판다스 - 누락 데이터 처리 : dropna, thresh, fillna, idxmax, ffill, bfill
데이터 불러오기 누락값 살펴보기 불린 조건을 '입력된 값의 개수가 전체 행의 개수와 같지 않다'로 설정 즉, age, embarked, deck, embark_town은 누락값이 있다. 시리즈에 cond로 필터링하면 누락값이 있는 컬럼들의 입력값의 개수를 볼 수 있다. dropna, thresh df.dropna(axis=0 or 1, thresh=n) 축을 기준으로 n개 미만 입력되면 그 축을 삭제하겠다. 데이터프레임의 열 개수는 len(df.columns)로 구할 수 있다. thresh가 500일땐 203개만 입력된 deck 컬럼이 삭제되었다. (15 → 14) thresh가 800일땐 714개가 입력된 age컬럼과 203개가 입력된 deck컬럼이 삭제되었다. (15 → 13) dropna, how=..