반응형
데이터프레임 제작
행의 레코드가 중복되는지 여부확인 위해
duplicated() 메서드 사용
h행과 k 행은 중복 되었음
drop_duplicates()
duplicated()메서드에서 True로 확인된 k열이 삭제되었음
c2열과 c3 열 기준으로 중복되었는지 확인
k행(h행과 중복)과 m행(r행과 중복)이 중복되었음
c2, c3열을 기준으로 중복되었던 k와 m행이 삭제되었음
keep='last'를 이용하면
h행과 중복인 k행을 살리고 h행을 삭제
r행과 중복인 m행을 살리고 r행을 삭제
반응형
'Pandas > 전처리' 카테고리의 다른 글
판다스 - 자료형 변환 : astype, pd.to_numeric (0) | 2020.06.19 |
---|---|
판다스 - 데이터 표준화 (단위 환산 : kpl, mpg) (0) | 2020.06.19 |
판다스 - 누락 데이터 처리 : dropna, thresh, fillna, idxmax, ffill, bfill (0) | 2020.06.18 |
판다스 - 누락 데이터 확인 : isnull(), count_nonzero() (0) | 2020.06.18 |
판다스 - 데이터 연결 : concat (0) | 2020.06.18 |