반응형
interpolate 메서드는 누락값 양쪽에 있는 값을 이용해
중간값을 구한 다음 누락값을 그 중간값으로 처리
데이터프레임이 일정한 간격을 유지하고 있는 것처럼 수정 가능
데이터 불러오기
에볼라 바이러스의 데이터 일부를 변경하여 가져왔다.
중간에 누락값이 있기 때문에 이를 시각화하면
위처럼 중간에 값이 끊겨있음을 확인할 수 있다.
이때 사용하는 것이 interplolate다.
Guinea열의 12월 27일 값을 보면
원래는 누락값이었지만
2769와 2730의 합을 해서 2로 나눈 값인
2749.5가 나왔다.
이제 다시 eb_filled로 시각화를 해보면
잘 연결된 것처럼 수정할 수 있게 됐다.
반응형
'Pandas > 전처리' 카테고리의 다른 글
판다스 - Excel(csv) 읽어올 때 콤마(,)있는 컬럼을 정수형으로 읽어오기 : thousands (6) | 2020.07.12 |
---|---|
판다스 - 원핫인코딩 : get_dummies (0) | 2020.07.07 |
판다스 - 나이를 나이대로 범주화(카테고리화)하기 (0) | 2020.07.07 |
판다스 - 컬럼(열 or 변수)간 상관계수 : corr (0) | 2020.07.07 |
판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score (0) | 2020.06.29 |