본문 바로가기

Pandas/전처리

판다스 - 누락데이터 처리 : interpolate

반응형
interpolate 메서드는 누락값 양쪽에 있는 값을 이용해

중간값을 구한 다음 누락값을 그 중간값으로 처리

데이터프레임이 일정한 간격을 유지하고 있는 것처럼 수정 가능

 

 

 

데이터 불러오기

 

 

에볼라 바이러스의 데이터 일부를 변경하여 가져왔다.

 

 

 

 

 

중간에 누락값이 있기 때문에 이를 시각화하면

 

 

위처럼 중간에 값이 끊겨있음을 확인할 수 있다.

 

 

 

 

 

이때 사용하는 것이 interplolate다.

 

 

 

Guinea열의 12월 27일 값을 보면

 

원래는 누락값이었지만

 

2769와 2730의 합을 해서 2로 나눈 값인

 

2749.5가 나왔다.

 

 

 

 

 

 

이제 다시 eb_filled로 시각화를 해보면

 

 

 

잘 연결된 것처럼 수정할 수 있게 됐다.

 

 

반응형