본문 바로가기

Pandas/응용

판다스 - 시계열 : 최초발생일, 진행 정도 파악

반응형

 

 

데이터 불러오기

 

 

에볼라 바이러스의 데이터프레임이다.

 

데이터프레임을 읽어올 때 parse_dates를 이용해 

 

Date 컬럼의 자료형을 datetime64로 바꿔줬다.

** (parse_dates=[0])도 가능

 

 

 

살펴보니 

 

데이터가 시간 역순으로 정렬되어있다.

 

 

 

 

Date 컬럼에서 최초 발생일을 빼면 에볼라의 진행정도를 알 수 있다.

 

 

Date컬럼에서

 

최솟값을 구하면 최초 발생일이 나온다.

 

 

 

 

 

 

 

Date 컬럼에서 최초 발생일을 빼면

 

진행 정도를 컬럼으로 만들 수 있다.

 

(벡터 - 스칼라) 브로드캐스팅

 

 

 

 

 

반응형