Pandas/응용
판다스 - 시계열 : 최초발생일, 진행 정도 파악
Data_Pistachio
2020. 6. 30. 20:26
반응형
데이터 불러오기
에볼라 바이러스의 데이터프레임이다.
데이터프레임을 읽어올 때 parse_dates를 이용해
Date 컬럼의 자료형을 datetime64로 바꿔줬다.
** (parse_dates=[0])도 가능
살펴보니
데이터가 시간 역순으로 정렬되어있다.
Date 컬럼에서 최초 발생일을 빼면 에볼라의 진행정도를 알 수 있다.
Date컬럼에서
최솟값을 구하면 최초 발생일이 나온다.
Date 컬럼에서 최초 발생일을 빼면
진행 정도를 컬럼으로 만들 수 있다.
(벡터 - 스칼라) 브로드캐스팅
반응형