반응형
https://steadiness-193.tistory.com/82
위와 반대로 하는 내용
데이터 불러오기
날짜순으로 내려가는 데이터이며
각 컬럼별로 데이터가 입력된 날짜가 다르다.
그래프로 보니 각 출발하는 날짜가 다르다.
pd.Series.first_valid_index
유효한 값이 있는 첫번째 인덱스 반환
더 쉽게 보자면
B컬럼이 처음 입력된 일자는 2월 11일로
1번 인덱스를 리턴한다.
그렇다면 가장 오래전에 입력된 데이터의 인덱스에서
갈 컬럼별 first_valid_index만큼
끌어올리면 되지 않을까?
즉 B 컬럼은 위로 1칸, C는 2칸, D는 3칸을 올리면 된다는 것이다.
shift
인잣값만큼 데이터를 밀어낸다.
값이 음수라면 위로, 양수라면 아래로 움직인다.
위의 for loop를 이용해서 코드를 짜보면
위로 끌어올린 각 컬럼을(시리즈를) 담은 리스트를 얻을 수 있다.
이를 다시 한번 pd.concat으로 연결하면
데이터프레임으로 만들 수 있다.
다시 시각화 하면
출발 일자가 10일로 통일되었다.
반응형
'Pandas > 응용' 카테고리의 다른 글
판다스 - 여러 대용량 데이터 처리하기 : os.listdir (0) | 2020.07.06 |
---|---|
판다스 - reindex를 활용한 멀티인덱스 컬럼(열) 추출 (0) | 2020.07.04 |
판다스 - 데이터 밀어내기 : last_valid_index, shift (0) | 2020.07.01 |
판다스 - 시계열 : 최초발생일, 진행 정도 파악 (0) | 2020.06.30 |
판다스 - groupby : cut, qcut을 이용해 그룹핑 (0) | 2020.06.28 |