본문 바로가기

Pandas/응용

판다스 - 데이터 끌어올리기 : first_valid_index, shift

반응형

https://steadiness-193.tistory.com/82

 

판다스 - 데이터 밀어내기 (last_valid_index, shift)

데이터 불러오기 우선 Date 컬럼을 보면 날짜의 역순으로 데이터가 진행되고 있다. 또한 2월 10일부터 A컬럼의 데이터가 있으나 B컬럼은 2월 11일, C 컬럼은 2월 12일부터 데이터가 입력되어있다. 이�

steadiness-193.tistory.com

 

위와 반대로 하는 내용

 

 

 

 

 

 

 

 

 

 

데이터 불러오기

 

 

 

 

날짜순으로 내려가는 데이터이며

 

각 컬럼별로 데이터가 입력된 날짜가 다르다.

 

 

 

 

 

 

 

 

 

그래프로 보니 각 출발하는 날짜가 다르다.

 

 

 

 

 

 

 

 

 

pd.Series.first_valid_index

 

유효한 값이 있는 첫번째 인덱스 반환

 

 

 

 

 

더 쉽게 보자면

 

 

 

B컬럼이 처음 입력된 일자는 2월 11일로

 

1번 인덱스를 리턴한다.

 

 

 

 

 

 

그렇다면 가장 오래전에 입력된 데이터의 인덱스에서

 

갈 컬럼별 first_valid_index만큼 

 

끌어올리면 되지 않을까?

 

 

 

즉 B 컬럼은 위로 1칸, C는 2칸, D는 3칸을 올리면 된다는 것이다.

 

 

 

 

 

 

 

 

 

shift

인잣값만큼 데이터를 밀어낸다.

 

 

값이 음수라면 위로, 양수라면 아래로 움직인다.

 

 

 

 

 

 

 

 

 

 

위의 for loop를 이용해서 코드를 짜보면

 

 

 

 

 

 

 

 

 

위로 끌어올린 각 컬럼을(시리즈를) 담은 리스트를 얻을 수 있다.

 

 

 

 

 

 

 

 

 

이를 다시 한번 pd.concat으로 연결하면 

 

데이터프레임으로 만들 수 있다.

 

 

 

 

 

 

 

 

다시 시각화 하면

 

 

 

출발 일자가 10일로 통일되었다.

 

 

 

 

 

반응형