반응형
인덱스를 함수로 그룹핑하는 것은 이미 여러번 해보았다.
이번엔 set_index와 사용자 함수로 groupby를 해보자.
데이터 불러오기
Date컬럼은 datetime 자료형이다.
함수 정의
Date 컬럼에서 연월을 뽑아내는 함수다.
set_index를 이용해서 groupby
2020년 9월과 2020년 10월로 잘 그룹화되었다.
set_index가 아니라 groupby에
Date컬럼과 extract_ym 함수를 넣으면 어떻게 될까?
예상대로 에러가 나온다.
set_index, groupby, 사용자 정의 함수
동시 이용
우선 Alpha 컬럼과 Date 컬럼으로 동시에 그룹핑해서 집계함수를 쓰면 다음과 같다.
그런데 Date를 원본 그 자체가 아니라
연월로만 보고 싶다면 어떻게 해야할까?
이때 set_index를 활용하는 것이다.
Date로 인덱스를 설정하고
Alpha컬럼으로 그룹핑한 뒤
Date 인덱스는 extract_ym 함수에 의해 연월만 뽑아내진 뒤
그 데이터로 다시 그룹핑 된 것이다.
순서를 바꿔도 에러는 발생하지 않는다.
반응형
'Pandas > 응용' 카테고리의 다른 글
정규표현식 - 원하는 문자열이 있는 행만 남기기 : re.compile, re.search (0) | 2020.08.08 |
---|---|
정규표현식 - re.sub : 원하는 문자만 남기고 제거하기 (0) | 2020.08.02 |
판다스 - groupby : 집계함수를 활용한 뒤 데이터프레임 분석 (0) | 2020.07.15 |
판다스 - groupby : 그룹 객체별 상위 N개의 행만 추출 (0) | 2020.07.14 |
판다스 - groupby : 그룹 객체에서 컬럼간 연산 (0) | 2020.07.14 |