반응형
피벗테이블 메서드(옵션)들을 상세히 살펴보자
데이터 불러오기
기본 피벗테이블
클래스별 / 성별별로
나이의 평균을 알 수 있다.
values='age'컬럼을 넣었기 때문이다.
aggfunc는 default가 평균값이다.
(즉, 생략 가능)
옵션에 여러개를 넣으면 어떻게 될까?
우선 aggfunc에 두개의 함수를 넣었다.
열 구조가 2중 멀티 인덱스가 된다.
mean함수와 sum함수가 한 층을 이루고
female과 male이 다음 층으로 사용된다.
조금 더 여러개로 넣어보자
사실 columns에 넣은 것은 survived뿐이지만
다소 복잡해 보이는 멀티인덱스가 되었다.
우선 가장 먼저 집계함수인 mean, max 가 한 층을 이루고
데이터 값을 구분하는(values) age와 fare 열이 그 다음 층을 이룬다.
마지막으로 survived 컬럼의 구분인 0과 1로 나뉜 컬럼으로 층이 이뤄진다.
위 예시로 보자면
aggfunc, values, columns 순서대로 위 층부터 내려온다.
* 참고 : 피벗테이블의 인덱스 / 컬럼
구분되는건 잘 알겠다.
이 피벗테이블에서 내가 원하는 행이나 컬럼을 보고 싶다면 어떻게 할까?
다음 포스팅에서 계속!
https://steadiness-193.tistory.com/54?category=947982
반응형
'Pandas > 응용' 카테고리의 다른 글
판다스 - pivot_table : xs 인덱서 2 (0) | 2020.06.25 |
---|---|
판다스 - pivot_table : xs 인덱서 (0) | 2020.06.25 |
판다스 - pivot_table (피벗 테이블) (0) | 2020.06.25 |
판다스 - 멀티인덱스 : loc, xs 인덱서 (0) | 2020.06.24 |
판다스 - groupby : 그룹에 따른 결측치 채우기 (0) | 2020.06.24 |