본문 바로가기

Pandas/응용

판다스 - pivot_table (피벗 테이블2)

반응형

피벗테이블 메서드(옵션)들을 상세히 살펴보자

 

 

데이터 불러오기

 

seaborn의 타이타닉 데이터

 

 

 

기본 피벗테이블

 

 

클래스별 / 성별별로 

 

나이의 평균을 알 수 있다.

 

values='age'컬럼을 넣었기 때문이다.

 

aggfunc는 default가 평균값이다.

(즉, 생략 가능)

 

 

 

 

 

 

옵션에 여러개를 넣으면 어떻게 될까?

 

 

 

우선 aggfunc에 두개의 함수를 넣었다.

 

열 구조가 2중 멀티 인덱스가 된다.

 

 

mean함수와 sum함수가 한 층을 이루고 

 

female과 male이 다음 층으로 사용된다.

 

 

 

 

 

 

조금 더 여러개로 넣어보자

 

 

사실 columns에 넣은 것은 survived뿐이지만 

 

다소 복잡해 보이는 멀티인덱스가 되었다.

 

 

우선 가장 먼저 집계함수인 mean, max 가 한 층을 이루고

 

데이터 값을 구분하는(values) age와 fare 열이 그 다음 층을 이룬다.

 

 

마지막으로 survived 컬럼의 구분인 0과 1로 나뉜 컬럼으로 층이 이뤄진다.

 

 

위 예시로 보자면

 

aggfunc, values, columns 순서대로 위 층부터 내려온다.

 

 

 

 

 

 

* 참고 : 피벗테이블의 인덱스 / 컬럼

 

 

 

 

 

 

 

구분되는건 잘 알겠다.

 

이 피벗테이블에서 내가 원하는 행이나 컬럼을 보고 싶다면 어떻게 할까?

 

다음 포스팅에서 계속!

 

 

https://steadiness-193.tistory.com/54?category=947982

 

판다스 - pivot_table : xs 인덱서

https://steadiness-193.tistory.com/53 판다스 - pivot_table(피벗 테이블2) 피벗테이블 메서드(옵션)들을 상세히 살펴보자 데이터 불러오기 기본 피벗테이블 클래스별 / 성별별로 나이의 평균을 알 수 있다. va

steadiness-193.tistory.com

 

 

반응형