본문 바로가기

Pandas/응용

판다스 - 교차일람표 : pd.crosstab()

반응형
교차표는 그룹의 빈도를 계산하기 위한 피벗테이블의 한 유형이다.

crosstab의 처음 두 인자는 배열이나 시리즈 혹은 배열의 리스트가 올 수 있다.

 

데이터 불러오기

 

 

위 데이터를 국적별로, 잘 쓰는 손별로 빈도를 보자.

 

 

이 때 사용하는 것이

 

pd.crosstab이다.

 

첫번째 들어가는 것이 국적 -> 인덱스

두번째 들어가는 것이 손 -> 컬럼

 

 

 

 

 

여기에 기존 피벗테이블 처럼

 

margins=True를 넣을 수도 있다.

 

 

 

margins_name으로 All 컬럼의 이름을 바꿀 수도 있다.

 

 

 

 

물론 피벗테이블로도 할 수 있다.

 

 

 

 

 

 

tips 테이블로 한번 더 보자

 

기존 데이터프레임

 

time과 day를 멀티 인덱스로 설정하고

 

컬럼은 smoker로 넣어줬다.

 

역시 빈도 수를 손 쉽게 파악할 수 있다.

 

 

 

 

피벗테이블도 좋지만

 

그룹 빈도만을 보려면 crosstab을 활용하는 것도 

 

편리할 듯 하다.

 

 

 

 

반응형