Pandas/응용
판다스 - 교차일람표 : pd.crosstab()
Data_Pistachio
2020. 6. 25. 16:52
반응형
교차표는 그룹의 빈도를 계산하기 위한 피벗테이블의 한 유형이다.
crosstab의 처음 두 인자는 배열이나 시리즈 혹은 배열의 리스트가 올 수 있다.
데이터 불러오기
위 데이터를 국적별로, 잘 쓰는 손별로 빈도를 보자.
이 때 사용하는 것이
pd.crosstab이다.
첫번째 들어가는 것이 국적 -> 인덱스
두번째 들어가는 것이 손 -> 컬럼
여기에 기존 피벗테이블 처럼
margins=True를 넣을 수도 있다.
margins_name으로 All 컬럼의 이름을 바꿀 수도 있다.
물론 피벗테이블로도 할 수 있다.
tips 테이블로 한번 더 보자
time과 day를 멀티 인덱스로 설정하고
컬럼은 smoker로 넣어줬다.
역시 빈도 수를 손 쉽게 파악할 수 있다.
피벗테이블도 좋지만
그룹 빈도만을 보려면 crosstab을 활용하는 것도
편리할 듯 하다.
반응형