반응형
교차표는 그룹의 빈도를 계산하기 위한 피벗테이블의 한 유형이다.
crosstab의 처음 두 인자는 배열이나 시리즈 혹은 배열의 리스트가 올 수 있다.
데이터 불러오기
위 데이터를 국적별로, 잘 쓰는 손별로 빈도를 보자.
이 때 사용하는 것이
pd.crosstab이다.
첫번째 들어가는 것이 국적 -> 인덱스
두번째 들어가는 것이 손 -> 컬럼
여기에 기존 피벗테이블 처럼
margins=True를 넣을 수도 있다.
margins_name으로 All 컬럼의 이름을 바꿀 수도 있다.
물론 피벗테이블로도 할 수 있다.
tips 테이블로 한번 더 보자
time과 day를 멀티 인덱스로 설정하고
컬럼은 smoker로 넣어줬다.
역시 빈도 수를 손 쉽게 파악할 수 있다.
피벗테이블도 좋지만
그룹 빈도만을 보려면 crosstab을 활용하는 것도
편리할 듯 하다.
반응형
'Pandas > 응용' 카테고리의 다른 글
판다스 - 시계열 데이터2 : date_range, period_range (0) | 2020.06.26 |
---|---|
판다스 - 시계열 데이터 : Timestamp, Period, strptime, strftime (0) | 2020.06.26 |
판다스 - pivot_table : xs 인덱서 2 (0) | 2020.06.25 |
판다스 - pivot_table : xs 인덱서 (0) | 2020.06.25 |
판다스 - pivot_table (피벗 테이블2) (0) | 2020.06.25 |