반응형
cut 함수(등간격)와 qcut 함수(같은 크기)는
groupby와 조합하면 데이터 묶음에 대해 변위치 분석이나 버킷 분석을 쉽게 수행할 수 있다.
cut, qcut에서 반환된 Categorical 객체를 바로 groupby에 넘길 수 있다.
데이터 불러오기
위 데이터프레임에서
horsepower(마력) 컬럼을 나눠서 그룹핑해보자
1. cut
Categorical 객체를 바로 그룹핑에 이용
agg를 이용해 다양하게 분석 가능
보기 불편할 땐 stack을 이용
2. qcut
표본 변위치 기반하여
크기가 같은 버킷을 구하려면 qcut을 사용한다.
Categorical 객체를 바로 그룹핑에 이용
agg를 이용해 다양하게 분석 가능
보기 불편할 땐 stack을 이용
필요한 함수를 적절히
groupby와 함께 분석에 활용하면 된다.
cut과 qcut은 아래 포스팅 참조
https://steadiness-193.tistory.com/67
반응형
'Pandas > 응용' 카테고리의 다른 글
판다스 - 데이터 밀어내기 : last_valid_index, shift (0) | 2020.07.01 |
---|---|
판다스 - 시계열 : 최초발생일, 진행 정도 파악 (0) | 2020.06.30 |
판다스 - groupby : 색인 단계로 그룹핑하기(계층적 색인) (0) | 2020.06.28 |
판다스 - groupby : 함수로 그룹핑하기 (0) | 2020.06.28 |
판다스 - groupby : 사전과 시리즈로 그룹핑하기 (0) | 2020.06.28 |