본문 바로가기

Pandas/응용

판다스 - groupby : cut, qcut을 이용해 그룹핑

반응형
cut 함수(등간격)와 qcut 함수(같은 크기)는

groupby와 조합하면 데이터 묶음에 대해 변위치 분석이나 버킷 분석을 쉽게 수행할 수 있다.


cut, qcut에서 반환된 Categorical 객체를 바로 groupby에 넘길 수 있다.

 

 

데이터 불러오기

 

위 데이터프레임에서 

 

horsepower(마력) 컬럼을 나눠서 그룹핑해보자

 

 

 

 

 

1. cut

 

 

살펴보기용

 

 

 

 

 

Categorical 객체를 바로 그룹핑에 이용

 

 

 

 

agg를 이용해 다양하게 분석 가능

 

 

 

 

 

 

 

보기 불편할 땐 stack을 이용

 

 

 

 

 

 

 

 

 

2. qcut

 

 

 

 

표본 변위치 기반하여

 

크기가 같은 버킷을 구하려면 qcut을 사용한다.

 

 

 

cut과의 비교

 

 

 

Categorical 객체를 바로 그룹핑에 이용

 

 

 

 

 

 

agg를 이용해 다양하게 분석 가능

 

 

 

 

 

 

 

 

 

보기 불편할 땐 stack을 이용

 

 

 

 

필요한 함수를 적절히

 

groupby와 함께 분석에 활용하면 된다. 

 

 

 

 

cut과 qcut은 아래 포스팅 참조

 

https://steadiness-193.tistory.com/67

 

판다스 - pd.cut, pd.qcut

cut 함수 : 균등한 길이의 그룹 데이터의 분산에 따라 각각의 그룹마다 데이터 수가 다르게 나뉜다. qcut 함수 : 같은 크기의 그룹  표본 변위치를 기반으로 데이터를 나누어, 적당히 같은 크기의 �

steadiness-193.tistory.com

 

반응형