본문 바로가기

Pandas/응용

판다스 - groupby : apply, filter 등 주의할 점

반응형
groupby를 한 객체를 변수에 넣느냐

넣지않고 진행하느냐에 따라 

그룹화에 이용된 컬럼이 남아있는가, 사라지는가가 달라진다.

 

 

예시를 들어 살펴보자

 

 

 

 

데이터 불러오기

 

 

244행의 tips 데이터를 불러왔다.

 

 

 

1. groupby한 데이터프레임 객체를 변수에 넣기

 

 

변수명 = grouped

 

 

그룹별로 입력된 데이터의 개수가 상이하다.

 

 

 

 

여기서, 10개 초과로 입력된 그룹만 필터링하고자 한다.

 

 

 

그룹화된 객체의 변수인 grouped를 이용하여

 

filter를 했다.

 

(기존 244행에서 231행으로 줄어들었다.)

 

 

 

이랬더니

 

그룹화에 이용한 컬럼인 size가 사라졌다.

 

 

 

 

 

 

2. groupby한 데이터프레임 객체를 그대로 이용하기

 

 

 

그룹화에 이용했던 size 컬럼이 그대로 남아있다.

 

 

 

 

이를 잘 숙지하고 groupby를 이용해야 한다.

반응형