반응형
groupby를 한 객체를 변수에 넣느냐
넣지않고 진행하느냐에 따라
그룹화에 이용된 컬럼이 남아있는가, 사라지는가가 달라진다.
예시를 들어 살펴보자
데이터 불러오기
244행의 tips 데이터를 불러왔다.
1. groupby한 데이터프레임 객체를 변수에 넣기
그룹별로 입력된 데이터의 개수가 상이하다.
여기서, 10개 초과로 입력된 그룹만 필터링하고자 한다.
그룹화된 객체의 변수인 grouped를 이용하여
filter를 했다.
(기존 244행에서 231행으로 줄어들었다.)
이랬더니
그룹화에 이용한 컬럼인 size가 사라졌다.
2. groupby한 데이터프레임 객체를 그대로 이용하기
그룹화에 이용했던 size 컬럼이 그대로 남아있다.
이를 잘 숙지하고 groupby를 이용해야 한다.
반응형
'Pandas > 응용' 카테고리의 다른 글
판다스 - groupby : 그룹에 따른 결측치 채우기 (0) | 2020.06.24 |
---|---|
판다스 - groupby : 그룹 순회, get_group (0) | 2020.06.24 |
판다스 - groupby 메서드들의 활용 방안 (0) | 2020.06.23 |
판다스 - groupby : apply와 agg의 차이 (0) | 2020.06.23 |
판다스 - groupby : apply와 transform (차이) (0) | 2020.06.23 |