Pandas/응용
판다스 - groupby : aggregate (agg 메서드 안의 기준 컬럼, count 이용)
Data_Pistachio
2020. 6. 22. 15:29
반응형
데이터 불러오기

C 컬럼의 초성별로 그룹화 했다.
count

각 컬럼별 누락값을 제외한 값을 셌다.
1보다 큰 값을 가지는 불린 데이터프레임도 나타냈다.
여기서 agg() 메서드를 이용해보자

위의 결과와 동일한 불린 데이터프레임이 나왔다.
그렇다면 컬럼별로 agg 메서드를 이용해보자

위 불린 데이터프레임을 시리즈로 쪼개어 동일한 결과가 나왔다.
그런데, agg 메서드 안에 컬럼이 들어가면 어떻게 될까?

정말 이상하게도 B컬럼도 모두 True를 나타내고 있다.

이는 agg 메서드 안의 컬럼이 기준이 되기 때문이다.

A 컬럼은 모두 True 였는데, agg 메서드 안에서 적용되니
모두 False가 나왔다.
이는 이어질 filter 메서드에서 유용하게 사용되니 잘 기억해두어야 한다.
반응형