본문 바로가기

Pandas/응용

판다스 - groupby : aggregate (agg 메서드 안의 기준 컬럼, count 이용)

반응형

데이터 불러오기

 

 

C 컬럼의 초성별로 그룹화 했다.

 

 

 

 

 

count

 

 

각 컬럼별 누락값을 제외한 값을 셌다.

 

1보다 큰 값을 가지는 불린 데이터프레임도 나타냈다.

 

 

 

 

 

여기서 agg() 메서드를 이용해보자

 

 

위의 결과와 동일한 불린 데이터프레임이 나왔다.

 

 

 

 

 

그렇다면 컬럼별로 agg 메서드를 이용해보자

 

 

위 불린 데이터프레임을 시리즈로 쪼개어 동일한 결과가 나왔다.

 

 

 

 

 

 

그런데, agg 메서드 안에 컬럼이 들어가면 어떻게 될까?

 

 

 

 

정말 이상하게도 B컬럼도 모두 True를 나타내고 있다.

 

 

 

 

 

 

이는 agg 메서드 안의 컬럼이 기준이 되기 때문이다.

 

 

 

 

 

 

 

 

A 컬럼은 모두 True 였는데, agg 메서드 안에서 적용되니

 

모두 False가 나왔다.

 

 

 

이는 이어질 filter 메서드에서 유용하게 사용되니 잘 기억해두어야 한다.

 

 

반응형

'Pandas > 응용' 카테고리의 다른 글

판다스 - groupby : filter (len, size, count)  (0) 2020.06.22
판다스 - groupby : aggregate, size  (0) 2020.06.22
판다스 - groupby : aggregate  (0) 2020.06.22
판다스 - groupby  (0) 2020.06.22
판다스 - apply, applymap, pipe(응용3)  (0) 2020.06.22