본문 바로가기

Pandas/응용

판다스 - groupby : 그룹 객체별 상위 N개의 행만 추출

반응형

타이타닉 데이터프레임을 

 

pclass와 성별 컬럼으로 그룹화

 

 

 

 

 

그룹별 데이터 개수

 

 

여기서

 

 

그룹별

fare(요금) 컬럼 기준으로 상위 50개씩만 추출하려면?

 

 

1. lambda 함수 이용

 

 

 

 

위 lambda 함수를 apply와 함께 이용한다.

 

 

pclass 3개

성별 2개

각 50개의 행

 

6 x 50 = 300개의 행

 

잘 출력되었다.

 

 

double check

 

 

 

 

2. 함수 정의

 

 

위 lambda 함수와 결과로는 큰 차이가 없다.

 

 

 

기존 인덱스 삭제

반응형