본문 바로가기

Pandas/기초

판다스 - 데이터프레임 랜덤 추출 : DataFrame.sample

반응형

데이터 불러오기

 

 

편하게 10개 행만 가져온다.

 

 

[DataFrame.sample(frac, n, replace, random_state)]

frac
전체 행에서 몇 %만 추출할 것인가

0~1까지의 값을 넣을 수 있다.

n
몇개의 행을 추출할 것인가


* frac과 n은 동시에 쓸 수 없다.

replace=False
default는 중복 비허용

random_state
설정 시 결과 고정

 

 

n

 

 

 

 

n, random_state

 

 

random_state에 아무 숫자나 넣으면 된다.

 

몇번을 실행해도 동일한 추출이 된다.

 

 

 

 

 

reset_index로 활용

 

 

 

 

frac

 

 

전체 10개 행에서 50%인 5개 행만 추출한다.

 

n과 같이 쓸 수 없다.

 

 

 

70%인 7개 행을 가져온다.

 

 

 

 

frac=1

 

 

frac에 1을 넣으면 전체 데이터프레임을 랜덤으로 재배열한다.

 

 

 

 

replace=True

 

 

기본 옵션인 replace=False를 True로 바꿔주면

 

중복된 결과를 허용한다.

 

 

반응형