반응형
데이터 불러오기
편하게 10개 행만 가져온다.
[DataFrame.sample(frac, n, replace, random_state)]
frac
전체 행에서 몇 %만 추출할 것인가
0~1까지의 값을 넣을 수 있다.
n
몇개의 행을 추출할 것인가
* frac과 n은 동시에 쓸 수 없다.
replace=False
default는 중복 비허용
random_state
설정 시 결과 고정
n
n, random_state
random_state에 아무 숫자나 넣으면 된다.
몇번을 실행해도 동일한 추출이 된다.
reset_index로 활용
frac
전체 10개 행에서 50%인 5개 행만 추출한다.
n과 같이 쓸 수 없다.
70%인 7개 행을 가져온다.
frac=1
frac에 1을 넣으면 전체 데이터프레임을 랜덤으로 재배열한다.
replace=True
기본 옵션인 replace=False를 True로 바꿔주면
중복된 결과를 허용한다.
반응형
'Pandas > 기초' 카테고리의 다른 글
판다스 - 파일 읽어오기 : from os.path import join (0) | 2020.08.24 |
---|---|
판다스 - 카테고리 자료형 : Categorical, cat 속성, categories, codes, categorical 메서드 (0) | 2020.08.20 |
판다스 - 백분위수 찾기 : describe(percentiles), quantile (0) | 2020.08.09 |
판다스 - value_counts(normalize=True) (0) | 2020.08.07 |
판다스 - to_datetime : format, dt (0) | 2020.07.23 |