반응형
[Scaling]
변수의 크기가 다 상대적이므로 값이 너무 작거나, 큰 경우
해당 변수가 Target에 미치는 영향력이 제대로 표현되지 않을 수 있음
[Min-Max Scaling]
값의 범위를 0이상 1이하로 변경한다.
데이터 불러오기 및 결측치 처리
결측치 처리는 아래 포스팅 참조
https://steadiness-193.tistory.com/239?category=961040
복사본 만들기
(1) Min-Max Scaler 불러온 뒤 정의
sklearn.preprocessing 패키지의 MinMaxScaler를 불러왔다.
이를 mMscaler로 정의한다.
numeric 컬럼 뽑아두기
values를 이용해 array로 뽑아두자
(2) Min, Max값 찾기
fit을 이용해 최소, 최댓값을 찾아낸다.
(3) Min, Max scale 처리한 데이터 리턴받기
(4) 결과 비교
스케일링 처리 전(왼쪽)에 비해
오른쪽 기술통계 결과를 보면
최소는 0, 최대는 1로 잘 변환된 것을 볼 수 있다.
반응형
'Machine Learning > 전처리(Preprocessing)' 카테고리의 다른 글
Machine Learning - One-Hot Encoding (원핫 인코딩) (0) | 2020.08.26 |
---|---|
Machine Learning - Label Encoding (라벨 인코딩) (0) | 2020.08.26 |
Machine Learning - Scaling : Standard Scaling (Z-score) (0) | 2020.08.26 |
Machine Learning - 결측값 처리(Imputation) : median, mode (0) | 2020.08.26 |
Machine Learning - 결측값 처리(Imputation) : mean (0) | 2020.08.26 |