본문 바로가기

Machine Learning/전처리(Preprocessing)

Machine Learning - Scaling : Min-Max Scaling

반응형
[Scaling]

변수의 크기가 다 상대적이므로 값이 너무 작거나, 큰 경우

해당 변수가 Target에 미치는 영향력이 제대로 표현되지 않을 수 있음


[Min-Max Scaling]

값의 범위를 0이상 1이하로 변경한다.

 

 

https://www.oreilly.com/library/view/regression-analysis-with/9781788627306/6bb0d820-6200-4bfe-aa91-e7b7ffa2a9c1.xhtml

 

 

 

 

 

 

데이터 불러오기 및 결측치 처리

 

 

결측치 처리는 아래 포스팅 참조

 

https://steadiness-193.tistory.com/239?category=961040

 

Machine Learning - 결측값 처리(Imputation) : mean

데이터 불러오기 categorical, numeric 컬럼 구분 리스트 제작 간단히, 자료형이 object라면 categorical이고 int나 float이라면 numeric이라 보면 된다. 방법1. for loop 이용 방법2. 직접 명시 + 리스트 이용..

steadiness-193.tistory.com

 

 

 

 

 

복사본 만들기

 

 

 

(1) Min-Max Scaler 불러온 뒤 정의

 

 

sklearn.preprocessing 패키지의 MinMaxScaler를 불러왔다.

 

이를 mMscaler로 정의한다.

 

 

 

 

 

 

numeric 컬럼 뽑아두기

 

 

 

values를 이용해 array로 뽑아두자

 

 

 

 

 

 

(2) Min, Max값 찾기

 

 

fit을 이용해 최소, 최댓값을 찾아낸다.

 

 

 

 

 

 

 

(3) Min, Max scale 처리한 데이터 리턴받기

 

데이터 변환

 

 

 

 

 

(4) 결과 비교

 

 

스케일링 처리 전(왼쪽)에 비해

 

오른쪽 기술통계 결과를 보면

 

최소는 0, 최대는 1로 잘 변환된 것을 볼 수 있다.

반응형