본문 바로가기

Machine Learning/회귀(Regression)

Regression - RandomForestRegressor, XGBRegressor, LGBMRegressor

반응형

Random Forest Regressor

 

 

Classification - RandomForestClassifier

https://steadiness-193.tistory.com/257 Machine Learning - valid와 test를 train으로 전처리 https://steadiness-193.tistory.com/256 Machine Learning - train_test_split https://steadiness-193.tistory.co..

steadiness-193.tistory.com

위 포스팅의 Classifier대신 Regressor를 이용한다.

 

 

 

데이터 불러오기

 

https://steadiness-193.tistory.com/269

 

Regression - FIFA 이적료 예측 : 전처리

dacon.io/competitions/open/235538/data/ [스포츠] 해외 축구 선수 이적료 예측 미션 출처 : DACON - Data Science Competition dacon.io 각 컬럼의 정보 id 선수 고유의 아이디 name 이름 age 나이 continent 선..

steadiness-193.tistory.com

 

위 포스팅에서 전처리 완료한 데이터를 이용한다.

 

https://www.3leafnodes.com/random-forest-regression-train-with-one-feature-grid-search

 

 

축에 직교하며 분기해서 최적의 회귀를 찾는다.

 

 

 

손실함수인 MSE가 매우 낮게 나와 학습과 예측이 잘 되었다고 판단할 수 있다.

 

 

 

 

XGBoost Regressor

 

 

 

Classification - XGBClassifier

[XGBoost] 부트스트래핑(Bootstrapping) 방식의 앙상블 알고리즘 부트스트래핑 : 임의로 샘플 및 변수를 선택하여 학습 부스팅 알고리즘 (Boosting algorithm) 각 트리(이터레이션)가 맞히지 못한 샘플에 대��

steadiness-193.tistory.com

 

 

랜덤포레스트보다 조금 높은 성능을 보여준다.

 

 

 

 

LightGBM Regressor

 

 

Classification - LGBMClassifier

Gradient Boosting 알고리즘 기반의 단점을 보완한 xgboost에도 아쉬운 점이 있다. 바로, 여전히 속도가 느리다는 것이다. 이를 다시 보완하기위해 나온 것이 LightGBM이다. [LightGBM] XGboost보다 가볍고 더 ��

steadiness-193.tistory.com

 

 

성능만으로 따지자면 XGB > LGBM > RandomForest 순으로 나왔다.

반응형