반응형
https://steadiness-193.tistory.com/291
위 포스팅에선 train_test_split을 이용해서 라벨 후처리와 점수 측정까지 동시에 해보았다.
그러나 실제 대회에선 저렇게 나누지 않고 진행한다.
라벨 후처리는 이진 분류에서 쓰이니, 익숙한 타이타닉으로 연습해보자
전처리는 아래 포스팅에 있으나
https://steadiness-193.tistory.com/290
행 삭제와 train_test_split을 진행하지 않는다.
또한 titanic 공식 점수 측정 방식인 정확도(accuracy_score)로 비교한다.
oof_pred, oof_train
train 전체 행인 891행을 예측해서 모아둔 확률 값을 얻어냈다.
scoring
100번 반복해 얻어낸 최종 threshold 값은 0.413이다.
그냥 argmax를 이용해서 구한 값과 비교하기 위해 두 개를 제출해보자
제출 결과 비교
아쉽게도 그냥 oof ensemble한 oof_pred 보다 오히려 정답률이 낮아졌다.
이렇게 라벨 후처리를 한 것과 안한 것의 제출 값을 비교해야할 수도 있다.
반응형
'Machine Learning > 모델 튜닝(Model Tuning)' 카테고리의 다른 글
Model Tuning - Stacking : 실전 적용 (1) | 2020.10.04 |
---|---|
Model Tuning - Stacking (스태킹_CV 기반) (0) | 2020.10.04 |
Model Tuning - Label Postprocessing (라벨 후처리) (0) | 2020.10.02 |