본문 바로가기

Machine Learning/회귀(Regression)

(10)
Regression - FIFA 이적료 예측 : 전처리 dacon.io/competitions/open/235538/data/ [스포츠] 해외 축구 선수 이적료 예측 미션 출처 : DACON - Data Science Competition dacon.io 각 컬럼의 정보 id 선수 고유의 아이디 name 이름 age 나이 continent 선수들의 국적이 포함되어 있는 대륙 contract_until 선수의 계약기간 만료 position 선수가 선호하는 포지션 prefer_foot 선수가 선호하는 발 reputation 선수가 유명한 정도 stat_overall 선수의 현재 능력치 stat_potential 선수가 경험 및 노력을 통해 발전할 수 있는 정도 stat_skill_moves 선수의 개인기 능력치 value FIFA가 선정한 선수의 이적 시장 가격..
Regression - Regularization : L1 규제(Lasso), L2 규제(Ridge) * 수학적 증명, 수식보단 기본 개념과 활용법에 초점을 맞춤 Regularization (정형화, 규제, 일반화) 모델이 과적합되게 학습하지 않고 일반성을 가질 수 있도록 규제 하는 것. 하늘색 선은 오버피팅 될 수 있으므로 빨간색 점선으로 모델이 설정될 수 있게 해주는 작업이다. 데이터의 feature에는 손대지 않고 최대한 하늘색 선을 펴주려면 기울기(가중치)를 건드리면 된다. 이때 이용하는 것이 Lasso, Ridge이다. Lasso (least absolute shrinkage and selection operator) w는 가중치(기울기)를 의미한다. MSE (손실함수)에 α를 곱한 L1규제항을 더한 것이다. (비용함수에 가중치 파라미터의 절댓값을 모두 합한 형태) 학습의 방향이 단순히 손실함수..