반응형
https://steadiness-193.tistory.com/253
위에서 만들어낸 train과 test를 이용한다.
DecisionTreeClassifier
[DecisionTreeClassifier]
min_samples_split : 의사결정나무에서 최종 노드의 최소 샘플 수 제한
* 샘플 수가 10개 미만이라면 더 나누지 않는다.
random_state : 결과를 고정시킴, Seed Number와 같은 개념
feature와 label 정의
feature는 id와 target컬럼인 species를 제외한 모든 컬럼이다.
label은 species 컬럼이며 각 개수는 위와 같다.
X_train, y_train, X_test 정의
DecisionTreeClassifier 학습시키기
fit을 이용해서 학습시킨다.
결과 예측하기
X_test를 가지고 test 데이터셋의 label을 예측한다.
결과 비교
versicolor와 virginica를 하나씩 틀린 것 빼곤 다 맞혔다.
True의 비율(정답률)은 약 98% 정도이다.
반응형
'Machine Learning > 분류(Classification)' 카테고리의 다른 글
Classification - XGBClassifier (0) | 2020.09.09 |
---|---|
Classification - RandomForestClassifier (0) | 2020.09.08 |
Classification - DecisionTreeClassifier (0) | 2020.09.08 |
Classification - SVM 서포트 벡터 머신 (0) | 2020.09.08 |
Classification - 정확도 평가 : accuracy_score (0) | 2020.09.08 |