반응형
머신러닝을 진행하기 위해서는
문자열을 숫자로 바꿔줘야 한다.
소형 → 0 / 중형 → 1 / 대형 → 2
이런 식이다.
데이터 불러오기
race 컬럼의 고유값
라벨링 목표
White → 0 |
두가지 방법으로 알아본다.
1. 딕셔너리 + map
일일이 사전으로 매핑을 만들어두고 map을 이용해서 값을 구해낸다.
https://steadiness-193.tistory.com/216?category=947982
2. list.index() + map
고유값이 담긴 배열을 tolist를 통해 리스트 형태로 바꿔준다.
list.index()에 인자로 리스트 원소를 넣으면 원소가 들어있는 위치(인덱스)를 리턴한다.
만든 리스트를 temp_list라는 변수에 넣어두고
map과 lambda를 같이 이용하면 1번과 같은 결과를 얻을 수 있다.
컬럼으로 추가
https://steadiness-193.tistory.com/243
위 포스팅엔 sklearn.preprocessing 패키지를 이용하는 방법이 있다.
반응형
'Pandas > 응용' 카테고리의 다른 글
판다스 - isinstance (0) | 2020.09.06 |
---|---|
판다스 - 데이터프레임 역순으로 재구성 (0) | 2020.08.24 |
판다스 - datetime : dt 연산자 활용 (0) | 2020.08.13 |
판다스 - groupby : 그룹 객체별, 기준 컬럼의 상위 N개의 행만 추출 (0) | 2020.08.09 |
판다스 - 값이 높은 n번째까지 출력 : nlargest (0) | 2020.08.09 |