반응형
데이터 불러오기
위 데이터프레임의 price 컬럼은 천 단위에 콤마(,)가 있다.
우선 dtypes로 확인해보면
모두 문자열로 구성되어 있다.
이렇게 되면 숫자 연산이 불가능하기에 price나 deliver_fee는 정수형으로 바꿔줘야 한다.
보통은 apply를 이용한 다음 컬럼을 추가한다.
보통의 작업
apply를 이용해 콤마(,) 없애고 정수형으로 변환
원하는 위치에 컬럼 추가
새로 추가한 컬럼은 정수형으로 잘 되었다.
그러나 이 작업은 다소 귀찮고 컬럼이 새로 추가되는 번거로움이 있다.
이를 해결하기 위해
read_csv / read_excel 등에선 thousands 옵션을 제공한다.
thousands 옵션을 이용해서 데이터를 다시 불러오자
부가적인 작업없이
천 단위 구분자(,)가 포함된 컬럼을 자동으로 숫자형으로 바꿔서 가져왔다.
반응형
'Pandas > 전처리' 카테고리의 다른 글
판다스 - 누락데이터 처리 : interpolate (0) | 2020.07.07 |
---|---|
판다스 - 원핫인코딩 : get_dummies (0) | 2020.07.07 |
판다스 - 나이를 나이대로 범주화(카테고리화)하기 (0) | 2020.07.07 |
판다스 - 컬럼(열 or 변수)간 상관계수 : corr (0) | 2020.07.07 |
판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score (0) | 2020.06.29 |