Pandas/전처리
판다스 - Excel(csv) 읽어올 때 콤마(,)있는 컬럼을 정수형으로 읽어오기 : thousands
Data_Pistachio
2020. 7. 12. 17:36
반응형
데이터 불러오기
위 데이터프레임의 price 컬럼은 천 단위에 콤마(,)가 있다.
우선 dtypes로 확인해보면
모두 문자열로 구성되어 있다.
이렇게 되면 숫자 연산이 불가능하기에 price나 deliver_fee는 정수형으로 바꿔줘야 한다.
보통은 apply를 이용한 다음 컬럼을 추가한다.
보통의 작업
apply를 이용해 콤마(,) 없애고 정수형으로 변환
원하는 위치에 컬럼 추가
새로 추가한 컬럼은 정수형으로 잘 되었다.
그러나 이 작업은 다소 귀찮고 컬럼이 새로 추가되는 번거로움이 있다.
이를 해결하기 위해
read_csv / read_excel 등에선 thousands 옵션을 제공한다.
thousands 옵션을 이용해서 데이터를 다시 불러오자
부가적인 작업없이
천 단위 구분자(,)가 포함된 컬럼을 자동으로 숫자형으로 바꿔서 가져왔다.
반응형