본문 바로가기

Pandas/전처리

판다스 - Excel(csv) 읽어올 때 콤마(,)있는 컬럼을 정수형으로 읽어오기 : thousands

반응형

데이터 불러오기

 

 

위 데이터프레임의 price 컬럼은 천 단위에 콤마(,)가 있다.

 

 

 

우선 dtypes로 확인해보면

 

 

모두 문자열로 구성되어 있다.

 

 

이렇게 되면 숫자 연산이 불가능하기에 price나 deliver_fee는 정수형으로 바꿔줘야 한다.

 

 

보통은 apply를 이용한 다음 컬럼을 추가한다.

 

 

 

 

 

 

보통의 작업

 

apply를 이용해 콤마(,) 없애고 정수형으로 변환

 

 

 

 

 

 

원하는 위치에 컬럼 추가

 

 

새로 추가한 컬럼은 정수형으로 잘 되었다.

 

 

그러나 이 작업은 다소 귀찮고 컬럼이 새로 추가되는 번거로움이 있다.

 

 

 

 

 

 

 

이를 해결하기 위해 

 

read_csv / read_excel 등에선 thousands 옵션을 제공한다.

 

 

 

thousands 옵션을 이용해서 데이터를 다시 불러오자

 

 

부가적인 작업없이

 

천 단위 구분자(,)가 포함된 컬럼을 자동으로 숫자형으로 바꿔서 가져왔다.

 

 

반응형