본문 바로가기

Pandas/응용

판다스 - 원하는 위치에 조건에 맞는 컬럼(열) 추가 : insert 응용

반응형
데이터프레임.insert(원하는 컬럼의 위치, 새롭게 들어갈 컬럼의 이름, 조건)


- 컬럼의 위치는 0부터 시작

- 조건을 변수에 넣어서도 이용 가능

 

 

데이터 불러오기

 

 

위 컬럼들의 자료형을 보자

 

 

 

 

마력은 숫자로 구성된 것 같은데 

 

자료형이 object이다.

 

 

 

 

이를 파악하기 위해 unique 메서드로 살펴보자

 

 

 

숫자들 사이에 ?라는 값이 있어 object형으로 표시된 것이다.

 

 

 

 

 

 

[목표 : horsepower 컬럼 옆에 자료형이 float인 horsepower 사본 컬럼 추가]

 

https://steadiness-193.tistory.com/18

 

판다스 - 자료형 변환 (astype, pd.to_numeric)

데이터 불러오기 문제가 있는 열은 total_bill로서, [1, 3, 5, 7]행은 missing이라는 문자열이 들어가 있다. 데이터 타입을 확인해도 숫자가 아닌 object형으로 되어있다. [목적 : total_bill 컬럼을 float형으..

steadiness-193.tistory.com

 

위의 pd.to_numeric을 이용해서

 

 

 

?를 NaN으로 바꾼 시리즈를 만들어 낸다.

 

 

 

 

 

이제 float_sr을 insert 인자에 넣어주면 된다.

 

 

 

 

5번째 컬럼의 위치에

 

horsepower_float라는 이름의 컬럼이 추가됐다.

 

 

 

 

자료형이 잘 바뀌었는지 확인해보자

 

 

 

새로 추가한 컬럼의 자료형은 float으로 잘 바뀌었다.

 

 

 

 

즉  ?가 NaN으로 잘 바뀌었다는 것이다.

 

 

 

 

 

반응형