반응형
데이터프레임.insert(원하는 컬럼의 위치, 새롭게 들어갈 컬럼의 이름, 조건)
- 컬럼의 위치는 0부터 시작
- 조건을 변수에 넣어서도 이용 가능
데이터 불러오기
위 컬럼들의 자료형을 보자
마력은 숫자로 구성된 것 같은데
자료형이 object이다.
이를 파악하기 위해 unique 메서드로 살펴보자
숫자들 사이에 ?라는 값이 있어 object형으로 표시된 것이다.
[목표 : horsepower 컬럼 옆에 자료형이 float인 horsepower 사본 컬럼 추가]
https://steadiness-193.tistory.com/18
위의 pd.to_numeric을 이용해서
?를 NaN으로 바꾼 시리즈를 만들어 낸다.
이제 float_sr을 insert 인자에 넣어주면 된다.
5번째 컬럼의 위치에
horsepower_float라는 이름의 컬럼이 추가됐다.
자료형이 잘 바뀌었는지 확인해보자
새로 추가한 컬럼의 자료형은 float으로 잘 바뀌었다.
즉 ?가 NaN으로 잘 바뀌었다는 것이다.
반응형
'Pandas > 응용' 카테고리의 다른 글
판다스 - groupby : 인덱스로 그룹화하기 (멀티인덱스, level) (0) | 2020.07.07 |
---|---|
판다스 - 누락데이터를 그룹별로 대체하여 컬럼(열) 만들기 : insert, groupby, transform, fillna (0) | 2020.07.06 |
판다스 - 여러 대용량 데이터 처리하기 : os.listdir (0) | 2020.07.06 |
판다스 - reindex를 활용한 멀티인덱스 컬럼(열) 추출 (0) | 2020.07.04 |
판다스 - 데이터 끌어올리기 : first_valid_index, shift (0) | 2020.07.01 |