반응형
데이터 불러오기
dtype('0')는 object를 뜻함
Born컬럼과 Died컬럼은 날짜데이터이기에 자료형을 datetime으로 바꿔줄 필요가 있다.
자료형을 변환한 새로운 시리즈
새 시리즈를 데이터프레임의 새 열로 추가하기
데이터프레임[새로 추가할 열의 이름] = 새 시리즈
* 주의 : 새 시리즈의 길이와 데이터프레임의 길이는 같아야 함
위의 예는 두개의 컬럼을 동시에 추가하는 방법
컬럼간 연산한 시리즈를 다시 열로 추가하기
scientist['Died_dt'] - scientist['Born_dt']를 하면 벡터간 연산이므로 시리즈가 나오게 된다.
이를 또 새로운 컬럼으로 추가하기 위한 작업
얼마나 살았는지에 대한 정보를 컬럼으로 추가하는 것
컬럼 삭제하기
데이터프레임.drop(['컬럼명'], axis=0 or 1)
- axis : 1 열 삭제
- axis : 0 행 삭제
기존의 object형인 Born, Died 컬럼을 삭제함
** axis(축)에 대한 글은 Numpy 관련 포스팅에서 설명
반응형
'Pandas > 전처리' 카테고리의 다른 글
판다스 - 데이터 표준화 (단위 환산 : kpl, mpg) (0) | 2020.06.19 |
---|---|
판다스 - 중복 데이터 처리 : duplicated, drop_duplicates (0) | 2020.06.19 |
판다스 - 누락 데이터 처리 : dropna, thresh, fillna, idxmax, ffill, bfill (0) | 2020.06.18 |
판다스 - 누락 데이터 확인 : isnull(), count_nonzero() (0) | 2020.06.18 |
판다스 - 데이터 연결 : concat (0) | 2020.06.18 |