본문 바로가기

Pandas/전처리

판다스 - 시리즈와 데이터프레임 데이터 처리

반응형

데이터 불러오기

 

 

 

 

 

 

 

 

dtype('0')는 object를 뜻함

 

 

Born컬럼과 Died컬럼은 날짜데이터이기에 자료형을 datetime으로 바꿔줄 필요가 있다.

 

 

 

 

 

 

 

자료형을 변환한 새로운 시리즈 

 

format은 날짜 형식을 지정함, 대소문자 주의할 것

 

 

 

 

 

 

 

 

새 시리즈를 데이터프레임의 새 열로 추가하기

 

 

데이터프레임[새로 추가할 열의 이름] = 새 시리즈

 

* 주의 : 새 시리즈의 길이와 데이터프레임의 길이는 같아야 함

 

위의 예는 두개의 컬럼을 동시에 추가하는 방법

 

 

 

 

 

 

 

 

 

컬럼간 연산한 시리즈를 다시 열로 추가하기

 

 

scientist['Died_dt'] - scientist['Born_dt']를 하면 벡터간 연산이므로 시리즈가 나오게 된다.

 

 

이를 또 새로운 컬럼으로 추가하기 위한 작업

얼마나 살았는지에 대한 정보를 컬럼으로 추가하는 것

 

 

 

 

 

 

 

컬럼 삭제하기

 

 

데이터프레임.drop(['컬럼명'], axis=0 or 1)

 

- axis : 1 열 삭제

- axis : 0 행 삭제 

 

기존의 object형인 Born, Died 컬럼을 삭제함

 

 

 

 

** axis(축)에 대한 글은 Numpy 관련 포스팅에서 설명

 

 

 

반응형