반응형
데이터 불러오기
연월일 컬럼을 연 / 월 / 일 세개의 컬럼으로 나눠서 보고 싶다면
방법1 : str.split()
1. 연월일 컬럼의 자료형을 object로 변환한다.
2. 판다스의 자료형과 파이썬의 문자열을 이용해 .str.split('-') 문법을 사용한다.
3. 그렇게 분할된 리스트를 시리즈로 받아낸다.
4. 그 시리즈를 .str.get()을 이용한다.
5. 0번째는 연 / 1번째는 월 / 2번째는 일
6. 이들을 새 컬럼으로 추가한다.
* 주의 : 연월일, 연, 월, 일 컬럼은 object형이므로
추후 활용을 위해선 정수형으로 바꿀 필요가 있다.
방법2 : str.split(expand=True)
- 사실 방법1과 유사하나 코드가 다소 간결해지는 것 뿐이다.
1. split에서 expand=True를 넣으면 바로 데이터프레임의 컬럼으로 생성이 된다.
2. 새로 생성된 데이터프레임에 컬럼명을 넣어준다.
3. pd.concat을 이용해 연결해준다.
반응형
'Pandas > 전처리' 카테고리의 다른 글
판다스 - 넓은 데이터 정리하기 : melt (0) | 2020.06.20 |
---|---|
판다스 - isin() (0) | 2020.06.19 |
판다스 - 컬럼 순서 변경 (0) | 2020.06.19 |
판다스 - 데이터 정규화 (0) | 2020.06.19 |
판다스 - 구간 분할 : pd.cut, pd.get_dummies (0) | 2020.06.19 |