반응형
데이터 불러오기
pd.concat([데이터프레임1, 데이터프레임2, ...], axis=0(기본값))
axis=0이 기본값이므로, 위에서 아래방향으로 연결이 됨
기존 데이터프레임의 인덱스도 그대로 유지됨
또한 연결할 데이터프레임간의 컬럼명이 같아야 누락값 없이 연결됨
새 시리즈를 concat 해보기
컬럼명이 다르므로 새로운 열로 추가되며 누락값이 많아짐
새 데이터프레임을 concat 해보기
컬럼명이 같으므로 위, 아래로 잘 연결되었으며 기존 인덱스(0)을 유지함
append로 데이터프레임 연결하기
concat은 한번에 2개 이상의 데이터프레임을 연결할 수 있다.
append는 연결할 데이터프레임이 1개라면 이용 가능하다.
concat과 ignore_index
ignore_index=True를 이용하면 연결되던 데이터프레임의 기존 인덱스가 무시되고
0부터 다시 지정됨
열 방향으로 데이터 연결하기(pd.concat([데이터프레임or시리즈], axis=1)
axis=1을 넣으면 행에다 연결이된다 == 좌우로 연결 == 열 방향
같은 이름의 열이 있다면 해당 열 이름의 데이터를 모두 추출
새로운 열 추가
데이터프레임['만들고 싶은 열 이름'] = [길이 맞춘 리스트]
열 방향으로 연결하며 열 이름 초기화하기
열 이름이 0부터 길이만큼 초기화되었다.
공통 열과 공통 인덱스만 연결하기
join='inner'
공통 열인 A와 C만 연결되었음
* ignore_index=True를 넣어줘도 됨
join='inner'없이는 누락값이 많아졌지만 조건을 주면 인덱스가 같은 것끼리 연결이 된다.
반응형
'Pandas > 전처리' 카테고리의 다른 글
판다스 - 데이터 표준화 (단위 환산 : kpl, mpg) (0) | 2020.06.19 |
---|---|
판다스 - 중복 데이터 처리 : duplicated, drop_duplicates (0) | 2020.06.19 |
판다스 - 누락 데이터 처리 : dropna, thresh, fillna, idxmax, ffill, bfill (0) | 2020.06.18 |
판다스 - 누락 데이터 확인 : isnull(), count_nonzero() (0) | 2020.06.18 |
판다스 - 시리즈와 데이터프레임 데이터 처리 (0) | 2020.06.18 |