본문 바로가기

Pandas/전처리

판다스 - 데이터 연결 : concat

반응형

데이터 불러오기

 

 

 

 

 

 

 

pd.concat([데이터프레임1, 데이터프레임2, ...], axis=0(기본값))

 

 

axis=0이 기본값이므로, 위에서 아래방향으로 연결이 됨

 

기존 데이터프레임의 인덱스도 그대로 유지

 

또한 연결할 데이터프레임간의 컬럼명이 같아야 누락값 없이 연결됨

 

 

 

 

 

 

 

 

새 시리즈를 concat 해보기

 

임의의 시리즈 제작

 

컬럼명이 다르므로 새로운 열로 추가되며 누락값이 많아짐

 

 

 

 

 

 

새 데이터프레임을 concat 해보기

 

 

컬럼명이 같으므로 위, 아래로 잘 연결되었으며 기존 인덱스(0)을 유지함

 

 

 

 

 

 

 

append로 데이터프레임 연결하기

 

 

concat은 한번에 2개 이상의 데이터프레임을 연결할 수 있다.

 

append는 연결할 데이터프레임이 1개라면 이용 가능하다.

 

 

 

 

 

 

 

 

concat과 ignore_index

 

 

ignore_index=True를 이용하면 연결되던 데이터프레임의 기존 인덱스가 무시되고 

 

0부터 다시 지정됨

 

 

 

 

 

 

 

 

열 방향으로 데이터 연결하기(pd.concat([데이터프레임or시리즈], axis=1)

 

 

axis=1을 넣으면 행에다 연결이된다 == 좌우로 연결 == 열 방향

 

 

 

 

 

 

 

같은 이름의 열이 있다면 해당 열 이름의 데이터를 모두 추출

 

 

 

 

 

 

 

 

새로운 열 추가

 

 

데이터프레임['만들고 싶은 열 이름'] = [길이 맞춘 리스트]

 

 

 

 

 

 

 

 

 

열 방향으로 연결하며 열 이름 초기화하기

 

ignore_index=True

 

열 이름이 0부터 길이만큼 초기화되었다.

 

 

 

 

 

 

 

 

공통 열과 공통 인덱스만 연결하기

 

컬럼명을 일부 변경하였다.

 

그냥 연결하니 누락값이 많아졌다.

 

 

 

 

 

 

 

join='inner'

 

 

공통 열인 A와 C만 연결되었음

 

* ignore_index=True를 넣어줘도 됨

 

 

 

 

 

 

 

 

 

인덱스를 일부 변경하였다.

 

 

join='inner'없이는 누락값이 많아졌지만 조건을 주면 인덱스가 같은 것끼리 연결이 된다.

 

 

 

 

반응형