본문 바로가기

시각화/Seaborn

Seaborn - 조인트 그래프 : jointplot

반응형
산점도를 기본으로 표시하고 x-y축에 각 변수에 대한 히스토그램을 동시에 보여준다.


x, y 인자에 원하는 열 이름을 지정하고 data 인잣값으로 데이터프레임을 지정


두 변수의 관계와 데이터가 분산되어 있는 정도를 한눈에 파악하기 쉽다.

 

 

 

 

데이터 불러오기

 

https://steadiness-193.tistory.com/196

 

Seaborn - 이차원 밀집도 : kdeplot

이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/..

steadiness-193.tistory.com

 

위 포스팅에서 아웃라이어와 누락값들을 제거한 타이타닉 데이터프레임을 이용한다.

 

 

 

 

 

 

 

jointplot

 

 

기본적으로 fare와 age의 산점도를 보여주고

 

우측엔 age 컬럼의 히스토그램을, 위쪽엔 fare 컬럼의 히스토그램을 동시에 보여주고 있다.

 

 

 

 

 

 

 

xlabel, ylabel, 제목 추가

 

 

 

기존에 plt.xlabel이나 ax.set_xlabel과는 조금 다르다.

 

제목이 fare 컬럼의 히스토그램과 너무 가까우니 위치를 조금 조정해보자

 

 

 

y에 1.03 값을 넣어주었다.

(기본값 : 0.98)

 

 

 

 

 

 

hexbin

 

 

jointplot은 kind옵션을 제공하며 이 옵션에 그래프의 종류를 넣어 다양하게 살펴볼 수 있다.

 

kind에 hexbin을 넣으면 육각 산점도를 그릴 수 있다.

 

 

일반 산점도는 점이 겹칠 경우 점을 구분하기 어려운데, 

육각 산점도는 2차원 표면에 육각형으로 데이터를 쌓아 표현하므로 구분하기 쉬워진다.

특정 데이터의 개수가 많아지면 점점 진한 색으로 표시된다.

 

 

 

 

일반 산점도에 비해 분포 정도를 구분하기가 더 쉬워졌다.

 

 

 

 

 

 

 

4개의 jointplot그리기

1. 기본 // 2. 회귀선 추가 // 3. 육각 산점도 // 4. 커널 밀집 그래프

 

 

color 옵션으로 색을 조정할 수도 있다.

 

 

반응형