본문 바로가기

시각화/Seaborn

Seaborn - 범주형 데이터의 산점도 : stripplot, swarmplot

반응형
범주형 변수에 들어 있는 각 범주별 데이터의 분포 확인

[stripplot]
데이터 포인트가 중복되어 범주별 분포를 그린다.


[swarmplot]
위 그래프는 데이터의 분산까지 고려하여, 데이터 포인트가 서로 중복되지 않도록 그린다.
즉, 데이터가 퍼져 있는 정도를 입체적으로 볼 수 있다.

 

 

 

 

데이터 불러오기

 

https://steadiness-193.tistory.com/180

 

Seaborn - 산점도 : regplot

[산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - �

steadiness-193.tistory.com

 

위 포스팅에서 fare 컬럼의 아웃라이어를 제거한

 

타이타닉 데이터프레임을 가져온다.

 

 

 

 

class별로 나이의 분포를 살펴보자

 

 

 

stripplot

 

 

 

seaborn의 강점인 hue옵션에 성별을 넣으면

 

각 분포도 성별별로 나눠져서 그려진다.

 

 

 

 

 

stripplot + hue

 

 

 

 

 

 

 

 

 

swarmplot

 

 

stripplot과는 다르게

 

분산까지 표현되어 얼마나 퍼져있는지를 볼 수 있다.

 

 

 

 

 

swarmplot + hue

 

 

 

 

두개의 그래프를 조정해서 보기 좋게 그려보자

 

 

loc는 숫자로 조정할 수 있다.

 

 

 

반응형