본문 바로가기

시각화/Seaborn

Seaborn - 박스 플롯(박스 그래프) : boxplot

반응형
박스 플롯은 범주형 데이터 분포와 주요 통계 지표를 함께 제공


다양한 통계 수치를 확인하기 위해 자주 사용


최솟값, 1분위수, 중간값, 3분위수, 최댓값, 이상치 등 다양한 통계량을 한번에 표현

 

 

 

https://flowingdata.com/2008/02/15/how-to-read-and-use-a-box-and-whisker-plot/

 

 

 

이번 포스팅에선 seaborn으로 boxplot을 그리는 방법에 초점을 맞춘다.

 

 

 

boxplot에 대한 설명은 아래 포스팅 참조

 

https://steadiness-193.tistory.com/179

 

Matplotlib - 박스 플롯(박스 그래프) : boxplot

[박스 플롯] 이산형 변수와 연속형 변수를 함께 사용 - 이산형 변수 : Female, Male 처럼 명확하게 구분되는 값 - 연속형 변수 : 정수, 실수 같이 명확히 셀 수 없는 범위의 값 범주형 데이터의 분포를

steadiness-193.tistory.com

 

 

 

 

 

데이터 불러오기

 

https://steadiness-193.tistory.com/180

 

Seaborn - 산점도 : regplot

[산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - �

steadiness-193.tistory.com

 

위 포스팅에서 fare 컬럼의 아웃라이어를 제거한

 

타이타닉 데이터프레임을 가져온다.

 

 

 

 

 

타이타닉 생존자 별, 연령의 분포

 

 

 

 

hue 옵션 추가

성별별로 구분

 

hue 옵션에 성별을 넘기면

 

생존여부 별로도 더 나눠서 볼 수 있다.

 

 

 

 

 

 

위 두 개의 그래프를 동시에 그리기

 

 

 

 

색깔 변경

palette 옵션

 

 

 

 

 

* swarmplot을 추가해서 같이 볼 수도 있다.

 

 

반응형