본문 바로가기

시각화/Matplotlib

Matplotlib - 박스 플롯(박스 그래프) : boxplot

반응형
[박스 플롯]

이산형 변수와 연속형 변수를 함께 사용
- 이산형 변수 : Female, Male 처럼 명확하게 구분되는 값
- 연속형 변수 : 정수, 실수 같이 명확히 셀 수 없는 범위의 값

범주형 데이터의 분포를 파악하는데 용이함



한개의 컬럼
데이터프레임.boxplot(column=['컬럼명'])



여러 개의 연속형 변수
ax=fig.add_subplot
ax.boxplot

https://flowingdata.com/2008/02/15/how-to-read-and-use-a-box-and-whisker-plot/

 

 

최댓값과 최솟값 밖의 값들은 이상치라고 볼 수 있다.

 

 

 

 

mpg 컬럼의 박스 플롯

 

 

 

 

 

시리즈.boxplot은 에러 발생

 

 

시리즈.plot.box() 또는 시리즈.plot(kind='box') 이용

 

 

 

 

 

 

 

여러 개의 연속 변수

 

origin 컬럼은 1, 2, 3의 값이 있는데

해당 값별 mpg의 분포를 살펴보자

 

 

add_subplot을 이용해서 ax.boxplot으로 그릴 수 있다.

 

 

 

 

 

 

 

 

수직 수평 박스 플롯 동시에 그리기

 

수평 박스 플롯은 vert에 False를 넘겨주면 된다.

 

 

 

 

 

 

 

 

 

이상치의 색깔과 모양 변경

 

sym옵션에 색깔과 모양 문자열을 차례로 넘기면 된다.

 

왼쪽 sym='bo', 오른쪽 sym='rs'

 

 

rs = red square

 

 

 

 

 

 

물론 그래프를 여러 개 그릴 땐 subplots를 이용하면 편하지만

 

한 컬럼을 값에 따라 분류하여 나타내려면 subplots는 에러가 난다.

 

 

 

 

 

ax1.title도 에러 발생
그려지긴 그려진다.

 

 

 

 

 

 

단순히 데이터프레임의 여러 컬럼을 그릴 순 있다.

 

 

반응형