반응형
[박스 플롯]
이산형 변수와 연속형 변수를 함께 사용
- 이산형 변수 : Female, Male 처럼 명확하게 구분되는 값
- 연속형 변수 : 정수, 실수 같이 명확히 셀 수 없는 범위의 값
범주형 데이터의 분포를 파악하는데 용이함
한개의 컬럼
데이터프레임.boxplot(column=['컬럼명'])
여러 개의 연속형 변수
ax=fig.add_subplot
ax.boxplot
최댓값과 최솟값 밖의 값들은 이상치라고 볼 수 있다.
mpg 컬럼의 박스 플롯
시리즈.boxplot은 에러 발생
시리즈.plot.box() 또는 시리즈.plot(kind='box') 이용
여러 개의 연속 변수
origin 컬럼은 1, 2, 3의 값이 있는데
해당 값별 mpg의 분포를 살펴보자
add_subplot을 이용해서 ax.boxplot으로 그릴 수 있다.
수직 수평 박스 플롯 동시에 그리기
수평 박스 플롯은 vert에 False를 넘겨주면 된다.
이상치의 색깔과 모양 변경
sym옵션에 색깔과 모양 문자열을 차례로 넘기면 된다.
왼쪽 sym='bo', 오른쪽 sym='rs'
물론 그래프를 여러 개 그릴 땐 subplots를 이용하면 편하지만
한 컬럼을 값에 따라 분류하여 나타내려면 subplots는 에러가 난다.
단순히 데이터프레임의 여러 컬럼을 그릴 순 있다.
반응형
'시각화 > Matplotlib' 카테고리의 다른 글
Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리(2) (0) | 2020.07.28 |
---|---|
Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리 (0) | 2020.07.28 |
Matplotlib - 파이 차트 : pie (0) | 2020.07.25 |
Matplotlib - 산점도 : scatter (2) | 2020.07.25 |
Matplotlib - 밀도 그래프 : density, kde (0) | 2020.07.25 |