본문 바로가기

시각화/Matplotlib

Matplotlib - 산점도 : scatter

반응형
[산점도 그래프]

변수 2개를 사용해서 만드는 이변량 그래프

서로 다른 두 변수 사이의 관계를 나타내는데, 중요한 것은 각 변수가 연속되는 값을 가져야 한다는 점이다.
(일반적으로 정수형 또는 실수형 값)


plot(kind='scatter')
plot.scatter()



scatter(x, y, s=None, c=None)

x, y
iterable한 자료형 (시리즈, 배열)


s
선택입력, 점의 크기 조정

스칼라 입력 시 크기 고정
iterable 자료 입력 시 마커마다 다른 크기 설정 가능


c
선택입력, 점의 색상 변경
iterable 자료 입력 시 마커마다 다른 색상 설정 가능

 

 

 

 

자동차 무게와 연비 사이의 관계를 산점도로 표현

 

 

 

 

 

 

 

s, c 조정

 

 

s에 10을 넘겨서 점의 크기를 10으로 고정했고

 

컬러(c)는 coral로 고정했다.

 

 

 

 

 

 

s에 시리즈 넘겨서 점의 크기를 값에 따라 다르게 설정

 

 

실린더의 개수는 3, 4, 5, 6, 8의 값을 가진다.

 

해당 열의 최대값 대비 상대적 크기를 나타내는 비율을 만들기 위해서

 

최대값인 8로 cylinders 컬럼을 나눠준 뒤 200을 곱해준다.

 

 

그 배열을 s에 입력하면 값의 크기에 따라 점의 크기가 다르게 표시된다.

 

 

 

점이 너무 겹쳐져서 안보이는 것을 방지하기 위해 alpha=0.5를 넣어줬다.

 

이처럼 점의 크기에 변화를 주면 모양이 비눗방울 같아져서

 

버블(Bubble)차트라고 부르기도 한다.

 

 

 

 

 

 

c, marker, cmap 설정

 

 

s가 아닌 c에 정규화된 실린더 시리즈를 넘기면

 

값에 따라 점의 색상이 변하게 된다.

 

 

컬러맵(cmap)으로 viridis 옵션을 사용한다.

 

marker는 기본이 원이지만 이번엔 +로 그려보자

 

 

 

 

 

반응형