본문 바로가기

시각화/Seaborn

Seaborn - 산점도 그래프 : lmplot

반응형

데이터 불러오기

 

https://steadiness-193.tistory.com/196

 

Seaborn - 이차원 밀집도 : kdeplot

이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/..

steadiness-193.tistory.com

 

위 포스팅에서 아웃라이어와 누락값들을 제거한 타이타닉 데이터프레임을 이용한다.

 

 

 

 

 

사실 lmplot은 별 옵션 없이 산점도의 관점에서만 보면 regplot과 크게 다르지 않다.

 

 

 

https://steadiness-193.tistory.com/180

 

Seaborn - 산점도(산포도) : regplot

[산포도(산점도)] 서로 다른 2개의 연속 변수 이용 두 개의 1차원 데이터 묶음 간의 관계 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제�

steadiness-193.tistory.com

 

 

 

실제로 회귀선 없이 컬럼만 넣고 보면 동일한 결과를 나타낸다.

 

 

lmplot의 강점은 옵션들에 있다.

 

 

 

 

hue 옵션 추가

 

 

regplot엔 없는 hue옵션을 이용해

 

성별별로 구분해서 볼 수 있다.

 

 

 

 

 

 

markers 변경

 

 

 

markers를 이용해 원하는 모양으로 마커를 바꿔줄 수도 있다.

 

 

 

 

 

 

 

 

palette

 

 

 

palette 옵션으로 한꺼번에 색상도 바꿀 수 있다.

 

 

 

 

물론 이렇게 딕셔너리를 이용해 원하는 색상을 지정해주기도 한다.

 

 

 

 

 

 

 

마커 사이즈 변경

scatter_kws={'s': 스칼라값}

 

 

마커 사이즈를 30으로 변경해줬다.

 

 

 

 

 

 

 

 

hue 옵션 대신 컬럼으로 나눠서 보기

col='컬럼명'

 

 

보통 hue 옵션으로 구분하지만

 

col 옵션에 컬럼을 넣으면 좌/우로 나눠서 구분해준다.

 

왼쪽은 남성, 오른쪽은 여성의 산점도를 그렸다.

 

col 인자 - 데이터 그룹을 구분할 열 입력

 

 

 

 

 

 

 

 

 

hue와 col을 동시 사용

col='컬럼명', hue='컬럼명'

 

 

col에 pclass를 넣어 pclass 그룹별로 그래프를 그린 뒤

 

hue 옵션에 따라 성별로도 나눠줬다.

 

 

 

 

 

 

 

그래프를 그릴 열의 최댓값 지정

col_wrap = 정수

 

 

col_wrap=2 옵션 없이는 세 개의 그룹이 한 화면에 나왔지만

 

열을 2개로 제한해서 pclass가 3인 그룹은 아래 행에 그려졌다.

 

 

 

 

 

 

 

 

 

row와 col 이용

row='컬럼명', col='컬럼명'

 

 

한꺼번에 성별/pclass별로

 

요금과 나이의 관계를 보려면

 

row와 col에 원하는 컬럼명을 넣어주면 된다.

 

반응형