데이터 불러오기
https://steadiness-193.tistory.com/196
Seaborn - 이차원 밀집도 : kdeplot
이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/..
steadiness-193.tistory.com
위 포스팅에서 아웃라이어와 누락값들을 제거한 타이타닉 데이터프레임을 이용한다.
사실 lmplot은 별 옵션 없이 산점도의 관점에서만 보면 regplot과 크게 다르지 않다.
https://steadiness-193.tistory.com/180
Seaborn - 산점도(산포도) : regplot
[산포도(산점도)] 서로 다른 2개의 연속 변수 이용 두 개의 1차원 데이터 묶음 간의 관계 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제�
steadiness-193.tistory.com

실제로 회귀선 없이 컬럼만 넣고 보면 동일한 결과를 나타낸다.
lmplot의 강점은 옵션들에 있다.
hue 옵션 추가

regplot엔 없는 hue옵션을 이용해
성별별로 구분해서 볼 수 있다.
markers 변경

markers를 이용해 원하는 모양으로 마커를 바꿔줄 수도 있다.
palette

palette 옵션으로 한꺼번에 색상도 바꿀 수 있다.

물론 이렇게 딕셔너리를 이용해 원하는 색상을 지정해주기도 한다.
마커 사이즈 변경
scatter_kws={'s': 스칼라값}

마커 사이즈를 30으로 변경해줬다.
hue 옵션 대신 컬럼으로 나눠서 보기
col='컬럼명'

보통 hue 옵션으로 구분하지만
col 옵션에 컬럼을 넣으면 좌/우로 나눠서 구분해준다.
왼쪽은 남성, 오른쪽은 여성의 산점도를 그렸다.
col 인자 - 데이터 그룹을 구분할 열 입력
hue와 col을 동시 사용
col='컬럼명', hue='컬럼명'

col에 pclass를 넣어 pclass 그룹별로 그래프를 그린 뒤
hue 옵션에 따라 성별로도 나눠줬다.
그래프를 그릴 열의 최댓값 지정
col_wrap = 정수


col_wrap=2 옵션 없이는 세 개의 그룹이 한 화면에 나왔지만
열을 2개로 제한해서 pclass가 3인 그룹은 아래 행에 그려졌다.
row와 col 이용
row='컬럼명', col='컬럼명'


한꺼번에 성별/pclass별로
요금과 나이의 관계를 보려면
row와 col에 원하는 컬럼명을 넣어주면 된다.
'시각화 > Seaborn' 카테고리의 다른 글
Seaborn - 패싯 그리드 : FacetGrid (0) | 2020.08.01 |
---|---|
Seaborn - 스타일 변경 : set_style (0) | 2020.07.31 |
Seaborn - 관계 그래프 : pairplot (1) | 2020.07.31 |
Seaborn - 조인트 그래프 : jointplot (0) | 2020.07.31 |
Seaborn - 이차원 밀집도 : kdeplot (0) | 2020.07.31 |