본문 바로가기

시각화/Seaborn

Seaborn - 빈도 그래프 : countplot

반응형
이산값을 나타내는 그래프

각 범주에 속하는 데이터의 개수를 막대 그래프로 나타냄

 

 

데이터 불러오기

 

https://steadiness-193.tistory.com/180

 

Seaborn - 산점도 : regplot

[산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - �

steadiness-193.tistory.com

 

위 포스팅에서 fare 컬럼의 아웃라이어를 제거한

 

타이타닉 데이터프레임을 가져온다.

 

 

 

 

 

class별 인원 파악

 

 

 

class별로 인원 수를 그래프로 파악할 수 있다.

 

실제 수치를 보면

 

 

 

동일하게 그려진 것을 알 수 있다.

 

 

 

 

* 색 구성을 다르게 하려면 palette 옵션을 변경하면 된다.

 

 

palette 옵션에 Set1을 넘겨서 색상을 자동으로 변경했다.

 

 

 

 

 

 

 

class, who 컬럼의 값별로 count

 

위 그래프에서 hue 옵션에 who를 넣어주면 된다.

 

 

 

palette에는 Set2를 넣어줬다.

 

who 컬럼에는 child, woman, man 총 3개의 고유값이 있다.

 

 

class별, who를 구분해서 몇 명인지 셀 수 있는 것이다.

 

실제 수치와 비교해서 보면

 

 

 

확실히 시각화를 한 쪽이 눈에 잘 들어온다.

 

 

 

 

 

 

 

 

class, who 컬럼의 값별로 count + 누적 출력

 

 

축 방향으로 hue 변수를 분리하지 않고 위로 쌓아 올리는 누적그래프는

 

dodge=False를 넘겨서 그릴 수 있다.

 

 

 

 

palette에는 Set3를 넘겨주었다.

 

이 역시 각 값들을 더해서 누적하는 것이 아니라

 

 

그래프 자체를 누적해서 겹쳐보이는 것이다.

 

 

 

First 클래스의 총 누적합은 200이 넘지만

 

제일 높은 값인 111까지만 그래프가 그려진 것이다.

 

 

 

세로로 변경

 

 

y='원하는 컬럼명'을 넣어주면 세로로 돌려서 countplot을 그릴 수 있다.

반응형