본문 바로가기

시각화/Seaborn

(18)
Seaborn - 하나의 axe 객체에 여러 개 그래프 그리기 https://steadiness-193.tistory.com/166 Matplotlib - 하나의 axe 객체에 여러 개 그래프 그리기 [1개의 컬럼 이용] (예시 : 히스토그램) 1. add_subplot add_subplot을 이용해 ax 틀을 생성한다. 이제 ax에 바로 그래프 종류를 기입해서 그려내면 된다. ax.hist 박스로 체크한 부분에 보이듯이 plt.xlabel을.. steadiness-193.tistory.com 위 포스팅과 맥을 같이한다. [1개의 컬럼 이용] (예시 : 히스토그램) 1. add_subplot fig = plt.figure(figsize=(N, N)) ax = fig.add_subplot(1, 1, 1) [1] ax = sns.distplot ax = sns.dist..
Seaborn - 박스 플롯(박스 그래프) : boxplot 박스 플롯은 범주형 데이터 분포와 주요 통계 지표를 함께 제공 다양한 통계 수치를 확인하기 위해 자주 사용 최솟값, 1분위수, 중간값, 3분위수, 최댓값, 이상치 등 다양한 통계량을 한번에 표현 이번 포스팅에선 seaborn으로 boxplot을 그리는 방법에 초점을 맞춘다. boxplot에 대한 설명은 아래 포스팅 참조 https://steadiness-193.tistory.com/179 Matplotlib - 박스 플롯(박스 그래프) : boxplot [박스 플롯] 이산형 변수와 연속형 변수를 함께 사용 - 이산형 변수 : Female, Male 처럼 명확하게 구분되는 값 - 연속형 변수 : 정수, 실수 같이 명확히 셀 수 없는 범위의 값 범주형 데이터의 분포를 steadiness-193.tistory..
Seaborn - 빈도 그래프 : countplot 이산값을 나타내는 그래프 각 범주에 속하는 데이터의 개수를 막대 그래프로 나타냄 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - � steadiness-193.tistory.com 위 포스팅에서 fare 컬럼의 아웃라이어를 제거한 타이타닉 데이터프레임을 가져온다. class별 인원 파악 class별로 인원 수를 그래프로 파악할 수 있다. 실제 수치를 보면 동일하게 그려진 것을 알 수 있다..
Seaborn - 그래프 그릴 때 헷갈리는 부분 정리 https://steadiness-193.tistory.com/186 Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리 위 데이터프레임의 mpg 컬럼과 horsepower 컬럼의 관계를 살펴보자 scatter 이용 [하나의 그래프] 1. plt plt.scatter() plt.plot.scatter() plt.plot(kind='scatter') 가능 - xlabel, ylabel 등은 수동으로 추가.. steadiness-193.tistory.com 위 포스팅의 데이터프레임을 그대로 이용한다. mpg 컬럼과 horsepower 컬럼의 관계를 보기 위해 regplot을 이용한다. [하나의 그래프] 기본 기본, data 옵션 없이 크기 조정 plt.figure(figsize=(12, 6) sns...
Seaborn - 막대 그래프 : barplot [barplot] 지정한 변수의 평균을 계산하여 그림 데이터의 개수가 아닌 평균을 계산한다. sns.barplot(x, y, data, .., ) -data : 데이터프레임 - x, y : 컬럼 참조 막대그래프 위에 덧그려진 검은 선은 95%의 신뢰구간을 나타낸다. 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - � steadiness-193.tistory.com 위 포스팅에서 fare ..
Seaborn - 범주형 데이터의 산점도 : stripplot, swarmplot 범주형 변수에 들어 있는 각 범주별 데이터의 분포 확인 [stripplot] 데이터 포인트가 중복되어 범주별 분포를 그린다. [swarmplot] 위 그래프는 데이터의 분산까지 고려하여, 데이터 포인트가 서로 중복되지 않도록 그린다. 즉, 데이터가 퍼져 있는 정도를 입체적으로 볼 수 있다. 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - � steadiness-193.tistory.com..
Seaborn - 히트맵 : heatmap 2개의 범주형 변수를 각각 x, y축에 넣고 데이터를 매트릭스 형태로 분류한 상태를 그릴 수 있다. 주로 데이터프레임을 피벗테이블로 만든 객체를 그린다. 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - � steadiness-193.tistory.com 위 포스팅에서 fare 컬럼의 아웃라이어를 제거한 타이타닉 데이터프레임을 가져온다. 피벗테이블 제작 성별별, class별 인원 수를 피벗..
Seaborn - heatmap이 잘려나오는 경우 해결 주로 히트맵이 잘려나오는 이유는 matplotlib의 버전이 3.1.1일때 그럴 가능성이 높다. import matplotlib print("matplotlib version: {}". format(matplotlib.__version__)) 위 코드를 실행해 matplotlib의 버전이 3.1.1이라면 버전을 업그레이드 해야한다. 업그레이드 방법 1. Anaconda를 관리자권한으로 실행 2. 주피터 노트북에서 pip install --upgrade matplotlib 위 코드 실행 그리고 다시 버전을 확인하면 2020년 7월 26일 기준 matplotlib version: 3.3.0 위와 같이 나온다. 다시 sns.heatmap을 실행하면 잘림 없이 잘 나오게 된다.