본문 바로가기

시각화/Matplotlib

(24)
Matplotlib - 한글 폰트, -(마이너스), 디스플레이 설정 1. 한글 표시 설정 Windows일 경우 맑음고딕체를 사용한다. 맥일 경우 애플고딕체를 사용한다. 2. -(minus)표시는 False로 설정해둔다. 3. 글씨를 조금 더 선명하게 나타내려면 set_matplotlib_formats에 'retina'를 넘겨준다.
Matplotlib - x축 눈금 회전 안될 때 : ConversionError 데이터 불러오기 위 xticks는 굳이 90도 회전해서 보여질 필요가 없다. 회전 없이 나타날 수 있게 해보자 try1. xticks에 문자열 지정 ConversionError가 뜬다. try2. plot 메서드의 rot 옵션 이용 rot에 0을 넘기면 해결 된다. * 단, rotation으로 하면 에러 발생 try3. plt.xticks try1의 방법과는 달리 ticks 옵션에 0부터 ndf의 길이를 range로 넘겨준다. 즉, x축 눈금을 0, 1, 2로 준 다음에 labels로 이름을 바꿔주는 것이다.
Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리(2) https://steadiness-193.tistory.com/186 Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리 위 데이터프레임의 mpg 컬럼과 horsepower 컬럼의 관계를 살펴보자 scatter 이용 [하나의 그래프] 1. plt plt.scatter() plt.plot.scatter() plt.plot(kind='scatter') 가능 - xlabel, ylabel 등은 수동으로 추가.. steadiness-193.tistory.com 위 포스팅의 데이터를 그대로 이용한다. scatter 이용 [두개 이상의 그래프(subplots)] plt.subplots() 1. ax = plt.scatter 이전 포스팅의 add_subplot과는 다르게 plt.scatter를 해도 ax인자를..
Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리 위 데이터프레임의 mpg 컬럼과 horsepower 컬럼의 관계를 살펴보자 scatter 이용 [하나의 그래프] 1. plt plt.scatter() plt.plot.scatter() plt.plot(kind='scatter') 가능 - xlabel, ylabel 등은 수동으로 추가해야 함 - data 옵션 이용 여부에 따라 컬럼 연산 가능/불가능 - 사이즈는 plt.figure(figsize=(N, N))으로 조정 불가능 불가능 data 옵션 없이 data 옵션 이용 크기(figsize) 조정 2. 데이터프레임(시리즈).plot df.plot.scatter / df.plot(kind='scatter') 모두 가능 - plot 메서드 안에서 figsize 조절 가능 - label이 자동으로 생겨남 크기(..
Matplotlib - 박스 플롯(박스 그래프) : boxplot [박스 플롯] 이산형 변수와 연속형 변수를 함께 사용 - 이산형 변수 : Female, Male 처럼 명확하게 구분되는 값 - 연속형 변수 : 정수, 실수 같이 명확히 셀 수 없는 범위의 값 범주형 데이터의 분포를 파악하는데 용이함 한개의 컬럼 데이터프레임.boxplot(column=['컬럼명']) 여러 개의 연속형 변수 ax=fig.add_subplot ax.boxplot 최댓값과 최솟값 밖의 값들은 이상치라고 볼 수 있다. mpg 컬럼의 박스 플롯 시리즈.boxplot은 에러 발생 시리즈.plot.box() 또는 시리즈.plot(kind='box') 이용 여러 개의 연속 변수 origin 컬럼은 1, 2, 3의 값이 있는데 해당 값별 mpg의 분포를 살펴보자 add_subplot을 이용해서 ax.bo..
Matplotlib - 파이 차트 : pie [파이 차트] 원을 파이 조각처럼 나눠서 그린다. 조각의 크기는 해당 변수에 속하는 데이터 값의 크기에 비례한다. plot(kind='pie') plot.pie() 그림의 옵션들은 하나씩 그려보며 살펴보자 데이터 살펴보기 위 데이터프레임에서 origin 컬럼으로 그룹핑 한다. 각 그룹의 행 개수를 시리즈로 나타내고 인덱스를 바꿔주자 이제 이 grouped_sr을 이용해 파이 차트를 그릴 수 있다. 기본 파이 차트 USA, EU, KR은 시리즈의 인덱스로 자동으로 표시된다. 다만 파이 조각별로 비율이 어느정도인지는 나타나지 않는다. 파이 조각별로 값% 표시 autopct autopct에 '%1.1f%%'를 넘겨서 조각별로 소수 첫째자리까지 수치를 표시했다. 파이 조각을 나누는 시작점 조정 (각도) star..
Matplotlib - 산점도 : scatter [산점도 그래프] 변수 2개를 사용해서 만드는 이변량 그래프 서로 다른 두 변수 사이의 관계를 나타내는데, 중요한 것은 각 변수가 연속되는 값을 가져야 한다는 점이다. (일반적으로 정수형 또는 실수형 값) plot(kind='scatter') plot.scatter() scatter(x, y, s=None, c=None) x, y iterable한 자료형 (시리즈, 배열) s 선택입력, 점의 크기 조정 스칼라 입력 시 크기 고정 iterable 자료 입력 시 마커마다 다른 크기 설정 가능 c 선택입력, 점의 색상 변경 iterable 자료 입력 시 마커마다 다른 색상 설정 가능 자동차 무게와 연비 사이의 관계를 산점도로 표현 s, c 조정 s에 10을 넘겨서 점의 크기를 10으로 고정했고 컬러(c)는 c..
Matplotlib - 밀도 그래프 : density, kde [밀도 그래프] 관찰값을 사용해서 추정되는 연속된 확률 분포를 그린다. 일반적인 과정은 kernel 메서드를 잘 섞어 이 분포를 근사하는 방법이나 이보다 단순한 정규분포이다. 그래서 밀도 그래프는 KDE(Kernel Density Estimate : 커넬 밀도 추정)그래프라고도 알려져 있다. plot.density plot(kind='density') plot.kde plot(kind='kde') https://steadiness-193.tistory.com/175 Matplotlib - 히스토그램 : hist [히스토그램] 변수가 하나인 단변수 데이터의 빈도수를 그래프로 표현 x축을 같은 크기의 여러 구간으로 나누고 각 구간에 속하는 데이터 값의 개수(빈도)를 y축에 표시 즉, 값들의 빈도를 분리�� ..