본문 바로가기

시각화

(42)
Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https://steadiness-193.tistory.com/68 판다스 - 특잇값(outlier) 처리하기 데이터프레임을 다루다보면 여러 아웃라이어들을 볼 수 있다. 이 값들은 가치가 있을 수 있지만 때로는 제외하고 처리해야할 때가 steadiness-193.tistory.com 위 이상치 제거 방법을 fare 컬럼에 적용 후 age 컬럼의 누락행을 삭제하고 다시 age 컬럼의 이상치를 제거한 데이터프레임을 이용한다. 데이터 불러오기 694행..
Seaborn - 바이올린 플롯(바이올린 그래프) : violinplot 박스 플롯에 커널 밀도 함수 그래프를 y 축 방향에 추가한 그래프 분산의 정도를 파악하기 쉬움 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - � steadiness-193.tistory.com 위 포스팅에서 fare 컬럼의 아웃라이어를 제거한 타이타닉 데이터프레임을 가져온다. 타이타닉 생존자 별, 연령의 분포 1. 중심선을 따라 대칭인 kde plot 2. 가운데 보이는 흰색 점은 중앙..
Seaborn - 하나의 axe 객체에 여러 개 그래프 그리기 https://steadiness-193.tistory.com/166 Matplotlib - 하나의 axe 객체에 여러 개 그래프 그리기 [1개의 컬럼 이용] (예시 : 히스토그램) 1. add_subplot add_subplot을 이용해 ax 틀을 생성한다. 이제 ax에 바로 그래프 종류를 기입해서 그려내면 된다. ax.hist 박스로 체크한 부분에 보이듯이 plt.xlabel을.. steadiness-193.tistory.com 위 포스팅과 맥을 같이한다. [1개의 컬럼 이용] (예시 : 히스토그램) 1. add_subplot fig = plt.figure(figsize=(N, N)) ax = fig.add_subplot(1, 1, 1) [1] ax = sns.distplot ax = sns.dist..
Seaborn - 박스 플롯(박스 그래프) : boxplot 박스 플롯은 범주형 데이터 분포와 주요 통계 지표를 함께 제공 다양한 통계 수치를 확인하기 위해 자주 사용 최솟값, 1분위수, 중간값, 3분위수, 최댓값, 이상치 등 다양한 통계량을 한번에 표현 이번 포스팅에선 seaborn으로 boxplot을 그리는 방법에 초점을 맞춘다. boxplot에 대한 설명은 아래 포스팅 참조 https://steadiness-193.tistory.com/179 Matplotlib - 박스 플롯(박스 그래프) : boxplot [박스 플롯] 이산형 변수와 연속형 변수를 함께 사용 - 이산형 변수 : Female, Male 처럼 명확하게 구분되는 값 - 연속형 변수 : 정수, 실수 같이 명확히 셀 수 없는 범위의 값 범주형 데이터의 분포를 steadiness-193.tistory..
Seaborn - 빈도 그래프 : countplot 이산값을 나타내는 그래프 각 범주에 속하는 데이터의 개수를 막대 그래프로 나타냄 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - � steadiness-193.tistory.com 위 포스팅에서 fare 컬럼의 아웃라이어를 제거한 타이타닉 데이터프레임을 가져온다. class별 인원 파악 class별로 인원 수를 그래프로 파악할 수 있다. 실제 수치를 보면 동일하게 그려진 것을 알 수 있다..
Seaborn - 그래프 그릴 때 헷갈리는 부분 정리 https://steadiness-193.tistory.com/186 Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리 위 데이터프레임의 mpg 컬럼과 horsepower 컬럼의 관계를 살펴보자 scatter 이용 [하나의 그래프] 1. plt plt.scatter() plt.plot.scatter() plt.plot(kind='scatter') 가능 - xlabel, ylabel 등은 수동으로 추가.. steadiness-193.tistory.com 위 포스팅의 데이터프레임을 그대로 이용한다. mpg 컬럼과 horsepower 컬럼의 관계를 보기 위해 regplot을 이용한다. [하나의 그래프] 기본 기본, data 옵션 없이 크기 조정 plt.figure(figsize=(12, 6) sns...
Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리(2) https://steadiness-193.tistory.com/186 Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리 위 데이터프레임의 mpg 컬럼과 horsepower 컬럼의 관계를 살펴보자 scatter 이용 [하나의 그래프] 1. plt plt.scatter() plt.plot.scatter() plt.plot(kind='scatter') 가능 - xlabel, ylabel 등은 수동으로 추가.. steadiness-193.tistory.com 위 포스팅의 데이터를 그대로 이용한다. scatter 이용 [두개 이상의 그래프(subplots)] plt.subplots() 1. ax = plt.scatter 이전 포스팅의 add_subplot과는 다르게 plt.scatter를 해도 ax인자를..
Matplotlib - 그래프 그릴 때 헷갈리는 부분 정리 위 데이터프레임의 mpg 컬럼과 horsepower 컬럼의 관계를 살펴보자 scatter 이용 [하나의 그래프] 1. plt plt.scatter() plt.plot.scatter() plt.plot(kind='scatter') 가능 - xlabel, ylabel 등은 수동으로 추가해야 함 - data 옵션 이용 여부에 따라 컬럼 연산 가능/불가능 - 사이즈는 plt.figure(figsize=(N, N))으로 조정 불가능 불가능 data 옵션 없이 data 옵션 이용 크기(figsize) 조정 2. 데이터프레임(시리즈).plot df.plot.scatter / df.plot(kind='scatter') 모두 가능 - plot 메서드 안에서 figsize 조절 가능 - label이 자동으로 생겨남 크기(..