본문 바로가기

시각화

(42)
Seaborn - 색깔 조정 : color, palette titanic 데이터 전처리 나이대 컬럼 (age_group)을 만들었다. 이를 countplot으로 시각화해보자 https://steadiness-193.tistory.com/192 Seaborn - 빈도 그래프 : countplot 이산값을 나타내는 그래프 각 범주에 속하는 데이터의 개수를 막대 그래프로 나타냄 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이 steadiness-193.tistory.com countplot은 위 포스팅 참조 기본 기본 색상은 bar마다 다른 위 결과다. color 옵션 설정 color에 넣은 #FC7F77은 Kuler에서 찾아낼 수 있다. col..
Matplotlib - 한글 폰트, -(마이너스), 디스플레이 설정 1. 한글 표시 설정 Windows일 경우 맑음고딕체를 사용한다. 맥일 경우 애플고딕체를 사용한다. 2. -(minus)표시는 False로 설정해둔다. 3. 글씨를 조금 더 선명하게 나타내려면 set_matplotlib_formats에 'retina'를 넘겨준다.
Matplotlib - x축 눈금 회전 안될 때 : ConversionError 데이터 불러오기 위 xticks는 굳이 90도 회전해서 보여질 필요가 없다. 회전 없이 나타날 수 있게 해보자 try1. xticks에 문자열 지정 ConversionError가 뜬다. try2. plot 메서드의 rot 옵션 이용 rot에 0을 넘기면 해결 된다. * 단, rotation으로 하면 에러 발생 try3. plt.xticks try1의 방법과는 달리 ticks 옵션에 0부터 ndf의 길이를 range로 넘겨준다. 즉, x축 눈금을 0, 1, 2로 준 다음에 labels로 이름을 바꿔주는 것이다.
Seaborn - 패싯 그리드 : FacetGrid 다양한 범주형 값을 가지는 데이터를 시각화하는데 좋은 방법 행, 열 방향으로 서로 다른 조건을 적용하여 여러 개의 서브 플롯 제작 각 서브 플롯에 적용할 그래프 종류를 map() 메서드를 이용하여 그리드 객체에 전달 [그리는 방법] 1. FacetGrid에 데이터프레임과 구분할 row, col, hue 등을 전달해 객체 생성 2. 객체(facet)의 map 메서드에 그릴 그래프의 종류와 종류에 맞는 컬럼 전달 예시 - distplot의 경우 하나의 컬럼 // scatter의 경우 두개의 컬럼 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. sea..
Seaborn - 스타일 변경 : set_style 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/.. steadiness-193.tistory.com 위 포스팅에서 아웃라이어와 누락값들을 제거한 타이타닉 데이터프레임을 이용한다. seaborn의 set_style 메서드로 바꿀 수 있는 스타일은 darkgrid, whitegrid, dark, white, ticks가 있다. tick를 제외한 4가..
Seaborn - 산점도 그래프 : lmplot 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/.. steadiness-193.tistory.com 위 포스팅에서 아웃라이어와 누락값들을 제거한 타이타닉 데이터프레임을 이용한다. 사실 lmplot은 별 옵션 없이 산점도의 관점에서만 보면 regplot과 크게 다르지 않다. https://steadiness-193.tistory.com/180 Se..
Seaborn - 관계 그래프 : pairplot 이변수 데이터의 분포 인자로 전달되는 데이터프레임의 열(변수)을 두 개씩 짝 지을 수 있는 모든 조합에 대해서 표현 * 열은 정수/실수형이어야 함 3개의 열이라면 3행 x 3열의 크기로 모두 9개의 그리드를 만든다. 각 그리드의 두 변수 간의 관계를 나타내는 그래프를 하나씩 그리며 같은 변수끼리 짝을 이루는 대각선 방향으로는 히스토그램을 그린다. 서로 다른 변수 간에는 산점도를 그린다. 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 -..
Seaborn - 조인트 그래프 : jointplot 산점도를 기본으로 표시하고 x-y축에 각 변수에 대한 히스토그램을 동시에 보여준다. x, y 인자에 원하는 열 이름을 지정하고 data 인잣값으로 데이터프레임을 지정 두 변수의 관계와 데이터가 분산되어 있는 정도를 한눈에 파악하기 쉽다. 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/.. steadiness-193.tistory.com 위 포스팅..