본문 바로가기

시각화/Seaborn

(18)
Seaborn - 색깔 조정 : color, palette titanic 데이터 전처리 나이대 컬럼 (age_group)을 만들었다. 이를 countplot으로 시각화해보자 https://steadiness-193.tistory.com/192 Seaborn - 빈도 그래프 : countplot 이산값을 나타내는 그래프 각 범주에 속하는 데이터의 개수를 막대 그래프로 나타냄 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이 steadiness-193.tistory.com countplot은 위 포스팅 참조 기본 기본 색상은 bar마다 다른 위 결과다. color 옵션 설정 color에 넣은 #FC7F77은 Kuler에서 찾아낼 수 있다. col..
Seaborn - 패싯 그리드 : FacetGrid 다양한 범주형 값을 가지는 데이터를 시각화하는데 좋은 방법 행, 열 방향으로 서로 다른 조건을 적용하여 여러 개의 서브 플롯 제작 각 서브 플롯에 적용할 그래프 종류를 map() 메서드를 이용하여 그리드 객체에 전달 [그리는 방법] 1. FacetGrid에 데이터프레임과 구분할 row, col, hue 등을 전달해 객체 생성 2. 객체(facet)의 map 메서드에 그릴 그래프의 종류와 종류에 맞는 컬럼 전달 예시 - distplot의 경우 하나의 컬럼 // scatter의 경우 두개의 컬럼 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. sea..
Seaborn - 스타일 변경 : set_style 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/.. steadiness-193.tistory.com 위 포스팅에서 아웃라이어와 누락값들을 제거한 타이타닉 데이터프레임을 이용한다. seaborn의 set_style 메서드로 바꿀 수 있는 스타일은 darkgrid, whitegrid, dark, white, ticks가 있다. tick를 제외한 4가..
Seaborn - 산점도 그래프 : lmplot 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/.. steadiness-193.tistory.com 위 포스팅에서 아웃라이어와 누락값들을 제거한 타이타닉 데이터프레임을 이용한다. 사실 lmplot은 별 옵션 없이 산점도의 관점에서만 보면 regplot과 크게 다르지 않다. https://steadiness-193.tistory.com/180 Se..
Seaborn - 관계 그래프 : pairplot 이변수 데이터의 분포 인자로 전달되는 데이터프레임의 열(변수)을 두 개씩 짝 지을 수 있는 모든 조합에 대해서 표현 * 열은 정수/실수형이어야 함 3개의 열이라면 3행 x 3열의 크기로 모두 9개의 그리드를 만든다. 각 그리드의 두 변수 간의 관계를 나타내는 그래프를 하나씩 그리며 같은 변수끼리 짝을 이루는 대각선 방향으로는 히스토그램을 그린다. 서로 다른 변수 간에는 산점도를 그린다. 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 -..
Seaborn - 조인트 그래프 : jointplot 산점도를 기본으로 표시하고 x-y축에 각 변수에 대한 히스토그램을 동시에 보여준다. x, y 인자에 원하는 열 이름을 지정하고 data 인잣값으로 데이터프레임을 지정 두 변수의 관계와 데이터가 분산되어 있는 정도를 한눈에 파악하기 쉽다. 데이터 불러오기 https://steadiness-193.tistory.com/196 Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https:/.. steadiness-193.tistory.com 위 포스팅..
Seaborn - 이차원 밀집도 : kdeplot 이차원 밀집도는 두개의 컬럼을 이용하며 kdeplot으로 그릴 수 있다. seaborn의 타이타닉 데이터에서 https://steadiness-193.tistory.com/78 판다스 - 특잇값(outlier) 찾아내기 : Tukey Fences, Z-score https://steadiness-193.tistory.com/68 판다스 - 특잇값(outlier) 처리하기 데이터프레임을 다루다보면 여러 아웃라이어들을 볼 수 있다. 이 값들은 가치가 있을 수 있지만 때로는 제외하고 처리해야할 때가 steadiness-193.tistory.com 위 이상치 제거 방법을 fare 컬럼에 적용 후 age 컬럼의 누락행을 삭제하고 다시 age 컬럼의 이상치를 제거한 데이터프레임을 이용한다. 데이터 불러오기 694행..
Seaborn - 바이올린 플롯(바이올린 그래프) : violinplot 박스 플롯에 커널 밀도 함수 그래프를 y 축 방향에 추가한 그래프 분산의 정도를 파악하기 쉬움 데이터 불러오기 https://steadiness-193.tistory.com/180 Seaborn - 산점도 : regplot [산점도] 서로 다른 2개의 연속 변수 이용 선형회귀선을 함께 나타냄 데이터 불러오기 seaborn의 타이타닉 데이터에서 fare컬럼의 아웃라이어 행을 제거했다. https://steadiness-193.tistory.com/78 판다스 - � steadiness-193.tistory.com 위 포스팅에서 fare 컬럼의 아웃라이어를 제거한 타이타닉 데이터프레임을 가져온다. 타이타닉 생존자 별, 연령의 분포 1. 중심선을 따라 대칭인 kde plot 2. 가운데 보이는 흰색 점은 중앙..