반응형
https://steadiness-193.tistory.com/220
위 포스팅에서 전처리 완료한 fec_mrbo를 이용한다.
데이터 불러오기
후보와 주 컬럼으로 그룹핑하기
후보와 주 별로 그룹핑 한 객체의
그룹별 기부금의 합을 구했다.
이 또한 좀 더 보기 좋게 unstack을 하자
위 데이터프레임에서 누락값을 0으로 바꾸고
그 객체를 totals 변수에 넣어주자
67개의 주는 너무 많으니
후보 상관없이 10만 달러 초과로 기부한 주만 필터링 해보자
절대적인 기부금의 차이가 크기 때문에
주별 기부금의 합으로 나눠서 정규화를 해줘야한다.
위 데이터프레임의 행도 적은 것은 아니니
롬니에게 기부를 많이 한 상위 15개의 주를 기준으로 내림차순해서
시각화를 해보자
시각화
반응형
'Pandas > 실전' 카테고리의 다른 글
판다스 - 2012년 연방선거관리위원회 : 후보와 기부 규모별 기부 비율 (0) | 2020.08.09 |
---|---|
판다스 - 2012년 연방선거관리위원회 : 직업 및 고용주에 따른 (정당별)기부 통계 (0) | 2020.08.09 |
판다스 - 2012년 연방선거관리위원회 : 전처리, 메모리 효율화 (0) | 2020.08.09 |
판다스 - 뉴욕 Airbnb 데이터 : 지역별 가격 분포 파악, 시각화 (0) | 2020.08.03 |
판다스 - 뉴욕 Airbnb 데이터 : SQL로 데이터 다뤄보기 (0) | 2020.08.02 |