반응형
https://steadiness-193.tistory.com/110
위 포스팅에서 만들어낸 top 데이터 프레임을 이용한다.
역명 : 강남, 잠실(송파구청), 홍대입구, 고속터미널, 서울역, 신림, 선릉,
사당, 구로디지털단지, 가산디지털단지
노선명 : 2호선, 7호선, 3호선, 1호선, 4호선
top은 위의 역과 노선에 해당하는 데이터만 불러온 것이다.
이를 승객수로 내림차순해서 보면
상위 10개가 모두 1월로 나와있다.
1월의 데이터만 뽑아내기
top_Jan으로 1월의 데이터만 403개 행만 뽑아냈다.
1월의 일자별, 역별 승객수 합
유동인구가 제일 많은 10개 역 중에서도
1월 며칠에 승객이 제일 많은지 살펴볼 수 있다.
이 또한 히트맵으로 시각화해보자
압도적으로 강남에 1월 3일(금) / 10일(금) / 17일(금)에 승객수가 많다.
주로 금요일에 승객이 많은데, 24일부터 27일까지 적은 이유는
설날 때문으로 추측할 수 있다.
강남을 제외하고 살펴보자
강남 다음으로는 1월 중순까지 홍대입구와 잠실에 승객수가 많은 것을 볼 수 있다.
반응형
'Pandas > 실전' 카테고리의 다른 글
판다스 - 지하철 공공데이터 분석 (2020년 1월 ~ 5월) : 발렌타인데이 분석 (0) | 2020.07.10 |
---|---|
판다스 - 지하철 공공데이터 분석 (2020년 1월 ~ 5월) : 2월의 유동인구 많은 일자, 역별 분석 (0) | 2020.07.10 |
판다스 - 지하철 공공데이터 분석 (2020년 1월 ~ 5월) : 월별 승객이 제일 많은 역(노선) 찾기 (0) | 2020.07.09 |
판다스 - 지하철 공공데이터 분석 (2020년 1월 ~ 5월) : 전처리 (0) | 2020.07.09 |
판다스 - 미국농무부 영양소 정보 : 각 영양소가 가장 많이 든 음식 (0) | 2020.07.08 |