본문 바로가기

Pandas/실전

판다스 - 지하철 공공데이터 분석 (2020년 1월 ~ 5월) : 승객이 가장 많은 역/노선의 1월 분석

반응형

https://steadiness-193.tistory.com/110

 

판다스 - 지하철 공공데이터 분석 (2020년 1월 ~ 5월) : 월별 승객이 제일 많은 역(노선) 찾기

https://steadiness-193.tistory.com/109 판다스 - 지하철 공공데이터 분석 (2020년 1월 ~ 5월) : 전처리 데이터 출처 https://data.seoul.go.kr/dataList/OA-12914/S/1/datasetView.do 서울시 지하철호선별 역별..

steadiness-193.tistory.com

위 포스팅에서 만들어낸 top 데이터 프레임을 이용한다.

 

 

 

                  역명   :    강남, 잠실(송파구청), 홍대입구, 고속터미널, 서울역, 신림, 선릉,

                                 사당, 구로디지털단지, 가산디지털단지

 

              노선명   :     2호선, 7호선, 3호선, 1호선, 4호선

 

 

top은 위의 역과 노선에 해당하는 데이터만 불러온 것이다.

 

 

 

 

 

 

 

이를 승객수로 내림차순해서 보면

 

상위 10개가 모두 1월로 나와있다.

 

 

 

 

 

 

 

1월의 데이터만 뽑아내기

 

 

top_Jan으로 1월의 데이터만 403개 행만 뽑아냈다.

 

 

 

 

 

 

 

 

 

1월의 일자별, 역별 승객수 합

유동인구가 제일 많은 10개 역 중에서도

 

1월 며칠에 승객이 제일 많은지 살펴볼 수 있다.

 

 

 

 

 

이 또한 히트맵으로 시각화해보자

 

 

압도적으로 강남에 1월 3일(금) / 10일(금) / 17일(금)에 승객수가 많다.

 

주로 금요일에 승객이 많은데, 24일부터 27일까지 적은 이유는

 

설날 때문으로 추측할 수 있다.

 

 

 

 

강남을 제외하고 살펴보자

 

 

강남 다음으로는 1월 중순까지 홍대입구와 잠실에 승객수가 많은 것을 볼 수 있다.

 

 

반응형