반응형
https://steadiness-193.tistory.com/155
전처리, 컬럼 추가 등은 위 포스팅 참조
데이터 불러오기
Push Notification
Push 알람(마케팅)을 몇시에 하는 것이 좋은지는
시간대별 주문 수를 보면 된다.
InvoiceDate 컬럼을 이용해 시간 컬럼을 만들어 추가하자
시간대별 그룹핑, count
시각화
12시와 13시에 주문량이 제일 많은 것을 볼 수 있다.
* Hour 컬럼 추가 없이 set_index를 이용하는 방법도 있다.
시간대보다 더 디테일하게
30분 단위로 살펴보자
함수 정의
위 get_half_an_hour는
30분을 넘는 시간이라면 30분을,
30분을 넘지 않는 시간이라면 0분을 리턴한다.
예를 들어 15:45 주문이면 15:30으로 바뀌고
15:28 주문이면 15:00으로 바뀌는 것이다.
30분 컬럼 추가
30분 컬럼으로 그룹핑, count
시각화
12시와 12시 30분에 주문량이 제일 많은 것을 볼 수 있다.
그렇다면 그냥 12시와 12시 30분에 Push 마케팅을 하면 될까?
이에 '그렇다.'라고 답변하기엔 아쉬움이 있다.
왜냐하면
12시와 12시 30분의 주문 비율은
보다시피 전체 주문의 18%뿐이기 때문이다.
물론 적은 양이라고 볼 순 없지만 저 두 시간대에만 집중하기엔 아쉬움이 있다는 것이다.
* 30분 컬럼 추가 없이 set_index와 groupby에 함수를 이용할 수도 있다.
다음 포스팅에선 고객별 주문량이 제일 높은 시간대를 찾아보자.
반응형
'Pandas > 실전' 카테고리의 다른 글
판다스 - 로그데이터 분석 : 고객 이탈률이 높은 페이지는? (0) | 2020.07.23 |
---|---|
판다스 - 가상 쇼핑몰 고객 주문 데이터 : 고객별 주문을 가장 많이 하는 시간은? (0) | 2020.07.21 |
판다스 - 가상 쇼핑몰 고객 주문 데이터 : 우수 고객 찾기, 고객 코호트 분석 (0) | 2020.07.21 |
판다스 - 가상 쇼핑몰 고객 주문 데이터 : 고객 코호트(cohort) 분석 (0) | 2020.07.21 |
판다스 - 가상 쇼핑몰 고객 주문 데이터 : 시간대별 매출, 상위 매출 제품의 월별 판매량 추이 (0) | 2020.07.20 |