Pandas/실전
판다스 - 광고데이터 분석을 통한 중점관리 키워드 추출
Data_Pistachio
2020. 7. 14. 09:23
반응형
1. 노출수
광고데이터의 노출수를 오름차순하고
인덱스를 초기화(reset_index) 하여 시각화
x축은 인덱스로 큰 의미 없음
주목해야할 것은 상위 5%에서 압도적으로 높은 성적을 보임
2. 클릭수
광고데이터의 클릭수를 오름차순 하고
인덱스를 초기화(reset_index) 하여 시각화
x축은 인덱스로 큰 의미 없음
클릭 수 또한 상위 5%에서 압도적으로 높은 성적을 보이고 있음.
노출수, 클릭수 기준 상위 5% 이상의 키워드 추출
95백분위수를 이용한다. (quantile(0.95))
1. 첫번째 조건 만들기 (cond1)
노출수가 상위 5% 이상인지 확인하는 불린 시리즈
2. 두번째 조건 만들기 (cond2)
클릭수가 상위 5% 이상인지 확인하는 불린 시리즈
3. cond1과 cond2를 &를 이용하여
조건을 만족하는 키워드 찾기
조건을 만족하는 행의 키워드 컬럼만 찾아냈다.
즉, 위 배열에 있는 값들이
노출과 클릭이 상위 5%이상인 키워드들이다.
반응형