반응형
1. 노출수
광고데이터의 노출수를 오름차순하고
인덱스를 초기화(reset_index) 하여 시각화
x축은 인덱스로 큰 의미 없음
주목해야할 것은 상위 5%에서 압도적으로 높은 성적을 보임
2. 클릭수
광고데이터의 클릭수를 오름차순 하고
인덱스를 초기화(reset_index) 하여 시각화
x축은 인덱스로 큰 의미 없음
클릭 수 또한 상위 5%에서 압도적으로 높은 성적을 보이고 있음.
노출수, 클릭수 기준 상위 5% 이상의 키워드 추출
95백분위수를 이용한다. (quantile(0.95))
1. 첫번째 조건 만들기 (cond1)
노출수가 상위 5% 이상인지 확인하는 불린 시리즈
2. 두번째 조건 만들기 (cond2)
클릭수가 상위 5% 이상인지 확인하는 불린 시리즈
3. cond1과 cond2를 &를 이용하여
조건을 만족하는 키워드 찾기
조건을 만족하는 행의 키워드 컬럼만 찾아냈다.
즉, 위 배열에 있는 값들이
노출과 클릭이 상위 5%이상인 키워드들이다.
반응형
'Pandas > 실전' 카테고리의 다른 글
판다스 - 고객데이터 시각화 : 나이대별 히스토그램, 문자열 컬럼 (0) | 2020.07.15 |
---|---|
판다스 - 광고데이터 분석을 통한 비효율 키워드 추출 (0) | 2020.07.14 |
판다스 - 네이버 쇼핑 크롤링 자료 : 분석 (0) | 2020.07.13 |
판다스 - 네이버 쇼핑 크롤링 자료 : 전처리, 살펴보기 (0) | 2020.07.13 |
판다스 - 미국의 연도별 인구밀도 변화 (0) | 2020.07.11 |