본문 바로가기

Pandas/실전

판다스 - 광고데이터 분석을 통한 중점관리 키워드 추출

반응형

 

1. 노출수

 

광고데이터의 노출수를 오름차순하고

 

인덱스를 초기화(reset_index) 하여 시각화

 

 

x축은 인덱스로 큰 의미 없음

 

주목해야할 것은 상위 5%에서 압도적으로 높은 성적을 보임

 

 

 

 

 

 

 

 

2. 클릭수

 

광고데이터의 클릭수를 오름차순 하고

 

인덱스를 초기화(reset_index) 하여 시각화

 

 

x축은 인덱스로 큰 의미 없음

 

클릭 수 또한 상위 5%에서 압도적으로 높은 성적을 보이고 있음.

 

 

 

 

 

노출수, 클릭수 기준 상위 5% 이상의 키워드 추출

95백분위수를 이용한다. (quantile(0.95))

 

 

 

 

1. 첫번째 조건 만들기 (cond1)

노출수가 상위 5% 이상인지 확인하는 불린 시리즈

 

 

 

 

 

 

 

2. 두번째 조건 만들기 (cond2)

클릭수가 상위 5% 이상인지 확인하는 불린 시리즈

 

 

 

 

 

 

 

3. cond1과 cond2를 &를 이용하여 

조건을 만족하는 키워드 찾기

 

데이터는 비공개

 

조건을 만족하는 행의 키워드 컬럼만 찾아냈다.

 

즉, 위 배열에 있는 값들이

 

노출과 클릭이 상위 5%이상인 키워드들이다.

 

 

 

반응형