반응형
네이버 카페 크롤링 카테고리의 최종본이다.
위 포스팅에서 얻은 move_page 함수와
위 포스팅에서 설명한 카페 글 접속 및 탭 변경 방법,
그리고 위 포스팅에서 설명한
프레임 변경을 포함해 데이터를 긁어오는 함수인 get_data를 이용해
네이버 카페를 크롤링한다.
브라우저 실행 후
move_page 함수에 인자로 전달할 searching 입력
최종 결과를 담아낼 빈 리스트(result) 생성
크롤링 실행
1부터 10페이지까지 10개의 게시글씩
총 100개의 리스트가 만들어졌다.
이 result를 데이터프레임으로 바꿔주자
추후 활용을 위해 엑셀파일로 저장한다.
단, 데이터가 너무 길어 에러가 나는 것을 방지하고자
ExcelWriter를 이용한다.
https://steadiness-193.tistory.com/120
ExcelWriter 내용은 위 포스팅 참조
반응형
'Crawling (크롤링) > 네이버 카페' 카테고리의 다른 글
크롤링 - webdriver(selenium)으로 네이버 카페글 긁어오기 (9) | 2020.07.16 |
---|---|
크롤링 - webdriver(selenium)으로 네이버 카페글 접속하기 (0) | 2020.07.16 |
크롤링 - webdriver(selenium)으로 네이버 카페 페이지 넘기기 (0) | 2020.07.16 |