본문 바로가기

Crawling (크롤링)

(7)
크롤링 - webdriver(selenium)으로 네이버 카페 크롤링하기 네이버 카페 크롤링 카테고리의 최종본이다. 크롤링 - webdriver(selenium)으로 네이버 카페 페이지 넘기기 크롬 브라우저로 실행한다. 방법은 간단하다. 크롬 브라우저를 browser 라는 변수명으로 넣어주고 browser.get(url)을 이용하면된다. 중요한 것은 url을 찾아내는 것이다. 검색어 비건 디저트 사이트 네 steadiness-193.tistory.com 위 포스팅에서 얻은 move_page 함수와 크롤링 - webdriver(selenium)으로 네이버 카페글 접속하기 https://steadiness-193.tistory.com/139 크롤링 - webdriver(selenium)으로 네이버 카페 페이지 넘기기 크롬 브라우저로 실행한다. 방법은 간단하다. 크롬 브라우저를 b..
크롤링 - webdriver(selenium)으로 네이버 카페글 긁어오기 https://steadiness-193.tistory.com/139 크롤링 - webdriver(selenium)으로 네이버 카페 페이지 넘기기 크롬 브라우저로 실행한다. 방법은 간단하다. 크롬 브라우저를 browser 라는 변수명으로 넣어주고 browser.get(url)을 이용하면된다. 중요한 것은 url을 찾아내는 것이다. 검색어 비건 디저트 사이트 네 steadiness-193.tistory.com https://steadiness-193.tistory.com/140 크롤링 - webdriver(selenium)으로 네이버 카페글 접속하기 https://steadiness-193.tistory.com/139 크롤링 - webdriver(selenium)으로 네이버 카페 페이지 넘기기 크롬 브라우..
크롤링 - webdriver(selenium)으로 네이버 카페글 접속하기 https://steadiness-193.tistory.com/139 크롤링 - webdriver(selenium)으로 네이버 카페 페이지 넘기기 크롬 브라우저로 실행한다. 방법은 간단하다. 크롬 브라우저를 browser 라는 변수명으로 넣어주고 browser.get(url)을 이용하면된다. 중요한 것은 url을 찾아내는 것이다. 검색어 비건 디저트 사이트 네 steadiness-193.tistory.com 위 포스팅에서 만든 move_page 함수를 이용한다. 네이버 카페 : 비건디저트, 1페이지 접속 카페글 접속 리스트 찾기 브라우저 이용 find_elements_by_css_selector를 이용하여 a태그의 sh_cafe_title 클래스의 접속할 수 있는 리스트를 찾는다. 첫번째 게시글 들어가기..
크롤링 - webdriver(selenium)으로 네이버 카페 페이지 넘기기 크롬 브라우저로 실행한다. 방법은 간단하다. 크롬 브라우저를 browser 라는 변수명으로 넣어주고 browser.get(url)을 이용하면된다. 중요한 것은 url을 찾아내는 것이다. 검색어 비건 디저트 사이트 네이버 카페 네이버 카페 검색 1페이지 url search.naver.com/search.naver? where=article&ie=utf8&query=%EB%B9%84%EA%B1%B4+%EB%94%94%EC%A0%80%ED%8A%B8& prdtype=0&t=0&st=rel&date_option=0&date_from=&date_to=&srchby=text&dup_remove=1&cafe_url=& without_cafe_url=&board=&sm=tab_pge&start=1 네이버 카페 검색 2..
크롤링 - webdriver(selenium)으로 네이버 쇼핑 크롤링하기 크롤링할 콘텐츠 나이키 스우시 드라이핏 캡 548533 : 네이버쇼핑 판매되는 상품의 수량에 대해 2주, 1개월, 3개월, 6개월 단위로 추이를 보여주는 정보입니다. search.shopping.naver.com https://steadiness-193.tistory.com/119 크롤링 : webdriver(selenium)으로 네이버 쇼핑 긁어오기 나이키 스우시 드라이핏 캡 548533 : 네이버쇼핑 판매되는 상품의 수량에 대해 2주, 1개월, 3개월, 6개월 단위로 추이를 보여주는 정보입니다. search.shopping.naver.com 위 네이버 쇼핑의 1페이지 내용을 � steadiness-193.tistory.com 위 포스팅에서 만든 코드를 get_data 함수로 정의한다. https://..
크롤링 - webdriver(selenium)으로 네이버 쇼핑 긁어오기 나이키 스우시 드라이핏 캡 548533 : 네이버쇼핑 판매되는 상품의 수량에 대해 2주, 1개월, 3개월, 6개월 단위로 추이를 보여주는 정보입니다. search.shopping.naver.com 위 네이버 쇼핑의 1페이지 내용을 긁어보자 정확히는 판매처, 상품명, 판매가, 배송비 + 주소를 가져올 것이다. 1. BeautifulSoup으로 page_source 얻기 총 20개의 섹션이 있다. 이 20개를 먼저 찾아내야 한다. 2. 20개 찾기 이상하게도 21개가 나왔다. 맨 처음 것을 보면 맨 상단의 컬럼 같은 것까지 가져왔다. 맨 처음 것을 제외하면 원하던 20개의 섹션을 얻을 수 있다. 3. 판매처 찾기 그냥 글씨로 적혀있는 판매처와 이미지로 되어있는 판매처의 태그는 각각 다르다. 4. 상품명과 판..
크롤링 - webdriver(selenium)으로 네이버 쇼핑 페이지 넘기기 * 안내 크롤링한 코드 파일이 보이지 않아 보내드리기 어렵습니다. 😢 [2020년 7월 12일 기준] 향후 태그명이 달라질 수도 있음. 나이키 모자 네이버 쇼핑 페이지 나이키 스우시 드라이핏 캡 548533 : 네이버쇼핑 판매되는 상품의 수량에 대해 2주, 1개월, 3개월, 6개월 단위로 추이를 보여주는 정보입니다. search.shopping.naver.com 1. 페이지 바 찾기 웹드라이버 이용 (변수명 : browser) 브라우저로 위 url 접속 페이지 바 찾기 위 페이지 바의 태그의 아이디는 _price_list_paging 이다. 이를 page_bar 변수에 넣자 2. 페이지 바의 페이지들 찾기 위에서 찾은 page_bar 이용 이 페이지 바의 'a'태그에는 11개의 객체가 있다. 하나씩 꺼내..