본문 바로가기
데이터베이스 & 웹/HTML

Selenium 웹크롤링 기본

by tryotto 2020. 3. 6.
1
2
3
4
5
6
7
from selenium import webdriver
 
driver = webdriver.Chrome("C:\\Users\\tryot\\Downloads\\chromedriver.exe")
 
driver.get("http://www.naver.com")
 
driver.find_element_by_xpath('//*[@id="snb_wrap"]/ul/li[2]/a/img').click()
cs


마우스를 사용하지 않아도 자동으로 웹페이지를 다룰 수 있게 해준다

G매크로도 이런 원리로 작동하는걸까?


그래서 실습을 해봤다

1
2
3
4
5
6
7
8
import time
 
for i in range(05):
    time.sleep(1)
    driver.find_element_by_xpath('//*[@id="news_cast"]/div[1]/div/h3/a').click()
    
    time.sleep(1)    
    driver.find_element_by_xpath('//*[@id="snb_wrap"]/h1/a[1]').click()
cs

네이버 연합 뉴스 -> 네이버 홈페이지 -> 네이버 연합뉴스 -> 네이버 홈페이지 ....

이런식으로 계속 클릭을 하도록 코드를 짜봤다.

그때 내가 썼던 G매크로는 단순히 마우스의 위치를 이용한 매크로라서, 이런 마크업 언어를 다루지는 않았다는 점이 차이가 있다.
(결론 : G매크로랑은 다른 방식이라는 점..)



어찌됐든, 그럼 다음 수강신청때는 이걸 이용해서 매크로처럼 활용할 수 있을까?




안되네 ㅋㅋ


역시.. 이정도로 허술할리가 없지





그렇다면 대체 이 Selenium 이라는 자동 브라우저를 이용해서 무슨 웹 크롤링을 하겠다는거지?


일단 웹 크롤링의 정의가 무엇인지부터 확인해봐야겠다




'데이터베이스 & 웹 > HTML' 카테고리의 다른 글

마크업 언어와 타 언어 차이점  (0) 2020.03.06