python+selenium+chromedriver實現(xiàn)爬蟲示例代碼
下載好所需程序
1.Selenium簡介
Selenium是一個用于Web應(yīng)用程序測試的工具,直接運行在瀏覽器中,就像真正的用戶在操作一樣。
2.Selenium安裝
方法一:在Windows命令行(cmd)輸入pip install selenium即可自動安裝,安裝完成后,輸入pip show selenium可查看當(dāng)前的版本
方法二:直接下載selenium包:
Pychome安裝selenium如果出現(xiàn)無法安裝,參考以下博客
解決Pycharm無法使用已經(jīng)安裝Selenium的問題
3.禁止谷歌瀏覽器自動更新
搜索本地:管理工具-服務(wù)-Google自動更新服務(wù)-選擇禁止
安裝瀏覽器對應(yīng)的驅(qū)動driver
我這里用的是谷歌,選擇對應(yīng)的驅(qū)動版本
驅(qū)動的下載地址如下:
http://chromedriver.storage.googleapis.com/index.html
win32、win64的都下載win32.zip的
將下載的chromedriver進行解壓,并將文件復(fù)制或移動到,瀏覽器快捷方式所在目錄。
環(huán)境變量配置
1.Python環(huán)境配置
2.chromedriver環(huán)境配置
3.pychrome的python環(huán)境指向自己電腦安裝好的python
注意:將下載好的chromewebdriver.exe驅(qū)動放在Python的安裝路徑下的Scripts里面,同時將Scripts路徑添加到PATH中,這樣每次運行python的時候就會自動加載驅(qū)動
代碼實現(xiàn)
#已經(jīng)準(zhǔn)備環(huán)境:webdriver:Google已經(jīng)安裝好;環(huán)境變量配置好;pip install selenium; #selenium是一個包,包有很多對象,對象有屬性,方法。 from selenium import webdriver browser=webdriver.Chrome()#打開瀏覽器 url="https://news.qq.com/zt2020/page/feiyan.htm#/global?nojump=1"#獲取數(shù)據(jù)的地址 #請求瀏覽器內(nèi)容:請求方式:get,post,token browser.get(url) #css選擇器,id選擇器:#開頭,class選擇器:.開頭,標(biāo)簽選擇器:p,span,div。 coronavirus_countent=browser.find_element_by_class_name('d')#定位到class選擇器d這個內(nèi)容 print(coronavirus_countent)#查看內(nèi)容,session,一種緩存機制,通過瀏覽器解析,然后緩存的內(nèi)容 # <selenium.webdriver.remote.webelement.WebElement (session="a1aa22161543b44f599e97b35dbc1ac5", element="fe645993-43cb-46cf-83a7-2488dd3d838a")> print(coronavirus_countent.text)#查看當(dāng)前css.class中的d的內(nèi)容 coronavirus_time=browser.find_element_by_class_name('ml')#定位到class選擇器d這個內(nèi)容 print(coronavirus_time.text) coronavirus_data=browser.find_element_by_class_name('nowConfirm')#定位到class選擇器d這個內(nèi)容 print("=======") print(coronavirus_data.text) print("=====找nowConfirm下面的字內(nèi)容") coronavirus_sub=coronavirus_data.find_element_by_class_name('addnum') print(coronavirus_sub.text) browser.quit()
到此這篇關(guān)于python+selenium+chromedriver實現(xiàn)爬蟲示例代碼的文章就介紹到這了,更多相關(guān)python selenium chromedriver 爬蟲內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python第三方庫undetected_chromedriver的使用
- python一招完美搞定Chromedriver的自動更新問題
- Python3爬蟲ChromeDriver的安裝實例
- 詳解Python+Selenium+ChromeDriver的配置和問題解決
- Selenium執(zhí)行完畢未關(guān)閉chromedriver/geckodriver進程的解決辦法(java版+python版)
- 下載與當(dāng)前Chrome對應(yīng)的chromedriver.exe(用于python+selenium)
- python selenium 執(zhí)行完畢關(guān)閉chromedriver進程示例
- python3?chromedrivers簽到的簡單實現(xiàn)
相關(guān)文章
Python實現(xiàn)的矩陣轉(zhuǎn)置與矩陣相乘運算示例
這篇文章主要介紹了Python實現(xiàn)的矩陣轉(zhuǎn)置與矩陣相乘運算,結(jié)合實例形式分析了Python針對矩陣進行轉(zhuǎn)置與相乘運算的相關(guān)實現(xiàn)技巧與操作注意事項,需要的朋友可以參考下2019-03-03pandas學(xué)習(xí)之df.set_index的具體使用
本文主要介紹了pandas學(xué)習(xí)之df.set_index的具體使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-08-08Python程序打包工具py2exe和PyInstaller詳解
這篇文章主要介紹了Python程序打包工具py2exe和PyInstaller詳解,如果可以提前將程序打包成 Windows平臺的 .exe 文件或者是Linux下的 .sh 腳本,那么使用起來就會方便很多,需要的朋友可以參考下2019-06-06python except異常處理之后不退出,解決異常繼續(xù)執(zhí)行的實現(xiàn)
這篇文章主要介紹了python except異常處理之后不退出,解決異常繼續(xù)執(zhí)行的實現(xiàn),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04一篇文章搞懂Python Unittest測試方法的執(zhí)行順序
unittest是Python標(biāo)準(zhǔn)庫自帶的單元測試框架,是Python版本的JUnit,下面這篇文章主要給大家介紹了如何通過一篇文章搞懂Python Unittest測試方法的執(zhí)行順序,需要的朋友可以參考下2021-09-09python requests模擬登陸github的實現(xiàn)方法
這篇文章主要介紹了python requests模擬登陸github的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-12-12基于Python第三方插件實現(xiàn)西游記章節(jié)標(biāo)注漢語拼音的方法
這篇文章主要介紹了基于Python第三方插件實現(xiàn)西游記章節(jié)標(biāo)注漢語拼音的方法,本文通過實例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-05-05