欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python爬蟲selenium和phantomJs使用方法解析

 更新時間:2019年08月08日 16:48:54   作者:一覺昏睡人  
這篇文章主要介紹了python爬蟲selenium和phantomJs使用方法解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下

1.selenum:三方庫??梢詫崿F(xiàn)讓瀏覽器完成自動化的操作。

2.環(huán)境搭建

2.1 安裝:

pip install selenium

2.2 獲取瀏覽器的驅(qū)動程序

下載地址:

http://chromedriver.storage.googleapis.com/index.html

http://npm.taobao.org/mirrors/chromedriver/

瀏覽器版本和驅(qū)動版本的對應(yīng)關(guān)系表:

chromedriver版本 支持的Chrome版本
v2.46 v71-73
v2.45 v70-72
v2.44 v69-71
v2.43 v69-71
v2.42 v68-70
v2.41 v67-69
v2.40 v66-68
v2.39 v66-68
v2.38 v65-67
v2.37 v64-66
v2.36 v63-65
v2.35 v62-64
v2.34 v61-63
v2.33 v60-62
v2.32 v59-61
v2.31 v58-60
v2.30 v58-60
v2.29 v56-58
v2.28 v55-57
v2.27 v54-56
v2.26 v53-55
v2.25 v53-55
v2.24 v52-54
v2.23 v51-53
v2.22 v49-52
v2.21 v46-50
v2.20 v43-48
v2.19 v43-47
v2.18 v43-46
v2.17 v42-43
v2.13 v42-45
v2.15 v40-43
v2.14 v39-42
v2.13 v38-41
v2.12 v36-40
v2.11 v36-40
v2.10 v33-36
v2.9 v31-34
v2.8 v30-33
v2.7 v30-33
v2.6 v29-32
v2.5 v29-32
v2.4 v29-32

所有chromedriver均可在下面鏈接中下載到:

http://chromedriver.storage.googleapis.com/index.html 

現(xiàn)在有一點好的是出了按照chrome版本對應(yīng)的driver,直接按照瀏覽器版本去找對應(yīng)的driver(只對應(yīng)大版本就行),不用再費心去對應(yīng)了,大家可以嘗試一下

有些同學(xué)說下不了,到taobao下也是可以的:

http://npm.taobao.org/mirrors/chromedriver/

定位元素的8種方式:

#使用下面的方法,查找指定的元素進行操作即可
find_element_by_id 根據(jù)id找節(jié)點
find_elements_by_name 根據(jù)name找
find_elements_by_xpath 根據(jù)xpath查找
find_elements_by_tag_name 根據(jù)標簽名找
find_elements_by_class_name 根據(jù)class名字查找
# 通過id定位:
dr.find_element_by_id("kw")

# 通過name定位:
dr.find_element_by_name("wd")

# 通過class name定位:
dr.find_element_by_class_name("s_ipt")

# 通過tag name定位:
dr.find_element_by_tag_name("input")

# 通過xpath定位,xpath定位有N種寫法,這里列幾個常用寫法:
dr.find_element_by_xpath("http://*[@id='kw']")
dr.find_element_by_xpath("http://*[@name='wd']")
dr.find_element_by_xpath("http://input[@class='s_ipt']")
dr.find_element_by_xpath("/html/body/form/span/input")
dr.find_element_by_xpath("http://span[@class='soutu-btn']/input")
dr.find_element_by_xpath("http://form[@id='form']/span/input")
dr.find_element_by_xpath("http://input[@id='kw' and @name='wd']")

# 通過css定位,css定位有N種寫法,這里列幾個常用寫法:
dr.find_element_by_css_selector("#kw")
dr.find_element_by_css_selector("[name=wd]")
dr.find_element_by_css_selector(".s_ipt")
dr.find_element_by_css_selector("html > body > form > span > input")
dr.find_element_by_css_selector("span.soutu-btn> input#kw")
dr.find_element_by_css_selector("form#form > span > input")

接下來,我們的頁面上有一組文本鏈接。

<a class="mnav"  rel="external nofollow" name="tj_trnews">新聞</a>
<a class="mnav"  rel="external nofollow" name="tj_trhao123">hao123</a>
# 通過link text定位:
dr.find_element_by_link_text("新聞")
dr.find_element_by_link_text("hao123")

# 通過partial link text定位:
dr.find_element_by_partial_link_text("新")
dr.find_element_by_partial_link_text("hao")
dr.find_element_by_partial_link_text("123")

Selenium庫下webdriver模塊常用方法的使用

控制瀏覽器操作的一些方法

方法 說明

  • set_window_size() 設(shè)置瀏覽器的大小
  • back() 控制瀏覽器后退
  • forward() 控制瀏覽器前進
  • refresh() 刷新當(dāng)前頁面
  • clear() 清除文本
  • send_keys (value) 模擬按鍵輸入
  • click() 單擊元素
  • submit() 用于提交表單
  • get_attribute(name) 獲取元素屬性值
  • is_displayed() 設(shè)置該元素是否用戶可見
  • size 返回元素的尺寸
  • text 獲取元素的文本

---------------------

例子:

1.chrom瀏覽器自動搜索

from selenium import webdriver
from time import sleep
# 創(chuàng)建瀏覽器對象 驅(qū)動為瀏覽器的路徑
bro = webdriver.Chrome("./chromedriver.exe")
url = "https://www.baidu.com"7 # 發(fā)送請求
bro.get(url)
# 讓百度指定詞條的搜索
text = bro.find_element_by_id('kw')
# 發(fā)送關(guān)鍵字
text.send_keys('python')
# 點擊搜索按鈕
button = bro.find_element_by_id('su')
button.click()
# 關(guān)閉瀏覽器
bro.quit()

2.phantomjs無界面瀏覽器,其自動化流程上述操作谷歌自動化流程一致。

from selenium import webdriver
from time import sleep
bro = webdriver.PhantomJS('E:/BaiduNetdiskDownload/爬蟲課件/5. 動態(tài)數(shù)據(jù)加載
爬取\phantomjs‐2.1.1‐windows/bin/phantomjs.exe')
url = "https://www.baidu.com"
# 發(fā)送請求
bro.get(url)
bro.save_screenshot('./1.png')
# 讓百度指定詞條的搜索
text = bro.find_element_by_id('kw')
# 發(fā)送關(guān)鍵字
text.send_keys('python')
bro.save_screenshot('./2.png')
# 點擊搜索按鈕
button = bro.find_element_by_id('su')
button.click()
sleep(3)
bro.save_screenshot('./3.png')
# 關(guān)閉瀏覽器
bro.quit()

3.豆瓣網(wǎng)電影排行榜滾動條數(shù)據(jù)

from selenium import webdriver
from time import sleep3 url = 'https://movie.douban.com/typerank?type_name=%E5%96%9C%E5%89%A7&typ
e=24&interval_id=100:90&action='
bro = webdriver.PhantomJS('E:/BaiduNetdiskDownload/爬蟲課件/5. 動態(tài)數(shù)據(jù)加載
爬取\phantomjs‐2.1.1‐windows/bin/phantomjs.exe')
bro.get(url)
sleep(1)
bro.save_screenshot("./1.png")
js = 'window.scrollTo(0,document.body.scrollHeight)'
# 執(zhí)行js代碼 滾動條
bro.execute_script(js)
sleep(1)
bro.save_screenshot('./2.png')
# 獲取頁面數(shù)據(jù)
page_source = bro.page_source
print(page_source)

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Pandas之?dāng)?shù)據(jù)追加df.append方式

    Pandas之?dāng)?shù)據(jù)追加df.append方式

    這篇文章主要介紹了Pandas之?dāng)?shù)據(jù)追加df.append方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • windows系統(tǒng)下Python環(huán)境搭建教程

    windows系統(tǒng)下Python環(huán)境搭建教程

    這篇文章主要為大家詳細介紹了windows系統(tǒng)下Python環(huán)境搭建教程,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2017-03-03
  • python實現(xiàn)在pandas.DataFrame添加一行

    python實現(xiàn)在pandas.DataFrame添加一行

    下面小編就為大家分享一篇python實現(xiàn)在pandas.DataFrame添加一行,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • python opencv攝像頭的簡單應(yīng)用

    python opencv攝像頭的簡單應(yīng)用

    這篇文章主要為大家詳細介紹了python opencv攝像頭的簡單應(yīng)用,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-06-06
  • Python中sub()的用法說明

    Python中sub()的用法說明

    這篇文章主要介紹了Python中sub()的用法說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-04-04
  • 基于Python __dict__與dir()的區(qū)別詳解

    基于Python __dict__與dir()的區(qū)別詳解

    下面小編就為大家?guī)硪黄赑ython __dict__與dir()的區(qū)別詳解。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-10-10
  • 在Ubuntu系統(tǒng)下安裝使用Python的GUI工具wxPython

    在Ubuntu系統(tǒng)下安裝使用Python的GUI工具wxPython

    這篇文章主要介紹了在Ubuntu系統(tǒng)下安裝使用Python的GUI工具wxPython的方法,wxPython可以為Python提供強大的圖形化界面開發(fā)支持,需要的朋友可以參考下
    2016-02-02
  • Django choices下拉列表綁定實例

    Django choices下拉列表綁定實例

    這篇文章主要介紹了Django choices下拉列表綁定實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • 關(guān)于python的對象序列化介紹

    關(guān)于python的對象序列化介紹

    大家好,本篇文章主要講的是關(guān)于python的對象序列化介紹,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下
    2022-01-01
  • Python 如何反方向迭代一個序列

    Python 如何反方向迭代一個序列

    這篇文章主要介紹了Python 如何反方向迭代一個序列,文中講解非常細致,代碼幫助大家更好理解和學(xué)習(xí),感興趣的朋友可以了解下
    2020-07-07

最新評論