欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

淺談selenium如何應(yīng)對(duì)網(wǎng)頁(yè)內(nèi)容需要鼠標(biāo)滾動(dòng)加載的問(wèn)題

 更新時(shí)間:2020年03月14日 16:02:05   作者:wumxiaozhu  
這篇文章主要介紹了淺談selenium如何應(yīng)對(duì)網(wǎng)頁(yè)內(nèi)容需要鼠標(biāo)滾動(dòng)加載的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

相信大家在selenium爬取網(wǎng)頁(yè)的時(shí)候都遇到過(guò)這樣的問(wèn)題:就是網(wǎng)頁(yè)內(nèi)容需要用鼠標(biāo)滾動(dòng)加載剩余內(nèi)容,而不是一次全部加載出網(wǎng)頁(yè)的全部?jī)?nèi)容,這個(gè)時(shí)候如果要模擬翻頁(yè)的時(shí)候就必須加載出全部的內(nèi)容,不然定位元素會(huì)找不到,出現(xiàn)報(bào)錯(cuò)。

這里提供兩種方法供大家參考

一,通過(guò)selenium模擬瀏覽器,然后設(shè)置瀏覽器高度足夠長(zhǎng),最后延時(shí)使之能夠?qū)㈨?yè)面的內(nèi)容都能夠加載出來(lái)

import time
from selenium import webdriver
driver = webdriver.Firefox()
driver.set_window_size(1000,30000)
driver.get(url)
time.sleep(5)

二,通過(guò)selenium模擬瀏覽器下拉操作

from selenium import webdriver
import time
browser.execute_script("window.scrollBy(0,3000)")
time.sleep(1)
browser.execute_script("window.scrollBy(0,5000)")
time.sleep(1)
browser.execute_script("window.scrollBy(0,8000)")
time.sleep(1)

補(bǔ)充知識(shí):針對(duì)懶加載如何實(shí)現(xiàn)selenium 滑動(dòng)至頁(yè)面底部page_source一次性包含全部網(wǎng)頁(yè)內(nèi)容

有時(shí)網(wǎng)站使用了懶加載技術(shù):只有在瀏覽器中縱向滾動(dòng)條滾動(dòng)到指定的位置時(shí),頁(yè)面的元素才會(huì)被動(dòng)態(tài)加載。

注意,在加載之前,selenium的page_source是不會(huì)包含該頁(yè)面的內(nèi)容,page_source只包含加載出來(lái)的頁(yè)面內(nèi)容。

那么如何實(shí)現(xiàn)加載全部?jī)?nèi)容了,就需要模擬人滾動(dòng)滾動(dòng)條的行為,實(shí)現(xiàn)頁(yè)面的加載

from selenium.webdriver.chrome.options import Options
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
 
  def scroll_until_loaded(self):
    check_height = self.browser.execute_script("return document.body.scrollHeight;")
    while True:
      self.browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
      try:
        self.wait.until(lambda driver: self.browser.execute_script("return document.body.scrollHeight;") > check_height)
        check_height = self.browser.execute_script("return document.body.scrollHeight;")
      except TimeoutException:
        break

這里懶加載并不是一直有效, 當(dāng)網(wǎng)速不好時(shí),加載超過(guò)self.wait()時(shí)間, 頁(yè)面還沒(méi)加載出來(lái)時(shí), 會(huì)認(rèn)為全部加載完成, page_source里面的代碼就會(huì)是以前加載出來(lái)的, 所以執(zhí)行翻頁(yè)操作后, 要執(zhí)行time.sleep(3), 等待網(wǎng)頁(yè)加載, 更新html再獲取網(wǎng)頁(yè)源代碼

以上這篇淺談selenium如何應(yīng)對(duì)網(wǎng)頁(yè)內(nèi)容需要鼠標(biāo)滾動(dòng)加載的問(wèn)題就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 詳解Python3.6的py文件打包生成exe

    詳解Python3.6的py文件打包生成exe

    這篇文章給大家分享了Python3.6的py文件打包生成exe的方法步驟以及相關(guān)知識(shí)點(diǎn),有需要的朋友可以參考學(xué)習(xí)下。
    2018-07-07
  • python如何生成密碼字典

    python如何生成密碼字典

    這篇文章主要介紹了python如何生成密碼字典,密碼字典主要是配合解密使用,下面利用python實(shí)現(xiàn)生成密碼字典,需要的小伙伴可以參考一下
    2022-03-03
  • 200行python代碼實(shí)現(xiàn)貪吃蛇游戲

    200行python代碼實(shí)現(xiàn)貪吃蛇游戲

    這篇文章主要為大家詳細(xì)介紹了200行python代碼實(shí)現(xiàn)貪吃蛇游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-04-04
  • python使用sklearn實(shí)現(xiàn)決策樹的方法示例

    python使用sklearn實(shí)現(xiàn)決策樹的方法示例

    這篇文章主要介紹了python使用sklearn實(shí)現(xiàn)決策樹的方法示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-09-09
  • Python編程快速上手——Excel表格創(chuàng)建乘法表案例分析

    Python編程快速上手——Excel表格創(chuàng)建乘法表案例分析

    這篇文章主要介紹了Python Excel表格創(chuàng)建乘法表,結(jié)合具體實(shí)例形式分析了Python接受cmd命令操作Excel文件創(chuàng)建乘法表相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下
    2020-02-02
  • python列表去重的5種常見(jiàn)方法實(shí)例

    python列表去重的5種常見(jiàn)方法實(shí)例

    在Python編程過(guò)程中經(jīng)常會(huì)遇到列表去重的問(wèn)題,下面這篇文章主要給大家介紹了python列表去重的5種常見(jiàn)方法,文中通過(guò)實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-06-06
  • Python基礎(chǔ)之字符串格式化詳解

    Python基礎(chǔ)之字符串格式化詳解

    這篇文章主要介紹了Python基礎(chǔ)之字符串格式化詳解,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)python基礎(chǔ)的小伙伴們有很好地幫助,需要的朋友可以參考下
    2021-04-04
  • Python 處理表格進(jìn)行成績(jī)排序的操作代碼

    Python 處理表格進(jìn)行成績(jī)排序的操作代碼

    這篇文章主要介紹了Python 處理表格進(jìn)行成績(jī)排序,也就是說(shuō)將學(xué)生從按照學(xué)號(hào)排序變?yōu)榘凑粘煽?jī)從高到低進(jìn)行排序,具體實(shí)現(xiàn)代碼跟隨小編一起看看吧
    2021-07-07
  • Python的pycurl包用法簡(jiǎn)介

    Python的pycurl包用法簡(jiǎn)介

    這篇文章主要介紹了Python的pycurl包用法簡(jiǎn)介,文中羅列了其下模塊中的一些常用方法,需要的朋友可以參考下
    2015-11-11
  • Python中使用ipython的詳細(xì)教程

    Python中使用ipython的詳細(xì)教程

    ipython是一個(gè)非常流行的python解釋器,比python解釋器好用很多,本文重點(diǎn)給大家介紹Python中使用ipython的詳細(xì)教程,需要的朋友參考下吧
    2021-06-06

最新評(píng)論