欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

淺談selenium如何應(yīng)對網(wǎng)頁內(nèi)容需要鼠標(biāo)滾動加載的問題

 更新時間:2020年03月14日 16:02:05   作者:wumxiaozhu  
這篇文章主要介紹了淺談selenium如何應(yīng)對網(wǎng)頁內(nèi)容需要鼠標(biāo)滾動加載的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

相信大家在selenium爬取網(wǎng)頁的時候都遇到過這樣的問題:就是網(wǎng)頁內(nèi)容需要用鼠標(biāo)滾動加載剩余內(nèi)容,而不是一次全部加載出網(wǎng)頁的全部內(nèi)容,這個時候如果要模擬翻頁的時候就必須加載出全部的內(nèi)容,不然定位元素會找不到,出現(xiàn)報錯。

這里提供兩種方法供大家參考

一,通過selenium模擬瀏覽器,然后設(shè)置瀏覽器高度足夠長,最后延時使之能夠?qū)㈨撁娴膬?nèi)容都能夠加載出來

import time
from selenium import webdriver
driver = webdriver.Firefox()
driver.set_window_size(1000,30000)
driver.get(url)
time.sleep(5)

二,通過selenium模擬瀏覽器下拉操作

from selenium import webdriver
import time
browser.execute_script("window.scrollBy(0,3000)")
time.sleep(1)
browser.execute_script("window.scrollBy(0,5000)")
time.sleep(1)
browser.execute_script("window.scrollBy(0,8000)")
time.sleep(1)

補充知識:針對懶加載如何實現(xiàn)selenium 滑動至頁面底部page_source一次性包含全部網(wǎng)頁內(nèi)容

有時網(wǎng)站使用了懶加載技術(shù):只有在瀏覽器中縱向滾動條滾動到指定的位置時,頁面的元素才會被動態(tài)加載。

注意,在加載之前,selenium的page_source是不會包含該頁面的內(nèi)容,page_source只包含加載出來的頁面內(nèi)容。

那么如何實現(xiàn)加載全部內(nèi)容了,就需要模擬人滾動滾動條的行為,實現(xiàn)頁面的加載

from selenium.webdriver.chrome.options import Options
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
 
  def scroll_until_loaded(self):
    check_height = self.browser.execute_script("return document.body.scrollHeight;")
    while True:
      self.browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
      try:
        self.wait.until(lambda driver: self.browser.execute_script("return document.body.scrollHeight;") > check_height)
        check_height = self.browser.execute_script("return document.body.scrollHeight;")
      except TimeoutException:
        break

這里懶加載并不是一直有效, 當(dāng)網(wǎng)速不好時,加載超過self.wait()時間, 頁面還沒加載出來時, 會認為全部加載完成, page_source里面的代碼就會是以前加載出來的, 所以執(zhí)行翻頁操作后, 要執(zhí)行time.sleep(3), 等待網(wǎng)頁加載, 更新html再獲取網(wǎng)頁源代碼

以上這篇淺談selenium如何應(yīng)對網(wǎng)頁內(nèi)容需要鼠標(biāo)滾動加載的問題就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python+NumPy繪制常見曲線的方法詳解

    Python+NumPy繪制常見曲線的方法詳解

    NumPy(Numerical Python)是Python的一種開源的數(shù)值計算擴展。本文將利用NumPy庫繪制利薩茹曲線、計算斐波那契數(shù)列、方波和鋸齒波和三角波,需要的可以參考一下
    2022-06-06
  • 如何優(yōu)雅地處理Django中的favicon.ico圖標(biāo)詳解

    如何優(yōu)雅地處理Django中的favicon.ico圖標(biāo)詳解

    默認情況下,瀏覽器訪問一個網(wǎng)站的時候,同時還會向服務(wù)器請求"/favicon.ico"這個URL,目的是獲取網(wǎng)站的圖標(biāo),下面這篇文章主要給大家介紹了關(guān)于如何優(yōu)雅地處理Django中favicon.ico圖標(biāo)的相關(guān)資料,需要的朋友可以參考下
    2018-07-07
  • Python3簡單實例計算同花的概率代碼

    Python3簡單實例計算同花的概率代碼

    這篇文章主要介紹了Python3簡單實例計算同花的概率代碼,具有一定參考價值,需要的朋友可以了解下。
    2017-12-12
  • python每天定時運行某程序代碼

    python每天定時運行某程序代碼

    這篇文章主要介紹了python每天定時運行某程序代碼,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-08-08
  • Python使用XlsxWriter庫操作Excel詳解

    Python使用XlsxWriter庫操作Excel詳解

    XlsxWriter 是一個功能強大的 Python 模塊,專門用于生成 Microsoft Excel 2007及以上版本的電子表格文件,本文主要為大家介紹了如何使用XlsxWriter庫進行Excel基本操作,需要的可以參考下
    2023-11-11
  • Python股票開源庫akshare的具體使用

    Python股票開源庫akshare的具體使用

    AKShare是一個開源財經(jīng)數(shù)據(jù)接口庫,本文主要介紹了Python股票開源庫akshare的具體使用,具有一定的參考價值,感興趣的可以了解一下
    2024-04-04
  • python處理 yaml 時保持輸入輸出格式一致的問題記錄

    python處理 yaml 時保持輸入輸出格式一致的問題記錄

    這篇文章主要介紹了python處理 yaml 時保持輸入輸出格式一致的問題記錄,要想保持順序不變在dump時添加sort_keys=False,使yaml格式保持原來的排序,本文給大家介紹的非常詳細,需要的朋友可以參考下
    2024-06-06
  • 如何利用python讀取micaps文件詳解

    如何利用python讀取micaps文件詳解

    這篇文章主要給大家介紹了關(guān)于如何利用python讀取micaps文件的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-10-10
  • 一篇文章帶你學(xué)習(xí)Python3的高級特性(2)

    一篇文章帶你學(xué)習(xí)Python3的高級特性(2)

    這篇文章主要為大家詳細介紹了Python3的高階函數(shù),主要介紹什么是高級特性,高級特性的用法,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-01-01
  • 深入理解Python中的Contextlib庫

    深入理解Python中的Contextlib庫

    Python提供了一些內(nèi)建的庫以支持各種常見的編程任務(wù),Contextlib庫是其中之一,它提供了一些用于支持上下文管理協(xié)議(即with語句)的函數(shù),這篇文章將詳細介紹如何使用Contextlib庫中的功能,需要的朋友可以參考下
    2023-06-06

最新評論