欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python實(shí)現(xiàn)爬取網(wǎng)頁中動(dòng)態(tài)加載的數(shù)據(jù)

 更新時(shí)間:2020年08月17日 10:52:05   作者:Amo Xiang  
這篇文章主要介紹了Python實(shí)現(xiàn)爬取網(wǎng)頁中動(dòng)態(tài)加載的數(shù)據(jù),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

在使用python爬蟲技術(shù)采集數(shù)據(jù)信息時(shí),經(jīng)常會(huì)遇到在返回的網(wǎng)頁信息中,無法抓取動(dòng)態(tài)加載的可用數(shù)據(jù)。例如,獲取某網(wǎng)頁中,商品價(jià)格時(shí)就會(huì)出現(xiàn)此類現(xiàn)象。如下圖所示。本文將實(shí)現(xiàn)爬取網(wǎng)頁中類似的動(dòng)態(tài)加載的數(shù)據(jù)。

1. 那么什么是動(dòng)態(tài)加載的數(shù)據(jù)?

我們通過requests模塊進(jìn)行數(shù)據(jù)爬取無法每次都是可見即可得,有些數(shù)據(jù)是通過非瀏覽器地址欄中的url請求得到的。而是通過其他請求請求到的數(shù)據(jù),那么這些通過其他請求請求到的數(shù)據(jù)就是動(dòng)態(tài)加載的數(shù)據(jù)。(猜測有可能是js代碼當(dāng)咱們訪問此頁面時(shí)就會(huì)發(fā)送得get請求,到其他url中獲取數(shù)據(jù))

2. 如何檢測網(wǎng)頁中是否存在動(dòng)態(tài)加載得數(shù)據(jù)?

在當(dāng)前頁面中打開抓包工具,捕獲到地址欄中的url對應(yīng)的數(shù)據(jù)包,在該數(shù)據(jù)包的response選項(xiàng)卡搜索我們想要爬取的數(shù)據(jù),如果搜索到了結(jié)果則表示數(shù)據(jù)不是動(dòng)態(tài)加載的,否則表示數(shù)據(jù)為動(dòng)態(tài)加載的。如圖所示:


或者鼠標(biāo)右鍵單擊要爬取的頁面顯示網(wǎng)頁源代碼搜索我們想要爬取的數(shù)據(jù),如果搜索到了結(jié)果則表示數(shù)據(jù)不是動(dòng)態(tài)加載的,否則表示數(shù)據(jù)為動(dòng)態(tài)加載的。如圖所示:

3. 如果數(shù)據(jù)為動(dòng)態(tài)加載,那么我們?nèi)绾尾东@到動(dòng)態(tài)加載的數(shù)據(jù)?

在實(shí)現(xiàn)爬取動(dòng)態(tài)加載的數(shù)據(jù)信息時(shí),首先需要在瀏覽器的網(wǎng)絡(luò)監(jiān)視器中根據(jù)動(dòng)態(tài)加載的技術(shù)選擇網(wǎng)絡(luò)請求的類型,然后通過逐個(gè)篩選的方式查詢預(yù)覽信息中的關(guān)鍵數(shù)據(jù),并獲取對應(yīng)的請求地址,最后進(jìn)行信息的解析工作即可。具體步驟如下:

在瀏覽器中快捷鍵F12打開開發(fā)者工具,然后選擇Network(網(wǎng)絡(luò)監(jiān)視器)并在網(wǎng)絡(luò)類型中選擇JS,再按快捷鍵F5刷新,如下圖所示。

在請求信息的列表中,依次單擊每個(gè)請求信息,然后在對應(yīng)的Preview(請求結(jié)果預(yù)覽)中核對是否為需要獲取的動(dòng)態(tài)加載數(shù)據(jù),如下圖所示。

動(dòng)態(tài)加載的數(shù)據(jù)信息核對完成后,單擊Headers獲取當(dāng)前的網(wǎng)絡(luò)請求地址以及所需參數(shù),如下圖所示。

根據(jù)以上步驟獲取到的請求地址,發(fā)送網(wǎng)絡(luò)請求并從返回的信息中提取商品價(jià)格信息。筆者在代碼中使用到了反序列化,關(guān)于json序列化和反序列化可以點(diǎn)擊 此處 進(jìn)行學(xué)習(xí),代碼如下:

import requests
import json

# 獲取商品價(jià)格的請求地址
url = "https://c0.3.cn/stock?skuId=12464037&cat=1713,3259,3333&venderId=1000077923&area" \
  "=4_113_9786_0&buyNum=1&choseSuitSkuIds=&extraParam={%22originid%22:%221%22}&ch=1&fqsp=0&" \
  "pduid=1573698619147398205303&pdpin=jd_635f3b795bb1c&coord=&detailedAdd=&callback=jQuery6495921"
jQuery_id = url.split("=")[-1] + "("
# 頭部信息
headers = {
 "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) "
     "AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36"
}
# 發(fā)送網(wǎng)絡(luò)請求
response = requests.get(url, headers=headers)
if response.status_code == 200:
 goods_dict = json.loads(response.text.replace(jQuery_id, "")[:-1]) # 反序列化
 print(f"當(dāng)前售價(jià)為: {goods_dict['stock']['jdPrice']['op']}")
 print(f"定價(jià)為: {goods_dict['stock']['jdPrice']['m']}")
 print(f"會(huì)員價(jià)為: {goods_dict['stock']['jdPrice']['tpp']}")
else:
 print("請求失?。?) 	

筆者在寫博文的時(shí)候,價(jià)格發(fā)生了變化,運(yùn)行結(jié)果如下圖所示:

注意:爬取動(dòng)態(tài)加載數(shù)據(jù)信息時(shí),需要根據(jù)不同的網(wǎng)頁使用不同的方式進(jìn)行數(shù)據(jù)的提取。如果在運(yùn)行源碼時(shí)出現(xiàn)了錯(cuò)誤,請根據(jù)操作步驟獲取新的請求地址即可。

到此這篇關(guān)于Python實(shí)現(xiàn)爬取網(wǎng)頁中動(dòng)態(tài)加載的數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Python 爬取網(wǎng)頁動(dòng)態(tài)數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python中append實(shí)例用法總結(jié)

    python中append實(shí)例用法總結(jié)

    在本篇文章中小編給各位分享的是關(guān)于python中append實(shí)例用法以及相關(guān)知識點(diǎn),需要的朋友們可以學(xué)習(xí)下。
    2019-07-07
  • 基于Tensorflow讀取MNIST數(shù)據(jù)集時(shí)網(wǎng)絡(luò)超時(shí)的解決方式

    基于Tensorflow讀取MNIST數(shù)據(jù)集時(shí)網(wǎng)絡(luò)超時(shí)的解決方式

    這篇文章主要介紹了基于Tensorflow讀取MNIST數(shù)據(jù)集時(shí)網(wǎng)絡(luò)超時(shí)的解決方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • Opencv+Python實(shí)現(xiàn)圖像運(yùn)動(dòng)模糊和高斯模糊的示例

    Opencv+Python實(shí)現(xiàn)圖像運(yùn)動(dòng)模糊和高斯模糊的示例

    今天小編就為大家分享一篇關(guān)于Opencv+Python實(shí)現(xiàn)圖像運(yùn)動(dòng)模糊和高斯模糊的示例,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧
    2019-04-04
  • 定制FileField中的上傳文件名稱實(shí)例

    定制FileField中的上傳文件名稱實(shí)例

    下面小編就為大家?guī)硪黄ㄖ艶ileField中的上傳文件名稱實(shí)例。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-08-08
  • python中的getattribute 、getattr、setattr方法詳解

    python中的getattribute 、getattr、setattr方法詳解

    這篇文章主要介紹了python中的getattribute 、getattr、setattr方法詳解,python類中默認(rèn)有一些特殊方法,這篇文章記錄一下特殊方法的功能及用法,需要的朋友可以參考下
    2023-11-11
  • 基于python3 OpenCV3實(shí)現(xiàn)靜態(tài)圖片人臉識別

    基于python3 OpenCV3實(shí)現(xiàn)靜態(tài)圖片人臉識別

    這篇文章主要為大家詳細(xì)介紹了基于Python3 OpenCV3實(shí)現(xiàn)靜態(tài)圖片人臉識別,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-05-05
  • 基于Python制作一個(gè)相冊播放器

    基于Python制作一個(gè)相冊播放器

    對于相冊播放器,大家應(yīng)該都不陌生(用于瀏覽多張圖片的一個(gè)應(yīng)用)。本文將利用Python編寫一個(gè)簡單的相冊播放器,感興趣的可以學(xué)習(xí)一下
    2022-06-06
  • 深入分析python中整型不會(huì)溢出問題

    深入分析python中整型不會(huì)溢出問題

    本文給大家通過實(shí)例和原理深入分析了python中整型不會(huì)溢出的相關(guān)知識點(diǎn),有興趣的朋友可以跟著學(xué)習(xí)下。
    2018-06-06
  • Python之re操作方法(詳解)

    Python之re操作方法(詳解)

    下面小編就為大家?guī)硪黄狿ython之re操作方法(詳解)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-06-06
  • pygame庫pgu使用示例代碼

    pygame庫pgu使用示例代碼

    pgu全稱是Phil’s pyGame Utilities,是pygame的一組模塊與腳本,其中還有g(shù)ui集成了一些小模塊,現(xiàn)在用pygame制作小游戲的人越來越多,但是pygame它是沒有彈窗機(jī)制的,今天通過本文給大家介紹pygame庫pgu使用示例代碼,需要的朋友參考下吧
    2021-08-08

最新評論