快捷導(dǎo)航

Python爬取YY評(píng)級(jí)分?jǐn)?shù)并保存數(shù)據(jù)實(shí)現(xiàn)過(guò)程解析

更新時(shí)間：2020年06月01日 10:05:56 作者：其實(shí)還好啦

這篇文章主要介紹了Python爬取YY評(píng)級(jí)分?jǐn)?shù)并保存數(shù)據(jù)實(shí)現(xiàn)過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

前言

當(dāng)需要進(jìn)行大規(guī)模查詢(xún)時(shí)（比如目前遇到的情形：查詢(xún)某個(gè)省所有發(fā)債企業(yè)的YY評(píng)級(jí)分?jǐn)?shù)），人工查詢(xún)顯然太過(guò)費(fèi)時(shí)，那就寫(xiě)個(gè)爬蟲(chóng)吧。

由于該爬蟲(chóng)實(shí)在過(guò)于簡(jiǎn)單，就只簡(jiǎn)單概述下。

一、請(qǐng)求端

通過(guò)觀察YY評(píng)級(jí)的網(wǎng)頁(yè)信息，如下圖（F12或右擊進(jìn)入檢查，點(diǎn)擊network—>XHR—>headers）。

紅色框表明是個(gè)get請(qǐng)求（其實(shí)這種網(wǎng)頁(yè)基本都是Ajax get，需要總結(jié)實(shí)際url的規(guī)律的）。

綠色框即為實(shí)際URL，通過(guò)分析該URL，其由兩部分組成。前半部分為“
https://web.ratingdog.cn/v1/search?”，后半部分為黃色框內(nèi)內(nèi)容用“&”符號(hào)連接后的結(jié)果。黃色框內(nèi)的內(nèi)容，只有企業(yè)名稱(chēng)為變量，且為已知變量，那URL即可據(jù)此確定了。

另外需注意，YY評(píng)級(jí)需要登錄才可查詢(xún)數(shù)據(jù)，在構(gòu)建頭部信息進(jìn)行訪問(wèn)時(shí)，一定要提前登錄，并在頭部信息中放入登錄信息和登錄狀態(tài)。

二、響應(yīng)端

通過(guò)觀察網(wǎng)頁(yè)的響應(yīng)信息（F12或右擊進(jìn)入檢查，點(diǎn)擊network—>XHR—>response），如下圖。響應(yīng)信息及其簡(jiǎn)單，我們所需要的YY評(píng)級(jí)分?jǐn)?shù)安詳?shù)靥稍谀抢?，?jiǎn)單到一個(gè)正則表達(dá)式就可以提取出該數(shù)據(jù)。正則如下：

"msg".*?"IssuerName":"(.*?)","YYRating":"(.*?)/10","IntrinsicRating".*?"

三、代碼

所需數(shù)據(jù)較少，代碼相對(duì)簡(jiǎn)單，就不建立函數(shù)了，直接一路到底吧。如下：

運(yùn)行代碼后，得到結(jié)果如下。安徽省的100多條數(shù)據(jù)，就到了本地了

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

python實(shí)現(xiàn)json文件的增刪改操作方法
這篇文章主要介紹了python實(shí)現(xiàn)json文件的增刪改操作,本文通過(guò)示例代碼給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值，需要的朋友可以參考下
2023-06-06
python使用opencv進(jìn)行人臉識(shí)別
本文主要介紹了python使用opencv進(jìn)行人臉識(shí)別的相關(guān)資料。具有很好的參考價(jià)值。下面跟著小編一起來(lái)看下吧
2017-04-04
python的常見(jiàn)命令注入威脅
不過(guò)下面可是我們開(kāi)發(fā)產(chǎn)品初期的一些血淋淋的案例，更多的安全威脅可以看看北北同學(xué)的《python hack》PPT，里面提及了不只命令執(zhí)行的威脅，那些都是我們親身經(jīng)歷的代碼
2013-02-02
解決pycharm中opencv-python導(dǎo)入cv2后無(wú)法自動(dòng)補(bǔ)全的問(wèn)題(不用作任何文件上的修改)
這篇文章主要介紹了解決pycharm中opencv-python導(dǎo)入cv2后無(wú)法自動(dòng)補(bǔ)全的問(wèn)題(不用作任何文件上的修改),本文給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值，需要的朋友可以參考下
2020-03-03
Python3.7 pyodbc完美配置訪問(wèn)access數(shù)據(jù)庫(kù)
最近小編需要學(xué)習(xí)python連接access數(shù)據(jù)庫(kù)，發(fā)現(xiàn)很多朋友推薦pyodbc，那么這篇文章就先為大家介紹一下Python3.7下pyodbc的配置方法
2019-10-10
Python中OpenCV圖像特征和harris角點(diǎn)檢測(cè)
Harris角點(diǎn)檢測(cè)算子是于1988年由CHris Harris & Mike Stephens提出來(lái)的。在具體展開(kāi)之前，不得不提一下Moravec早在1981就提出來(lái)的Moravec角點(diǎn)檢測(cè)算子。本文重點(diǎn)給大家介紹OpenCV圖像特征harris角點(diǎn)檢測(cè)知識(shí)，一起看看吧
2021-09-09
Python中yield關(guān)鍵字的理解與使用
yield關(guān)鍵字用于創(chuàng)建生成器函數(shù),一種高效利用內(nèi)存的函數(shù)類(lèi)型,可以像迭代器對(duì)象一樣使用,本文主要介紹了Python中的yield關(guān)鍵字的應(yīng)用,需要的可以參考下
2023-08-08
Python異步編程之協(xié)程任務(wù)的調(diào)度操作實(shí)例分析
這篇文章主要介紹了Python異步編程之協(xié)程任務(wù)的調(diào)度操作,結(jié)合實(shí)例形式分析了Python異步編程中協(xié)程任務(wù)的調(diào)度相關(guān)原理、實(shí)現(xiàn)方法與操作注意事項(xiàng),需要的朋友可以參考下
2020-02-02
Python下載網(wǎng)絡(luò)小說(shuō)實(shí)例代碼
這篇文章主要介紹了Python下載網(wǎng)絡(luò)小說(shuō)實(shí)例代碼，分享了相關(guān)代碼示例，小編覺(jué)得還是挺不錯(cuò)的，具有一定借鑒價(jià)值，需要的朋友可以參考下
2018-02-02
詳解Python匿名函數(shù)（lambda函數(shù)）
這篇文章主要介紹了Python匿名函數(shù)（lambda函數(shù)），文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2019-04-04