欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

<rt id="d8yqa"><table id="d8yqa"></table></rt>

Python的Scrapy框架基本使用詳解

更新時間：2023年12月06日 10:10:15 作者：凌冰_

這篇文章主要介紹了Python的Scrapy框架基本使用詳解,Scrapy,Python開發(fā)的一個快速、高層次的屏幕抓取和web抓取框架,用于抓取web站點并從頁面中提取結(jié)構(gòu)化的數(shù)據(jù),Scrapy用途廣泛,可以用于數(shù)據(jù)挖掘、監(jiān)測和自動化測試,需要的朋友可以參考下

目錄

一、Scrapy框架使用

1. 創(chuàng)建scrapy項目
2. 創(chuàng)建爬蟲文件
3. 運行爬蟲代碼
4. scrapy文檔

二、scrapy項目的結(jié)構(gòu)

四、response的屬性和方法

五、scrapy工作原理

一、Scrapy框架使用

1. 創(chuàng)建scrapy項目

（不能有漢字，不能數(shù)字開頭）

scrapy startproject Baidu

2. 創(chuàng)建爬蟲文件

cd Baidu
scrapy  genspider wenda www.baidu.com

注意： parse()是執(zhí)行了start_url之后要執(zhí)行的方法，方法中的response就是返回的對象。相當于response = requests.get或requests.post

3. 運行爬蟲代碼

scrapy crawl wenda

在parse（）函數(shù)打印一句話，運行后發(fā)現(xiàn)沒有打印結(jié)果，原因是被一個叫robots.txt的文件給阻止了。

解決：大平臺的君子協(xié)議，只需在settings里將ROBOTSTXT_OBEY = True注釋掉即可。

再次運行

4. scrapy文檔

scrapy官網(wǎng)：https://scrapy.org/

scrapy文檔：https://doc.scrapy.org/en/latest/intro/tutorial.html

scrapy日志：https://docs.scrapy.org/en/latest/news.html

二、scrapy項目的結(jié)構(gòu)

四、response的屬性和方法

response.text 獲取響應(yīng)的字符串(源碼)
response.body 獲取響應(yīng)的二進制數(shù)據(jù)(二進制源碼)
response.xpath 直接通過xpath解析response中的內(nèi)容
response.extract() 提取selector對象的data所有屬性值
response.extract_first() 提取selector列表的第一個數(shù)據(jù)
response.get() : 得到第一條數(shù)據(jù)
response.getall() :取出所有的數(shù)據(jù)，以列表的方式呈現(xiàn)

五、scrapy工作原理

引擎向spiders要url
引擎將要爬取的url給調(diào)度器
調(diào)度器會將url生成請求對象放入到指定的隊列中
從隊列中出隊一個請求
引擎將請求交給下載器處理
下載器發(fā)送請求獲取互聯(lián)網(wǎng)數(shù)據(jù)
下載器將數(shù)據(jù)返回給引擎
引擎將數(shù)據(jù)再次給spiders
spiders通過xpath解析該數(shù)據(jù)，得到數(shù)據(jù)或url
spiders將數(shù)據(jù)或url給到引擎
引擎判斷是數(shù)據(jù)還是url，若是數(shù)據(jù)，交給管道處理；若是url，交給調(diào)度器處理

到此這篇關(guān)于Python的Scrapy框架基本使用詳解的文章就介紹到這了,更多相關(guān)Python的Scrapy框架內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

利用Python還原方陣游戲詳解
這篇文章的靈感來源于我玩游戲的時候，看見一個大佬在游戲里面建造了“還原方陣游戲”，就感覺很牛掰，就想著python不是有矩陣嗎，可以還原一下呢，感興趣的小伙伴可以了解一下
2023-01-01
這篇文章主要介紹了python基礎(chǔ)教程之面向?qū)ο蟮囊恍└拍?面向?qū)ο笫且环N代碼組織方式,讓代碼復用最大化,需要的朋友可以參考下
2014-08-08

解密Python中的描述符（descriptor）

解密Python中的描述符（descriptor）

這篇文章主要介紹了解密Python中的描述符（descriptor）,本文詳細講解了描述符（descriptor）的作用、訪問描述符、對描述符賦值、刪除描述符等內(nèi)容,需要的朋友可以參考下

2015-06-06

uwsgi啟動django項目的實現(xiàn)步驟

uwsgi啟動django項目的實現(xiàn)步驟

本文主要介紹了uwsgi啟動django項目的實現(xiàn)步驟，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

2022-08-08

Python繪制驚艷的?；鶊D的示例詳解

Python繪制驚艷的?；鶊D的示例詳解

很多時候，我們需要一種必須可視化數(shù)據(jù)如何在實體之間流動的情況。這個時候就需要?；鶊D，它通常描繪從一個實體(或節(jié)點)到另一個實體(或節(jié)點)的數(shù)據(jù)流。本文將利用Python繪制驚艷的?；鶊D，需要的可以參考一下

2022-02-02

Python實現(xiàn)快速多線程ping的方法

Python實現(xiàn)快速多線程ping的方法

這篇文章主要介紹了Python實現(xiàn)快速多線程ping的方法,實例分析了Python多線程及ICMP數(shù)據(jù)包的發(fā)送技巧,具有一定參考借鑒價值,需要的朋友可以參考下

2015-07-07

Python實現(xiàn)可視化CSV文件中的數(shù)據(jù)

Python實現(xiàn)可視化CSV文件中的數(shù)據(jù)

CSV文件包含許多記錄,數(shù)據(jù)分布在各行和各列中,在這篇文章中,小編主要為大家詳細介紹了Python如何實現(xiàn)可視化CSV文件中的數(shù)據(jù),感興趣的小伙伴可以跟隨小編一起學習一下

2023-11-11

Python使用PIL將圖片或GIF轉(zhuǎn)為字符畫的方法詳解

Python使用PIL將圖片或GIF轉(zhuǎn)為字符畫的方法詳解

PIL是專為Python語言設(shè)計的圖像處理庫,它涵蓋了廣泛的圖像處理功能,如圖像的加載、保存、編輯,以及執(zhí)行多樣化的圖像處理任務(wù),本文給大家介紹了Python使用PIL將圖片或GIF轉(zhuǎn)為字符畫的方法,需要的朋友可以參考下

2025-03-03

python 如何使用find和find_all爬蟲、找文本的實現(xiàn)

python 如何使用find和find_all爬蟲、找文本的實現(xiàn)

這篇文章主要介紹了python 如何使用find和find_all，爬蟲、找文本，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

2020-10-10

python?pandas?數(shù)據(jù)排序的幾種常用方法

python?pandas?數(shù)據(jù)排序的幾種常用方法

這篇文章主要介紹了python?pandas數(shù)據(jù)排序的幾種常用方法，文章圍繞主題展開詳細的內(nèi)容介紹，具有一定的參考價值，需要的小伙伴可以參考一下

2022-09-09

最新評論