使用Python的Scrapy框架十分鐘爬取美女圖
簡介
scrapy 是一個 python 下面功能豐富、使用快捷方便的爬蟲框架。用 scrapy 可以快速的開發(fā)一個簡單的爬蟲,官方給出的一個簡單例子足以證明其強大:
快速開發(fā)
下面開始10分鐘倒計時:
當(dāng)然開始前,可以先看看之前我們寫過的 scrapy 入門文章 《零基礎(chǔ)寫python爬蟲之使用Scrapy框架編寫爬蟲
1. 初始化項目
scrapy startproject mzt cd mzt scrapy genspider meizitu meizitu.com
2. 添加 spider 代碼:
定義 scrapy.Item ,添加 image_urls 和 images ,為下載圖片做準(zhǔn)備。
修改 start_urls 為初始頁面, 添加 parse 用于處理列表頁, 添加 parse_item 處理項目頁面。
3. 修改配置文件:
DOWNLOAD_DELAY = 1 # 添加下載延遲配置 ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1} # 添加圖片下載 pipeline IMAGES_STORE = '.' # 設(shè)置圖片保存目錄
4. 運行項目:
scrapy crawl meizitu
看,項目運行效果圖
等待一會兒,就是收獲的時候了
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作能帶來一定的幫助,如果有疑問大家可以留言交流。
相關(guān)文章
pycharm配置pyqt5-tools開發(fā)環(huán)境的方法步驟
這篇文章主要介紹了pycharm配置pyqt5-tools開發(fā)環(huán)境的方法步驟,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-02-02python導(dǎo)出requirements.txt的幾種方法以及環(huán)境配置詳細(xì)流程
這篇文章主要給大家介紹了關(guān)于python導(dǎo)出requirements.txt的幾種方法以及環(huán)境配置詳細(xì)流程,requirements.txt 文件是一個文本文件,用于列出你的Python項目所依賴的軟件包及其版本,需要的朋友可以參考下2023-11-11Python圖形化界面基礎(chǔ)篇之如何使用彈出窗口和對話框
對于Python程序員來說,處理彈出窗口似乎并不是一個常見的任務(wù),這篇文章主要給大家介紹了關(guān)于Python圖形化界面基礎(chǔ)篇之如何使用彈出窗口和對話框的相關(guān)資料,需要的朋友可以參考下2024-03-03自適應(yīng)線性神經(jīng)網(wǎng)絡(luò)Adaline的python實現(xiàn)詳解
這篇文章主要介紹了自適應(yīng)線性神經(jīng)網(wǎng)絡(luò)Adaline的python實現(xiàn)詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-09-09python Django編寫接口并用Jmeter測試的方法
這篇文章主要介紹了python Django編寫接口并用Jmeter測試,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07