欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

記錄一下scrapy中settings的一些配置小結(jié)

 更新時(shí)間:2020年09月28日 11:16:22   作者:Davide~蘇  
這篇文章主要介紹了記錄一下scrapy中settings的一些配置小結(jié),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

本文主要介紹了scrapy settings配置,分享給大家,具體如下:

# 字符編碼
FEED_EXPORT_ENCODING = 'utf-8'

# redis寫(xiě)法一
# REDIS_URL = 'redis://localhost:6379' 

# redis寫(xiě)法二
REDIS_HOST = '192.168.10.223'
REDIS_PORT = 6379
# 默認(rèn)的 scrapy redis 會(huì)讀取下面的密碼和db
REDIS_PARAMS = {
 'password': '123456',
 'db': redis_db
}

# 對(duì)于失敗的HTTP請(qǐng)求(如超時(shí))進(jìn)行重試會(huì)降低爬取效率,當(dāng)爬取目標(biāo)基數(shù)很大時(shí),舍棄部分?jǐn)?shù)據(jù)不影響大局,提高效率
# RETRY_ENABLED = False
# 請(qǐng)求下載超時(shí)時(shí)間,默認(rèn)180秒
DOWNLOAD_TIMEOUT = 10

# 1:設(shè)置去重組件,使用的是scrapy_redis的去重組件,而不是scrapy自己的去重組件了
DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"
# 2:設(shè)置調(diào)度器,使用scrapy——redis重寫(xiě)的調(diào)度器,
# 而不再使用scrapy內(nèi)部的調(diào)度器了
SCHEDULER = "scrapy_redis.scheduler.Scheduler"
# 3:可以實(shí)現(xiàn)斷點(diǎn)爬取=jondir,(請(qǐng)求的記錄不會(huì)丟失,會(huì)存儲(chǔ)在redis數(shù)據(jù)庫(kù)中,
# 不會(huì)清除redis的隊(duì)列,下次直接從redis的隊(duì)列中爬?。?
SCHEDULER_PERSIST = True
# 4:設(shè)置任務(wù)隊(duì)列的模式(三選一):
# SpiderPriorityQueue數(shù)據(jù)scrapy-redis默認(rèn)使用的隊(duì)列模式(
# 有自己的優(yōu)先級(jí))默認(rèn)第一種
SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.SpiderPriorityQueue"
# 使用了隊(duì)列的形式,任務(wù)先進(jìn)先出。
# SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.SpiderQueue"
# 采用了棧的形式:任務(wù)先進(jìn)后出
# SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.SpiderStack"

'''
用來(lái)控制當(dāng)接收到的 response 頭信息中的 Content-Length 和內(nèi)容不匹配或者response chunk 未正確結(jié)束時(shí)的時(shí)所采取的操作。
當(dāng) DOWNLOAD_FAIL_ON_DATALOSS 為 True 的時(shí)候拋出 ResponseFailed([_DataLoss]) 錯(cuò)誤
當(dāng)設(shè)置為 False 時(shí), 校驗(yàn)未通過(guò)的 response 將被忽略并且添加一個(gè)名為 dataloss 的 flag 到 response.flag
'''
DOWNLOAD_FAIL_ON_DATALOSS = False
MONGO_URI = 'mongodb://用戶名:密碼@ip:port'

到此這篇關(guān)于記錄一下scrapy中settings的一些配置小結(jié)的文章就介紹到這了,更多相關(guān)scrapy settings配置內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • PyTorch和Keras計(jì)算模型參數(shù)的例子

    PyTorch和Keras計(jì)算模型參數(shù)的例子

    今天小編就為大家分享一篇PyTorch和Keras計(jì)算模型參數(shù)的例子,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-01-01
  • Python編程實(shí)現(xiàn)及時(shí)獲取新郵件的方法示例

    Python編程實(shí)現(xiàn)及時(shí)獲取新郵件的方法示例

    這篇文章主要介紹了Python編程實(shí)現(xiàn)及時(shí)獲取新郵件的方法,涉及Python實(shí)時(shí)查詢郵箱及郵件獲取相關(guān)操作技巧,需要的朋友可以參考下
    2017-08-08
  • python圖像常規(guī)操作

    python圖像常規(guī)操作

    這篇文章主要介紹了python圖像常規(guī)操作,比較全面,涉及讀取和存儲(chǔ),生成縮略圖,調(diào)整尺寸與旋轉(zhuǎn),繪制圖像輪廓等相關(guān)內(nèi)容,具有一定參考價(jià)值,需要的朋友可以了解下。
    2017-11-11
  • Conda中環(huán)境遷移到另一個(gè)服務(wù)器的實(shí)現(xiàn)

    Conda中環(huán)境遷移到另一個(gè)服務(wù)器的實(shí)現(xiàn)

    本文主要介紹了Conda中的環(huán)境遷移到另一個(gè)服務(wù)器,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-03-03
  • python如何編寫(xiě)類似nmap的掃描工具

    python如何編寫(xiě)類似nmap的掃描工具

    這篇文章主要介紹了python如何編寫(xiě)類似nmap的掃描工具,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • tkinter禁用(只讀)下拉列表Combobox問(wèn)題

    tkinter禁用(只讀)下拉列表Combobox問(wèn)題

    這篇文章主要介紹了tkinter禁用(只讀)下拉列表Combobox問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-01-01
  • python爬蟲(chóng)今日熱榜數(shù)據(jù)到txt文件的源碼

    python爬蟲(chóng)今日熱榜數(shù)據(jù)到txt文件的源碼

    這篇文章主要介紹了python爬蟲(chóng)今日熱榜數(shù)據(jù)到txt文件的源碼,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-02-02
  • Pandas日期處理之生成工作日與節(jié)假日

    Pandas日期處理之生成工作日與節(jié)假日

    Python中的Pandas 提供了許多日期處理功能,使得處理時(shí)間序列數(shù)據(jù)變得容易。本文將介紹如何使用 Pandas 生成工作日和節(jié)假日,感興趣的小伙伴可以收藏一下
    2023-05-05
  • 在Django的上下文中設(shè)置變量的方法

    在Django的上下文中設(shè)置變量的方法

    這篇文章主要介紹了在Django的上下文中設(shè)置變量的方法,Django是重多Python高人氣框架中最為著名的一個(gè),需要的朋友可以參考下
    2015-07-07
  • python實(shí)現(xiàn)監(jiān)聽(tīng)鍵盤(pán)

    python實(shí)現(xiàn)監(jiān)聽(tīng)鍵盤(pán)

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)監(jiān)聽(tīng)鍵盤(pán),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-04-04

最新評(píng)論