欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python中用Scrapy實現(xiàn)定時爬蟲的實例講解

 更新時間:2021年01月18日 14:33:04   作者:宋宋大人  
在本篇文章里小編給大家整理的是一篇關(guān)于python中用Scrapy實現(xiàn)定時爬蟲的實例講解內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。

一般網(wǎng)站發(fā)布信息會在具體實現(xiàn)范圍內(nèi)發(fā)布,我們在進行網(wǎng)絡(luò)爬蟲的過程中,可以通過設(shè)置定時爬蟲,定時的爬取網(wǎng)站的內(nèi)容。使用python爬蟲框架Scrapy框架可以實現(xiàn)定時爬蟲,而且可以根據(jù)我們的時間需求,方便的修改定時的時間。

1、Scrapy介紹

Scrapy是python的爬蟲框架,用于抓取web站點并從頁面中提取結(jié)構(gòu)化的數(shù)據(jù)。任何人都可以根據(jù)需求方便的修改。Scrapy用途廣泛,可以用于數(shù)據(jù)挖掘、監(jiān)測和自動化測試。

2、使用Scrapy框架定時爬取

import time
from scrapy import cmdline
def doSth():
  # 把爬蟲程序放在這個類里 zhilian_spider 是爬蟲的name
  cmdline.execute('scrapy crawl zhilian_spider'.split())
# 想幾點更新,定時到幾點
def time_ti(h=17, m=54):
  while True:
    now = datetime.datetime.now()
    # print(now.hour, now.minute)
    if now.hour == h and now.minute == m:
      doSth()
    # 每隔60秒檢測一次
    time.sleep(60)
time_ti()

3、更簡單的寫法

import time
import sys
import os
import datetime
def Dingshi():
while True:
os.system("scrapy crawl lcp")#lcp是我們爬蟲的代碼名字哦
time.sleep(60)
Dingshi()

知識點擴展:

直接使用Timer類實例代碼

import time
import os
while True:
 os.system("scrapy crawl News")
 time.sleep(86400) #每隔一天運行一次 24*60*60=86400s或者,使用標準庫的sched模塊
import sched
#初始化sched模塊的scheduler類
#第一個參數(shù)是一個可以返回時間戳的函數(shù),第二個參數(shù)可以在定時未到達之前阻塞。
schedule = sched.scheduler ( time.time, time.sleep )
#被周期性調(diào)度觸發(fā)的函數(shù)
def func():
 os.system("scrapy crawl News")
def perform1(inc):
 schedule.enter(inc,0,perform1,(inc,))
 func() # 需要周期執(zhí)行的函數(shù)
def mymain():
 schedule.enter(0,0,perform1,(86400,))
if __name__=="__main__":
 mymain()
 schedule.run() # 開始運行,直到計劃時間隊列變成空為止關(guān)于cmd的實現(xiàn)方法,本人在單次執(zhí)行爬蟲程序時使用的是 
cmdline.execute("scrapy crawl News".split())但可能因為cmdline是scrapy模塊中自帶的,所以定時執(zhí)行時只能執(zhí)行一次就退出了。

到此這篇關(guān)于python中用Scrapy實現(xiàn)定時爬蟲的實例講解的文章就介紹到這了,更多相關(guān)python中使用Scrapy實現(xiàn)定時爬蟲內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Pytorch+PyG實現(xiàn)GIN過程示例詳解

    Pytorch+PyG實現(xiàn)GIN過程示例詳解

    這篇文章主要為大家介紹了Pytorch+PyG實現(xiàn)GIN過程示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-04-04
  • python 將大文件切分為多個小文件的實例

    python 將大文件切分為多個小文件的實例

    今天小編就為大家分享一篇python 將大文件切分為多個小文件的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • python 申請內(nèi)存空間,用于創(chuàng)建多維數(shù)組的實例

    python 申請內(nèi)存空間,用于創(chuàng)建多維數(shù)組的實例

    今天小編就為大家分享一篇python 申請內(nèi)存空間,用于創(chuàng)建多維數(shù)組的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • python3.0 模擬用戶登錄,三次錯誤鎖定的實例

    python3.0 模擬用戶登錄,三次錯誤鎖定的實例

    下面小編就為大家?guī)硪黄猵ython3.0 模擬用戶登錄,三次錯誤鎖定的實例。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-11-11
  • Django和Flask框架優(yōu)缺點對比

    Django和Flask框架優(yōu)缺點對比

    這篇文章主要介紹了Django和Flask框架相關(guān)對比,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2019-10-10
  • Python函數(shù)的參數(shù)類型和使用技巧詳解

    Python函數(shù)的參數(shù)類型和使用技巧詳解

    這篇文章主要介紹了Python函數(shù)的參數(shù)類型和使用技巧詳解,函數(shù)指通過專門的代碼組織,用來實現(xiàn)特定功能的代碼段,具有相對的獨立性,可以被其他代碼重復(fù)調(diào)用,需要的朋友可以參考下
    2023-08-08
  • python實現(xiàn)同一局域網(wǎng)下傳輸圖片

    python實現(xiàn)同一局域網(wǎng)下傳輸圖片

    這篇文章主要為大家詳細介紹了python實現(xiàn)同一局域網(wǎng)下傳輸圖片,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2020-03-03
  • 基于Python實現(xiàn)快遞信息提取

    基于Python實現(xiàn)快遞信息提取

    這篇文章主要為大家介紹了如何利用Python實現(xiàn)提取快遞信息,文中的示例代碼講解詳細,對我們學(xué)習(xí)Python有一定幫助,需要的可以參考一下
    2022-03-03
  • python?opencv實現(xiàn)灰度圖和彩色圖的互相轉(zhuǎn)換

    python?opencv實現(xiàn)灰度圖和彩色圖的互相轉(zhuǎn)換

    這篇文章主要給大家介紹了關(guān)于python?opencv實現(xiàn)灰度圖和彩色圖的互相轉(zhuǎn)換,文中通過實例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2022-01-01
  • Python操作MongoDb數(shù)據(jù)庫流程詳解

    Python操作MongoDb數(shù)據(jù)庫流程詳解

    這篇文章主要介紹了Python操作MongoDb數(shù)據(jù)庫流程詳解,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-03-03

最新評論