欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python爬蟲多次請求超時的幾種重試方法(6種)

 更新時間:2020年12月01日 10:51:52   作者:莫貞俊晗  
這篇文章主要介紹了python爬蟲多次請求超時的幾種重試方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

第一種方法

headers = Dict()
url = 'https://www.baidu.com'
try:
 proxies = None
 response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
except:
 # logdebug('requests failed one time')
 try:
  proxies = None
  response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
 except:
  # logdebug('requests failed two time')
  print('requests failed two time')

總結(jié) :代碼比較冗余,重試try的次數(shù)越多,代碼行數(shù)越多,但是打印日志比較方便

第二種方法

def requestDemo(url,):
 headers = Dict()
 trytimes = 3 # 重試的次數(shù)
 for i in range(trytimes):
 try:
  proxies = None
  response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
  # 注意此處也可能是302等狀態(tài)碼
  if response.status_code == 200:
  break
 except:
  # logdebug(f'requests failed {i}time')
   print(f'requests failed {i} time')

總結(jié) :遍歷代碼明顯比第一個簡化了很多,打印日志也方便

第三種方法

def requestDemo(url, times=1):
 headers = Dict()
 try:
  proxies = None
  response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
  html = response.text()
  # todo 此處處理代碼正常邏輯
  pass
  return html
 except:
  # logdebug(f'requests failed {i}time')
  trytimes = 3 # 重試的次數(shù)
  if times < trytimes:
  times += 1
   return requestDemo(url, times)
  return 'out of maxtimes'

總結(jié) :迭代 顯得比較高大上,中間處理代碼時有其它錯誤照樣可以進(jìn)行重試; 缺點 不太好理解,容易出錯,另外try包含的內(nèi)容過多時,對代碼運行速度不利。

第四種方法

@retry(3) # 重試的次數(shù) 3
def requestDemo(url):
 headers = Dict()
 proxies = None
 response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
 html = response.text()
 # todo 此處處理代碼正常邏輯
 pass
 return html
 
def retry(times):
 def wrapper(func):
  def inner_wrapper(*args, **kwargs):
   i = 0
   while i < times:
    try:
     print(i)
     return func(*args, **kwargs)
    except:
     # 此處打印日志 func.__name__ 為say函數(shù)
     print("logdebug: {}()".format(func.__name__))
     i += 1
  return inner_wrapper
 return wrapper

總結(jié) :裝飾器優(yōu)點 多種函數(shù)復(fù)用,使用十分方便

第五種方法

#!/usr/bin/python
# -*-coding='utf-8' -*-
import requests
import time
import json
from lxml import etree
import warnings
warnings.filterwarnings("ignore")

def get_xiaomi():
 try:
  # for n in range(5): # 重試5次
  #  print("第"+str(n)+"次")
  for a in range(5): # 重試5次
   print(a)
   url = "https://www.mi.com/"
   headers = {
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",
    "Accept-Encoding": "gzip, deflate, br",
    "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
    "Connection": "keep-alive",
    # "Cookie": "xmuuid=XMGUEST-D80D9CE0-910B-11EA-8EE0-3131E8FF9940; Hm_lvt_c3e3e8b3ea48955284516b186acf0f4e=1588929065; XM_agreement=0; pageid=81190ccc4d52f577; lastsource=www.baidu.com; mstuid=1588929065187_5718; log_code=81190ccc4d52f577-e0f893c4337cbe4d|https%3A%2F%2Fwww.mi.com%2F; Hm_lpvt_c3e3e8b3ea48955284516b186acf0f4e=1588929099; mstz=||1156285732.7|||; xm_vistor=1588929065187_5718_1588929065187-1588929100964",
    "Host": "www.mi.com",
    "Upgrade-Insecure-Requests": "1",
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.90 Safari/537.36"
   }
   response = requests.get(url,headers=headers,timeout=10,verify=False)
   html = etree.HTML(response.text)
   # print(html)
   result = etree.tostring(html)
   # print(result)
   print(result.decode("utf-8"))
   title = html.xpath('//head/title/text()')[0]
   print("title==",title)
   if "左左" in title:
   # print(response.status_code)
   # if response.status_code ==200:
    break
  return title

 except:
  result = "異常"
  return result

if __name__ == '__main__':
 print(get_xiaomi())

第六種方法

Python重試模塊retrying

# 設(shè)置最大重試次數(shù)
@retry(stop_max_attempt_number=5)
def get_proxies(self):
 r = requests.get('代理地址')
 print('正在獲取')
 raise Exception("異常")
 print('獲取到最新代理 = %s' % r.text)
 params = dict()
 if r and r.status_code == 200:
  proxy = str(r.content, encoding='utf-8')
  params['http'] = 'http://' + proxy
  params['https'] = 'https://' + proxy

# 設(shè)置方法的最大延遲時間,默認(rèn)為100毫秒(是執(zhí)行這個方法重試的總時間)
@retry(stop_max_attempt_number=5,stop_max_delay=50)
# 通過設(shè)置為50,我們會發(fā)現(xiàn),任務(wù)并沒有執(zhí)行5次才結(jié)束!

# 添加每次方法執(zhí)行之間的等待時間
@retry(stop_max_attempt_number=5,wait_fixed=2000)
# 隨機(jī)的等待時間
@retry(stop_max_attempt_number=5,wait_random_min=100,wait_random_max=2000)
# 每調(diào)用一次增加固定時長
@retry(stop_max_attempt_number=5,wait_incrementing_increment=1000)

# 根據(jù)異常重試,先看個簡單的例子
def retry_if_io_error(exception):
 return isinstance(exception, IOError)

@retry(retry_on_exception=retry_if_io_error)
def read_a_file():
 with open("file", "r") as f:
  return f.read()

read_a_file函數(shù)如果拋出了異常,會去retry_on_exception指向的函數(shù)去判斷返回的是True還是False,如果是True則運行指定的重試次數(shù)后,拋出異常,F(xiàn)alse的話直接拋出異常。

當(dāng)時自己測試的時候網(wǎng)上一大堆抄來抄去的,意思是retry_on_exception指定一個函數(shù),函數(shù)返回指定異常,會重試,不是異常會退出。真坑人??!

來看看獲取代理的應(yīng)用(僅僅是為了測試retrying模塊)

到此這篇關(guān)于python爬蟲多次請求超時的幾種重試方法的文章就介紹到這了,更多相關(guān)python爬蟲多次請求超時內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python實現(xiàn)一個簡單的ping工具方法

    python實現(xiàn)一個簡單的ping工具方法

    今天小編就為大家分享一篇python實現(xiàn)一個簡單的ping工具方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • 使用 PyTorch 實現(xiàn) MLP 并在 MNIST 數(shù)據(jù)集上驗證方式

    使用 PyTorch 實現(xiàn) MLP 并在 MNIST 數(shù)據(jù)集上驗證方式

    今天小編就為大家分享一篇使用 PyTorch 實現(xiàn) MLP 并在 MNIST 數(shù)據(jù)集上驗證方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-01-01
  • Python數(shù)據(jù)可視化實踐之使用Matplotlib繪制圖表

    Python數(shù)據(jù)可視化實踐之使用Matplotlib繪制圖表

    數(shù)據(jù)可視化是數(shù)據(jù)分析的重要環(huán)節(jié),通過將數(shù)據(jù)轉(zhuǎn)化為圖形,可以更直觀地展示數(shù)據(jù)特征和規(guī)律。Python中的Matplotlib庫是一個強(qiáng)大的數(shù)據(jù)可視化工具,本文將帶您了解Matplotlib的基本使用方法,以及如何繪制常見的圖表
    2023-05-05
  • python之PyAutoGui教你做個自動腳本計算器的方法

    python之PyAutoGui教你做個自動腳本計算器的方法

    這篇文章主要介紹了python之PyAutoGui教你做個自動腳本計算器的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-03-03
  • Python import模塊的緩存問題解決方案

    Python import模塊的緩存問題解決方案

    這篇文章主要介紹了Python import模塊的緩存問題解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-06-06
  • 如何實現(xiàn)python爬蟲爬取視頻時實現(xiàn)實時進(jìn)度條顯示

    如何實現(xiàn)python爬蟲爬取視頻時實現(xiàn)實時進(jìn)度條顯示

    這篇文章主要介紹了如何實現(xiàn)python爬蟲爬取視頻時實現(xiàn)實時進(jìn)度條顯示,在爬取并下載網(wǎng)頁上的視頻的時候,我們需要實時進(jìn)度條,這可以幫助我們更直觀的看到視頻的下載進(jìn)度。文章圍繞主題展開更多內(nèi)容,需要的小伙伴可以參考一下
    2022-06-06
  • Python安裝與卸載流程詳細(xì)步驟(圖解)

    Python安裝與卸載流程詳細(xì)步驟(圖解)

    這篇文章主要介紹了Python環(huán)境的安裝與卸載流程,本文分步驟通過圖文并茂的形式給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-02-02
  • Python實現(xiàn)PDF轉(zhuǎn)Word的多種方式總結(jié)

    Python實現(xiàn)PDF轉(zhuǎn)Word的多種方式總結(jié)

    這篇文章主要為大家詳細(xì)介紹了三種Python實現(xiàn)PDF文件轉(zhuǎn)Word文檔的方式,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-11-11
  • PyQt5使用QtDesigner實現(xiàn)多界面切換程序的全過程

    PyQt5使用QtDesigner實現(xiàn)多界面切換程序的全過程

    Pyqt5是Python中一個可視化超級好用的庫,下面這篇文章主要給大家介紹了關(guān)于PyQt5使用QtDesigner實現(xiàn)多界面切換程序的相關(guān)資料,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下
    2023-06-06
  • Python使用pymeter操作JMeter的教程詳解

    Python使用pymeter操作JMeter的教程詳解

    pymeter?是一個?Python?庫,它可以以編程方式創(chuàng)建和運行?JMeter?測試計劃,下面就跟隨小編一起來看看Python如何使用pymeter操作JMeter的吧
    2024-01-01

最新評論