欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

深入了解Python中Requests庫(kù)的使用

 更新時(shí)間:2023年07月16日 15:12:37   作者:CodeDevMaster  
Requests是一個(gè)功能強(qiáng)大的Python?HTTP庫(kù),用于發(fā)送HTTP請(qǐng)求,獲取響應(yīng)數(shù)據(jù),本文主要來(lái)和大家聊聊它的用法,需要的小伙伴可以跟隨小編一起學(xué)習(xí)一下

Requests模塊

Requests是一個(gè)功能強(qiáng)大的Python HTTP庫(kù),用于發(fā)送HTTP請(qǐng)求,獲取響應(yīng)數(shù)據(jù)。它簡(jiǎn)化了與HTTP資源的交互,提供了簡(jiǎn)潔且易于使用的API。

文檔:https://requests.readthedocs.io/projects/cn/zh_CN/latest/

要使用Requests模塊,首先需要安裝它,可以使用pip來(lái)安裝最新版本的Requests

pip install requests
pip3 install requests

簡(jiǎn)單使用

安裝完成后,就可以在Python代碼中導(dǎo)入Requests模塊并使用它了。

發(fā)送GET請(qǐng)求

使用Requests發(fā)送GET請(qǐng)求:

# 導(dǎo)入模塊
import requests
# 目標(biāo)url
url = 'https://www.baidu.com'
# 向目標(biāo)url發(fā)送get請(qǐng)求
response = requests.get(url)
# 打印響應(yīng)內(nèi)容
print(response.text)
# 解碼:解決中文亂碼問(wèn)題
print(response.content.decode())

發(fā)送POST請(qǐng)求

使用Requests發(fā)送POST請(qǐng)求:

# 導(dǎo)入模塊
import requests
# 定義請(qǐng)求地址
url = 'http://127.0.0.1:8080/login'
# 定義自定義請(qǐng)求頭
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36"
}
# 定義post請(qǐng)求參數(shù)
data = {
    "username": "admin",
    "password": "123456"
}
# 使用 POST 請(qǐng)求參數(shù)發(fā)送請(qǐng)求
response = requests.post(url, headers=headers, data=data)
# 獲取響應(yīng)的 html 內(nèi)容
html = response.content.decode("utf-8")
print(html)

使用Response響應(yīng)對(duì)象

獲取響應(yīng)內(nèi)容可以使用response.textresponse.content

response.text是將response.content(bytes類型)進(jìn)行解碼的字符串。

response.content是直接從網(wǎng)絡(luò)上抓取的數(shù)據(jù),沒(méi)有經(jīng)過(guò)任何解碼,是一個(gè) bytes類型的數(shù)據(jù)。

解碼需要指定一個(gè)編碼方式,服務(wù)器不指定的話, requests會(huì)根據(jù)HTTP頭部對(duì)響應(yīng)的編碼,如<meta charset="utf-8">進(jìn)行猜測(cè),默認(rèn)編碼是"ISO-8859-1"。猜測(cè)錯(cuò)誤,就會(huì)導(dǎo)致解碼產(chǎn)生亂碼。因此需要使用response.content.decode()來(lái)解決中文亂碼

decode函數(shù)解決中文亂碼

常見(jiàn)編碼字符集

utf-8
gbk
gb2312
ascii
iso-8859-1

response.content.decode() 默認(rèn)utf-8
response.content.decode("GBK")

常用屬性或方法

  • response = requests.get(url):response是發(fā)送請(qǐng)求獲取的響應(yīng)對(duì)象
  • response.text、response.content:獲取響應(yīng)內(nèi)容
  • response.url響應(yīng)的url:有時(shí)候響應(yīng)的url和請(qǐng)求的url并不一致
  • response.status_code:響應(yīng)狀態(tài)碼
  • response.request.headers:響應(yīng)對(duì)象的請(qǐng)求頭
  • response.headers:響應(yīng)頭
  • response.request._cookies:響應(yīng)對(duì)應(yīng)請(qǐng)求的cookie,返回cookieJar類型
  • response.cookies:應(yīng)中攜帶的cookies,經(jīng)過(guò)set-cookie動(dòng)作,返回cookieJar類型
  • response.json():自動(dòng)將json字符串類型的響應(yīng)內(nèi)容轉(zhuǎn)換為python對(duì)象(dict or list)

設(shè)置headers請(qǐng)求頭

可以使用headers參數(shù)來(lái)設(shè)置請(qǐng)求頭

headers參數(shù)用于攜帶請(qǐng)求頭發(fā)送請(qǐng)求的方法

headers參數(shù)接收字典形式的請(qǐng)求頭,請(qǐng)求頭字段名作為key,字段對(duì)應(yīng)的值作為value

import requests
# 目標(biāo)url
url = 'https://www.baidu.com'
# 請(qǐng)求頭
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"}
# 向目標(biāo)url發(fā)送get請(qǐng)求
response = requests.get(url, headers=headers)
# 打印響應(yīng)內(nèi)容
print(response.content.decode())
# 打印請(qǐng)求頭信息
print(response.request.headers)

處理Cookies

1.攜帶cookie

在headers參數(shù)中攜帶cookie。

從瀏覽器中復(fù)制User-Agent和Cookie

瀏覽器中的請(qǐng)求頭字段和值與headers參數(shù)中必須一致

headers請(qǐng)求參數(shù)字典中的Cookie鍵對(duì)應(yīng)的值是字符串

# 請(qǐng)求頭
import requests
# 構(gòu)造請(qǐng)求頭字典
headers = {
    # 瀏覽器中復(fù)制的User-Agent
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36',
    # 瀏覽器中復(fù)制的Cookie
    'Cookie': 'BIDUPSID=DA34A47255629CF319B6868F08DC207F; PSTM=1658846527; BAIDUID=DA34A47255629CF32D59A4FD90F6BB95:SL=0:NR=10:FG=1;'
}
url = 'https://www.baidu.com/s'
# 請(qǐng)求參數(shù) 字典
params = {'wd': 'java'}
# 向目標(biāo)url發(fā)送get請(qǐng)求
response = requests.get(url, headers=headers, params=params)
# 打印響應(yīng)內(nèi)容
print(response.content.decode())

2.cookies參數(shù)

可以在headers參數(shù)中攜帶cookie,也可以使用專門(mén)的cookies參數(shù)。cookie一般有過(guò)期時(shí)間,一旦過(guò)期需要重新獲取

cookies參數(shù)是一個(gè)字典形式:

cookies = {"cookie的name":"cookie的value"}

cookies參數(shù)的使用:

# 構(gòu)造cookies字典
cookies_str = '瀏覽器中復(fù)制的cookies字符串'
cookies_dict = {cookie.split('=')[0]: cookie.split('=')[-1] for cookie in cookies_str.split('; ')}
# 請(qǐng)求頭參數(shù)字典中攜帶cookie字符串
response = requests.get(url, headers=headers, cookies=cookies_dict)

3.cookieJar對(duì)象

使用requests獲取的resposne對(duì)象,具有cookies屬性。該屬性值是一個(gè)cookieJar類型,包含服務(wù)器設(shè)置在本地的cookie。

cookies操作

# 返回 RequestsCookieJar對(duì)象
cookies = response.cookies
# RequestsCookieJar 轉(zhuǎn) cookies字典
requests.utils.dict_from_cookiejar(cookies)
# cookies字典 轉(zhuǎn) RequestsCookieJar
requests.utils.cookiejar_from_dict()
# 對(duì)cookie進(jìn)行操作,把一個(gè)字典添加到cookiejar中
requests.utils.add_dict_to_cookiejar()

設(shè)置超時(shí)時(shí)間

使用timeout參數(shù)來(lái)設(shè)置請(qǐng)求的超時(shí)時(shí)間(秒)。

import requests
url = 'url'
# 設(shè)置超時(shí)時(shí)間,發(fā)送請(qǐng)求后,3秒鐘內(nèi)返回響應(yīng),否則就拋出異常
response = requests.get(url, timeout=3)

發(fā)送帶參數(shù)的請(qǐng)求

在url攜帶參數(shù)

import requests
# 目標(biāo)url
url = 'https://www.baidu.com/s?wd=java'
# 請(qǐng)求頭
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"}
# 向目標(biāo)url發(fā)送get請(qǐng)求
response = requests.get(url, headers=headers)
# 打印響應(yīng)內(nèi)容
print(response.content.decode())

通過(guò)params攜帶參數(shù)

構(gòu)建請(qǐng)求參數(shù)字典,向接口發(fā)送請(qǐng)求的時(shí)候帶上參數(shù)字典,參數(shù)字典設(shè)置給params

# 請(qǐng)求頭
import requests
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"}
url = 'https://www.baidu.com/s'
# 請(qǐng)求參數(shù) 字典
params = {'wd': 'java'}
# 向目標(biāo)url發(fā)送get請(qǐng)求
response = requests.get(url, headers=headers, params=params)
# 打印響應(yīng)內(nèi)容
print(response.content.decode())

proxy代理

概述

在Requests模塊中,可以使用代理服務(wù)器proxy來(lái)發(fā)送HTTP請(qǐng)求。代理可以在你和目標(biāo)服務(wù)器之間充當(dāng)中間人,用于在請(qǐng)求過(guò)程中轉(zhuǎn)發(fā)請(qǐng)求和響應(yīng)。使用代理有多種用途,例如隱藏真實(shí)的IP地址、繞過(guò)網(wǎng)絡(luò)限制等。

通過(guò)指定代理IP,可以讓代理服務(wù)器轉(zhuǎn)發(fā)發(fā)送請(qǐng)求。這種方式被稱為正向代理,它充當(dāng)了客戶端和目標(biāo)服務(wù)器之間的中間人,代理服務(wù)器接收來(lái)自客戶端的請(qǐng)求,并將其轉(zhuǎn)發(fā)給目標(biāo)服務(wù)器,然后將響應(yīng)返回給客戶端。

正向代理和反向代理區(qū)別:

1.正向代理

為發(fā)送請(qǐng)求的一方(瀏覽器或客戶端)轉(zhuǎn)發(fā)請(qǐng)求的,會(huì)知道最終處理請(qǐng)求的服務(wù)器的真實(shí)地址,例如VPN

2.反向代理

不為發(fā)送請(qǐng)求的一方(瀏覽器或客戶端)轉(zhuǎn)發(fā)請(qǐng)求、而是為最終處理請(qǐng)求的服務(wù)器轉(zhuǎn)發(fā)請(qǐng)求的,不會(huì)知道服務(wù)器的真實(shí)地址,例如nginx

代理分類

1.根據(jù)代理ip的匿名程度,代理IP可以分為三類:

1.透明代理(Transparent Proxy):

透明代理雖然可以直接隱藏你的IP地址,但是還是可以查到你是誰(shuí)。

目標(biāo)服務(wù)器接收到的請(qǐng)求頭如下:

REMOTE_ADDR = Proxy IP
HTTP_VIA = Proxy IP
HTTP_X_FORWARDED_FOR = Your IP

2.匿名代理(Anonymous Proxy):

使用匿名代理,別人只能知道你用了代理,無(wú)法知道你是誰(shuí)。

目標(biāo)服務(wù)器接收到的請(qǐng)求頭如下:

REMOTE_ADDR = proxy IP
HTTP_VIA = proxy IP
HTTP_X_FORWARDED_FOR = proxy IP

3.高匿代理(Elite proxy或High Anonymity Proxy):

高匿代理讓別人根本無(wú)法發(fā)現(xiàn)你是在用代理,所以是最好的選擇。毫無(wú)疑問(wèn)使用高匿代理效果最好。

目標(biāo)服務(wù)器接收到的請(qǐng)求頭如下:

REMOTE_ADDR = Proxy IP
HTTP_VIA = not determined
HTTP_X_FORWARDED_FOR = not determined

2.根據(jù)網(wǎng)站所使用的協(xié)議不同,需要使用相應(yīng)協(xié)議的代理服務(wù)

從代理服務(wù)請(qǐng)求使用的協(xié)議可以分為:

proxies代理參數(shù)的使用

為了讓服務(wù)器以為不是同一個(gè)客戶端在請(qǐng)求,為了防止頻繁向一個(gè)域名發(fā)送請(qǐng)求被封ip,所以需要使用代理ip

http代理:目標(biāo)url為http協(xié)議

https代理:目標(biāo)url為https協(xié)議

socks隧道代理,例如socks5代理:

  • socks 代理只是簡(jiǎn)單地傳遞數(shù)據(jù)包,不關(guān)心是何種應(yīng)用協(xié)議(FTP、HTTP和HTTPS等)
  • socks 代理比http、https代理耗時(shí)少
  • socks 代理可以轉(zhuǎn)發(fā)http和https的請(qǐng)求

注意:

如果proxies字典中包含有多個(gè)鍵值對(duì),發(fā)送請(qǐng)求時(shí)將按照url地址的協(xié)議來(lái)選擇使用相應(yīng)的代理ip

其他功能服務(wù)

忽略CA證書(shū)

瀏覽器訪問(wèn)某些網(wǎng)址時(shí),會(huì)提示:您的連接不是私密連接,這是因?yàn)榫W(wǎng)站的CA證書(shū)沒(méi)有經(jīng)過(guò)受信任的根證書(shū)頒發(fā)機(jī)構(gòu)的認(rèn)證。當(dāng)執(zhí)行請(qǐng)求時(shí),會(huì)拋出包含ssl.CertificateError等字樣的異常。

import requests
url = "url "
# 設(shè)置忽略證書(shū) verify參數(shù)設(shè)置為False表示不驗(yàn)證CA證書(shū)
response = requests.get(url,verify=False)

圖片下載

下載圖片時(shí),后綴名和請(qǐng)求的后綴名一致,必須使用response.content進(jìn)行保存文件

import requests
# 下載圖片地址
url = "https://pic.netbian.com/uploads/allimg/180826/113958-153525479855be.jpg"
# 發(fā)送請(qǐng)求獲取響應(yīng)
response = requests.get(url)
# 保存圖片
with open('image.png', 'wb') as f:
    f.write(response.content)

重試處理

retrying模塊可以通過(guò)裝飾器模式對(duì)某個(gè)函數(shù)進(jìn)行監(jiān)控,如果該函數(shù)引發(fā)異常就會(huì)觸發(fā)重試操作

安裝retrying模塊

pip install retrying
# 導(dǎo)入模塊
import time
import requests
# 使用第三方模塊 retrying 模塊
from retrying import retry
# 使用裝飾器進(jìn)行重試設(shè)置
# stop_max_attempt_number 表示重試次數(shù)
@retry(stop_max_attempt_number=3)
def test():
    print("Test 重試次數(shù)")
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36"
    }
    url = "http://127.0.0.1:8888"
    # 設(shè)置超時(shí)參數(shù)
    response = requests.get(url, headers=headers, timeout=1)
    return response.text
if __name__ == '__main__':
    try:
        html = test()
    except Exception as e:
        print(e)
    time.sleep(10)

Test 重試次數(shù)
Test 重試次數(shù)
Test 重試次數(shù)
HTTPConnectionPool(host='127.0.0.1', port=8888): Max retries exceeded with url: / (Caused by ConnectTimeoutError(<urllib3.connection.HTTPConnection object at 0x000001CF901742B0>, 'Connection to 127.0.0.1 timed out. (connect timeout=1)'))

session狀態(tài)保持

requests模塊中的Session類能夠自動(dòng)處理發(fā)送請(qǐng)求獲取響應(yīng)過(guò)程中產(chǎn)生的cookie,進(jìn)而達(dá)到狀態(tài)保持的目的。

session實(shí)例在請(qǐng)求一個(gè)網(wǎng)站后,對(duì)方服務(wù)器設(shè)置在本地的cookie會(huì)保存在session中,下一次再使用session請(qǐng)求對(duì)方服務(wù)器的時(shí)候,會(huì)帶上前一次的cookie

session對(duì)象發(fā)送get或post請(qǐng)求的參數(shù),與requests模塊發(fā)送請(qǐng)求的參數(shù)完全一致

# 實(shí)例化session對(duì)象
session = requests.session() 
# 一次請(qǐng)求
response = session.get(url, headers)
# 下一次請(qǐng)求
response = session.post(url, data)

以上就是深入了解Python中Requests庫(kù)的使用的詳細(xì)內(nèi)容,更多關(guān)于Python Requests庫(kù)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Python常見(jiàn)編碼和解碼技術(shù)詳解

    Python常見(jiàn)編碼和解碼技術(shù)詳解

    這篇文章詳細(xì)介紹了?Python?常見(jiàn)的編碼和解碼技術(shù),包括字符編碼(如?ASCII、UTF-8?等)、數(shù)據(jù)編碼(如?Base64、URL?編碼等)、文件編碼,通過(guò)代碼示例講解操作方法及錯(cuò)誤處理,還給出了常見(jiàn)編碼的選擇指南,強(qiáng)調(diào)掌握這些技術(shù)對(duì)編寫(xiě)程序很重要,需要的朋友可以參考下
    2025-01-01
  • Pandas數(shù)據(jù)集的合并與連接merge()方法

    Pandas數(shù)據(jù)集的合并與連接merge()方法

    Pandas數(shù)據(jù)集的合并與連接(merge())是數(shù)據(jù)處理過(guò)程中常用的操作之一,在使用Pandas進(jìn)行數(shù)據(jù)集合并時(shí),可以使用merge()函數(shù)將兩個(gè)或多個(gè)數(shù)據(jù)集按照指定的列進(jìn)行合并,本文就來(lái)介紹一下,感興趣的可以了解一下
    2023-11-11
  • Python Pandas對(duì)缺失值的處理方法

    Python Pandas對(duì)缺失值的處理方法

    這篇文章主要給大家介紹了關(guān)于Python Pandas對(duì)缺失值的處理方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用Python Pandas具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-09-09
  • Python設(shè)置Socket代理及實(shí)現(xiàn)遠(yuǎn)程攝像頭控制的例子

    Python設(shè)置Socket代理及實(shí)現(xiàn)遠(yuǎn)程攝像頭控制的例子

    這篇文章主要介紹了Python設(shè)置Socket代理及實(shí)現(xiàn)遠(yuǎn)程攝像頭控制的例子,皆是對(duì)socket模塊的實(shí)際運(yùn)用,需要的朋友可以參考下
    2015-11-11
  • python中eval與int的區(qū)別淺析

    python中eval與int的區(qū)別淺析

    這篇文章主要給大家介紹了關(guān)于python中eval與int的區(qū)別,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-08-08
  • 在Django的視圖中使用form對(duì)象的方法

    在Django的視圖中使用form對(duì)象的方法

    這篇文章主要介紹了在Django的視圖中使用form對(duì)象的方法,Django是Python豐富多彩的開(kāi)發(fā)框架中最具有人氣的一個(gè),需要的朋友可以參考下
    2015-07-07
  • Django序列化中SerializerMethodField的使用詳解

    Django序列化中SerializerMethodField的使用詳解

    這篇文章主要介紹了Django序列化中SerializerMethodField的使用,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2025-03-03
  • Django MEDIA的配置及用法詳解

    Django MEDIA的配置及用法詳解

    這篇文章主要介紹了Django MEDIA的配置及用法詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-07-07
  • python實(shí)現(xiàn)批量修改文件名

    python實(shí)現(xiàn)批量修改文件名

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)批量修改文件名,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-03-03
  • 一文詳解Python為什么要寫(xiě)__init__.py

    一文詳解Python為什么要寫(xiě)__init__.py

    這篇文章主要介紹了Python為什么要寫(xiě)__init__.py的相關(guān)資料,__init__.py文件可以包含包的初始化環(huán)境變量、公共接口、包的信息以及通過(guò)__all__變量控制模塊的公開(kāi)接口,需要的朋友可以參考下
    2025-03-03

最新評(píng)論