Python中HTTP請(qǐng)求的全面指南
在現(xiàn)代網(wǎng)絡(luò)應(yīng)用中,HTTP(HyperText Transfer Protocol)協(xié)議是客戶(hù)端與服務(wù)器之間數(shù)據(jù)傳輸?shù)暮诵?。作為Python開(kāi)發(fā)者,了解和掌握如何發(fā)送和處理HTTP請(qǐng)求至關(guān)重要。無(wú)論你是開(kāi)發(fā)Web應(yīng)用、爬蟲(chóng),還是進(jìn)行API集成,本文都將從基礎(chǔ)到高級(jí),逐步引導(dǎo)你成為HTTP請(qǐng)求處理的高手。
一、HTTP請(qǐng)求基礎(chǔ)知識(shí)
HTTP是一種無(wú)狀態(tài)的應(yīng)用層協(xié)議,用于客戶(hù)端和服務(wù)器之間的數(shù)據(jù)傳輸。其主要特點(diǎn)包括請(qǐng)求-響應(yīng)模型、無(wú)狀態(tài)性以及對(duì)多種數(shù)據(jù)格式的支持。
- 請(qǐng)求-響應(yīng)模型:客戶(hù)端發(fā)送請(qǐng)求,服務(wù)器處理請(qǐng)求并返回響應(yīng)。
- 無(wú)狀態(tài):每個(gè)請(qǐng)求都是獨(dú)立的,服務(wù)器不會(huì)記住前一個(gè)請(qǐng)求的狀態(tài)。
- 支持多種數(shù)據(jù)格式:HTTP可以傳輸文本、圖像、視頻等多種類(lèi)型的數(shù)據(jù)。
一個(gè)HTTP請(qǐng)求由請(qǐng)求行、請(qǐng)求頭和請(qǐng)求體三部分組成:
- 請(qǐng)求行:包含請(qǐng)求方法(如GET、POST)、請(qǐng)求URL和HTTP版本。
- 請(qǐng)求頭:包含請(qǐng)求的附加信息,如瀏覽器類(lèi)型、接受的內(nèi)容類(lèi)型等。
- 請(qǐng)求體:可選部分,通常用于POST請(qǐng)求,包含要發(fā)送的數(shù)據(jù)。
一個(gè)HTTP響應(yīng)則包含狀態(tài)行、響應(yīng)頭和響應(yīng)體:
- 狀態(tài)行:包含HTTP版本、狀態(tài)碼(如200、404)和狀態(tài)信息。
- 響應(yīng)頭:包含響應(yīng)的附加信息,如內(nèi)容類(lèi)型、內(nèi)容長(zhǎng)度等。
- 響應(yīng)體:實(shí)際的響應(yīng)數(shù)據(jù),如HTML頁(yè)面、JSON數(shù)據(jù)等。
二、Python中的HTTP請(qǐng)求庫(kù)
Python提供了多個(gè)模塊和庫(kù)來(lái)處理HTTP請(qǐng)求和響應(yīng),其中最常用的庫(kù)是requests。requests庫(kù)功能強(qiáng)大且易于使用,是發(fā)送HTTP請(qǐng)求的流行選擇。
安裝requests庫(kù)
你可以使用pip命令來(lái)安裝requests庫(kù):
pip install requests
使用requests庫(kù)發(fā)送HTTP請(qǐng)求
requests庫(kù)提供了簡(jiǎn)單的API來(lái)發(fā)送HTTP請(qǐng)求,包括GET、POST、PUT、DELETE等常見(jiàn)方法。
GET請(qǐng)求
GET請(qǐng)求用于從服務(wù)器獲取數(shù)據(jù)。以下是一個(gè)簡(jiǎn)單的GET請(qǐng)求示例:
import requests response = requests.get('https://jsonplaceholder.typicode.com/posts') print(response.status_code) # 打印狀態(tài)碼 print(response.json()) # 打印返回的JSON數(shù)據(jù)
在這個(gè)例子中,我們發(fā)送了一個(gè)GET請(qǐng)求到https://jsonplaceholder.typicode.com/posts,并打印了響應(yīng)的狀態(tài)碼和JSON數(shù)據(jù)。
POST請(qǐng)求
POST請(qǐng)求用于向服務(wù)器發(fā)送數(shù)據(jù)。以下是一個(gè)簡(jiǎn)單的POST請(qǐng)求示例:
import requests data = {'title': 'foo', 'body': 'bar', 'userId': 1} response = requests.post('https://jsonplaceholder.typicode.com/posts', json=data) print(response.status_code) # 打印狀態(tài)碼 print(response.json()) # 打印返回的JSON數(shù)據(jù)
在這個(gè)例子中,我們發(fā)送了一個(gè)POST請(qǐng)求到https://jsonplaceholder.typicode.com/posts,并發(fā)送了包含標(biāo)題、正文和用戶(hù)ID的JSON數(shù)據(jù)。
PUT請(qǐng)求
PUT請(qǐng)求用于更新服務(wù)器上的資源。以下是一個(gè)簡(jiǎn)單的PUT請(qǐng)求示例:
import requests data = {'id': 1, 'title': 'updated title', 'body': 'updated body', 'userId': 1} response = requests.put('https://jsonplaceholder.typicode.com/posts/1', json=data) print(response.status_code) # 打印狀態(tài)碼 print(response.json()) # 打印返回的JSON數(shù)據(jù)
在這個(gè)例子中,我們發(fā)送了一個(gè)PUT請(qǐng)求到https://jsonplaceholder.typicode.com/posts/1,并更新了指定帖子的標(biāo)題、正文和用戶(hù)ID。
DELETE請(qǐng)求
DELETE請(qǐng)求用于刪除服務(wù)器上的資源。以下是一個(gè)簡(jiǎn)單的DELETE請(qǐng)求示例:
import requests response = requests.delete('https://jsonplaceholder.typicode.com/posts/1') print(response.status_code) # 打印狀態(tài)碼
在這個(gè)例子中,我們發(fā)送了一個(gè)DELETE請(qǐng)求到https://jsonplaceholder.typicode.com/posts/1,并刪除了指定帖子。
三、處理HTTP響應(yīng)
在處理HTTP響應(yīng)時(shí),我們通常需要獲取狀態(tài)碼、響應(yīng)頭和響應(yīng)體。
獲取狀態(tài)碼
狀態(tài)碼表示請(qǐng)求的處理結(jié)果,常見(jiàn)狀態(tài)碼包括:
- 200:請(qǐng)求成功。
- 404:請(qǐng)求的資源未找到。
- 500:服務(wù)器內(nèi)部錯(cuò)誤。
獲取狀態(tài)碼的示例:
response = requests.get('https://jsonplaceholder.typicode.com/posts') print(f"狀態(tài)碼: {response.status_code}")
獲取響應(yīng)頭
響應(yīng)頭包含服務(wù)器返回的附加信息,可以通過(guò)headers屬性獲?。?/p>
response = requests.get('https://jsonplaceholder.typicode.com/posts') print("響應(yīng)頭:") for key, value in response.headers.items(): print(f"{key}: {value}")
獲取響應(yīng)體
響應(yīng)體是實(shí)際的數(shù)據(jù)內(nèi)容,可以通過(guò)text或json()方法獲?。?/p>
response = requests.get('https://jsonplaceholder.typicode.com/posts') print("響應(yīng)體:") print(response.text) # 以字符串形式獲取 print(response.json()) # 以JSON格式獲取
四、高級(jí)技巧與實(shí)踐
除了基本的HTTP請(qǐng)求和響應(yīng)處理外,還有一些高級(jí)技巧和實(shí)踐可以幫助你更高效地發(fā)送和處理HTTP請(qǐng)求。
使用連接池
建立HTTP連接是一個(gè)耗時(shí)的操作,為了減少連接的開(kāi)銷(xiāo),你可以使用連接池來(lái)復(fù)用已有的連接。在requests庫(kù)中,你可以通過(guò)設(shè)置Session對(duì)象來(lái)啟用連接池。
import requests session = requests.Session() # 使用session發(fā)送多個(gè)請(qǐng)求 response1 = session.get('https://jsonplaceholder.typicode.com/posts/1') response2 = session.get('https://jsonplaceholder.typicode.com/posts/2') # 關(guān)閉session session.close()
設(shè)置請(qǐng)求頭
在發(fā)送HTTP請(qǐng)求時(shí),設(shè)置合適的請(qǐng)求頭信息是非常重要的。例如,設(shè)置User-Agent可以模擬不同的瀏覽器行為,設(shè)置Accept-Encoding可以支持壓縮以減少傳輸?shù)臄?shù)據(jù)量。
headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get('https://example.com', headers=headers)
處理Cookies和Session
如果需要保持會(huì)話(huà)狀態(tài)或進(jìn)行多次請(qǐng)求,建議使用requests.Session()來(lái)管理會(huì)話(huà),它會(huì)自動(dòng)處理Cookies的持久化和發(fā)送。
session = requests.Session() # 登錄并獲取cookies login_data = {'username': 'your_username', 'password': 'your_password'} response = session.post('https://example.com/login', data=login_data) # 使用session發(fā)送其他請(qǐng)求 response = session.get('https://example.com/protected_page')
錯(cuò)誤處理
檢查HTTP響應(yīng)狀態(tài)碼以確保請(qǐng)求成功。對(duì)于非200的響應(yīng),應(yīng)適當(dāng)處理錯(cuò)誤,并記錄詳細(xì)的錯(cuò)誤信息以便調(diào)試。
try: response = requests.get('https://example.com/nonexistent_page') response.raise_for_status() # 如果狀態(tài)碼不是200,則引發(fā)HTTPError異常 except requests.exceptions.HTTPError as errh: print("Http Error:", errh) except requests.exceptions.ConnectionError as errc: print("Error Connecting:", errc) except requests.exceptions.Timeout as errt: print("Timeout Error:", errt) except requests.exceptions.RequestException as err: print("OOps: Something Else", err)
設(shè)置超時(shí)時(shí)間
為了防止請(qǐng)求無(wú)限期地等待,應(yīng)設(shè)置合理的超時(shí)時(shí)間。這可以通過(guò)在請(qǐng)求中傳遞timeout參數(shù)來(lái)實(shí)現(xiàn)。
response = requests.get('https://example.com', timeout=5) # 設(shè)置超時(shí)時(shí)間為5秒
使用代理
有時(shí)候,由于網(wǎng)絡(luò)環(huán)境的限制,直接發(fā)起HTTP請(qǐng)求可能會(huì)遇到速度瓶頸。這時(shí),你可以考慮使用代理來(lái)繞過(guò)限制,提高請(qǐng)求速度。
proxies = { 'http': 'http://10.10.1.10:3128', 'https': 'http://10.10.1.10:3128' } response = requests.get('https://www.zdaye.com', proxies=proxies) print(response.text)
注意,代理服務(wù)器的URL格式通常為協(xié)議://地址:端口。如果你需要身份驗(yàn)證,可以在URL中包含用戶(hù)名和密碼,如http://user:password@proxy.server:port。
HTTP認(rèn)證
有些網(wǎng)站需要HTTP基本認(rèn)證才能訪(fǎng)問(wèn)。requests庫(kù)通過(guò)AuthBase類(lèi)及其子類(lèi)HTTPBasicAuth來(lái)處理這種情況。
from requests.auth import HTTPBasicAuth url = 'https://example.com/protected' username = 'your_username' password = 'your_password' response = requests.get(url, auth=HTTPBasicAuth(username, password)) print(response.text)
此外,requests庫(kù)還支持OAuth等更復(fù)雜的認(rèn)證機(jī)制,這通常需要通過(guò)第三方庫(kù)來(lái)實(shí)現(xiàn)。
五、高級(jí)功能與實(shí)踐
自定義請(qǐng)求頭
除了常見(jiàn)的User-Agent和Accept-Encoding之外,你還可以根據(jù)需要自定義其他請(qǐng)求頭。
headers = { 'User-Agent': 'Custom User Agent', 'Custom-Header': 'CustomHeaderValue', } response = requests.get('https://example.com', headers=headers) print(response.headers)
文件上傳
使用requests庫(kù)上傳文件非常簡(jiǎn)單。你只需要將文件對(duì)象作為文件字段的一部分傳遞給POST請(qǐng)求。
url = 'https://example.com/upload' files = {'file': open('example.txt', 'rb')} response = requests.post(url, files=files) print(response.text)
流式響應(yīng)
對(duì)于大文件或長(zhǎng)時(shí)間運(yùn)行的請(qǐng)求,你可能希望以流的方式處理響應(yīng)數(shù)據(jù),以避免將整個(gè)響應(yīng)內(nèi)容一次性加載到內(nèi)存中。
response = requests.get('https://example.com/largefile', stream=True) with open('largefile', 'wb') as f: for chunk in response.iter_content(chunk_size=8192): f.write(chunk)
處理重定向
requests庫(kù)默認(rèn)會(huì)自動(dòng)處理HTTP重定向。但如果你需要控制重定向的行為,可以通過(guò)設(shè)置allow_redirects參數(shù)來(lái)實(shí)現(xiàn)。
response = requests.get('https://example.com/redirect', allow_redirects=False) print(response.status_code) # 可能會(huì)是301或302 print(response.headers['Location']) # 重定向的目標(biāo)URL
SSL證書(shū)驗(yàn)證
默認(rèn)情況下,requests庫(kù)會(huì)驗(yàn)證SSL證書(shū)。但在某些情況下,你可能需要忽略SSL驗(yàn)證(例如,在測(cè)試環(huán)境中)。雖然不推薦在生產(chǎn)環(huán)境中這樣做,但你可以通過(guò)設(shè)置verify參數(shù)為False來(lái)實(shí)現(xiàn)。
response = requests.get('https://example.com', verify=False) print(response.text)
然而,更好的做法是指定一個(gè)CA證書(shū)文件來(lái)驗(yàn)證服務(wù)器的SSL證書(shū)。
response = requests.get('https://example.com', verify='/path/to/cacert.pem') print(response.text)
六、總結(jié)
本文全面介紹了如何在Python中使用requests庫(kù)發(fā)送和處理HTTP請(qǐng)求。從基礎(chǔ)知識(shí)到高級(jí)技巧,我們涵蓋了GET、POST、PUT、DELETE等常見(jiàn)請(qǐng)求方法,以及如何處理HTTP響應(yīng)、設(shè)置請(qǐng)求頭、管理Cookies和會(huì)話(huà)、處理錯(cuò)誤、設(shè)置超時(shí)時(shí)間、使用代理和進(jìn)行HTTP認(rèn)證等內(nèi)容。
以上就是Python中HTTP請(qǐng)求的全面指南的詳細(xì)內(nèi)容,更多關(guān)于Python HTTP請(qǐng)求的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
python selenium 彈出框處理的實(shí)現(xiàn)
這篇文章主要介紹了python selenium 彈出框處理的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-02-02selenium+python自動(dòng)化測(cè)試之頁(yè)面元素定位
這篇文章主要介紹了selenium+python自動(dòng)化測(cè)試之頁(yè)面元素定位,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-01-01OpenCV簡(jiǎn)單標(biāo)準(zhǔn)數(shù)字識(shí)別的完整實(shí)例
這篇文章主要給大家介紹了關(guān)于OpenCV簡(jiǎn)單標(biāo)準(zhǔn)數(shù)字識(shí)別的相關(guān)資料,要通過(guò)opencv 進(jìn)行數(shù)字識(shí)別離不開(kāi)訓(xùn)練庫(kù)的支持,需要對(duì)目標(biāo)圖片進(jìn)行大量的訓(xùn)練,才能做到精準(zhǔn)的識(shí)別出目標(biāo)數(shù)字,需要的朋友可以參考下2021-09-09Python 面向?qū)ο笾?lèi)class和對(duì)象基本用法示例
這篇文章主要介紹了Python 面向?qū)ο笾?lèi)class和對(duì)象基本用法,結(jié)合實(shí)例形式詳細(xì)分析了Python面向?qū)ο蟪绦蛟O(shè)計(jì)中類(lèi)class和對(duì)象基本概念、原理、使用方法與操作注意事項(xiàng),需要的朋友可以參考下2020-02-02Windows平臺(tái)Python連接sqlite3數(shù)據(jù)庫(kù)的方法分析
這篇文章主要介紹了Windows平臺(tái)Python連接sqlite3數(shù)據(jù)庫(kù)的方法,結(jié)合實(shí)例形式分析了Windows平臺(tái)安裝SQLite數(shù)據(jù)庫(kù)及創(chuàng)建、連接數(shù)據(jù)庫(kù)的實(shí)現(xiàn)方法與相關(guān)注意事項(xiàng),需要的朋友可以參考下2017-07-07python使用urllib模塊和pyquery實(shí)現(xiàn)阿里巴巴排名查詢(xún)
這篇文章主要介紹了python庫(kù)urllib及pyquery基本東西的應(yīng)用,實(shí)現(xiàn)阿里巴巴關(guān)鍵詞排名的查詢(xún),其中涉及到urllib代理的設(shè)置,pyquery對(duì)html文檔的解析2014-01-01Python使用lambda拋出異常實(shí)現(xiàn)方法解析
這篇文章主要介紹了Python使用lambda拋出異常實(shí)現(xiàn)方法解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-08-08keras分類(lèi)模型中的輸入數(shù)據(jù)與標(biāo)簽的維度實(shí)例
這篇文章主要介紹了keras分類(lèi)模型中的輸入數(shù)據(jù)與標(biāo)簽的維度實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-07-07