Python requests亂碼的五種解決辦法
更新時間:2024年04月19日 11:02:27 作者:小龍在山東
在Python中使用requests庫發(fā)送HTTP請求時,有時會遇到亂碼的問題,亂碼通常是由于編碼不一致或解碼錯誤導致的,這篇文章給大家介紹了Python requests亂碼的五種解決辦法,并通過代碼示例講解的非常詳細,需要的朋友可以參考下
使用requests模塊請求網(wǎng)頁內(nèi)容,經(jīng)常會出現(xiàn)亂碼,例如:
import requests
res = requests.get("https://www.baidu.com/")
print(res.text)

亂碼的原因是內(nèi)容編碼和解碼方式不一致導致的,解決辦法有以下幾種解決辦法:
第一種:apparent_encoding
import requests
res = requests.get("https://www.baidu.com/")
res.encoding = res.apparent_encoding
print(res.text)

第二種:content utf-8解碼
一種臨時性的解決辦法,不建議用這種方法,相當于寫死代碼了。
import requests
res = requests.get("https://www.baidu.com/")
try:
txt = res.content.decode('gbk')
except UnicodeDecodeError as e:
# print(e)
txt = res.content.decode('utf-8')
print(txt)

第三種:chardet
import requests
import chardet
res = requests.get("https://www.baidu.com/")
encoding = chardet.detect(res.content)['encoding']
print(res.content.decode(encoding))
第四種:cchardet
cchardet需要提前安裝一下:pip install cchardet。
import requests
import cchardet
res = requests.get("https://www.baidu.com/")
encoding = cchardet.detect(res.content)['encoding']
print(res.content.decode(encoding))
第五種:encode + decode
import requests
import cchardet
res = requests.get("https://www.baidu.com/")
res_encoding = res.encoding # 響應的編碼方式
con_encoding = cchardet.detect(res.content)['encoding'] # 內(nèi)容的編碼方式
print(res.text.encode(res_encoding).decode(con_encoding)) # 重新編解碼text
到此這篇關(guān)于Python requests亂碼的五種解決辦法的文章就介紹到這了,更多相關(guān)Python requests亂碼內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python使用pysmb庫訪問Windows共享文件夾的詳細教程
本教程旨在幫助您使用pysmb庫,通過SMB(Server Message Block)協(xié)議,輕松連接到Windows共享文件夾,并列舉其中的文件與文件夾,此外,我們還將簡要介紹如何下載和上傳文件,以及如何處理可能遇到的連接錯誤,需要的朋友可以參考下2024-12-12
Pandas庫中isnull函數(shù)的實現(xiàn)
isnull()是Pandas庫中DataFrame和Series對象的一個函數(shù),用于檢測數(shù)據(jù)中的缺失值,本文主要介紹了Pandas庫中isnull函數(shù)的實現(xiàn),具有一定參考價值,感興趣的可以了解一下2024-07-07

