python中response.text 和response.content的區(qū)別詳解
1.response.text
- 類型:str
- 解碼類型: 根據(jù)HTTP 頭部對響應的編碼作出有根據(jù)的推測,推測的文本編碼
- 如何修改編碼方式:response.encoding=”gbk”
2. response.content
- 類型:bytes
- 解碼類型: 沒有指定
- 如何修改編碼方式:response.content.deocde(“utf-8”)
3.獲取網(wǎng)頁源碼的通用方式:
response.content.decode() response.content.decode(“GBK”)
解碼方式可以根據(jù)響應頭中找到Content-Type:text/html;charset=utf-8或者網(wǎng)頁源碼中content="text/html;charset=utf-8''來決定.
response.text
以上三種方法從前往后嘗試,能夠100%的解決所有網(wǎng)頁解碼的問題
所以:更推薦使用**response.content.deocde()**的方式獲取響應的html頁面
補充:python3中requests 常用response
看代碼吧~
import requests res = requests.get("http://127.0.0.1:9092") print(res.status_code) # 200 print(res.url) # http://127.0.0.1:9092/ print(res.headers) # {'Content-Type': 'application/json; charset=utf-8', 'Content-Length': '10', 'Date': 'Sat, 22 Dec 2018 13:36:16 GMT', 'Connection': 'keep-alive'} print(res.cookies) # <RequestsCookieJar[<Cookie cid=hello world for 127.0.0.1/>]> print(res.text) # 8248154254 print(res.content) # b'8248154254' 寫圖片 print(res.cookies['cid']) # hello world # 爬取 圖片 r1 = requests.get('https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1545496551516&di=8ed19596bc72aa87299ed7f234830128&imgtype=0&src=http%3A%2F%2Fimg5.duitang.com%2Fuploads%2Fitem%2F201107%2F31%2F20110731155631_htMcs.jpg') b = r1.content with open('hao.jpg','wb') as f: f.write(b)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python3自動簽到 定時任務 判斷節(jié)假日的實例
今天小編就為大家分享一篇Python3自動簽到 定時任務 判斷節(jié)假日的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-11-11Python操作MySQL數(shù)據(jù)庫的簡單步驟分享
這篇文章主要給大家介紹了關于Python操作MySQL數(shù)據(jù)庫的簡單步驟,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2021-04-04Python調(diào)用釘釘自定義機器人的實現(xiàn)
這篇文章主要介紹了Python調(diào)用釘釘自定義機器人的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-01-01python區(qū)分不同數(shù)據(jù)類型的方法
這篇文章主要介紹了python區(qū)分不同數(shù)據(jù)類型的方法實例以及相關知識點,需要的朋友們學習下。2019-10-10