快捷導(dǎo)航

解讀requests.session()獲取Cookies全過(guò)程

更新時(shí)間：2023年02月25日 09:28:49 作者：MicoJack Honey

這篇文章主要介紹了解讀requests.session()獲取Cookies全過(guò)程，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教

通過(guò)requests.session()查看默認(rèn)配置下請(qǐng)求頭

import requests

session = requests.session()

print("默認(rèn)配置下的請(qǐng)求頭：",session.headers.items())
# 默認(rèn)配置下的請(qǐng)求頭：
 ItemsView({'User-Agent': 'python-requests/2.21.0',
 'Accept-Encoding': 'gzip, deflate', 
 'Accept': '*/*',
 'Connection': 'keep-alive'})"

我們可以看到在默認(rèn)情況下，請(qǐng)求頭的內(nèi)容很機(jī)器，沒(méi)有靈性。

如果大家使用的IDE是Pycharm的話，ctrl+右鍵點(diǎn)擊session.headers的headers查看源碼。

得到如圖：

default_headers()

使用的是default_headers()（默認(rèn)請(qǐng)求頭），這里我們依然看不到print打印在終端的內(nèi)容，所以繼續(xù)ctrl+右擊點(diǎn)擊default_headers()。

得到如圖：

進(jìn)入default_headers()

OK! But it’s not over，這里我們還有User-Agent的value沒(méi)有看到，但是經(jīng)過(guò)猜測(cè)我們不難得到default_user_agent()的內(nèi)容就是python-requests/2.21.0。

包裝請(qǐng)求頭，讓他看起來(lái)更帥氣

首先，了解對(duì)headers進(jìn)行一個(gè)簡(jiǎn)單的增刪改查操作

刪改查

包裝

包裝Headers

包裝我們的Headers

方式一

headers = {
            'Origin': 'https://***.com',
            'Host': '***.com',
            'Referer': 'https://**.com/,
            'User-Agent': 'Mozilla/5.0',
        }
session.headers.update(headers)#字典的更新方法

方式二

換一種大家都在用的方式，在請(qǐng)求的時(shí)候添加headers參數(shù)即可：

response = session.get(url, headers=headers)

驗(yàn)證兩種方式是否得到的效果一樣

第一種方式

one

第二種方式

two

結(jié)論：兩種方式在response端看到的效果等同，區(qū)別在于第一種方式session是永久的，而第二種常用的方式只是在請(qǐng)求的時(shí)候攜帶過(guò)去的，所以當(dāng)我們查看session的時(shí)候?yàn)榭?，那么這就有一個(gè)問(wèn)題，我們?cè)诤罄m(xù)的請(qǐng)求中任然需要帶上headers=這個(gè)參數(shù)，似乎它并沒(méi)有那么好？

這是在github上copy 的部分爬蟲代碼如下：

github