快捷導(dǎo)航

Python3中關(guān)于cookie的創(chuàng)建與保存

更新時(shí)間：2018年10月21日 09:54:25 作者：回憶不說(shuō)話(huà)

今天小編就為大家分享一篇關(guān)于Python3中關(guān)于cookie的創(chuàng)建與保存的文章，小編覺(jué)得內(nèi)容挺不錯(cuò)的，現(xiàn)在分享給大家，具有很好的參考價(jià)值，需要的朋友一起跟隨小編來(lái)看看吧

1.cookie的作用

cookie 是指某些網(wǎng)站為了辨別用戶(hù)身份、進(jìn)行session跟蹤而儲(chǔ)存在用戶(hù)本地終端上的數(shù)據(jù)，就像有些網(wǎng)站上的一些數(shù)據(jù)是需要登錄后才能看得到，那么想抓取某個(gè)頁(yè)面內(nèi)容，就需要用到cookie來(lái)模擬登陸了。

在用cookie模擬登陸的時(shí)候，需要用到python中的CookieJar，CookieJar中有一些子類(lèi)，例如：

FileCookieJar,LWPCookieJar,MoziliaCookieJar
CookieJar 管理http生成的cookie，負(fù)責(zé)cookie的存儲(chǔ)工作，向http當(dāng)中添加指定的cookie

MozillaCookieJar和LWPCookieJar類(lèi)都是FileCookieJar的子類(lèi)。實(shí)現(xiàn)了具體的把cookie內(nèi)容保存為文件的方法。只是這兩個(gè)類(lèi)對(duì)應(yīng)的標(biāo)準(zhǔn)不同而已。

2 獲取cookie

from http.cookiejar import CookieJar,LWPCookieJar
from urllib.request import Request,urlopen,HTTPCookieProcessor,build_opener
from urllib.parse import urlencode
import ssl
# ----------------------------------------獲取cookie---------------------------
# 生成一個(gè)管理cookie的對(duì)象
cookie_obj = CookieJar()
# 創(chuàng)建一個(gè)支持cookie的對(duì)象，對(duì)象屬于HTTPCookieProcessor
cookie_handler = HTTPCookieProcessor(cookie_obj)  
#創(chuàng)建一個(gè)opener
opener = build_opener(cookie_handler)  
response = opener.open('http://www.baidu.com')
print(response)
#打印cookie
for cookie in cookie_obj:
  print('key:',cookie.name)
  print('value:',cookie.value)

3 保存cookie的文件

from http.cookiejar import CookieJar,LWPCookieJar
from urllib.request import Request,urlopen,HTTPCookieProcessor,build_opener
filename = 'neihan.txt'
# 設(shè)置cookie保存的文件
cookie_obj = LWPCookieJar(filename=filename)
# 創(chuàng)建一個(gè)支持cookie的對(duì)象，對(duì)象屬于HTTPCookieProcessor
cookie_handler = HTTPCookieProcessor(cookie_obj)
#創(chuàng)建一個(gè)opener
opener = build_opener(cookie_handler)
#請(qǐng)求網(wǎng)頁(yè)
response = opener.open('http://www.neihanshequ.com')
# 保存cookie到指定的文件當(dāng)中去
# ignore_expires=True 即便目標(biāo)cookie已經(jīng)在文件中存在，仍然對(duì)其寫(xiě)入
# ignore_discard=True  即便cookie將要/已經(jīng)過(guò)期，仍然寫(xiě)入
cookie_obj.save(ignore_expires=True,ignore_discard=True)

4 使用本地的cookie進(jìn)行請(qǐng)求

from http.cookiejar import CookieJar,LWPCookieJar
from urllib.request import Request,urlopen,HTTPCookieProcessor,build_opener
cookie = LWPCookieJar()
#從文件中讀取cookie到變量
cookie.load('neihan.txt')
request = Request('http://www.neihanshequ.com')
# 創(chuàng)建一個(gè)支持cookie的對(duì)象，對(duì)象屬于HTTPCookieProcessor
cookie_handler = HTTPCookieProcessor(cookie)
#創(chuàng)建一個(gè)opener
opener = build_opener(cookie_handler)
#請(qǐng)求網(wǎng)頁(yè)
response = opener.open(request)
# print(response.read().decode())

5 使用cookie進(jìn)行模擬登陸

from http.cookiejar import CookieJar,LWPCookieJar
from urllib.request import Request,urlopen,HTTPCookieProcessor,build_opener
from urllib.parse import urlencode
import ssl
cookie = LWPCookieJar(filename='meishi.txt')
cookie_handler = HTTPCookieProcessor(cookie)
opener = build_opener(cookie_handler)
headers={
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:61.0) Gecko/20100101 Firefox/61.0'
}
post_url = 'https://i.meishi.cc/login.php?redirect=https%3A%2F%2Fi.meishi.cc%2Flogin.php%3Fac%3Dzhuce'
# urlencode對(duì)url當(dāng)中的參數(shù)進(jìn)行編碼
# urlencode()編碼的對(duì)象為字典類(lèi)型
post_data = urlencode({
  'username':'***********',  #自己的登陸賬號(hào)
  'password':'************'  #自己的登陸密碼
})
# 請(qǐng)求url 并傳參，設(shè)置編碼方式
request = Request(post_url,bytes(post_data,encoding='utf-8'))
# 解決證書(shū)問(wèn)題
ssl._create_default_https_context = ssl._create_unverified_context
response = opener.open(request)
print(response.read().decode())
cookie.save(ignore_discard=True,ignore_expires=True)

這里的post_url是抓包獲取來(lái)的

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了，希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接

您可能感興趣的文章: