欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

如何使用Python的Requests包實現(xiàn)模擬登陸

 更新時間:2018年04月27日 10:42:26   作者:春風(fēng)不及你的笑  
這篇文章主要為大家詳細介紹了使用Python的Requests包模擬登陸,具有一定的參考價值,感興趣的小伙伴們可以參考一下

前段時間喜歡用python去抓一些頁面玩,但都基本上都是用get請求一些頁面,再通過正則去過濾。

今天試了一下,模擬登陸個人網(wǎng)站。發(fā)現(xiàn)也比較簡單。讀懂本文需要對http協(xié)議和http會話有一定的理解。

注明:因為模擬登陸的是我的個人網(wǎng)站,所以以下代碼對個人網(wǎng)站和賬號密碼做了處理。

網(wǎng)站分析

爬蟲的必備第一步,分析目標(biāo)網(wǎng)站。這里使用谷歌瀏覽器的開發(fā)者者工具分析。

通過登陸抓取,看到這樣一個請求。

上方部分為請求頭,下面部分為請求是傳的參數(shù)。由圖片可以看出,頁面通過表單提交了三個參數(shù)。分別為_csrf,usermane,password。

其中csrf是為了預(yù)防跨域腳本偽造。原理很簡單,就是每一次請求,服務(wù)器生成一串加密字符串。放在隱藏的input表單中。再一次請求的時候,把這個字符串一起傳過去,為了驗證是否為同一個用戶的請求。

因此,我們的代碼邏輯就有了。首先請求一次登錄頁面。然后分析頁面,拿到csrf字符串。最后把這個字符串和賬號密碼一起傳給服務(wù)器用來登錄。

第一份代碼

#!/usr/bin/env python2.7
# -*- coding: utf-8 -*-

import requests
import re

# 頭部信息
headers = {
 'Host':"localhost",
 'Accept-Language':"zh-CN,zh;q=0.8",
 'Accept-Encoding':"gzip, deflate",
 'Content-Type':"application/x-www-form-urlencoded",
 'Connection':"keep-alive",
 'Referer':"http://localhost/login",
 'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36"
}

# 登陸方法
def login(url,csrf):
 data = {
 "_csrf" : csrf,
 "username": "xiedj",
 "password": "***"
 }

 response = requests.post(url, data=data, headers=headers)
 return response.content


# 第一次訪問獲取csrf值
def get_login_web(url):
 page = requests.get('http://localhost/login')
 reg = r'<meta name="csrf-token" content="(.+)">'
 csrf = re.findall(reg,page.content)[0]
 login_page = login(url,csrf)
 print login_page


if __name__ == "__main__":
 url = "http://localhost/login/checklogin"
 get_login_web(url)

代碼看起來好像沒有什么問題。然而執(zhí)行的時候出錯了。核查了一下,錯誤的原因是,csrf驗證失?。?/p>

再多次確認獲取的csrf和請求登錄的csrf字符串沒問題了之后,我想到了一個問題。
如果,大家還不知道錯誤原因的話,這里可以暫停思考一個問題?!胺?wù)器如何知道,第一次請求獲取csrf和第二次post登錄請求是同一個用戶?”

到這,應(yīng)該都清楚了,如果要登錄成功,需要解決如何讓服務(wù)相信兩次請求是同一個用戶。這里需要用到http會話(不清楚的可以自行百度,這里簡單介紹)。

http協(xié)議是一個種無狀態(tài)的協(xié)議。為了使這種無狀態(tài)變得有狀態(tài),因此引進了會話。簡單的講,通過session去記錄這個狀態(tài)。當(dāng)一個用戶第一次請求web服務(wù)的時候,服務(wù)器會生成一個session,用于保存這個用戶的信息。同時,在返回給用戶端時,把這個sessionID保存在cookies里。當(dāng)用戶再一次請求的時候,瀏覽器會把這個cookies帶上。因此在服務(wù)器端就能知道多次請求是否為同一個用戶。

因此我們的代碼,需要在第一次請求的時候拿到這個sessionID。第二次請求的時候把這個sessionID一起傳過去。而requests厲害的地方就是,一句簡單requests.Session(),就能使用這個會話對象。

第二份代碼

#!/usr/bin/env python2.7
# -*- coding: utf-8 -*-

import requests
import re

# 頭部信息
headers = {
 'Host':"localhost",
 'Accept-Language':"zh-CN,zh;q=0.8",
 'Accept-Encoding':"gzip, deflate",
 'Content-Type':"application/x-www-form-urlencoded",
 'Connection':"keep-alive",
 'Referer':"http://localhost/login",
 'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36"
}

# 登陸方法
def login(url,csrf,r_session):
 data = {
 "_csrf" : csrf,
 "username": "xiedj",
 "password": "***"
 }

 response = r_session.post(url, data=data, headers=headers)
 return response.content


# 第一次訪問獲取csrf值
def get_login_web(url):
 r_session = requests.Session()
 page = r_session.get('http://localhost/login')
 reg = r'<meta name="csrf-token" content="(.+)">'
 csrf = re.findall(reg,page.content)[0]


 login_page = login(url,csrf,r_session)
 print login_page


if __name__ == "__main__":
 url = "http://localhost/login/checklogin"
 get_login_web(url)

成功獲取登陸后的頁面

由代碼可以知道,requests.Session()啟動會話對象后,第二次請求會自動把上一次的sessionID一起傳過去。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • 機器學(xué)習(xí)10大經(jīng)典算法詳解

    機器學(xué)習(xí)10大經(jīng)典算法詳解

    這篇文章主要為大家詳細介紹了機器學(xué)習(xí)10大經(jīng)典算法,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2017-12-12
  • Pytorch神經(jīng)網(wǎng)絡(luò)參數(shù)管理方法詳細講解

    Pytorch神經(jīng)網(wǎng)絡(luò)參數(shù)管理方法詳細講解

    這篇文章主要介紹了Pytorch神經(jīng)網(wǎng)絡(luò)參數(shù)管理方法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧
    2023-05-05
  • python3 爬取圖片的實例代碼

    python3 爬取圖片的實例代碼

    這篇文章主要介紹了python3 爬取圖片的實例代碼,代碼簡單易懂,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下
    2018-11-11
  • Python實現(xiàn)

    Python實現(xiàn)"驗證回文串"的幾種方法

    這篇文章主要介紹了Python實現(xiàn)"驗證回文串"的幾種方法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-03-03
  • Python通過文本和圖片生成詞云圖

    Python通過文本和圖片生成詞云圖

    這篇文章主要介紹了Python通過文本和圖片生成詞云圖,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-05-05
  • Seaborn數(shù)據(jù)分析NBA球員信息數(shù)據(jù)集

    Seaborn數(shù)據(jù)分析NBA球員信息數(shù)據(jù)集

    這篇文章主要為大家介紹了Seaborn數(shù)據(jù)分析處理NBA球員信息數(shù)據(jù)集案例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-09-09
  • Python 根據(jù)數(shù)據(jù)模板創(chuàng)建shapefile的實現(xiàn)

    Python 根據(jù)數(shù)據(jù)模板創(chuàng)建shapefile的實現(xiàn)

    今天小編就為大家分享一篇Python 根據(jù)數(shù)據(jù)模板創(chuàng)建shapefile的實現(xiàn),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-11-11
  • Django之富文本(獲取內(nèi)容,設(shè)置內(nèi)容方式)

    Django之富文本(獲取內(nèi)容,設(shè)置內(nèi)容方式)

    這篇文章主要介紹了Django之富文本(獲取內(nèi)容,設(shè)置內(nèi)容方式),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-05-05
  • Python+Selenium實現(xiàn)讀取網(wǎng)易郵箱驗證碼

    Python+Selenium實現(xiàn)讀取網(wǎng)易郵箱驗證碼

    在自動化工作中,有可能會遇到一些發(fā)送郵箱驗證碼類似的功能。本文將利用Python?Selenium實現(xiàn)自動化讀取網(wǎng)易郵箱驗證碼,感興趣的可以了解一下
    2022-03-03
  • Python word文本自動化操作實現(xiàn)方法解析

    Python word文本自動化操作實現(xiàn)方法解析

    這篇文章主要介紹了Python word文本自動化操作實現(xiàn)方法解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-11-11

最新評論