欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

利用selenium 3.7和python3添加cookie模擬登陸的實現(xiàn)

 更新時間:2017年11月20日 09:24:01   作者:地球守衛(wèi)者  
這篇文章主要給大家介紹了關于利用selenium 3.7和python3添加cookie模擬登陸的相關資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用python具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧。

前言

隨著Python3的普及,Selenium3也跟上了行程。而Selenium3最大的變化是去掉了Selenium RC,另外就是Webdriver從各自瀏覽器中脫離,必須單獨下載。本文就來介紹了關于selenium 3.7+python3實現(xiàn)添加cookie模擬登陸的相關內(nèi)容,分享出來供大家參考學習,下面話不多說了,來一起看看詳細的介紹吧。

一、背景介紹

最近做一個爬蟲項目,用selenium調(diào)用瀏覽器去獲取渲染后的源碼,但是每次登陸都需要手機驗證,這真的是頭痛啊,這種驗證方式不要想著去破解,還是老老實實用手機收驗證碼去吧!反正我是不知道這種驗證方式還能破解!難道就沒有其他辦法了嗎?

有,那就是模擬登陸!這樣最起碼不用沒測試一次就登陸驗證一次。

這里要說一下的就是,網(wǎng)上很多關于webdriver 添加cookie的教程,基本百分之80都是有問題的。反正我是找了N多的帖子都沒有一個是正確的。

二、  添加cookie方法:driver.add_cookie()

1.add_cookie(cookie_dict)方法里面參數(shù)是cookie_dict,說明里面參數(shù)是字典類型。

2.add_cookie源碼。

從源碼中我們可以看出,add_cookie方法接受一個字典,字典中包含name,value,path,domain,secure,expiry,但是這個源碼容易誤導人,那就是cookie參數(shù)沒有給全。

網(wǎng)上很多教程給的代碼cookie參數(shù)是沒給夠的,根本就跑不起來。

3. add_cookie接收的字典格式?!?/p>

正確的格式:

cookie = {
 # "domain": ".58.com", #Firefox瀏覽器不能寫domain,如果寫了會報錯,谷歌需要寫否則也是報錯,這里就是一個坑。其他瀏覽器沒測試不知道情況。
 'name': name,
 'value': value,
 "expires": "",
 'path': '/',
 'httpOnly': False,
 'HostOnly': False,
 'Secure': False,

}
  • name:cookie的名稱
  • value:cookie對應的值,動態(tài)生成的
  • domain:服務器域名
  • expiry:Cookie有效終止日期
  • path:Path屬性定義了Web服務器上哪些路徑下的頁面可獲取服務器設置的Cookie
  • httpOnly:防腳本攻擊
  • secure:在Cookie中標記該變量,表明只有當瀏覽器和Web Server之間的通信協(xié)議為加密認證協(xié)議時

為什么要構(gòu)造成這樣子,其實我們看下瀏覽器保存的cookie格式就明白了。下圖就是谷歌瀏覽器的cookie 的截圖。

三 ,我們舉個例子看下是否真的寫成功了:


 第一次訪問的的時候去獲取名字叫hello的cookie 是沒有的,add_cookie后再去訪問,第二次訪問就拿到了hello。說明已經(jīng)寫進去了。

 四、項目實戰(zhàn)。

能不能用?好不好用?怎么用?,用項目來說話,模擬登陸百度。!

目標:

  1.手動登錄一次后,只要在cookie 有效期內(nèi)無需重復登錄。

  2.訪問瀏覽記錄。

示例代碼

#!coding=utf-8
import time
from selenium import webdriver
import pickle
 
class BaiduSpider(object):
 def __init__(self,username,password):
  self.username = username
  self.password = password
  self.driver = webdriver.Chrome()
  self.driver.get(url='http://www.baidu.com')
  self.set_cookie()
  self.is_login()
 def is_login(self):
  '''判斷當前是否登陸'''
  self.driver.refresh()
  html = self.driver.page_source
  if html.find(self.username) == -1: #利用用戶名判斷是否登陸
   # 沒登錄 ,則手動登錄
   self.login()
  else:
   #已經(jīng)登錄 嘗試訪問搜索記錄,可以正常訪問
   self.driver.get(url='http://i.baidu.com/my/history')
   time.sleep(30) # 延時看效果
 
 def login(self):
  '''登陸'''
  time.sleep(60) #等待手動登錄
  self.driver.refresh()
  self.save_cookie()
 
 def save_cookie(self):
  '''保存cookie'''
  # 將cookie序列化保存下來
  pickle.dump(self.driver.get_cookies(), open("cookies.pkl", "wb"))
 
 def set_cookie(self):
  '''往瀏覽器添加cookie'''
  '''利用pickle序列化后的cookie'''
  try:
   cookies = pickle.load(open("cookies.pkl", "rb"))
   for cookie in cookies:
    cookie_dict = {
     "domain": ".baidu.com", # 火狐瀏覽器不用填寫,谷歌要需要
     'name': cookie.get('name'),
     'value': cookie.get('value'),
     "expires": "",
     'path': '/',
     'httpOnly': False,
     'HostOnly': False,
     'Secure': False}
    self.driver.add_cookie(cookie_dict)
  except Exception as e:
   print(e)
 
 
if __name__ == '__main__':
 
 BaiduSpider('usename','!!!!') # 你的百度賬號,密碼

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。

相關文章

  • Python趣味爬蟲之爬取愛奇藝熱門電影

    Python趣味爬蟲之爬取愛奇藝熱門電影

    好久沒帶大家實現(xiàn)Python爬蟲了,文中有非常詳細的代碼示例,對不會爬蟲的小伙伴們很有幫助哦,需要的朋友可以參考下
    2021-06-06
  • 利用Python制作一個MOOC公開課下載器

    利用Python制作一個MOOC公開課下載器

    為了幫助大家更好地在假期內(nèi)卷,本文將利用Python制作一個中國大學MOOC的公開課下載器。文中的示例代碼講解詳細,感興趣的小伙伴可以學習一下
    2022-03-03
  • 探索Python3.4中新引入的asyncio模塊

    探索Python3.4中新引入的asyncio模塊

    這篇文章主要介紹了Python3.4中新引入的asyncio模塊,包括其對端口和服務器等的操作,需要的朋友可以參考下
    2015-04-04
  • Python利用txt文件對Mysql進行增刪改查移

    Python利用txt文件對Mysql進行增刪改查移

    這篇文章主要介紹了如何在Python中利用TXT文件對Mysql中的記錄進行增刪改查移,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學習學習
    2021-12-12
  • Python中re正則匹配數(shù)據(jù)的實現(xiàn)

    Python中re正則匹配數(shù)據(jù)的實現(xiàn)

    在Python中,可以使用re模塊來使用正則表達式,本文主要介紹了Python中re正則匹配數(shù)據(jù)的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2024-04-04
  • 利用PyCharm操作Github(倉庫新建、更新,代碼回滾)

    利用PyCharm操作Github(倉庫新建、更新,代碼回滾)

    這篇文章主要介紹了利用PyCharm操作Github(倉庫新建、更新,代碼回滾),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-12-12
  • 最新評論