欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python爬蟲(chóng)解決驗(yàn)證碼的思路及示例

 更新時(shí)間:2019年08月01日 09:48:31   作者:xiaozhanger  
這篇文章主要介紹了python爬蟲(chóng)解決驗(yàn)證碼的思路及示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

如果直接從生成驗(yàn)證碼的頁(yè)面把驗(yàn)證碼下載到本地后識(shí)別,再構(gòu)造表單數(shù)據(jù)發(fā)送的話,會(huì)有一個(gè)驗(yàn)證碼同步的問(wèn)題,即請(qǐng)求了兩次驗(yàn)證碼,而識(shí)別出來(lái)的驗(yàn)證碼并不是實(shí)際需要發(fā)送的驗(yàn)證碼。有如下幾種方法解決。

法1:

用session:

mysession = requests.Session()
login_url = 'http://xxx.com'
checkcode_url='http://yyy.com'
html = mysession.get(login_url,timeout=60*4)
#....balabala解析操作....
checkcode = mysession.get(checkcode_url,timeout=60*4)
with open('checkcode.png','wb') as f:
  f.write(checkcode.content)
 
#接下來(lái)balabala對(duì)圖像操作,可以用python的相關(guān)庫(kù)(識(shí)別率低,教務(wù)網(wǎng)的驗(yàn)證碼都?jí)騿埽?,也可以用云速等第三方?yàn)證碼識(shí)別網(wǎng)站提供的有償服務(wù)(識(shí)別度較高)
 
#再接下來(lái)構(gòu)造表單數(shù)據(jù)balabala

法2:

用cookie:

#綁定cookie
checkcode_url='http://yyy.com'
cookie = cookielib.CookieJar()
handler = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(handler)
 
#先讀取驗(yàn)證碼的url
picture = opener.open(checkcode_url).read()
 
#balabala圖像處理
 
# 生成post數(shù)據(jù) 
data = urllib.urlencode(postData)
# 構(gòu)造request請(qǐng)求
request = urllib2.Request(PostUrl, data, headers)
# 利用之前存有cookie的opener登錄頁(yè)面
try:
  response = opener.open(request)
  result = response.read()
except urllib2.HTTPError, e:
  print e.code

法3:

selenium+手動(dòng)構(gòu)造cookie: 該方法無(wú)需識(shí)別驗(yàn)證碼,本人尚未嘗試。

webdriver 操作 cookie 的方法有:

  • get_cookies() 獲得所有 cookie 信息
  • get_cookie(name) 返回特定 name 有 cookie 信息
  • add_cookie(cookie_dict) 添加 cookie,必須有 name 和 value 值
  • delete_cookie(name) 刪除特定(部分)的 cookie 信息
  • delete_all_cookies() 刪除所有 cookie 信息
....
#第一次訪問(wèn) xxx 網(wǎng)站
driver.get("http://xxx.com")
#將用戶(hù)名密碼寫(xiě)入瀏覽器 cookie
driver.add_cookie({'name':'username','value':'username'})
driver.add_cookie({'name':'password','value':'password'})
#再次訪問(wèn) xxx 網(wǎng)站,將會(huì)自動(dòng)登錄
driver.get("http://xxx.com")
time.sleep(5)
....
driver.quit()

這種方法難點(diǎn)在于確定該網(wǎng)站是用cookie中的什么key值來(lái)表示“用戶(hù)名”和“密碼”的。而且好像有些cookie是加密過(guò)的??梢韵扔胓et_cookies()進(jìn)行觀察。

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • python進(jìn)階教程之詞典、字典、dict

    python進(jìn)階教程之詞典、字典、dict

    這篇文章主要介紹了python進(jìn)階教程之詞典、字典、dict,說(shuō)了好幾個(gè)詞最官方的應(yīng)該是字典,英文dict,本文就是專(zhuān)注講解字典的,需要的朋友可以參考下
    2014-08-08
  • 只需7行Python代碼玩轉(zhuǎn)微信自動(dòng)聊天

    只需7行Python代碼玩轉(zhuǎn)微信自動(dòng)聊天

    今天小編就為大家分享一篇關(guān)于只需7行Python代碼玩轉(zhuǎn)微信自動(dòng)聊天,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧
    2019-01-01
  • PyQt5事件處理之定時(shí)在控件上顯示信息的代碼

    PyQt5事件處理之定時(shí)在控件上顯示信息的代碼

    這篇文章主要介紹了PyQt5事件處理之定時(shí)在控件上顯示信息的代碼,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-03-03
  • Python中splitlines()方法的使用簡(jiǎn)介

    Python中splitlines()方法的使用簡(jiǎn)介

    這篇文章主要介紹了Python中splitlines()方法的使用簡(jiǎn)介,是Python入門(mén)中的基礎(chǔ)知識(shí),需要的朋友可以參考下
    2015-05-05
  • Python pandas對(duì)excel的操作實(shí)現(xiàn)示例

    Python pandas對(duì)excel的操作實(shí)現(xiàn)示例

    這篇文章主要介紹了Python pandas對(duì)excel的操作實(shí)現(xiàn)示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-07-07
  • Python+Pygame實(shí)戰(zhàn)之英文版猜字游戲的實(shí)現(xiàn)

    Python+Pygame實(shí)戰(zhàn)之英文版猜字游戲的實(shí)現(xiàn)

    這篇文章主要為大家介紹了如何利用Python中的Pygame模塊實(shí)現(xiàn)英文版猜單詞游戲,文中的示例代碼講解詳細(xì),對(duì)我們學(xué)習(xí)Python游戲開(kāi)發(fā)有一定幫助,需要的可以參考一下
    2022-08-08
  • 淺析Python編寫(xiě)函數(shù)裝飾器

    淺析Python編寫(xiě)函數(shù)裝飾器

    這篇文章主要介紹了Python編寫(xiě)函數(shù)裝飾器的相關(guān)資料,需要的朋友可以參考下
    2016-03-03
  • python使用 zip 同時(shí)迭代多個(gè)序列示例

    python使用 zip 同時(shí)迭代多個(gè)序列示例

    這篇文章主要介紹了python使用 zip 同時(shí)迭代多個(gè)序列,結(jié)合實(shí)例形式分析了Python使用zip遍歷迭代長(zhǎng)度相等與不等的序列相關(guān)操作技巧,需要的朋友可以參考下
    2019-07-07
  • pip install命令安裝擴(kuò)展庫(kù)整理

    pip install命令安裝擴(kuò)展庫(kù)整理

    這篇文章主要介紹了pip install命令安裝擴(kuò)展庫(kù)整理,文中代碼和圖文講解的很詳細(xì),有需要的同學(xué)可以參考下
    2021-03-03
  • python 實(shí)現(xiàn)二維數(shù)組的索引、刪除、拼接操作

    python 實(shí)現(xiàn)二維數(shù)組的索引、刪除、拼接操作

    這篇文章主要介紹了python 實(shí)現(xiàn)二維數(shù)組的索引、刪除、拼接操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2021-05-05

最新評(píng)論