欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python爬蟲實現(xiàn)驗證碼登錄代碼實例

 更新時間:2019年05月10日 11:09:40   作者:小迷妹大米姐  
這篇文章主要介紹了Python爬蟲實現(xiàn)驗證碼登錄,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

很多網(wǎng)站為了避免被惡意訪問,需要設(shè)置驗證碼登錄,避免非人類的訪問,Python爬蟲實現(xiàn)驗證碼登錄的原理則是先到登錄頁面將生成的驗證碼保存下來,然后人為輸入后,包裝后再POST給服務(wù)器,實現(xiàn)驗證,這里還涉及到了Cookie,其實Cookie保存在本地主機上,避免用戶重復輸入用戶名和密碼,在連接服務(wù)器的時候?qū)⒃L問連接和Cookie組裝起來POST給服務(wù)器。

這里涉及到了兩次向服務(wù)器POST,一次是Cookie,這里還自行設(shè)計想要Cookie的內(nèi)容,由于是要登錄,Cookie中存放的則是用戶名和密碼。第二次POST則是向服務(wù)器提交驗證。

這里用到Python3,主要用到的包是re  urllib.request   http.cookiejar

上代碼,借鑒了別人的代碼~~~

import re
import urllib.request
import http.cookiejar
#from http.comkie import CookieJar 上面那句和這句等同
 
loginurl='https://www.douban.com/accounts/login'
cookie = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor)#在已存的Cookie下建立連接
 
params={}
params['form_email']='用戶名'
params['form_password']='密碼'#這里寫上已有的用戶名和密碼
params['source']='http://www.douban.com/accounts/login'
 
#從首頁提交登陸
response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))#urllib.parse.urlencode(params).encode('utf-8')這個是向服務(wù)
#器POST的內(nèi)容,可以打印一下response.geturl()請求的連接看一下
#print(response.geturl()[0:33])
#驗證成功跳轉(zhuǎn)至登陸頁
if response.geturl()[0:33]=='https://accounts.douban.com/login':
    html = response.read().decode('utf-8')
    #print(html),可以先打印一下文件內(nèi)容,為了看到網(wǎng)頁元素更方便的寫正則,可以復制下來,在需要獲取的地方用(.+?)表示,然后用group()元組來取得,
    #驗證圖片地址
    imgurl=re.search('<img id="captcha_image" src="(.+?)" alt="captcha" class="captcha_image"/>',html)
    if imgurl:
       url=imgurl.group(1)
       #print(url)
       #將驗證碼以v.jpg保存在本地,在輸入驗證碼的時候可以手工輸入
       res=urllib.request.urlretrieve(url,'v.jpg')
       captcha = re.search('<input type="hidden" name="captcha-id" value="(.+?)"/>',html)
       #print(captcha.group(1))
       if captcha:
           vcode=input('請輸入圖片上的驗證碼:')
           params["captcha-solution"] = vcode
           params["captcha-id"] = captcha.group(1)#這個是動態(tài)生成的,需要從網(wǎng)頁中獲得
           params["user_login"] = "登錄"
           #提交驗證碼驗證
           response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))
           if response.geturl()=="https://www.douban.com/":
              print("login sucess")

以上所述是小編給大家介紹的Python爬蟲實現(xiàn)驗證碼登錄詳解整合,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!

相關(guān)文章

最新評論