Python實(shí)現(xiàn)滑塊驗(yàn)證碼詳解
本節(jié)要講解如下圖所示的滑塊驗(yàn)證碼(更為復(fù)雜的滑動(dòng)拼圖驗(yàn)證碼在下一篇介紹)。這種驗(yàn)證碼機(jī)制比較簡(jiǎn)單:將滑塊拖動(dòng)到滑軌的最右端即可完成驗(yàn)證,如下圖所示。如果未將滑塊拖動(dòng)到滑軌的最右端,則無(wú)法通過(guò)驗(yàn)證,驗(yàn)證失敗后滑塊會(huì)回到起始位置。
其中的關(guān)鍵是需要用Selenium庫(kù)模擬鼠標(biāo)拖動(dòng)滑塊滑動(dòng)一定的距離。因?yàn)榛瑝K的起始位置和滑軌的起始位置相同,所以滑塊需要移動(dòng)的距離等于滑軌的跨度減去滑塊的寬度。下面就來(lái)利用開(kāi)發(fā)者工具查看滑軌和滑塊的寬度。
在瀏覽器中打開(kāi)本書(shū)配套代碼文件中為滑塊驗(yàn)證碼搭建的本地網(wǎng)頁(yè)文件“index.html”,打開(kāi)開(kāi)發(fā)者工具,然后用元素選擇按鈕選中整個(gè)滑軌,此時(shí)的界面如下圖所示。可以看到其中顯示了滑軌的尺寸和顏色等屬性。要查看滑軌的尺寸,有兩種方法:圖中箭頭所示。
滑塊寬度的查看方法和滑軌相同,用元素選擇工具選中滑塊,可以看到滑塊的寬度。由此可知需要模擬滑動(dòng)的距離為260像素。
下圖開(kāi)始編寫(xiě)代碼。首先用Selenium庫(kù)打開(kāi)網(wǎng)頁(yè),代碼如下:
from selenium import webdriver browser = webdriver.Chrome() url = r'D:\works\python_crawl1\《Python爬蟲(chóng)(進(jìn)階與進(jìn)通)》代碼匯總\2.驗(yàn)證碼反爬\3.滑塊驗(yàn)證碼\index.html' browser.get(url) #用模擬瀏覽器打開(kāi)網(wǎng)頁(yè)
然后用Selenium定位滑塊,代碼如下:
huakuai = browser.find_element_by_xpath('//*[@id="code-box"]/span')
定位到滑塊后,就可以準(zhǔn)備拖動(dòng)滑塊了。在拖動(dòng)過(guò)程中要保持鼠標(biāo)為按下?tīng)顟B(tài),不能過(guò)早松開(kāi)鼠標(biāo),所以不能使用click()函數(shù)。Selenium庫(kù)提供了一個(gè)ActionChains模塊,其中的click_and_hold()函數(shù)可以使鼠標(biāo)保持按下?tīng)顟B(tài),release()函數(shù)可以松開(kāi)鼠標(biāo),move_by_offset()函數(shù)可以使鼠標(biāo)移動(dòng)。結(jié)合使用這些函數(shù)即可將滑塊拖動(dòng)一定距離,代碼如下:
action = webdriver.ActionChains(browser) # 啟動(dòng)動(dòng)作鏈 action.click_and_hold(huakuai).perform() #按住滑塊 action.move_by_offset(260,0) #移動(dòng)滑塊,其中的260是之前計(jì)算出來(lái)的需要滑動(dòng)的距離 action.release().perform() #釋放滑塊
完整代碼如下,其中還用time庫(kù)的sleep()函數(shù)在模擬滑動(dòng)前等待兩秒,以便觀察滑動(dòng)效果。
from selenium import webdriver import time # 1.訪問(wèn)網(wǎng)址 browser = webdriver.Chrome() url = r'D:\works\python_crawl1\《Python爬蟲(chóng)(進(jìn)階與進(jìn)通)》代碼匯總\2.驗(yàn)證碼反爬\3.滑塊驗(yàn)證碼\index.html' browser.get(url) #用模擬瀏覽器打開(kāi)網(wǎng)頁(yè) # 2.定位滑塊 huakuai = browser.find_element_by_xpath('//*[@id="code-box"]/span') # 3.開(kāi)始滑動(dòng) action = webdriver.ActionChains(browser) # 啟動(dòng)動(dòng)作鏈 action.click_and_hold(huakuai).perform() #按住滑塊 time.sleep(2) action.move_by_offset(260,0) #移動(dòng)滑塊,其中的260是之前計(jì)算出來(lái)的需要滑動(dòng)的距離 action.release().perform() #釋放滑塊
最終運(yùn)行結(jié)果如下圖所示,模擬滑塊成功。
需要注意的是,現(xiàn)在有一些含有滑塊驗(yàn)證碼的網(wǎng)頁(yè)會(huì)檢測(cè)當(dāng)前瀏覽器是否為Selenium庫(kù)的webdriver模擬瀏覽器,如果是的話,便很難模擬滑動(dòng)成功。這種反爬機(jī)制已經(jīng)不是驗(yàn)證碼反爬,而是webdriver反爬,處理起來(lái)比較困難。這里有一個(gè)討巧的解決方法:如果登錄階段需要進(jìn)行滑動(dòng)驗(yàn)證(如淘寶的登錄),那么可以在代碼中用time.sleep()等待一段時(shí)間,在這段時(shí)間內(nèi)用其他方式手動(dòng)登錄,如手動(dòng)掃碼登錄,登錄成功后再用Selenium庫(kù)繼續(xù)爬取。
到此這篇關(guān)于Python實(shí)現(xiàn)滑塊驗(yàn)證碼詳解的文章就介紹到這了,更多相關(guān)Python滑塊驗(yàn)證碼內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Pandas+openpyxl進(jìn)行Excel處理詳解
這篇文章主要為大家詳細(xì)介紹了如何使用pandas和openpyxl庫(kù)對(duì)多個(gè)Excel文件進(jìn)行多種處理的方法,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解下2025-02-02Python爬蟲(chóng)與防反爬蟲(chóng)策略從入門(mén)到實(shí)戰(zhàn)
本文將從基礎(chǔ)的爬蟲(chóng)原理和庫(kù)介紹開(kāi)始,逐步深入,通過(guò)實(shí)際示例代碼,帶領(lǐng)讀者學(xué)習(xí)Python爬蟲(chóng)的使用和技巧,掌握從簡(jiǎn)單到復(fù)雜的爬蟲(chóng)實(shí)現(xiàn)2024-01-01Python configparser模塊應(yīng)用過(guò)程解析
這篇文章主要介紹了Python configparser模塊應(yīng)用過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-08-08python函數(shù)超時(shí)自動(dòng)退出的實(shí)操方法
在本篇文章里小編給大家整理的是一篇關(guān)于python函數(shù)超時(shí)自動(dòng)退出的實(shí)操方法,有需要的朋友們可以學(xué)習(xí)下。2020-12-12淺談Python類(lèi)里的__init__方法函數(shù),Python類(lèi)的構(gòu)造函數(shù)
下面小編就為大家?guī)?lái)一篇淺談Python類(lèi)里的__init__方法函數(shù),Python類(lèi)的構(gòu)造函數(shù)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2016-12-12