Python實現(xiàn)滑塊驗證碼詳解
本節(jié)要講解如下圖所示的滑塊驗證碼(更為復雜的滑動拼圖驗證碼在下一篇介紹)。這種驗證碼機制比較簡單:將滑塊拖動到滑軌的最右端即可完成驗證,如下圖所示。如果未將滑塊拖動到滑軌的最右端,則無法通過驗證,驗證失敗后滑塊會回到起始位置。

其中的關(guān)鍵是需要用Selenium庫模擬鼠標拖動滑塊滑動一定的距離。因為滑塊的起始位置和滑軌的起始位置相同,所以滑塊需要移動的距離等于滑軌的跨度減去滑塊的寬度。下面就來利用開發(fā)者工具查看滑軌和滑塊的寬度。
在瀏覽器中打開本書配套代碼文件中為滑塊驗證碼搭建的本地網(wǎng)頁文件“index.html”,打開開發(fā)者工具,然后用元素選擇按鈕選中整個滑軌,此時的界面如下圖所示??梢钥吹狡渲酗@示了滑軌的尺寸和顏色等屬性。要查看滑軌的尺寸,有兩種方法:圖中箭頭所示。

滑塊寬度的查看方法和滑軌相同,用元素選擇工具選中滑塊,可以看到滑塊的寬度。由此可知需要模擬滑動的距離為260像素。

下圖開始編寫代碼。首先用Selenium庫打開網(wǎng)頁,代碼如下:
from selenium import webdriver browser = webdriver.Chrome() url = r'D:\works\python_crawl1\《Python爬蟲(進階與進通)》代碼匯總\2.驗證碼反爬\3.滑塊驗證碼\index.html' browser.get(url) #用模擬瀏覽器打開網(wǎng)頁
然后用Selenium定位滑塊,代碼如下:
huakuai = browser.find_element_by_xpath('//*[@id="code-box"]/span')
定位到滑塊后,就可以準備拖動滑塊了。在拖動過程中要保持鼠標為按下狀態(tài),不能過早松開鼠標,所以不能使用click()函數(shù)。Selenium庫提供了一個ActionChains模塊,其中的click_and_hold()函數(shù)可以使鼠標保持按下狀態(tài),release()函數(shù)可以松開鼠標,move_by_offset()函數(shù)可以使鼠標移動。結(jié)合使用這些函數(shù)即可將滑塊拖動一定距離,代碼如下:
action = webdriver.ActionChains(browser) # 啟動動作鏈 action.click_and_hold(huakuai).perform() #按住滑塊 action.move_by_offset(260,0) #移動滑塊,其中的260是之前計算出來的需要滑動的距離 action.release().perform() #釋放滑塊
完整代碼如下,其中還用time庫的sleep()函數(shù)在模擬滑動前等待兩秒,以便觀察滑動效果。
from selenium import webdriver
import time
# 1.訪問網(wǎng)址
browser = webdriver.Chrome()
url = r'D:\works\python_crawl1\《Python爬蟲(進階與進通)》代碼匯總\2.驗證碼反爬\3.滑塊驗證碼\index.html'
browser.get(url) #用模擬瀏覽器打開網(wǎng)頁
# 2.定位滑塊
huakuai = browser.find_element_by_xpath('//*[@id="code-box"]/span')
# 3.開始滑動
action = webdriver.ActionChains(browser) # 啟動動作鏈
action.click_and_hold(huakuai).perform() #按住滑塊
time.sleep(2)
action.move_by_offset(260,0) #移動滑塊,其中的260是之前計算出來的需要滑動的距離
action.release().perform() #釋放滑塊
最終運行結(jié)果如下圖所示,模擬滑塊成功。

需要注意的是,現(xiàn)在有一些含有滑塊驗證碼的網(wǎng)頁會檢測當前瀏覽器是否為Selenium庫的webdriver模擬瀏覽器,如果是的話,便很難模擬滑動成功。這種反爬機制已經(jīng)不是驗證碼反爬,而是webdriver反爬,處理起來比較困難。這里有一個討巧的解決方法:如果登錄階段需要進行滑動驗證(如淘寶的登錄),那么可以在代碼中用time.sleep()等待一段時間,在這段時間內(nèi)用其他方式手動登錄,如手動掃碼登錄,登錄成功后再用Selenium庫繼續(xù)爬取。
到此這篇關(guān)于Python實現(xiàn)滑塊驗證碼詳解的文章就介紹到這了,更多相關(guān)Python滑塊驗證碼內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python configparser模塊應(yīng)用過程解析
這篇文章主要介紹了Python configparser模塊應(yīng)用過程解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2020-08-08
淺談Python類里的__init__方法函數(shù),Python類的構(gòu)造函數(shù)
下面小編就為大家?guī)硪黄獪\談Python類里的__init__方法函數(shù),Python類的構(gòu)造函數(shù)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2016-12-12

