欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python Selenium破解滑塊驗證碼最新版(GEETEST95%以上通過率)

 更新時間:2021年01月29日 12:05:52   作者:PANDA  
這篇文章主要介紹了Python Selenium破解滑塊驗證碼最新版(GEETEST95%以上通過率),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

一、滑塊驗證碼簡述

       有爬蟲,自然就有反爬蟲,就像病毒和殺毒軟件一樣,有攻就有防,兩者彼此推進發(fā)展。而目前最流行的反爬技術驗證碼,為了防止爬蟲自動注冊,批量生成垃圾賬號,幾乎所有網站的注冊頁面都會用到驗證碼技術。其實驗證碼的英文為 CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart),翻譯成中文就是全自動區(qū)分計算機和人類的公開圖靈測試,它是一種可以區(qū)分用戶是計算機還是人的測試,只要能通過 CAPTCHA 測試,該用戶就可以被認為是人類。由此也可知道破解滑塊驗證碼的關鍵即是讓計算機更好的模擬人的行為,這也是破解的難點所在。

二、環(huán)境配置

1.安裝

selenium 支持 python2.7 以及 python3.5 等主流 python 版本,其安裝較為簡單,有網的環(huán)境下,打開cmd輸入即可自動安裝:

pip install selenium

2.webdriver

selenium 安裝完成后,下載所選瀏覽器的 webdriver,本文以 ChromeDriver為例,下載解壓后切記將.exe文件放入對應Python應用程序的同級目錄下,以確保將 webdriver 的路徑添加至系統(tǒng) PATH 變量中。同時還需將.exe文件放入Chrome應用程序的同級目錄下,注意下載的ChromeDriver版本需與Chrome瀏覽器版本對應才可使用。ChromeDriver下載地址

3.相關庫與模板

#圖像處理標準庫
from PIL import Image  
#web測試
from selenium import webdriver
#鼠標操作
from selenium.webdriver.common.action_chains import ActionChains
#等待時間 產生隨機數 
import time,random

三、破解步驟

本文以春秋官網為例:

  • 保存滑塊驗證碼原圖到本地。
  • 利用selenium進入滑塊驗證碼頁面,截取所需頁面圖片。
  • 通過圖片像素對比分析獲取缺口位置與滑塊移動距離。
  • 機器模擬人工滑動軌跡。

四、代碼實現(xiàn)

首先通過selenium對網頁元素爬取進入滑塊驗證碼頁面

#打開頁面至屏幕最大尺寸
driver = webdriver.Chrome()
driver.get('https://account.ch.com/NonRegistrations-Regist')
driver.maximize_window()
#獲取輸入手機號碼的表單
input1 = driver.find_element_by_name('phoneNumberInput')
# 輸入注冊號碼
input1.send_keys(phoneNumber)
time.sleep(0.2)
#獲取打開滑塊驗證碼頁面的元素
getcheck=driver.find_element_by_id('getDynamicPwd')
#點擊進入滑塊驗證碼頁面
getcheck.click()

如圖1

上周國內最大的驗證碼平臺極驗(GEETEST)進行了滑塊驗證碼更新,向反爬蟲又邁進了一步,新浪、斗魚等使用極驗驗證碼的各大網站頁也隨之更新,當然春秋也不例外,此次更新顯然是針對了破解滑塊驗證碼的關鍵痛點,在此之前點擊獲取驗證碼,出現(xiàn)滑塊驗證碼界面之后并不會直接出現(xiàn)滑塊,此時可對屏幕進行截圖,當點擊滑動圓球之后才會出現(xiàn)滑塊與缺口,此時再次進行截圖,即可根據兩次截圖的像素RGB值逐一遍歷,找到缺口位置。但更新之后點擊獲取驗證碼,直接會出現(xiàn)滑塊與缺口,如圖1所見。問題來了,現(xiàn)在沒有原圖作為參照,怎么找到缺口位置呢???仔細一想,其實這個問題并不難,無非就是需要一張原圖作為參照,經過觀察發(fā)現(xiàn)每個網站的驗證碼背景圖片不過區(qū)區(qū)幾張,那么我們可以考慮通過人工滑動滑塊,在成功拼圖后出現(xiàn)完整原圖的那一瞬間進行屏幕截圖,將原圖逐一截圖保存至本地,再通過缺口圖片與本地保存的原圖進行像素RGB值匹配,原圖豈不速速現(xiàn)出原形,缺口圖圓球需滑至最右再進行截圖,下文詳細解釋。

# 獲取拖拽的圓球
slideblock = driver.find_element_by_class_name('geetest_slider_button')
# 鼠標點擊圓球不松開
ActionChains(driver).click_and_hold(slideblock).perform()
# 將圓球滑至相對起點位置的最右邊
ActionChains(driver).move_by_offset(xoffset=250, yoffset=0).perform()
time.sleep(0.4)
# 保存包含滑塊及缺口的頁面截圖
driver.save_screenshot('D:\quekou.png')
# 放開圓球
ActionChains(driver).release(slideblock).perform()
#打開保存至本地的缺口頁面截圖
quekouimg=Image.open('d://quekou.png')
# 匹配本地對應原圖
sourceimg=match_source(quekouimg)
def match_source(image):
  imagea=Image.open('d://source1.png')
  imageb=Image.open('d://source2.png')
  imagec=Image.open('d://source3.png')
  imaged=Image.open('d://source4.png')
  list=[imagea,imageb,imagec,imaged]
  #通過像素差遍歷匹配本地原圖
  for i in list:
    #本人電腦原圖與缺口圖對應滑塊圖片橫坐標相同,縱坐標原圖比缺口圖大88px,可根據實際情況修改
    pixel1=image.getpixel((868,340))
    pixel2=i.getpixel((868,428))
    #pixel[0]代表R值,pixel[1]代表G值,pixel[2]代表B值
    if abs(pixel1[0]-pixel2[0])<5:
      return i
  return image

為了更快捷獲取滑塊移動距離,我們可以考慮將滑塊先滑至最右端再進行截圖,因為采用從左往右對比遍歷的方式,采用這種方式能保證第一次獲取到的便是缺口位置,由于滑塊起點相同,此種方法可減少計算滑塊大小這一步(畢竟滑塊大小計算也是通過像素遍歷,沒必要再計算一次)。

# 獲取缺口位置
visualstack=get_diff_location(sourceimg,quekouimg)
# 獲取移動距離loc,827為滑塊起點位置
loc=visualstack-827
# 計算滑塊位移距離
def get_diff_location(image1,image2):
  #(825,1082)(335,463)為滑塊圖片區(qū)域,可根據實際情況修改
  for i in range(825,1082):
    for j in range(335,463):
      #遍歷原圖與缺口圖像素值尋找缺口位置
      if is_similar(image1,image2,i,j)==False:
        return i
  return -1
# 對比RGB值得到缺口位置
def is_similar(image1,image2,x,y):
  pixel1=image1.getpixel((x, y+88))
  pixel2=image2.getpixel((x, y))
  # 截圖像素也許存在誤差,50作為容差范圍
  if abs(pixel1[0]-pixel2[0])>=50 and abs(pixel1[1]-pixel2[1])>=50 and abs(pixel1[2]-pixel2[2])>=50:
    return False
  return True

接下來,破解滑塊驗證碼最關鍵也最難的一步來了,機器模擬人工滑動軌跡,或許你可以精準滑動到缺口位置,但還是會被識別為機器被怪物吃掉拼圖,本人在測試的時候也是一把辛酸淚,最后經過不斷調試學習,得到一種通過率還OK的滑動軌跡算法,即采用物理加速度位移相關公式按照先快后慢的人工滑動規(guī)律進行軌跡計算,同時還采用了模擬人滑動超過了缺口位置再滑回至缺口的情況以使軌跡更契合人工滑動軌跡。由于項目時間有限,本人就沒花過多時間研究了,如果想要99%通過率可以嘗試機器學習,采集人工滑動軌跡進行曲線擬合的方法獲取軌跡。

#滑塊移動軌跡
def get_track(self,distance):
  track=[]
  current=0
  mid=distance*3/4
  t=random.randint(2,3)/10
  v=0
  while current<distance:
     if current<mid:
       a=2
     else:
       a=-3
     v0=v
     v=v0+a*t
     move=v0*t+1/2*a*t*t
     current+=move
     track.append(round(move))
  return track
# 生成拖拽移動軌跡,加3是為了模擬滑過缺口位置后返回缺口的情況
track_list=get_track(loc+3)
time.sleep(2)
ActionChains(driver).click_and_hold(slideblock).perform()
time.sleep(0.2)
# 根據軌跡拖拽圓球
for track in track_list:
  ActionChains(driver).move_by_offset(xoffset=track,yoffset=0).perform()
# 模擬人工滑動超過缺口位置返回至缺口的情況,數據來源于人工滑動軌跡,同時還加入了隨機數,都是為了更貼近人工滑動軌跡
imitate=ActionChains(driver).move_by_offset(xoffset=-1, yoffset=0)
time.sleep(0.015)
imitate.perform()
time.sleep(random.randint(6,10)/10)
imitate.perform()
time.sleep(0.04)
imitate.perform()
time.sleep(0.012)
imitate.perform()
time.sleep(0.019)
imitate.perform()
time.sleep(0.033)
ActionChains(driver).move_by_offset(xoffset=1, yoffset=0).perform()
# 放開圓球
ActionChains(driver).pause(random.randint(6,14)/10).release(slideblock).perform()
time.sleep(2)
#務必記得加入quit()或close()結束進程,不斷測試電腦只會卡卡西
driver.close()

至此,小白破解滑塊驗證碼就算基本了結,整個步驟看起來挺簡單的,但其中的坑大概只有實踐才會知道,出BUG之后第一件事請認真檢查你的代碼,不要放過任何一個地方,參數、范圍、返回值、取值等等,甚至可能是你最覺得沒問題的地方,往往是問題所在……over

到此這篇關于Python Selenium破解滑塊驗證碼最新版(GEETEST95%以上通過率)的文章就介紹到這了,更多相關Python Selenium破解滑塊驗證碼內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Tensorflow之Saver的用法詳解

    Tensorflow之Saver的用法詳解

    本篇文章主要介紹了Tensorflow之Saver的用法詳解,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-04-04
  • PyTorch中flatten()?函數的用法實例小結

    PyTorch中flatten()?函數的用法實例小結

    在PyTorch中,flatten函數的作用是將一個多維的張量轉換為一維的向量,它可以將任意形狀的張量轉換為一維,而不需要指定轉換后的大小,這篇文章主要介紹了PyTorch中flatten()?函數的用法,需要的朋友可以參考下
    2023-11-11
  • python中匿名函數的應用方法

    python中匿名函數的應用方法

    這篇文章主要介紹了python中匿名函數的應用方法,匿名函數是無需使用def定義的函數,只需使用關鍵字lambda進行聲明,且只可使用一次,只有一個返回值,需要的朋友可以參考下
    2023-07-07
  • Python實現(xiàn)雙人五子棋對局

    Python實現(xiàn)雙人五子棋對局

    這篇文章主要為大家詳細介紹了Python實現(xiàn)雙人五子棋對局,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-05-05
  • 使用pth文件添加Python環(huán)境變量方式

    使用pth文件添加Python環(huán)境變量方式

    這篇文章主要介紹了使用pth文件添加Python環(huán)境變量方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-05-05
  • Python中zip函數如何使用

    Python中zip函數如何使用

    在本篇文章里小編給大家分享的是關于Python中的zip函數用法,需要的朋友們可以學習參考下。
    2020-06-06
  • Python大數據量文本文件高效解析方案代碼實現(xiàn)全過程

    Python大數據量文本文件高效解析方案代碼實現(xiàn)全過程

    在數據分析中,有時數據源會是超大的文本文件(幾G,或在幾十G),需要從中提取需要的信息,下面這篇文章主要給大家介紹了關于Python大數據量文本文件高效解析方案代碼實現(xiàn)的相關資料,需要的朋友可以參考下
    2022-12-12
  • JSONLINT:python的json數據驗證庫實例解析

    JSONLINT:python的json數據驗證庫實例解析

    本文介紹的 jsonlint 啟發(fā)自 python 的表單驗證工具 wtforms,wtforms 通過繼承 Form 類也能進行 json 數據驗證,下面通過一些例子給大家詳細介紹,非常不錯,具有參考借鑒價值,需要的朋友參考下吧
    2017-11-11
  • python實現(xiàn)簡單遺傳算法

    python實現(xiàn)簡單遺傳算法

    這篇文章主要介紹了python如何實現(xiàn)簡單遺傳算法,幫助大家更好的利用python進行數據分析,感興趣的朋友可以了解下
    2020-09-09
  • python3解析庫lxml的安裝與基本使用

    python3解析庫lxml的安裝與基本使用

    lxml是python的一個解析庫,支持HTML和XML的解析,支持XPath解析方式,下面這篇文章主要給大家介紹了關于python3解析庫lxml的安裝與使用的相關資料,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下
    2018-06-06

最新評論