OpenCV搞定騰訊滑塊驗證碼的實現(xiàn)代碼
前言
廢話
滑塊驗證碼破解是一直都想搞的項目,畢竟多數(shù)網(wǎng)站都會采用滑塊驗證碼,于是最近在修改論文的閑暇之余把這事兒給解決了。要搞現(xiàn)在的滑塊驗證碼繞不開圖像處理,圖像處理當然是首推OpenCV-Python
啦!當然我的OpenCV非常菜(P.S.兩天速成不敢保證代碼質(zhì)量
),發(fā)現(xiàn)問題就直接指出嘛,不用走流程啦!
環(huán)境
首先需要一個python,然后安裝opencv的python庫,如下:
pip install opencv-python
然后測試一下是否可用,如下:
import cv2 as cv import numpy as np if __name__ == '__main__': img = np.ones((200, 200, 3), np.uint8) * 255 cv.rectangle(img, (50, 50), (150, 150), (0, 0, 255), 2) cv.imshow('test', img) cv.waitKey(0) cv.destroyAllWindows()
正常的話就會如下顯示:
OpenCV的使用
相關(guān)的API我也是邊用邊查的,用得也是相當生疏!具體的常用方法大家只好自行百度了,我就不獻丑了!
實現(xiàn)原理及方法
騰訊滑塊驗證
這次搞得目標就是騰訊滑塊驗證碼,調(diào)用騰訊滑塊這個接口的網(wǎng)站還是挺多的,比如非常好用的在線畫圖網(wǎng)站ProcessOn
,其中滑塊驗證部分類似這樣子的:
抓個包發(fā)現(xiàn)只有滑塊圖和帶缺口的圖,如下:
破解滑塊驗證碼最為關(guān)鍵的地方在于找到滑塊缺口的位置
,找到缺口位置后就可以利用Selenium
模擬拖動滑塊到指定位置實現(xiàn)破解,之前的老辦法就是將完整圖的像素點和帶缺口圖的像素點進行比較從而得到缺口位置
,但是現(xiàn)在一般不會將完整圖暴露給我們,所以只有在帶有缺口的圖上進行處理。我這里一共有兩種方案進行缺口位置識別,一種是基于模板匹配
的,另一種是基于輪廓檢測
的,下面會細講兩種方案的實現(xiàn)方法。
模板匹配識別缺口
具體是實現(xiàn)過程如下:
1.處理滑塊的圖片
- 灰度化滑塊圖片
- 處理一下滑塊圖中滑塊的外圈
- 使用inRange二值化滑塊圖
- 使用開運算去除白色噪點
運行結(jié)果如下所示(左側(cè)為原始滑塊,右側(cè)為處理后的滑塊):
2.處理帶缺口的圖片
- 先來個高斯濾波去噪
- 灰度化帶缺口圖
- 使用閾值二值化該圖
運行結(jié)果如下所示(左側(cè)為原始圖,右側(cè)為處理后的圖):
3.進行模板匹配
調(diào)用模板匹配API并圈出匹配上的區(qū)域,結(jié)果如下所示:
警告警告警告
這種方法的缺口識別率在50%
左右,很大一部分原因是滑塊圖的背景為純白色,這在匹配時會產(chǎn)生很大的干擾,要是能將滑塊圖的背景變?yōu)橥该?/code>,正確的匹配率可以達到90%以上
如果大家有任何將滑塊圖的背景變?yōu)橥该鞯霓k法,可以留言到評論區(qū),我真的萬分感謝?。?!
下面是現(xiàn)階段的實現(xiàn)代碼:
# encoding:utf-8 import cv2 as cv import numpy as np # 對滑塊進行二值化處理 def handle_img1(image): kernel = np.ones((8, 8), np.uint8) # 去滑塊的前景噪聲內(nèi)核 gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY) width, heigth = gray.shape for h in range(heigth): for w in range(width): if gray[w, h] == 0: gray[w, h] = 96 # cv.imshow('gray', gray) binary = cv.inRange(gray, 96, 96) res = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel) # 開運算去除白色噪點 # cv.imshow('res', res) return res # 模板匹配(用于尋找缺口有點誤差) def template_match(img_target, img_template): tpl = handle_img1(img_template) # 誤差來源就在于滑塊的背景圖為白色 blurred = cv.GaussianBlur(img_target, (3, 3), 0) # 目標圖高斯濾波 gray = cv.cvtColor(blurred, cv.COLOR_BGR2GRAY) ret, target = cv.threshold(gray, 127, 255, cv.THRESH_BINARY) # 目標圖二值化 # cv.imshow("template", tpl) # cv.imshow("target", target) method = cv.TM_CCOEFF_NORMED width, height = tpl.shape[:2] result = cv.matchTemplate(target, tpl, method) min_val, max_val, min_loc, max_loc = cv.minMaxLoc(result) left_up = max_loc right_down = (left_up[0] + height, left_up[1] + width) cv.rectangle(img_target, left_up, right_down, (0, 0, 255), 2) cv.imshow('res', img_target) if __name__ == '__main__': img0 = cv.imread('./demo/3/hycdn_3.jpg') img1 = cv.imread('./demo/3/hycdn_3_2.png') template_match(img0, img1) cv.waitKey(0) cv.destroyAllWindows()
輪廓檢測識別缺口
基于輪廓檢測缺口的思路簡單很多,加上合理的條件識別率在95%
以上,實現(xiàn)過程如下:
帶缺口圖高斯模糊去噪用(200,400)
的閾值做Canny邊緣檢測尋找輪廓對已有的輪廓做約束,比如輪廓的面積范圍,輪廓的周長范圍
多個匹配結(jié)果如下:
實現(xiàn)代碼如下:
# encoding:utf-8 import cv2 as cv def get_pos(image): blurred = cv.GaussianBlur(image, (5, 5), 0) canny = cv.Canny(blurred, 200, 400) contours, hierarchy = cv.findContours(canny, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE) for i, contour in enumerate(contours): M = cv.moments(contour) if M['m00'] == 0: cx = cy = 0 else: cx, cy = M['m10'] / M['m00'], M['m01'] / M['m00'] if 6000 < cv.contourArea(contour) < 8000 and 370 < cv.arcLength(contour, True) < 390: if cx < 400: continue x, y, w, h = cv.boundingRect(contour) # 外接矩形 cv.rectangle(image, (x, y), (x + w, y + h), (0, 0, 255), 2) cv.imshow('image', image) return x return 0 if __name__ == '__main__': img0 = cv.imread('./demo/4/hycdn_4.jpg') get_pos(img0) cv.waitKey(0) cv.destroyAllWindows()
遺留問題
問題1
如何將滑塊圖的純白背景變?yōu)橥该鞅尘埃?/p>
問題2
使用Selenium
和軌跡算法拖動滑塊時將滑塊拖出左側(cè)的范圍之外,軌跡算法是先加速后減速整體是向前移動的,按道理來說不可能往回走,但是模擬拖動的時候會出現(xiàn)滑塊向后拖動且拖出范圍的現(xiàn)象,這問題如何解決?
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
python導(dǎo)出mysql指定binlog文件實現(xiàn)demo
這篇文章主要介紹了python導(dǎo)出mysql指定binlog文件實現(xiàn)demo,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-12-12Python實現(xiàn)快速排序和插入排序算法及自定義排序的示例
這篇文章主要介紹了Python實現(xiàn)快速排序和插入排序算法及自定義排序的示例,自定義排序用到了Python的sort和sorted函數(shù),需要的朋友可以參考下2016-02-02為何你的Python代碼在Notepad++中只閃現(xiàn)一下就消失無蹤?
你是否曾在Notepad++中運行編寫的Python代碼,卻發(fā)現(xiàn)它們瞬間消失無蹤?別擔心,這不是你的幻覺,在這篇指南中,我們將揭秘這一現(xiàn)象背后的原因,并教你如何輕松解決,讓我們一起揭開這個謎團,讓你的Python代碼在Notepad++中安然無恙吧!2024-02-02詳解利用python-highcharts庫繪制交互式可視化圖表
本文主要和大家分享一個超強交互式可視化繪制工具-python-highcharts。python-highcharts就是使用Python進行Highcharts項目繪制,簡單的說就是實現(xiàn)Python和Javascript之間的簡單轉(zhuǎn)換層,感興趣的可以了解一下2022-03-03Pandas把dataframe或series轉(zhuǎn)換成list的方法
這篇文章主要介紹了Pandas把dataframe或series轉(zhuǎn)換成list的方法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-06-06Python?matplotlib之折線圖的各種樣式與畫法總結(jié)
matplotlib是Python中的一個第三方庫,主要用于開發(fā)2D圖表,以漸進式、交互式的方式實現(xiàn)數(shù)據(jù)可視化,可以更直觀的呈現(xiàn)數(shù)據(jù),使數(shù)據(jù)更具說服力,下面這篇文章主要給大家介紹了關(guān)于Python?matplotlib之折線圖的各種樣式與畫法的相關(guān)資料,需要的朋友可以參考下2022-12-12如何使用python-opencv批量生成帶噪點噪線的數(shù)字驗證碼
這篇文章主要介紹了如何使用python-opencv批量生成帶噪點噪線的數(shù)字驗證碼,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12NumPy實現(xiàn)多維數(shù)組中的線性代數(shù)
本文主要介紹了NumPy實現(xiàn)多維數(shù)組中的線性代數(shù),文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-07-07Python實現(xiàn)定時精度可調(diào)節(jié)的定時器
這篇文章主要為大家詳細介紹了Python實現(xiàn)定時精度可調(diào)節(jié)的定時器,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-04-04