Python+Pillow+Pytesseract實(shí)現(xiàn)驗(yàn)證碼識(shí)別
昨天十行代碼實(shí)現(xiàn)文字識(shí)別,感覺(jué)怎樣,是不是很爽
今天咋們繼續(xù)利用pillow和pytesseract來(lái)實(shí)現(xiàn)驗(yàn)證碼的識(shí)別
一、環(huán)境配置
需要 pillow 和 pytesseract 這兩個(gè)庫(kù),pip install 安裝就好了。
pip?install?pillow?-i?http://pypi.douban.com/simple?--trusted-host?pypi.douban.com pip?install?pytesseract?-i?http://pypi.douban.com/simple?--trusted-host?pypi.douban.com
安裝好Tesseract-OCR.exe
pytesseract 庫(kù)的配置:搜索找到pytesseract.py,打開(kāi)該.py文件,找到 tesseract_cmd,改變它的值為剛才安裝 tesseract.exe 的路徑。
二、驗(yàn)證碼識(shí)別
識(shí)別驗(yàn)證碼,需要先對(duì)圖像進(jìn)行預(yù)處理,去除會(huì)影響識(shí)別準(zhǔn)確度的線(xiàn)條或噪點(diǎn),提高識(shí)別準(zhǔn)確度。
實(shí)例1
import?cv2?as?cv import?pytesseract from?PIL?import?Image def?recognize_text(image): ????#?邊緣保留濾波??去噪 ????dst?=?cv.pyrMeanShiftFiltering(image,?sp=10,?sr=150) ????#?灰度圖像 ????gray?=?cv.cvtColor(dst,?cv.COLOR_BGR2GRAY) ????#?二值化 ????ret,?binary?=?cv.threshold(gray,?0,?255,?cv.THRESH_BINARY_INV?|?cv.THRESH_OTSU) ????#?形態(tài)學(xué)操作???腐蝕??膨脹 ????erode?=?cv.erode(binary,?None,?iterations=2) ????dilate?=?cv.dilate(erode,?None,?iterations=1) ????cv.imshow('dilate',?dilate) ????#?邏輯運(yùn)算??讓背景為白色??字體為黑??便于識(shí)別 ????cv.bitwise_not(dilate,?dilate) ????cv.imshow('binary-image',?dilate) ????#?識(shí)別 ????test_message?=?Image.fromarray(dilate) ????text?=?pytesseract.image_to_string(test_message) ????print(f'識(shí)別結(jié)果:{text}') src?=?cv.imread(r'./test/044.png') cv.imshow('input?image',?src) recognize_text(src) cv.waitKey(0) cv.destroyAllWindows()
運(yùn)行效果如下:
識(shí)別結(jié)果:3n3D
Process finished with exit code 0
實(shí)例2
import?cv2?as?cv import?pytesseract from?PIL?import?Image def?recognize_text(image): ????#?邊緣保留濾波??去噪 ????blur?=cv.pyrMeanShiftFiltering(image,?sp=8,?sr=60) ????cv.imshow('dst',?blur) ????#?灰度圖像 ????gray?=?cv.cvtColor(blur,?cv.COLOR_BGR2GRAY) ????#?二值化 ????ret,?binary?=?cv.threshold(gray,?0,?255,?cv.THRESH_BINARY_INV?|?cv.THRESH_OTSU) ????print(f'二值化自適應(yīng)閾值:{ret}') ????cv.imshow('binary',?binary) ????#?形態(tài)學(xué)操作??獲取結(jié)構(gòu)元素??開(kāi)操作 ????kernel?=?cv.getStructuringElement(cv.MORPH_RECT,?(3,?2)) ????bin1?=?cv.morphologyEx(binary,?cv.MORPH_OPEN,?kernel) ????cv.imshow('bin1',?bin1) ????kernel?=?cv.getStructuringElement(cv.MORPH_OPEN,?(2,?3)) ????bin2?=?cv.morphologyEx(bin1,?cv.MORPH_OPEN,?kernel) ????cv.imshow('bin2',?bin2) ????#?邏輯運(yùn)算??讓背景為白色??字體為黑??便于識(shí)別 ????cv.bitwise_not(bin2,?bin2) ????cv.imshow('binary-image',?bin2) ????#?識(shí)別 ????test_message?=?Image.fromarray(bin2) ????text?=?pytesseract.image_to_string(test_message) ????print(f'識(shí)別結(jié)果:{text}') src?=?cv.imread(r'./test/045.png') cv.imshow('input?image',?src) recognize_text(src) cv.waitKey(0) cv.destroyAllWindows()
運(yùn)行效果如下:
二值化自適應(yīng)閾值:181.0
識(shí)別結(jié)果:8A62N1
Process finished with exit code 0
實(shí)例3
import?cv2?as?cv import?pytesseract from?PIL?import?Image def?recognize_text(image): ????#?邊緣保留濾波??去噪 ????blur?=?cv.pyrMeanShiftFiltering(image,?sp=8,?sr=60) ????cv.imshow('dst',?blur) ????#?灰度圖像 ????gray?=?cv.cvtColor(blur,?cv.COLOR_BGR2GRAY) ????#?二值化??設(shè)置閾值??自適應(yīng)閾值的話(huà)?黃色的4會(huì)提取不出來(lái) ????ret,?binary?=?cv.threshold(gray,?185,?255,?cv.THRESH_BINARY_INV) ????print(f'二值化設(shè)置的閾值:{ret}') ????cv.imshow('binary',?binary) ????#?邏輯運(yùn)算??讓背景為白色??字體為黑??便于識(shí)別 ????cv.bitwise_not(binary,?binary) ????cv.imshow('bg_image',?binary) ????#?識(shí)別 ????test_message?=?Image.fromarray(binary) ????text?=?pytesseract.image_to_string(test_message) ????print(f'識(shí)別結(jié)果:{text}') src?=?cv.imread(r'./test/045.jpg') cv.imshow('input?image',?src) recognize_text(src) cv.waitKey(0) cv.destroyAllWindows()
運(yùn)行效果如下:
二值化設(shè)置的閾值:185.0
識(shí)別結(jié)果:7364
Process finished with exit code 0
到此這篇關(guān)于Python+Pillow+Pytesseract實(shí)現(xiàn)驗(yàn)證碼識(shí)別的文章就介紹到這了,更多相關(guān)Python驗(yàn)證碼識(shí)別內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python下調(diào)用pytesseract識(shí)別某網(wǎng)站驗(yàn)證碼的實(shí)現(xiàn)方法
- python實(shí)現(xiàn)驗(yàn)證碼識(shí)別功能
- Python基于內(nèi)置庫(kù)pytesseract實(shí)現(xiàn)圖片驗(yàn)證碼識(shí)別功能
- Python pytesseract驗(yàn)證碼識(shí)別庫(kù)用法解析
- python簡(jiǎn)單驗(yàn)證碼識(shí)別的實(shí)現(xiàn)過(guò)程
- Python+Selenium+Pytesseract實(shí)現(xiàn)圖片驗(yàn)證碼識(shí)別
相關(guān)文章
Python&Matlab實(shí)現(xiàn)伏羲八卦圖的繪制
八卦最先由伏羲根據(jù)燧人氏造設(shè)的兩幅星圖歷法《河圖洛書(shū)》創(chuàng)設(shè)。本文將通過(guò)Python和Matlab分別繪制伏羲八卦圖,感興趣的小伙伴可以了解一下2022-03-03關(guān)于Python函數(shù)對(duì)象的名稱(chēng)空間和作用域
這篇文章主要介紹了關(guān)于Python函數(shù)對(duì)象的名稱(chēng)空間和作用域,數(shù)據(jù)的名稱(chēng)是儲(chǔ)存到棧區(qū),而數(shù)據(jù)的內(nèi)容是儲(chǔ)存到堆區(qū),當(dāng)我們要去使用數(shù)據(jù)的內(nèi)容時(shí),我們可以通過(guò)數(shù)據(jù)的名稱(chēng)來(lái)直接去表示數(shù)據(jù)的內(nèi)容,需要的朋友可以參考下2023-04-04TensorFlow實(shí)現(xiàn)自定義Op方式
今天小編就為大家分享一篇TensorFlow實(shí)現(xiàn)自定義Op方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02python操作MySQL數(shù)據(jù)庫(kù)具體方法
堅(jiān)持每天學(xué)一點(diǎn),每天積累一點(diǎn)點(diǎn),作為自己每天的業(yè)余收獲,這個(gè)文章是我在吃飯的期間寫(xiě)的,利用自己零散的時(shí)間學(xué)了一下python操作MYSQL,所以整理一下。我采用的是MySQLdb操作的MYSQL數(shù)據(jù)庫(kù)。先來(lái)一個(gè)簡(jiǎn)單的例子吧2013-10-10Python?Jinja2?庫(kù)靈活性廣泛性應(yīng)用場(chǎng)景實(shí)例解析
Jinja2,作為Python中最流行的模板引擎之一,為開(kāi)發(fā)者提供了強(qiáng)大的工具,用于在Web應(yīng)用和其他項(xiàng)目中生成動(dòng)態(tài)內(nèi)容,本文將深入研究?Jinja2?庫(kù)的各個(gè)方面,提供更豐富的示例代碼,能夠充分理解其靈活性和廣泛應(yīng)用的場(chǎng)景2024-01-01Python中計(jì)數(shù)器Counter的使用技巧分享
計(jì)數(shù)器(Counter)是Python標(biāo)準(zhǔn)庫(kù)collections模塊中提供的一個(gè)強(qiáng)大工具,用于統(tǒng)計(jì)可哈希對(duì)象的出現(xiàn)次數(shù),本文將介紹Python中計(jì)數(shù)器的基本用法、高級(jí)功能等內(nèi)容,希望對(duì)大家有所幫助2023-11-11