Python免費驗證碼識別之ddddocr識別OCR自動庫實現
更新時間:2022年02月24日 10:00:34 作者:海寶7號
在Python爬蟲過程中,有些網站需要驗證碼通過后方可進入網頁,目的很簡單,就是區(qū)分是人閱讀訪問還是機器爬蟲,下面這篇文章主要給大家介紹了關于Python免費驗證碼識別之ddddocr識別OCR自動庫實現的相關資料,需要的朋友可以參考下
需要ocr識別,推薦一個Python免費的驗證碼識別-ddddocr
安裝過程:
1、鏡像安裝:pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple
2.python.exe -m pip install --upgrade pip
注意升級pip庫,,動不動升級就很麻煩。
Collecting pip Downloading https://pypi.tuna.tsinghua.edu.cn/packages/ca/31/b88ef447d595963c01060998cb329251648acf4a067721b0452c45527eb8/pip-21.2.4-py3-none-any.whl (1.6 MB) |████████████████████████████████| 1.6 MB 939 kB/s Installing collected packages: pip Attempting uninstall: pip Found existing installation: pip 21.2.1 Uninstalling pip-21.2.1: Successfully uninstalled pip-21.2.1 Successfully installed pip-21.2.4
完成之后,找個參考圖片
import ddddocr ocr = ddddocr.DdddOcr() with open('1.png', 'rb') as f: img_bytes = f.read() res = ocr.classification(img_bytes) print(res)
對比效果圖:
效果不是太好,有的圖片,例如:
哈哈哈,自個玩吧。
附ddddocr-驗證碼識別案例
import ddddocr ocr=ddddocr.DdddOcr() with open('test_img.png', 'rb') as f: img_bytes=f.read() res=ocr.classification(img_bytes) print(res)
普通干擾較弱的驗證碼均可識別通過
總結
到此這篇關于Python免費驗證碼識別之ddddocr識別OCR自動庫實現的文章就介紹到這了,更多相關ddddocr識別OCR自動庫內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
django數據模型中null和blank的區(qū)別說明
這篇文章主要介紹了django數據模型中null和blank的區(qū)別說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-09-09requests.gPython?用requests.get獲取網頁內容為空?’?’問題
這篇文章主要介紹了requests.gPython?用requests.get獲取網頁內容為空?’?’,溫行首先舉例說明,具有一定得參考價值,需要的小伙伴可以參考一下2022-01-01