python+Tesseract OCR實(shí)現(xiàn)截屏識(shí)別文字
一、tesseract-ocr下載安裝
1、下載
以下是關(guān)于Tesseract的常用網(wǎng)址
下載地址:https://digi.bib.uni-mannheim.de/tesseract/
官方網(wǎng)站:https://github.com/tesseract-ocr/tesseract
官方文檔:https://github.com/tesseract-ocr/tessdoc
語(yǔ)言包地址:https://github.com/tesseract-ocr/tessdata
2、安裝tesseract-ocr
(1)選擇語(yǔ)言
(2)開(kāi)始安裝
(3)同意許可
(4)選擇安裝的用戶(hù)
(5)選擇附帶要安裝的語(yǔ)言包
此后會(huì)在安裝過(guò)程中會(huì)自動(dòng)從服務(wù)器下載該語(yǔ)言包。(這里不太建議勾選下載語(yǔ)言包,因?yàn)橄螺d速度實(shí)在太慢。本教程后續(xù)會(huì)介紹如何拓展語(yǔ)言包,但如果已經(jīng)翻墻的話(huà),可以忽略這個(gè)建議。)
默認(rèn)即可。
(6)安裝位置
(7)開(kāi)始安裝
(8)安裝完成
3、安裝語(yǔ)言包
(1)下載安裝
https://github.com/tesseract-ocr/tessdata
項(xiàng)目較大,可以按需下載簡(jiǎn)體中文:
將下載的文件存放到該目錄:D:\Program Files\Tesseract-OCR\tessdata
注:若小伙伴無(wú)法科學(xué)上網(wǎng),可以從這里下載簡(jiǎn)體中文語(yǔ)言包:http://www.dbjr.com.cn/softs/538925.html
(2)測(cè)試
進(jìn)入到Tesseract OCR安裝目錄:
# 查看版本 PS D:\Program Files\Tesseract-OCR> .\tesseract.exe -v tesseract v5.3.0.20221214 leptonica-1.78.0 libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0 Found AVX2 Found AVX Found FMA Found SSE4.1 Found libarchive 3.5.0 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5 libzstd/1.4.5 Found libcurl/7.77.0-DEV Schannel zlib/1.2.11 zstd/1.4.5 libidn2/2.0.4 nghttp2/1.31.0 # 查看安裝的語(yǔ)言包 PS D:\Program Files\Tesseract-OCR> .\tesseract.exe --list-langs List of available languages in "D:\Program Files\Tesseract-OCR/tessdata/" (4): chi_sim chi_sim_vert eng osd
二、python截屏識(shí)別文字
1、安裝必須的包
pip install pyautogui pip install pytesseract
2、截屏識(shí)別文字
import pyautogui import pytesseract # 設(shè)置Tesseract的安裝路徑(如果它不在默認(rèn)的系統(tǒng)路徑中) pytesseract.pytesseract.tesseract_cmd = 'D:/Program Files/Tesseract-OCR/tesseract.exe' # 截取屏幕截圖 screenshot = pyautogui.screenshot() # 定義區(qū)域范圍(左上角x坐標(biāo),左上角y坐標(biāo),右下角x坐標(biāo),右下角y坐標(biāo)) region = (100, 100, 300, 200) # 從屏幕截圖中使用指定區(qū)域創(chuàng)建一個(gè)新的圖像對(duì)象 custom_screenshot = screenshot.crop(region) # 將圖像對(duì)象轉(zhuǎn)換為灰度圖像,以幫助提高文本識(shí)別的準(zhǔn)確性 custom_screenshot = custom_screenshot.convert('L') # 使用pytesseract進(jìn)行文字識(shí)別 text = pytesseract.image_to_string(custom_screenshot) # 打印識(shí)別的文本 print(text)
3、準(zhǔn)確度
英文準(zhǔn)確度還行,中文準(zhǔn)確度。。。一言難盡。應(yīng)該是可以通過(guò)訓(xùn)練提高準(zhǔn)確度的。
參考資料
https://blog.csdn.net/weixin_51571728/article/details/120384909
到此這篇關(guān)于python+Tesseract OCR實(shí)現(xiàn)截屏識(shí)別文字的文章就介紹到這了,更多相關(guān)python Tesseract OCR 識(shí)別文字內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python 實(shí)現(xiàn) hive中類(lèi)似 lateral view explode的功能示例
這篇文章主要介紹了python 實(shí)現(xiàn) hive中類(lèi)似 lateral view explode的功能示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05python中h5py開(kāi)源庫(kù)的使用樣例詳解
這篇文章主要介紹了python中的h5py開(kāi)源庫(kù)的使用,本文只是簡(jiǎn)單的對(duì)h5py庫(kù)的基本創(chuàng)建文件,數(shù)據(jù)集和讀取數(shù)據(jù)的方式進(jìn)行介紹,需要的朋友可以參考下2022-05-05Python編程新標(biāo)準(zhǔn)學(xué)會(huì)十項(xiàng)好習(xí)慣提升編碼質(zhì)量
這篇文章主要為大家介紹了Python編程新標(biāo)準(zhǔn)學(xué)會(huì)十項(xiàng)好習(xí)慣提升編碼質(zhì)量,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01Python學(xué)習(xí)教程之常用的內(nèi)置函數(shù)大全
python給我們提供了很多已經(jīng)定義好的函數(shù),下面這篇文章主要給大家介紹了關(guān)于Python學(xué)習(xí)教程之一些常用的內(nèi)置函數(shù),文中分享了關(guān)于數(shù)學(xué)函數(shù)、功能函數(shù)、類(lèi)型轉(zhuǎn)換函數(shù)、字符串處理和序列處理函數(shù)的相關(guān)資料,需要的朋友可以參考借鑒,下面來(lái)一起看看吧。2017-07-07Python實(shí)現(xiàn)的微信支付方式總結(jié)【三種方式】
這篇文章主要介紹了Python實(shí)現(xiàn)的微信支付方式,結(jié)合實(shí)例形式總結(jié)分析了Python實(shí)現(xiàn)的三種微信支付方式及相關(guān)操作步驟、原理、注意事項(xiàng),需要的朋友可以參考下2019-04-04深入了解Python?Opencv數(shù)據(jù)增強(qiáng)
常見(jiàn)的數(shù)據(jù)增強(qiáng)操作有:按比例放大或縮小圖片、旋轉(zhuǎn)、平移、水平翻轉(zhuǎn)、改變圖像通道等。本文將通過(guò)Python?OpenCV實(shí)現(xiàn)這些操作,需要的可以參考一下2022-02-02利用python實(shí)現(xiàn)終身免費(fèi)的聽(tīng)書(shū)工具
本文通過(guò)實(shí)際案例,詳細(xì)介紹了作者如何利用Python庫(kù)實(shí)現(xiàn)文本轉(zhuǎn)語(yǔ)音的過(guò)程,從安裝庫(kù)到實(shí)際操作案例,都有詳細(xì)的說(shuō)明,為讀者提供了一定的參考價(jià)值2024-03-03Python使用matplotlib繪制多個(gè)圖形單獨(dú)顯示的方法示例
這篇文章主要介紹了Python使用matplotlib繪制多個(gè)圖形單獨(dú)顯示的方法,結(jié)合實(shí)例形式分析了matplotlib實(shí)現(xiàn)繪制多個(gè)圖形單獨(dú)顯示的具體操作技巧與注意事項(xiàng),代碼備有較為詳盡的注釋便于理解,需要的朋友可以參考下2018-03-03