python識別文字(基于tesseract)代碼實例
這篇文章主要介紹了python識別文字(基于tesseract)代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
Ubuntu版本:
1.tesseract-ocr安裝
sudo apt-get install tesseract-ocr
2.pytesseract安裝
sudo pip install pytesseract
3.Pillow 安裝
sudo pip install pillow
開始寫代碼:
from PIL import Image from pytesseract import pytesseract image = Image.open('test.png') code = pytesseract.image_to_string(image,lang='chi_sim') print(code)
報錯了:
找到路徑,發(fā)現(xiàn)沒有chi_sim.traineddata這個訓(xùn)練包
# 安裝訓(xùn)練數(shù)據(jù)(equ為數(shù)學(xué)公式包) sudo apt-get install tesseract-ocr-eng tesseract-ocr-chi-sim tesseract-ocr-equ
安裝之后就會有訓(xùn)練包了,可以正常運行。
英文識別正確率較高,中文就比較雞肋了。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python?Traceback(most?recent?call?last)報錯信息:示例解讀
這篇文章主要介紹了Python?Traceback(most?recent?call?last)報錯信息:示例解讀,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-12-12使用coverage統(tǒng)計python web項目代碼覆蓋率的方法詳解
這篇文章主要介紹了使用coverage統(tǒng)計python web項目代碼覆蓋率的方法,詳細分析了coverage的安裝以及coverage命令統(tǒng)計py文件相關(guān)操作技巧,需要的朋友可以參考下2019-08-08Python函數(shù)遞歸調(diào)用實現(xiàn)原理實例解析
這篇文章主要介紹了Python函數(shù)遞歸調(diào)用實現(xiàn)原理過程解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-08-08Django解決無法從request.POST中獲取URL傳進來的參數(shù)
這篇文章主要介紹了Django解決無法從request.POST中獲取URL傳進來的參數(shù)問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-12-12