python使用tesseract實(shí)現(xiàn)字符識(shí)別功能
介紹
Tesseract 是一個(gè)開源的光學(xué)字符識(shí)別(OCR)引擎,它能夠識(shí)別多種語(yǔ)言的文本,可將掃描文檔、圖像中的文字提取并轉(zhuǎn)換為計(jì)算機(jī)可編輯的文本格式。
1. 安裝tesseract
首先到下列地址處,下載tesseract安裝程序,并安裝。
tesseract下載地址(第三方非官網(wǎng))
https://digi.bib.uni-mannheim.de/tesseract/
安裝完成后,進(jìn)入安裝目錄找到tesseract.exe,并且拷貝路徑,然后到編譯器編寫python代碼。
2. 編寫python代碼
import cv2 import pytesseract # 指定 Tesseract-OCR 可執(zhí)行文件的路徑 pytesseract.pytesseract.tesseract_cmd = "D:\\computer_vision_lib\\tesseract-ocr5.3\\tesseract.exe" # 選擇一張要識(shí)別的字符圖片 img = cv2.imread("test.png") img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 使用 Tesseract-OCR 進(jìn)行文字識(shí)別,并返回識(shí)別到的字符 print(pytesseract.image_to_string(img)) print('--'*10) # 獲取每個(gè)字符的邊界框的坐標(biāo) print(pytesseract.image_to_boxes(img)) hImg, wImg, _ = img.shape boxes = pytesseract.image_to_boxes(img) for b in boxes.splitlines(): b = b.split(' ') x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4]) cv2.rectangle(img, (x, hImg - y), (w, hImg - h), (0, 0, 255), 3) cv2.putText(img, b[0], (x, hImg - y + 25), cv2.FONT_HERSHEY_COMPLEX, 1, (50, 50, 255), 2) cv2.imshow("Image", img) cv2.waitKey(0)
執(zhí)行截圖如下:
到此這篇關(guān)于python使用tesseract實(shí)現(xiàn)字符識(shí)別功能的文章就介紹到這了,更多相關(guān)python tesseract字符識(shí)別內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
基于keras 模型、結(jié)構(gòu)、權(quán)重保存的實(shí)現(xiàn)
今天小編就為大家分享一篇基于keras 模型、結(jié)構(gòu)、權(quán)重保存的實(shí)現(xiàn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-01-01Python使用scipy進(jìn)行曲線擬合的方法實(shí)例
這篇文章主要給大家介紹了關(guān)于Python使用scipy進(jìn)行曲線擬合的相關(guān)資料,Scipy優(yōu)化和擬合采用的是optimize模塊,該模塊提供了函數(shù)最小值(標(biāo)量或多維)、曲線擬合和尋找等式的根的有用算法,需要的朋友可以參考下2022-05-05PPOCRLabel標(biāo)注的txt格式如何轉(zhuǎn)換成labelme能修改的json格式
這篇文章主要介紹了PPOCRLabel標(biāo)注的txt格式如何轉(zhuǎn)換成labelme能修改的json格式問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-03-03python 遍歷可迭代對(duì)象的實(shí)現(xiàn)方法
本文主要介紹了python 遍歷可迭代對(duì)象的實(shí)現(xiàn)方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02Python基礎(chǔ)教程之Pandas數(shù)據(jù)分析庫(kù)詳解
Pandas是一個(gè)基于 NumPy 的非常強(qiáng)大的開源數(shù)據(jù)處理庫(kù),它提供了高效、靈活和豐富的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具,本文中,我們將學(xué)習(xí)如何使用Pandas來(lái)處理和分析數(shù)據(jù),感興趣的小伙伴跟著小編一起來(lái)看看吧2023-07-07解決Pytorch中的神坑:關(guān)于model.eval的問(wèn)題
這篇文章主要介紹了解決Pytorch中的神坑:關(guān)于model.eval的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05淺析Python語(yǔ)言自帶的數(shù)據(jù)結(jié)構(gòu)有哪些
Python已經(jīng)廣泛的應(yīng)用于數(shù)據(jù)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等眾多科學(xué)計(jì)算領(lǐng)域,這篇文章主要介紹了Python語(yǔ)言自帶的數(shù)據(jù)結(jié)構(gòu)有哪些?需要的朋友可以參考下2019-08-08