Python3一行代碼實(shí)現(xiàn)圖片文字識(shí)別的示例
自學(xué)Python3第5天,今天突發(fā)奇想,想用Python識(shí)別圖片里的文字。沒(méi)想到Python實(shí)現(xiàn)圖片文字識(shí)別這么簡(jiǎn)單,只需要一行代碼就能搞定
from PIL import Image import pytesseract #上面都是導(dǎo)包,只需要下面這一行就能實(shí)現(xiàn)圖片文字識(shí)別 text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim') print(text)
我們以識(shí)別詩(shī)詞為例
下面是我們要識(shí)別的圖片
先看下效果圖
我們運(yùn)行代碼后識(shí)別的結(jié)果,有幾個(gè)字沒(méi)有正確識(shí)別,但是大多數(shù)字都能識(shí)別出來(lái)。
風(fēng)急天高猿嘯哀 渚蕓胄芳少白鳥(niǎo)飛鳳 無(wú)邊落木蕭蕭下, 不盡長(zhǎng)量工盲袞宕袞來(lái) 萬(wàn)里悲秋常1乍窨, 百年多病獨(dú)登氤 艱難苦恨擎霜量 漂倒新停澍酉帆
一行代碼就能識(shí)別圖片,我們背后要做些準(zhǔn)備工作的
- 這里我們需要用到兩個(gè)庫(kù):pytesseract和PIL
- 同時(shí)我們還需要安裝識(shí)別引擎tesseract-ocr
下面就來(lái)講講這幾個(gè)庫(kù)的安裝,因?yàn)橹挥羞@幾個(gè)庫(kù)安裝好以后Python才能實(shí)現(xiàn)一行代碼實(shí)現(xiàn)圖片文字識(shí)別
一,pytesseract和PIL的安裝
安裝這兩個(gè)包可以借助pip
- 1,命令行安裝
pip install PIL pip install pytesseract
- 2,如果你用的pycharm編輯器,就可以直接借助pycharm實(shí)現(xiàn)快速安裝。
在pycharm的Settings設(shè)置頁(yè)按照下面步驟操作
這樣就能成功安裝pytesseract,安裝PIL只需要在上面第三步里搜索PIL并點(diǎn)擊安裝即可
這時(shí)我們安轉(zhuǎn)好了庫(kù),運(yùn)行下面代碼
from PIL import Image import pytesseract text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim') print(text)
會(huì)報(bào)下面錯(cuò)誤,錯(cuò)誤原因是:沒(méi)有安裝識(shí)別引擎tesseract-ocr
二,安裝識(shí)別引擎tesseract-ocr
1.下載下面的安裝包,然后直接點(diǎn)擊安裝即可
tesseract-ocr安裝包和中文語(yǔ)言包
解壓安裝tesseract-ocr后做如下操作,就可以支持中文識(shí)別了。因?yàn)閠esseract-ocr默認(rèn)不支持中文識(shí)別。
2,安裝完成tesseract-ocr后,我們還需要做一下配置
在C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py打開(kāi)后做如下操作
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY #tesseract_cmd = 'tesseract' tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
也可以通過(guò)pycharm快速打開(kāi)pytesseract.py
至此我們所有的配置就完成了,運(yùn)行下面代碼就可以把杜甫的登高這首圖片詩(shī)解析成文字了
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- python利用pytesseract 實(shí)現(xiàn)本地識(shí)別圖片文字
- python pytesseract庫(kù)的實(shí)例用法
- python3光學(xué)字符識(shí)別模塊tesserocr與pytesseract的使用詳解
- Python基于內(nèi)置庫(kù)pytesseract實(shí)現(xiàn)圖片驗(yàn)證碼識(shí)別功能
- python下調(diào)用pytesseract識(shí)別某網(wǎng)站驗(yàn)證碼的實(shí)現(xiàn)方法
- Python 圖片文字識(shí)別的實(shí)現(xiàn)之PaddleOCR
- Python調(diào)用百度OCR實(shí)現(xiàn)圖片文字識(shí)別的示例代碼
- Python圖像處理之圖片文字識(shí)別功能(OCR)
- python利用 pytesseract快速識(shí)別提取圖片中的文字((圖片識(shí)別)
相關(guān)文章
Python 25行代碼實(shí)現(xiàn)的RSA算法詳解
這篇文章主要介紹了Python 25行代碼實(shí)現(xiàn)的RSA算法,結(jié)合實(shí)例形式詳細(xì)分析了rsa加密算法的概念、原理、相關(guān)實(shí)現(xiàn)技巧與注意事項(xiàng),需要的朋友可以參考下2018-04-04Python如何安裝mysql數(shù)據(jù)庫(kù)模塊
這篇文章主要介紹了Python如何安裝mysql數(shù)據(jù)庫(kù)模塊問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-07-07python 實(shí)現(xiàn)數(shù)據(jù)庫(kù)中數(shù)據(jù)添加、查詢與更新的示例代碼
這篇文章主要介紹了python 實(shí)現(xiàn)數(shù)據(jù)庫(kù)中數(shù)據(jù)添加、查詢與更新的示例代碼,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-12-12Python爬蟲(chóng)lxml庫(kù)處理XML和HTML文檔
在當(dāng)今信息爆炸的時(shí)代,網(wǎng)絡(luò)上的數(shù)據(jù)量龐大而繁雜,為了高效地從網(wǎng)頁(yè)中提取信息,Python爬蟲(chóng)工程師們需要強(qiáng)大而靈活的工具,其中,lxml庫(kù)憑借其卓越的性能和豐富的功能成為Python爬蟲(chóng)領(lǐng)域的不可或缺的工具之一,本文將深入介紹lxml庫(kù)的各個(gè)方面,充分掌握這個(gè)強(qiáng)大的爬蟲(chóng)利器2023-12-12python自然語(yǔ)言處理之字典樹(shù)知識(shí)總結(jié)
這篇文章主要介紹了python自然語(yǔ)言處理之字典樹(shù)知識(shí)總結(jié),文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)python的小伙伴們有非常好的幫助,需要的朋友可以參考下2021-04-04使用Python實(shí)現(xiàn)文字轉(zhuǎn)語(yǔ)音并播放功能
這篇文章主要給大家介紹了使用Python實(shí)現(xiàn)文字轉(zhuǎn)語(yǔ)音并播放功能,文中通過(guò)代碼示例給大家講解的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作有一定的幫助,需要的朋友可以參考下2024-01-01Python多進(jìn)程并發(fā)(multiprocessing)用法實(shí)例詳解
這篇文章主要介紹了Python多進(jìn)程并發(fā)(multiprocessing)用法,實(shí)例分析了multiprocessing模塊進(jìn)程操作的相關(guān)技巧,需要的朋友可以參考下2015-06-06淺談python之自動(dòng)化運(yùn)維(Paramiko)
這篇文章主要介紹了淺談python之自動(dòng)化運(yùn)維(Paramiko),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-01-01matplotlib交互式數(shù)據(jù)光標(biāo)mpldatacursor的實(shí)現(xiàn)
這篇文章主要介紹了matplotlib交互式數(shù)據(jù)光標(biāo)mpldatacursor的實(shí)現(xiàn) ,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-02-02