欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python3.6使用tesseract-ocr的正確方法

 更新時間:2018年10月17日 11:22:57   作者:no-96  
今天小編就為大家分享一篇關(guān)于Python3.6使用tesseract-ocr的正確方法,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧

Tesseract介紹

tesseract是一個挺不錯的OCR引擎,目前的問題是最新的中文資料相對較少,過時、不準確的信息偏多。

tesseract是一個google支持的開源ocr項目,其項目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源碼可以在這里下載。

實際使用tesseract ocr也有兩種方式:1. 動態(tài)庫方式 libtesseract  2. 執(zhí)行程序方式 tesseract.exe

環(huán)境

  • Python 3.6.3
  • pip 9.0.1
  • tesseract-ocr-setup-3.05.00dev.exe
  • Windows10

安裝

1.tesseract-orc

  • Tesseract:開源的OCR識別引擎,初期Tesseract引擎由HP實驗室研發(fā),后來貢獻給了開源軟件業(yè),后經(jīng)由Google進行改進,消除bug,優(yōu)化,重新發(fā)布。

安裝的時候需要自行選擇安裝的語言,一些其他國家的語言可以不選擇安裝,我之按安裝了中文,英文和日語。安裝過程和其他軟件一樣。

2.pytesseract

pip install pytesseract

配置環(huán)境

1.設(shè)置 tesseract-orc路徑

默認情況下tesseract-orc是不被添加到系統(tǒng)的path路徑的,這樣在使用的時候發(fā)生FileNotFoundError: [WinError 2] 系統(tǒng)找不到指定的文件錯誤。

解決方法:

  • 方法1:將 C:\Program Files (x86)\Tesseract-OCR添加到系統(tǒng)路徑(路徑因安裝過程而異)
  • 方法2:修改pytesseract.py文件

設(shè)置訓練集的位置

下載的默認訓練集也沒有添加到系統(tǒng)路徑,會報錯

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\tessdata/chi_sim.traineddata')

解決方法:

設(shè)置環(huán)境變量 TESSDATA_PREFIX
C:\Program Files (x86)\Tesseract-OCR\tessdata

實例程序

import pytesseract
from PIL import Image
image = Image.open('test.png')
code = pytesseract.image_to_string(image)
print(code)

更多參考:https://pypi.python.org/pypi/pytesseract

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接

相關(guān)文章

  • python打開音樂文件的實例方法

    python打開音樂文件的實例方法

    在本篇文章里小編給大家整理的是一篇關(guān)于python打開音樂文件的實例方法,有需要的朋友們學習參考下。
    2020-07-07
  • Python?4種實現(xiàn)定時任務(wù)的方案

    Python?4種實現(xiàn)定時任務(wù)的方案

    這篇文章主要給大家分享了Python?4種實現(xiàn)定時任務(wù)的方案,運用 while True: + sleep()、Timeloop 庫、threading.Timer 、內(nèi)置模塊 sched ,下面就來看看具體的實現(xiàn)過程吧
    2021-12-12
  • conda使用清華源設(shè)置channel的鏡像

    conda使用清華源設(shè)置channel的鏡像

    今天在下載OpenCV的時候發(fā)現(xiàn)清華的conda channel鏡像已經(jīng)不能用了,conda需要設(shè)置的源是anaconda的源,本來就來介紹一下在conda使用清華源設(shè)置channel的鏡像的方法,感興趣的可以了解一下
    2021-05-05
  • Python內(nèi)建數(shù)據(jù)結(jié)構(gòu)詳解

    Python內(nèi)建數(shù)據(jù)結(jié)構(gòu)詳解

    本文給大家匯總介紹了Python中的5種內(nèi)建數(shù)據(jù)結(jié)構(gòu)以及操作示例,非常的詳細,有需要的小伙伴可以參考下。
    2016-02-02
  • python處理yaml文件的操作方法

    python處理yaml文件的操作方法

    yaml文件是一種數(shù)據(jù)序列化語言,廣泛用于配置文件、日志文件、等,本文給大家介紹python處理yaml文件的操作方法,感興趣的朋友跟隨小編一起看看吧
    2023-11-11
  • Python如何對接文心一言

    Python如何對接文心一言

    這篇文章主要為大家介紹了Python如何對接文心一言的操作實例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2024-01-01
  • python zip()函數(shù)的使用示例

    python zip()函數(shù)的使用示例

    這篇文章主要介紹了python zip()的使用示例,幫助大家更好的理解和學習python,感興趣的朋友可以了解下
    2020-09-09
  • Python使用擴展庫pywin32實現(xiàn)批量文檔打印實例

    Python使用擴展庫pywin32實現(xiàn)批量文檔打印實例

    這篇文章主要介紹了Python使用擴展庫pywin32實現(xiàn)批量文檔打印實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-04-04
  • 運用python去除圖片水印

    運用python去除圖片水印

    本文介紹了如何運用python去除圖片的水印,文中使用圖片以及代碼詳細的介紹了兩種去除的方法,感興趣的朋友可以自己參考一下
    2021-08-08
  • pandas 像SQL一樣使用WHERE IN查詢條件說明

    pandas 像SQL一樣使用WHERE IN查詢條件說明

    這篇文章主要介紹了pandas 像SQL一樣使用WHERE IN查詢條件說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06

最新評論