欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解Python安裝tesserocr遇到的各種問題及解決辦法

 更新時間:2019年03月07日 14:52:01   作者:雨軒戀i  
這篇文章主要介紹了詳解Python安裝tesserocr遇到的各種問題及解決辦法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

Tesseract的安裝及配置

在Python爬蟲過程中,難免遇到各種各樣的驗證碼問題,最簡單的就是​這種驗證碼了,那么在遇到驗證碼的時候該怎么辦呢?我們就需要OCR技術(shù)了,OCR-即Optical Character Recognition光學字符識別,是指通過掃描字符,然后將其形狀翻譯成電子文本的過程。而tesserocr是Python的一個OCR識別庫,所以在安裝tesserocr之前,我們需要安裝tesseract這個東西

下載地址:https://digi.bib.uni-mannheim.de/tesseract/可以選擇下載不帶dev的穩(wěn)定版本,我下載的是3.05.01版本的,不過這個版本的可能比較早了,識別能力不是很厲害,讀者可以選擇下載最新版本的3.05.02,識別能力應(yīng)該會好很多。

下載完就是一路雙擊,在最后的Additional Language data(download)選上這個選項,是OCR支持各種語言的包,然后繼續(xù)安裝,直到安裝成功。

我的安裝路徑為:G:\Program Files (x86)\Tesseract-OCR


安裝完成后就得需要配置環(huán)境變量,打開環(huán)境變量設(shè)置,在path中加入如下

​的設(shè)置,這樣tesseract就安裝成功并配置完成了、

tesserocr庫的安裝

剛開始我直接在cmd下輸入 pip install tesserocr 很不幸報錯了,報錯類似于如下。。。因為之前我的報錯,沒有截圖。所以。。


就是類似于這種的截圖,這該怎么辦,難道要去下載visual C++嗎?我們有更好的解決方法,下載對應(yīng)的.whl文件

下載地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases一定要下載對應(yīng)版本的


我的是3.5.1,所以我下載的是這個版本的。讀者可以自行選擇。

我的tesserocr-2.2.2-cp36-cp36m-win_amd64.whl文件下載在G盤根目錄下,然后在cmd里輸入 pip install G:\tesserocr-2.2.2-cp36-cp36m-win_amd64.whl 開始安裝whl文件,發(fā)現(xiàn)報錯了。提示不能安裝whl文件。。原來是沒有安裝wheel。

然后我就去安裝了wheel 直接 pip install wheel即可。

安裝成功 在輸入pip install G:\tesserocr-2.2.2-cp36-cp36m-win_amd64.whl 發(fā)現(xiàn)開始安裝了。

哎心累啊,總算弄好了。但是,我在pycharm中調(diào)用tesserocr 這個庫,他又提示報錯了,這是為什么呢?百度了一下最終解決。

原來需要在pycharm下的terrminal下輸入如下圖:

如果報錯了還得有一步操作。

將Tesseract-OCR下的tessdata文件復制到你的Python安裝路徑的scripts下:


這樣


這下應(yīng)該就徹底安裝成功了。。

這下在pycharm里總算不會報錯了,我們來試一下識別這兩張圖片的效果



代碼:

from PIL import Image
import tesserocr

imag=Image.open('test.jpg')
print(tesserocr.image_to_text(imag))
imag1=Image.open('image.png')
print(tesserocr.image_to_text(imag1))

輸出結(jié)果如下:

將762408識別成了162408 我也很無奈呀。。。可能是因為版本太菜了吧

以上就是我安裝tesserocr遇到的問題及解決辦法了。其實還可以裝pytesseract這個庫。

安裝pytesseract庫

安裝這個pytesseract庫可比tesserocr方便多了,根本不會報錯,直接pip install pytesseract 完事。。pycharm直接搜索庫


然后下載就完事,多省事。。。。

看一下識別效果,還是同樣的兩張圖片。

代碼:

import pytesseract
from PIL import Image
import tesserocr

im=Image.open('test.jpg')
print(pytesseract.image_to_string(im))
im1=Image.open('image.png')
print(pytesseract.image_to_string(im1))

運行結(jié)果:

運行結(jié)果一樣的,所以我推薦大家使用pytesseract這個庫。

驗證碼識別問題

我打開知乎登錄界面,下載了一張驗證碼圖片:開始識別它。

代碼如下:

import pytesseract
from PIL import Image
import tesserocr



#簡單驗證 特別垃圾
image=Image.open('3.jpg')
result=tesserocr.image_to_text(image)
print(result)


#完全驗證 也不咋地。。
image1=Image.open('3.jpg')
image1=image1.convert('L')
threshold=127
table=[]
for i in range(256):
 if i <threshold:
  table.append(0)
 else:
  table.append(1)
image2=image1.point(table,'1')
image2.show() #二值化灰度處理圖片顯示
result=pytesseract.image_to_string(image2)
print(result)

運行結(jié)果:

​都識別失敗了,,,

賊無語,但是灰度化和二值化后的圖片已經(jīng)很清晰了。。

我都能看出來是H83G了,你識別個H535是個什么鬼。。綜上,這個庫吧,可能效果也不是那么好。先湊活用吧。。

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Django零基礎(chǔ)入門之路由path和re_path詳解

    Django零基礎(chǔ)入門之路由path和re_path詳解

    這篇文章主要介紹了Django零基礎(chǔ)入門之路由path和re_path,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-09-09
  • Linux下python制作名片示例

    Linux下python制作名片示例

    這篇文章主要介紹了Linux下python制作名片示例的相關(guān)資料,需要的朋友可以參考下
    2018-07-07
  • python實現(xiàn)帶錯誤處理功能的遠程文件讀取方法

    python實現(xiàn)帶錯誤處理功能的遠程文件讀取方法

    這篇文章主要介紹了python實現(xiàn)帶錯誤處理功能的遠程文件讀取方法,涉及Python使用socket操作遠程文件的相關(guān)技巧,非常具有實用價值,需要的朋友可以參考下
    2015-04-04
  • 詳解Python如何獲取視頻文件的大小和時長

    詳解Python如何獲取視頻文件的大小和時長

    這篇文章主要為大家詳細介紹了Python如何實現(xiàn)獲取視頻文件的大小和時長,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起了解一下
    2023-03-03
  • 基于pytorch padding=SAME的解決方式

    基于pytorch padding=SAME的解決方式

    今天小編就為大家分享一篇基于pytorch padding=SAME的解決方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-02-02
  • 關(guān)于python pyqt5安裝失敗問題的解決方法

    關(guān)于python pyqt5安裝失敗問題的解決方法

    這篇文章主要給大家介紹了關(guān)于python pyqt5安裝失敗問題的解決方法,文中給出了詳細的解決過程與解決方法,對同樣遇到這個問題的朋友們具有一定的參考學習價值,需要的朋友們跟著小編來一起學習學習吧。
    2017-08-08
  • 分享10個拿來即用的Python自動化腳本

    分享10個拿來即用的Python自動化腳本

    這篇文章主要來和大家分享10個拿來即用的Python自動化腳本,文中的示例代碼講解詳細,具有一定的借鑒價值,感興趣的小伙伴可以跟隨小編一起學習一下
    2023-12-12
  • Windows系統(tǒng)Python直接調(diào)用C++ DLL的方法

    Windows系統(tǒng)Python直接調(diào)用C++ DLL的方法

    這篇文章主要介紹了Windows系統(tǒng)Python直接調(diào)用C++ DLL文件的方法,本文給大家介紹的非常詳細,具有一定的參考借鑒價值 ,需要的朋友可以參考下
    2019-08-08
  • 進行數(shù)據(jù)處理的6個?Python?代碼塊分享

    進行數(shù)據(jù)處理的6個?Python?代碼塊分享

    這篇文章主要介紹了進行數(shù)據(jù)處理6個Python代碼塊的分享,分享內(nèi)容有選取有空值的行、快速替換列值、對列進行分區(qū)、將一列分為多列等內(nèi)容,需要的朋友可以參考一下
    2022-04-04
  • 關(guān)于Python自動化操作Excel

    關(guān)于Python自動化操作Excel

    這篇文章主要介紹了關(guān)于Python自動化操作Excel, Python 是一種功能強大的編程語言,可以用于許多任務(wù),包括處理 Excel 文件,需要的朋友可以參考下
    2023-04-04

最新評論