欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

如何基于Python代碼實(shí)現(xiàn)高精度免費(fèi)OCR工具

 更新時(shí)間:2020年06月18日 10:58:44   作者:guran0822  
這篇文章主要介紹了如何基于Python代碼實(shí)現(xiàn)高精度免費(fèi)OCR工具,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

近期Github開(kāi)源了一款基于Python開(kāi)發(fā)、名為T(mén)extshot的截圖工具,剛開(kāi)源不到半個(gè)月已經(jīng)500+Star。

這兩天抽空看了一下Textshot的源碼,的確是一個(gè)值得介紹的項(xiàng)目。

相對(duì)于大多數(shù)OCR工具復(fù)雜工程、差強(qiáng)人意的效果,Textshot具有明顯的優(yōu)勢(shì),

  • 項(xiàng)目簡(jiǎn)單
  • 技術(shù)點(diǎn)豐富

項(xiàng)目簡(jiǎn)單

Textshot整個(gè)項(xiàng)目只有1個(gè)Python文件、139行代碼,沒(méi)有復(fù)雜的第三方庫(kù)應(yīng)用,也不涉及過(guò)多后端算法的調(diào)用。

技術(shù)點(diǎn)豐富

Textshot這個(gè)項(xiàng)目雖然只有短短的139行代碼,但是,卻涉及Python中多個(gè)方面的知識(shí)應(yīng)用,

  • UI開(kāi)發(fā)
  • 截圖工具開(kāi)發(fā)
  • 后端引擎調(diào)用

通過(guò)這短短的項(xiàng)目,你不僅可以了解如何利用PyQt5實(shí)現(xiàn)一個(gè)用戶界面,還可以學(xué)會(huì)如何使用pyscreenshot開(kāi)發(fā)一款自己的截圖工具。此外,還能夠?qū)W會(huì)后端tesseract的調(diào)用。

換句話說(shuō),這短短的139行代碼囊括了前端至后端的整個(gè)流程,而且涉及到截圖和OCR兩款工具的銜接。因此,Textshot雖然工程不大,卻是一個(gè)非常完備、值得學(xué)習(xí)的項(xiàng)目。

本文就來(lái)剖析這個(gè)項(xiàng)目的源代碼,教你一步一步實(shí)現(xiàn)自用且永久免費(fèi)的截圖&OCR工具!

tesseract

目前OCR工具數(shù)不勝數(shù),但是大多數(shù)都是在相同的后端算法上面進(jìn)行了不同的封裝而已。而真正在OCR核心做的較好、值得大書(shū)特書(shū)的,那么一定非tesseract莫屬

tesseract早在1985就已經(jīng)開(kāi)始由HP實(shí)驗(yàn)室開(kāi)始研發(fā),而在1995年更是被評(píng)為最為準(zhǔn)確的3款OCR工具之一。此后,tesseract被開(kāi)源,經(jīng)過(guò)Google對(duì)其不斷的進(jìn)行優(yōu)化和升級(jí),它目前已經(jīng)成為OCR方面一款標(biāo)桿性的工具。很多開(kāi)源或者付費(fèi)的OCR工具,都是直接調(diào)用tesseract或者對(duì)其進(jìn)行稍許優(yōu)化。

而今天介紹的Textshot就是直接調(diào)用tesseract后端引擎進(jìn)行OCR識(shí)別。因此,Textshot只是實(shí)現(xiàn)了一款截圖工具,起到前后端的串聯(lián)作用,在OCR識(shí)別算法方面并沒(méi)有做任何工作。

tesseract安裝

由于Textshot的OCR識(shí)別需要調(diào)用tesseract后端引擎,所以,首先需要安裝tesseract。

Windows版安裝可以直接訪問(wèn)下載鏈接[1].

Mac下可以使用Homebrew進(jìn)行安裝,

brew install tesseract 

Textshot

Textshot是一款截圖識(shí)別文字的OCR工具,因此,它主要涉及2個(gè)環(huán)境,

截圖

OCR識(shí)別

Textshot首先通過(guò)截圖獲取需要進(jìn)行文字識(shí)別的圖像,然后對(duì)這副圖像進(jìn)行OCR文字識(shí)別,輸出識(shí)別結(jié)果。

前面已經(jīng)介紹了,Textshot的OCR識(shí)別階段調(diào)用的是tesseract,所以只需要1行代碼即可完成。

因此,Textshot的工作主要是圍繞前端窗口和截圖工具的實(shí)現(xiàn)方面。

截圖工具

截圖工具是我們經(jīng)常會(huì)用到的一種工具,如何實(shí)現(xiàn)一款截圖工具?

很多人會(huì)把它想的非常復(fù)雜,其實(shí),Python中有很多可以實(shí)現(xiàn)截圖的庫(kù)或者函數(shù),例如,pyscreenshot或者pillow中的ImageGrab函數(shù),它的調(diào)用方式如下,

shot = ImageGrab.grab(bbox=(x1, y1, x2, y2))

也就是說(shuō),我們只需要把鼠標(biāo)框選的起點(diǎn)和終點(diǎn)坐標(biāo)傳給grab方法就可以實(shí)現(xiàn)截圖功能。

那么,現(xiàn)在問(wèn)題就轉(zhuǎn)化為如何獲取鼠標(biāo)框選的起點(diǎn)和終點(diǎn)?

Textshot通過(guò)調(diào)用PyQt5并繼承QWidget來(lái)實(shí)現(xiàn)鼠標(biāo)框選過(guò)程中的一些方法來(lái)獲取框選的起點(diǎn)和終點(diǎn)。

Textshot繼承和重寫(xiě)QWidget方法主要包括如下幾個(gè),

  • keyPressEvent(self, event):鍵盤(pán)響應(yīng)函數(shù)
  • paintEvent(self, event):UI繪制函數(shù)
  • mousePressEvent(self, event):鼠標(biāo)點(diǎn)擊事件
  • mouseMoveEvent(self, event):鼠標(biāo)移動(dòng)事件
  • mouseReleaseEvent(self, event):鼠標(biāo)釋放事件

可以看出,上面重寫(xiě)的方法以及囊括了截圖過(guò)程中涉及的各個(gè)動(dòng)作,

  • 點(diǎn)擊鼠標(biāo)
  • 拖動(dòng)、繪制截圖框
  • 釋放鼠標(biāo)
class Snipper(QtWidgets.QWidget):
  def __init__(self, parent=None, flags=Qt.WindowFlags()):
    super().__init__(parent=parent, flags=flags)
 
    self.setWindowTitle("TextShot")
    self.setWindowFlags(
      Qt.FramelessWindowHint | Qt.WindowStaysOnTopHint | Qt.Dialog
    )
 
    self.is_macos = sys.platform.startswith("darwin")
    if self.is_macos:
      self.setWindowState(self.windowState() | Qt.WindowMaximized)
    else:
      self.setWindowState(self.windowState() | Qt.WindowFullScreen)
 
    self.setStyleSheet("background-color: black")
    self.setWindowOpacity(0.5)
 
    QtWidgets.QApplication.setOverrideCursor(QtGui.QCursor(QtCore.Qt.CrossCursor))
 
    self.start, self.end = QtCore.QPoint(), QtCore.QPoint()
 
  def keyPressEvent(self, event):
    if event.key() == Qt.Key_Escape:
      QtWidgets.QApplication.quit()
 
    return super().keyPressEvent(event)
 
  def paintEvent(self, event):
    if self.start == self.end:
      return super().paintEvent(event)
 
    painter = QtGui.QPainter(self)
    painter.setPen(QtGui.QPen(QtGui.QColor(255, 255, 255), 3))
    painter.setBrush(QtGui.QColor(255, 255, 255, 100))
 
    if self.is_macos:
      start, end = (self.mapFromGlobal(self.start), self.mapFromGlobal(self.end))
    else:
      start, end = self.start, self.end
 
    painter.drawRect(QtCore.QRect(start, end))
    return super().paintEvent(event)
 
  def mousePressEvent(self, event):
    self.start = self.end = QtGui.QCursor.pos()
    self.update()
    return super().mousePressEvent(event)
 
  def mouseMoveEvent(self, event):
    self.end = QtGui.QCursor.pos()
    self.update()
    return super().mousePressEvent(event)
 
  def mouseReleaseEvent(self, event):
    if self.start == self.end:
      return super().mouseReleaseEvent(event)
 
    x1, x2 = sorted((self.start.x(), self.end.x()))
    y1, y2 = sorted((self.start.y(), self.end.y()))

然后啟動(dòng)截圖界面,

QtCore.QCoreApplication.setAttribute(Qt.AA_DisableHighDpiScaling)
app = QtWidgets.QApplication(sys.argv)
window = QtWidgets.QMainWindow()
snipper = Snipper(window)
snipper.show()

用戶拖動(dòng)、框選窗口,會(huì)獲取窗口的起點(diǎn)和終點(diǎn)的坐標(biāo),這時(shí)候可以調(diào)用下面語(yǔ)句進(jìn)行截圖,獲取需要OCR識(shí)別的文本圖像,

shot = ImageGrab.grab(bbox=(x1, y1, x2, y2))  

OCR文字識(shí)別

通過(guò)ImageGrab.grab截取到文本圖像shot,下一步就是要把圖像內(nèi)容輸入給后端的tesseract引擎,讓它把圖像轉(zhuǎn)化為字符串

result = pytesseract.image_to_string(img, timeout=2, lang=(sys.argv[1] if len(sys.argv) > 1 else None))

到這里,就實(shí)現(xiàn)了一款準(zhǔn)確度高、永久免費(fèi)的OCR工具。

回顧一下Textshot的項(xiàng)目,我們會(huì)發(fā)現(xiàn)截圖坐標(biāo)范圍內(nèi)的圖像、OCR識(shí)別只需要2行代碼,大多數(shù)都是在圍繞獲取窗口起點(diǎn)和終點(diǎn)坐標(biāo)在開(kāi)發(fā)。換句話說(shuō),Textshot這個(gè)項(xiàng)目對(duì)OCR核心部分并沒(méi)有做任何更改,只是在產(chǎn)品包裝方面做了一些巧妙的工作。

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python 鍵盤(pán)事件詳解

    Python 鍵盤(pán)事件詳解

    這篇文章主要為大家詳細(xì)介紹了Python的 鍵盤(pán)事件,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-11-11
  • python破解zip加密文件的方法

    python破解zip加密文件的方法

    這篇文章主要介紹了python破解zip加密文件的方法,本文圖文并茂給大家介紹的非常詳細(xì),需要的朋友可以參考下
    2018-05-05
  • python hash每次調(diào)用結(jié)果不同的原因

    python hash每次調(diào)用結(jié)果不同的原因

    這篇文章主要介紹了python hash每次調(diào)用結(jié)果不同的原因,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-11-11
  • python3獲取當(dāng)前目錄的實(shí)現(xiàn)方法

    python3獲取當(dāng)前目錄的實(shí)現(xiàn)方法

    這篇文章主要介紹了python3獲取當(dāng)前目錄的實(shí)現(xiàn)方法,文中給大家提到了python3獲取當(dāng)前目錄和上級(jí)目錄的方法,需要的朋友可以參考下
    2019-07-07
  • python根據(jù)unicode判斷語(yǔ)言類(lèi)型實(shí)例代碼

    python根據(jù)unicode判斷語(yǔ)言類(lèi)型實(shí)例代碼

    這篇文章主要介紹了python根據(jù)unicode判斷語(yǔ)言類(lèi)型實(shí)例代碼,具有一定借鑒價(jià)值,需要的朋友可以參考下
    2018-01-01
  • python代碼xml轉(zhuǎn)txt實(shí)例

    python代碼xml轉(zhuǎn)txt實(shí)例

    這篇文章主要介紹了python代碼xml轉(zhuǎn)txt實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-03-03
  • 最新評(píng)論