欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 圖片文字識別的實現(xiàn)之PaddleOCR

 更新時間:2021年11月16日 15:13:02   作者:劍客阿良_ALiang  
OCR方向的工程師,之前一定聽說過PaddleOCR這個項目,其主要推薦的PP-OCR算法更是被國內外企業(yè)開發(fā)者廣泛應用,短短半年時間,累計Star數(shù)量已超過15k,頻頻登上Github Trending和Paperswithcode 日榜月榜第一

前言

什么是OCR?

光學字符識別(Optical Character Recognition, OCR),是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。簡而言之,檢測圖像中的文本資料,并且識別出文本的內容。

那么有哪些應用場景呢?

其實我們日常生活中處處都有ocr的影子,比如在疫情期間身份證識別錄入信息、車輛車牌號識別、自動駕駛等。我們的生活中,機器學習已經(jīng)越來越多的扮演著重要角色,也不再是神秘的東西。

OCR的技術路線是什么呢?

ocr的運行方式如下圖,輸入->圖像預處理->文字檢測->文本識別->輸出。

本文主要是介紹一個博主使用的比較好的OCR開源項目,在這里分享給大家——PaddleOCR。

項目Github地址: PaddleOCR地址

我會按照剛接觸的狀態(tài),梳理一下驗證使用該項目的過程。

項目使用

先把項目從github上clone下來,慢慢分析。

項目結構

首先我們看一下項目的構造。

發(fā)現(xiàn)項目有中文的介紹說明,這就很方便了,點開按照官方的說明開始操作。

環(huán)境部署

點開README.md,,可以從文檔教程中看到第一步就是教你如何安裝環(huán)境。

由于內容過多,我就做個概括,方便大家直接上手。

1、安裝Anaconda,構造虛擬環(huán)境

這里可以參考我的另一篇文章,里面很詳細:Python 機器學習第一章環(huán)境配置圖解流程

官方給的是python3.8的虛擬環(huán)境,我們也構造一個,打開Anaconda Prompt。

輸入命令:

conda create -n paddle_env python=3.8

激活環(huán)境:

conda activate paddle_env

2、依賴包下載

paddlepaddle安裝

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

layoutparser安裝

pip3 install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl

Shapely安裝,這個需要下載,下載地址:Shapely下載地址

我選的是這個

安裝命令:

pip install Shapely-1.8.0-cp38-cp38-win_amd64.whl

paddleocr安裝

pip install paddleocr -i https://mirror.baidu.com/pypi/simple

好的,環(huán)境有點多,都安裝好了就開始上手使用吧。

測試代碼

官方給出了兩種模式,一是命令行執(zhí)行,一是代碼執(zhí)行。為了直觀的看到配置,我這里使用的是代碼模式。

準備一張帶文字的圖片

測試代碼如下

#!/user/bin/env python
# coding=utf-8
"""
@project : ocr_paddle
@author  : huyi
@file   : test.py
@ide    : PyCharm
@time   : 2021-11-15 14:56:20
"""
from paddleocr import PaddleOCR, draw_ocr
 
# Paddleocr目前支持的多語言語種可以通過修改lang參數(shù)進行切換
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, use_gpu=False,
                lang="ch")  # need to run only once to download and load model into memory
img_path = './data/2.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
    # print(line[-1][0], line[-1][1])
    print(line)
 
# 顯示結果
from PIL import Image
 
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='./fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

代碼說明

1、因為我的電腦沒有顯卡,所以設置了use_gpu=False。

2、顯示結果部分會將識別的文字用框標出來,并且展示識別的結果。

驗證一下

我們看到,打印的內容有識別出來的每句話所在的圖片位置,以及識別結果和可信度。而上面的結果圖中,將每句話對應的文字都框了出來。效果很不錯!

參數(shù)補充

官方還給出了一些參數(shù),可以調整輸出的內容??梢詤⒖磓uickstart.md文件。參數(shù)補充:

- 單獨使用檢測:設置`--rec`為`false`
- 單獨使用識別:設置`--det`為`false`

官方還提供一個標準的json結構輸出數(shù)據(jù)

PP-Structure的返回結果為一個dict組成的list,示例如下

```shell
[{ 'type': 'Text',
'bbox': [34, 432, 345, 462],
'res': ([[36.0, 437.0, 341.0, 437.0, 341.0, 446.0, 36.0, 447.0], [41.0, 454.0, 125.0, 453.0, 125.0, 459.0, 41.0, 460.0]],
[('Tigure-6. The performance of CNN and IPT models using difforen', 0.90060663), ('Tent ', 0.465441)])
}
]
```

總結

總的來說,這個項目還是很有意思的,訓練的部分我就不多贅述了,畢竟準備數(shù)據(jù)挺麻煩的?;仡^我再想想這個項目可不可以魔改成好用的工具。

分享:

我們根本不需要最后的落腳點,只要不斷前進就好了,只要不停下,道路就會不斷延伸?!哆M擊的巨人》

如果本文對你有幫助的話,請不要吝嗇你的贊,謝謝!

到此這篇關于Python 圖片文字識別的實現(xiàn)之PaddleOCR的文章就介紹到這了,更多相關Python 文字識別內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • python求解三角形第三邊長實例

    python求解三角形第三邊長實例

    這篇文章主要介紹了python求解三角形第三邊長實例,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • python中tab鍵是什么意思

    python中tab鍵是什么意思

    在本篇內容里小編給大家整理了關于python中的tab鍵表示什么意思的相關內容,需要的朋友們可以參考學習下。
    2020-06-06
  • python中如何實現(xiàn)鏈式調用

    python中如何實現(xiàn)鏈式調用

    這篇文章主要介紹了python中如何實現(xiàn)鏈式調用,幫助大家更好的理解和學習使用python,感興趣的朋友可以了解下
    2021-03-03
  • python調用接口的4種方式代碼實例

    python調用接口的4種方式代碼實例

    這篇文章主要介紹了python調用接口的4種方式代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-11-11
  • python正則-re的用法詳解

    python正則-re的用法詳解

    這篇文章主要介紹了python正則-re的用法詳解,文中給大家提到了正則中的修飾符以及它的功能,需要的朋友可以參考下
    2019-07-07
  • Pywinauto基礎教程之控件操作

    Pywinauto基礎教程之控件操作

    這篇文章主要給大家介紹了關于Pywinauto基礎教程之控件操作的相關資料,pywinauto庫是一個用于在Windows上自動化操作的庫,文中通過代碼示例介紹的非常詳細,需要的朋友可以參考下
    2023-08-08
  • 用Pygal繪制直方圖代碼示例

    用Pygal繪制直方圖代碼示例

    這篇文章主要介紹了用Pygal繪制直方圖代碼示例,具有一定借鑒價值,需要的朋友可以了解下。
    2017-12-12
  • 20行Python代碼實現(xiàn)一款永久免費PDF編輯工具的實現(xiàn)

    20行Python代碼實現(xiàn)一款永久免費PDF編輯工具的實現(xiàn)

    這篇文章主要介紹了20行Python代碼實現(xiàn)一款永久免費PDF編輯工具的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-08-08
  • 使用python實現(xiàn)數(shù)組、鏈表、隊列、棧的方法

    使用python實現(xiàn)數(shù)組、鏈表、隊列、棧的方法

    數(shù)據(jù)結構是指相互之間存在著一種或多種關系的數(shù)據(jù)元素的集合和該集合中數(shù)據(jù)元素之間的關系組成。這篇文章主要介紹了使用python實現(xiàn)數(shù)組、鏈表、隊列、棧的相關知識,需要的朋友可以參考下
    2019-12-12
  • Python庫functools示例詳解

    Python庫functools示例詳解

    Python?的?functools?模塊提供了一些常用的高階函數(shù),也就是用于處理其它函數(shù)的特殊函數(shù)。換言之,就是能使用該模塊對?所有可調用對象(?即?參數(shù)?或(和)?返回值?為其他函數(shù)的函數(shù)?)?進行處理,這篇文章主要介紹了Python庫functools詳解,需要的朋友可以參考下
    2023-01-01

最新評論