欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python?paddleocr快速使用及參數(shù)配置詳解

 更新時間:2024年06月04日 17:11:22   作者:ElaineTiger  
PaddleOCR是基于PaddlePaddle深度學習框架的開源OCR工具,但它提供了推理模型/訓練模型/預訓練模型,用戶可以直接使用推理模型進行識別,也可以對訓練模型或預訓練模型進行再訓練,這篇文章主要介紹了Python?paddleocr快速使用及參數(shù)詳解,需要的朋友可以參考下

其它相關推薦:
PaddleOCR模型訓練及使用詳細教程

官方網(wǎng)址:https://github.com/PaddlePaddle/PaddleOCR

  PaddleOCR是基于PaddlePaddle深度學習框架的開源OCR工具,但它提供了推理模型/訓練模型/預訓練模型,用戶可以直接使用推理模型進行識別,也可以對訓練模型或預訓練模型進行再訓練。支持約80種語言的文本識別,并具有較高的準確性和速度。

1. paddleocr快速使用

1.1 使用默認模型路徑

import cv2
from paddleocr import PaddleOCR
# 使用默認模型路徑
paddleocr = PaddleOCR(lang='ch', show_log=False)
img = cv2.imread('ch2.jpg')  # 打開需要識別的圖片
result = paddleocr.ocr(img)
for i in range(len(result[0])):
    print(result[0][i][1][0])   # 輸出識別結果

1.2 設定模型路徑

import cv2
from paddleocr import PaddleOCR
# 設定模型路徑
paddleocr = PaddleOCR(lang='ch', show_log=False, 
                      det_model_dir='.paddleocr\\whl\\det\\ch\\ch_PP-OCRv4_det_infer',
                      rec_model_dir='.paddleocr\\whl\\rec\\ch\\ch_PP-OCRv4_rec_infer') # 推理模型路徑
img = cv2.imread('ch2.jpg')  # 打開需要識別的圖片
result = paddleocr.ocr(img)
for i in range(len(result[0])):
    print(result[0][i][1][0])   # 輸出識別結果

2. PaddleOCR其他參數(shù)介紹

PaddleOCR模型推理參數(shù)解釋

在使用PaddleOCR進行模型推理時,可以自定義修改參數(shù),來修改模型、數(shù)據(jù)、預處理、后處理等內容,詳細的參數(shù)解釋如下所示。

全局信息

參數(shù)名稱類型默認值含義
image_dirstr無,必須顯式指定圖像或者文件夾路徑
page_numint0當輸入類型為pdf文件時有效,指定預測前面page_num頁,默認預測所有頁
vis_font_pathstr“./doc/fonts/simfang.ttf”用于可視化的字體路徑
drop_scorefloat0.5識別得分小于該值的結果會被丟棄,不會作為返回結果
use_pdservingboolFalse是否使用Paddle Serving進行預測
warmupboolFalse是否開啟warmup,在統(tǒng)計預測耗時的時候,可以使用這種方法
draw_img_save_dirstr“./inference_results”系統(tǒng)串聯(lián)預測OCR結果的保存文件夾
save_crop_resboolFalse是否保存OCR的識別文本圖像
crop_res_save_dirstr“./output”保存OCR識別出來的文本圖像路徑
use_mpboolFalse是否開啟多進程預測
total_process_numint6開啟的進程數(shù),use_mpTrue時生效
process_idint0當前進程的id號,無需自己修改
benchmarkboolFalse是否開啟benchmark,對預測速度、顯存占用等進行統(tǒng)計
save_log_pathstr“./log_output/”開啟benchmark時,日志結果的保存文件夾
show_logboolTrue是否顯示預測中的日志信息
use_onnxboolFalse是否開啟onnx預測

預測引擎相關

參數(shù)名稱類型默認值含義
use_gpuboolTrue是否使用GPU進行預測
ir_optimboolTrue是否對計算圖進行分析與優(yōu)化,開啟后可以加速預測過程
use_tensorrtboolFalse是否開啟tensorrt
min_subgraph_sizeint15tensorrt中最小子圖size,當子圖的size大于該值時,才會嘗試對該子圖使用trt engine計算
precisionstrfp32預測的精度,支持fp32, fp16, int8 3種輸入
enable_mkldnnboolTrue是否開啟mkldnn
cpu_threadsint10開啟mkldnn時,cpu預測的線程數(shù)

文本檢測模型相關

參數(shù)名稱類型默認值含義
det_algorithmstr“DB”文本檢測算法名稱,目前支持DB, EAST, SAST, PSE, DB++, FCE
det_model_dirstrxx檢測inference模型路徑
det_limit_side_lenint960檢測的圖像邊長限制
det_limit_typestr“max”檢測的邊長限制類型,目前支持minmax,min表示保證圖像最短邊不小于det_limit_side_lenmax表示保證圖像最長邊不大于det_limit_side_len

其中,DB算法相關參數(shù)如下

參數(shù)名稱類型默認值含義
det_db_threshfloat0.3DB輸出的概率圖中,得分大于該閾值的像素點才會被認為是文字像素點
det_db_box_threshfloat0.6檢測結果邊框內,所有像素點的平均得分大于該閾值時,該結果會被認為是文字區(qū)域
det_db_unclip_ratiofloat1.5Vatti clipping算法的擴張系數(shù),使用該方法對文字區(qū)域進行擴張
max_batch_sizeint10預測的batch size
use_dilationboolFalse是否對分割結果進行膨脹以獲取更優(yōu)檢測效果
det_db_score_modestr“fast”DB的檢測結果得分計算方法,支持fastslow,fast是根據(jù)polygon的外接矩形邊框內的所有像素計算平均得分,slow是根據(jù)原始polygon內的所有像素計算平均得分,計算速度相對較慢一些,但是更加準確一些。

EAST算法相關參數(shù)如下

參數(shù)名稱類型默認值含義
det_east_score_threshfloat0.8EAST后處理中score map的閾值
det_east_cover_threshfloat0.1EAST后處理中文本框的平均得分閾值
det_east_nms_threshfloat0.2EAST后處理中nms的閾值

SAST算法相關參數(shù)如下

參數(shù)名稱類型默認值含義
det_sast_score_threshfloat0.5SAST后處理中的得分閾值
det_sast_nms_threshfloat0.5SAST后處理中nms的閾值
det_box_typestrquad是否多邊形檢測,彎曲文本場景(如Total-Text)設置為’poly’

PSE算法相關參數(shù)如下

參數(shù)名稱類型默認值含義
det_pse_threshfloat0.0對輸出圖做二值化的閾值
det_pse_box_threshfloat0.85對box進行過濾的閾值,低于此閾值的丟棄
det_pse_min_areafloat16box的最小面積,低于此閾值的丟棄
det_box_typestr“quad”返回框的類型,quad:四點坐標,poly: 彎曲文本的所有點坐標
det_pse_scaleint1輸入圖像相對于進后處理的圖的比例,如640*640的圖像,網(wǎng)絡輸出為160*160,scale為2的情況下,進后處理的圖片shape為320*320。這個值調大可以加快后處理速度,但是會帶來精度的下降

文本識別模型相關

參數(shù)名稱類型默認值含義
rec_algorithmstr“CRNN”文本識別算法名稱,目前支持CRNN, SRN, RARE, NETR, SAR, ViTSTR, ABINet, VisionLAN, SPIN, RobustScanner, SVTR, SVTR_LCNet
rec_model_dirstr無,如果使用識別模型,該項是必填項識別inference模型路徑
rec_image_shapestr“3,48,320”識別時的圖像尺寸
rec_batch_numint6識別的batch size
max_text_lengthint25識別結果最大長度,在SRN中有效
rec_char_dict_pathstr“./ppocr/utils/ppocr_keys_v1.txt”識別的字符字典文件
use_space_charboolTrue是否包含空格,如果為True,則會在最后字符字典中補充空格字符

端到端文本檢測與識別模型相關

參數(shù)名稱類型默認值含義
e2e_algorithmstr“PGNet”端到端算法名稱,目前支持PGNet
e2e_model_dirstr無,如果使用端到端模型,該項是必填項端到端模型inference模型路徑
e2e_limit_side_lenint768端到端的輸入圖像邊長限制
e2e_limit_typestr“max”端到端的邊長限制類型,目前支持min, max,min表示保證圖像最短邊不小于e2e_limit_side_len,max表示保證圖像最長邊不大于e2e_limit_side_len
e2e_pgnet_score_threshfloat0.5端到端得分閾值,小于該閾值的結果會被丟棄
e2e_char_dict_pathstr“./ppocr/utils/ic15_dict.txt”識別的字典文件路徑
e2e_pgnet_valid_setstr“totaltext”驗證集名稱,目前支持totaltext, partvgg,不同數(shù)據(jù)集對應的后處理方式不同,與訓練過程保持一致即可
e2e_pgnet_modestr“fast”PGNet的檢測結果得分計算方法,支持fastslowfast是根據(jù)polygon的外接矩形邊框內的所有像素計算平均得分,slow是根據(jù)原始polygon內的所有像素計算平均得分,計算速度相對較慢一些,但是更加準確一些。

方向分類器模型相關

參數(shù)名稱類型默認值含義
use_angle_clsboolFalse是否使用方向分類器
cls_model_dirstr無,如果需要使用,則必須顯式指定路徑方向分類器inference模型路徑
cls_image_shapestr“3,48,192”預測尺度
label_listlist[‘0’, ‘180’]class id對應的角度值
cls_batch_numint6方向分類器預測的batch size
cls_threshfloat0.9預測閾值,模型預測結果為180度,且得分大于該閾值時,認為最終預測結果為180度,需要翻轉

其它相關推薦:
PaddleOCR模型訓練及使用詳細教程

到此這篇關于Python paddleocr快速使用及參數(shù)詳解的文章就介紹到這了,更多相關Python paddleocr使用內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Python實戰(zhàn)之單詞打卡統(tǒng)計

    Python實戰(zhàn)之單詞打卡統(tǒng)計

    這篇文章主要介紹了Python實戰(zhàn)之單詞打卡統(tǒng)計,文中有非常詳細的代碼示例,對正在學習python的小伙伴們有非常好的幫助,需要的朋友可以參考下
    2021-04-04
  • 檢測python爬蟲時是否代理ip偽裝成功的方法

    檢測python爬蟲時是否代理ip偽裝成功的方法

    這篇文章主要介紹了檢測python爬蟲時是否代理ip偽裝成功的方法以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。,需要的朋友可以參考下
    2019-07-07
  • Python 元組拆包示例(Tuple Unpacking)

    Python 元組拆包示例(Tuple Unpacking)

    今天小編就為大家分享一篇Python 元組拆包實例(Tuple Unpacking),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • Python中斷多重循環(huán)的思路總結

    Python中斷多重循環(huán)的思路總結

    在本文里小編給大家整理的是關于Python中斷多重循環(huán)的思路以及相關知識點,有需要的朋友們可以學習下。
    2019-10-10
  • Python爬蟲實現(xiàn)爬取百度百科詞條功能實例

    Python爬蟲實現(xiàn)爬取百度百科詞條功能實例

    這篇文章主要介紹了Python爬蟲實現(xiàn)爬取百度百科詞條功能,結合完整實例形式分析了Python爬蟲的基本原理及爬取百度百科詞條的步驟、網(wǎng)頁下載、解析、數(shù)據(jù)輸出等相關操作技巧,需要的朋友可以參考下
    2019-04-04
  • Python語法學習之正則表達式的量詞匯總

    Python語法學習之正則表達式的量詞匯總

    通過正則的規(guī)則匹配到的信息都是一個單獨的字符存到輸出結果中的,如何更夠根據(jù)字符串中的詞組進行匹配呢?因此本文將帶大家學習一下正則表達式中的量詞符號與組的概念,感興趣的可以了解一下
    2022-04-04
  • 使用python進行量化交易的完整指南

    使用python進行量化交易的完整指南

    量化交易,作為現(xiàn)代金融市場中的一種先進交易方式,通過運用數(shù)學模型、統(tǒng)計方法和計算機算法來指導交易決策,旨在提高交易效率和決策的準確性,本文將詳細介紹如何使用Python進行量化交易,包括策略開發(fā)、數(shù)據(jù)處理、回測、風險管理和實盤交易等關鍵步驟
    2024-09-09
  • Python中日志模塊logging的使用技巧和應用詳解

    Python中日志模塊logging的使用技巧和應用詳解

    在Python開發(fā)中,日志記錄是一個非常重要的環(huán)節(jié),它不僅有助于開發(fā)者追蹤程序的執(zhí)行流程,還能在出現(xiàn)問題時提供關鍵信息,幫助快速定位并解決問題,本文將結合實際案例,詳細介紹logging模塊的基礎用法和高級特性,需要的朋友可以參考下
    2024-08-08
  • Python創(chuàng)建臨時文件和文件夾

    Python創(chuàng)建臨時文件和文件夾

    這篇文章主要介紹了Python如何創(chuàng)建臨時文件和文件夾,文中講解非常細致,代碼幫助大家更好的理解和學習,感興趣的朋友可以了解下
    2020-08-08
  • numpy求矩陣的特征值與特征向量(np.linalg.eig函數(shù)用法)

    numpy求矩陣的特征值與特征向量(np.linalg.eig函數(shù)用法)

    這篇文章主要介紹了numpy求矩陣的特征值與特征向量(np.linalg.eig函數(shù)用法),具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-02-02

最新評論