PPOCRLabel標(biāo)注的txt格式如何轉(zhuǎn)換成labelme能修改的json格式
PPOCRLabel標(biāo)注的txt格式轉(zhuǎn)換成labelme能修改的json格式
PPOCR是個(gè)好東西
默認(rèn)的訓(xùn)練文件是用自帶的PPOCRLabel標(biāo)注的,有時(shí)候需要用labelme來(lái)修改一些東西,比如后期用到的字段提取,就需要加一個(gè)參數(shù),PPOCRLabel就沒(méi)法做了,只能轉(zhuǎn)成labelme,并利用group_id這個(gè)參數(shù)來(lái)賦值。
所以寫(xiě)了下面這個(gè)腳本
Label.txt每一行對(duì)應(yīng)一個(gè)圖片標(biāo)注,該腳本作用是將PPOCRLabel的標(biāo)注文件Label.txt轉(zhuǎn)換為一個(gè)一個(gè)的json文件
并存儲(chǔ)至json1目錄下:
# -*- coding:utf-8 -*-
# 開(kāi)發(fā)人員 : csu·攀-_-||
# 開(kāi)發(fā)時(shí)間 : 2021/9/7 0007 10:30
# 文件名稱 : pplable2json.py
# 開(kāi)發(fā)工具 : PyCharm
# 功能描述 : PPOCRLabel標(biāo)注的txt格式轉(zhuǎn)換成labelme能修改的json格式
import os
import cv2
import json
import base64
#轉(zhuǎn)base64
def image_to_base64(image_np):
image = cv2.imencode('.jpg', image_np)[1]
image_code = str(base64.b64encode(image))[2:-1]
return image_code
def pp2json(path,savepath):
with open(os.path.join(path,'Label.txt'),'r',encoding='utf-8') as f:
for line in f.readlines():
line = line.strip('\n') # 去掉列表中每一個(gè)元素的換行符
imgname = line.split('\t')[0].split('/')[1]
img = cv2.imread(os.path.join(path,imgname))
H,W,C = img.shape
items = json.loads(line.split('\t')[1])
item_shapes = []
for item in items:
item_shapes.append({
"label":item['transcription'],
"points":item['points'],
"group_id": 0,
"shape_type": "polygon",
"flags": {}
})
new_dict = {
"version": "4.5.9",
"flags": {},
"shapes": item_shapes,
"imagePath": imgname,
"imageData": image_to_base64(img),
"imageHeight": H,
"imageWidth": W
}
with open(os.path.join(savepath,imgname.split('.')[0] + '.json'), "w",encoding='utf-8') as fw:
print(imgname,' succeed!')
json.dump(new_dict, fw)
if __name__ == '__main__':
path = r'E:\Projects\OCR-release-2.1\tools\infer\imgs\train_data'
savepath = r'json1'
pp2json(path,savepath)

PPOCRLabel標(biāo)注的Label.txt文件,所有的圖片標(biāo)注都在一個(gè)txt里頭,一個(gè)圖片一行,文件名和標(biāo)注內(nèi)容之間用制表符’\t’隔開(kāi)。

labelme標(biāo)注的json文件格式
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
PyQT5速成教程之Qt Designer介紹與入門(mén)
這篇文章主要介紹了PyQT5速成教程之Qt Designer介紹與入門(mén),本文以PyCharm為例通過(guò)實(shí)例代碼圖文相結(jié)合給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-11-11
Python創(chuàng)建相同值數(shù)組/列表的兩種方法
眾所周知數(shù)組是一種用來(lái)在計(jì)算機(jī)中存儲(chǔ)連續(xù)的相同類型數(shù)值的數(shù)據(jù)結(jié)構(gòu),這篇文章主要給大家介紹了關(guān)于Python創(chuàng)建相同值數(shù)組/列表的兩種方法,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-12-12
解讀殘差網(wǎng)絡(luò)(Residual Network),殘差連接(skip-connect)
這篇文章主要介紹了殘差網(wǎng)絡(luò)(Residual Network),殘差連接(skip-connect),具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08
python之Character string(實(shí)例講解)
下面小編就為大家?guī)?lái)一篇python之Character string(實(shí)例講解)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-09-09
mat矩陣和npy矩陣實(shí)現(xiàn)互相轉(zhuǎn)換(python和matlab)
這篇文章主要介紹了mat矩陣和npy矩陣實(shí)現(xiàn)互相轉(zhuǎn)換(python和matlab),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-07-07
Python實(shí)現(xiàn)APP自動(dòng)化發(fā)微信群消息的示例代碼
本文主要介紹了Python實(shí)現(xiàn)APP自動(dòng)化發(fā)微信群消息的示例代,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下碼2022-01-01
Python之PyQt6對(duì)話框的實(shí)現(xiàn)
這篇文章主要介紹了Python之PyQt6對(duì)話框的實(shí)現(xiàn),文章內(nèi)容詳細(xì),簡(jiǎn)單易懂,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2023-01-01
Python自動(dòng)化之實(shí)現(xiàn)桌面壁紙下載器
隨著計(jì)算機(jī)性能的提升,人們對(duì)計(jì)算機(jī)個(gè)性化的要求也越來(lái)越高了,自己使用的計(jì)算機(jī)當(dāng)然要設(shè)置成自己喜歡的風(fēng)格!本文就來(lái)用Python做個(gè)桌面壁紙下載器,需要的可以參考一下2022-11-11

