PPOCRLabel標(biāo)注的txt格式如何轉(zhuǎn)換成labelme能修改的json格式
PPOCRLabel標(biāo)注的txt格式轉(zhuǎn)換成labelme能修改的json格式
PPOCR是個好東西
默認(rèn)的訓(xùn)練文件是用自帶的PPOCRLabel標(biāo)注的,有時候需要用labelme來修改一些東西,比如后期用到的字段提取,就需要加一個參數(shù),PPOCRLabel就沒法做了,只能轉(zhuǎn)成labelme,并利用group_id這個參數(shù)來賦值。
所以寫了下面這個腳本
Label.txt每一行對應(yīng)一個圖片標(biāo)注,該腳本作用是將PPOCRLabel的標(biāo)注文件Label.txt轉(zhuǎn)換為一個一個的json文件
并存儲至json1目錄下:
# -*- coding:utf-8 -*-
# 開發(fā)人員 : csu·攀-_-||
# 開發(fā)時間 : 2021/9/7 0007 10:30
# 文件名稱 : pplable2json.py
# 開發(fā)工具 : PyCharm
# 功能描述 : PPOCRLabel標(biāo)注的txt格式轉(zhuǎn)換成labelme能修改的json格式
import os
import cv2
import json
import base64
#轉(zhuǎn)base64
def image_to_base64(image_np):
image = cv2.imencode('.jpg', image_np)[1]
image_code = str(base64.b64encode(image))[2:-1]
return image_code
def pp2json(path,savepath):
with open(os.path.join(path,'Label.txt'),'r',encoding='utf-8') as f:
for line in f.readlines():
line = line.strip('\n') # 去掉列表中每一個元素的換行符
imgname = line.split('\t')[0].split('/')[1]
img = cv2.imread(os.path.join(path,imgname))
H,W,C = img.shape
items = json.loads(line.split('\t')[1])
item_shapes = []
for item in items:
item_shapes.append({
"label":item['transcription'],
"points":item['points'],
"group_id": 0,
"shape_type": "polygon",
"flags": {}
})
new_dict = {
"version": "4.5.9",
"flags": {},
"shapes": item_shapes,
"imagePath": imgname,
"imageData": image_to_base64(img),
"imageHeight": H,
"imageWidth": W
}
with open(os.path.join(savepath,imgname.split('.')[0] + '.json'), "w",encoding='utf-8') as fw:
print(imgname,' succeed!')
json.dump(new_dict, fw)
if __name__ == '__main__':
path = r'E:\Projects\OCR-release-2.1\tools\infer\imgs\train_data'
savepath = r'json1'
pp2json(path,savepath)

PPOCRLabel標(biāo)注的Label.txt文件,所有的圖片標(biāo)注都在一個txt里頭,一個圖片一行,文件名和標(biāo)注內(nèi)容之間用制表符’\t’隔開。

labelme標(biāo)注的json文件格式
總結(jié)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python創(chuàng)建相同值數(shù)組/列表的兩種方法
眾所周知數(shù)組是一種用來在計算機中存儲連續(xù)的相同類型數(shù)值的數(shù)據(jù)結(jié)構(gòu),這篇文章主要給大家介紹了關(guān)于Python創(chuàng)建相同值數(shù)組/列表的兩種方法,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-12-12
解讀殘差網(wǎng)絡(luò)(Residual Network),殘差連接(skip-connect)
這篇文章主要介紹了殘差網(wǎng)絡(luò)(Residual Network),殘差連接(skip-connect),具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08
mat矩陣和npy矩陣實現(xiàn)互相轉(zhuǎn)換(python和matlab)
這篇文章主要介紹了mat矩陣和npy矩陣實現(xiàn)互相轉(zhuǎn)換(python和matlab),具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-07-07
Python實現(xiàn)APP自動化發(fā)微信群消息的示例代碼
本文主要介紹了Python實現(xiàn)APP自動化發(fā)微信群消息的示例代,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下碼2022-01-01

