PPOCRLabel標(biāo)注的txt格式如何轉(zhuǎn)換成labelme能修改的json格式
PPOCRLabel標(biāo)注的txt格式轉(zhuǎn)換成labelme能修改的json格式
PPOCR是個(gè)好東西
默認(rèn)的訓(xùn)練文件是用自帶的PPOCRLabel標(biāo)注的,有時(shí)候需要用labelme來(lái)修改一些東西,比如后期用到的字段提取,就需要加一個(gè)參數(shù),PPOCRLabel就沒法做了,只能轉(zhuǎn)成labelme,并利用group_id這個(gè)參數(shù)來(lái)賦值。
所以寫了下面這個(gè)腳本
Label.txt每一行對(duì)應(yīng)一個(gè)圖片標(biāo)注,該腳本作用是將PPOCRLabel的標(biāo)注文件Label.txt轉(zhuǎn)換為一個(gè)一個(gè)的json文件
并存儲(chǔ)至json1目錄下:
# -*- coding:utf-8 -*- # 開發(fā)人員 : csu·攀-_-|| # 開發(fā)時(shí)間 : 2021/9/7 0007 10:30 # 文件名稱 : pplable2json.py # 開發(fā)工具 : PyCharm # 功能描述 : PPOCRLabel標(biāo)注的txt格式轉(zhuǎn)換成labelme能修改的json格式 import os import cv2 import json import base64 #轉(zhuǎn)base64 def image_to_base64(image_np): image = cv2.imencode('.jpg', image_np)[1] image_code = str(base64.b64encode(image))[2:-1] return image_code def pp2json(path,savepath): with open(os.path.join(path,'Label.txt'),'r',encoding='utf-8') as f: for line in f.readlines(): line = line.strip('\n') # 去掉列表中每一個(gè)元素的換行符 imgname = line.split('\t')[0].split('/')[1] img = cv2.imread(os.path.join(path,imgname)) H,W,C = img.shape items = json.loads(line.split('\t')[1]) item_shapes = [] for item in items: item_shapes.append({ "label":item['transcription'], "points":item['points'], "group_id": 0, "shape_type": "polygon", "flags": {} }) new_dict = { "version": "4.5.9", "flags": {}, "shapes": item_shapes, "imagePath": imgname, "imageData": image_to_base64(img), "imageHeight": H, "imageWidth": W } with open(os.path.join(savepath,imgname.split('.')[0] + '.json'), "w",encoding='utf-8') as fw: print(imgname,' succeed!') json.dump(new_dict, fw) if __name__ == '__main__': path = r'E:\Projects\OCR-release-2.1\tools\infer\imgs\train_data' savepath = r'json1' pp2json(path,savepath)
PPOCRLabel標(biāo)注的Label.txt文件,所有的圖片標(biāo)注都在一個(gè)txt里頭,一個(gè)圖片一行,文件名和標(biāo)注內(nèi)容之間用制表符’\t’隔開。
labelme標(biāo)注的json文件格式
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python創(chuàng)建相同值數(shù)組/列表的兩種方法
眾所周知數(shù)組是一種用來(lái)在計(jì)算機(jī)中存儲(chǔ)連續(xù)的相同類型數(shù)值的數(shù)據(jù)結(jié)構(gòu),這篇文章主要給大家介紹了關(guān)于Python創(chuàng)建相同值數(shù)組/列表的兩種方法,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-12-12解讀殘差網(wǎng)絡(luò)(Residual Network),殘差連接(skip-connect)
這篇文章主要介紹了殘差網(wǎng)絡(luò)(Residual Network),殘差連接(skip-connect),具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08python之Character string(實(shí)例講解)
下面小編就為大家?guī)?lái)一篇python之Character string(實(shí)例講解)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-09-09mat矩陣和npy矩陣實(shí)現(xiàn)互相轉(zhuǎn)換(python和matlab)
這篇文章主要介紹了mat矩陣和npy矩陣實(shí)現(xiàn)互相轉(zhuǎn)換(python和matlab),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-07-07Python實(shí)現(xiàn)APP自動(dòng)化發(fā)微信群消息的示例代碼
本文主要介紹了Python實(shí)現(xiàn)APP自動(dòng)化發(fā)微信群消息的示例代,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下碼2022-01-01Python之PyQt6對(duì)話框的實(shí)現(xiàn)
這篇文章主要介紹了Python之PyQt6對(duì)話框的實(shí)現(xiàn),文章內(nèi)容詳細(xì),簡(jiǎn)單易懂,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2023-01-01Python自動(dòng)化之實(shí)現(xiàn)桌面壁紙下載器
隨著計(jì)算機(jī)性能的提升,人們對(duì)計(jì)算機(jī)個(gè)性化的要求也越來(lái)越高了,自己使用的計(jì)算機(jī)當(dāng)然要設(shè)置成自己喜歡的風(fēng)格!本文就來(lái)用Python做個(gè)桌面壁紙下載器,需要的可以參考一下2022-11-11