使用python和yolo方法實(shí)現(xiàn)yolo標(biāo)簽自動(dòng)標(biāo)注
yolo代碼自動(dòng)標(biāo)注
1.引言
在圖像處理與機(jī)器視覺(jué)領(lǐng)域,標(biāo)注數(shù)據(jù)的質(zhì)量和數(shù)量對(duì)于模型的訓(xùn)練至關(guān)重要。然而,手動(dòng)標(biāo)注大量圖像是一項(xiàng)繁瑣且耗時(shí)的工作。為了解決這個(gè)問(wèn)題,自動(dòng)標(biāo)注技術(shù)應(yīng)運(yùn)而生。本文將介紹如何使用YOLOv10結(jié)合傳統(tǒng)圖像處理算法進(jìn)行驗(yàn)證碼圖像的自動(dòng)標(biāo)注,從初步的自動(dòng)標(biāo)注到高階的基于檢測(cè)結(jié)果的自動(dòng)標(biāo)注。
2.初階“自動(dòng)標(biāo)注”,給每個(gè)圖像都生成一個(gè)固定的標(biāo)注文件,進(jìn)而在labglimg中對(duì)矩形框進(jìn)行微調(diào),減少標(biāo)注的工作量
在初步的自動(dòng)標(biāo)注階段,我們首先為每張圖像生成一個(gè)固定的標(biāo)注文件,這些文件的內(nèi)容通常是預(yù)設(shè)的,矩形框的位置并不精確,因此適合用作標(biāo)注的初步框架。
import os # 圖像文件夾路徑 image_folder = 'D:' # 標(biāo)注文件即txt文件路徑 txt_folder = 'D:' # 基于上述兩個(gè)路徑檢索圖像和txt即yolo格式的標(biāo)注文件 image_files = [f.split('.')[0] for f in os.listdir(image_folder) if f.lower().endswith(('jpg', 'jpeg', 'png', 'bmp'))] txt_files = [f.split('.')[0] for f in os.listdir(txt_folder) if f.lower().endswith('txt')] # 遍歷圖像文件名 for img_name in image_files: # 如果某圖像沒(méi)有對(duì)應(yīng)的標(biāo)簽文件即txt文件 if img_name not in txt_files: # 寫入txt文件 txt_content = """0 0.808621 0.945652 0.072414 0.073913 0 0.250000 0.604348 0.093103 0.078261 0 0.660345 0.584783 0.086207 0.100000 0 0.613793 0.160870 0.117241 0.139130 0 0.293103 0.184783 0.103448 0.117391""" with open(os.path.join(txt_folder, img_name + '.txt'), 'w') as f: f.write(txt_content) print("Process complete.")
由于我們對(duì)每張圖都生成的是一份固定的標(biāo)注txt文件,所以生成的文件一般都是這種的,矩形框 不在正確的位置上,雖然能夠降低一定的標(biāo)注工作量,但是我們還是想讓它更精準(zhǔn)一點(diǎn),那就需要使用訓(xùn)練好的模型了。
局限性:
矩形框位置不準(zhǔn)確,標(biāo)注結(jié)果可能與實(shí)際物體位置存在偏差。
無(wú)法自動(dòng)識(shí)別圖像中的所有物體,可能遺漏檢測(cè)。
3.高階自動(dòng)標(biāo)注,利用我們訓(xùn)練好的(但是沒(méi)有特別精準(zhǔn)的)yolo文件先對(duì)每張圖進(jìn)行檢測(cè),再手動(dòng)微調(diào)
為了提高自動(dòng)標(biāo)注的精度,我們可以使用YOLOv10模型對(duì)每張圖像進(jìn)行目標(biāo)檢測(cè),并根據(jù)檢測(cè)結(jié)果生成標(biāo)注文件。這種方式能夠提供較為準(zhǔn)確的初步標(biāo)注,用戶只需要對(duì)檢測(cè)框進(jìn)行微調(diào)即可,減少了大量的手動(dòng)標(biāo)注工作。
import os from ultralytics import YOLOv10 # Folder paths image_folder = 'D:' txt_folder = 'D:' # Load a pretrained YOLOv10n model model = YOLOv10("\weights\\best.pt") image_files = [f for f in os.listdir(image_folder) if f.lower().endswith(('jpg', 'jpeg', 'png', 'bmp'))] # Perform object detection on each image file for img_name in image_files: img_path = os.path.join(image_folder, img_name) # Perform prediction results = model.predict(img_path) # Extract detection results (assuming results[0] contains the detection) detections = results[0].boxes.xywh # Get bounding box coordinates (xywh format) # If no .txt file exists, create a new one txt_path = os.path.join(txt_folder, img_name.split('.')[0] + '.txt') if not os.path.exists(txt_path): # Check if .txt file already exists # Write detection results to the .txt file with open(txt_path, 'w') as f: for detection in detections: # Assuming you want the format: class_id x_center y_center width height (normalized) # Convert coordinates from pixels to normalized values by dividing by image width/height x_center, y_center, width, height = detection x_center /= results[0].orig_img.shape[1] # Normalize by image width y_center /= results[0].orig_img.shape[0] # Normalize by image height width /= results[0].orig_img.shape[1] # Normalize by image width height /= results[0].orig_img.shape[0] # Normalize by image height # Write to file (Assuming class id is 0 here, change based on your model) f.write(f"0 {x_center} {y_center} {width} {height}\n") print("Process complete.")
代碼詳解:
1.加載YOLOv10模型:使用YOLOv10模型進(jìn)行物體檢測(cè)。通過(guò)model.predict()函數(shù)對(duì)每張圖像進(jìn)行檢測(cè)。
2.提取檢測(cè)結(jié)果:模型返回的結(jié)果中包含了檢測(cè)到的目標(biāo)的坐標(biāo)信息,采用boxes.xywh提取出目標(biāo)的位置。
3.坐標(biāo)歸一化:將檢測(cè)結(jié)果的坐標(biāo)從像素值轉(zhuǎn)換為相對(duì)圖像大小的比例(即歸一化值),以符合YOLO標(biāo)注格式。
4.生成標(biāo)注文件:根據(jù)模型檢測(cè)結(jié)果生成標(biāo)注文件,格式為class_id x_center y_center width height。
這種方式得到的數(shù)據(jù)一般是下圖這樣的,1.會(huì)有一些框不準(zhǔn),2.有一些框是重復(fù)的,3.有一些代碼沒(méi)有檢測(cè)到。此時(shí)我們只需要微調(diào)這三種情況的框即可,顯著降低了工作量。
4.總結(jié)
本文介紹了基于YOLOv10的自動(dòng)標(biāo)注方法,從初階的固定標(biāo)注到高階的基于YOLO檢測(cè)結(jié)果的自動(dòng)標(biāo)注。兩者相比,高階方法顯著提高了標(biāo)注的準(zhǔn)確性,并減少了人工操作的時(shí)間。
初階方法:快速生成標(biāo)注文件,適用于初步標(biāo)注,但需要人工微調(diào)和修正。
高階方法:通過(guò)YOLOv10檢測(cè)得到較為精準(zhǔn)的標(biāo)注結(jié)果,適合更高精度要求的任務(wù),但仍需要人工微調(diào)。
希望這些代碼能幫助大家提升標(biāo)注工作的效率和精度,降低人工標(biāo)注的成本。在未來(lái)的工作中,我們可以繼續(xù)優(yōu)化和擴(kuò)展該方法,進(jìn)一步提高自動(dòng)標(biāo)注的精度和適用范圍。
到此這篇關(guān)于使用python和yolo方法實(shí)現(xiàn)yolo標(biāo)簽自動(dòng)標(biāo)注的文章就介紹到這了,更多相關(guān)python yolo標(biāo)簽自動(dòng)標(biāo)注內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- 使用Python生成隨機(jī)圖片驗(yàn)證碼的代碼詳解
- Python Flask實(shí)現(xiàn)圖片驗(yàn)證碼與郵箱驗(yàn)證碼流程詳細(xì)講解
- python爬蟲(chóng)模擬登錄之圖片驗(yàn)證碼實(shí)現(xiàn)詳解
- python生成圖片驗(yàn)證碼的方法
- 非常簡(jiǎn)單的Python識(shí)別圖片驗(yàn)證碼實(shí)現(xiàn)過(guò)程
- python爬蟲(chóng)如何解決圖片驗(yàn)證碼
- python中matplotlib實(shí)現(xiàn)隨鼠標(biāo)滑動(dòng)自動(dòng)標(biāo)注代碼
- 使用 Python 和 LabelMe 實(shí)現(xiàn)圖片驗(yàn)證碼的自動(dòng)標(biāo)注功能
相關(guān)文章
pycharm通過(guò)ssh連接遠(yuǎn)程服務(wù)器教程
今天小編就為大家分享一篇pycharm通過(guò)ssh連接遠(yuǎn)程服務(wù)器教程,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02python中ndarray數(shù)組的索引和切片的使用
本文主要介紹了python中ndarray數(shù)組的索引和切片的使用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-07-07Python使用logging實(shí)現(xiàn)多進(jìn)程安全的日志模塊
這篇文章主要為大家詳細(xì)介紹了Python如何使用標(biāo)準(zhǔn)庫(kù)logging實(shí)現(xiàn)多進(jìn)程安全的日志模塊,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解下2024-01-01用python實(shí)現(xiàn)一個(gè)簡(jiǎn)單的驗(yàn)證碼
這篇文章主要介紹了用python實(shí)現(xiàn)一個(gè)簡(jiǎn)單的驗(yàn)證碼的方法,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-12-1230行Python代碼打造一款簡(jiǎn)單的人工語(yǔ)音對(duì)話
使用gtts和speech_recognition實(shí)現(xiàn)簡(jiǎn)單的人工語(yǔ)音對(duì)話,通過(guò)將語(yǔ)音變成文本,然后文本變成語(yǔ)音,僅用30行代碼,超級(jí)簡(jiǎn)單,對(duì)Python人工語(yǔ)音對(duì)話的實(shí)現(xiàn)過(guò)程及完整代碼感興趣的朋友一起看看吧2021-05-05