欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

三分鐘教會你用Python+OpenCV批量裁剪xml格式標(biāo)注的圖片

 更新時間:2022年01月20日 12:48:42   作者:18歲小白想成大牛  
最近學(xué)習(xí)網(wǎng)絡(luò)在線課程的過程中,為了方便課后復(fù)習(xí),使用手機截取了大量的圖片,下面這篇文章主要給大家介紹了如何通過三分鐘教會你用Python+OpenCV批量裁剪xml格式標(biāo)注圖片的相關(guān)資料,需要的朋友可以參考下

前言

在目標(biāo)檢測中,數(shù)據(jù)集常常使用labelimg標(biāo)注,會生成xml文件。本文旨在根據(jù)xml標(biāo)注文件來裁剪目標(biāo),以達到去除背景信息的目的。

xml文件格式

以下是一個標(biāo)注好的圖片生成的xml文件。具體含義見代碼注釋。

<annotation>                             <!--xml所屬文件夾-->
	<folder>JPEGImages</folder>          <!--對應(yīng)圖片所屬文件夾-->
	<filename>408.bmp</filename>
	<path>E:\JPEGImages\408.bmp</path>
	<source>
		<database>Unknown</database>
	</source>
	<size>           				<!--整張圖片寬,高,3通道彩色-->
		<width>413</width>
		<height>342</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>
	<object>							<!--標(biāo)注的目標(biāo),一共5個框-->
		<name>bad_part</name>			<!--名稱,也就是類別-->
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>                  <!--坐標(biāo),左上,左下,右上,右下-->
			<xmin>339</xmin>
			<ymin>103</ymin>
			<xmax>398</xmax>
			<ymax>173</ymax>
		</bndbox>
	</object>
	<object>
		<name>bad_part</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>265</xmin>
			<ymin>15</ymin>
			<xmax>364</xmax>
			<ymax>74</ymax>
		</bndbox>
	</object>
	<object>
		<name>bad_part</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>118</xmin>
			<ymin>33</ymin>
			<xmax>195</xmax>
			<ymax>52</ymax>
		</bndbox>
	</object>
	<object>
		<name>bad_part</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>113</xmin>
			<ymin>103</ymin>
			<xmax>177</xmax>
			<ymax>147</ymax>
		</bndbox>
	</object>
	<object>
		<name>bad_part</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>224</xmin>
			<ymin>298</ymin>
			<xmax>287</xmax>
			<ymax>326</ymax>
		</bndbox>
	</object>
</annotation>

代碼思想

  1. 獲取到標(biāo)簽文件路徑和圖片文件路徑;
  2. 遍歷圖片文件夾獲取到圖片,并分割文件名;
  3. 根據(jù)圖片的文件名加后綴xml得到具體的標(biāo)簽文件;
  4. 通過xml.etree.ElementTree讀取xml文件;
  5. 遍歷所有的目標(biāo)框,獲取到[];
  6. 通過cv2裁剪目標(biāo)(先高后寬 參考文章:http://www.dbjr.com.cn/article/211183.htm中的第二中裁剪方法);
  7. 將裁剪好的圖片保存到指定文件目錄。

完整代碼

'''
根據(jù)xml標(biāo)簽裁剪目標(biāo)
1.文件夾中可以有除了圖片格式或標(biāo)簽格式的文件,有判斷可以忽略其他文件
2.圖片未標(biāo)注沒有對應(yīng)的xml文件自動忽略不會報錯
3.同一個圖片有多個真實框,會按名稱_0,名稱_1 …… 排列
4.圖片本身的命名無規(guī)律會按3中的命名規(guī)則加上名稱后綴重新命名。
'''

import cv2
import xml.etree.ElementTree as ET
import os 

img_path = r'E:/JPEGImages' #圖片路徑
xml_path = r'E:/Annotations' #標(biāo)簽路徑
obj_img_path = r'E:/cut'   #目標(biāo)裁剪圖片存放路徑

for img_file in os.listdir(img_path):    #遍歷圖片文件夾
    if img_file[-4:] in ['.bmp', '.jpg','.png']:    #判斷文件是否為圖片格式
        img_filename = os.path.join(img_path, img_file)  #將圖片路徑與圖片名進行拼接
        img_cv = cv2.imread(img_filename)  #讀取圖片
        
        img_name = (os.path.splitext(img_file)[0])  #分割出圖片名,如“000.png” 圖片名為“000”
        xml_name = xml_path + '\\' + '%s.xml'%img_name  #利用標(biāo)簽路徑、圖片名、xml后綴拼接出完整的標(biāo)簽路徑名
        
        if os.path.exists(xml_name):  #判斷與圖片同名的標(biāo)簽是否存在,因為圖片不一定每張都打標(biāo)
            root = ET.parse(xml_name).getroot() #利用ET讀取xml文件
            count = 0 #目標(biāo)框個數(shù)統(tǒng)計,防止目標(biāo)文件覆蓋
            for obj in root.iter('object'):  #遍歷所有目標(biāo)框
                name = obj.find('name').text   #獲取目標(biāo)框名稱,即label名
            
                xmlbox = obj.find('bndbox')   #找到框目標(biāo)
                x0 = xmlbox.find('xmin').text  #將框目標(biāo)的四個頂點坐標(biāo)取出
                y0 = xmlbox.find('ymin').text
                x1 = xmlbox.find('xmax').text
                y1 = xmlbox.find('ymax').text
                
                obj_img = img_cv[int(y0):int(y1), int(x0):int(x1)]  #cv2裁剪出目標(biāo)框中的圖片
                
                cv2.imwrite(obj_img_path + '\\' + '%s_%s'%(img_name, count) + '.jpg', obj_img)  #保存裁剪圖片
                count += 1 #目標(biāo)框統(tǒng)計值自增1
                
print("裁剪完成!")

效果展示

總結(jié)

  1. ET解析樹基本上是xml標(biāo)注文件必備的解析庫。
  2. labelimg→ \rightarrow→xml→ \rightarrow→VOC數(shù)據(jù)集
  3. labelme→ \rightarrow→json→ \rightarrow→COCO數(shù)據(jù)集
  4. json是字典形式,內(nèi)存??;xml是DTD文檔,格式統(tǒng)一跨平臺
  5. 去除背景信息是很重要的一環(huán),可以避免模型監(jiān)督學(xué)習(xí)時學(xué)習(xí)到相似的錯誤信息。

到此這篇關(guān)于用Python+OpenCV批量裁剪xml格式標(biāo)注圖片的文章就介紹到這了,更多相關(guān)Python+OpenCV批量裁剪xml格式圖片內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 如何用python整理附件

    如何用python整理附件

    本篇文章給大家整理了關(guān)于如何用python整理附件的相關(guān)知識點,學(xué)習(xí)python的朋友可以跟著測試下。
    2018-05-05
  • Python button選取本地圖片并顯示的實例

    Python button選取本地圖片并顯示的實例

    今天小編就為大家分享一篇Python button選取本地圖片并顯示的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06
  • 詳解pandas的外部數(shù)據(jù)導(dǎo)入與常用方法

    詳解pandas的外部數(shù)據(jù)導(dǎo)入與常用方法

    這篇文章主要介紹了詳解pandas的外部數(shù)據(jù)導(dǎo)入與常用方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-05-05
  • Python 詳解爬取并統(tǒng)計CSDN全站熱榜標(biāo)題關(guān)鍵詞詞頻流程

    Python 詳解爬取并統(tǒng)計CSDN全站熱榜標(biāo)題關(guān)鍵詞詞頻流程

    讀萬卷書不如行萬里路,只學(xué)書上的理論是遠(yuǎn)遠(yuǎn)不夠的,只有在實戰(zhàn)中才能獲得能力的提升,本篇文章手把手帶你用Python爬取CSDN全站綜合熱榜標(biāo)題,順便統(tǒng)計關(guān)鍵詞詞頻,大家可以在過程中查缺補漏,提升水平
    2021-11-11
  • Matplotlib中文亂碼的3種解決方案

    Matplotlib中文亂碼的3種解決方案

    當(dāng)我們用matplotlib作圖時,往往會發(fā)現(xiàn)中文的文字變成了小方塊,我在繪制決策樹的時候就碰到了這個問題。下面這篇文章主要給大家總結(jié)介紹了關(guān)于Matplotlib中文亂碼的3種解決方案,需要的朋友可以參考下
    2018-11-11
  • python實現(xiàn)從web抓取文檔的方法

    python實現(xiàn)從web抓取文檔的方法

    這篇文章主要介紹了python實現(xiàn)從web抓取文檔的方法,以抓取人人網(wǎng)頁面為例講述了完整的web文檔抓取方法,需要的朋友可以參考下
    2014-09-09
  • python3 判斷列表是一個空列表的方法

    python3 判斷列表是一個空列表的方法

    今天小編就為大家分享一篇python3 判斷列表是一個空列表的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-05-05
  • python實現(xiàn)敲木魚加功德包含加音效和敲擊動作(附demo)

    python實現(xiàn)敲木魚加功德包含加音效和敲擊動作(附demo)

    敲木魚加功德是一款很火的動畫,本文主要介紹了python實現(xiàn)敲木魚加功德包含加音效和敲擊動作,具有一定的參考價值,感興趣的可以了解一下
    2023-11-11
  • python 判斷l(xiāng)inux進程,并殺死進程的實現(xiàn)方法

    python 判斷l(xiāng)inux進程,并殺死進程的實現(xiàn)方法

    今天小編就為大家分享一篇python 判斷l(xiāng)inux進程,并殺死進程的實現(xiàn)方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-07-07
  • 在Python中執(zhí)行和調(diào)用JavaScript的多種方法小結(jié)

    在Python中執(zhí)行和調(diào)用JavaScript的多種方法小結(jié)

    JavaScript(JS)是一種常用的腳本語言,通常用于網(wǎng)頁開發(fā),但有時也需要在Python中執(zhí)行或調(diào)用JavaScript代碼,本文將詳細(xì)介紹Python中執(zhí)行和調(diào)用JavaScript的多種方法,每種方法都將附有示例代碼,方便理解如何在Python中與JavaScript進行互動,需要的朋友可以參考下
    2023-11-11

最新評論