Pytorch中使用ImageFolder讀取數(shù)據(jù)集時(shí)忽略特定文件
一、使用ImageFolder讀取數(shù)據(jù)集時(shí)忽略特定文件
如果事先知道需要忽略哪些文件,當(dāng)然直接從數(shù)據(jù)集里刪除就行了。但如果需要在程序運(yùn)行時(shí)動(dòng)態(tài)確認(rèn),或者篩選規(guī)則比較復(fù)雜,人工不好做,就需要讓ImageFolder
在讀取時(shí)使用自定義的篩選規(guī)則。
ImageFolder有一個(gè)可選參數(shù)為is_valid_file
,參數(shù)類型為可調(diào)用的函數(shù),該函數(shù)傳入一個(gè)str參數(shù),返回一個(gè)bool值。當(dāng)返回值為True時(shí)保留該文件,否則忽略。
例如,讀取時(shí)想要忽略所有文件名帶‘invalid’的文件,
代碼如下:
import platform from torchvision.datasets import ImageFolder class Check(object): ? ? def __init__(self, ? ? ? ? ? ? ? ? ?key_word: str): ? ? ? ? self.key_word = key_word ? ? ? ? self.separator = '\\' if platform.system() == 'Windows' else '/' ? ? def __call__(self,? ? ? ?? ??? ??? ? file_name: str) -> bool: ? ? ? ? folders = file_name.split(self.separator) ? ? ? ? return folders[-1].find(self.key_word) < 0 dataset = ImageFolder('./data', is_valid_file=Check('invalid'))
這里定義了一個(gè)實(shí)現(xiàn)了__call__
方法的Check類,相比于直接定義函數(shù)的好處在于可以在構(gòu)造函數(shù)里指定想要忽略的字符,并且能夠根據(jù)操作系統(tǒng)的不同把文件目錄分隔符給確定了。
更加復(fù)雜的功能可以自行修改代碼邏輯實(shí)現(xiàn),但是要注意如果某個(gè)類別的所有文件都被篩選掉了,ImageFolder
會(huì)報(bào)FileNotFoundError
錯(cuò)誤。
如果想要忽略整個(gè)類別可以使用下面方法?。?!
二、ImageFolder只讀取部分類別文件夾
直接繼承并且重寫ImageFolder
類的find_classes
方法即可
from torchvision.datasets.folder import * from typing import * class FilterableImageFolder(ImageFolder): ? ? def __init__( ? ? ? ? ? ? self, ? ? ? ? ? ? root: str, ? ? ? ? ? ? transform: Optional[Callable] = None, ? ? ? ? ? ? target_transform: Optional[Callable] = None, ? ? ? ? ? ? loader: Callable[[str], Any] = default_loader, ? ? ? ? ? ? is_valid_file: Optional[Callable[[str], bool]] = None, ? ? ? ? ? ? valid_classes: List = None ? ? ): ? ? ? ? self.valid_classes = valid_classes ? ? ? ? super(FilterableImageFolder, self).__init__(root, transform, target_transform, loader, is_valid_file) ? ? def find_classes(self, directory: str) -> Tuple[List[str], Dict[str, int]]: ? ? ? ? classes = sorted(entry.name for entry in os.scandir(directory) if entry.is_dir()) ? ? ? ? #增加了這下面這句 ? ? ? ? classes = [valid_class for valid_class in classes if valid_class in self.valid_classes] ? ? ? ? if not classes: ? ? ? ? ? ? raise FileNotFoundError(f"Couldn't find any class folder in {directory}.") ? ? ? ? class_to_idx = {cls_name: i for i, cls_name in enumerate(classes)} ? ? ? ? return classes, class_to_idx
使用時(shí),例如有mouse
、cat
、dog
三個(gè)類別的數(shù)據(jù)集文件夾,只想讀取cat
和dog
,
代碼如下:
dataset = FilterableImageFolder('./data', valid_classes=['cat', 'dog'])
到此這篇關(guān)于Pytorch中使用ImageFolder讀取數(shù)據(jù)集時(shí)忽略特定文件的文章就介紹到這了,更多相關(guān)ImageFolder讀取數(shù)據(jù)集內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
關(guān)于python的mmh3庫(kù)安裝以及使用詳解
這篇文章主要介紹了關(guān)于python的mmh3庫(kù)安裝以及使用詳解,哈希方法主要有MD、SHA、Murmur、CityHash、MAC等幾種方法,mmh3全程murmurhash3,是一種非加密的哈希算法,常用于hadoop等分布式存儲(chǔ)情境中,需要的朋友可以參考下2023-07-07Python設(shè)計(jì)模式之適配器模式原理與用法詳解
這篇文章主要介紹了Python設(shè)計(jì)模式之適配器模式原理與用法,結(jié)合實(shí)例形式分析了適配器模式的相關(guān)概念、原理及Python實(shí)現(xiàn)技巧,需要的朋友可以參考下2019-01-01Qt5.14 與 OpenCV4.5 教程之圖片增強(qiáng)效果
這篇文章主要介紹了Qt5.14 與 OpenCV4.5 教程之圖片增強(qiáng)效果的實(shí)現(xiàn),本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2021-11-11django2+uwsgi+nginx上線部署到服務(wù)器Ubuntu16.04
這篇文章主要介紹了django2+uwsgi+nginx上線部署到服務(wù)器Ubuntu16.04,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2018-06-06Windows 平臺(tái)做 Python 開(kāi)發(fā)的最佳組合(推薦)
在 Windows 上如何做 Python 開(kāi)發(fā)呢?相信大神們都會(huì)有自己的解決方案,但本文希望介紹微軟官方發(fā)布的 Terminal 和 Visual Studio Code,希望它們能構(gòu)建更流暢的 Windows 開(kāi)發(fā)體驗(yàn),感興趣的朋友跟隨小編一起看看吧2020-07-07pycharm命令終端運(yùn)行python文件以及傳遞參數(shù)方式
這篇文章主要介紹了pycharm命令終端運(yùn)行python文件以及傳遞參數(shù)方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-06-06淺談django model的get和filter方法的區(qū)別(必看篇)
下面小編就為大家?guī)?lái)一篇淺談django model的get和filter方法的區(qū)別(必看篇)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-05-05Python selenium環(huán)境搭建實(shí)現(xiàn)過(guò)程解析
這篇文章主要介紹了Python selenium環(huán)境搭建實(shí)現(xiàn)過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-09-09Python中最快的循環(huán)姿勢(shì)實(shí)例詳解
python給我們提供了多個(gè)循環(huán)方法,比如while循環(huán)、for循環(huán)等,下面這篇文章主要給大家介紹了關(guān)于Python中最快的循環(huán)姿勢(shì),需要的朋友可以參考下2021-11-11