分析PyTorch?Dataloader報錯ValueError:num_samples的另一種可能原因

更新時間：2024年02月09日 14:35:06 作者：陽光素描

這篇文章主要介紹了分析PyTorch?Dataloader報錯ValueError:num_samples的另一種可能原因,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教

先粘報錯信息

Traceback (most recent call last): File “train.py”, line 169, in
train_test() File “train.py”, line 29, in train_test
dataloader_train = DataLoader(dataset_train, batch_size=batch_size, shuffle=True, pin_memory=True, drop_last=False)
File “/data3/anaconda3/lib/python3.8/site-packages/torch/utils/data/dataloader.py”,
line 270, in init
sampler = RandomSampler(dataset, generator=generator) # type: ignore[arg-type]
File “/data3/anaconda3/lib/python3.8/site-packages/torch/utils/data/sampler.py”,
line 102, in init
raise ValueError("num_samples should be a positive integer "
ValueError: num_samples should be a positive integer value, but got num_samples=0

在使用pytorch訓練模型時，同樣的代碼在Windows下可以正常訓練，但在Linux下卻會出現(xiàn)以上報錯。

網上查閱相關資料，解決辦法是完全相同的

出現(xiàn)的問題的地方可能是如下的地方

調用DataLoder時注意參數

self.train_dataloader = DataLoader(train_dataset,
batch_size=TrainOption.train_batch_size, shuffle=TRUE,
num_workers=TrainOption.data_load_worker_num)

shuffle的參數設置錯誤導致，

因為已經有batch_sample了，就不需要shuffle來進行隨機的sample了，所以在這里的shuffle應該設置為FALSE才對。

但我這里并未使用batch_sample，因此不是上述原因。

經查發(fā)現(xiàn)

由于兩系統(tǒng)下目錄地址的格式不同，

因此直接從windows移植過來的代碼不能在指定目錄下正常讀取數據，

且代碼未設置sample讀取個數為0時報錯，

導致dataset返回長度為0，小于batch_size，因此出現(xiàn)上述報錯。

出現(xiàn)上述問題時，如未使用batch_sample，可首先檢查dataset.len()是否正常。

總結

因多次出現(xiàn)上述問題，故記錄。

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

python中Class(類)的超詳細說明
這篇文章主要介紹了python中Class(類)的相關資料,Class類定義了具有相同屬性和方法的對象集合,對象是類的實例,類變量在整個實例化的對象中是公用的,而實例變量是每個對象獨有的,文中通過代碼介紹的非常詳細,需要的朋友可以參考下
2024-11-11
python實現(xiàn)對服務器腳本敏感信息的加密解密功能
這篇文章主要介紹了python實現(xiàn)對服務器腳本敏感信息的加密解密功能，本文給大家介紹的非常詳細，具有一定的參考借鑒價值,需要的朋友可以參考下
2019-08-08
python opencv 直方圖反向投影的方法
這篇文章主要介紹了python opencv 直方圖反向投影的方法，小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2018-02-02
Python中__init__.py文件的作用
這篇文章主要介紹了Python中__init__.py文件的作用，在PyCharm中，帶有__init__.py這個文件的目錄被認為是Python的包目錄，與普通目錄的圖標有不一樣的顯示
2022-09-09
Python實現(xiàn)byte轉integer
這篇文章主要介紹了Python實現(xiàn)byte轉integer操作，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2021-06-06
numpy中生成隨機數的幾種常用函數(小結)
這篇文章主要介紹了numpy中生成隨機數的幾種常用函數，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-08-08
詳細介紹Ruby中的正則表達式
這篇文章主要介紹了詳細介紹Ruby中的正則表達式,文章中還給出了用于搜索和替換的正則表達式的使用實例,需要的朋友可以參考下
2015-04-04
Python實現(xiàn)從Markdown到PDF的轉換的方法
Markdown,以其簡潔的語法和易于閱讀的特性,成為了許多作家、開發(fā)者和學生記錄思想、編寫教程或撰寫報告的首選格式,然而,在分享或打印這些文檔時,Markdown的純文本形式可能無法滿足對版式和布局的專業(yè)需求,本文將介紹如何用Python代碼輕松實現(xiàn)從Markdown到PDF的轉換
2024-07-07
pytorch 數據處理:定義自己的數據集合實例
今天小編就為大家分享一篇pytorch 數據處理:定義自己的數據集合實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-12-12
Python實現(xiàn)爬取并分析電商評論
這篇文章主要介紹了Python實現(xiàn)爬取并分析電商評論,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-06-06