欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

淺談PyTorch的數(shù)據(jù)讀取機(jī)制Dataloader與Dataset

 更新時(shí)間:2023年07月29日 09:55:29   作者:木千之  
這篇文章主要介紹了淺談PyTorch的數(shù)據(jù)讀取機(jī)制Dataloader與Dataset,DataLoader的作用是構(gòu)建一個(gè)可迭代的數(shù)據(jù)裝載器,每次執(zhí)行循環(huán)的時(shí)候,就從中讀取一批Batchsize大小的樣本進(jìn)行訓(xùn)練,需要的朋友可以參考下

Dataloader與DataSet數(shù)據(jù)讀取方法

DataLoader與DataSet是PyTorch數(shù)據(jù)讀取的核心。

torch.utils.DataLoader”的作用是構(gòu)建一個(gè)可迭代的數(shù)據(jù)裝載器,每次執(zhí)行循環(huán)的時(shí)候,就從中讀取一批Batchsize大小的樣本進(jìn)行訓(xùn)練。

其主要參數(shù)有五項(xiàng):

  1. dataset:隸屬DataSet類,表示數(shù)據(jù)從哪里讀取以及如何讀取
  2. batchsize:批大小
  3. num_works:是否多進(jìn)程讀取數(shù)據(jù)
  4. shuffle:每個(gè)epoch是否亂序
  5. drop_last:當(dāng)樣本數(shù)不能被batchsize整除時(shí),是否舍棄最后一批數(shù)據(jù)

上述主要參數(shù)中num_works通常在單進(jìn)程時(shí)默認(rèn)為“0”,也可以在支持多進(jìn)程的設(shè)備上設(shè)置為允許的“4 | 8 | 16”等。

shuffle則通常設(shè)置為使用亂序(True),以使得每次數(shù)據(jù)讀取具有隨機(jī)性。

這里頗為重要的是“Epoch、Iteration和Batchsize”之間的關(guān)系:

1)Epoch表示所有訓(xùn)練樣本都已輸入到模型中,記為一個(gè)Epoch;

2)Iteration表示一批樣本輸入到模型中,記為一個(gè)Iteration;

3)Batchsize表示批大小,決定一個(gè)Epoch中有多少個(gè)Iteration。當(dāng)樣本數(shù)可以被Batchsize整除時(shí),三者成立關(guān)系,即全體樣本分成Batchsize分批次輸入模型,每批次記為一次Iteration。

若樣本總數(shù)80個(gè),當(dāng)Batchsize=8時(shí),可以知道“1 Epoch = 10 Iteration”。

若樣本總數(shù)87個(gè),當(dāng)Batchsize-8時(shí),可以知道:1)若“drop_last=True”,則“1 Epoch = 10 Iteration”;2)

若“drop_last=False”,則“1 Epoch = 11 Iteration”,其最后一個(gè)Iteration時(shí)樣本個(gè)數(shù)為7,小于既定Batchsize。

torch.utils.data.Dataset”主要用于定義數(shù)據(jù)從哪里讀取以及如何讀取的問題。其定義為DataSet抽象類,所有自定義的Dataset都需要繼承它,并復(fù)寫“getitem()”內(nèi)構(gòu)函數(shù),該函數(shù)接受一個(gè)索引,并返回一個(gè)樣本。

在這里插入圖片描述

DataLoader與DataSet數(shù)據(jù)讀取機(jī)制

PyTorch的數(shù)據(jù)讀取機(jī)制通常圍繞三個(gè)核心問題展開,即:

讀取哪些數(shù)據(jù)?從哪里讀取數(shù)據(jù)?怎么讀取數(shù)據(jù)?

事實(shí)上,通過在PyCharm中進(jìn)行代碼調(diào)試,我們可以簡要回答上述問題:

1)通過Sampler取樣器按序或隨機(jī)挑選出Batchsize數(shù)量的索引列表;

2)使用DataSet中的data_dir指定硬盤上的數(shù)據(jù)訪問路徑;

3)使用DataSet中自定義的getitem()方法,基于Sampler返回的索引列表讀取相應(yīng)數(shù)據(jù)和標(biāo)簽,并拼接成新的列表數(shù)據(jù)。

在這里插入圖片描述

事實(shí)上,PyTorch的數(shù)據(jù)讀取經(jīng)過了諸多函數(shù)的跳轉(zhuǎn)。在for循環(huán)中首先調(diào)用了“DataLoader”,進(jìn)而使用Sampler、Dataset和getitem解決“數(shù)據(jù)讀哪些?從哪讀?怎么讀?”的問題。

最后,我們提供一份PyTorch中DataLoader數(shù)據(jù)讀取機(jī)制的函數(shù)跳轉(zhuǎn)流程圖,供大家參考學(xué)習(xí)。

在這里插入圖片描述

到此這篇關(guān)于淺談PyTorch的數(shù)據(jù)讀取機(jī)制Dataloader與Dataset的文章就介紹到這了,更多相關(guān)PyTorch的Dataloader與Dataset內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python列表(list)常用操作方法小結(jié)

    Python列表(list)常用操作方法小結(jié)

    這篇文章主要介紹了Python列表(list)常用操作方法小結(jié),本文講解了常用操作方法和一些簡單代碼實(shí)例,需要的朋友可以參考下
    2015-02-02
  • python開發(fā)之a(chǎn)naconda以及win7下安裝gensim的方法

    python開發(fā)之a(chǎn)naconda以及win7下安裝gensim的方法

    這篇文章主要介紹了python開發(fā)之a(chǎn)naconda以及win7下安裝gensim的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • python去重,一個(gè)由dict組成的list的去重示例

    python去重,一個(gè)由dict組成的list的去重示例

    今天小編就為大家分享一篇python去重,一個(gè)由dict組成的list的去重示例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • WxPython開發(fā)之列表數(shù)據(jù)的自定義打印處理

    WxPython開發(fā)之列表數(shù)據(jù)的自定義打印處理

    這篇文章主要為大家詳細(xì)介紹了如何利用WxPython內(nèi)置的打印數(shù)據(jù)組件實(shí)現(xiàn)列表數(shù)據(jù)的自定義打印處理,以及對記錄進(jìn)行分頁等常規(guī)操作,需要的可以參考下
    2025-03-03
  • Python基礎(chǔ)之字典常見操作經(jīng)典實(shí)例詳解

    Python基礎(chǔ)之字典常見操作經(jīng)典實(shí)例詳解

    這篇文章主要介紹了Python基礎(chǔ)之字典常見操作,結(jié)合實(shí)例形式詳細(xì)分析了Python基本功能、創(chuàng)建、內(nèi)置函數(shù)與相關(guān)使用技巧,需要的朋友可以參考下
    2020-02-02
  • 如何在python?中導(dǎo)入?package

    如何在python?中導(dǎo)入?package

    這篇文章主要介紹了?如何在python中導(dǎo)入,package,package?在python中是一種有效組織代碼,module可以是一個(gè)文件,可以通過import來導(dǎo)入一個(gè)module?單個(gè)文件,而,package,則是作為一個(gè)目錄來導(dǎo)入,下文操作流程需要的朋友可以參考一下
    2022-04-04
  • 利用Python過濾相似文本的簡單方法示例

    利用Python過濾相似文本的簡單方法示例

    這篇文章主要給大家介紹了關(guān)于利用Python過濾相似文本的簡單方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-02-02
  • Python3通過chmod修改目錄或文件權(quán)限的方法示例

    Python3通過chmod修改目錄或文件權(quán)限的方法示例

    這篇文章主要介紹了Python3通過chmod修改目錄或文件權(quán)限的方法示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-06-06
  • Python插入Elasticsearch操作方法解析

    Python插入Elasticsearch操作方法解析

    這篇文章主要介紹了Python插入Elasticsearch操作方法解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-01-01
  • pandas如何優(yōu)雅的列轉(zhuǎn)行及行轉(zhuǎn)列詳解

    pandas如何優(yōu)雅的列轉(zhuǎn)行及行轉(zhuǎn)列詳解

    我們在做數(shù)據(jù)處理的時(shí)候遇到pandas列轉(zhuǎn)行的問題,這篇文章主要給大家介紹了關(guān)于pandas如何優(yōu)雅的列轉(zhuǎn)行及行轉(zhuǎn)列的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2021-12-12

最新評論