Pytorch DataLoader 變長數(shù)據(jù)處理方式

更新時間：2020年01月08日 09:33:00 作者：HappyCtest

今天小編就為大家分享一篇Pytorch DataLoader 變長數(shù)據(jù)處理方式，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

關于Pytorch中怎么自定義Dataset數(shù)據(jù)集類、怎樣使用DataLoader迭代加載數(shù)據(jù)，這篇官方文檔已經(jīng)說得很清楚了，這里就不在贅述。

現(xiàn)在的問題：有的時候，特別對于NLP任務來說，輸入的數(shù)據(jù)可能不是定長的，比如多個句子的長度一般不會一致，這時候使用DataLoader加載數(shù)據(jù)時，不定長的句子會被胡亂切分，這肯定是不行的。

解決方法是重寫DataLoader的collate_fn，具體方法如下：

# 假如每一個樣本為：
sample = {
	# 一個句子中各個詞的id
	'token_list' : [5, 2, 4, 1, 9, 8],
	# 結果y
	'label' : 5,
}


# 重寫collate_fn函數(shù)，其輸入為一個batch的sample數(shù)據(jù)
def collate_fn(batch):
	# 因為token_list是一個變長的數(shù)據(jù)，所以需要用一個list來裝這個batch的token_list
  token_lists = [item['token_list'] for item in batch]
  
  # 每個label是一個int，我們把這個batch中的label也全取出來，重新組裝
  labels = [item['label'] for item in batch]
  # 把labels轉換成Tensor
  labels = torch.Tensor(labels)
  return {
    'token_list': token_lists,
    'label': labels,
  }


# 在使用DataLoader加載數(shù)據(jù)時，注意collate_fn參數(shù)傳入的是重寫的函數(shù)
DataLoader(trainset, batch_size=4, shuffle=True, num_workers=4, collate_fn=collate_fn)

使用以上方法，可以保證DataLoader能Load出一個batch的數(shù)據(jù)，load出來的東西就是重寫的collate_fn函數(shù)最后return出來的字典。

以上這篇Pytorch DataLoader 變長數(shù)據(jù)處理方式就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Python必須了解的35個關鍵詞
這篇文章主要介紹了Python必須了解的35個關鍵詞，文中講解非常細致，幫助大家更好的理解和學習，感興趣的朋友可以了解下
2020-07-07
一篇文章帶你了解Python中的類
這篇文章主要給大家介紹了關于Python中類的相關資料，文中通過示例代碼介紹的非常詳細，對大家學習或者使用Python具有一定的參考學習價值，需要的朋友們下面來一起學習學習吧
2021-09-09
快速上手基于Anaconda搭建Django環(huán)境的教程
Django具有完整的封裝，開發(fā)者可以高效率的開發(fā)項目，Django將大部分的功能進行了封裝，開發(fā)者只需要調用即可，接下來通過本文給大家介紹基于Anaconda搭建Django環(huán)境的教程,需要的朋友可以參考下
2021-10-10
python 打印對象的所有屬性值的方法
下面小編就為大家?guī)硪黄猵ython 打印對象的所有屬性值的方法。小編覺得挺不錯的，現(xiàn)在就分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2016-09-09
Python建立Map寫Excel表實例解析
這篇文章主要介紹了Python建立Map寫Excel表實例解析，具有一定借鑒價值,需要的朋友可以參考下
2018-01-01
Python隨機生成8位密碼的示例詳解
這篇文章主要為大家詳細介紹了基于Python實現(xiàn)隨機生成8位密碼的相關方法，文中的示例代碼講解詳細，具有一定的借鑒價值，需要的可以參考一下
2023-02-02
Python文件如何讀取read()函數(shù)
這篇文章主要介紹了Python文件如何讀取read()函數(shù)問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2024-02-02
$python簡單圖片操作：打開\顯示\保存圖像方法介紹$
python簡單圖片操作：打開\顯示\保存圖像方法介紹
這篇文章主要介紹了python簡單圖片操作：打開\顯示\保存圖像方法介紹，還涉及將圖片保存為灰度圖的簡單方法示例，具有一定參考價值，需要的朋友可以了解下。
2017-11-11
Python shelve模塊實現(xiàn)解析
這篇文章主要介紹了Python shelve模塊實現(xiàn)解析,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2019-08-08
淺談flask源碼之請求過程
這篇文章主要介紹了淺談flask源碼之請求過程,小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2018-07-07