欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pytorch DataLoader 變長數(shù)據(jù)處理方式

 更新時間:2020年01月08日 09:33:00   作者:HappyCtest  
今天小編就為大家分享一篇Pytorch DataLoader 變長數(shù)據(jù)處理方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

關(guān)于Pytorch中怎么自定義Dataset數(shù)據(jù)集類、怎樣使用DataLoader迭代加載數(shù)據(jù),這篇官方文檔已經(jīng)說得很清楚了,這里就不在贅述。

現(xiàn)在的問題:有的時候,特別對于NLP任務來說,輸入的數(shù)據(jù)可能不是定長的,比如多個句子的長度一般不會一致,這時候使用DataLoader加載數(shù)據(jù)時,不定長的句子會被胡亂切分,這肯定是不行的。

解決方法是重寫DataLoader的collate_fn,具體方法如下:

# 假如每一個樣本為:
sample = {
	# 一個句子中各個詞的id
	'token_list' : [5, 2, 4, 1, 9, 8],
	# 結(jié)果y
	'label' : 5,
}


# 重寫collate_fn函數(shù),其輸入為一個batch的sample數(shù)據(jù)
def collate_fn(batch):
	# 因為token_list是一個變長的數(shù)據(jù),所以需要用一個list來裝這個batch的token_list
  token_lists = [item['token_list'] for item in batch]
  
  # 每個label是一個int,我們把這個batch中的label也全取出來,重新組裝
  labels = [item['label'] for item in batch]
  # 把labels轉(zhuǎn)換成Tensor
  labels = torch.Tensor(labels)
  return {
    'token_list': token_lists,
    'label': labels,
  }


# 在使用DataLoader加載數(shù)據(jù)時,注意collate_fn參數(shù)傳入的是重寫的函數(shù)
DataLoader(trainset, batch_size=4, shuffle=True, num_workers=4, collate_fn=collate_fn)

使用以上方法,可以保證DataLoader能Load出一個batch的數(shù)據(jù),load出來的東西就是重寫的collate_fn函數(shù)最后return出來的字典。

以上這篇Pytorch DataLoader 變長數(shù)據(jù)處理方式就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python必須了解的35個關(guān)鍵詞

    Python必須了解的35個關(guān)鍵詞

    這篇文章主要介紹了Python必須了解的35個關(guān)鍵詞,文中講解非常細致,幫助大家更好的理解和學習,感興趣的朋友可以了解下
    2020-07-07
  • 一篇文章帶你了解Python中的類

    一篇文章帶你了解Python中的類

    這篇文章主要給大家介紹了關(guān)于Python中類的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用Python具有一定的參考學習價值,需要的朋友們下面來一起學習學習吧
    2021-09-09
  • 快速上手基于Anaconda搭建Django環(huán)境的教程

    快速上手基于Anaconda搭建Django環(huán)境的教程

    Django具有完整的封裝,開發(fā)者可以高效率的開發(fā)項目,Django將大部分的功能進行了封裝,開發(fā)者只需要調(diào)用即可,接下來通過本文給大家介紹基于Anaconda搭建Django環(huán)境的教程,需要的朋友可以參考下
    2021-10-10
  • python 打印對象的所有屬性值的方法

    python 打印對象的所有屬性值的方法

    下面小編就為大家?guī)硪黄猵ython 打印對象的所有屬性值的方法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2016-09-09
  • Python建立Map寫Excel表實例解析

    Python建立Map寫Excel表實例解析

    這篇文章主要介紹了Python建立Map寫Excel表實例解析,具有一定借鑒價值,需要的朋友可以參考下
    2018-01-01
  • Python隨機生成8位密碼的示例詳解

    Python隨機生成8位密碼的示例詳解

    這篇文章主要為大家詳細介紹了基于Python實現(xiàn)隨機生成8位密碼的相關(guān)方法,文中的示例代碼講解詳細,具有一定的借鑒價值,需要的可以參考一下
    2023-02-02
  • Python文件如何讀取read()函數(shù)

    Python文件如何讀取read()函數(shù)

    這篇文章主要介紹了Python文件如何讀取read()函數(shù)問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-02-02
  • python簡單圖片操作:打開\顯示\保存圖像方法介紹

    python簡單圖片操作:打開\顯示\保存圖像方法介紹

    這篇文章主要介紹了python簡單圖片操作:打開\顯示\保存圖像方法介紹,還涉及將圖片保存為灰度圖的簡單方法示例,具有一定參考價值,需要的朋友可以了解下。
    2017-11-11
  • Python shelve模塊實現(xiàn)解析

    Python shelve模塊實現(xiàn)解析

    這篇文章主要介紹了Python shelve模塊實現(xiàn)解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-08-08
  • 淺談flask源碼之請求過程

    淺談flask源碼之請求過程

    這篇文章主要介紹了淺談flask源碼之請求過程,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-07-07

最新評論