解讀torch.nn.GRU的輸入及輸出示例
我們有時(shí)會(huì)看到GRU中輸入的參數(shù)有時(shí)是一個(gè),但是有時(shí)又有兩個(gè)。這難免會(huì)讓人們感到疑惑,那么這些參數(shù)到底是什么呢。
一、輸入到GRU的參數(shù)
輸入的參數(shù)有兩個(gè),分別是input和h_0。
Inputs: input, h_0
①input的shape
The shape of input:(seq_len, batch, input_size) : tensor containing the feature of the input sequence. The input can also be a packed variable length sequence。
See functorch.nn.utils.rnn.pack_padded_sequencefor details.
②h_0的shape
從下面的解釋中也可以看出,這個(gè)參數(shù)可以不提供,那么就默認(rèn)為0.
The shape of h_0:(num_layers * num_directions, batch, hidden_size): tensor containing the initial hidden state for each element in the batch.
Defaults to zero if not provided. If the RNN is bidirectional num_directions should be 2, else it should be 1.
綜上,可以只輸入一個(gè)參數(shù)。當(dāng)輸入兩個(gè)參數(shù)的時(shí)候,那么第二個(gè)參數(shù)相當(dāng)于是一個(gè)隱含層的輸出。
為了便于理解,下面是一幅圖:
二、GRU返回的數(shù)據(jù)
輸出有兩個(gè),分別是output和h_n
①output
output 的shape是:(seq_len, batch, num_directions * hidden_size): tensor containing the output features h_t from the last layer of the GRU, for each t.
If a class:torch.nn.utils.rnn.PackedSequence has been given as the input, the output will also be a packed sequence.
For the unpacked case, the directions can be separated using output.view(seq_len, batch, num_directions, hidden_size), with forward and backward being direction 0 and 1 respectively.
Similarly, the directions can be separated in the packed case.
②h_n
h_n的shape是:(num_layers * num_directions, batch, hidden_size): tensor containing the hidden state for t = seq_len
Like output, the layers can be separated using
h_n.view(num_layers, num_directions, batch, hidden_size).
三、代碼示例
數(shù)據(jù)的shape是[batch,seq_len,emb_dim]
RNN接收輸入的數(shù)據(jù)的shape是[seq_len,batch,emb_dim]
即前兩個(gè)維度調(diào)換就行了。
可以知道,加入批處理的時(shí)候一次處理128個(gè)句子,每個(gè)句子中有5個(gè)單詞,那么上圖中展示的input_data的shape是:[128,5,emb_dim]。
結(jié)合代碼分析,本例子將演示有1個(gè)句子和5個(gè)句子的情況。假設(shè)每個(gè)句子中有9個(gè)單詞,所以seq_len=9,并且每個(gè)單詞對(duì)應(yīng)的emb_dim=3,所以對(duì)應(yīng)數(shù)據(jù)的shape是: [batch,9,3],由于輸入到RNN中數(shù)據(jù)格式的格式,所以為[9,batch,3]
import torch import torch.nn as nn emb_dim = 3 hidden_dim = 2 rnn = nn.GRU(emb_dim,hidden_dim) #rnn = nn.GRU(9,1,3) print(type(rnn)) tensor1 = torch.tensor([[-0.5502, -0.1920, 1.1845], [-0.8003, 2.0783, 0.0175], [ 0.6761, 0.7183, -1.0084], [ 0.9514, 1.4772, -0.2271], [-1.0146, 0.7912, 0.2003], [-0.5502, -0.1920, 1.1845], [-0.8003, 2.0783, 0.0175], [ 0.1718, 0.1070, 0.4255], [-2.6727, -1.5680, -0.8369]]) tensor2 = torch.tensor([[-0.5502, -0.1920]]) # 假設(shè)input只有一個(gè)句子,那么batch為1 print('--------------batch=1時(shí)------------') data = tensor1.unsqueeze(0) h_0 = tensor2[0].unsqueeze(0).unsqueeze(0) print('data.shape: [batch,seq_len,emb_dim]',data.shape) print('') input = data.transpose(0,1) print('input.shape: [seq_len,batch,emb_dim]',input.shape) print('h_0.shape: [1,batch,hidden_dim]',h_0.shape) print('') # 輸入到rnn中 output,h_n = rnn(input,h_0) print('output.shape: [seq_len,batch,hidden_dim]',output.shape) print('h_n.shape: [1,batch,hidden_dim]',h_n.shape) # 假設(shè)input中有5個(gè)句子,所以,batch = 5 print('\n--------------batch=5時(shí)------------') data = tensor1.unsqueeze(0).repeat(5,1,1) # 由于batch為5 h_0 = tensor2[0].unsqueeze(0).repeat(1,5,1) # 由于batch為5 print('data.shape: [batch,seq_len,emb_dim]',data.shape) print('') input = data.transpose(0,1) print('input.shape: [seq_len,batch,emb_dim]',input.shape) print('h_0.shape: [1,batch,hidden_dim]',h_0.shape) print('') # 輸入到rnn中 output,h_n = rnn(input,h_0) print('output.shape: [seq_len,batch,hidden_dim]',output.shape) print('h_n.shape: [1,batch,hidden_dim]',h_n.shape)
四、輸出
<class ‘torch.nn.modules.rnn.GRU’>
--------------batch=1時(shí)------------
data.shape: [batch,seq_len,emb_dim] torch.Size([1, 9, 3])input.shape: [seq_len,batch,emb_dim] torch.Size([9, 1, 3])
h_0.shape: [1,batch,hidden_dim] torch.Size([1, 1, 2])output.shape: [seq_len,batch,hidden_dim] torch.Size([9, 1, 2])
h_n.shape: [1,batch,hidden_dim] torch.Size([1, 1, 2])--------------batch=5時(shí)------------
data.shape: [batch,seq_len,emb_dim] torch.Size([5, 9, 3])input.shape: [seq_len,batch,emb_dim] torch.Size([9, 5, 3])
h_0.shape: [1,batch,hidden_dim] torch.Size([1, 5, 2])output.shape: [seq_len,batch,hidden_dim] torch.Size([9, 5, 2])
h_n.shape: [1,batch,hidden_dim] torch.Size([1, 5, 2])
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python 中if else 語(yǔ)句的作用及示例代碼
python中的if-else語(yǔ)句是一個(gè)判斷性語(yǔ)句,既然是判斷就要有條件以及滿足條件與不滿足的情況,一下將講解一些if-else語(yǔ)句的知識(shí),需要的朋友參考下吧2018-03-03Python環(huán)境搭建以及Python與PyCharm安裝詳細(xì)圖文教程
PyCharm是一種PythonIDE,帶有一整套可以幫助用戶在使用Python語(yǔ)言開發(fā)時(shí)提高其效率的工具,這篇文章主要給大家介紹了關(guān)于Python環(huán)境搭建以及Python與PyCharm安裝的詳細(xì)圖文教程,需要的朋友可以參考下2024-03-03Python實(shí)現(xiàn)自動(dòng)合并Word并添加分頁(yè)符
這篇文章主要為大家詳細(xì)介紹了如何基于Python實(shí)現(xiàn)對(duì)多個(gè)Word文檔加以自動(dòng)合并,并在每次合并時(shí)按要求增添一個(gè)分頁(yè)符的功能,感興趣的可以了解一下2023-02-02Python實(shí)現(xiàn)全角半角字符互轉(zhuǎn)的方法
大家都知道在自然語(yǔ)言處理過程中,全角、半角的的不一致會(huì)導(dǎo)致信息抽取不一致,因此需要統(tǒng)一。這篇文章通過示例代碼給大家詳細(xì)的介紹了Python實(shí)現(xiàn)全角半角字符互轉(zhuǎn)的方法,有需要的朋友們可以參考借鑒,下面跟著小編一起學(xué)習(xí)學(xué)習(xí)吧。2016-11-11Django如何創(chuàng)作一個(gè)簡(jiǎn)單的最小程序
這篇文章主要介紹了Django如何創(chuàng)作一個(gè)簡(jiǎn)單的最小程序,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-05-05python實(shí)現(xiàn)圖書管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)圖書管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-03-03python 解決動(dòng)態(tài)的定義變量名,并給其賦值的方法(大數(shù)據(jù)處理)
今天小編就為大家分享一篇python 解決動(dòng)態(tài)的定義變量名,并給其賦值的方法(大數(shù)據(jù)處理),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2018-11-11pytorch 改變tensor尺寸的實(shí)現(xiàn)
今天小編就為大家分享一篇pytorch 改變tensor尺寸的實(shí)現(xiàn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2020-01-01Python使用thread模塊實(shí)現(xiàn)多線程的操作
線程(Threads)是操作系統(tǒng)提供的一種輕量級(jí)的執(zhí)行單元,可以在一個(gè)進(jìn)程內(nèi)并發(fā)執(zhí)行多個(gè)任務(wù),每個(gè)線程都有自己的執(zhí)行上下文,包括棧、寄存器和程序計(jì)數(shù)器,本文給大家介紹了Python使用thread模塊實(shí)現(xiàn)多線程的操作,需要的朋友可以參考下2024-10-10