腳本之家服務器常用軟件

快捷導航

Pytorch 的 LSTM 模型的示例教程

更新時間：2023年06月01日 15:30:45 作者：許野平

本文給大家介紹了Pytorch 的 LSTM 模型的示例教程，文中結合實例代碼給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友參考下吧

1. 代碼

完整的源代碼：

import torch
from torch import nn
# 定義一個LSTM模型
class LSTM(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, output_size):
        super(LSTM, self).__init__()
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_size, output_size)
    def forward(self, x):
        # 初始化隱藏狀態(tài)h0, c0為全0向量
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
        # 將輸入x和隱藏狀態(tài)(h0, c0)傳入LSTM網絡
        out, _ = self.lstm(x, (h0, c0))
        # 取最后一個時間步的輸出作為LSTM網絡的輸出
        out = self.fc(out[:, -1, :])
        return out
# 定義LSTM超參數
input_size = 10   # 輸入特征維度
hidden_size = 32  # 隱藏單元數量
num_layers = 2    # LSTM層數
output_size = 2   # 輸出類別數量
# 構建一個隨機輸入x和對應標簽y
x = torch.randn(64, 5, 10)  # [batch_size, sequence_length, input_size]
y = torch.randint(0, 2, (64,))  # 二分類任務，標簽為0或1
# 創(chuàng)建LSTM模型，并將輸入x傳入模型計算預測輸出
lstm = LSTM(input_size, hidden_size, num_layers, output_size)
pred = lstm(x)  # [batch_size, output_size]
# 定義損失函數和優(yōu)化器，并進行模型訓練
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(lstm.parameters(), lr=1e-3)
num_epochs = 100
for epoch in range(num_epochs):
    # 前向傳播計算損失函數值
    pred = lstm(x)  # 在每個epoch中重新計算預測輸出
    loss = criterion(pred.squeeze(), y)
    # 反向傳播更新模型參數
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    # 輸出每個epoch的訓練損失
    print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}")

2. 模型結構分析

# 定義一個LSTM模型
class LSTM(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, output_size):
        super(LSTM, self).__init__()
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_size, output_size)
    def forward(self, x):
        # 初始化隱藏狀態(tài)h0, c0為全0向量
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
        # 將輸入x和隱藏狀態(tài)(h0, c0)傳入LSTM網絡
        out, _ = self.lstm(x, (h0, c0))
        # 取最后一個時間步的輸出作為LSTM網絡的輸出
        out = self.fc(out[:, -1, :])
        return out

上述代碼定義了一個LSTM類，這個類可以用于完成一個基于LSTM的序列模型的搭建。

在初始化函數中，輸入的參數分別是輸入數據的特征維度（input_size），隱藏層的大?。╤idden_size），LSTM層數（num_layers）以及輸出數據的維度（output_size）。這里使用batch_first=True表示輸入數據的第一個維度是batch size，第二個維度是時間步長和特征維度。

在forward函數中，首先初始化了LSTM網絡的隱藏狀態(tài)為全0向量，并且將其移動到與輸入數據相同的設備上。然后調用了nn.LSTM函數進行前向傳播操作，并且通過fc層將最后一個時間步的輸出映射為輸出的數據，最后進行了返回。

3. 代碼詳解

        # 將輸入x和隱藏狀態(tài)(h0, c0)傳入LSTM網絡
        out, _ = self.lstm(x, (h0, c0))

這行代碼是利用 PyTorch 自帶的 LSTM 模塊處理輸入張量 x（形狀為 [batch_size, sequence_length, input_size]）并得到 LSTM 層的輸出 out 和最終狀態(tài)。其中，h0 是 LSTM 層的初始隱藏狀態(tài)，c0 是 LSTM 層的初始細胞狀態(tài)。

在代碼中，調用了 self.lstm(x, (h0, c0)) 函數，該函數的返回值有兩個：第一個返回值是 LSTM 層的輸出 out，其包含了所有時間步上的隱狀態(tài)；第二個返回值是一個元組，包含了最后一個時間步的隱藏狀態(tài)和細胞狀態(tài)，但我們用“_”丟棄了它。

因為對于許多深度學習任務來說，只需要輸出序列的最后一個時間步的隱藏狀態(tài)，而不需要每個時間步上的隱藏狀態(tài)。因此，這里我們只保留 LSTM 層的輸出 out，而忽略了 LSTM 層最后時間步的狀態(tài)。

最后，out 的形狀為 [batch_size, sequence_length, hidden_size]，其中 hidden_size 是 LSTM 層輸出的隱藏狀態(tài)的維度大小。

x = torch.randn(64, 5, 10)

這行代碼創(chuàng)建了一個形狀為 (64, 5, 10) 的張量 x，它包含 64 個樣本，每個樣本具有 5 個特征維度和 10 個時間步。該張量的值是由均值為 0，標準差為 1 的正態(tài)分布隨機生成的。

torch.randn() 是 PyTorch 中生成服從標準正態(tài)分布的隨機數的函數。它的輸入是張量的形狀，輸出是符合正態(tài)分布的張量。在本例中，形狀為 (64, 5, 10) 表示該張量包含 64 個樣本，每個樣本包含 5 個特征維度和 10 個時間步，每個元素都是服從標準正態(tài)分布的隨機數。這種方式生成的隨機數可以用于初始化模型參數、生成噪音數據等許多深度學習應用場景。

y = torch.randint(0, 2, (64,))  # 二分類任務，標簽為0或1

y = torch.randint(0, 2, (64,)) 是使用 PyTorch 庫中的 randint() 函數來生成一個64個元素的張量 y，張量的每個元素都是從區(qū)間 [0, 2) 中隨機生成的整數。

具體而言，torch.randint() 函數包含三個參數，分別是 low、high 和 size。其中，low 和 high 分別表示隨機生成整數的區(qū)間為 [low, high)，而 size 參數指定了生成的張量的形狀。

在上述代碼中，size=(64,) 表示生成的張量 y 的形狀為 64x1，即一個包含 64 個元素的一維張量，并且每個元素的值都在 [0, 2) 中隨機生成。這種形式的張量通常用于分類問題中的標簽向量。在該任務中，一個標簽通常由一個整數表示，因此可以采用使用 randint() 函數生成一個長度為標簽類別數的一維張量，其每個元素的取值為 0 或 1，表示對應類別是否被選中。

# 創(chuàng)建LSTM模型，并將輸入x傳入模型計算預測輸出
lstm = LSTM(input_size, hidden_size, num_layers, output_size)
pred = lstm(x)  # [batch_size, output_size]

通過定義的LSTM類創(chuàng)建了一個LSTM模型，并將輸入x傳入模型進行前向計算，得到了一個預測輸出pred，其形狀為[64, output_size]，其中output_size是在LSTM初始化函數中指定的輸出數據的維度。

這段代碼演示了如何使用已經構建好的代碼搭建并訓練一個基于LSTM的序列模型，并且展示了其中的一些關鍵步驟，包括數據輸入、模型創(chuàng)建以及前向計算。

到此這篇關于Pytorch 的 LSTM 模型的簡單示例的文章就介紹到這了,更多相關Pytorch LSTM 模型內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pytorch 的 LSTM 模型的示例教程

目錄

1. 代碼

2. 模型結構分析

3. 代碼詳解

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具