怎樣保存模型權重和checkpoint
概述
在pytorch中有兩種方式可以保存推理模型,第一種是只保存模型的參數(shù),比如parameters和buffers;另外一種是保存整個模型;
1.保存模型 - 權重參數(shù)
我們可以用torch.save()函數(shù)來保存model.state_dict();state_dict()里面包含模型的parameters&buffers;這種方法只保存模型中必要的訓練參數(shù)。
你可以用pytorch中的pickle來保存模型;使用這種方法可以生成最直觀的語法,并涉及最少的代碼;這種方法的缺點是,序列化的數(shù)據(jù)被綁定到特定的類和保存模型時使用的確切的目錄結構。
這樣做的原因是pickle并不保存模型類本身。相反,它保存包含類的文件的路徑,在加載期間使用;因此,當在其他項目中使用或重構后,您的代碼可能以各種方式中斷。
我們將探討如何保存和加載模型進行推斷的兩種方法。
步驟:
(1)導入所有必要的庫來加載我們的數(shù)據(jù)
(2)定義和初始化神經(jīng)網(wǎng)絡
(3)初始化優(yōu)化器
(4)保存并通過state_dict加載模型
(5)保存并加載整個模型
1.1代碼
# -*- coding: utf-8 -*- # @Project: zc # @Author: zc # @File name: Neural_Network_test # @Create time: 2022/3/19 15:33 # 1.導入相關數(shù)據(jù)庫 import torch import torch.nn as nn import torch.optim as optim from torch.nn import functional as F # 2.定義神經(jīng)網(wǎng)絡模型 class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.conv1 = nn.Conv2d(3, 6, 5) self.pool = nn.MaxPool2d(2, 2) self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(16 * 5 * 5, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) def forward(self, x): x = self.pool(F.relu(self.conv1(x))) x = self.pool(F.relu(self.conv2(x))) x = x.view(-1, 16 * 5 * 5) x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x # 3. 實例化神經(jīng)網(wǎng)絡 net = Net() # 4. 實例化優(yōu)化器 optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9) # 5. 保存模型參數(shù) # Specify a path PATH = "state_dict_model.pt" # 6. 保存模型的參數(shù)字典:parameters and buffers torch.save(net.state_dict(), PATH) # 7. 實例化新的模型 model = Net() # 8. 給新的實例加載之前的模型參數(shù) model.load_state_dict(torch.load(PATH)) # 9. 設置模型為評估模式 model.eval()
注意(1):
pytorch中常用的慣例是將model.state_dict()保存為"state_dict_model.pt",即文件的格式一般是.pt或者.pth格式文件;注意load_state_dict加載的是一個字典,而不是路徑。
注意(2):
模型參數(shù)在推理階段一定要設置model.eval();這樣可以讓dropout和batchnorm失效,如果沒設置推理模式,會得到不一樣的結果。
2.保存模型 - 整個模型
將模型所有的內(nèi)容都保存下來。
# Specify a path PATH = "entire_model.pt" # Save torch.save(net, PATH) # Load model = torch.load(PATH) model.eval()
3.保存模型 - checkpoints
我們按照checkpoints模式來保存模型,本質(zhì)上就是按照字典的模式進行分門別類的保存,我們可以通過鍵值進行加載。
epoch
:訓練周期model_state_dict
:模型可訓練參數(shù)optimizer_state_dict
:模型優(yōu)化器參數(shù)loss
:模型的損失函數(shù)
# Additional information EPOCH = 5 PATH = "model.pt" LOSS = 0.4 torch.save({ 'epoch': EPOCH, 'model_state_dict': net.state_dict(), 'optimizer_state_dict': optimizer.state_dict(), 'loss': LOSS, }, PATH)
保存和加載通用的檢查點模型以進行推斷或恢復訓練,這有助于您從上一個地方繼續(xù)進行。
當保存一個常規(guī)檢查點時,您必須保存模型的state_dict之外的更多信息。
保存優(yōu)化器的state_dict也很重要,因為它包含緩沖區(qū)和參數(shù),隨著模型的運行而更新。
您可能希望保存的其他項目是您離開的時期,最新記錄的訓練損失,外部torch.nn.嵌入層,以及更多,基于自己的算法
3.1代碼
# 1.導入相關數(shù)據(jù)庫 import torch import torch.nn as nn import torch.optim as optim from torch.nn import functional as F # 2. 定義神經(jīng)網(wǎng)絡 class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.conv1 = nn.Conv2d(3, 6, 5) self.pool = nn.MaxPool2d(2, 2) self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(16 * 5 * 5, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) def forward(self, x): x = self.pool(F.relu(self.conv1(x))) x = self.pool(F.relu(self.conv2(x))) x = x.view(-1, 16 * 5 * 5) x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x # 3. 實例化神經(jīng)網(wǎng)絡 net = Net() # 4. 實例化優(yōu)化器 optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9) # Additional information # 5. 定義超參數(shù) EPOCH = 5 PATH = "model.pt" LOSS = 0.4 # 6. 以checkpoints形式保存模型的相關數(shù)據(jù) torch.save({ 'epoch': EPOCH, 'model_state_dict': net.state_dict(), 'optimizer_state_dict': optimizer.state_dict(), 'loss': LOSS, }, PATH) # 7. 重新實例化一個模型 model = Net() # 8. 實例化優(yōu)化器 optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9) # 9. 加載以前的checkpoint checkpoint = torch.load(PATH) # 10. 通過鍵值來加載相關參數(shù) model.load_state_dict(checkpoint['model_state_dict']) optimizer.load_state_dict(checkpoint['optimizer_state_dict']) epoch = checkpoint['epoch'] loss = checkpoint['loss'] # 11.設置推理模式 model.eval() # - or - model.train()
4.保存雙模型
當保存有多個神經(jīng)網(wǎng)絡模型組成的神經(jīng)網(wǎng)絡時,比如GAN對抗模型,sequence-to-sequence序列到序列模型,或者一個組合模型,你必須為每一個模型保存狀態(tài)字典state_dict()和其對應的優(yōu)化器參數(shù)optimizer.state_dict();您還可以保存任何其他項目,可能會幫助您恢復訓練,只需將它們添加到字典;為了加載模型,第一步是初始化神經(jīng)網(wǎng)絡模型和優(yōu)化器,然后用torch.load()去加載checkpoint對應的數(shù)據(jù),因為checkpoints是字典,所以我們可以通過鍵值進行查詢導入;
4.1相關步驟
(1)導入所有相關的數(shù)據(jù)庫
(2)定義和實例化神經(jīng)網(wǎng)絡模型
(3)初始化優(yōu)化器
(4)保存多重模型
(5)加載多重模型
# 1.導入相關數(shù)據(jù)庫 import torch import torch.nn as nn import torch.optim as optim from torch.nn import functional as F # 2. 定義神經(jīng)網(wǎng)絡 class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.conv1 = nn.Conv2d(3, 6, 5) self.pool = nn.MaxPool2d(2, 2) self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(16 * 5 * 5, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) def forward(self, x): x = self.pool(F.relu(self.conv1(x))) x = self.pool(F.relu(self.conv2(x))) x = x.view(-1, 16 * 5 * 5) x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x # 3. 實例化神經(jīng)網(wǎng)絡A,B netA = Net() netB = Net() # 4. 實例化優(yōu)化器A,B optimizerA = optim.SGD(netA.parameters(), lr=0.001, momentum=0.9) optimizerB = optim.SGD(netB.parameters(), lr=0.001, momentum=0.9) # 5. 保存模型 # Specify a path to save to PATH = "model.pt" torch.save({ 'modelA_state_dict': netA.state_dict(), 'modelB_state_dict': netB.state_dict(), 'optimizerA_state_dict': optimizerA.state_dict(), 'optimizerB_state_dict': optimizerB.state_dict(), }, PATH) # 6.重新實例化新的網(wǎng)絡模型A,B modelA = Net() modelB = Net() # 7. 重新實例化新的網(wǎng)絡模型A,B optimModelA = optim.SGD(modelA.parameters(), lr=0.001, momentum=0.9) optimModelB = optim.SGD(modelB.parameters(), lr=0.001, momentum=0.9) # 8. 將以前模型的參數(shù)重新加載到新的模型A,B中 checkpoint = torch.load(PATH) modelA.load_state_dict(checkpoint['modelA_state_dict']) modelB.load_state_dict(checkpoint['modelB_state_dict']) optimizerA.load_state_dict(checkpoint['optimizerA_state_dict']) optimizerB.load_state_dict(checkpoint['optimizerB_state_dict']) # 9. 開啟預測模式 modelA.eval() modelB.eval() # - or - # 10.開啟訓練模式 modelA.train() modelB.train()
5.機器學習流程圖
6.機器學習常用庫
總結
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python中index()函數(shù)與find()函數(shù)的區(qū)別詳解
這篇文章主要介紹了Python中index()函數(shù)與find()函數(shù)的區(qū)別詳解,Python index()方法檢測字符串中是否包含子字符串 str ,如果指定beg開始和end結束范圍,則檢查是否包含在指定范圍內(nèi),需要的朋友可以參考下2023-08-08LyScript實現(xiàn)內(nèi)存交換與差異對比的方法詳解
LyScript?針對內(nèi)存讀寫函數(shù)的封裝功能并不多,只提供了內(nèi)存讀取和內(nèi)存寫入函數(shù)的封裝,本篇文章將繼續(xù)對API進行封裝,實現(xiàn)一些在軟件逆向分析中非常實用的功能,需要的可以參考一下2022-08-08解決已經(jīng)安裝requests,卻依然提示No module named requests問題
今天小編就為大家分享一篇解決已經(jīng)安裝requests,卻依然提示No module named 'requests'問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-05-05Opencv圖像添加椒鹽噪聲、高斯濾波去除噪聲原理以及手寫Python代碼實現(xiàn)方法
椒鹽噪聲的特征非常明顯,為圖像上有黑色和白色的點,下面這篇文章主要給大家介紹了關于Opencv圖像添加椒鹽噪聲、高斯濾波去除噪聲原理以及手寫Python代碼實現(xiàn)的相關資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2022-09-09