快捷導(dǎo)航

pytorch中model.train()和model.eval()用法及說明

更新時(shí)間：2024年09月09日 15:56:56 作者：hejp_123

在PyTorch中,model.train()用于啟用BatchNormalization和Dropout,保證模型在訓(xùn)練階段能夠有效地利用這些層的特性,而model.eval()則是用于測試階段,確保BatchNormalization和Dropout不會(huì)影響測試結(jié)果,保持模型的穩(wěn)定性

model.train()和model.eval()用法

1.1 model.train()

model.train()的作用是啟用 Batch Normalization 和 Dropout。

如果模型中有BN層(Batch Normalization）和Dropout，需要在訓(xùn)練時(shí)添加model.train()。

model.train()是保證BN層能夠用到每一批數(shù)據(jù)的均值和方差。

對(duì)于Dropout，model.train()是隨機(jī)取一部分網(wǎng)絡(luò)連接來訓(xùn)練更新參數(shù)。

1.2 model.eval()

model.eval()的作用是不啟用 Batch Normalization 和 Dropout。

如果模型中有BN層(Batch Normalization）和Dropout，在測試時(shí)添加model.eval()。

model.eval()是保證BN層能夠用全部訓(xùn)練數(shù)據(jù)的均值和方差，即測試過程中要保證BN層的均值和方差不變。

對(duì)于Dropout，model.eval()是利用到了所有網(wǎng)絡(luò)連接，即不進(jìn)行隨機(jī)舍棄神經(jīng)元。

訓(xùn)練完train樣本后，生成的模型model要用來測試樣本。

在model(test)之前，需要加上model.eval()，否則的話，有輸入數(shù)據(jù)，即使不訓(xùn)練，它也會(huì)改變權(quán)值。這是model中含有BN層和Dropout所帶來的的性質(zhì)。

在做one classification的時(shí)候，訓(xùn)練集和測試集的樣本分布是不一樣的，尤其需要注意這一點(diǎn)。

1.3 分析原因

使用PyTorch進(jìn)行訓(xùn)練和測試時(shí)一定注意要把實(shí)例化的model指定train/eval。

model.eval()時(shí)，框架會(huì)自動(dòng)把BN和Dropout固定住，不會(huì)取平均，而是用訓(xùn)練好的值，

不然的話，一旦test的batch_size過小，很容易就會(huì)被BN層導(dǎo)致生成圖片顏色失真極大?。。。。?！

總結(jié)

以上為個(gè)人經(jīng)驗(yàn)，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

Python全面解析json數(shù)據(jù)并保存為csv文件
這篇文章主要介紹了Python全面解析json數(shù)據(jù)并保存為csv文件，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2022-07-07
Python pandas 的索引方式 data.loc[],data[][]示例詳解
這篇文章主要介紹了Python pandas 的索引方式 data.loc[], data[][]的相關(guān)資料,其中data.loc[index,column]使用.loc[ ]第一個(gè)參數(shù)是行索引，第二個(gè)參數(shù)是列索引，本文結(jié)合實(shí)例代碼講解的非常詳細(xì)，需要的朋友可以參考下
2023-02-02
Python實(shí)現(xiàn)刪除list列表重復(fù)元素的方法總結(jié)
在Python編程中，我們經(jīng)常需要處理列表中的重復(fù)元素，這篇文章為大家介紹了五種高效的方法來刪除列表中的重復(fù)元素，希望對(duì)大家有所幫助
2023-07-07
Python 語言實(shí)現(xiàn)六大查找算法
本文給大家分享Python 語言實(shí)現(xiàn)六大查找算法，針對(duì)每種算法通過實(shí)例代碼給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值，需要的朋友參考下吧
2021-06-06
Python面向?qū)ο缶幊讨惖倪M(jìn)階
這篇文章主要介紹了Python面向?qū)ο缶幊讨惖囊?，引?Reference是對(duì)象的指針，引用是內(nèi)存中真實(shí)對(duì)象的指針，表示為變量名或者內(nèi)存地址、每個(gè)對(duì)象存在至少一個(gè)引用，id()函數(shù)用于獲得引用，想具體了解的小伙伴可以參考下面文章的內(nèi)容
2021-11-11
python實(shí)現(xiàn)裝飾器、描述符
本篇文章通過代碼實(shí)例給大家分享了python實(shí)現(xiàn)裝飾器、描述符模擬代碼的過程，對(duì)戲需要的讀者可以參考下。
2018-02-02
python掃描線填充算法詳解
這篇文章主要為大家詳細(xì)介紹了python掃描線填充算法，文中示例代碼介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2020-02-02
Python列表排序方法reverse、sort、sorted詳解
這篇文章主要介紹了Python列表排序方法reverse、sort、sorted詳解,需要的朋友可以參考下
2021-04-04
Python的垃圾回收機(jī)制深入分析
這篇文章主要介紹了Python的垃圾回收機(jī)制,有助于深入的理解Python的內(nèi)存分配與回收機(jī)制,需要的朋友可以參考下
2014-07-07
python如何以表格形式打印輸出的方法示例
這篇文章主要介紹了python如何以表格形式打印輸出的方法示例，小編覺得挺不錯(cuò)的，現(xiàn)在分享給大家，也給大家做個(gè)參考。一起跟隨小編過來看看吧
2019-06-06