解決Pytorch中的神坑:關(guān)于model.eval的問題
有時候使用Pytorch訓(xùn)練完模型,在測試數(shù)據(jù)上面得到的結(jié)果令人大跌眼鏡。
這個時候需要檢查一下定義的Model類中有沒有 BN 或 Dropout 層,如果有任何一個存在
那么在測試之前需要加入一行代碼:
#model是實(shí)例化的模型對象 model = model.eval()
表示將模型轉(zhuǎn)變?yōu)閑valuation(測試)模式,這樣就可以排除BN和Dropout對測試的干擾。
因?yàn)锽N和Dropout在訓(xùn)練和測試時是不同的:
對于BN,訓(xùn)練時通常采用mini-batch,所以每一批中的mean和std大致是相同的;而測試階段往往是單個圖像的輸入,不存在mini-batch的概念。所以將model改為eval模式后,BN的參數(shù)固定,并采用之前訓(xùn)練好的全局的mean和std;
對于Dropout,訓(xùn)練階段,隱含層神經(jīng)元先乘概率P,再進(jìn)行激活;而測試階段,神經(jīng)元先激活,每個隱含層神經(jīng)元的輸出再乘概率P。
如下圖所示:
補(bǔ)充:pytorch中model.eval之后是否還需要model.train的問題
答案是:需要的
正確的寫法是
for循環(huán)之后再開啟train,
循環(huán)之后的評估m(xù)odel.eval之后就會再次回到model.train
以上為個人經(jīng)驗(yàn),希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Pytorch實(shí)現(xiàn)Fashion-mnist分類任務(wù)全過程
這篇文章主要介紹了Pytorch實(shí)現(xiàn)Fashion-mnist分類任務(wù)全過程,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-12-12python機(jī)器學(xué)習(xí)庫scikit-learn:SVR的基本應(yīng)用
這篇文章主要介紹了python機(jī)器學(xué)習(xí)庫scikit-learn:SVR的基本應(yīng)用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-06-06Python庫Gym開發(fā)和比較強(qiáng)化學(xué)習(xí)算法使用探究
這篇文章主要介紹了Python庫Gym開發(fā)和比較強(qiáng)化學(xué)習(xí)算法使用探究,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01配置python連接oracle讀取excel數(shù)據(jù)寫入數(shù)據(jù)庫的操作流程
這篇文章主要介紹了配置python連接oracle,讀取excel數(shù)據(jù)寫入數(shù)據(jù)庫,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-03-03Django框架視圖層URL映射與反向解析實(shí)例分析
這篇文章主要介紹了Django框架視圖層URL映射與反向解析,結(jié)合實(shí)例形式分析了Django框架普通url映射、命名URL參數(shù)映射、分布式URL映射、反向解析等相關(guān)操作技巧,需要的朋友可以參考下2019-07-07