欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

PyTorch梯度裁剪避免訓(xùn)練loss nan的操作

 更新時間:2021年05月24日 10:53:10   作者:一個菜鳥的奮斗  
這篇文章主要介紹了PyTorch梯度裁剪避免訓(xùn)練loss nan的操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教

近來在訓(xùn)練檢測網(wǎng)絡(luò)的時候會出現(xiàn)loss為nan的情況,需要中斷重新訓(xùn)練,會很麻煩。因而選擇使用PyTorch提供的梯度裁剪庫來對模型訓(xùn)練過程中的梯度范圍進(jìn)行限制,修改之后,不再出現(xiàn)loss為nan的情況。

PyTorch中采用torch.nn.utils.clip_grad_norm_來實(shí)現(xiàn)梯度裁剪,鏈接如下:

https://pytorch.org/docs/stable/_modules/torch/nn/utils/clip_grad.html

訓(xùn)練代碼使用示例如下:

from torch.nn.utils import clip_grad_norm_
outputs = model(data)
loss= loss_fn(outputs, target)
optimizer.zero_grad()
loss.backward()
# clip the grad
clip_grad_norm_(model.parameters(), max_norm=20, norm_type=2)
optimizer.step()

其中,max_norm為梯度的最大范數(shù),也是梯度裁剪時主要設(shè)置的參數(shù)。

備注:網(wǎng)上有同學(xué)提醒在(強(qiáng)化學(xué)習(xí))使用了梯度裁剪之后訓(xùn)練時間會大大增加。目前在我的檢測網(wǎng)絡(luò)訓(xùn)練中暫時還沒有碰到這個問題,以后遇到再來更新。

補(bǔ)充:pytorch訓(xùn)練過程中出現(xiàn)nan的排查思路

1、最常見的就是出現(xiàn)了除0或者log0這種

看看代碼中在這種操作的時候有沒有加一個很小的數(shù),但是這個數(shù)數(shù)量級要和運(yùn)算的數(shù)的數(shù)量級要差很多。一般是1e-8。

2、在optim.step()之前裁剪梯度

optim.zero_grad()
loss.backward()
nn.utils.clip_grad_norm(model.parameters, max_norm, norm_type=2)
optim.step()

max_norm一般是1,3,5。

3、前面兩條還不能解決nan的話

就按照下面的流程來判斷。

...
loss = model(input)
# 1. 先看loss是不是nan,如果loss是nan,那么說明可能是在forward的過程中出現(xiàn)了第一條列舉的除0或者log0的操作
assert torch.isnan(loss).sum() == 0, print(loss)
optim.zero_grad()
loss.backward()
# 2. 如果loss不是nan,那么說明forward過程沒問題,可能是梯度爆炸,所以用梯度裁剪試試
nn.utils.clip_grad_norm(model.parameters, max_norm, norm_type=2)
# 3.1 在step之前,判斷參數(shù)是不是nan, 如果不是判斷step之后是不是nan
assert torch.isnan(model.mu).sum() == 0, print(model.mu)
optim.step()
# 3.2 在step之后判斷,參數(shù)和其梯度是不是nan,如果3.1不是nan,而3.2是nan,
# 特別是梯度出現(xiàn)了Nan,考慮學(xué)習(xí)速率是否太大,調(diào)小學(xué)習(xí)速率或者換個優(yōu)化器試試。
assert torch.isnan(model.mu).sum() == 0, print(model.mu)
assert torch.isnan(model.mu.grad).sum() == 0, print(model.mu.grad)

以上為個人經(jīng)驗(yàn),希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • python實(shí)現(xiàn)分頁效果

    python實(shí)現(xiàn)分頁效果

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)分頁效果,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2017-10-10
  • 淺談flask截獲所有訪問及before/after_request修飾器

    淺談flask截獲所有訪問及before/after_request修飾器

    這篇文章主要介紹了淺談flask截獲所有訪問及before/after_request修飾器,具有一定借鑒價值,需要的朋友可以參考下
    2018-01-01
  • python根據(jù)文本生成詞云圖代碼實(shí)例

    python根據(jù)文本生成詞云圖代碼實(shí)例

    這篇文章主要介紹了python根據(jù)文本生成詞云圖代碼實(shí)例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2019-11-11
  • PyQt 如何創(chuàng)建自定義QWidget

    PyQt 如何創(chuàng)建自定義QWidget

    這篇文章主要介紹了PyQt 如何創(chuàng)建自定義QWidget,幫助大家更好的理解和學(xué)習(xí)使用pyqt,感興趣的朋友可以了解下
    2021-03-03
  • numpy.reshape(-1,1)的具體使用

    numpy.reshape(-1,1)的具體使用

    本文主要介紹了numpy.reshape(-1,1)的具體使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2022-07-07
  • Python各類圖像庫的圖片讀寫方式總結(jié)(推薦)

    Python各類圖像庫的圖片讀寫方式總結(jié)(推薦)

    這篇文章主要介紹了Python各類圖像庫的圖片讀寫方式總結(jié)(推薦),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-02-02
  • Python實(shí)現(xiàn)為圖片批量添加隨機(jī)水印

    Python實(shí)現(xiàn)為圖片批量添加隨機(jī)水印

    這篇文章主要為大家詳細(xì)介紹了如何使用Python實(shí)現(xiàn)為圖片批量添加隨機(jī)水印,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-11-11
  • Python的閉包和裝飾器你真的了解嗎

    Python的閉包和裝飾器你真的了解嗎

    這篇文章主要為大家詳細(xì)介紹了Python的閉包和裝飾器,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2022-02-02
  • Python字符串替換實(shí)例分析

    Python字符串替換實(shí)例分析

    這篇文章主要介紹了Python字符串替換的方法,實(shí)例對比分析了單個字符替換與字符串替換的相關(guān)技巧,非常簡單實(shí)用,需要的朋友可以參考下
    2015-05-05
  • 對python中的argv和argc使用詳解

    對python中的argv和argc使用詳解

    今天小編就為大家分享一篇對python中的argv和argc使用詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-12-12

最新評論