欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pytorch損失反向傳播后梯度為none的問題

 更新時(shí)間:2021年05月12日 17:03:03   作者:lczygogogo  
這篇文章主要介紹了pytorch 出現(xiàn)損失反向傳播后梯度為none的問題,具有很好的參考價(jià)值,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教

錯(cuò)誤代碼:輸出grad為none

a = torch.ones((2, 2), requires_grad=True).to(device)
b = a.sum()
b.backward()
print(a.grad)

由于.to(device)是一次操作,此時(shí)的a已經(jīng)不是葉子節(jié)點(diǎn)了

修改后的代碼為:

a = torch.ones((2, 2), requires_grad=True)
c = a.to(device)

b = c.sum()
b.backward()
print(a.grad)

類似錯(cuò)誤:

self.miu = torch.nn.Parameter(torch.ones(self.dimensional)) * 0.01

應(yīng)該為

self.miu = torch.nn.Parameter(torch.ones(self.dimensional) * 0.01)

補(bǔ)充:pytorch梯度返回none的bug

pytorch1.4.0如果使用了view方法,reshape方法

tensor即使設(shè)置了requires_grad,反向傳播之后, x返回沒有g(shù)rad梯度,為none

不知道其他版本有無此bug

補(bǔ)充:PyTorch中梯度反向傳播的注意點(diǎn)

在一個(gè)迭代循環(huán)中

optimizer.zero_grad()語句的位置比較隨意,只要放在loss.backward()前面即可,它的作用是將梯度歸零,否則會在每一個(gè)迭代中進(jìn)行累加,

loss.backward()的作用是反向傳播,計(jì)算梯度,optimizer.step()的功能是優(yōu)化器自動完成參數(shù)的更新。

optimizer.zero_grad()
loss.backward()
optimizer.step()

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

最新評論