要想使用optimizer,需要?jiǎng)?chuàng)建一個(gè)optimizer 對(duì)象,這個(gè)對(duì)象會(huì)保存當(dāng)前狀態(tài),并根據(jù)梯度更新參數(shù)。 怎樣構(gòu)造Optimizer 要構(gòu)造一個(gè)Optimizer,需要使用一個(gè)用來(lái)包含所有參數(shù)(Tensor形式)的iterable,把相關(guān)參數(shù)(如learning rate、weight decay等)裝進(jìn)去。 注意,如果想要使用.cuda()方法來(lái)將model移到GPU中,一定要確保這一步在構(gòu)造...
www.dbjr.com.cn/article/2067...htm 2025-6-8