在定義 saver 的時(shí)候一般會定義最多保存模型的數(shù)量,一般來說,如果模型本身很大,我們需要考慮到硬盤大小。如果你需要在當(dāng)前訓(xùn)練好的模型的基礎(chǔ)上進(jìn)行 fine-tune,那么盡可能多的保存模型,后繼 fine-tune 不一定從最好的 ckpt 進(jìn)行,因?yàn)橛锌赡芤幌伦泳瓦^擬合了。但是如果保存太多,硬盤也有壓力呀。如果只想保留最好的...
www.dbjr.com.cn/article/1388...htm 2025-5-22