DQN(Deep Q-Network)是一種基于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的算法,由DeepMind提出,用于解決離散動(dòng)作空間下的馬爾科夫決策過程(MDP)問題。它是首個(gè)成功將深度學(xué)習(xí)應(yīng)用于解決強(qiáng)化學(xué)習(xí)任務(wù)的算法之一。DQN,即深度Q網(wǎng)絡(luò)(Deep Q-network),是指基于深度學(xué)習(xí)的Q-Learing算法。 一、強(qiáng)化學(xué)習(xí)基礎(chǔ) 強(qiáng)化學(xué)習(xí)(Reinforcement Learning)是機(jī)器...
www.dbjr.com.cn/python/339025f...htm 2025-5-28