聯(lián)合隨機性策略的深度強化學習探索方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大小:679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經(jīng)可以解決許多復雜的任務(wù),然而如何平衡探索和利用的關(guān)系仍然是強化學習領(lǐng)域的一個基本的難題,為此提出一種聯(lián)合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經(jīng)驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優(yōu)勢的前提下學會探索。通過結(jié)合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環(huán)境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優(yōu)于DDPG算法。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 日韩毛片大全免费高清 | 中文字幕一区二区三区精品 | 欧美一区二区在线观看免费网站 | 日韩亚洲欧美在线 | 久久九九免费视频 | 在线一区二区三区 | 怡红院在线观看 | 欧美精品a毛片免费观看 | 国产午夜亚洲精品理论片不卡 | 成年人在线免费观看网站 | 手机在线看片国产日韩生活片 | 一区二区三区不卡在线观看 | 成人精品视频一区二区在线 | 黄页美女 | 国产精品国产亚洲精品不卡 | 鲁丝一区二区三区不属 | 性欧美精品久久久久久久 | 日韩国产欧美一区二区三区 | 国产成人欧美一区二区三区的 | 亚洲天天看 | 亚洲精品午夜国产va久久成人 | 色拍自拍亚洲综合在线 | 伊人色在线视频 | 91精品专区 | 欧美高清正版在线 | 国产美女又黄又爽又色视频免费 | 亚洲精品久久一区二区无卡 | 午夜爽爽性刺激一区二区视频 | 日本一级高清片免费 | 中文字幕在线观看网址 | 在线观看不卡一区 | 91精品久久久久含羞草 | 激情五月色播五月 | 亚洲日本久久一区二区va | 国产亚洲欧美成人久久片 | 一区不卡在线观看 | 暖暖在线精品日本中文 | 九九全国免费视频 | 99视频有精品视频免费观看 | 亚洲精品不卡久久久久久 | 深夜福利视频大全在线观看 |