-
大小: 2.73MB文件類型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2023-09-09
- 語(yǔ)言: 其他
- 標(biāo)簽: 深度學(xué)習(xí)??強(qiáng)化學(xué)習(xí)??
資源簡(jiǎn)介
深度強(qiáng)化學(xué)習(xí)是人工智能領(lǐng)域的一個(gè)新的研究熱點(diǎn).它以一種通用的形式將深度學(xué)習(xí)的感知能力與強(qiáng)化學(xué)習(xí)的決策能力相結(jié)合,并能夠通過(guò)端對(duì)端的學(xué)習(xí)方式實(shí)現(xiàn)從原始輸入到輸出的直接控制.自提出以來(lái),在許多需要感知高維度原始輸入數(shù)據(jù)和決策控制的任務(wù)中,深度強(qiáng)化學(xué)習(xí)方法已經(jīng)取得了實(shí)質(zhì)性的突破.該文首先闡述了三類主要的深度強(qiáng)化學(xué)習(xí)方法,包括基于值函數(shù)的深度強(qiáng)化學(xué)習(xí)、基于策略梯度的深度強(qiáng)化學(xué)習(xí)和基于搜索與監(jiān)督的深度強(qiáng)化學(xué)習(xí);其次對(duì)深度強(qiáng)化學(xué)習(xí)領(lǐng)域的一些前沿研究方向進(jìn)行了綜述,包括分層深度強(qiáng)化學(xué)習(xí)、多任務(wù)遷移深度強(qiáng)化學(xué)習(xí)、多智能體深度強(qiáng)化學(xué)習(xí)、基于記憶與推理的深度強(qiáng)化學(xué)習(xí)等.最后總結(jié)了深度強(qiáng)化學(xué)習(xí)在若干領(lǐng)域的成功應(yīng)用和未來(lái)發(fā)展趨勢(shì).
代碼片段和文件信息
評(píng)論
共有 條評(píng)論