資源簡介
深度逆向強化學習是機器學習領(lǐng)域的一個新的研究熱點,它針對深度強化學習的回報函數(shù)難以獲取問題,提出了通過專家示例軌跡重構(gòu)回報函數(shù)的方法。首先介紹了3類深度強化學習方法的經(jīng)典算法;接著闡述了經(jīng)典的逆向強化學習算法,包括基于學徒學習、最大邊際規(guī)劃、結(jié)構(gòu)化分類和概率模型形式化的方法;然后對深度逆向強化學習的一些前沿方向進行了綜述,包括基于最大邊際法的深度逆向強化學習、基于深度Q網(wǎng)絡(luò)的深度逆向強化學習和基于最大熵模型的深度逆向強化學習和示例軌跡非專家情況下的逆向強化學習方法等。最后總結(jié)了深度逆向強化學習在算法、理論和應用方面存在的問題和發(fā)展方向。
代碼片段和文件信息
評論
共有 條評論