資源簡介
對于動態(tài)系統(tǒng)的控制、決策、穩(wěn)定性分析是控制學科長期以來的研究熱點,基于Bellman提出的動態(tài)規(guī)劃方法,為解決當狀態(tài)空間和動作空間維數(shù)增加帶來的維數(shù)災問題,發(fā)展產生了自適應動態(tài)規(guī)劃(Adaptive dynamic programming, ADP),這種方法也被稱為自適應評價設計、啟發(fā)式動態(tài)規(guī)劃、 神經元動態(tài)規(guī)劃和增強學習(張化光,張欣,羅艷紅,等. 自適應動態(tài)規(guī)劃綜述[J]. 自動化學報, 2013, 39(4): 303-311.)。
控制學科對強化學習的研究角度和計算機學科略有不同,這本書作者結合自己多年的研究教學經驗,為兩個學科的學者提供了更加系統(tǒng)的思路。感興趣的朋友可以下載看看,僅作交流分享,請勿用于其他用途。
這是一本書的草稿,計劃在2019年內定稿,由雅典娜科學公司出版。它表示“正在進行的工作”。它很可能包含錯誤(希望不是嚴重的錯誤)。此外,它對文獻的引用是不完整的。歡迎您 向作者提出意見和建議(dimitrib@mit.edu)。
代碼片段和文件信息
評論
共有 條評論