Reinforcement Learning and Optimal Control 強(qiáng)化學(xué)習(xí)與最優(yōu)控制帶書簽 Dimitri P. Bertsekas

大小: 3.39MB

文件類型: .pdf

金幣: 1

下載: 0 次

發(fā)布日期: 2023-08-10
語(yǔ)言: 其他
標(biāo)簽: 強(qiáng)化學(xué)習(xí)??最優(yōu)控制??

高速下載

資源簡(jiǎn)介

對(duì)于動(dòng)態(tài)系統(tǒng)的控制、決策、穩(wěn)定性分析是控制學(xué)科長(zhǎng)期以來(lái)的研究熱點(diǎn)，基于Bellman提出的動(dòng)態(tài)規(guī)劃方法，為解決當(dāng)狀態(tài)空間和動(dòng)作空間維數(shù)增加帶來(lái)的維數(shù)災(zāi)問(wèn)題，發(fā)展產(chǎn)生了自適應(yīng)動(dòng)態(tài)規(guī)劃(Adaptive dynamic programming, ADP)，這種方法也被稱為自適應(yīng)評(píng)價(jià)設(shè)計(jì)、啟發(fā)式動(dòng)態(tài)規(guī)劃、神經(jīng)元?jiǎng)討B(tài)規(guī)劃和增強(qiáng)學(xué)習(xí)（張化光，張欣，羅艷紅，等. 自適應(yīng)動(dòng)態(tài)規(guī)劃綜述[J]. 自動(dòng)化學(xué)報(bào), 2013, 39(4): 303-311.）。控制學(xué)科對(duì)強(qiáng)化學(xué)習(xí)的研究角度和計(jì)算機(jī)學(xué)科略有不同，這本書作者結(jié)合自己多年的研究教學(xué)經(jīng)驗(yàn)，為兩個(gè)學(xué)科的學(xué)者提供了更加系統(tǒng)的思路。感興趣的朋友可以下載看看，僅作交流分享，請(qǐng)勿用于其他用途。這是一本書的草稿，計(jì)劃在2019年內(nèi)定稿，由雅典娜科學(xué)公司出版。它表示“正在進(jìn)行的工作”。它很可能包含錯(cuò)誤（希望不是嚴(yán)重的錯(cuò)誤）。此外，它對(duì)文獻(xiàn)的引用是不完整的。歡迎您向作者提出意見和建議（dimitrib@mit.edu）。

xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

Reinforcement Learning and Optimal Control 強(qiáng)化學(xué)習(xí)與最優(yōu)控制帶書簽 Dimitri P. Bertsekas

資源簡(jiǎn)介

資源截圖

代碼片段和文件信息

評(píng)論

相關(guān)資源

xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

Reinforcement Learning and Optimal Control 強(qiáng)化學(xué)習(xí)與最優(yōu)控制 帶書簽 Dimitri P. Bertsekas

資源簡(jiǎn)介

資源截圖

代碼片段和文件信息

評(píng)論

相關(guān)資源

Reinforcement Learning and Optimal Control 強(qiáng)化學(xué)習(xí)與最優(yōu)控制帶書簽 Dimitri P. Bertsekas