資源簡介
(不是掃描版,很清晰的pdf)馬爾可夫決策過程是研究隨機環境下多階段決策過程優化問題的理論工具.在過去的幾十年
中, 隨著生態科學、經濟理論、通訊工程以及眾多學科中需要考慮不確定因素和序列決策問題
的大量新模型的涌現, 進一步刺激了馬爾可夫決策過程在理論上和應用領域中長足的發展.
本書從簡單的例子開始, 介紹了馬爾可夫決策過程的基本概念、決策過程以及一些常用
的基本理論.還介紹了多種最優準則, 包括有限階段準則、折扣準則、平均準則、權重報酬準
則、概率準則等.從模型角度考慮了有限狀態空間、可數狀態空間和一般Borel 狀態空間; 從
決策時間上來說, 考慮了離散時間、連續時間和半馬氏決策時刻問題.本文還介紹了大量的應
用實例以及建模方法.本書可作為高年級大學生和研究生教材, 也可作為運籌學、管理科學、
信息科學、系統科學以及計算機科學和工程領域的學者和技術人員的參考書.
代碼片段和文件信息
評論
共有 條評論