-
大小: 122.76MB文件類(lèi)型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2022-06-18
- 語(yǔ)言: 其他
- 標(biāo)簽: 強(qiáng)化學(xué)習(xí)??性能勢(shì)??隨機(jī)學(xué)習(xí)??
資源簡(jiǎn)介
隨機(jī)學(xué)習(xí)與優(yōu)化在現(xiàn)代工程、社會(huì)、金融問(wèn)題中具有廣泛的應(yīng)用。《隨機(jī)學(xué)習(xí)與優(yōu)化:基于靈敏度的方法》以一個(gè)統(tǒng)一的框架,涵蓋了離散事件動(dòng)態(tài)系統(tǒng)的攝動(dòng)分析、馬爾可大決策過(guò)程、強(qiáng)化學(xué)習(xí)、辨識(shí)和自適應(yīng)控制等學(xué)習(xí)和優(yōu)化的不同學(xué)科;并利用基于性能差分公式的簡(jiǎn)單方法介紹馬爾可夫決策過(guò)程理論,通過(guò)該方法能求得以長(zhǎng)期平均代價(jià)為準(zhǔn)則的n階偏差優(yōu)化策略以及無(wú)折扣的Blackwell優(yōu)化策略。《隨機(jī)學(xué)習(xí)與優(yōu)化:基于靈敏度的方法》還包含有最近發(fā)展出來(lái)的基于事件的優(yōu)化方法,它為利用系統(tǒng)的特性來(lái)克服或減輕數(shù)災(zāi)的研究開(kāi)辟了個(gè)新方向。《隨機(jī)學(xué)習(xí)與優(yōu)化:基于靈敏度的方法》強(qiáng)調(diào)以樣本路徑的構(gòu)造為基礎(chǔ)的物理解釋?zhuān)锢砩系闹庇^認(rèn)識(shí)可以為完善已有的優(yōu)化方法提供新思路。
為幫助讀者理解掌握書(shū)中的內(nèi)容,《隨機(jī)學(xué)習(xí)與優(yōu)化:基于靈敏度的方法》提供了大量的示例和豐富的習(xí)題。
《隨機(jī)學(xué)習(xí)與優(yōu)化:基于靈敏度的方法》適合作為相關(guān)專(zhuān)業(yè)的研究生教材,學(xué)生可從一門(mén)課程中學(xué)到原本屬于多個(gè)不同學(xué)科的內(nèi)容?!峨S機(jī)學(xué)習(xí)與優(yōu)化:基于靈敏度的方法》有助于促進(jìn)學(xué)習(xí)和優(yōu)化領(lǐng)域中各學(xué)科之間的合作,對(duì)該領(lǐng)域的研究人員也大有裨益。
代碼片段和文件信息
評(píng)論
共有 條評(píng)論