資源簡介
強化深度學習迷宮問題
代碼片段和文件信息
import?tensorflow?as?tf
import?numpy?as?np
from?collections?import?deque
import?random
class?DeepQNetwork:
????r?=?np.array([[-1?-1?-1?-1?0?-1]
??????????????????[-1?-1?-1?0?-1?100.0]
??????????????????[-1?-1?-1?0?-1?-1]
??????????????????[-1?0?0?-1?0?-1]
??????????????????[0?-1?-1?1?-1?100]
??????????????????[-1?0?-1?-1?0?100]
??????????????????])
????#?執行步數。
????step_index?=?0
????#?狀態數。
????state_num?=?6
????#?動作數。
????action_num?=?6
????#?訓練之前觀察多少步。
????OBSERVE?=?1000.
????#?選取的小批量訓練樣本數。
????BATCH?=?20
????#?epsilon?的最小值,當?epsilon?小于該值時,將不在隨機選擇行為。
????FINAL_EPSILON?=?0.0001
????#?epsilon?的初始值,epsilon?逐漸減小。
????INITIAL_EPSILON?=?0.1
????#?epsilon?衰減的總步數。
????EXPLORE?=?3000000.
????#?探索模式計數。
????epsilon?=?0
????#?訓練步數統計。
????learn_step_counter?=?0
????#?學習率。
????learning_rate?=?0.001
????#?γ經驗折損率。
????gamma?=?0.9
????#?記憶上限。
????memory_size?=?5000
????#?當前記憶數。
????memory_counter
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件??????429107??2020-07-09?18:10??鍒嗗竷寮忚綆楁湡鏈綔涓?pptx
?????文件?????????277??2020-07-09?18:10??__MACOSX\._鍒嗗竷寮忚綆楁湡鏈綔涓?pptx
?????文件???????11257??2020-07-15?13:08??榪峰.py
?????文件?????????384??2020-07-15?13:08??__MACOSX\._榪峰.py
- 上一篇:DCASE2016基線,GMM做SED
- 下一篇:模式識別系統——自行車需求量預測
評論
共有 條評論