關(guān)于我們
書單推薦
新書推薦

強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)

定  價(jià):129 元

叢書名:智能系統(tǒng)與技術(shù)叢書

        

  • 作者:肖智清著
  • 出版時(shí)間:2023/6/1
  • ISBN:9787111728917
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類:TP311.561 
  • 頁(yè)碼:490
  • 紙張:
  • 版次:1
  • 開(kāi)本:24cm
9
7
7
8
2
7
8
1
9
1
1
1
7

讀者對(duì)象:本書適用于AI與大數(shù)據(jù)算法工程師、愛(ài)好者

本書介紹強(qiáng)化學(xué)習(xí)理論及其Python實(shí)現(xiàn)。第1章: 從零開(kāi)始介紹強(qiáng)化學(xué)習(xí)的背景知識(shí), 介紹環(huán)境庫(kù)Gym的使用。第2-15章: 基于折扣獎(jiǎng)勵(lì)離散時(shí)間Markov決策過(guò)程模型, 介紹強(qiáng)化學(xué)習(xí)的主干理論和常見(jiàn)算法。采用數(shù)學(xué)語(yǔ)言推導(dǎo)強(qiáng)化學(xué)習(xí)的基礎(chǔ)理論, 進(jìn)而在理論的基礎(chǔ)上講解算法。Python實(shí)現(xiàn)和算法講解一一對(duì)應(yīng), 針對(duì)深度強(qiáng)化學(xué)習(xí)算法還給出了基于TensorFlow 2和PyTorch 1的對(duì)照實(shí)現(xiàn)。第16章: 介紹其他強(qiáng)化學(xué)習(xí)模型, 包括平均獎(jiǎng)勵(lì)模型、連續(xù)時(shí)間模型、非齊次模型, 半Markov模型、部分可觀測(cè)模型等, 以便更好了解強(qiáng)化學(xué)習(xí)研究的全貌。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容