關(guān)于我們
書單推薦
新書推薦

揭秘深度強(qiáng)化學(xué)習(xí) 機(jī)器學(xué)習(xí)深度學(xué)習(xí)人工智能叢書 AlphaGo核心算法揭秘

揭秘深度強(qiáng)化學(xué)習(xí) 機(jī)器學(xué)習(xí)深度學(xué)習(xí)人工智能叢書 AlphaGo核心算法揭秘

定  價(jià):89.8 元

        

  • 作者:彭偉
  • 出版時(shí)間:2018/5/1
  • ISBN:9787517062387
  • 出 版 社:中國水利水電出版社
  • 中圖法分類:TP181 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
0
8
6
7
2
5
3
1
8
7
7

深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)是深度學(xué)習(xí)算法和強(qiáng)化學(xué)習(xí)算法的巧妙結(jié)合,它是一種新興的通用人工智能算法技術(shù),也是機(jī)器學(xué)習(xí)的前沿技術(shù),DRL 算法潛力無限,AlphaGo 是目前該算法*成功的使用案例。DRL 算法以馬爾科夫決策過程為基礎(chǔ),是在深度學(xué)習(xí)強(qiáng)大的非線性函數(shù)的擬合能力下構(gòu)成的一種增強(qiáng)算法。深度強(qiáng)化學(xué)習(xí)算法主要包括基于動態(tài)規(guī)劃(DP)的算法以及基于策略優(yōu)化的算法,本書的目的就是要把這兩種主要的算法(及設(shè)計(jì)技巧)講解清楚,使算法研究人員能夠熟練地掌握。

《揭秘深度強(qiáng)化學(xué)習(xí)人工智能機(jī)器學(xué)習(xí)技術(shù)叢書》共10 章,首先以AlphaGo 在圍棋大戰(zhàn)的偉大事跡開始,引起對人工智能發(fā)展和現(xiàn)狀的介紹,進(jìn)而介紹深度強(qiáng)化學(xué)習(xí)的基本知識。然后分別介紹了強(qiáng)化學(xué)習(xí)(重點(diǎn)介紹蒙特卡洛算法和時(shí)序差分算法)和深度學(xué)習(xí)的基礎(chǔ)知識、功能神經(jīng)網(wǎng)絡(luò)層、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),以及深度強(qiáng)化學(xué)習(xí)的理論基礎(chǔ)和當(dāng)前主流的算法框架。*后介紹了深度強(qiáng)化學(xué)習(xí)在不同領(lǐng)域的幾個應(yīng)用實(shí)例。引例、基礎(chǔ)知識和實(shí)例相結(jié)合,方便讀者理解和學(xué)習(xí)。

《揭秘深度強(qiáng)化學(xué)習(xí) 人工智能機(jī)器學(xué)習(xí)技術(shù)叢書》內(nèi)容豐富,講解全面、語言描述通俗易懂,是深度強(qiáng)化學(xué)習(xí)算法入門的*選擇。本書適合計(jì)算機(jī)專業(yè)本科相關(guān)學(xué)生、人工智能領(lǐng)域的研究人員以及所有對機(jī)器學(xué)習(xí)和人工智能算法感興趣的人員。

 你還可能感興趣
 我要評論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容