邊做邊學深度強化學習:PyTorch 程序設計實踐
[日]小川雄太郎(Yutaro ogawa)著
- 出版商: 機械工業
- 出版日期: 2020-04-01
- 定價: $414
- 售價: 7.5 折 $311
- 語言: 簡體中文
- 頁數: 215
- ISBN: 711165014X
- ISBN-13: 9787111650140
-
相關分類:
DeepLearning、Reinforcement、化學 Chemistry
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$474$450 -
$352Python 強化學習實戰 : 應用 OpenAI Gym 和 TensorFlow 精通強化學習和深度強化學習
-
$520$411 -
$500$395 -
$505白話強化學習與 PyTorch
-
$690$345 -
$352強化學習
-
$534$507 -
$594$564 -
$505強化學習
-
$230TensorFlow 強化學習快速入門指南使用 Python 動手搭建自學習的智能體 (Tensorflow Reinforcement Learning Quick Start Guide)
-
$505$475 -
$750$593 -
$658MicroPython 從入門到精通
-
$474$450 -
$658Python 文本分析, 2/e (Text Analytics with Python: A Practitioner's Guide to Natural Language Processing, 2/e)
-
$780$616 -
$1,000$790 -
$305Python Web 項目開發實戰教程 (Flask版)(微課版)
-
$305深度強化學習
-
$352TensorFlow 知識圖譜實戰
-
$505基於混合方法的自然語言處理:神經網絡模型與知識圖譜的結合
-
$600$450 -
$602因果推斷與機器學習
-
$654多面體編譯理論與深度學習實踐
商品描述
PyTorch是基於Python的張量和動態神經網絡,作為近年來較為火爆的深度學習框架,它使用強大的GPU能力,提供極高的靈活性和速度。
本書面向普通大眾,指導讀者以PyTorch為工具,在Python中實踐深度強化學習。讀者只需要具備一些基本的編程經驗和基本的線性代數知識即可讀懂書中內容,通過實現具體程序來掌握深度強化學習的相關知識。
本書內容:
介紹監督學習、非監督學習和強化學習的基本知識。
通過走迷宮任務介紹三種不同的算法(策略梯度法、Sarsa和Q學習)。
使用Anaconda設置本地PC,在倒立擺任務中實現強化學習。
使用PyTorch實現MNIST手寫數字分類任務。
實現深度強化學習的最基本算法DQN。
解釋繼DQN之後提出的新的深度強化學習技術(DDQN、Dueling Network、優先經驗回放和A2C等)。
使用GPU與AWS構建深度學習環境,採用A2C再現消磚塊游戲。
作者簡介
小川雄太郎,東京大學博士,曾在東京大學從事腦機能測量及計算論的神經科學研究。現就職於株式會社電通國際信息服務技術開發部,從事機器學習相關技術的研究開發。
目錄大綱
譯者序
前言
第1章 強化學習概述
1.1 機器學習的分類(監督學習、非監督學習、強化學習)
1.2 強化學習、深度強化學習的歷史
1.3 深度強化學習的應用實例
參考文獻
第2章 在走迷宮任務中實現強化學習
2.1 Try Jupyter的使用方法
2.2 迷宮和智能體的實現
2.3 策略疊代法的實現
2.4 價值疊代法的術語整理
2.5 Sarsa的實現
2.6 實現Q學習
參考文獻
第3章 在倒立擺任務中實現強化學習
3.1 在本地PC上準備強化學習的實現和執行環境
3.2 倒立擺任務“CartPole”
3.3 由多變量連續值表示的狀態的表格表示
3.4 Q學習的實現
參考文獻
第4章 使用PyTorch實現深度學習
4.1 神經網絡和深度學習的歷史
4.2 深度學習的計算方法
4.3 使用PyTorch實現MNIST手寫數字分類任務
參考文獻
第5章 深度強化學習DQN的實現
5.1 深度強化學習DQN(深度Q網絡)的說明
5.2 實現DQN的四個要點
5.3 實現DQN(上)
5.4 實現DQN(下)
參考文獻
第6章 實現深度強化學習的改進版
6.1 深度強化學習算法發展圖
6.2 DDQN的實現
6.3 Dueling Network的實現
6.4 優先經驗回放的實現
6.5 A2C的實現
參考文獻
第7章 在AWS GPU環境中實現消磚塊遊戲
7.1 消磚塊遊戲“Breakout”的描述
7.2 準備在AWS上使用GPU所需要的深度學習執行環境
7.3 學習Breakout的四個關鍵思想
7.4 A2C的實現(上)
7.5 A2C的實現(下)
參考文獻
後記