搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Python深度强化学习(基于Chainer和OpenAI Gym)/轻松上手IT技术日文译丛
0.00     定价 ¥ 79.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787111692584
  • 作      者:
    作者:(日)牧野浩二//西崎博光|责编:赵亮宇//李美莹|译者:申富饶//于僡
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2021-11-01
收藏
内容介绍
近年来,机器学习受到了人们的广泛关注。本书面向普通大众,指导读者在Python(基于Chainer和OpenAI Gym)中实践深度强化学习。读者只需要具备一些基本的编程经验即可读懂书中内容,通过实现具体程序来掌握深度强化学习的相关知识。 本书内容: 介绍深度学习、强化学习和深度强化学习的基本知识。 通过多种实际对战游戏(如太空侵略者、吃豆人)来介绍算法,如ε-greedy算法。 使用Anaconda设置本地PC,在倒立摆和老鼠学习问题中实现深度强化学习。 使用Python实现MNIST手写数字分类任务。 实现深度强化学习的基本算法DQN。 详解继DQN之后提出的新的深度强化学习技术(DDQN、PER-DQN、DDPG和A3C等)。
展开
目录

译者序<br >前言<br >第1章 引言  1<br >11 深度强化学习可以做什么  1<br >12 本书的结构  4<br >13 框架:Chainer和ChainerRL  6<br >14 Python的运行检查  6<br >15 Chainer的安装  9<br >16 ChainerRL的安装  12<br >17 模拟器:OpenAI Gym  14<br >第2章 深度学习  17<br >21 什么是深度学习  17<br >22 神经网络  18<br >23 基于Chainer的神经网络  21<br >231 Chainer与神经网络的对应  24<br >232 Chainer程序  25<br >233 参数设置  26<br >234 创建数据  27<br >235 定义神经网络  27<br >236 各种声明  28<br >237 显示训练状态  28<br >238 保存训练状态  31<br >239 执行训练  32<br >24 与其他神经网络的对应  32<br >241 感知器  32<br >242 5层神经网络(深度学习)  33<br >243 计算输入中的1的数量  34<br >25 基于深度神经网络的手写数字识别  35<br >251 手写数字的输入格式  36<br >252 深度神经网络的结构  39<br >253 8×8的手写数字数据  41<br >26 基于卷积神经网络的手写数字识别  43<br >261 卷积  45<br >262 激活函数  49<br >263 池化  49<br >264 执行  50<br >27 一些技巧  53<br >271 读取文件数据  54<br >272 使用训练模型  55<br >273 重启训练  56<br >274 检查权重  56<br >275 从文件中读取手写数字  57<br >第3章 强化学习  59<br >31 什么是强化学习  59<br >311 有监督学习  60<br >312 无监督学习  60<br >313 半监督学习  60<br >32 强化学习原理  61<br >33 通过简单的示例来学习  61<br >34 应用到Q学习问题中  63<br >341 状态  63<br >342 行动  63<br >343 奖励  63<br >344 Q值  64<br >35 使用Python进行训练  67<br >351 运行程序  67<br >352 说明程序  69<br >36 基于OpenAI Gym的倒立摆  73<br >361 运行程序  73<br >362 说明程序  74<br >37 如何保存和加载Q值  79<br >第4章 深度强化学习  81<br >41 什么是深度强化学习  81<br >42 对于老鼠学习问题的应用  83<br >421 运行程序  83<br >422 说明程序  85<br >423 如何保存和读取智能体模型  91<br >43 基于OpenAI Gym的倒立摆  91<br >431 运行程序  91<br >432 说明程序  92<br >44 基于OpenAI Gym的太空侵略者  97<br >45 基于OpenAI Gym的颠球  99<br >451 运行程序  101<br >452 说明程序  102<br >46 对战游戏  109<br >461 黑白棋  109<br >462 训练方法  111<br >463 变更盘面  121<br >464 黑白棋实体  121<br >465 如何与人类对战  123<br >466 卷积神经网络的应用  127<br >47 使用物理引擎进行模拟  128<br >471 物理引擎  129<br >472 运行程序  130<br >473 说明程序  131<br >48 物理引擎在颠球问题中的应用  132<br >49 物理引擎在倒立摆问题中的应用  140<br >410 物理引擎在机械臂问题中的应用  144<br >411 使用其他深度强化学习方法  151<br >4111 深度强化学习的类型  151<br >4112 将训练方法更改为DDQN  153<br >4113 将训练方法更改为PER-DQN  153<br >4114 将训练方法更改为DDPG  153<br >4115 将训练方法更改为A3C  155<br >第5章 实际环境中的应用  157<br >51 使用摄像机观察环境(MNIST)  157<br >511 摄像机设置  158<br >512 通过卷积神经网络对摄像机图像进行分类  160<br >513 使用图像大小为28×28的手写数字进行训练  163<br >52 实际环境中的老鼠学习问题  164<br >53 使用Raspberry Pi处理老鼠学习问题  168<br >531 环境构建  169<br >532 以输入输出为重点的简化  169<br >533 使用摄像机测量环境  176<br >54 使用Arduino + PC处理老鼠学习问题  181<br >541 环境构建  182<br >542 以输入输出为重点的简化  185<br >543 使用摄像机测量环境  193<br >55 使用Raspberry Pi + Arduino处理老鼠学习问题  197<br >56 结语  201<br >附录  202

展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证