信阅平台

编辑推荐

本书读者对象：大中专院校计算机、人工智能相关专业学生，对机器学习、强化学习算法感兴趣的程序员。

● 本书从初高中学生都熟悉的“平均值计算”的角度出发，简单易懂地解释复杂的强化学习原理。

● 使用常见的例子（多臂老虎机问题和网格世界问题）对各种算法进行比较，使它们的特点更易理解。

● 对于强化学习的核心算法，提供了Python 3和MATLAB两种类型的代码。执行代码，可直观理解“原理 → 公式 → 程序”这一系列流程。

展开

作者简介

[日] 曾我部东马

理学博士(物理学专业)。曾任马克斯·普朗克研究所（德国）博士研究员、剑桥大学（英国）研究员。2009年回到日本，参与创立了Grid公司，担任董事兼首席技术官。2011年起先后担任东京大学尖端科学技术研究中心特聘助理教授、特聘副教授。2016年3月起任电气通信大学副教授，同时兼任Grid公司首席技术顾问、东京大学尖端科学技术研究中心客座研究员至今。

他以开发具有“深度学习—深度强化学习—回归预测—优化”功能的跨功能机器学习框架∞ReNom而闻名，目前在开发以量子机器学习为代表的最先进量子算法∞ReNomQ的同时，还致力于使用深度强化学习的“在线优化问题”的研究。