本书读者对象:大中专院校计算机、人工智能相关专业学生,对机器学习、强化学习算法感兴趣的程序员。
● 本书从初高中学生都熟悉的“平均值计算”的角度出发,简单易懂地解释复杂的强化学习原理。
● 使用常见的例子(多臂老虎机问题和网格世界问题)对各种算法进行比较,使它们的特点更易理解。
● 对于强化学习的核心算法,提供了Python 3和MATLAB两种类型的代码。执行代码,可直观理解“原理 → 公式 → 程序”这一系列流程。
[日] 曾我部东马
理学博士(物理学专业)。曾任马克斯·普朗克研究所(德国)博士研究员、剑桥大学(英国)研究员。2009年回到日本,参与创立了Grid公司,担任董事兼首席技术官。2011年起先后担任东京大学尖端科学技术研究中心特聘助理教授、特聘副教授。2016年3月起任电气通信大学副教授,同时兼任Grid公司首席技术顾问、东京大学尖端科学技术研究中心客座研究员至今。
他以开发具有“深度学习—深度强化学习—回归预测—优化”功能的跨功能机器学习框架∞ReNom而闻名,目前在开发以量子机器学习为代表的最先进量子算法∞ReNomQ的同时,还致力于使用深度强化学习的“在线优化问题”的研究。
请选择您读者所在的图书馆