强化学习是机器学习的一个基本范示,其中智能体执行动作以确保设备的最优性能。虽然这种机器学习范式近年来取得了巨大的成功和普及,但以前的学术研究要么集中在理论上(最优控制和动态规划),要么集中在算法上,其中大多数是基于仿真的。
《基于模型的强化学习》提供了一个基于模型的框架来桥接这两个方面,从而创建了一个基于模型的在线学习控制主题的整体处理。在此过程中,作者寻求开发一个基于模型的数据驱动控制框架,该框架将数据系统识别、基于模型的强化学习和最优控制以及每个主题的应用连接起来。这种评估经典结果的新技术将会是更有效的强化学习系统。本书的核心是提供一个端到端的框架——从设计到应用——一种更易于处理的基于模型的强化学习技术。
展开