第1章 绪论
1.1 人工智能和神经网络
1.2 评价学习
1.3 研究内容
参考文献
第2章 研究对象
2.1 双轮移动机器人
2.1.1 移动机器人的运动学描述
2.1.2 移动机器人的动力学描述
2.2 机械手
2.2.1 机械手的运动学描述
2.2.2 机械手的动力学描述
参考文献
第3章 机电系统的智能控制
3.1 非线性系统的控制方法
3.2 神经网络控制
3.2.1 随机向量函数链神经网络
3.2.2 具有高斯型激活函数的神经网络
参考文献
第4章 机电系统的最优控制方法
4.1 Bellman动态规划
4.2 线性二次型调节器
4.3 Pontryagin最大值原理
4.4 本章小结
参考文献
第5章 智能系统的学习方法
5.1 监督学习
5.1.1 最速下降算法
5.1.2 交尺度算法
5.1.3 Levenberg-Marquardt算法
5.1.4 共视彬度法
5.2 评价学习
5.2.1 Q学习算法
5.3 无导师学习
5.3.1 胜者通吃网络
5.3.2 胜者多吃网络
参考文献
第6章 自适应动态规划——离散形式
6.1 神经动态规划
6.2 基于模型的学习方法
6.2.1 启发式动态规划
6.2.2 双启发式动态规划
6.2.3 全局双启发式动态规划
6.3 无模型学习方法
6.3.1 动作依赖启发式动态规划
参考文献
第7章 机电系统的控制
7.1 应用PD控制器的WMR和RM跟踪控制
7.1.1 PD控制的综合
7.1.2 仿真测试
7.1.3 结论
7.2 WMR的自适应跟踪控制
7.2.1 自适应控制算法的综合
7.2.2 仿真测试
7.2.3 结论
7.3 WMR的神经网络跟踪控制
7.3.1 神经网络控制算法的综合
7.3.2 仿真测试
7.3.3 结论
7.4 WMR跟踪控制中的启发式动态规划
7.4.1 HDP型控制的综合
7.4.2 仿真测试
7.4.3 结论
7.5 WMR和RM跟踪控制中的双启发动态规划
7.5.1 DHP型控制的综合
7.5.2 仿真测试
7.5.3 结论
7.6 WMR和RM跟踪控制中的全局双启发动态规划
7.6.1 GDHP型控制的综合
7.6.2 仿真测试
7.6.3 结论
7.7 动作依赖启发式动态规划在WMR跟踪控制中的应用
7.7.1 ADHDP型控制的综合
7.7.2 仿真测试
7.7.3 结论
7.8 WMR运动的行为控制
7.8.1 行为控制综合
7.8.2 仿真测试
7.8.3 结论
7.9 本章总结
7.9.1 未来奖励折扣系数Y的选取
参考文献
第8章 强化学习在非线性连续系统控制中的应用
8.1 经典强化学习
8.1.1 控制综合,系统稳定性和强化学习算法
8.1.2 仿真测试
8.1.3 结论
8.2 经典强化学习的近似
8.2.1 控制系统综合,系统稳定性和强化学习算法
8.2.2 仿真测试
8.2.3 结论
8.3 动作器-评价器结构的强化学习
8.3.1 控制系统综合,系统稳定性和强化学习算法
8.3.2 仿真测试
8.3.3 结论
8.4 最优自适应控制中的动作器-评价器型强化学习
8.4.1 控制综合,系统稳定性和强化学习算法
8.4.2 仿真测试
8.4.3 结论
8.5 最优控制中评价器自适应结构的实施
8.5.1 控制综合,评价学习算法和系统稳定性
8.5.2 仿真测试
8.5.3 结论
参考文献
第9章 双人零和微分博弈和H∞控制
9.1 H∞控制
9.2 双人零和微分博弈
9.3 双人零和微分博弈在WMR驱动单元控制中的应用
9.3.1 仿真测试
9.3.2 结论
9.4 WMR控制中将神经网络用于双人零和微分博弈
9.4.1 仿真测试
9.4.2 结论
参考文献
第10章 控制算法的实验验证
10.1 实验室测试台描述
10.1.1 WMR运动控制台
10.1.2 RM运动控制实验台
10.2 PD控制分析
10.2.1 WMR运动控制分析
10.2.2 RM运动控制分析
10.2.3 结论
10.3 自适应控制分析
10.3.1 WMR运动控制分析
10.3.2 结论
10.4 神经网络控制分析
10.4.1 WMR运动控制分析
10.4.2 结论
10.5 HDP控制分析
10.5.1 WMR运动控制分析
10.5.2 结论
10.6 DHP控制分析
10.6.1 WMR运动控制分析
10.6.2 RM运动控制分析
10.6.3 结论
10.7 GDHP控制分析
10.7.1 WMR运动控制分析
10.7.2 结论
10.8 ADHDP控制分析
10.8.1 WMR运动控制分析
10.8.2 结论
10.9 行为控制分析
10.9.1 WMR运动控制分析
10.9.2 结论
10.10 本章小结
参考文献
第11章 结论
展开