(3)遗传算法
遗传算法最早是由美国Michigan大学的J.Holland博士提出的。遗传算法规划法在使用时,首先设计一个带有反馈补偿的前馈控制系统,根据这个特定的控制系统实现各个关节的力矩控制。因为实现遗传算法需要把所求的问题参数化求解,所以只能先假设某个关节的运动曲线,再用多次函数插值实现问题的参数化,最后利用遗传算法,根据稳定性条件或其他寻优条件确定问题的各个参数,达到步态规划的目的。遗传算法直接用于步态规划是有相当困难的。第一,对于某个关节的运动规律曲线事先完全无法知道。第二,运动规律往往不是一个初等函数,即使用了函数的插值,最后求得了问题的解,也只是解的一个近似,求解结果未必可用。第三,就算前面两种困难都可以忽略或者克服,在实际的步态规划中,还是有最大的一个问题——计算的复杂性。在目前需要步态规划的机器人在行走中共有14个需要控制的自由度,以每个关节的运动规律都是最简单的二次曲线计,至少需要84条基因(14x6)的遗传算法才能完成步态的规划,计算量非常大。所以遗传算法并不适于直接用于步态规划,而常常用来做步态规划的后处理——步态优化。
(4)强化学习
强化学习的特点是试错法和延时奖励,它的这个特点使其非常适合步态学习,也符合人类学习行走的过程。Salatian等人利用传感器输入使用强化学习方式对双足机器人的斜坡步行进行控制。由于仿人机器人的多自由度的特点,完全应用强化学习进行步态生成将会非常耗时,因此,强化学习基本上被用来进行局部参数的调整。例如,Toddler应用强制学习获得控制器参数,而Hamid应用强化学习调整CMAC生成的步态。
(5)软计算
由于机器人具有较多的复杂自由度,以上的方法大多不适合于实时的计算。为了能够实时控制机器人的运动,有必要开发一种适应性的步态规划系统。基于神经网络,模糊逻辑和遗传算法等不同组合所形成的软计算控制方式被证明是可以为复杂不确定、不精确的现实世界问题进行计算的。软计算的优点在于算法可以适应系统的参数,因此通过软计算可以进行不同地面的机器人行走控制尝试。Shouwen Fan等人提出了一种利用FNN模糊神经网络进行机器人步行训练的方法,其中,约束依靠ZMP和重心,代价函数由能量消耗最低为依据(由平均功率、功率方差、平均力矩消耗三部分组成)。利用B样条曲线对离散重心位置和身体姿态数据进行光滑处理,建立了前向和逆向的位移模型,利用该模型,可以把重心轨迹和理想的身体姿态映射到关节空间轨迹上来,并通过Matlab进行了实验。Pandu等人解决了双足机器人上升和下降时动态平衡的步态生成问题。在以上的研究中,下身腿部的运动利用逆动力学的概念和具有静态平衡的躯干生成。当确定完ZMP位置之后,整个步态生成通过动态平筏进行验证。同时,他们利用软计算也开发了一个合适的规划器用来进行动态平衡的上升和下降过程中的步态生成。
……
展开