第1章 引言
许多实际工程系统本质上是高度非线性系统,如机器人、高速列车和飞行器等,因此,近年来,非线性系统控制问题受到极大关注,并有大量研究成果[1-10]。本章将围绕自动控制理论进展、非线性模型、非线性现象、典型非线性系统举例以及非线性系统常见形式等几方面展开。
1.1 自动控制理论进展
自动控制理论经历了三个发展阶段:经典控制理论、现代控制理论和智能控制理论。其从属性上分为线性系统理论和非线性系统理论,下面将对这两大类理论做简要介绍。
1.1.1 线性系统理论
线性系统理论的发展经历了经典控制理论和现代控制理论两个阶段。
经典控制理论是在1932年美国物理学家奈奎斯特(H. Nyquist)提出的频率响应法和1948年美国学者伊文思(W. R. Evans)提出的根轨迹法基础上发展起来的一套理论,其主要研究对象是单输入单输出线性时不变系统,以传递函数作为系统数学模型,以时域分析法、根轨迹法和频域分析法作为分析设计的主要工具[11]。经典控制理论在第二次世界大战中获得了巨大应用,为工程技术人员提供了一种有效的反馈控制方法,满足了设计者对控制系统准确跟踪与补偿能力的需求。
虽然经典控制理论的发展已经很成熟,且形成了相对完整的体系,但仍存在诸多缺陷和局限性。其一,经典控制理论主要研究线性时不变系统,难以处理更具一般性的非线性时变系统;其二,经典控制理论的应用仅限于单输入单输出系统,只能揭示系统输入-输出的外部特性,对于大多数具有动态耦合的多输入多输出系统而言,经典控制方法难以揭示其系统内部结构特征;其三,当系统存在非线性及不确定性因素时,经典控制理论采用“试凑法”设计系统控制器,主要依赖于设计人员的先前经验,无法从理论上给出*佳的设计方案[11]。在20世纪50年代蓬勃兴起的航天技术及计算机技术的推动下,现代控制理论应运而生,其中一个重要标志是美国学者卡尔曼(R. E. Kalman)系统性地将状态空间概念引入控制领域。
现代控制理论的本质是基于状态空间模型在时域中对系统进行设计和分析。状态空间模型不仅可以反映系统的输入-输出外部特性,而且可以揭示系统的内部结构特性,因此,基于状态空间模型的现代控制理论是一种既适用于单输入单输出系统又适用于多输入多输出系统、既可用于线性定常系统又可用于线性时变系统的有效分析方法。
线性系统理论对于解决线性系统的控制问题非常有效,但是对于解决模型具有高度不确定性、强非线性的系统控制问题有其局限性。随着大量学者的深入研究,针对非线性系统的各种控制方法不断涌现,并形成一套较为完整的非线性系统控制理论。
1.1.2 非线性系统理论
非线性系统控制是自动控制理论中研究非线性系统运动规律及分析方法的一门分支学科。对于复杂非线性系统,线性系统理论方法难以适用。近年来,基于李雅普诺夫(Lyapunov)稳定性理论的控制方法有了突破性发展,主要包括鲁棒控制、自适应控制、神经网络控制和有限时间控制等,这些控制方法不仅跨越了传统线性控制理论与实际工业应用之间的鸿沟,而且为解决具有强非线性、强耦合性以及强不确定性的复杂系统控制问题打开了大门。接下来简要介绍上述提到的几种控制方法。
1. 鲁棒控制
基于传递函数的经典控制理论以及基于状态空间描述的现代控制理论存在的重大缺陷为被控对象的数学模型精确已知。然而,由于建模方法的局限性以及被控系统自身参数摄动现象的存在,系统数学模型不可避免地存在着各种形式的不确定性,从而使得获取被控对象的精确数学模型难度极大。因此,为了处理系统模型的不确定性并保证系统稳定,鲁棒控制理论应运而生。鲁棒控制是指设计一种控制器,使得当系统存在一定程度的参数不确定性及一定限度的未建模动态特性时,确保闭环系统稳定,并保持一定动态性能的方法。
鲁棒控制研究始于20世纪50年代,其早期主要处理单变量系统在微小摄动下的不确定性问题,具有代表性的是Zames提出的微分灵敏度分析[12]。然而在实际工业过程中,参数变化不可能永远无穷小,有可能变化波动比较大,因此,1987年Norton提出了鲁棒辨识方法[13],用于研究有界扰动刻画参数不确定性情形。过去一段时期中,鲁棒控制一直是国际控制领域的研究热点,主要方法有Kharitonov区间控制理论[14]、 控制理论[15]和结构奇异值理论[12]。此外,通过将鲁棒控制与其他方法结合,也形成了一大批具有代表性的理论成果[16, 17]。
2. 自适应控制
实际系统不可避免地会受到各种不确定性和/或干扰的影响,例如,无人机飞行过程中会受到阵风的影响,工业设备的零部件老化或损坏导致参数突变,机器人运动过程中面临运行环境不确定性等问题,这些问题难以用传统的方法和技术来解决[18]。针对具有“不确定性”的被控系统,如何设计具有自适应能力的控制器,一直是控制领域的研究热点,由此催生了自适应控制方法。“自适应”的概念*初起源于生物系统,是指生物变更自己的习性以适应新环境的一种特征。自适应控制是指设计一种控制策略,自动修正自身特性以适应被控对象及扰动动力学特征的变化[19]。自适应控制的研究对象是具有不确定性参数的系统(“不确定参数”多指系统参数为常数且未知)。与鲁棒控制不同的是,自适应控制所依据的是系统结构信息,设计的控制器在系统运行过程中不断提取可利用信息,从而不断更新控制器相关参数。
正是由于辨识/补偿机制赋予的在线估计/学习能力,自适应控制在处理不确定性问题以及外部干扰方面具有较强的能力。常见的自适应控制方法包括基于参数估计的自适应控制方法[20]和基于动态(高)增益的自适应控制方法[21]。
(1)基于参数估计的自适应控制方法。该方法的主要思想是基于系统量测信息设计在线动态更新律估计系统不确定性,进而设计自适应控制器。为了更清楚地阐明该思想,考虑如下不确定性系统:
(1.1)
其中, 是未知常数。若已知,控制器 可实现系统(1.1)的全局渐近稳定。于是,引入 估计 ,设计可执行的控制器。由文献[20]可知,选取 的更新律为 ,可确保。
(2)基于动态(高)增益的自适应控制方法。该方法的主要思想是基于系统量测信息引入动态(高)增益以捕获系统不确定性,进而直接设计控制器。例如,对于系统(1.1),设计动态高增益控制器 ,其中 。直观地讲,动态增益 可以变得足够大以捕获未知参数 ,从而确保闭环系统 的状态收敛到零[21]。值得强调的是,引入的动态增益既需要变得充分大以发挥补偿作用,也要保证有界性以确保控制器的可执行性。本质上,基于动态(高)增益的自适应控制方法是通过在线调整控制器参数直接补偿系统不确定性,因而也称为“直接自适应控制方法”。基于参数估计的自适应控制方法是对系统不确定性进行估计后设计控制器来抵消不确定性,而不是直接补偿不确定性,相应也称为“间接自适应控制方法”。
在21世纪初,随着计算机技术的飞速发展,自适应控制方法取得重大突破,被广泛应用到航海、化工、电网和医疗等领域[22-24]。此外,自适应方法结合其他控制技术,形成了一系列综合控制方法,如鲁棒自适应控制方法、神经网络自适应控制方法和模糊自适应控制方法等。文献[25]采用自适应控制方法解决了线性系统中的执行器故障问题;文献[26]将自适应控制方法用到比例积分(proportional plus integral,PI)控制中,解决了高阶标准型非线性系统的保性能控制问题。
3. 神经网络控制
人工神经网络简称神经网络,是由大量处理单元经广泛互联而组成的人工网络,用来模拟脑神经系统的结构和功能。其发展大致分为四个阶段:启蒙、低谷、复兴、高潮。
启蒙阶段:1943年,McCulloch和Pitts提出了M-P模型[27],此模型虽然简单,但却为神经网络的发展提供了理论基础。1949年,Hebb在文献[28]中提出了突触连接强度可变的假设,后来发展成为神经网络中有名的Hebb规则,为建立有学习能力的神经网络模型奠定了基础。1960年,Widrow和Hoff提出了W-H学习规则来修正权值矢量的学习规则[29],训练一定网络的权值和偏差使之线性地近似一个函数,并将其应用到了实际问题中。
低谷阶段:1969年,Minsky和Papert从数学角度对以感知器为代表的网络系统的功能及其局限性做了分析,指出简单线性感知器的功能非常有限,它不能处理线性不可分的二分类问题。该结论给当时的研究者带来了严重打击,于是人工神经网络的研究陷入了长达10年的低谷期。
复兴阶段:1982年,Hopfield教授提出了一种单层反馈神经网络,即Hopfield网络[30]。它是由非线性元件构成的反馈系统,并且首次把李雅普诺夫函数引入其中,证明了网络的稳定性。1986年,McClelland和Rumelhart在多层神经网络模型基础上,提出了BP神经网络[31]。1989年和1991年,文献[32]和文献[33]分别证明了多层前馈神经网络和径向基函数(radial basis function,RBF)神经网络都具有万能逼近能力。1995年,Cortes和Vapnik提出了支持向量机和维数的概念[34]。经过多年研究发展,已经有上百种神经网络模型被相继提出并应用。
高潮阶段:21世纪以来,随着云计算、大数据等新兴技术的崛起,各式各样行之有效的神经网络模型被相继提出,并在各个领域被广泛应用。例如,在2006年,深度学习由Hinton等提出[35],它是机器学习的一个新领域。近年来,很多学者把神经网络与自适应控制、PID控制和鲁棒控制相结合,解决了非线性系统的状态约束、执行器故障和控制方向未知等问题[36-38]。
神经网络控制是指在控制系统中采用神经网络对难以精确描述的复杂非线性对象进行建模,或充当控制器,或进行优化计算、推理和故障诊断的控制方式。与传统控制相比,神经网络控制具有如下优势。
(1)非线性:神经网络能在紧凑集合内对任意连续非线性函数进行充分逼近。
(2)并行分布处理:神经网络具有高度的并行处理能力,这使其具有强大的容错能力和较强的数据处理能力。
(3)学习和自适应性:能对知识环境提供的信息进行学习和记忆。
(4)多变量:神经网络可以处理多输入信号,非常适用于多变量系统。
4. 有限时间控制
相较于前三种控制方法,有限时间控制因其具有更好的鲁棒性、更强的抗干扰性和更快的收敛速度等优点,近年来备受关注[39]。
收敛性能是评估控制算法优劣的一个关键性能指标。大多数控制算法往往只能保证渐近收敛,少数控制方法能取得指数收敛的结果,但是这两类方法均基于无穷时间区间对闭环系统进行控制器设计和稳定性分析。然而,实际系统复杂多变,控制任务要求苛刻,特别是某些控制精度较高的系统(如导弹拦截系统),往往对收敛时间、控制精度等要求更高(要求系统状态在有限时间内达到给定精度或平衡点)。常规的渐近稳定或一致*终有界稳定的结果,显然不能满足这类控制需求[40-42]。有限时间控制是指系统状态在合适的控制算法(控制协议/控制律)下能够在有限时间内达到平衡点。相较于渐近稳定和一致*终有界稳定控制,有限时间稳定控制不仅保证系统拥有更快的收敛速度,同时可以保证系统存在外部扰动时具有更好的抗干扰能力和更强的鲁棒性[39, 43-45]。因此,研究有限时间控制不仅具有重要的理论意义,同时具有广泛的工程应用价值。
在实际系统中,由于模型不确定性和外界扰动的存在,有限时间控制往往不能使系统状态精确收敛到平衡点,只能保证状态在有限时间内收敛到系统平衡点附近的邻域内。针对这类情况,虽然*终一致有界稳定控制(如PID控制[46])同样能实现状态在有限时间里收敛到某个界内,但大量研究结果表明,相比该类控制,有
展开