《鲁棒故障检测与故障估计理论及应用》主要介绍了基于模型的动力学系统故障检测、故障分离、故障辨识和估计以及故障分析等方面的一些鲁棒诊断方法,并介绍了这些方法在轨道交通车辆、风力发电系统以及轨道健康状态识别中的应用等。在故障检测技术方面,基于GKYP引理的混合H-/H∞故障检测以及这种方法在线性参数变化系统中的推广应用是《鲁棒故障检测与故障估计理论及应用》中理论方面的一个重要部分;在故障估计方面,基于GKYP引理的滤波器是主要的技术策略,同时介绍了基于系统辨识技术的故障估计方法;在故障分离方面,《鲁棒故障检测与故障估计理论及应用》介绍了基于SVD分解和Eros方法;在应用方面,介绍了基于Kalman滤波器和GLRT的故障检测以及基于CUSUM和能量法的故障分离等技术。
《鲁棒故障检测与故障估计理论及应用》可作为动力学系统故障诊断领域方面研究生的参考书,同时对从事自动化系统研究、复杂机电系统健康状态监测、轨道交通车辆安全状态监测及相关领域的广大工程技术人员也具有一定的参考价值。
第1 章绪论
1.1 引言
随着生产水平和科学技术的不断发展,现代机电系统的规模日趋大型化、复杂化,自动化的程度也越来越高。自动化程度的提高可以提高生产率、降低生产成本,但系统发生故障的可能性也随之增加,尤其在某些高科技领域,高可靠性的系统是必需的,系统中的任何一个故障都可能会导致一系列的连锁反应,导致整个设备甚至整个过程不能正常运行,轻者造成停机、停产,重者会产生严重的甚至灾难性的人员伤亡。最典型的灾难性故障有:第二次世界大战期间,美国空军由于飞机故障而损失飞机达21000 架,是整个大战期间被击落飞机的2.5 倍;而从1998 年8 月到1999 年5 月的短短10 个月间,美国的三种运载火箭:“大力神”、“雅典娜”
和“德尔它”就发生了5 次发射失败,造成了近30 亿美元的直接经济损失;我国卫星发射的多次失利和多次的飞行事故(如2002 年国航“4¢15”和华航“5¢25”空难) 造成了巨大的经济损失和重大的人员伤亡;1986 年4 月,苏联切尔诺贝利核电站放射性泄漏事故,损失达30 亿美元,核污染波及周边各国;1986 年1 月,“挑战者”号航天飞机由于固体燃料助推火箭密封泄漏而引起燃料箱爆炸,导致7 名宇航员全部遇难,总计损失达12 亿美元;1984 年12 月,印度博帕尔农药厂毒气泄漏事故,造成2000 多人死亡,成为目前为止世界工业史上空前的特大事故;更近的如2003 年2 月1 日,载有7 名宇航员的美国“哥伦比亚”号航天飞机,在结束了为期16 天的太空任务之后,返回地球,在着陆前发生意外故障,航天飞机全部解体坠毁,不仅造成巨大的经济损失,而且使人类探索太空的航天事业遭受重大影响;2011 年的日本福岛核电站事件起因是由于强烈地震和海啸,使得核电厂断电、外部冷却系统完全失效,导致核反应堆快速升温爆炸,安全壳破裂,部分人工放射性核素外溢到大气或随着冷却水流入海洋,造成了巨大的污染和损失。这些灾难性的事件无时无刻不在警示人们,现代设备系统运行的安全性和可靠性是极其重要的,而故障检测与诊断(fault detection and diagnosis,FDD) 技术则为提高系统可靠性、可维护性和有效性开辟了一条新的途径。
故障诊断技术是提高系统安全性的重要手段之一。它是一门相对独立发展的技术,最早起源于采用硬件冗余方法的人工诊断,即利用冗余部件提供的信息,按照少数服从多数的原则确定故障部件。但硬件冗余方法在提高系统可靠性的同时,也增加了系统的成本、重量和空间。对大型复杂系统,采用硬件冗余的故障诊断方法是不现实的。因此,基于解析冗余的故障诊断技术应运而生。1971 年,美国麻省理工学院Beard 教授在他的博士论文中,提出了通过比较观测器的输出得到系统故障信息的思想,标志着解析冗余故障诊断技术的开端。由于解析冗余不需要增加额外硬件设备,具有成本低、易实现的特点,一直都是故障诊断技术研究的主要方法。到20 世纪90 年代中后期,针对线性系统的解析冗余故障诊断技术已形成了较为完整的体系,对非线性系统故障诊断的研究成为人们关注的焦点。随着故障诊断技术研究的深入,人们发现仍有许多急待解决的问题,如鲁棒故障诊断方法、非线性系统的故障诊断,特别是考虑到外部干扰和模型不确定性时非线性系统的鲁棒故障诊断方法、时滞系统以及网络控制系统的故障诊断方法、数据驱动的鲁棒故障诊断方法、复杂大系统的分布式鲁棒故障诊断方法以及网络控制系统的故障诊断方法等。
故障诊断技术发展几十年来,在工业领域得到了广泛的应用[1?3]。从诊断技术的各分支技术来看,美国占有领先地位。美国的一些公司,如Bently、HP 等,他们的监测产品基本上代表了当今诊断技术的最高水平,不仅具有完善的监测功能,而且具有较强的诊断功能,在宇宙、军事、化工、能源、汽车等方面具有广泛的应用。美国西屋公司的三套人工智能诊断软件(汽轮机TurbinAID、发电机GenAID和水化学ChemAID) 对其所产机组的安全运行发挥了巨大的作用。还有美国通用电器公司研究的用于内燃电力机车故障排除的专家系统DELTA、美国NASA 研制的用于动力系统诊断的专家系统、Delio Products 公司研制的用于汽车发动机冷却系统噪声原因诊断的专家系统ENGING COOLING ADCISOR 等。近年来,由于微型计算机特别是便携机的迅速发展,基于便携机的在线、离线监测与诊断系统日益普及,如美国生产的M6000 系列产品。
1.2 故障诊断技术的相关概念与任务本节将给出故障诊断技术领域的一些概念与名词,它们是了解与研究动态系统故障诊断技术的基础。这些概念同样适用于线性系统和非线性系统的故障诊断问题。
1.2.1 基本概念
(1) 故障(fault):系统至少有一个特性或者参数出现较大偏差,超出可接受的范围。此时系统的性能明显低于其正常水平,所以已难以完成其预期的功能。故障按照不同的标准可分为多种,如按故障发生的部位有传感器故障、执行器故障和元部件故障等;按故障的性质有突发性故障、缓变性故障和间隙故障等;按故障的持续时间有间断性故障和永久性故障等;按故障的相关性有关联故障和非关联故障等;从建模角度按故障发生的形式可分为加性故障和乘性故障等;另外,故障还可以分为单故障、多故障、独立故障和局部故障等。
(2) 故障检测(fault detection):利用一定的技术手段,确定系统是否发生故障。
故障检测根据被诊断对象的性质,可以采用不同的故障检测方法。对于同一个故障采用不同的方法,诊断效果往往很不一样,这就需要根据一定的性能指标对不同的方法进行评价。
(3) 残差(residual):故障检测单元对系统被监测量(如系统的输出) 的预测值和系统的实际输出值之间的差值。监测残差是故障检测的主要方法之一,采用一定的残差度量指标(如残差信号的范数),并设立相应的阈值,就可以进行故障检测。
当系统中没有故障发生时,它的变化主要反映了系统外界干扰、模型不确定性对系统输出的影响,此时残差的度量输出值小于设定的阈值;当系统发生故障时,系统的实际输出发生明显变化,而故障检测单元预测输出仍然为无故障时的输出,残差会有明显的变化,残差的度量输出值会大于无故障时的情形,当其值大于阈值时,认为系统发生了故障。
(4) 故障分离(fault isolation):在故障检测之后,确定故障的种类和故障发生的部位。在有些实际应用中,故障被检测到之后,就可以满足实际要求,维修人员经过复查后就可以对元器件的故障进行维修或直接更换元器件。但在有些自动化程度要求较高的系统中,只检测出系统的故障往往是不够的,还需要进一步确定是哪个部件发生了故障,以便在线的故障容错系统对其进行补偿或者维修人员可以准确地找到发生故障的元部件。相对于故障检测来讲,故障分离具有更大的难度,因为各种不同的故障都可以引起残差度量值超出阈值,要区分开是哪一个故障引起的,往往需要更多的工作。
(5) 故障辨识(fault identiˉcation):在故障分离之后,确定故障的大小以及故障发生的时间、位置和故障性质,并对故障加以评价等。故障辨识是故障诊断中最难和最复杂的一个问题,一般在故障检测和故障分离之后,主要完成故障的幅值大小等的确定和识别。对于一些可参数化的故障,如传感器的恒定偏差故障、弹性元器件参数的变化等,其故障幅值大小的识别可以用一些滤波方法和估计方法加以确定。
(6) 故障诊断(fault diagnosis):广义上通常作为故障检测、分离和辨识的通称;狭义上特指故障分离与故障辨识,在一些文献中故障诊断特指故障分离。在本书后续的叙述中可根据上下文加以判断。
(7) 故障检测与分离(fault detection and isolation,FDI):故障检测与故障分离之和。
(8) 故障检测与诊断(fault detection and diagnosis,FDD):故障检测与故障诊断之和。这时的故障诊断特指故障分离。
(9) 误报(false alarm):系统没有发生故障而报警。这主要出现在当诊断阈值过低,对系统的外部扰动估计不足,故障检测所设计的残差度量阈值太小,从而在系统扰动较大或者系统的运行工况发生明显变化时,残差度量值超出系统的阈值而误报警。“误报率”是衡量故障诊断系统性能的基本指标之一。
(10) 漏报(missing alarm):系统发生了故障而没有报警。“漏报率”是衡量故障诊断系统性能的又一个基本指标。残差度量的阈值设计得过大或过于保守,对系统的外部扰动或者系统的不确定性估计过大,就会导致在系统有明显的故障时故障检测单元不报警,一些幅值较小的故障无法被检测到。
(11) 诊断模型(diagnosis model):是一组静态或动态关系,把特定的输入变量――“症状”与特定的输出变量――“故障”或者“故障的表征量”联系了起来。
诊断模型可以有许多不同的表示方法,与不同的故障诊断方法相对应。例如,解析模型是一种人们熟悉的诊断模型,而神经网络、模糊逻辑系统等以其特有的方式存储、表示诊断模型。
(12) 解析冗余(analytical redundancy):与硬件冗余相对应,指通过用解析方法表示的系统数学模型来产生冗余的信号。冗余信号的产生往往是成功实现故障诊断的一个关键。
(13) 故障决策(fault decision-making):在故障发生后,根据故障的类别、严重程度、变化趋势等,决定采取的相应措施。
(14) 故障预报(fault prediction):根据系统的残差和症状等动态信息,在故障尚未发生时对其运行状态趋势的估计。一般通过对系统的运行参数或残差进行预测来实现。准确的故障预报可以有效地避免或降低故障发生带来的损失。
1.2.2 故障诊断任务
当系统发生故障时,如何找出故障的特性描述,并利用它进行故障检测、预报、分离、辨识,进而实现故障决策是故障诊断的主要任务。它包括故障特征提取、故障建模、故障检测、故障分离与辨识、故障预报和故障评价与决策等几个方面的内容,其中故障检测、故障预报、故障分离与故障辨识可以包含在故障诊断方法的研究中。
1. 故障特征提取通过数据测量和一定的信息处理技术获取反映系统故障的特征描述的过程。故障特征提取的主要方法有:直接观察和测量;参数、状态估计或滤波与重构;对测量值进行信息处理,如FFT、谱分析、小波分析等信号处理、神经元网络(ANN)、粗糙集(RS) 理论等。
2. 故障建模按照先验信息和输入输出关系,建立系统故障的数学模型,作为故障诊断的依据。同时它也包括故障树、有向图、定性推理等故障检测与诊断方法中非数学模型的建立。
3. 故障检测从可测或不可测的估计变量中,判断运行的系统是否发生故障,一旦系统发生意外变化,应发生警报。
4. 故障分离与辨识如果系统发生了故障,给出故障源的位置,区别出原因是传感器、执行器和被控对象等或者是特大扰动。故障辨识是在弄清故障性质的同时,计算故障的程度、大小及故障发生的时间等参数。
5. 故障评价与决策判断故障的严重程度,以及故障对系统的影响和发展趋势,针对不同的工况采取不同的措施,其中包括保护系统的启动。
1.2.3 故障诊断系统的性能指标评价故障诊断系统的性能指标大体上可分为以下三个方面。
1. 故障检测系统性能指标故障检测系统性能指标大体上可分为以下“精、准、快”三个方面:
(1) 对故障的灵敏程度:指故障检测系统对“小”故障信号的检测能力。故障总是从微弱的故障发展成为严重的故障,最终到元部件的失效。故障检测系统检测到的故障信号越是微弱,则故障诊断系统对该故障的灵敏度越高,表明它能精确地检测到的系统的“小”故障。
(2) 故障检测的准确性:误报是指系统没有发生故障却被错误判定出现了故障的情形;漏报是指系统中出现了故障却没有被检测出来的情形。一个可靠的故障检测系统应当保持尽可能低的误报率和漏报率,保证故障检测的“准确性”。
(3) 故障检测的快速性:是指当诊断对象发生故障后故障检测系统在尽可能短的时间内检测到故障发生的能力。故障检测的及时性越好,说明故障从发生到被正确检测出来之间的时间间隔越短。
2. 故障诊断性能指标
(1) 故障分离能力:是指诊断系统对于不同部件发生的故障可以区分和准确定位的能力。这种能力的强弱决定于对象的物理特性、故障大小、噪声、干扰、建模误差以及所设计的故障分离算法。故障的分离能力越强,表明诊断系统对于不同故障的区分能力越强,对故障的定位也就越准确。
(2) 故障辨识的准确性:是指诊断系统对故障大小、发生时刻及其时变特性的估计的准确程度。故障辨识准确性越高,表明诊断系统对故障的估计就越准确,也就越有利于故障的评价与决策。在容错控制系统中,这一点尤其重要。
3. 故障诊断系统的鲁棒性和自适应性
(1) 鲁棒性:指故障诊断系统在存在噪声、干扰、建模误差的情况下,正确地完成故障诊断任务,同时保持满意的误报率和漏报率的能力,保证对故障的敏感性。
一个故障诊断系统的鲁棒性越强,表明它受噪声、干扰、建模误差的影响越小,其可靠性也就越高。
(2) 自适应性:指故障诊断系统对于变化的被诊断对象所具有的自适应能力,并且能够充分利用由变化产生的新信息来改善自身,如设计相应的故障诊断系统、时变的故障检测阈值等。引起这些变化的原因可以是被诊断对象的外部输入的变化、结构的变化或由诸如生产数量、原材料质量等原因引起的工作条件的变化。对时变系统,保证良好的适应性是非常重要的。只有有了适应性,才可以保证系统的故障检测的“精、准、快”指标,才可以对故障进行可行的分离和辨识。
1.3 故障诊断技术分类按照故障诊断权威德国的Frank 教授的观点,故障诊断方法主要可划分为基于解析模型的方法、基于信号处理的方法及基于知识的方法三种,如图1.1 所示。
……