第1章绪论
1.1引言
随着现代工业技术的迅速发展,大型自动化系统的结构越来越复杂,自动化程度越来越高,不但同一设备不同部分之间存在紧密耦合,而且不同设备之间也存在密切的联系,在运行过程中形成一个相互影响的统一整体。通常在一处发生的故障可能引起一系列连锁反应,若不能将其及时诊断并排除,就会导致设备,甚至整个系统不能有效正常运行,造成灾难性事故[1-8]。
采用异常检测和故障诊断技术的经济效益是非常明显的,英国对2000个国营工厂的调查表明,采用故障诊断技术后每年可节省维修费用3亿英镑,用于诊断的费用仅为0.5亿英镑[7]。美国Pekrul发电厂实施故障诊断技术后的经济效益情况分析表明,故障诊断系统的收益达到投入的36倍[9,10]。我国每年用于设备维修的费用仅冶金行业就达250亿元。如果推广异常检测和故障诊断技术,每年可减少事故50%~70%,节约维修费用10%~30%,效益相当可观[11-13]。
故障诊断技术的使用还可以用来指导设备的状态检修制度。目前大型自动化系统多采用设备定期检修制度,存在“维修过剩、维修不足”、“小病大治、无病亦治”现象。盲目维修带来的不仅是低效与无效,还有可能是负效。在频繁的超量维修中,尤其是进口设备维修损坏的现象时常发生[11,12]。
开展大型自动化系统的故障诊断研究,给出合理的视情检修制度,以便发生故障的情况下能迅速判断、处理事故,并给出灵活好用的智能化自动分析软件,对辅助控制中心的工作人员做出正确决策,制定合理的预测维护方案具有重要的实践指导意义。但是,故障诊断研究的理论体系还不完善,因此故障诊断的研究必须紧密结合工程实际,为故障诊断在实际中的应用打下扎实的理论基础。
另外,故障诊断是事后维修的决策依据,无法很好地做早期预测维护。随着工业互联的不断推进,工业自动化系统的规模更加庞大,结构更加复杂,即使是早期微小故障也可能在发展演化后造成巨大的财产损失和人员伤亡[14-17]。开展预知性维护研究,用视情维修代替计划维修是保证系统安全高效经济运行的必备手段之一。这一技术的核心是微小故障早期诊断与寿命预测[18-21]。
国家“十二五”科学和技术发展规划将重大工程健康状态的检测,以及诊断列为需求导向的重大科学问题。《高端装备制造业“十二五”发展规划》也把故障诊断与预测维护技术列为重点发展的关键智能基础共性技术。《中国制造2025》提出“加快开展物联网技术研发和应用示范,培育智能检测、远程诊断管理、全产业链追溯等工业互联网新应用,建设一批高质量的工业大数据平台。”把工业大数据用于智能检测、远程诊断是故障预测维护的全新研究方向之一。
工业互联是智能制造的前提,工业大数据是工业互联的产物。山西钢铁集团的热轧钢板生产线安装有300多个测点,每分钟采集约3GB的监测数据。三一重工远程监测系统对上百种10万多台工程装备进行在线监测,每台工程装备铺设246个测量点,目前该系统累积数据量超过1000亿条,每天以1000万条的速度增长。北京化工大学高金吉团队开发的远程监测系统有29家企业使用,监测机组总数达1149台,总监测点数多达18552个,单位时间数据量达到1.52TB。这些数据可以记录不同设备在不同工况下的海量监测数据[22]。“大数据时代信息资源深藏闺中是极大浪费”,充分挖掘数据中包含的信息,建立基于深度特征抽取技术的智能故障诊断方法是保证生产过程安全高效运行的必要手段,是真正实现视情维护,进行智能决策的前提。
近年来,数据驱动的故障诊断和预测维护技术因其不需要复杂工业过程的机理模型而受到学者和工程师的关注。浅层特征抽取建立的机器学习模型或多变量统计模型不能对非显著故障特征做精确表示。这就无法彻底达到“让数据自己说话,让系统自动从数据中学习并发现或者领悟具体特征”的目的,从而影响数据驱动的微小故障诊断的精确性。深度学习技术通过逐层初始化能有效克服深层神经网络(deep neural network,DNN)训练的难题,具有优异的特征表示能力。在函数逼近理论中,观测数据空间的基(对应空间坐标系的坐标轴)能够唯一地表示刻画观测数据特征的函数,但这种表示结果并非对具备明确物理意义的故障特征的精确表示。这也是神经网络无法很好表示微小故障特征的原因。标架(frame)是观测数据空间中与基对应的一组集合,包含冗余信息。标架中的元素可以代表观测空间中坐标轴之外的其他信息,而这些信息的组合可能是我们想要抽取的故障特征。深度学习(deep learning,DL)的每一层把观测数据表示成标架中元素的组合,所以有望对微小故障特征做精确表示。深度学习鼻祖Hinton课题组的研究表明,网络层数越多,深度学习框架对特征的逼近精度越好。本书把深度学习抽取出的特征定义为深层特征,研究基于深层特征抽取的微小故障诊断方法。基于深度学习的故障诊断研究目前大多仅限于基于单个传感器观测数据的离线故障分类。为实现视情维护,基于多形态感知信息的在线微小故障诊断的关键问题亟须解决。
深度学习是一种大数据深度特征抽取技术。深度学习模型采用故障数据量的多少、深层网络抽取微小故障特征的方式,决定了逐层学习后再做全局参数调整的深度学习模型进行故障诊断的精度。虽然深度学习有强大的特征表示能力,但是推理决策能力不足、实时性差等问题导致现有基于深度学习的方法无法精确地进行微小故障的实时诊断。
1.2故障诊断的研究内容及方法分类
1.2.1故障诊断的研究内容
从系统的观点来看,故障包括两层含义:一是系统偏离正常的功能,其形成原因主要是系统不正常的工作条件引起的,若能及时对参数进行调节或修复相应零部件,则系统可恢复正常功能;二是系统功能的失效,是指系统连续偏离正常的功能,且其程度不断加剧,使设备的基本功能不能得到保证[1,2,23,24]。
故障诊断是采用各种测量和监视方法,记录和显示设备运行状态,对异常状态做出报警,对已经发生或者可能发生的故障进行诊断和分析预报,确定故障发生的原因,从而提出维修对策,使设备恢复到正常状态[23,24]。
从信息提取的角度看,故障诊断的过程就是在不同层次上做不同程度的特征提取,实现从观测空间到特征空间、决策空间和分类空间的变换。这个过程称为故障诊断的空间变换,如图1-1所示[7]。
故障诊断技术的研究受到工程界和学术领域众多专家的广泛关注。实用高效的故障诊断方法要求既能进行实时故障检测,又能完成故障模式的辨识,找出发生故障的元部件,从而为系统维护和检修人员提供必要的指导[24]。
1.2.2故障诊断方法分类
诊断方法的研究是故障诊断技术的核心。关于故障诊断方法研究的文献也层出不穷,从基于解析模型的方法到基于人工智能的方法、基于统计的方法等[7,24]。现有的故障诊断方法大体上可以分为3类,即基于定量模型的方法、基于定性模型的方法和基于数据驱动的方法。基于定量模型的方法包括观测器设计法、等价空间法和扩展卡尔曼滤波(extended Kalman filter,EKF)法等。基于定性模型的方法包括有向图法、故障树法、定性机理分析法、抽象结构分层模型法、抽象功能分层模型法等。基于数据驱动的方法可分为定性的方法和定量的方法。定性的方法有专家系统法和定性趋势分析法。定量的方法有基于机器学习的方法、基于统计的PCA/PLS(partial least squares,部分*小二乘)方法和基于信号处理的方法等[25-35]。图1-2所示为故障诊断方法分类[7,8,24]。
基于EKF的故障诊断方法是一种基于状态估计的方法。利用系统精确的数学模型和可观测输入/输出构造能反映系统中潜在故障的残差信号,该诊断方法基于对残差信号的分析进行故障诊断[36,37]。
基于观测器的故障诊断方法设计一组对所有扰动和特定故障解耦、对其他故障敏感的观测器,然后通过恰当的分组设计和逻辑判断进行故障检测和分类[38-41]。
基于等价空间的故障诊断方法利用系统的解析数学模型建立系统输入/输出变量之间的等价关系。这种关系可以反映输出变量之间静态直接冗余和输入/输出变量之间动态的解析冗余。然后,通过检验实际系统的输入/输出值是否满足该等价关系,达到检测和分离故障的目的[42-44]。
基于模型的故障诊断利用系统内部的精确机理模型,具有很好的诊断效果。但是,这类方法依赖被诊断对象的精确机理模型,需要关于系统运行状况信息的一些先验知识。这些信息在有些情况下是无法得到的,或者很难建立更通用的精确模型。诊断性能的好坏在很大程度上依赖机理模型的准确程度。另外,许多实际运行的大型复杂系统可采集到丰富的在线和离线测量数据,但是这些信息并没有被有效地利用。如何更好地控制此类系统,并对控制效果进行评价既是国民经济发展的需求,也是智能运维领域亟待解决的挑战性问题。数据驱动故障诊断方法的研究应运而生。
1.3数据驱动的故障诊断方法综述
随着分布式控制系统(distributedcontrol system,DCS)、各种智能化仪表、现场总线技术在工业控制中的广泛应用,大量的系统状态数据被采集并存储下来。但是,这些包含系统运行状态信息的数据并没有被有效地利用,以致出现“数据丰富,信息匮乏”的现象。例如,对于一个设施良好的化工厂,测量变量可能有成百上千个,包括各种二进制设备信号、警告信息、流量、压力、温度等模拟信号,而操作工在同一时间只能处理几个变量(一般是7个)[8,45]。
20世纪90年代以来,随着计算机技术和数据库技术的发展,廉价的计算资源和可靠的存储技术为海量数据的分析提供了物质基础。工业界已越来越意识到将现有的数据变为有用的信息,使之服务于系统健康管理,增加系统的可靠性,并降低维护成本的重要性。据统计,仅美国石化行业每年因异常事故造成的损失就高达2亿美元[7,46]。
数据驱动的系统故障诊断研究已成为当前自动控制领域的一个研究热点。美国等发达国家近年来已投入大量的人力和物力,加强对该领域的资助,以期望通过对观测数据的分析来揭示、反映系统的内在变化,提高诊断能力,从而把数据资源的拥有优势转化为经济效益。我国也逐渐意识到其重要性。2006年,《国家中长期科学和技术发展规划纲要(2006-2020年)》陈述的重点领域和优先研究课题都涉及如何利用多变量数据的综合处理结果对大型自动化系统的运行状况进行决策。相关部门相继把数据驱动的异常诊断研究作为重点或优先资助方向。
数据驱动的方法以采集到的过程数据为基础,通过各种数据处理与分析方法(如多元统计分析、频谱分析、小波分析等)挖掘数据中隐含的信息,提高系统的健康管理能力,并且数据驱动方法与具体模型的选取无关,通用性强[8,23]。
综上,开展数据驱动的故障诊断技术研究既有理论性和挑战性,又有很高的应用价值。研究数据驱动的故障诊断方法,解决“数据丰富,信息匮乏”问题可以进一步提高系统健康管理的性能,更好地控制包含大量测量信息的大型自动化系统。
一些控制技术公司已在他们的控制软件中增加了统计监控模块,如Foxboro公司的FoxSPC、Siemens公司的SIMATIC-WinCC、Honeywell的TpS等[8]。但是,该领域的理论体系并不完善,必须紧密结合工程实际,开展相应的理论研究,为数据驱动故障诊断方法的应用打下扎实的理论基础。
1.3.1故障诊断的专家系统法
基于专家系统的故障诊断方法能够利用专家丰富的经验知识进行诊断,无须系统机理建模,并且诊断结果易于理解,因此得到广泛的应用[7,25,26,47,48]。
这类方法也存在不足,如知识获取的瓶颈问题[10,49]。专家知识的局限性和知识表述规则化的困难,造成诊断知识库的不完备。当遇到一个没有相关规则与之对应的新故障现象时,系统就显得无能为力。同时,系统缺乏自学习和自
展开