间歇过程因其能够满足现代过程工业的特点和要求而被广泛采用,但间歇过程具有很强的非线性及动态特性,这些特性决定了间歇过程控制要比连续过程控制复杂,需要新的非传统技术。如何将具有离散时间特征(批次轴)和连续时间特征(时间轴)的信息统一在同一个模型和控制系统框架下是间歇过程优化控制中面临的挑战。
《基于数据的间歇过程综合学习型优化控制》主要介绍基于数据的间歇过程综合学习型优化控制,旨在把具有离散时间特征(批次轴)和连续时间特征(时间轴)的性能参数融入控制系统的分析与设计中,从而实现批次轴时间轴的协同设计。《基于数据的间歇过程综合学习型优化控制》分为三部分:第1、2章介绍必要的背景材料和预备知识;第3、4章研究基于数据的间歇过程模型;第5~7章研究间歇过程的综合学习型优化控制。
第1章间歇过程优化控制概述
1.1引言
为满足现代社会瞬息万变的市场要求,现代过程工业正逐渐由生产大批量、通用性的基础材料向既生产基础材料又生产小批量、多品种、系列化、高附加值的专业产品发展。间歇过程(batchprocess),又称批量生产过程,具有小批量、多品种、系列化、合成步骤复杂、技术密集等特点,能够满足现代过程工业的特点和要求[1.5]。半导体加工、制药、注塑、发酵等都属于典型的间歇过程。间歇过程和连续过程在各个行业中的应用情况如图1.1所示。可以预见,间歇过程作为具有很强生命力的一种现代过程工业的生产形式,将发挥更大的作用[6.20]。
图1.1间歇过程和连续过程在各个行业中的应用
在间歇控制标准SP88中,间歇过程的定义为:将有限量的物质,按规定的加工顺序,在一个或多个加工设备中加工,以获得有限量的产品,如果需要更多的产品则重复上述过程。简单地讲,就是将反应原料一次加入反应器,反应一段时间或达到一定的反应程度后一次取出全部的反应物料,然后进入下一轮操作。间歇过程是一种生产方式(生产的操作形式),和连续生产方式相对应,可以用同一套多用途、多功能的设备生产多种类型的产品。
虽然,间歇过程在工业上已得到广泛采用,但间歇过程的动态过程是一个一直在“进行中”的过渡过程,运行区间内一般没有稳态工作点,并且具有很强的非线性及动态特性[7.9]。由这些特点带来的不利于控制的方面主要有:
(1)过程的不确定性与时变性。在间歇过程的整个运行中,被加工生产的物质经历了一个从初态到终态的变化过程,被控系统没有稳定的工作点作为控制器设计的参考,并且时间常数、稳态增益、系统滞后等参数都是时变的。
(2)难以得到过程精确的机理模型。间歇生产方式的优势在很大程度上是因为其灵活性和柔性,即可针对市场需求进行产品快速加工调整,这样就不可能耗费大量人力物力建立过程精确的机理模型。
(3)缺乏有效的实时测量和准确的测量手段。在间歇过程中,由于对一些重要的品质指标参数缺乏在线测量手段,无法实施对产品质量的实时监控[4]。
这些特性决定了间歇过程控制要比连续过程控制复杂,需要新的非传统的技术[18]。如何保证不同批次之间产品品质的一致性成为控制理论界和工业界共同关注的课题。
但是,间歇过程中的以下特点可以被有效利用,从而形成独具特色的研究方向:
(1)慢速过程。间歇过程属于慢速反应过程,因此有足够的时间在线处理过程信息,进行较复杂的计算,从而实现间歇过程的优化控制。
(2)重复性。由于间歇过程特有的重复运行特性,每次运行的结果都对下一次的优化运行提供了有用的信息。
1.2间歇过程优化控制的研究状况
近年来,国内外的一些研究学者开展了间歇过程优化控制方面的研究工作,如英国学者Zhang及其合作者主要开展了神经网络模型驱动的间歇过程优化策略研究[2,7,20,21,29,30];韩国学者Lee及其合作者主要开展了基于迭代学习控制的间歇过程产品质量在线监测研究[23,26];香港学者Gao及其合作者主要从2D模型和预测控制的角度对间歇过程的优化控制进行了研究[12.17,19];新加坡学者Chiu及其合作者主要开展了基于多模型的间歇过程Run.to.Run优化及模型预测控制,并应用到实际生产过程中[31,32]。另外,清华大学的熊智华、阳宪惠及合作者[8.10,21],东北大学的王福利、毛志忠及合作者[4,34],浙江大学的王树青、陈曦、李平及合作者[24,27],上海交通大学的邵惠鹤、李赣平及合作者[6],南京航空航天大学的陆宁云及合作者[11],北京化工大学的曹柳林、李晓光及合作者[39],华南理工大学的周华、钱宇及合作者[40],北京防化研究院的邹志云及合作者[41],杭州电子科技大学的张日东及合作者[1],大连理工大学的刘涛[42.46],北京化工大学的王友清[47]等近年来开展了这方面的研究工作。作者相信,国内外从事间歇过程优化控制研究的学者还有很多,由于篇幅限制,谨向未提及者致歉。
根据用于优化的测量类型,间歇过程的优化控制策略可分为:离线优化、在线优化和Run.to.Run优化。其中,Run.to.Run优化是间歇过程中特有的一种优化控制方式,有着广阔的发展前景。这种方式根据对历史批次信息的反馈评估与分析,更新过程模型并调整控制方案从而降低批次间的产品差异。主要分为三种:第一种方法是通过简化的机理模型,基于间歇过程操作的重复性,应用积累的操作经验和庞大的历史数据来更新和改进模型以及由模型预估的最优轨线[22];第二种方法是使用主元分析、部分最小二乘、多变量统计分析法等来分析,由此得到优化指标和过程变量之间的统计相关模型,然后使用该模型在后续的批次中根据实时测量值更新操作轨线[23];第三种方法是使用神经网络建立数据驱动的模型,基于间歇过程操作的重复性和模型的预测信息,通过优化方法得到最优轨线[8]。但是,目前大多数研究结果只适用于线性和轻微非线性过程,对强非线性过程无能为力[24]。因此,针对非线性对象的Run.to.Run控制是未来的研究热点。
此外,迭代学习控制(iterativelearningcontrol)的思想非常适合间歇过程的优化控制。它是一种学习控制策略,适合于一类具有重复运行特性的被控对象,其利用系统先前的控制经验和输出误差来修正当前的控制作用,使被控系统的实际输出轨迹在有限时间区间内尽可能收敛于期望的输入轨迹[25,26]。由于间歇过程中具有显著的批次间重复特性,可以利用以前批次的结果作为反馈对下一批次的产品进行控制。近年来有一些这方面的研究,如Lee等[23]提出了把迭代学习控制和模型预测控制相结合的方法,利用迭代学习控制的思想校正模型误差,而利用模型预测控制来实时地调整辅助变量的优化轨迹;樊雷等[27]提出了迭代学习控制和广义预测控制相结合的方法,起到了减小模型误差和抑制扰动的作用;邸丽清等[10]提出了利用偏最小二乘的隐变量模型和迭代学习控制结合的思想,得到了不同质量等级的终点质量指标;刘涛等[45]将二维系统的稳定性理论应用到了间歇过程的迭代学习控制中,证明了闭环系统的稳定性;贾立等[48.52]提出了将数据驱动的神经模糊模型和迭代学习控制结合的思想,并分析了模型及控制器的收敛性。可以看到,迭代学习控制在间歇中的应用已经越来越受到青睐,是解决间歇过程优化控制问题的一个重要途径,有着广阔的发展前景。但是,迭代学习控制在间歇过程中的应用还有很多问题值得深入探讨,如迭代学习控制的初值问题、鲁棒性、学习速度、迭代学习控制的分析方法以及迭代学习控制应用推广都是这一领域的研究热点。
本书将Run.to.Run优化控制和迭代学习控制统称为学习型控制(learning.typecontrol)。可以预见,学习型控制将成为间歇过程优化控制的主要方式,但其在间歇过程的理论研究和实际应用方面还远未成熟,如何将具有离散时间特征(批次轴)和连续时间特征(时间轴)的信息统一在学习型控制系统框架下还有待深入研究。
1.3迭代学习控制在间歇过程中的应用
迭代学习控制适合具有某种重复运动(运行)性质的被控对象,可实现有限时间区间上的完全跟踪任务。它通过对被控系统进行控制尝试,以系统输出与给定轨迹的偏差信号修正不理想的控制信号,产生一个新的控制信号,使得系统跟踪性能得以提高[25]。
假设连续控制系统可表示为(t)=fx(t),u(t),t
y(t)=gx(t),t(1.1)
其中,f、g为向量函数;x(t)、u(t)、y(t)分别表示系统的状态变量、控制变量和输出变量。假设系统在有限时间区间0,tf上重复运行,并且向量函数f、g在每一次重复运行时所表示的函数关系不变,则由它们描述的系统动力学特性具有可重复性,xk(t)、uk(t)、yk(t)分别表示系统的状态变量、控制变量和输出变量(k=0,1,2,表示重复操作次数)。因此,可重复的控制系统(1.1)又可表示为
k(t)=fxk(t),uk(t),tyk(t)=gxk(t),t(1.2)
其中,t∈0,tf。式(1.3)描述了更一般的可重复动态系统k(t)=fxk(t),uk(t),tyk(t)=gxk(t),uk(t),t(1.3)迭代学习控制问题可描述为:对于被控系统(1.3),在有限时间区间0,tf上可达到期望轨迹yd(t)(t∈[0,tf]),设计控制学习率,要求通过多次的重复运行,使系统的控制输入达到期望控制ud(t),系统的输出尽可能地跟踪期望轨迹yd(t)。定义输出误差为ek(t)=yd(t)-yk(t)(1.4)利用当前控制uk(t)和输出误差ek(t)构造学习率产生下一次迭代的控制uk+1(t),即uk+1(t)=L(uk(t),ek(t))(1.5)
其中,L(?)为算子。迭代学习控制的算法流程如图1.2所示。图1.2迭代学习控制算法流程图间歇过程的工作原理如图1.3所示,其操作描述为:将反应原料一次加入反应器,反应一段时间或达到一定的反应程度后一次取出全部的反应物料,然后进入下一轮操作。这种“重复性”的特点使它可以利用历史批次的输入、输出以及误差信息来对当前批次的信息进行修正,从而达到对产品质量输出的控制。因此,迭代学习控制的思想非常适合间歇过程的优化控制,利用系统先前批次的控制经验和输出误差来修正当前的控制作用,对下一批次的产品进行控制,使被控系统的实际输出轨迹在有限时间区间内尽可能收敛于期望的输出轨迹[26]。图1.3基于迭代学习控制的间歇过程原理图
1.4间歇过程优化控制研究中存在的关键问题
当前间歇过程优化控制研究中,主要存在的问题如下。
1.模型研究问题间歇过程的优化控制依赖于过程精确的数学模型,这方面早期的工作主要致力于基于机理模型的研究,但是间歇过程的机理通常十分复杂并具有很强的非线性,往往要耗费大量的人力、物力,这与快速反映市场需要的生产背景不能适应,因此,数据驱动的模型成为研究的热点。在现有的数据驱动模型研究中,神经网络已显现出其在非线性过程建模中的强大能力,并已从数学上证明具有逼近任意非线性连续函数的能力。间歇过程神经网络模型方面的研究成果见文献[1],[5],[7],[20],[28],[29]。但传统的神经网络建模方法本质上是一种“黑箱”建模法,并且网络中的映射规则不可见、难以理解,不适合于表达基于规则的知识,这样就很难利用间歇过程中已知的机理知识。针对神经网络的缺点,文献[30]中提出采用神经模糊网络建立间歇过程的模型,其实质是将间歇过程的非线性模型在空间中分成几个不同的区域,每个区域具有一个线性的模型,然后通过权值将各个线性模型叠加最后构成一个非线性模型,这样可以有效利用过程中已知的机理知识。但是,文献中采用传统的BP算法训练模型参数,易陷入局部极小。其次,在实际的间歇过程生产中,数据量有限且质量有好有坏,并且过程中也经常存在未知扰动,这样模型与实际过程之间就会存在失配。另外,传统的数据驱动方法多为静态驱动模式。美国自然科学基金会在2000年首先提出了动态数据驱动应用系统的研究概念[53],其基本思想是采用动态数据注入的方式,动态完善和调整实际的仿真结果,可以实现仿真与实际数据之间的动态紧耦合关系。借鉴动态数据驱动应用系统的概念,如果将动态数据驱动模式引入到间歇过程的建模中,动态地吸收新的数据,则可能提供更为精确的预测、控制及更加可靠的输出结果。目前,这方面的报道还比较少。因此,有必要探讨能够合
……