第1章 绪论
1.1 概述
随着我国海洋事业的壮大,舰船运动预报问题的解决已变得非常重要,船舶运动姿态预报对于舰载机起降指导与补偿、减摇控制、舰载导弹发射等都具有重大意义,因此国内外对船舶运动姿态建模预报非常重视并展开了许多研究[1,2]。从总体来看,所采用的研究方法可分为基于水动力学的分析方法和基于非水动力学的分析方法。
由于基于水动力学的预报方法存在计算的复杂性和实现的困难性,国内外学者现在更多地采用基于非水动力学的方法,主要包括周期图法、统计预报方法、神经网络法、投影寻踪法等[1-5]。周期图法把船舶运动姿态用一系列的周期序列和一个平稳随机序列来描述,用采集的船舶运动姿态的先验数据估计出它的周期序列项,进行近似预报。统计预报方法是以积分方程为分析工具并且使预报的均方误差*小的线性预报,该方法需要把预报与滤波结合起来使数据无外来噪声干扰,通过对输入信号的历史数据进行数学运算得到未来时刻的短期预报,但需要对测量数据进行长时间的处理以便得到预报信号的功率谱,所以统计预报方法难以适用于船舶实际应用需要。神经网络法把船舶运动姿态数据作为神经网络的输入,在反复学习训练中调整神经元连接权和神经元阈值,使给定输入数据经过学习训练后得到的网络输出接近于期望,利用建好的神经网络再在新的输入条件下得到预报值。投影寻踪法把数据投影到低维空间,通过极大化某个指标,发现数据的聚类结构,逼近多维非线性时间序列。
基于非水动力学的方法还有时间序列分析法,这也是人们*感兴趣的方法,这种方法的*大优点是无须知道海浪的任何先验信息和船舶航行姿态的状态方程,仅仅利用历史数据寻求规律进行预报。对于船舶运动预报,可基于船舶运动一段时间的数据利用时间序列分析法来寻求对应规律,把船舶运动看成一个平稳的窄带随机过程,通过线性模型或非线性模型拟合这一过程。根据统计分析船舶运动时间序列的规律性,拟合船舶运动的*佳数学模型,并利用模型对未来时刻的状态进行预报,计算量小且容易实现,关键问题是模型的参数估计。其中,可利用的模型包括自回归(autoregressive, AR)模型、自回归滑动平均(autoregressive moving average, ARMA)模型、门限自回归(threshold autoregressive, TAR)模型等[6,7]。但是高海况下船舶在海浪中的运动是一个非线性随机过程,其预报精度和时间长度会受很大影响,因此有待进一步探讨更有效的预报方法。本书采用多种自适应算法结合线性模型与非线性模型对船舶运动姿态时间序列预报展开进一步的研究。
本书在传统*小均方(least-mean-square, LMS)算法的基础上,寻找能够提高性能的改进LMS算法;在递归*小二乘(recursive least squares, RLS)算法的基础上,研究格型递归*小二乘(lattice recursive least squares, LRLS)算法;基于Kalman滤波理论,提出基于Kalman滤波算法的自适应AR建模与预报方法;针对支持向量机(support vector machine, SVM)的统计学理论和*小二乘支持向量机(least squares-support vector machine, LS-SVM)基本原理,建立基于LS-SVM的预报模型;针对周期图法预报效果差的原因,进行有针对性的改进研究;将长短期记忆(long shot-term memory, LSTM)神经网络应用到船舶运动预报中,并针对LSTM神经网络的不足之处进行有针对性的改进;由于船舶运动姿态的不确定性与混沌是紧密相连的,针对船舶运动姿态的非平稳、不确定性和非线性,引入混沌相空间重构理论,利用混沌系统短期预测的特性应用多种自适应算法结合多种模型对船舶运动姿态时间序列预报展开进一步的研究;根据回声状态网络的非线性逼近能力、强容错能力、网络训练过程简单的特点,结合相空间重构理论研究建立回声状态网络预报模型;针对船舶运动姿态在随机海浪作用下的非线性以及混沌特性,利用Volterra级数的非线性表征能力,给出船舶运动姿态混沌时间序列的二阶Volterra自适应预报模型;研究组合预报方法、基于扩展Kalman滤波算法的船舶运动自适应建模预报方法等。
1.2 基于时间序列分析法的船舶运动自适应建模与预报
时间序列是指存在于自然科学或社会科学中的某一变量或指标的数值或观测值。由复杂性理论可知,时间序列中不仅包含了系统所有变量过去的信息,而且包含了参与系统演化的所有变量的大量信息。因此,时间序列分析有着广泛的实际应用,主要包括:
(1)分析时间序列的统计规律性,推断产生时间序列的物理系统的性质,找出它的规律性。
(2)根据对时间序列统计规律性的分析,构造拟合它的*佳数学模型,浓缩时间序列的信息,简化对时间序列的表示。
(3)利用拟合的数学模型预报时间序列未来的可能值,给出预报结果的分析。
(4)根据拟合的数学模型模拟出时间序列,用于分析和优化处理。
传统的时间序列分析法是在时域上估计观测数据{x(i),i=1,2, ,N}的自相关函数,或在频域上估计它的自谱函数(或称功率谱)。但实际上,所获得的时间序列往往是有限长度的,因此不可能通过观察数据计算出自协方差函数与自谱函数的真值。自谱函数会发生谱线泄露现象,即观测数据中所包含的谐波成分与幅值出现歪曲,这一缺点在分析处理较短的观测数据时尤为突出。虽然目前已提出了不少克服以上缺陷的方法,但其效果只是减少谱线泄露而不能消除。
现代时间序列分析方法是通过另一种途径,即模型法来实现的。主要思路是把时间序列看成随机系统对于不相关的或独立的“白噪声”输入的一个实现,即将时间序列看成动态系统的输出,而系统的输入是白噪声。这样,动态系统的数学模型就可以将不独立或相关的时间序列输出转化为独立的或不相关的输入。所以现代时间序列分析方法就归结为寻求这样一种模型,它能实现将不独立数据转化成独立数据,然后利用独立观测值进行估计、预测和控制[8]。
现代时间序列分析方法是处理动态数据的参数化时域分析方法,通过对观测数据拟合一个参数模型,利用所得模型进行未来值预测。在实际应用中,尤其是在极短期预报当中,实时预报是我们比较关心的问题。自适应模型在某种程度上能够实时地根据测量数据和期望输出自行调整模型参数,并随着数据的陆续到来,通过递推算法自动地对模型参数加以修正,使其接近某种*佳值,即便在尚不完全掌握序列特性的情况下也能得到满意的模型[9]。
由于应用递推算法,自适应模型的参数在每次迭代中要加以修正,参数和输入数据是有关的,这意味着自适应模型是非线性的,但习惯上将其称为线性自适应模型,这是因为被估计的参数向量是由一组观察数据的线性组合进行自适应计算得出的。
常用的时间序列线性预报模型即AR模型、ARMA模型分别如下。
AR模型:其表达式为
式中,为自回归阶数;为自回归系数;为均值为零、方差为的正态分布噪声。该模型简记为AR。
ARMA模型:为了使模型在拟合实际数据时有更大的灵活性,有时在模型中既包含自回归部分也包含滑动平均部分,这就是ARMA模型。其表达式为
式中,p和q分别是自回归部分和滑动平均部分的阶数;和分别是自回归和滑动平均系数。该模型简记为ARMA。
近年来,针对现实生活中大量的非线性问题,Volterra级数模型被广泛采用,特别地,这种模型对于非线性自适应滤波是非常有用的。Volterra级数可以描述一大类非线性系统,利用这个特点,可以将其与自适应算法相结合对时间序列进行预测[10]。
自适应模型递推算法种类很多,具体采用何种方法要考虑如下几个因素。
(1)收敛速度:在平稳情况下要经过多少次迭代才能在均方意义下充分快地收敛到*优解。算法收敛得快,就能很快地使模型符合未知的平稳统计特性,而且在非平稳情况下也能跟踪统计特性的变化。
(2)稳态进度:某种算法所得参数的均方误差在迭代次数充分大时的值。通常这个均方误差要和某种*优结果的*小均方差作比较。
(3)算法的鲁棒性:对于输入病态数据具有有效的处理能力。
1.3 混沌时间序列预测
混沌时间序列预测可以用来确定动力学系统模型,检测和识别混沌,目前已被广泛应用于自然科学和社会科学的各个领域,具有很重要的实际应用价值和意义。
20世纪80年代以来,混沌时间序列分析的理论与方法得到不断发展。1980年,Packard等[11]提出时间序列的相空间技术,Takens[12]提出并证明了用延迟坐标重构相空间的方法。相空间的延迟时间重构保留了原来系统的几何结构,和原有的系统是拓扑等价的。相空间重构理论将混沌理论与非线性时间序列结合分析,为混沌时间序列的预测和分析奠定了坚实的理论分析基础。
经过四十多年的发展,在混沌时间序列预测领域已经获得了很多重要的研究成果,其中的预测方法包括全局预测法、局域预测法和非线性自适应预测法等。
全局预测法即全局多项式建模预测法,它与非线性表达能力相关,在理论上是可行的,但由于其建模过程是离线的,当嵌入维数很高时该方法很难做出准确的预测。全局神经网络因其强大的非线性逼近能力已被很多学者用来研究混沌时间序列的预测问题,如反向传播(back progation,BP)神经网络、径向基神经网络、自适应线性神经网络、感知机神经网络、竞争学习神经网络、学习向量量化(learning vector quantization,LVQ)神经网络、Elman神经网络、Hopfield神经网络和Boltzmann神经网络等,但对于不同的算法,神经网络预测法的预测性能会有很大差别,同时存在局部*小点的问题,给实际工程实现带来了很大的困难。相对于静态神经网络,动态递归神经网络由于普遍适用于非线性复杂系统的建模和预测成为近年来研究的热点[13,14]。
局域预测法是一种针对混沌时间序列的基本预测方法,具有柔韧性好、拟合速度快和运算精度高等优点。该方法把相空间数据*终点附近的若干数据点作为相关点,通过拟合这些相关点来估计数据的走向,*后从预测出的数据点中得出所需要的预测值。目前局域预测法在大多数实际情况下都是可以实现的,比全局预测法应用的范围更广。但是,由于目前一阶以上的局域预测法所求参数比较多,而且一旦一阶局域预测法参数矩阵为病态矩阵,通过*小二乘法确定的待定系数会出现预测精度降低的现象,成为局域预测法广泛应用的重要瓶颈[15,16]。
非线性自适应预测法在某种程度上能够实时地根据测量数据和期望输出的差值自行调整参数,并随着新数据到来通过递推算法自动地对参数进行修正使其接近目标值。非线性自适应预测法由于具有自动跟踪、实时性好等优点也受到广泛的关注,成为研究热点。
混沌的英文为“chaos”,其含义是混乱无序。然而究竟什么是混沌,目前尚无明确的定义。混沌可理解为确定系统产生的对初值极端敏感的非周期行为。混沌一般具备两个主要特征:①对于某些参量值在几乎所有的初始条件下都将产生非周期动力学过程;②随着时间的推移,将表现出各自独立的时间演化,即存在对初始条件的敏感依赖性。对这两个特征的描述或判别有四个基本尺度:①存在正的李雅普诺夫(Lyapunov)指数;②刻画系统在相空间的运动或结构复杂性的维数为分数维;③用来反映动力学系统非线性状况复杂性程度和运动不稳定的拓扑熵非负;④功率谱连续[17]。
按照不同的标准将混沌划分如下:①时间混沌和空间混沌。时间混沌即系统状态具有初始条件的敏感性,空间混沌即系统状态具有边界条件的敏感性。②完全混沌和有限混沌。如果在该系统中大多数轨道显示出敏感依赖性,即为完全混沌;如果在该系统中只有某些轨道是非周期性的而大多数轨道是周期性的或准周期性的,即为有限混沌[18]。③强混沌和弱混沌。这是按照是否有一个时间尺度可以对系统的演化行为做出预测来划分的,强混沌中存在一个时间尺度,一旦超越这一尺度,系统演化就是不可预测的,而弱混沌不存在这样的一个尺度,它
展开