第1章资料同化概述
1.1资料同化是干什么的?
本书读者可能对以下问题感兴趣:什么是资料同化?为什么需要做资料同化?资料同化主要关心什么问题?资料同化的理论基础是什么?怎么做资料同化?资料同化的关键技术是什么?需要储备多少资料特点和同化方法方面的知识才能解决不同资料同化情景下的关键技术?对解决某些问题为什么某个同化方法比其他方法更具优势?资料同化的主要挑战是什么?
大气资料同化的目的之一是为数值天气预报(NWP)提供初始条件。数值天气预报中的控制方程可以形式上表达为
(1.1)
其中,x0是模式变量向量的初始条件,譬如地球大气在初始时刻(t0)和三维空间的风矢量(M,V,W)、密度(o)、位温(60和比湿(g);x(t)是描述未来时刻(t,t>to)大气状态的预报向量,它的分量所表达的大气变量与xa相同;F(x(t))包含所有影响时间倾向项的大气动力过程、外源强迫(地形、太阳辐射)、显式和隐式参数化物理过程(积云对流参数化、行星边界层过程、微物理过程、辐射参数化等)。
用欧拉和蛙跳格式来近似方程(1.1)左边的时间导数(Haltiner和Williams,1980),我们得到不同时间积分步长%,上的控制方程表达式:
(1.2)
其中,At是数值积分步长。一旦能确定变量初始条件X0,通过式(1.2)中的时间积分步骤,就能得到未来时刻的大气状态。这样的一个求解过程在数学上叫作正问题。因此,数值天气预报(NWP)得到的是正问题答案。
数值天气预报中需要解决的一个逆问题例子如下:给定一组观测资料和一个根据模式变量得到观测量(Fn)的观测算子(Hn)
(1.3)
其中,满足式(1.2)。我们需要根据这些观测资料估计初始条件向量X0的值,资料同化要解决的是类似这样的逆问题。资料同化的目的是要根据式(1.2)、式(1.3)和已知资料,得到真实大气在某个时间和给定空间分辨率
上的一个“最优”估计值。这里的“最优”是由最大似然或最小方差这两个统计估计方法来定义的(见第2章)。
大部分逆问题比相应的正问题难解得多。数学中的逆问题理论是关于求解逆问题的理论(Tarantola,1987)。它可以为模式中未知参数提供信息,验证模式的正确性,在几个模式中筛选出一个最佳模式,为决策层设计外场观测试验,还可以从大量数据中获取关键信息。值得强调的是,逆问题理论和逆问题方法是对一个已有模式进行改进并提供更深入的分析,但不能提供一个崭新的模式。
我们用以下三个例子来说明为什么想做和需要做资料同化。图1.1展示了欧洲中期天气预报中心(ECMWF)的全球大尺度再分析资料ERA5(Hoffmann等,2018)给出的2018年9月6日0000UTC时飓风“佛罗伦斯”(Florence)的海平面气压分布。飓风中心的海平面气压比实际观测值高了46hPa。根据飓风Florence在2018年9月6日0000UTC的中心气压、最大风速、最大风速半径和34kt风速半径(用4bkt=255km),利用Fujita经验公式(Fujita,1952),我们可以得到对应飓风Florence的人造涡旋海平面气压分布,如图1.1b所示。利用包含物理过程参数化的四维变分同化系统同化人造热带气旋,可以改进飓风路径和强度预报水平(Zou和Xiao,2000;Xiao等,2000;Park和Zou,2004;Tlan和Zou,2019b)。
第二个例子比较了2000年9月17日0000UTC飓风“戈登”(Gordon)附近的QulkSCAT二维海面风分布(图1.2a)(Rlcciardulli和Wentz,2015)和美国国家环境预报中心(NCEP)FNL再分析资料(图1.2b)(NCEP,2000),ECMWF Interim再分析资料(图1.2c)(Simmons等,2007)、ECMWFERA5再分析资料(图1.2d)(Hoffmann等,2018)。飓风Gordon在这个时间达到一级飓风强度。NCEPFNL再分析资料中的海面风速比QuikSCAT观测的海面风速弱很多。这是因为NCEPFNL再分析资料的水平分辨率(1.0°x1.0°)比卫星QuikSCAT海面风、Interim再分析资料和ERA5再分析资料的水平分辨率(0.25°x0.25°)低。QuikSCAT海面风卫星观测资料在飓风Gordon内呈非对称分布,最强风速分布在飓风中心东北方向,最大风速半径略小于100km,最小风速在最佳观测路径飓风中心(图1.2a)。然而,NCEPFNL再分析资料和ERA5再分析资料中的海面风最小风速中心在最佳观测路径飓风中心的西面(图1.2b,d)。由于分辨率较低,NCEPFNL再分析资料最强风速与最小海平面气压中心的距离约为200km(图1.2b),比观测的最大风速半径大了一倍。虽然与QuikSCAT海面风观测资料的水平分辨率相同,Interim再分析资料的海面风几乎完全没有反映飓风Gordon的反气旋环流特征(图1.2c),而ERA5再分析资料中飓风Gordon的海面风反气旋环流特征明显,接近QuikSCAT海面风观测特征。此外,以上三个全球再分析资料(图1.2b~d)都没有显示QuikSCAT观测到的位于飓风中心东北方向的一个海面风速次大值(图1.2a)。因此,我们有理由尝试把QuikSCAT海面风卫星观测资料应用到飓风涡旋初始化、资料同化和数值天气预报中去。
第三个例子显示了飓风“邦尼”(Bonnie)附近由特殊传感器微波成像仪(SSM/I)给出的中心频率分别为19GHz和89GHz的垂直极化通道的二维亮温观测分布图,如图1.3a、b所示(Raytheon,2000),观测时间是1998年8月24日2230UTC。19GHz低频通道观测亮温显示出飓风Bonnie的一个非对称分布特征,飓风Bonnie中的最高观测亮温区位于飓风中心的东北侧,在275K左右,比飓风环境观测亮温高了约55K。然而,在19GHz低频通道最高观测亮温区,89GHz高频通道观测亮温值低得多,约225K,远比飓风环境区域的观测亮温低。除温度和水汽外,SSM/I观测亮温的这些分布特征与飓风Bonnie中云的分布特征有关。飓风Bonnie云中液态水路径和冰水路径的分布如图1.3c~d所示,液态水路径是1998年8月24日2230UTC由SSM/I反演得到,冰水路径是1998年8月24日1700UTC由热带降水测量任务微波成像仪TMI反演得到。液态云辐射增加了卫星微波成像仪接收到的19GHz频率附近的红外辐射量;由于云冰散射作用,卫星微波成像仪接收到89GHz频率附近的红外辐射量减小。卫星微波成像仪观测到的这些特征促成了飓风卫星资料同化的一系列相关研究(Amerault和Zou,2003,2006;Amerault等,2008,2009)。同化受云影响的卫星高频通道亮温观测资料需要考虑辐射传输模式中的冰粒子分布与中尺度数值预报模式中微物理过程参数化方案的一致性(Amerault和Zou,2003),以及云水和冰水变量的背景场误差协方差矩阵(Amerault和Zou,2006),还要发展中尺度数值预报模式和微物理过程参数化方案的伴随算子(Amerault等,2008)。Amerault等(2009)利用美国海军实验室(ONR)海洋和大气耦合中尺度预报系统COAMPS(Coupled Ocean/Atmosphere Mesoscale Prediction System)及其伴随模式(包含COAMPS微物理过程伴随算子),同化受云冰影响的SSM/I亮温观测资料后,改进了飓风预报水平。
观测资料是进行资料同化的原因。大气资料种类繁多,包括GPS无线电掩星弯角和折射率,搭载在极轨环境卫星上的微波和红外辐射仪辐射亮温,静止卫星成像仪红外通道辐射亮温,地基GPS总降水量资料,卫星总柱臭氧,卫星海面风,地面雷达径向风和反射率,卫星水汽反演风矢量,无线电探空仪观测、地面站观测、飞机观测、机载雷达飓风观测、外场观测、下投式探空仪飓风观测数据,等等。即使是在已有的同化系统中加入这些资料,科学家们仍需要完成以下工作:开发合适的观测算子,定量估计资料和模式的误差偏差和方差,开发物理上合理的偏差订正、云检测、资料稀疏化和质量控制方法,保证极小化程序收敛,进行资料同化影响评估,分析资料同化改进或不改进数值天气预报水平的原因。
在过去的80年里,随着计算机、通信、卫星和雷达遥感观测仪器科学和技术的迅猛发展,资料同化从简单的函数拟合主观方法逐步发展成为越来越依赖于计算机能力且更复杂的客观方法。这些能在计算机上实现的方法包括逐步订正法、最优插值、三维变分、四维变分、增量四维变分、卡尔曼滤波、扩展卡尔曼滤波、集合卡尔曼滤波、混合集合卡尔曼滤波和三维变分、混合集合卡尔曼滤波和四维变分。重要的是,我们不仅要知道每个方法的数学公式,也要清楚每个方法中使用的近似假设的实施细节以及各自的含义。
在实际应用中选择某一个同化方法需要考虑该方法的优缺点,以及与其他同化方法的相似性,确定所选同化方法能服务于特定的应用目的。事实上,无论用什么方法,资料同化所产生的大气状态变量的分析场(/)可以近似写成下面的一般形式:
(1.4)
其中,xb是背景场向量,矩阵W被称为后验权重。所以,不同资料同化方法之间的最大差别是怎样获得后验权重,以及式(1.4)隔多长时间计算一次。当然,在实际应用中,只有在向量xb的维数较小的情况下,才直接利用式(1.4)得到分析场/。对大部分数值天气预报问题,向量xb或/的维数远大于106。在这种情况下,大气状态变量的分析场/是通过别的数学计算方法间接得到的,式(1.4)近似成立。
资料同化需注意以下几点:观测值被拟合到观测误差之内;②保证观测算子得到的模拟值与真实资料具有物理一致性;③充分利用已知背景场信息;④若模式和观测资料有偏差,要合理估计这些偏差,并在模拟值和观测资料值中减去偏差;⑤合理估计模式和观测资料的统计误差协方差特征;⑥在同化过程中加入在所关注大气尺度上成立的大气动力和物理限制条件;⑦确保计算误差和数据噪声被抑制;⑧计算速度和计算内存可承受;⑨定量估计并给出资料同化得到的大气状态变量分析场/的误差统计特征。总之,通过把各类观测资料与数值预报模式结合,大气资料同化得到在指定分辨率上的、在统计意义上“最优”的大气状态变量估计值。大气资料同化不只是求解一个单纯的数学逆问题。掌握观测物理量和天气系统及其误差结构等知识,对大气资料同化至关重要。当然,计算条件的约束也很重要。
1.2热力学变量和大气状态方程
大气状态是由三维空间的风速矢量v和数个热力学变量决定的。这一节,我们简要介绍以下一些热力学变量的定义:温度(D、气压&)、密度(p)、比容(a)、比湿(g)、水汽混合比(w)、位温(的、内能(M)、热焓(幻、等容热容(Ca)、等压热容(Cp)。不同形式的大气状态方程和热力学定律可以反映大气中不同热力学变量之间的一些约束关系。
地球大气可以近似为理想大气,大气内分子间的相互作用可以忽略。即使一个气团作为整体在某个时间是静止的,气团内的分子却不停地向四面八方运动着,分子运动的动能之和决定了该气团的温度。理想气体温度定义为(Bohren和Albrecht,1998)
其中,mm是单个分子质量,是第i个分子运动速度,k是玻尔兹曼常数,表示对气团内所有分子求和的平均算子。