第1章 矩阵和贝叶斯理论基础
在水下成像和目标波达角度(direction of arrival,DOA)估计中,涉及线性模型或方程的求解,因此相关理论必然用到线性代数、矩阵运算等数学基础;信息采集系统具有不确定性,同时水下环境存在混响、噪声、声速*线弯*和多径干扰等标准声信号传播模型难以兼顾的因素,形成扰动导致求解偏差。另外,线性回归模型的解常常存在不唯一性,估计方法必须以某种准则为前提,以降低模型对扰动的敏感性,继而提高稳定性。*后,为了应用相关准则或引入先验信息,需要以贝叶斯理论为工具寻求求解思路。本章介绍本书将用到的矩阵运算、范数空间和贝叶斯理论相关数学基础,方便后续章节的理论阐述。
1.1 标量、矢量与矩阵计算法则
1.1.1 定义
定义1.1 令复标量 ,其中 表示M维复空间,则序列
(1.1)
定义为M维复矢量或复向量。其中,上角标T表示转置。需要强调,在本书中,矢量均指列矢量,表示行矢量时以矢量转置形式表达。
定义1.2 复数矩阵 表示为
(1.2)
其中, 为矩阵A中第i行、第j列位置的元素, , 。可见,矩阵可以用N个M维矢量表示,并以aj指代矩阵A中第j列矢量。
注意,在本书中,以小写斜体字母指代标量,如a、b、x;以小写斜体加粗字母指代矢量或向量,如a、x;以大写斜体加粗字母指代矩阵,如A。在矩阵符号算子的规定上,上角标H表示共轭转置,因此对于实数矩阵 ,AT = AH;矩阵A的行列式表示为det(A)或|A|;对于可逆阵,以A1表示矩阵A的逆矩阵,以A表示矩阵A的伪逆矩阵;矩阵的秩表示为rank(A)。
在贝叶斯推理中,常用到与矩阵求逆相关的两个广泛使用的重要结论,这里不加证明地给出。
引理1.1(矩阵求逆引理) 存在如下等式:
(1.3)
其中,矩阵 和 为可逆阵,矩阵 , 。
命题1.1(矩阵分块求逆法) 设矩阵 为N阶非奇异方阵,而且A的分块矩阵
(1.4)
中A11和A22分别为N1和N2阶非奇异阵,N = N1 + N2。则
(1.5)
此外,在以矩阵为基础的概率密度分布函数中,常常需要用到矩阵的迹,以tr(A)来表示矩阵A的迹。与之相关的性质包括
(1.6)
(1.7)
还常通过下述性质化简1-秩矩阵的迹为标量表达,即
(1.8)
其中,x和y均为N维矢量。
1.1.2 矩阵微分
在数学中,矩阵微分定义在特定的矩阵空间上,通过计算单个函数对多个变量的偏导数,或多元函数对单个变量的偏导数,其中往往将矢量或矩阵视为单个实体以简化运算。在随机过程中,矩阵微分法是计算*优估计量的**技能,尤其是高维度信号。典型的应用包括卡尔曼滤波、维纳滤波、期望*大化(expectation maximization,EM)算法等。
本节的内容包括实数域和复数域两部分。*先在实数域中,考虑一种基本情况,假设矢量 可以写成矢量 的函数,即
(1.9)
则y相对于x的一阶导数可以写成
(1.10)
该矩阵又称为函数或变换f的雅可比矩阵。注意到,两个矢量之间的导数为矩阵,当自变量x退化为标量时,输出导数为矢量;当因变量y退化为标量时,输出导数为行矢量。
以此为依据,容易给出一些常用的公式列表,如表1.1所示。
表1.1 常用公式1
表1.1中,多数等式可以根据式(1.10)直接证明,这里仅以下述等式为例给出证明过程。输出为标量的二次式为
(1.11)
写成展开式表达为
(1.12)
取对第k个元素xk的导数, ,得到
(1.13)
结果为
(1.14)
得证。
除了表1.1中所列项目之外,尚有一些有用的结论结合表1.1能够灵活处理我们遇到的矩阵求导问题。
结论1.1 假设矩阵A与矢量x和z均无关,有
(1.15)
(1)在矢量空间中也可以等效于矢量y和x的内积,若y和x均与矢量z有关,则
(1.16)
(2)通过式(1.11)来定义标量,其中x为矢量z的函数,A与z无关,则
(1.17)
类似地,以式(1.10)为基础,可以将矢量-矢量导数扩展到矩阵-标量的导数,写成
(1.18)
以此为基础,我们给出矩阵的逆矩阵-标量的求导公式如下:
(1.19)
对式(1.19)给出简单证明。可逆方阵A满足A1A = I,其中I为单位阵,在等式两侧分别对求导得到
(1.20)
整理得到式(1.19),得证。
下面考虑标量-矩阵求导方法。设f为矩阵X的标量函数,根据式(1.18)需要f对X逐元素求导并排列成与X尺寸相同的矩阵,称为定义法求导。显然,定义法求导的复杂性更高,实际应用中并不实用,而且没有用到求导的基本原则,即将自变量本身看成一个实体,无论是矢量还是矩阵。为了贯彻这种思路,先给出如下等式:
(1.21)
结合表1.2中的矩阵求导常用公式,能够完成绝大部分矩阵求导任务。
表1.2 常用公式2
*后考虑复数域矩阵求导方法。下面从复数标量情况入手,任何复数 及其共轭 可以表示为实部和虚部形式:
(1.22)
(1.23)
其中,j为虚数单位,即 。于是其实部 与虚部 可以分别表示为
(1.24)
(1.25)
结合式(1.22)~式(1.25)得到如下微分关系[1]:
(1.26)
(1.27)
(1.28)
(1.29)
从而得到(dz)* = dz*。考虑任意标量复函数 ,写成f(z, z*),即将z和z*视为两个复数变量,两个变量同时为实数x和y的函数,于是同理f也可以视为x和y的函数。于是f的微分可以表示为
(1.30)
将式(1.28)和式(1.29)代入式(1.30),得到
展开