第1章预备知识
本章介绍本书后面各章节用到的一些随机变量收敛定义、记号以及它们之间的关系,若干基本判别准则定义以及其他定理和不等式。
1.1随机变量收敛性
考虑随机变量序列和随机变量X。下面分别介绍几种收敛定义:依分布收敛、依概率收敛、几乎处处收敛、完全收敛以及r阶矩收敛。
定义1.1(依分布收敛)记Xn的分布函数为Fn,X的分布函数为F。如果对于F的任意连续点x,极限均成立,则称随机变量序列Xn依分布收敛或弱收敛于随机变量X,记作。
定义1.2(依概率收敛)如果对于任意ε>0,均成立,则称随机变量序列Xn依概率收敛于随机变量X,记作。
定义1.3(几乎处处收敛)如果
则称随机变量序列Xn几乎处处收敛于随机变量X,记作。
定义1.4(完全收敛)如果对于任意。
则称随机变量序列Xn完全收敛于随机变量X,记作。
定义1.5(r阶矩收敛)设r>0,如果
则称随机变量序列Xn以r阶矩收敛于随机变量X,记作Xn时,也称为均方收敛。
上述收敛满足如下递推关系:
对于随机变量序列Xn和常数集合an,如果Xn/an依概率收敛于0,则记。
如果Xn/an随机有界(即对于任意ε>0,存在有限M>0和有限N>0,使得对于任意n>N,有,则记。
1.2基本判别准则
本节介绍在非参数函数估计中常用的若干基本判别准则。记未知函数为f(x),给定一组独立同分布样本后,假设计算得到未知函数估计为。由偏差和方差的定义可知,的偏差和方差分别为
需要引入指标来评估估计的质量。对于任一固定的x,可将f(x)视为待估参数θ,常用的评价指标是均方误差。
定义1.6(均方误差)对于未知的参数θ,其估计.θ的均方误差(mean squared error,MSE)定义为。
通过简单证明可得,估计量的均方误差等于估计量的方差与偏差平方之和。对于未知函数估计,在单点x处估计函数.fn(x)的均方误差可写成如下形式:
均方误差反映了在点x处,估计与f(x)的平均偏离程度。
从单点出发,进一步考虑全局的情况。下面分别介绍积分平方误差(integrated squared error,ISE)和平均积分平方误差(mean integrated squared error,MISE)。
定义1.7(积分平方误差)对于未知的函数,其估计的积分平方误差定义为
定义1.8(平均积分平方误差)对于未知的函数,其估计的平均积分平方误差定义为。
平均积分平方误差反映了密度估计与在整个定义域上的全部平均偏离程度。给出性能评估指标后,就可以通过比较各估计对应的指标数值来选择更优的估计。
1.3定理和不等式
本节列出一些在后续章节中常用的定理和不等式。
引理1.1(Borel-Cantelli引理)考虑随机事件序列,记。
(1)如果
(2)如果
下面介绍经典中心极限定理及收敛速度定理。
定理1.1(中心极限定理)设是一个独立同分布的随机变量序列,如果,则对于任意实数,有。
其中,Φ为标准正态随机变量的累积分布函数。
定理1.2(Esseen定理)设F(x)和G(x)分别是R1上的有界不减和有界变差函数,且。记。
那么对任意正数T,当时有
其中,为仅与b有关的正常数,可取为方程的根。
定理1.3(Berry-Esseen不等式)设是一个独立随机变量序列。那么存在正常数A,使得。
下面列出若干不等式,方便后续使用时进行查阅。
(1)马尔科夫(Markov)不等式:若X是非负随机变量,则对于任意。
(2)切比雪夫(Chebyshev)不等式:对于随机变量,则对于任意。
(3)赫尔德(H.lder)不等式:对于随机变量X和Y,若并且
(4)柯西–施瓦茨(Cauchy-Schwarz)不等式:对于随机变量X和Y。
(5)闵可夫斯基(Minkowski)不等式:对于随机变量X和Y,若p>1,则。
(6)詹森(Jensen)不等式:对于随机变量X,设g是凸函数,则。
第2章非参数密度估计
本章主要讨论随机变量的密度函数f(x)的估计问题,即给定一组独立同分布的样本,如何估计f(x)概率密度函数是统计学中的核心概念之一,可以通过密度函数得到对应随机变量的分布情况,同时可以解决很多实际问题,如参数估计、假设检验等。由于对密度函数的信息知之甚少,只能假设其为满足一定光滑条件的一个未知函数f(x),因而需要借助非参数密度估计方法估计f(x)。本章将介绍一元随机变量的非参数密度估计的直方图方法、光滑的核估计方法,多元随机变量的核密度估计,以及这些估计的大样本性质和相关技术。
2.1简单的一元密度估计
随机变量的概率密度函数(probabilitydensity function,PDF)是其累积分布函数(cumulative distribution function,CDF)的一阶导数,因此可以考虑通过估计分布函数F(x)的一阶导数来估计密度函数f(x)。随机变量的分布函数的一个简单且有效的估计是其经验分布函数。
定义2.1(经验分布函数)给定一组独立同分布的样本,则其经验分布函数定义为
其中,是示性函数。
通过简单证明可以知道,经验分布函数Fn(x)是F(x)的无偏估计。下面不加证明地给出经验分布函数的一些常用的渐近性质。
定理2.1(1)对于任意给定的;
(2)
(3)
(4)
展开