第2章一些常用的非参数估计方法简介
为了研究连续时间金融模型的统计推断问题,我们先回顾一下独立同分布场合下概率密度及其泛函有关的非参数估计方法。
通常来说,一个典型的统计推断过程由五个步骤构成:假定分布族、抽样、计算统计量和抽样分布、进行估计和检验、评价模型。假定分布族是对实际问题的数学描述,它是统计推断的基础。样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值,这样推断问题就转化为对分布族若干个未知参数的推断问题,用样本对这些参数做出估计或者进行某种形式的假设检验,这类推断方法称为参数方法。然而在许多实际问题中,人们往往对总体的分布形式知之甚少,很难对总体的分布形式和统计模型做出明确的假定。比如,人为控制因素不多情况下的大部分经济和社会问题,数据的分布形式和数据之问的关系常常是不能任意假定,最多只能对总体的分布做出类似于连续型分布或者关于某点对称等一般性的假定。这种不假定总体分布的具体形式,尽量从数据(或样本)本身获得所需要的信息,通过推断方法而获得结构关系,并逐步建立对事物的数学描述和统计模型的方法称为非参数方法。
非参数统计学是统计学中的一个重要分支,相对于参数统计而言,非参数统计有以下两个突出的特点:
首先,非参数统计方法对总体分布的假定相对较少,因而有广泛的适用性,推断结果一般有较好的稳健性,即不会产生由于总体分布的一些变化而导致的大的结论性错误。在经典的统计框架中,正态分布一直是最引人注目的,但如果模型通不过正态性检验,样本量不足固然是一个可能的原因,但另外一个潜在的原因则是模型假定本身存在问题。如果是后者,那么就可能通过改变方法,不是盲目地增加样本量而达到分析目的。
其次,非参数统计可以处理所有类型的数据。我们知道,统计数据按照数据类型可以分为两大类:定性数据(包括类别数据和顺序数据)、定量数据(包括等距数据和比例数据)。拿检验来说,一般而言,参数统计主要针对后一类定量数据,如果所收集到的数据不符合参数统计模型的假定,比如:数据只有顺序,没有大小,则很多参数模型无能为力,此时只能尝试非参数方法。即便对于定量数据而言,应用参数统计推断也未必都有理想的结果,如果将这些数据转化为顺序数据,用非参数方法分析,甚至可能获得更好的结果。
当然,非参数方法也有一些缺点,如果人们对总体有充分的了解且足以确定其分布类型,非参数方法就不如参数方法具有更强的针对性,有效性可能会差一些。另外,非参数统计方法在小样本的时候,可能涉及更多不常见的统计分布表,因而会给一些使用者带来不便。然而后面这个问题并非本质,因为大多数统计软件中都有现成的函数可以方便计算这些分布,网络上也有内嵌式函数模块,供用户使用。
本章主要介绍回归函数和密度函数的非参数估计方法。回归模型是数理统计中发展较早、理论丰富、应用性强的重要模型。20世纪70年代以前主要研究的是参数回归模型,由于参数回归模型对回归函数提供了大量信息,因此当我们假设的模型与实际情况相符合时,模型所做出的推断结果有较高精度,反之模型所做出的推断可能就很差。为此,人们寻找到一种新的模型:非参数回归模型。非参数回归的研究始于20世纪70年代,由于模型中回归函数的形式可以是任意的,因此非参数回归模型在实际问题中有广泛应用。
……
展开