减少单变量Tobit模型设定偏误,得到一致的和渐近正态的、且具有较好小样本表现的估计量是微观计量经济学方法论研究的重要领域;双变量Tobit模型一直缺乏计算上可行的、至少满足一致性的估计量。目前文献中已有的估计量存在一些缺陷。为此,《Tobit模型的半参数和非参数估计》首先基于受限因变量条件生存函数,构造单变量Tobit模型非参数或半参数估计量,与前人构造的估计量相比,其对误差项具有较弱约束限制,但有较好的小样本表现;其次构造双变量Tobit模型一致的和渐近正态的半参数估量,得到该模型的一个可行性估计,克服最大似然估计量和Amemiya估计量的缺陷;再次构造Tobit模型一致的渐近正态的非参数估计量;最后设计模拟实验,对上述各估计量进行模拟,并与文献中相关估计量进行比较。
第一章
Tobit模型估计概述及准备知识
自Tobin于1958年具开创性地对居民耐用品消费支出计量模型进行研究之后,Tobit模型的估计问题一直是微观计量经济学的重要研究领域。20世纪80年代之前,此类模型基本上被设定为扰动项服从某种已知分布(如正态分布)的参数模型,然后由最大似然方法或二阶段最小二乘法对模型中的参数进行估计。但是,Aramazar和Schmidt(1982)的研究结果表明,扰动项正态性的假定对于Tobit模型的一致性估计是至关重要的;当模型设定产生偏误且扰动项不服从正态分布时,基于最大似然或二阶段最小二乘法的参数估计是不一致的,其估计结果和统计推断可能会对经济分析产生错误导向。
本章以具有固定归并点的归并(或删失)数据回归模型(censoredregressionmodel)以及相应的截断数据回归模型(truncatedregressionmodel)为例,回顾较早期文献对它们的参数和半参数估计方法;然后引入本书所用方法,并给出本书估计方法(主要是半参数估计)研究的相关准备知识,主要是关于经验过程和U统计量分解的相关概念和定理。
假设真实的数据生成过程为
(1.1)
其中,x是k维列向量;β0是k维参数向量。但实际观察到的数据为yi,xi:i=1,2,,n,其中,
(1.2)
即y*i只在大于0的时候才能被观察,所有小于0的观测值都被归并到0这一点,称yi为归并因变量。当归并点不为0时,可以通过被解释变量的一个平移变换得到模型(1.1)和模型(1.2)。
如果y*i和xi都只在y*i>0的时候才能被观察,则得到截断数据回归模型,此时的实际观测数据为yi,xi:i=1,2,,n0,其中,yi>0表示截断因变量,而n0表示y*i可观测的样本数量。归并数据回归模型比截断数据回归模型包含更多的数据信息,表现在两个方面:第一,截断数据回归模型并不知道被截断的数据量有多少,即它只能观察到n0个样本而不能观察n个全样本;第二,对于y*i≤0的样本,归并数据回归模型仍可观察到xi的值,而截断数据回归模型则丢失了这部分信息。因此,截断数据回归模型的估计方法均可用于归并数据回归模型的估计;反之不然。但是,如果能对归并数据回归模型新增的数据信息加以利用,应能得到参数更优的估计。归并数据回归模型和截断数据回归模型是经典Tobit模型的两个主要类型。
假设模型y*i=x′iβ0+ui满足GaussMarkov基本假定的要求。我们感兴趣的是参数向量β0的估计,即x对潜变量y*i的边际影响的估计。现在的问题是,y*i不被观察,我们仅可观察到yi。故从数据可得性上看,我们不可以由y*i关于xi的回归得到β0的估计,而应由可观察的yi出发,探讨β0的估计。
Tobit模型的半参数和非参数估计第一章Tobit模型估计概述及准备知识对于归并因变量y来说,其条件数学期望是
E[y|x]=P[y>0|x]E[y|y>0,x]
=P[u>-x′β0|x]E[x′β0+u|u>-x′β0,x]
=1-Fu|x(-x′β0)x′β0+∫∞-x′β0tfu|x(t)dt
其中,Fu|x(t)是扰动项u的条件分布函数;fu|x(t)是相应的条件密度函数。可见,利用这种归并(censored)的数据,将y关于x回归得到的普通最小二乘(ordinaryleastsquares,OLS)估计量β^OLS不是参数β0的一致性估计。同样,对于截断因变量来说,其条件数学期望是
E[y|x]=E[y|y>0,x]
=E[x′β0+u|u>-x′β0,x]=x′β0+∫∞-x′β0tfu|x(t)dt
可见,利用这种截断(truncated)数据,将y关于x回归存在遗漏变量问题,从而OLS估计量β^OLS不是参数β0的一致性估计。
Tobit模型(1.1)和模型(1.2)的传统估计方法为参数的最大似然估计方法(Amemiya,1973)以及基于似然函数(likelihoodbased)的其他一些参数方法(Heckman,1979)。这些方法假设扰动项服从某个具体的参数分布,然后由最大似然估计方法估计。例如,在扰动项ui服从正态分布N(0,σ2)之下,归并数据模型(1.1)和模型(1.2)的似然目标函数是
其中,di=1{yi>0}是反映被解释变量观察值没有被归并的结果的示性函数,而第一项反映了被解释变量被归并时其似然值对似然目标函数的贡献;()和Φ()分别表示标准正态分布的密度函数和累积分布函数。参数(β0,σ2)的最大似然估计量是由上述目标函数最大化问题的一阶条件求解得到的(需迭代算法求解)。
二步法估计使用可观察变量yi的条件期望:
首先,由di≡1{yi>0}关于xi作Probit估计得β0/σ的估计α^,其对应的似然函数是;记和。其次,将yi(包括0观察点)关于Φixi和i作回归得β0和σ的估计β^和σ^。
可以证明,当扰动项分布设定正确,且具有条件同方差时,最大似然估计量(maximumlikelihoodestimator,MLE)和二步法估计量具有一致性和渐近正态性。但是,这些良好的性质依赖于对扰动项分布的正确设定。如果设定不正确,MLE一般是不一致的(AramazarandSchmidt,1982)。另外,如果扰动项的条件异方差被忽略,那么即使其分布被正确设定,参数最大似然方法也会得到不一致的估计(MaddalaandNelson,1975)。这些结论激发了人们对Tobit模型的半参数估计方法的研究,以寻求更稳健的估计量。本章所指的半参数方法是指在保留回归方程的线性形式(参数部分)的同时,放松对扰动项分布的参数设定,允许扰动项服从某个未知分布(非参数部分),只要这个分布满足一定的正则条件即可。这些正则条件一般只对分布的光滑性以及矩的存在性做出要求,可包含一大类分布,当然包括正态分布。由于不需要对扰动项的具体分布进行人为设定,因此半参数估计量的性质对于扰动项的不同分布是稳健的。
第一节早期的半参数估计量
早期的Tobit模型半参数估计方法主要包括Miller(1976)、Buckley和James(1979)及Koul等(1981),它们的核心都在于对OLS估计进行修正,以适用于归并数据回归模型的估计。这三种方法均针对随机归并模型而提出,其中Koul等(1981)的估计方法涉及归并点变量的随机分布,不能直接应用于具有固定归并点的模型(1.1)和模型(1.2),因此本节只简述前两种方法。
在此之前,有必要对归并数据下分布函数的乘积限估计量(productlimitestimator)作一介绍。假设{V1,V2,,Vn}是随机变量V的一个随机样本,V的密度函数和分布函数分别为gv和Gv,但实际可观测的是一个归并样本{W1,W2,,Wn},其中,Wi=maxVi,ci,ci是已知常数。现在希望用归并样本{W1,W2,,Wn}构造gv和Gv的估计量。如果{V1,V2,,Vn}可以被观测,则gv的一个直观估计是
gnv=1n,v=Vi;i=1,2,,n0,其他
即用一个离散分布去逼近真实分布,并赋予每个样本点以相同的概率质量(probabilitymass)。此时,如果记V(1)≤V(2)≤≤V(n)为{V1,V2,,Vn}所对应的顺序统计量,且令V(0)=-∞和V(n+1)=+∞,那么G(v)的估计量为
但是,当某些样本点被归并时,仍然赋予这些样本点以1/n的概率质量显然是不妥当的。乘积限估计的思想在于把这些被归并的样本点的概率质量平均分配给比它小的所有样本点,这是因为,当样本点Vi被归并而观察值为Wi=ci时,我们只知道Vi≤Wi=ci,但并不知道Vi的具体数值,因此Vi有可能等于满足Wjci},δi=1表示第i个样本没有被归并。相应地,记δ(i)≡1{W(i)=V(i)}为W(i)所对应的δ值,则归纳可证,G(v)的乘积限估计量为
(1.3)
Kaplan和Meier(1958)证明了乘积限估计量G^(v)是分布函数G(v)在归并数据下的非参数MLE,且可以通过解方程
(1.4)
得到。方程(1.4)称为自一致性(selfconsistency)方程。Efron(1967)证明方程(1.4)有且仅有唯一解[式(1.3)]。
现在回到归并数据回归模型(1.1)和模型(1.2)。先看Miller(1976)的估计。Miller方法的思想在于对线性回归模型OLS估计的目标函数进行修正以适用于归并数据回归模型。Miller(1976)指出,分布函数的乘积限估计量[式(1.3)]可用于归并数据回归模型的半参数估计。假定Eui=0,否则令其均值α0≡Eui作为常数与原来模型中的截距项合并至回归函数中。如果{y*i}可以被观测,我们可以通过最小化
得到β0的OLS估计量,其中,,u(i)β是{uiβ}对应的顺序统计量。但在归并数据回归模型中,我们只能观测到以及,即{uiβ}的一个归并样本。因此,很自然的一个思路是把上述OLS估计量目标函数中的Gnu;β替换成乘积限估计量:
其中,di=1{yi>0};d(i)是e(i)β所对应的d值,再通过最小化
(1.5)
得到β0的估计,这就是Miller(1976)提出的估计量。如果所有的观测值都没有发生归并,即所得的数据为随机样本,则对所有i=1,2,,n都有di=1,从而,Miller估计量退化为OLS估计量。注意到目标函数(1.5)对β不连续,因此微分方法不可用。Miller(1976)建议用迭代方法求解β0的估计β^,即
直到收敛为止。初始的β^0可以选用非归并数据yi对xi作回归的OLS估计。
与Miller方法不同,Buckley和James(1979)通过修正正规方程组(目标函数的一阶条件)来构造归并数据模型的半参数估计量。在归并数据回归模型中,由于Eyixi≠x′iβ0,因此不能直接解最小二乘(leastsquare,LS)正规方程组来估计模型中的未知参数β0。但是,如果用潜在因变量y*i的期望值替代被归并的观测值yi=0,即定义
则有
从而正规方程组
的解可以作为未知参数β0的合理估计,即
(1.6)
因为,xi未知,所以需要用迭代方法得到参数β0的可行性估计。假设β0的第k步估计为β^k,由于
我们先用
作为Ey*iy*i≤0,xi的估计,其中,ejβ^k≡yj-x′jβ^k;G^u;β是式(1.3)所定义的乘积限估计量;g^j是按G^u;β分配给第j个样本点的概率质量。然后,用y~iβ^k≡diyi+1-diy^iβ^k代替正规方程组或式(1.6)中的y~i,得到第k+1步的估计:
初始估计可使用非归并数据样本yi对xi作回归的OLS估计。
Miller和Halpern(1982)通过数值模拟比较了Miller(1976)、Buckley和James(1979)及Koul等(1981)的估计量,发现在这三种估计量中,BuckleyJames估计量的小样本表现最好。James和Smith(1984)证明了BuckleyJames估计量的弱一致性(即估计量依概率收敛于真正参数)。Lai和Ying(1991)对BuckleyJames估计量进行了改良,克服了乘积限估计量在下尾处的不稳定性,并证明了改良后的BuckleyJames估计量的一致性和渐近正态性。
Miller估计量和BuckleyJames估计量都可以推广到截断数据以及双边归并(doublycensored)数据情形,只需把估计量构造过程中出现的乘积限估计相应地置换成LyndenBell估计(Tsuietal.,1988)和Turnbull(1974)的分布估计即可。
第二节CLAD估计量和STLS估计量
Miller估计量和BuckleyJames估计量的一致性和渐近正态性没有完
……