(1)面板数据是指N个不同对象在T个不同时期被观测的数据,是可以控制某些类型的遗失变量。多元回归是控制变量的一种有力的工具,但它所要求的变量必须有全面的数据,如果得不到一些变量的数据,则某些遗失变量就不能包括在回归中,参数估计的最小二乘估计量就会存在估计偏差。比如研究因变量随时间的变化情况,面板数据就有可能消除那些在对象之间有差异但随时间不变的遗失变量的影响。
例如,考虑我国粮食生产的地区差异,用我国26个省份的1997~2003年这7年间每一年的粮食产量、播种面积、劳动力投入量、化肥投入量以及有关变量处理此问题。这个面板数据集允许某些遗失变量被控制,比如各地区气候状况的不同和土壤的质量不同,这些难以观测的变量在地区之间不同但不随时间变化。面板数据也允许那些随时间变化但在各地区不变的变量被控制,比如度量政府对于农业生产的扶持态度的变量等。
(2)面板数据集含有NxT个数据,能提供更多的数据信息和更大的自由度。既可以分析个体之间的差异情况,又可以描述个体的动态变化特征;既可以从不同角度反映已有数据的信息,又可以反映被遗失变量的信息。比如对上一例子,面板数据模型可以分析各省份粮食产量与其影响因素的动态发展关系,也可以分析各省份间粮食生产的异同关系,了解我国的粮食生产结构。
(3)面板数据模型提供了具有挑战性的模型方法,把研究对象划分为更多的类别,能更准确地估计模型参数,更准确地捕捉社会的复杂行为。由于面板数据具有双下标的形式,一方面能更好地代表来自不同个体和不同时点的数据信息;同时,其模型检验与估计也因此变得更加复杂。面板数据有时间和个体上的两个维度,根据维度上的不同效应,可以分为个体固定效应、个体随机效应、时间固定效应、时间随机效应和混合效应等模型形式,为了得到模型参数的最优估计量,每一种形式都有不同的假设和估计方法;面板数据除了每个截面序列存在序列自相关性外,截面与截面之间还存在空间相关性。
……
展开