什么是合并时间序列?正如字面上所表达的,时间序列(在一个分析单位下规律出现的具有时间性的观测值)由横截面数据(在单独时间点上一个分析单位下的观测值)组成的一个数据集。这些分析单位可以是学校、健康组织、商业交易、城市、国家等。为什么需要进行“合并分析”呢?其中一个原因在于,当下研究者可以获得越来越多的相关横截面数据与时间序列数据。另外一个原因在于,将时间序列数据与横截面数据合并可以显著地扩大样本量,这使之前显得棘手的分析问题变为可能。
本书讨论使用同时包含横截面与时间序列的数据的回归分析。一个时间序列是一组数列,就一组变量X_t与X_(t+1)而言,观测值之间的距离是恒定且固定的(Ostrom, 1978)。一个横截面则是一个分析单位在特定时间点上所存在的一组变量(X_i … X_n)的全部观测值。当变量在一定时间跨度内在一定数量的不同横截面上被反复观测到时,我们可将这样产生的数据矩阵称为一个合并时间序列(pooled time series)。
归纳合并时间序列矩阵的特征有许多种方法。标准的方法是首先归纳横截面上的特征,然后再归纳时间序列上的特征。矩阵的形式被设定,这对于一个横截面内部随时间发生的变化较不同横截面之间产生的变化而言是次要的。
将横截面与时间序列用这样的方式组合在一起的主要好处是可以捕捉到不同单位在空间上的变化以及同一单位随时间产生的变化。因此,我们可以对结果以及产生结果的过程进行描述、分析以及假设检验。当时间序列的长度被缩减且/或横截面的样本量较小时,合并数据是应用性研究中一个特别有用的方法。通常来说,单变量时间序列对于常规时间序列技术而言显得太短了。许多时间序列方法要求至少30个时间点,而其它的一些方法要求更多。
本书的主要目的是向已具备有关线性模型、回归方法和单变量时间序列估计基本知识的读者介绍合并时间序列设计。首先,我们会检验合并时间序列的回归模型,然后再检验各种不同的回归估计技术。本书会穿插对合并时间序列设计进行应用的不同例子,这些例子来自社会科学和行为科学。本书的叙述形式将结合对合并时间序列问题的理论展示与具体应用。为了方便阅读与课堂教学,所有的章节将用大写字母(A、B、C)来表明困难程度。
……