《应用回归导论》:
每一种可能性均存在利弊。第一种调整方法简单地通过剔除奇异点而忽略这个问题,其主要的缺陷是减少了样本量以及丢失了其附加的信息。第二种调整方法保留了在第一个调整方法中可能丢失的信息,然而,让问题变得很麻烦的是,我们必须考虑同一个模型在实证上的两个版本。第三种调整方法仅仅使用一个方程,其保留了所有样本并且能够让奇异点更接近回归直线,然而,这样的结果可能会牺牲以原来的单位衡量时所可能具有的简单明了的解释。第四种调整方法可能揭示奇异点并不是非典型的个案,而是实际上拟合到一个更为一般的模式——可能是非线性。一个明显的限制是在非实验的社会科学研究中,我们不可能收集更多的观测。没有哪一种调整方法适合所有情况,相反,在决定如何处理一个奇异点的问题时,我们必须考虑研究的问题和特定的散点图所呈现的外观。
……
展开