第一篇 空间抽样原理
第3章 三明治空问抽样模型
简单随机空间抽样和空间系统抽样方法考虑了空间对象的自相关性,因此克服了传统抽样方法在处理地理相关对象时遇到的问题(Cochran,1946;Dunn andHarrison,1993;Griffith,2005;Haining,1988;Rodriguez-Iturbe,1974)。空间异质性是空间对象的另一个特征,在抽样中通过分层的方法解决空间异质性带来的问题。在后验精度地理资源调查中,空间异质性特征也被广泛利用(刘纪远等,2005;http://www.spss.com/statistics),也有部分学者研究空间异质表面的先验精度抽样(Griffith,2005;Hainin9,1988)。在对空间异质对象调查时,如果最终抽样结果需要在多个报告单元进行统计推断,那么抽样费用将急剧增加。例如,调查需要在中国2700多个县级行政区内分别得到结果,那么每个行政区都必须要布置样本,也就是说,抽样的样本个数和报告单元的个数成正比。在流行病学调查中有这样的问题,例如,在癌症调查中,对癌症的统计是根据统计报告单元进行的但是,导致癌症的环境风险因素并不一定和统计报告单元吻合,因此为了更好地对癌症进行流行病学分析,需要更加灵活的抽样调查和统计方法。
3.1 问题定义
下面就将介绍能够解决上述问题,并且能在多个领域应用的三明治空间抽样模型(Wang et al.,2002)。我们将以全国县级人口调查案例解释说明三明治空间抽样模型。假如我们调查全国2700多个县的人口,要求抽样相对误差不超过5%,那么需要多少个样本。或者在调查费用已知条件下,根据能够调查的样本个数,最后抽样结果能达到什么精度。图3.1是三明治空间抽样模型的框架结构,它由报告层、知识层和样本层三层结构组成,所以叫做“三明治空间抽样模型”。
在三明治空间抽样模型中,首先,为了消除对象空间异质特性,将研究区域划分为多个分区,这些分区组成了知识层。其次,根据用户对抽样精度要求计算所有层总的抽样样本量,并按照分层抽样样本分配理论,将样本分配到每个知识层。在用户调查得到样本值以后,计算每个知识层的样本均值和方差。最后,将知识层的均值和方差传递到报告层中得到每个报告层的均值和方差。三明治空间抽样模型完成了样本层、知识层和报告层的信息和误差传递。
展开