搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
社会统计方法与技术
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    7801905571
  • 作      者:
    (美)戴维.K.希尔德兰德(David K.Hildebrand),(美)加德曼.R.爱沃森(Gudmund R.Iversen),(美)约翰.H.奥尔德里奇(John H.Aldrich)等著
  • 出 版 社 :
    社会科学文献出版社
  • 出版日期:
    2005
收藏
内容介绍
  《社会科学定量分析丛书》是美国萨基出版社专为社会科学界从事定量分析的研究人员编撰的一套专著,其中每一部的作者都是相关领域的专家。这部丛书对世界社会科学界影响颇大,已被翻译成多国文字。本书从中选择了9部,定名为《社会统计方法与技术》,由上下篇组成,已飨读者。
  社会调查数据以定序和定量者居多。因此,《社会统计方法与技术》着重介绍了定序和定量数据的处理和统计方法。学习并掌握本书的全部内容,不仅使读者能正确熟练地应用很多统计方法,提高我国的社会定量分析水平,而且为进一步学习其他的社会统计技术铺平了道路。
展开
精彩书摘
  定类变量
  由一组类别组成的,表示一个潜在特性的不同表现的定类尺度。理想状态下,就某个属性而言,分配到某个类别的个体都具有某种同一性。把民主党派和共和党派相混合在“独立党派人士”分类中,将向我们传达关于他们政治行为的错误信息。另外,分类也必须是互斥的(每个个案只能属于一个类别)和完整的。
  定类变量的分类可以由调查者根据其需要按任何顺序排列。正如我们看到的,对表1各列的重新排序不会丢失任何信息。相反,定序变量的分类具有某种隐含的次序:他们量度的不仅有性质上的而且有分量上的差异。比如社会地位变量的类别为(低,中,高),那么它就不能再按别的顺序来组织,如(中,低,高),否则就有可能丢失某些信息。定类变量和定序变量都属于类别变量,它们之间的差异在于定序变量的尺度包含了组间的次序关系,而定类变量则不具有这种性质。
  定类变量量表可以量度真实的离散现象,比如种族或性别,但是在大多数情况它们大概表现了某种量度误差,因为其代表的潜特质或多或少表示某种定量的特质。例如,态度通常不是简单地进行正面地或反面的回答,人们总是保持他们不同程度的赞同倾向。因此,态度可以被认为是一个连续的集合,从坚定的同意到不确定,再到坚定的反对。在态度这个问题上,不能因为量度的难度而把这个潜含的丰富信息模糊化。
  特别要注意,类别的数量和性质对于做出正确推理是至关重要的。在社会学和政治学的研究中,一个最大的错误就是将回答混合成很少几个类别。或许是为了方便起见,或许是因为人人如此,对数据进行二分(即把人们归类为成非此即彼)的做法从来都是错误的,不管使用了何种统计技术,粗劣的量度数据肯定会产生错误严重的结论。
  因变量与自变量
  大多数社会科学家认为一个人的党派认同,通常在其青年期逐渐形成,部分地决定他或她的政治偏好。在这种意义上讲,1980年的选举将由选民的政党派别决定。一个变量,依赖于另一个变量,或者由另一个变量所引起,或者暂时跟随另一个变量的变化而变化,我们称其为“因变量”。顺其自然的,这个原因变量被称为“自变量”。自变量在某一水平上的变化将引起因变量相应的变化,但是反过来,因变量的改变不会对自变量产生影响。
  本书描述的一些方法只有当研究者对因变量有清楚的定义时,才可以适用。虽然其他的方法没有对因果依赖关系做出假定,但也应该仔细思考变量间存在的因果关系。把一个变量人为指定为因变量或是自变量,在某些场合是适当的,没有任何公式不允许这么做——但是由此产生的结果却很有可能是错误的。
  当然,这些决定只是表现了我们对数据的假设,因为不太可能证明一个变量是另一个变量的原因。
  类别的数目
  既然定类变量通常被编组成二维或多维的表格(分别如表1和表22),在这种方式下,每个单元格包含了尽可能多的个案。其后果是:包含许多个零的交叉类别表看起来不那么可靠和有足够的表达力,这是很容易理解的。合并某些类别以提高单元格的频次尽管能够解决这个问题,但是毫无疑问也产生了其他一些问题。这有两个原因:
  第一,该定类变量的变异,部分地依赖于该变量的类别数目;在其他变量保持不变的情况下,该变量的类别越多,变异越大。这里,“变异”指个案间的量度差异。如果全部样本都属于一个类别,那么就不存在离差或变异;另一方面,如果它们或多或少分布在几个类别中,那么该变量就存在较大的变异。把人们按党派分成民主党派,共和党派,以及独立党派,比起更为精确的“坚定的民主党派”,是一种较为简单的类别方式,但是存在较少的变异。在回归分析中,变异的数量,特别是自变量的变异数量,部分地影响相关量度值。
  第二,合并或减少类别的数目会严重影响观察到的相互关系。例如,假定一个研究者有三个变量,各分成五个类别。为了简化结果的表达,他决定把每个变量都合并成两个类别。然而,在使用相同的变量,样本和同样的统计方法的情况下,从二分数据(dichotomized data)得来的统计分析的结果,将不同于从没有经过合并的变量得到的分析结果。具体研究中,往往会在2×2×2的交叉分类表中发现相关关系,而在5×5×5的交叉分类表中并不存在这种关系。
  该教训也相当简单:尽可能的保持原有的类别,在没有充分的理由时,在没有经过证明重新分类不会影响实质性结论时,不要将变量变成二分或者三分变量。
  ……
展开
目录
上篇
一 定类数据分析
1 介绍
1.1 预备知识
1.2 定类变量的分析
2 卡方检验
2.1 卡方检验的解释
3 相关的量度
3.1 介绍
3.2  2×2表格的相关量度
3.3  I×J表格的相关量度法
3.4 相关量度的比较
4 多元数据分析的介绍
4.1 定类变量的因果分析
5 结论
注 释
参考文献
二 定序数据分析
简 介
1 定序量度
1.1 定序变量分析的三个问题
2 单个观测值的二元预测
2.1 总体和样本
2.2 已知自变量状态的预测
2.3 自变量状态未知的预测
2.4 V8量度
2.5 象限量度:专门应用于定序变量
2.6 科恩Kappa(Cohens Kappa):另一种量度
2.7 定序变量预测的灵敏度分析:可靠性(信度)评估
3 成对观测值的二元预测
3.1 计算合并的定序数据
3.2 对合并定序表格的预测
3.3 合并表格的概率形式
3.4 合并定序形式的灵敏度分析
3.5 排除所有同分的预测域
3.6 排除一个变量的同分的预测域
3.7 从预测域去掉一个单元格而非一行或一列
3.8 不同预测域的比较
3.9 一致和不一致:回顾
3.10 再次标准化:肯德尔τc(Kendalls τc)
3.1l 肯德尔τ2b(Kendalls τ2b):合并表格的混合预测方法以及与
定量变量预测的类似之处
4 定量,定类和定序变量的联合预测
4.1 定量变量
4.2 定类变量和扩展形式
5 多元分析
5.1 建立三元合并表
5.2 模仿二元预测的三元预测
5.3 多元
5.4 部分
6 计算方法和统计推论
6.1 计算机软件
6.2 统计推论
6.3 小结
注 释
参考文献
三 方差分析
1 导论
2 一维方差分析:所有类别
2.1 两组比较
2.2 两组以上
3 二维方差分析,所有类别
3.1 不相关的解释变量
3.2 相关的解释变量
3.3 特殊主题
4 方差分析,定类样本
4.1 一维分析
4.2 两个解释变量
5 其他模型
5.1 混合模型(Mixed Models)
5.2 三个解释变量
5.3 拉丁方设计
5.4 嵌套设计(Nested Designs)
5.5 方差分析与回归分析
6 结论
6.1 回顾
6.2 其他论题
参考文献
四 关联的量度
1 导论
2 离散数据的抽样分布
2.1 二项分布和多项分布
2.2 列联表
3 定类数据关联的量度
3.1 以卡方统计值为基础的量度
3.1.1 皮尔逊(PEARSON)均方列联系数
3.1.2 皮尔逊(PEARSON)列联系数与斯科达(SAKODA)的修正
3.1.3 楚普洛夫(TSCHUPROW)列联系数
3.1.4 克莱姆(CRAMER)列联系数
3.2 消减预测误差比例的量度系数
3.2.1 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)λ系数
3.2.2 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)τ系数
3.3 一致性的量度
3.3.1 科恩(COHEN)κ系数与加权κ系数
3.3.2 科尔曼一莱特(COLEMAN-LIGHT)条件一致性量度系数
3.4 针对2 × 2列联表的特定量度系数
3.4.1 以交叉乘积比为基础的量度系数
3.4.2 以相关系数为基础的量度系数
4 量度连续(定距)数据的相关
4.1 皮尔逊(PEARSON)积矩相关系数
4.2 肯德尔(KENDALL)T系数
4.3 斯皮尔曼(SPEARMAN)秩相关系数29
5 量度定序数据的关联
5.1 初步
5.2 肯德尔(KENDALL)τb系数
5.3 与肯德尔(KENDALL)τb系数有关的量度系数
5.3.1 肯德尔一斯图尔特(KENDALL-STUART)τC系数
5.3.2 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)γ系数
5.3.3 萨默斯(SOMERS)d系数
5.3.4 威尔逊(WILSON)e系数
5.3.5 总结
5.4 其他量度系数
6 选择适当的量度系数
7 相关与因果联系
注释
参考文献
五 多重回归的应用

导言
1 多元回归模型:复习
2 设定错误
2.1 设定错误导致的后果
2.2 设定错误举例:生活满意度
2.3 发现和处理设定错误
3 量度误差
3.1 量度误差的后果
3.2 量度误差举例:生活满意度
3.3 发现量度误差
3.4 处理量度误差
4 多元共线性
4.1 多元共线性的后果
4.2 发现高度多元共线性
4.3 多元共线性举例:生活满意度
4.4 处理多元共线性
5 非线性和不可加性
5.1 发现非线性和不可加性
5.2 处理非线性
5.3 处理不可加性
5.4 非线性和不可加性模型的注意事项
6 异方差和自相关
6.1 出现异方差和自相关的原因
6.2 异方差和自相关导致的后果
6.3 发现异方差
6.4 异方差举例:收入和租房
6.5 处理异方差和自相关
7 结束语
注 释
参考文献
下篇
一 线性概率模型、对数概率模型和正态概率模型
丛书编辑引言
1 线性概率模型
……
2 非线性概率模型的设定
3 二项应变量正态概率模型和对数概率模型的估计
4 最小卡方估计和多项模型
5 总结和扩展
注 释
参考文献
二 回归的解释与应用
丛书编辑导言
l 导论
2 基础回归理论与社会科学实践
3 回归估计的统计性质
4 回归系数的抽样分布
5 选择一种设定
6 变量的重要性
7 结论
附录对回归一致性结果的证明
注 释
参考文献
三 时间序列分析:回归技术
1 导论
2 时间序列回归分析:非滞后的情况
3 其他备择的时变过程
4 时间序列回归分析:滞后的情况
5 预测
6 总结
附录防卫支出数据(单位:10亿美元)
注 释
参考文献
四 事件史分析法——用于纵向数据的回归分析法
丛书编辑序
l 导论
2 离散时间事件史数据分析法
3 连续时间数据的参数分析法
4 比例风险模型和部分似然估计
5 多类事件史的数据估计分析法
6 重复事件分析法
7 状态变化情况下的事件史分析法
8 结论
附录A 最大似然和部分似然
附录B  GLIM、SAS和BMDP程序实例清单
附录C 计算机程序
注 释
参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证