搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
因果推断方法及其应用/统计与数据科学丛书
0.00     定价 ¥ 98.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787030821966
  • 作      者:
    作者:李伟|责编:李欣//李香叶|总主编:朱力行
  • 出 版 社 :
    科学出版社
  • 出版日期:
    2025.05
收藏
内容介绍
《因果推断方法及其应用》系统介绍了因果推断的方法及其应用,共八章。第1章重点阐述了潜在结果框架与结构因果模型,为《因果推断方法及其应用》内容奠定基础。第2章介绍了多种**因果推断的基本方法,包括倾向得分法、匹配法、回归法、双稳健估计法、工具变量法以及阴性对照法等。在此基础上,《因果推断方法及其应用》进一步深人探讨多个因果推断的前沿主题。第3章讨论了基于多模型整合的稳健估计方法,以应对模型不确定性带来的挑战。第4章聚焦于融合数据的因果推断,介绍如何整合来自多个数据源的信息以提升推断效率与准确性。第5章至第8章依次介绍了含死亡截断数据的因果推断、含缺失数据的因果中介分析、归因分析以及基于工具变量法的因果关系发现《因果推断方法及其应用》不仅注重因雜断施的讲解,还结合实际案例进行分析。
展开
精彩书摘
第1章因果推断框架及相关概念
  1.1从辛普森悖论谈起
  在统计学的漫长历史中,辛普森悖论以其*特的反直觉的特性,为我们揭示了数据背后的复杂性与局限性.本节将从历史上对相关性的初步探索出发,通过辛普森悖论的具体数值例子,引出对因果推断的讨论.
  早在19世纪末,英国统计学家弗朗西斯 高尔顿(Francis Galton)就开始了对人类身髙遗传规律的研究.他通过对大量父子身髙的观察与统计,发现了身高在代际间传递的规律性,并*次提出了“回归效应”的概念,即后代的身高有向总人口平均身高回归的趋势.这一发现不仅揭示了遗传与环境的相互作用,也为后续统计学中相关性的研究奠定了基础.随后,卡尔 皮尔逊(Karl Pearson)在1895年提出了“相关系数”,这一指标成为衡量两个变量之间线性相关程度的重要工具.相关系数的引入,使得我们能够更准确地量化变量间的关系,为统计分析提供了强大的工具.
  然而,即便在相关性分析日益成熟的今天,我们仍可能遭遇辛普森悖论这一统计学的“陷阱”.辛普森悖论指出,在某些情况下,单*观察每个子群体时得出的结论,与将这些子群体合并后得出的整体结论可能截然相反.以下是一个具体的数值例子来说明辛普森悖论.
  假设我们研究两家医院(医院A和医院针对某种疾病的治疗效果,以存活率作为评价指标.表1.1显示,相对整体数据而言,医院A的存活率为40%(800人存活,1200人死亡),而医院B的存活率为50%(1000人存活,1000人死亡).这似乎表明医院B的治疗效果优于医院A.然而,当我们进一步根据病情的严重程度细分数据时,情况却发生了逆转.在重症患者中,医院A的存活率为30%(450人存活,1050人死亡),而医院B仅为20%(100人存活,400人死亡在非重症患者中,医院A的存活率为70%(350人存活,150人死亡),医院B则为60%(900人存活,600人死亡:).因此,在考虑了病情的严重程度这一背景变量后,我们发现医院A在重症和非重症患者的治疗上都表现得更好.
  这个例子就是辛普森悖论的一个典型案例:单*观察每个子群体(重症和非重症患者)时,医院A的治疗效果优于医院B;但将子群体合并后,医院B的整体存活率却看似更高.上面的例子是人工构造的,现实中也存在不少辛普森悸论的例子.美国加利福尼亚大学伯克利分校的著名统计学家Peter Bickel教授在1975年汾fence杂志上发表的研究[13],揭示了一个著名的辛普森悖论实例.该实例涉及加州大学伯克利分校研究生院在录取学生时可能存在的性别偏见问题.具体来说,Bickel教授发现,当单*分析各个院系时,女性申请者的录取率接近甚至在某些院系高于男性申请者的.然而,当汇总全校的录取数据时,却呈现出女性整体录取率显著低于男性的现象.具体数据信息见表1.2.
  辛普森悖论的出现,提醒我们在进行统计分析时必须谨慎考虑背景变量或混杂因素的影响.它揭示了数据背后的复杂性和潜在的误导性,使得我们不能仅仅依靠相关性来推断因果关系.例如,在研究吸烟与肺癌的关系时,我们不能仅凭吸烟与肺癌之间的相关性就断定吸烟是导致肺癌的原因.这是因为可能存在一系列未观测的变量,如遗传特性、环境因素(如暴露于其他致癌物质)、生活习惯(如饮食习惯、运动水平)以及社会经济状况等,这些变量可能同时影响个体的吸烟倾向和患癌风险.比如,某些基因变异可能增加个体对尼古丁的依赖性和对肺癌的易感性.这些基因变异不仅影响了个体的吸烟倾向,还可能直接影响其细胞对致癌物质的反应,从而增加患癌风险.因此,即便吸烟对肺癌没有因果作用,吸烟与肺癌之间也会相关.因果推断是确定一个事件或因素是否导致另一个事件或因素发生的方法.为了进行有效的因果推断,我们需要给出合理的假定、采用更为严谨的研究设计和方法.
  1.2因果推断的基本框架
  潜在结果框架和结构因果模型是现代因果推断领域的两种主要方法.它们分别从不同的角度描述因果关系,目标都是揭示变量间的因果联系并提供对因果效应的估计.下面我们分别介绍这两种方法.
  1.2.1潜在结果框架
  潜在结果框架(Potential Outcomes Framework)由Donald Rubin在20世纪70年代提出是因果推断中的一个重要工具,用来定义和量化因果效应.该框架通过潜在结果来描述个体在不同处理条件下可能的结果,从而能明确地定义处理变量对结果变量的因果效应.
  对于个体i,用表示处理或干预变量,用X表示感兴趣的结果变量.我们这里考虑二值变量1,处理状态取1,对照状态取0(可相应推广至多值处理变量每个个体i在两种状态下有两个潜在结果:Yi(l)表示当个体i接受处理时的结果,(0)表示当个体i接受对照时的结果.这些潜在结果代表了个体在接受处理和未接受处理时的结果,因此在理论上,它们是固定的、反映了个体的属性或特征.潜在结果定义的提出需要以下稳定个体处理值假设(Stable Unit Treatment Value Assumption,SUTVA).
  假设1.2.1(稳定个体处理值假设)对任意个体i,其潜在结果蝴不随其他个体的处理而变化,且在同一处理水平的情况下,个体i的潜在结果只有一个明确的结果.
  稳定个体处理值假设表明每一个体的结果不受其他个体处理的影响,这个假设在很多科学问题中是合理的,例如,对一块土地施肥不会影响其他土地的产量;张三服用阿司匹林,不会降低李四的体温.但是在一些社会学研究中,由于个体间存在干涉,这个假定可能不成立,例如,给某个人颁奖,不仅促进他自己的工作,也许会影响到周围人的积极性.SUTVA还蕴含了对一个个体施加相同水平的处理,只能得到一个潜在结果,即潜在结果是个体i和处理值t的函数或随机变量,例如,考虑抽烟对肺癌的作用,t=1表示抽烟,t=0表示不抽烟,那么稳定个体处理值假设要求只能有一个结果,而不管个体i的抽烟量是一天一根还是两根.当然,实际上不同抽烟量下的潜在结果不同,如果定义处理A为抽烟量,SUTVA更容易满足,但该假设是不可用观测数据进行检验的.在因果推断研究中,我们一般还需要因果一致性(Consistency)假设建立观测结果和潜在结果的联系.
  假设1.2.2(—致性假设)如果有).
  在一致性假设下,对于二值的处理T“实际观测到的结果K与处理状态相关,其表达式为
  因此,对于每个个体,在给定处理状态下只能观测到或中的一个,另一个结果则是潜在的,且无法被观测到.这种反事实(Counterfactual)思维是Rubin潜在结果框架的核心.例如,在表1.3中,I=1表示个体接受了处理,我们只能观测到的结果,而是未知的;类似地,Ti=Q表示个体未接受处理,我们只能观测到)的结果,而是未知的.
  对于个体i,处理的因果效应定义为X(l)-Fi(0),这表示处理与未处理之间的结果差异.由于我们无法同时观测到和K(0),个体因果效应通常无法直接估计.因此,我们更关注总体层面的平均处理效应(Average Treatment Effect,ATE)或平均因果作用.为简便记号,将省略变量的下标L我们用t表示平均处理效应,它通常被定义为
  其中表示期望值.我们可以看到,ATE量化了在总体上处理对结果的平均影响.
  在随机化试验中,由于处理是随机分配的,处理组和对照组的差异可以完全归因于处理本身.这意味着
  即潜在结果7⑴和Y(0)与处理分配T是*立的.因此,随机化试验消除了混杂因素的影响,使得因果效应的估计更加可信,我们有
  这说明我们可以通过计算处理组和对照组的平均观测结果,来估计总体的因果效应.假如表1.3中的数据来自一种新药对患者健康影响的随机化试验研究.患者被随机分为两组:一组接受药物(处理组);另一组不接受药物(对照组).
  在这个表格中,患者1、3、5接受了药物,而患者2、4未接受药物.那么,处理组的平均结果;对照组的平均结果.因此,ATE的估计值为8.33-4.5=3.83.这表明,平均来看,接受药物的患者比未接受药物的患者健康状况增加了3.83个单位
  1.2.2结构因果模型
  结构因果模型(Structural Causal Model,SCM)的概念和方法是由Pearl提出的[13t),132].Pearl是计算机科学和统计学领域的著名学者,他通过将因果图与结构方程模型相结合,发展出了一套系统的因果推断方法,通常被称为结构因果模型.一个典型的结构因果模型由三部分组成:变量集合XUX2, ,Xp表示系统中的所有变量;有向无环图(Directed Acyclic Graph,DAG)表示变量之间的因果关系;结构方程用数学形式描述每个变量如何生成.我们接下来分别介绍有向无环图和结构方程.
  有向无环图(DAG)是一种用于表示变量之间因果关系的图形结构.在DAG中,每个节点代表一个变量,箭头表示从一个变量到另一个变量的因果影响.DAG是有向的,即每条边都有一个方向,并且是无环的,即不存在一个从某个节点出发,沿着箭头回到该节点的路径,它有如下关键特性.
  有向:边有方向,通常表示因果关系的方向.箭头指向结果变量,箭头的起点是原因变量.
  无环:DAG中不存在任何闭环,也就是说不存在一个变量既是其自身的结果又是其原因.
  图:由节点和有向边组成,用图形方式表示变量之间的依赖关系.
  在有向无环图中,父节点是指指向某一节点的节点,也就是因果关系中原因的角色.如果在DAG中存在一条从节点Xi指向节点Xj的边),则节点Xi是节点Xj的父节点,而节点Xj是节点Xi的子节点.一个节点的祖先节点是通过有向边可以追溯到的所有上游节点.一个节点的后代节点是通过有向边可以到达的所有下游节点.例如,假设我们有三个变量:X!表示吸烟;X2表示焦油沉积;X3表示肺癌.如果吸烟导致焦油沉积,焦油沉积导致肺癌,则该因果关系可以用DAG表示如下:
  在上面的例子中,Xi是X3的祖先节点,X2也是X3的祖先节点,是和X2的后代节点.从因果关系的角度看,因果路径是从一个变量沿箭头方向到另一个变量的路径.例如,在Xi4x24X3中,Xi到x3存在因果路径.并非所有的路径都是因果路径,一些路径可能仅代表变量之间的关联.例如,如果同时影响x2和x3,但x2和x3没有边,这会导致x2和x3之间存在关联路径,但不是因果路径.
  在结构因果模型中,每个变量都由其直接原因决定,并通过以下结构方程表示:
  其中,是的直接原因,即父节点;是一个描述变量生成过程的函数;
  是未观测因素或噪声(外生变量),与*立.在结构因果模型中,联合分布可以根据因果图的结构进行分解.在DAG中,变量只依赖于它的父节点),所以我们可以利用这些依赖关系简化联合分布的分解:
  这表明,联合分布可以分解为每个变量在其父节点条件下的概率分布的乘积.这种分解方式是基于因果图的局部条件*立性假设的:给定父节点,节点与其非后代节点条件*立.
  在上面的例子中,我们可以通过以下结构方程描述:吸烟是外生的,定义为;焦油沉积x2由吸烟决定:肺癌由焦油沉积决定.其中,是噪声项,代表未观测到的外部因素对每个变量的影响.根据因果图的结构,联合分布可以分解为
  这表示每个变量只依赖于它的父节点,而不依赖于其他无关变量.
  结构因果模型可以用于推断干预的因果效应.干预指的是外部强制改变某个变量的值,并观察其他变量的变化.干预通过算子进行建模,表示将变量固定为某个特定值,并切断对的其他影响,这样会改变系统中其他变量的联合分布.干预后的联合分布可以表示为
  其中表示示性函数.例如,当我们干预吸烟变量时,相当于对系统进行强制处理:do.这相当于用常数A取代结构方程中的则干预后的联合分布为
  这里我们认为干预后A不再是随机变量,而是一个固定值使
展开
目录
目录
“统计与数据科学丛书”序
前言
第1章 因果推断框架及相关概念 1
1.1 从辛普森悖论谈起 1
1.2 因果推断的基本框架 3
1.2.1 潜在结果框架 3
1.2.2 结构因果模型 5
1.2.3 两种框架关系的讨论 7
1.3 研究挑战 7
第2章 因果推断的基本方法 10
2.1 倾向得分法 10
2.1.1 倾向得分模型 11
2.1.2 逆概率加权估计 12
2.2 匹配法 13
2.2.1 度量 14
2.2.2 匹配 15
2.2.3 评估 15
2.2.4 分析 16
2.3 回归法 17
2.3.1 结果回归法 17
2.3.2 Pearl后门准则 18
2.4 双稳健估计法 19
2.5 工具变量法 21
2.5.1 工具变量简介 22
2.5.2 线性模型的工具变量估计 24
2.5.3 非参可加模型的工具变量估计 25
2.5.4 单调性假设下的工具变量估计 26
2.6 阴性对照法 27
2.6.1 阴性对照变量简介 27
2.6.2 平均处理效应的识别与估计 29
2.7 应用实例 31
2.7.1 就业培训对收入的影响 31
2.7.2 教育对收入的影响 33
2.7.3 右心导管插入术对重症患者死亡率的影响 34
2.8 本章小结 35
第3章 基于多模型的稳健估计 37
3.1 基于多模型的估计方法简介 37
3.2 整合多模型的因果效应估计 38
3.2.1 倾向得分的模型混合估计 39
3.2.2 结果回归的模型混合估计 40
3.2.3 基于模型混合的双稳健估计量 40
3.2.4 数值模拟 42
3.3 整合多模型的数据融合分析 44
3.3.1 模型假设与识别性 45
3.3.2 基于模型校准的加权估计量 46
3.3.3 数值模拟 50
3.4 应用实例 51
3.5 本章小结 53
第4章 基于融合数据的因果推断 54
4.1 融合随机化试验的因果迁移学习 54
4.1.1 参数定义及识别性 55
4.1.2 估计方法 56
4.2 数据融合中的混杂变量调整 57
4.2.1 关心的因果参数和识别性 58
4.2.2 三稳健估计量 60
4.2.3 数值模拟 62
4.3 数据融合中的工具变量法 63
4.3.1因果参数的定义和识别 64
4.3.2 多稳健估计 66
4.3.3 其他半参数估计量 69
4.4 应用实例 70
4.4.1 身体活动对医疗保健支出的影响 70
4.4.2 吸烟对身体功能状态的影响 71
4.5 本章小结 73
第5章 含死亡截断数据的因果推断 74
5.1 因果主分层简介 74
5.2 多臂试验中含死亡截断结果的因果推断 77
5.2.1 感兴趣的因果参数及识别性 78
5.2.2 估计方法 81
5.2.3 数值模拟 82
5.3 观察性研究中含死亡截断结果的因果推断 83
5.3.1 阴性对照变量与排除性假设 84
5.3.2存活组因果效应的识别(二值情况) 85
5.3.3 存活组因果效应的识别(一般情况) 87
5.3.4 估计方法 88
5.4 应用实例 89
5.4.1 幼鼠发育毒理学试验 89
5.4.2 白血病干细胞移植 91
5.5 本章小结 92
第6章 含缺失数据的因果中介分析 94
6.1 因果中介分析简介 95
6.1.1 因果中介作用的定义和识别 95
6.1.2 因果中介效应的估计和推断方法 97
6.2 结果变量数据缺失的中介分析 98
6.2.1 离散结果变量的识别 100
6.2.2 连续结果变量的识别 101
6.2.3 估计和推断方法 102
6.3 协变量数据缺失的中介分析 103
6.3.1 协变量非随机缺失时的非参数估计方法 105
6.3.2 大样本性质和推断 107
6.4 应用实例 109
6.4.1 阿尔茨海默病干预效果的临床抗精神病试验研究 109
6.4.2 工作满意度和抑郁症的关系 110
6.5 本章小结 112
第7章 归因分析 113
7.1 单个原因和单个结果的归因分析 114
7.1.1 原因的概率:定义 114
7.1.2 原因的概率:识别与应用 117
7.2 多个原因和单个结果的归因分析 120
7.2.1 后验因果效应:定义 120
7.2.2 后验因果效应:识别 123
7.3 多个原因和多个结果的归因分析 126
7.3.1 多元后验因果效应:定义 126
7.3.2 多元后验因果效应:识别 130
7.4 应用实例 134
7.4.1 高血压患者发病原因分析 134
7.4.2 儿童急性淋巴细胞白血病发病原因分析 136
7.4.3 感冒还是心绞痛? 139
7.4.4 呼吸道病症诊断与归因 141
7.5本章小结 143
第8章 基于工具变量法的因果关系发现 144
8.1 因果关系发现简介 145
8.2 基于工具变量的双向因果关系推断 147
8.2.1 含未知混杂的双向因果关系模型 148
8.2.2 因果作用和因果方向的识别 149
8.2.3 估计及理论保证 154
8.3 基于工具变量的因果结构学习 156
8.3.1 含工具变量的因果网络模型 157
8.3.2 因果图和因果效应的识别 158
8.3.3 估计及理论保证 163
8.4 应用实例 166
8.4.1 BMI与血压的关系研究 166
8.4.2 阿尔茨海默病基因调控网络研究 167
8.5 本章小结 169
参考文献 170
“统计与数据科学丛书”已出版书目 183
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证