本书首先向读者介绍了关联规则从研究背景与意义出发,着重向读者讲解负关联规则基本概念,研究负关联规则可能遇到的问题如矛盾规则问题、置信度设置问题、非频繁项集问题、多数据库挖掘问题和冗余规则处理问题等,以及为了解决以上问题所采取的措施(提出的算法),此外在每一种算法之后都会附有相关实验从而帮助读者更好的理解并使用相关算法。
目录
第1章关联规则挖掘概述1
1.1数据挖掘概述1
1.1.1数据挖掘的起源1
1.1.2数据挖掘的定义3
1.1.3数据挖掘的任务4
1.2关联规则挖掘7
1.2.1概述7
1.2.2主要算法8
1.2.3Apriori算法详解14
1.2.4由频繁项集产生关联规则19
小结20
第2章挖掘负关联规则的PNARC模型21
2.1负关联规则概述21
2.2正负关联规则相关性模型——PNARC模型23
2.2.1问题分析23
2.2.2负关联规则中支持度与置信度的计算24
2.2.3相关性在正负关联规则挖掘中的应用26
2.2.4PNARC算法29
2.3PNARC模型实验结果30
2.3.1示例数据31
2.3.2更多的实验结果32
小结40
第3章兴趣度在负关联规则中的应用研究41
3.1兴趣度在正关联规则中的应用概述41
3.2χ2检验在负关联规则中的应用研究46
3.2.1假设检验相关知识46
3.2.2χ2检验在负关联规则中的应用研究48
3.2.3算法设计52
3.2.4实验结果53
3.3相关系数在负关联规则中的应用研究55
3.4最小兴趣度在负关联规则中的应用研究57
3.4.1PS兴趣度相关问题讨论57
3.4.2算法设计58
3.4.3实验结果59
小结62
第4章多数据库中的负关联规则挖掘63
4.1多数据库中的正关联规则挖掘概述63
4.2多数据库中的负关联规则挖掘67
4.2.1挖掘合成规则67
4.2.2算法设计及实验68
4.3多数据库中挖掘负加权关联规则72
4.4基于PS兴趣度的多数据库中的负关联规则挖掘79
4.5多数据库中的例外关联规则挖掘82
小结86
第5章负时态关联规则挖掘87
5.1研究时态关联规则的必要性87
5.2两种典型的正时态关联规则挖掘模型88
5.2.1日历模型分析88
5.2.2商品生命周期模型分析90
5.3挖掘时态频繁项集算法91
5.3.1相关定义91
5.3.2GTFS算法设计92
5.3.3GTFS算法举例93
5.4负时态关联规则挖掘模型95
5.4.1相关定义95
5.4.2CTFS算法设计及CTP算法设计97
5.4.3CTP模型举例98
小结100
第6章非频繁项集挖掘技术101
6.1比例比率模型101
6.2两级支持度模型104
6.2.12LS算法设计104
6.2.22LS算法实验结果106
6.2.32LSP算法设计106
6.2.42LSP模型实验结果107
6.3多级最小支持度模型110
6.3.1MLMS模型中非频繁项集的定义110
6.3.2MLMS算法设计111
6.3.3实验结果112
6.4MLMS的兴趣度模型——IMLMS模型114
6.4.1项集的修剪方法114
6.4.2IMLMS算法设计116
6.4.3实验结果118
6.5多项支持度模型119
6.6用基本Apriori算法实现MIS模型124
6.6.1MSB_apriori算法124
6.6.2实验结果125
6.6.3MSB_apriori+算法127
6.6.4实验结果128
6.7扩展的多项支持度模型130
小结132
第7章负关联规则修剪技术的研究136
7.1正关联规则修剪的有关技术回顾136
7.2最小冗余的无损关联规则集表述141
7.2.1有关定义141
7.2.2无损规则集表述的推演142
7.3基于最小相关度的负关联规则修剪技术146
7.4基于多最小置信度的负关联规则修剪技术151
7.4.1多置信度的必要性分析152
7.4.2算法和实验结果155
7.5基于逻辑推理的负关联规则修剪技术158
小结165
第8章负频繁项集及其负关联规则挖掘166
8.1负频繁项集挖掘方法——eNFIS算法166
8.1.1负候选项集支持度计算方法166
8.1.2算法设计及实验结果167
8.2基于多支持度的负频繁项集挖掘算法——emsNFIS算法170
8.3负频繁项集中的负关联规则挖掘问题与对策172
小结175
第9章正负关联规则在大学校园数据分析中的应用176
9.1校园数据分析的意义176
9.2数据预处理177
9.2.1数据预处理简介177
9.2.2校园数据概述180
9.3基于关联规则的大学生心理健康数据分析183
9.3.1心理健康数据预处理183
9.3.2挖掘结果分析187
9.4学生一卡通消费行为与成绩间的关联分析190
9.4.1数据预处理190
9.4.2挖掘结果分析194
9.5图书借阅行为与成绩间的关联分析195
9.5.1数据预处理195
9.5.2挖掘结果分析197
9.6心理健康与成绩间的关联分析197
9.6.1数据预处理197
9.6.2挖掘结果分析199
9.7消费行为、图书借阅行为、心理健康与成绩间的关联分析200
9.7.1数据预处理200
9.7.2挖掘结果分析201
小结203
第10章正负关联规则在医疗数据分析中的应用204
10.1概述204
10.2医疗数据预处理206
10.2.1医疗数据特征206
10.2.2数据选择207
10.2.3数据规范化208
10.2.4数据归约209
10.3正负关联规则在心脑血管疾病分析中的应用210
10.4正负关联规则在糖尿病分析中的应用214
10.5正负关联规则在类风湿性关节炎中的应用217
小结220
缩略语表221
参考文献223