本书全面介绍了数据挖掘与商业智能的基本概念与原理,包括经典理论与趋势发展,并深入叙述了各种数据挖掘的技术与典型应用。通过本书的学习,读者可以对数据挖掘与商业智能的整体结构、概念、原理、技术和发展有深入的了解和认识。本书以Microsoft SQL Server 2014(适用于2012)的数据挖掘模块进行介绍,让读者可以很快地通过书中的说明与范例,在最短的时间内就能上手。本书分为四个部分:第一部分介绍数据仓库、数据挖掘与商业智能之间的关系。第二部分对Microsoft SQL Server的整体架构进行了介绍,并详细阐述了直接与数据挖掘相关的两个服务:分析服务和报表服务。第三部分逐一阐述了Microsoft SQL Server中包含的九种数据挖掘模型。第四部分提供了四个数据挖掘的案例以及数据挖掘模型的评估,通过模仿练习,读者可获得实际的数据挖掘经验,稍加修改就能在自己所处的领域中加以应用。
PART I 数据仓库、数据挖掘与商业智能Chapter 1 绪论 2
1-1 商业智能 3
1-2 数据挖掘 7
Chapter 2 数据仓库 9
2-1 数据仓库定义 10
2-2 数据仓库特性 10
2-3 数据仓库架构 11
2-4 创建数据仓库的目的 12
2-5 数据仓库的运用 14
2-6 数据仓库的管理 14
Chapter 3 数据挖掘简介 16
3-1 数据挖掘的定义 17
3-2 数据挖掘的重要性 17
3-3 数据挖掘的功能 17
3-4 数据挖掘的步骤 18
3-5 数据挖掘建模的标准CRISP-DM 19
3-6 数据挖掘的应用 21
3-7 数据挖掘软件介绍 22
Chapter 4 数据挖掘的主要方法 24
4-1 回归分析 25
4-2 关联规则 27
4-3 聚类分析 27
4-4 判别分析 29
4-5 神经网络 29
4-6 决策树 31
4-7 其他分析方法 32
Chapter 5 数据挖掘与相关领域的关系 34
5-1 数据挖掘与统计分析 35
5-2 数据挖掘与数据仓库 35
5-3 数据挖掘与KDD 36
5-4 数据挖掘与OLAP 37
5-5 数据挖掘与机器学习 37
5-6 数据挖掘与Web数据挖掘 38PART II Microsoft SQL Server概述Chapter 6 Microsoft SQL Server中的商业智能 40
6-1 Microsoft SQL Server入门 41
6-2 关系数据仓库 41
6-3 SQL Server 2008 R2概述 42
6-4 SQL Server 2008 R2技术 43
6-5 SQL Server 2008 R2新增功能 45
Chapter 7 Microsoft SQL Server中的数据挖掘功能 46
7-1 创建商业智能应用程序 47
7-2 Microsoft SQL Server数据挖掘功能的优势 48
7-3 Microsoft SQL Server数据挖掘算法 50
7-4 Microsoft SQL Server可扩展性 51
7-5 Microsoft SQL Server是数据挖掘与商业智能的结合 51
7-6 使用数据挖掘可以解决的问题 52
Chapter 8 Microsoft SQL Server的分析服务(Analysis Services) 56
8-1 创建多维数据集的结构 57
8-2 建立和部署多维数据集 58
8-3 从模板创建自定义的数据库 58
8-4 统一维度模型 59
8-5 基于属性的维度 59
8-6 维度类型 60
8-7 量度组和数据视图 61
8-8 计算效率 62
8-9 MDX脚本 62
8-10 存储过程 63
8-11 关键绩效指标(KPI) 64
8-12 实时商业智能 64
Chapter 9 Microsoft SQL Server的报表服务(Reporting Services) 66
9-1 为何使用报表服务 67
9-2 报表服务的功能 67
Chapter 10 Microsoft SQL Server的整合服务 71
10-1 SSIS介绍 72
10-2 操作示例 79
Chapter 11 Microsoft SQL Server的DMX语言 100
11-1 DMX语言介绍 101
11-2 DMX函数 102
11-3 DMX语法 107
11-4 DMX操作实例 115PART III Microsoft SQL Server中的数据挖掘模型Chapter 12 决策树模型 122
12-1 基本概念 123
12-2 决策树与判别函数 123
12-3 计算方法 124
12-4 操作范例 126
Chapter 13 贝叶斯分类器 134
13-1 基本概念 135
13-2 操作范例 137
Chapter 14 关联规则 147
14-1 基本概念 148
14-2 关联规则的种类 149
14-3 关联规则的算法:Apriori算法 149
14-4 操作范例 150
Chapter 15 聚类分析 160
15-1 基本概念 161
15-2 层级聚类法与动态聚类法 161
15-3 操作范例 166
Chapter 16 时序聚类 176
16-1 基本概念 177
16-2 主要算法 177
16-3 操作示例 179
Chapter 17 线性回归模型 187
17-1 基本概念 188
17-2 一元回归模型 189
17-3 多元回归模型 192
17-4 操作范例 195
Chapter 18 逻辑回归模型 203
18-1 基本概念 204
18-2 logit变换与logistic分布 204
18-3 逻辑回归模型 206
18-4 操作范例 207
Chapter 19 人工神经网络模型 215
19-1 基本概念 216
19-2 神经网络模型的特点 217
19-3 神经网络模型的优劣比较 218
19-4 操作范例 220
Chapter 20 时序模型 228
20-1 基本概念 229
20-2 时序的构成 231
20-3 简单时序的预测 237
20-4 包含趋势与季节成份的时序预测 238
20-5 参数化的时序预测模型 240
20-6 操作范例 243PART IV Microsoft SQL Server数据挖掘应用实例Chapter 21 决策树模型实例 253
Chapter 22 逻辑回归模型实例 260
22-1 回归模型实例一 261
22-2 回归模型实例二 266
22-3 回归模型实例三 270
Chapter 23 神经网络模型实例 275
23-1 神经网络模型实例一 276
23-2 神经网络模型实例二 281
Chapter 24 时序模型实例 292
24-1 时序模型实例一 293
24-2 时序模型实例二 297
Chapter 25 如何评估数据挖掘模型 303
25-1 评估图节点介绍 Evaluation Chart Node 304
25-2 在SQL Server中如何评估模型 307
25-3 规则度量:支持度与可信度 311