第1章 导论与预备知识 1
1.1 数据分析的研究对象 1
1.2 向量空间 3
1.3 范数 7
1.4 内积空间 9
1.5 线性变换 12
1.6 特征值与特征向量 16
1.7 正交补空间和保范变换 23
1.8 多维随机变量 26
1.8.1 随机向量的分布和独立性 26
1.8.2 随机向量的数字特征 28
1.8.3 多维正态分布 29
1.9 多元统计量及抽样分布 36
1.9.1 总体、样本和统计量 36
1.9.2 估计量的评价标准 38
1.9.3 常用的多元抽样分布 41
拓展阅读建议 44
第1章习题 44
第2章 方差分析 46
2.1 单变量的均值检验 46
2.2 单变量的方差分析 49
2.3 多元均值检验 54
2.4 多元方差分析 59
2.5 协方差矩阵相等的检验 62
2.6 MATLAB方差分析工具 64
拓展阅读建议 67
第2章习题 68
第3章 关于总体分布的检验和独立性检验 69
3.1 拟合优度检验 69
3.1.1 多项分布的中心极限定理 69
3.1.2 拟合优度检验 71
3.1.3 理论分布中含有未知参数的拟合优度检验 75
3.2 正态性检验 78
3.2.1 图示法 79
3.2.2 拟合优度检验 85
3.2.3 Kolmogorov-Smirnov检验 87
3.2.4 偏度和峰度 89
3.2.5 Jarque-Bera检验 91
3.3 独立性检验 92
3.3.1 引例 92
3.3.2 列联表分析 94
拓展阅读建议 96
第3章习题 96
第4章 奇异值分解 99
4.1 奇异值分解定理 99
4.2 几何解释 104
4.3 应用 106
4.3.1 矩阵的低秩逼近和数据压缩 106
4.3.2 超定线性方程组和矩阵的伪逆 112
拓展阅读建议 114
第4章习题 114
第5章 多元线性回归分析 116
5.1 线性回归模型 116
5.2 最小二乘估计 117
5.3 几何解释 123
5.4 偏相关系数 126
5.5 线性回归模型的推断及评价 134
5.6 实例 137
拓展阅读建议 140
第5章习题 140
第6章 主成分分析 142
6.1 概述 142
6.2 数学模型 143
6.3 主成分模型的解 144
6.4 主成分的性质 147
6.5 主成分分析的计算实现 150
6.6 实践中需要考虑的问题 154
6.6.1 适合用主成分法降维的数据 154
6.6.2 是否先对数据进行标准化处理 156
6.6.3 应该保留多少个主成分 156
6.7 实例 161
拓展阅读建议 164
第6章习题 164
第7章 因子分析 165
7.1 概述 165
7.2 数学模型 167
7.3 因子模型的参数估计 168
7.3.1 主成分法 169
7.3.2 主因子法 171
7.3.3 极大似然估计 173
7.3.4 三种参数估计法的比较 176
7.4 因子旋转 179
7.4.1 基本思想 179
7.4.2 因子旋转方法 180
7.4.3 应用实例 182
7.5 因子得分的估计 186
7.5.1 最小二乘法 186
7.5.2 加权最小二乘估计 187
7.5.3 回归法 188
7.5.4 因子正交旋转对因子得分的影响 189
7.5.5 应用实例 189
拓展阅读建议 193
第7章习题 193
第8章 聚类分析 195
8.1 概述 195
8.2 相似性度量 196
8.2.1 距离 196
8.2.2 相似系数 198
8.2.3 用MATLAB计算距离矩阵和不相似度矩阵 199
8.3 系统聚类法 201
8.3.1 常用的系统聚类法 201
8.3.2 系统聚类法的步骤 205
8.3.3 系统聚类的实现 208
8.3.4 系统聚类法的性质 212
8.4 K-均值聚类 213
8.4.1 基本思想与算法 213
8.4.2 MATLAB实现 214
8.5 聚类分析实践中常遇到的问题 216
8.5.1 变量的选取 216
8.5.2 确定类的个数 216
8.5.3 聚类结果的解释 218
拓展阅读建议 220
第8章习题 220
第9章 多维标度分析 221
9.1 概述 221
9.2 多维标度分析的古典解 222
9.2.1 基本概念 222
9.2.2 欧氏距离结构的充要条件 223
9.2.3 多维标度分析的古典解 227
9.2.4 计算实例 228
9.3 多维标度分析的古典解与主成分的联系 233
9.4 非度量多维标度分析 235
9.4.1 概念及原理 235
9.4.2 实现 238
拓展阅读建议 241
第9章习题 241
第10章 判别分析和逻辑回归分析 243
10.1 概述 243
10.2 两个总体的判别分析 244
10.2.1 判别模型 244
10.2.2 正态总体的平均错判成本最小判别法 245
10.2.3 应用实例 247
10.3 多个总体的判别分析 253
10.3.1 后验概率和Bayes公式 253
10.3.2 Bayes判别法 254
10.3.3 平均错判成本最小判别法 255
10.3.4 计算实例 257
10.4 Fisher线性判别分析 262
10.4.1 基本思想 262
10.4.2 Fisher线性判别函数 263
10.4.3 计算实例 266
10.4.4 MATLAB的判别分析函数 270
10.5 逻辑回归模型 271
10.5.1 基本思想及数学模型 271
10.5.2 模型参数估计 272
10.5.3 利用逻辑回归模型分类 273
10.5.4 假设检验 274
10.5.5 应用实例 275
10.6 多分类的softmax回归模型 278
10.6.1 模型与参数估计方法 278
10.6.2 应用实例 279
拓展阅读建议 281
第10章习题 281
第11章 典型相关分析 284
11.1 概述 284
11.2 数学模型及求解 285
11.2.1 数学模型 285
11.2.2 模型求解 286
11.2.3 典型相关系数的显著性检验 289
11.3 MATLAB实现及应用实例 289
11.3.1 MATLAB实现 289
11.3.2 应用实例 293
拓展阅读建议 295
第11章习题 296
附录A 2分布、t分布和F分布 298