第1章 绪论
1.1 数据挖掘概述
1.2 数据挖掘的定义
1.2.1 数据挖掘的一般步骤
1.2.2 数据挖掘任务
1.3 数据挖掘的主要问题
1.3.1 数据挖掘算法的有效性和可扩展性
1.3.2 处理噪声和不完全数据
1.3.3 高维度数据
1.3.4 关系数据库和复杂数据类型的处理
1.3.5 异种数据库和全球信息系统挖掘信息
1.4 数据挖掘的应用
1.4.1 推荐系统
1.4.2 互联网风险控制
1.5 小结
1.6 参考文献
第2章 数据及数据集基本分析
2.1 数据对象与属性
2.1.1 属性的定义
2.1.2 定性属性
2.1.3 定量属性
2.2 数据与元数据
2.2.1 传统的元数据
2.2.2 元数据的类型
2.2.3 元数据的模式
2.3 结构化、非结构化和半结构化数据
2.3.1 结构化数据
2.3.2 非结构化数据
2.3.3 半结构化数据
2.4 数据集基本分析技术
2.4.1 频率和众数
2.4.2 百分位数
2.4.3 均值和中位数
2.4.4 极差和方差
2.4.5 多元数据统计
2.5 结构化数据集基本分析技术
2.5.1 鸢尾花数据集介绍
2.5.2 描述统计
2.6 文本数据集基本分析技术
2.6.1 20newsgroups数据集介绍
2.6.2 文本可视化
2.7 数据可视化技术
2.7.1 可视化数据变量之间的相关性
2.7.2 可视化数据变量值的分布情况
2.8 数据对象相似性与距离计算
2.8.1 数据对象的相似性定义
2.8.2 数据对象相似性的度量方法
2.9 大数据概述
2.9.1 大数据的兴起
2.9.2 大数据的特点
2.10 小结
2.11 练习题
2.12 参考文献
第3章 数据预处理
3.1 数据预处理概述
3.2 数据清洗
3.2.1 缺失值处理
3.2.2 异常点检测
3.2.3 异常点处理
3.2.4 重复数据处理
3.2.5 噪声处理
3.3 数据降维
3.3.1 数据降维概述
3.3.2 主成分分析降维
3.3.3 多维缩放降维
3.3.4 等度量映射降维
3.3.5 局部线性嵌入降维
……
第4章 分类基本算法
第5章 基于深度学习的分类算法
第6章 聚类分析
第7章 推荐系统
展开