译者序
前言
第1章 机器学习简介
1.1 机器学习的起源
1.2 机器学习的使用与滥用
1.2.1 机器学习的成功应用
1.2.2 机器学习的限制
1.2.3 机器学习的伦理方面
1.3 机器如何学习
1.3.1 数据存储
1.3.2 抽象化
1.3.3 一般化
1.3.4 评估
1.4 实践中的机器学习
1.4.1 输入数据的类型
1.4.2 机器学习算法的类型
1.4.3 为输入数据匹配算法
1.5 使用R进行机器学习
1.5.1 安装R添加包
1.5.2 载入和卸载R添加包
1.5.3 安装RStudio
1.6 总结
第2章 管理和理解数据
2.1 R数据结构
2.1.1 向量
2.1.2 因子
2.1.3 列表
2.1.4 数据框
2.1.5 矩阵和数组
2.2 用R管理数据
2.2.1 保存、载入和移除R数据结构
2.2.2 从CSV文件导入数据和将数据保存为CSV文件
2.3 探索和理解数据
2.3.1 探索数据的结构
2.3.2 探索数值变量
2.3.3 探索分类变量
2.3.4 探索变量之间的关系
2.4 总结
第3章 懒惰学习——使用近邻分类
3.1 理解近邻分类
3.1.1 k近邻算法
3.1.2 为什么k-NN算法是懒惰的
3.2 例子——用k-NN算法诊断乳腺癌
3.2.1 第1步——收集数据
3.2.2 第2步——探索和准备数据
3.2.3 第3步——基于数据训练模型
3.2.4 第4步——评估模型的性能
3.2.5 第5步——提高模型的性能
3.3 总结
第4章 概率学习——朴素贝叶斯分类
第5章 分而治之——应用决策树和规则进行分类
第6章 预测数值型数据——回归方法
第7章 黑箱方法—神经网络和支持向量机
第8章 探寻模式——基于关联规则的购物篮分析
第9章 寻找数据的分组——k均值聚类
第10章 模型性能的评估
第11章 提高模型的性能
第12章 其他机器学习主题
展开