第一部分 概 述
第1 章 人工智能基础 2
1. 1 人工智能 2
1. 1. 1 人工智能的由来 2
1. 1. 2 人工智能学科 3
1. 2 机器学习 6
1. 2. 1 机器学习简介 6
1. 2. 2 机器学习的类别 7
1. 2. 3 机器学习的应用 9
本章小结 10
第2 章 Python 环境搭建11
2. 1 软件的下载与安装 11
2. 1. 1 平台一:海龟编辑器 11
2. 1. 2 平台二: PyCharm 13
2. 2 必需库功能简介 20
2. 2. 1 numpy——基础科学计算库 20
2. 2. 2 SciPy——科学计算工具集 22
2. 2. 3 Pandas——数据分析利器 23
2. 2. 4 matplotlib——图形绘制法宝 26
IV 走进人工智能——机器学习原理解析与应用
2. 2. 5 Sklearn——机器学习神器 28
本章小结 30
第二部分 分 类
第3 章 K 近邻算法 33
3. 1 K 近邻算法的原理 33
3. 2 K 近邻算法的应用 37
3. 2. 1 K 近邻算法的常用参数 37
3. 2. 2 应用案例一:小说分类 37
3. 2. 3 应用案例二:糖尿病诊断 39
3. 3 K 近邻算法的特点 40
本章小结 41
第4 章 决策树 42
4. 1 决策树的原理 42
4. 1. 1 决策树的分类过程 42
4. 1. 2 决策树的具体组成 43
4. 1. 3 构建决策树的相关概念 44
4. 2 决策树的构建 47
4. 2. 1 建树 47
4. 2. 2 剪枝 49
4. 3 决策树的应用 50
4. 3. 1 环境补充搭建 50
4. 3. 2 决策树的常用参数 50
4. 3. 3 应用案例:影院会员观影喜好分析 51
4. 4 决策树的特点 53
本章小结 53
第5 章 随机森林 54
5. 1 随机森林的原理 54
5. 1. 1 集成学习 54
5. 1. 2 随机森林的分类过程 55
目录V
5. 2 随机森林的构建 57
5. 2. 1 训练样本随机采样 58
5. 2. 2 样本特征随机选择 59
5. 3 随机森林的应用 59
5. 3. 1 环境补充搭建 59
5. 3. 2 RandomForestClassifier 类 60
5. 3. 3 应用案例一:红酒分类——决策树与随机森林分类器效果对比 60
5. 3. 4 应用案例二:影院会员观影喜好分析 61
5. 4 随机森林的特点 67
本章小结 68
第6 章 支持向量机 69
6. 1 支持向量机的逻辑原理 69
6. 2 支持向量机的数学原理解析 71
6. 2. 1 线性可分的情况 71
6. 2. 2 近似线性可分的情况 73
6. 2. 3 线性不可分的情况 74
6. 3 支持向量机中的核函数 76
6. 3. 1 支持向量机中常用核函数介绍 77
6. 3. 2 支持向量机中核函数的应用 78
6. 4 支持向量机的应用 80
6. 4. 1 SVM 类的常用参数 80
6. 4. 2 应用案例:情绪分类 80
本章小结 84
第7 章 贝叶斯算法 85
7. 1 贝叶斯算法的原理 85
7. 1. 1 贝叶斯公式 85
7. 1. 2 贝叶斯算法的原理(以朴素贝叶斯算法为例) 89
7. 1. 3 贝叶斯算法的类别 90
7. 2 贝叶斯算法的应用 91
7. 2. 1 调用方法 91
7. 2. 2 应用案例:识别毒蘑菇 91
VI 走进人工智能——机器学习原理解析与应用
7. 3 贝叶斯算法的特点 93
本章小结 94
第三部分 回 归
第8 章 线性回归 97
8. 1 一元线性回归的原理 98
8. 2 一元线性回归的应用 100
8. 2. 1 LinearRegression 类的常用参数 100
8. 2. 2 应用案例:房屋翻修成本预测 101
8. 3 多元线性回归的原理 103
8. 4 多元线性回归的应用 105
8. 5 线性回归算法的特点 107
本章小结 108
第9 章 多项式回归 109
9. 1 一元多项式回归的原理 110
9. 2 一元多项式回归的应用 114
9. 2. 1 PolynomialFeatures 类的常用参数 114
9. 2. 2 应用案例:红酒价值预测 114
9. 3 多元多项式回归的原理 117
9. 4 多元多项式回归的应用 119
9. 5 多项式回归的特点 120
本章小结 120
第10 章 LASSO 回归与岭回归 122
10. 1 L1 范数正则化——LASSO 回归 123
10. 1. 1 LASSO 回归中的alpha 参数调节 125
10. 1. 2 LASSO 类的常用参数 125
10. 1. 3 应用案例:对糖尿病数据集进行拟合 126
10. 2 L2 范数正则化——岭回归 130
10. 2. 1 岭回归中的alpha 参数调节 131
10. 2. 2 Ridge 类的常用参数 132
目录VII
10. 2. 3 应用案例:对糖尿病数据集进行拟合 132
10. 3 LASSO 回归与岭回归的异同 137
10. 3. 1 LASSO 回归与岭回归的共同点 137
10. 3. 2 LASSO 回归与岭回归的区别 137
本章小结 137
第11 章 逻辑回归 138
11. 1 逻辑回归的原理 139
11. 2 逻辑回归的应用 143
11. 2. 1 逻辑回归算法的常用参数 143
11. 2. 2 应用案例:鸢尾花分类 144
11. 3 逻辑回归实现多分类的原理 145
11. 3. 1 OVR/A(One Vs Rest/All) 146
11. 3. 2 OVO(One Vs One) 147
11. 4 多分类逻辑回归的应用 148
11. 5 逻辑回归的特点 150
本章小结 150
第12 章 模型评估与优化 152
12. 1 交叉验证 152
12. 1. 1 K 折交叉验证的原理 154
12. 1. 2 交叉验证法的具体应用 155
12. 1. 3 留一交叉验证法 157
12. 2 分类模型的可信度评估 158
12. 2. 1 混淆矩阵 159
12. 2. 2 分类系统的评价指标 160
12. 2. 3 应用案例:识别乳腺癌 162
12. 3 回归模型的可信度评估 163
12. 3. 1 平均绝对误差 164
12. 3. 2 均方误差 164
12. 3. 3 均方根误差 165
12. 3. 4 R2 166
12. 3. 5 应用案例:波士顿房价预测 166
12. 4 超参数调优 168
VIII 走进人工智能——机器学习原理解析与应用
12. 4. 1 简单网格搜索来寻找超参数 168
12. 4. 2 与交叉验证结合的网格搜索 170
本章小结 172
第四部分 聚 类
第13 章 物以类聚:K 均值聚类 175
13. 1 K 均值算法的原理 175
13. 1. 1 K 均值算法的基本思想 176
13. 1. 2 算法基本过程 177
13. 2 K 均值算法的应用 178
13. 2. 1 KMeans 类的常用参数 178
13. 2. 2 应用案例一:鸢尾花的聚类 179
13. 2. 3 应用案例二:甜西瓜的由来(一) 181
13. 3 K 均值算法的特点 184
本章小结 184
第14 章 DBSCAN 聚类 185
14. 1 DBSCAN 算法的原理 186
14. 1. 1 DBSCAN 算法的核心概念 186
14. 1. 2 DBSCAN 算法的基本过程 187
14. 2 DBSCAN 算法的应用 189
14. 2. 1 DBSCAN 类的常用参数 189
14. 2. 2 应用案例一:小涛的问题 190
14. 2. 3 应用案例二:甜西瓜的由来(二) 191
14. 3 DBSCAN 算法的特点 193
本章小结 193
第五部分 关 联 分 析
第15 章 Apriori 算法 196
15. 1 Apriori 算法的原理 196
15. 1. 1 关联分析中的相关概念 196
目录IX
15. 1. 2 Apriori 算法的原理 197
15. 2 Apriori 算法的应用 201
15. 2. 1 Apriori 类的常用参数 201
15. 2. 2 应用案例一:货架调整 201
15. 2. 3 应用案例二:餐厅菜品 203
15. 3 Apriori 算法的特点 206
本章小结 206
第六部分 数据预处理
第16 章 数据归一与标准化 209
16. 1 数据归一化与标准化的必要性 209
16. 2 数据归一化 210
16. 2. 1 离差法过程 210
16. 2. 2 均值归一化过程 211
16. 2. 3 数据归一化的应用 211
16. 3 数据标准化 213
16. 3. 1 数据标准化过程 214
16. 3. 2 数据标准化的应用 214
16. 4 数据预处理实例 216
本章小结 219
第17 章 神奇的工具PCA 220
17. 1 PCA 算法的基本原理 221
17. 1. 1 PCA 的简单理解 221
17. 1. 2 向量投影与内积 222
17. 1. 3 PCA——选择最优的基 224
17. 1. 4 PCA 的基本过程 227
17. 2 PCA 算法的应用 229
17. 2. 1 PCA 类的常用参数 229
17. 2. 2 应用案例一:对鸢尾花进行PCA 降维 229
17. 3 PCA 算法的特点 231
本章小结 231
X 走进人工智能——机器学习原理解析与应用
第七部分 人工神经网络
第18 章 自主学习—— MLP 算法 234
18. 1 人工神经网络的发展简史 234
18. 2 单层感知机 236
18. 3 多层感知机 240
18. 3. 1 MLP 的基本原理 240
18. 3. 2 MLP 前向传播 242
18. 3. 3 MLP 后向传播 245
18. 3. 4 梯度下降 248
18. 4 MLP 算法的应用 253
18. 4. 1 MLPClassifier 类的常用参数 253
18. 4. 2 应用案例一:一起去游乐场 254
18. 4. 3 应用案例二:图片文字识别 256
18. 5 MLP 算法的特点 259
本章小结 259