第1章 机器学习和统计科学
1.1 机器学习的发展
1.2 编程语言与库
1.3 基本数学概念
1.3.1 统计学——不确定性建模的基本支柱
1.3.2 概率与随机变量
1.3.3 概率函数的统计度量
1.3.4 微分基础
1.3.5 预备知识
1.4 小结
第2章 学习过程
2.1 理解问题
2.2 数据集定义与检索
2.2.1 ETL过程
2.2.2 加载数据与使用Scipy和Pandas进行探索分析
2.2.3 与IPython交互
2.2.4 二维数据处理
2.3 特征工程
2.3.1 缺失数据估算
2.3.2 独热编码
2.4 数据预处理规范化和特征缩放
2.5 模型定义提出正确的问题
2.6 损失函数定义
2.7 模型拟合和评价数据集划分
2.8 模型应用与结果分析
2.8.1 回归指标
2.8.2 分类指标
2.8.3 聚类质量评估
2.9 小结
第3章 聚类
3.1 分组—— 一种人类行为
3.2 自动化聚类过程
3.3 寻找一个共同的中心—— K-means
3.3.1 K-means的优缺点
3.3.2 K-means算法分解
3.3.3 K-means算法实现
3.4 最近邻(Nearest Neighbors)
3.5 K-NN算法实现示例
3.6 算法扩展
3.7 小结
第4章 线性回归和逻辑回归
4.1 回归分析回归的应用
4.2 线性回归
4.2.1 代价函数的确定
4.2.2 分析方法
4.2.3 协方差和相关性
4.2.4 寻找协方差和相关性的斜率和截距
4.2.5 梯度下降法
4.2.6 递归过程表示
4.3 实践中的数据研究和线性回归
4.3.1 鸢尾花数据集
4.3.2 线性回归与梯度下降
4.4 逻辑回归
4.4.1 线性回归和逻辑回归
4.4.2 logit函数
4.4.3 应用逻辑回归建立心脏疾病模型的实例
4.5 小结
第5章 神经网络
5.1 神经模型的历史
5.1.1 感知器模型
5.1.2 改进预测结果——ADALINE算法
5.1.3 感知器和ADALINE之间的异同
5.1.4 单层和多层感知器
5.2 使用单层感知器实现简单的功能
5.2.1 定义并绘制传递函数类型
5.2.2 表示和理解传递函数
5.2.3 Sigmoid函数或逻辑函数
5.2.4 使用Sigmoid函数
5.2.5 修正线性单元
5.2.6 线性传递函数
5.2.7 定义损失函数
展开