序一
序二
前言
第1章 机器学习
1.1 机器学习概述
1.1.1 机器学习发展历史
1.1.2 机器学习工作原理
1.2 机器学习典型工具箱
1.2.1 NumPy
1.2.2 Pandas
1.2.3 SciKit-Learn
1.2.4 TensorFlow
1.3 机器学习项目实现流程
1.3.1 业务场景拆解
1.3.2 构建特征工程
1.3.3 模型评估与选型
1.3.4 模型优化
第2章 业务场景拆解
2.1 业务目标拆解
2.1.1 业务目标拆解方法
2.1.2 算法模型作用环节分析
2.2 项目方案制定
2.2.1 项目团队配置
2.2.2 机器学习项目方案制定
第3章 特征工程
3.1 特征工程基础
3.1.1 特征工程的概念和意义
3.1.2 工业界特征工程应用
3.2 数据预处理
3.2.1 缺失值处理
3.2.2 异常值处理
3.3 数值变量处理
3.3.1 连续特征离散化
3.3.2 数值数据变换
3.3.3 特征缩放和归一化
3.4 类别变量处理
3.4.1 类别特征的编码方法
3.4.2 特征交叉
3.5 特征筛选
3.5.1 过滤式
3.5.2 包装法
3.5.3 嵌入法
第4章 模型评估和模型选型
4.1 模型评估和模型选型概要
4.1.1 模型评估简介
4.1.2 模型选型简介
4.2 模型评估方法
4.2.1 留出法
4.2.2 K折交叉验证法
4.2.3 自助法
4.3 模型评估指标
4.3.1 分类问题评估指标
4.3.2 回归模型评估指标
4.3.3 结合业务场景选择评估指标
4.4 典型模型介绍
4.4.1 统计机器学习
4.4.2 深度学习
4.4.3 因果推断
4.5 模型选型技术
4.5.1 模型选型依据
4.5.2 偏差和方差
4.5.3 结合业务场景进行模型选型
第5章 模型优化
5.1 数据集优化
5.1.1 数据采样
5.1.2 数据降维
5.2 目标函数优化
5.2.1 常见损失函数
5.2.2 正则化项
5.2.3 不平衡数据集下对损失函数的优化
5.3 模型结构优化——集成学习
5.3.1 Bagging
5.3.2 Boosting
5.3.3 Stacking
5.4 最优化算法
5.4.1 梯度下降法
5.4.2 牛顿法和拟牛顿法
5.4.3 Momentum/AdaGrad/RMSProp/Adam
5.5 模型参数优化
5.5.1 模型调参要素
5.5.2 网格搜索
5.5.3 随机搜索
5.5.4 贝叶斯优化
第6章 计算广告:广告点击率预估
6.1 业务场景介绍
6.1.1 计算广告概述
6.1.2 计算广告核心算法
6.2 点击率预估场景下的特征挖掘
6.2.1 数据集介绍
6.2.2 数据分析
6.2.3 特征构建
6.3 常见的点击率预估模型
6.3.1 基线模型建设
6.3.2 DeepCrossing模型
6.3.3 Wide Deep模型
6.3.4 Deep Cross模型
6.3.5 DeepFM模型
6.3.6 AFM模型
6.3.7 DIN模型
第7章 供需预测:“新零售”之供需时序建模
7.1 业务场景介绍
7.1.1 为什么需要供需预测
7.1.2 新零售场景下的供需预测
7.2 时序问题的数据分析和特征挖掘
7.2.1 数据集介绍
7.2.2 数据分析
7.2.3 特征构建
7.3 时序模型探索过程
7.3.1 传统时序模型——ARIMA
7.3.2 Prophet模型
7.3.3 树模型——LightGBM
7.3.4 深度学习模型——LSTM模型
7.3.5 深度学习模型——Transformer模型
7.3.6 深度学习模型——DeepAR模型
第8章 智能营销:优惠券发放
8.1 业务场景介绍
8.1.1 智能营销的概念和架构
8.1.2 优惠券发放业务场景
8.2 智能营销场景下的特征挖掘
8.2.1 数据集介绍
8.2.2 用户侧特征挖掘
8.2.3 产品侧特征挖掘
8.3 智能营销建模流程
8.3.1 发给谁——人群分层模型(RFM、Uplift Model、ESMM)
8.3.2 发多少——LTV模型
8.3.3 怎么发——优惠券分发策略
第9章 动态定价:交易市场价格动态调整
9.1 业务场景介绍
9.1.1 动态定价概述
9.1.2 常见动态定价业务场景
9.1.3 网约车场景下的交易市场业务
9.2 动态定价相关的特征挖掘
9.2.1 时空特征挖掘
9.2.2 用户特征挖掘
9.2.3 平台特征挖掘
9.3 动态定价模型
9.3.1 动态定价策略总览
9.3.2 用户行为预估模型
展开