搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
机器学习基础(面向预测数据分析的算法实用范例与案例研究原书第2版)/数据科学与大数据技术丛书
0.00     定价 ¥ 149.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787111791638
  • 作      者:
    作者:(爱)约翰·D.凯莱赫//布莱恩·马克·纳米//奥伊弗·达西|责编:姚蕾|译者:潘巍//张显明//苏统华//刘贤明
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2025-11-01
收藏
畅销推荐
内容介绍
机器学习常用于从海量数据集中提取模式以构建预测模型。这些模型广泛应用于预测性数据分析领域,包括价格预测、风险评估、客户行为预测及文档分类等。这本入门教材系统阐述了预测性数据分析中最核心的机器学习方法,兼顾理论概念与实践应用。技术与数学内容辅以详解的实例演练,案例研究则展示了这些模型在更广泛商业场景中的应用。第2版新增了机器学习领域的最新进展,特别是关于深度学习的全新章节,以及两章“预测模型之外”的内容——无监督学习与强化学习。 本书通俗易懂,在引入数学模型和算法之前,先以非技术性语言阐释每种方法背后的核心理念。内容聚焦且深入,为学生提供核心概念的详细介绍,奠定自主探索该领域的坚实基础。无论是前面的章节还是后面的案例研究,都生动展示了预测模型学习过程如何融入更广阔的商业实践。第五部分的两个案例研究详细描述了数据分析项目的全过程,涵盖从业务问题定义到分析解决方案实施的各个阶段。本书既可作为入门教材使用,也可作为专业人士的参考指南。
展开
目录
译者序
前言
符号
第一部分 机器学习和数据分析导论
第1章 面向预测数据分析的机器学习
1.1 什么是预测数据分析
1.2 什么是机器学习
1.3 机器学习是如何工作的
1.4 归纳偏差与采样偏差
1.5 机器学习可能出现什么问题
1.6 预测数据分析项目的生命周期:CRISP-DM
1.7 预测数据分析工具
1.8 未来之路
1.9 习题
第2章 从数据到见解再到决策
2.1 将业务问题转化为分析解决方案
2.1.1 案例研究:汽车保险欺诈
2.2 评估可行性
2.2.1 案例研究:汽车保险欺诈
2.3 设计分析基础表
2.3.1 案例研究:汽车保险欺诈
2.4 设计和实现特征
2.4.1 不同类型的数据
2.4.2 不同类型的特征
2.4.3 处理时间
2.4.4 法律问题
2.4.5 实现特征
2.4.6 案例研究:汽车保险欺诈
2.5 总结
2.6 延伸阅读
2.7 习题
第3章 数据探索
3.1 数据质量报告
3.1.1 案例研究:汽车保险欺诈
3.2 了解数据
3.2.1 正态分布
3.2.2 案例研究:汽车保险欺诈
3.3 辨识数据质量问题
3.3.1 缺失值
3.3.2 不规则基数
3.3.3 异常值
3.3.4 案例研究:汽车保险欺诈
3.4 处理数据质量问题
3.4.1 处理缺失值
3.4.2 处理异常值
3.4.3 案例研究:汽车保险欺诈
3.5 高级数据探索
3.5.1 可视化特征之间的关系
3.5.2 度量协方差和相关性
3.6 数据准备
3.6.1 标准化
3.6.2 分箱
3.6.3 采样
3.7 总结
3.8 延伸阅读
3.9 习题
第二部分 预测数据分析
第4章 基于信息的学习
4.1 主要思想
4.2 基础知识
4.2.1 决策树
4.2.2 香农熵模型
4.2.3 信息增益
4.3 标准方法:ID3算法
4.3.1 实用范例:植被分布预测
4.4 扩展和变体
4.4.1 其他特征选择和不纯净度度量
4.4.2 处理连续型描述性特征
4.4.3 预测连续型目标
4.4.4 树剪枝
4.4.5 模型集成
4.5 总结
4.6 延伸阅读
4.7 习题
第5章 基于相似性的学习
5.1 主要思想
5.2 基础知识
5.2.1 特征空间
5.2.2 使用距离度量来衡量相似性
5.3 标准方法:最近邻算法
5.3.1 实用范例
5.4 扩展和变体
5.4.1 处理噪声数据
5.4.2 高效的内存搜索
5.4.3 数据标准化
5.4.4 预测连续型目标
5.4.5 其他相似性度量
5.4.6 特征选择
5.5 总结
5.6 延伸阅读
5.7 后记
5.8 习题
第6章 基于概率的学习
6.1 主要思想
6.2 基础知识
6.2.1 贝叶斯定理
6.2.2 贝叶斯预测
6.2.3 条件独立性和因子分解
6.3 标准方法:朴素贝叶斯模型
6.3.1 实用范例
6.4 扩展和变体
6.4.1 平滑处理
6.4.2 连续型特征:概率密度函数
6.4.3 连续型特征:分箱
6.4.4 贝叶斯网络
6.5 总结
6.6 延伸阅读
6.7 习题
第7章 基于误差的学习
7.1 主要思想
7.2 基础知识
7.2.1 简单的线性回归
7.2.2 测量误差
7.2.3 误差曲面
7.3 标准方法:使用梯度下降的多变量线性回归
7.3.1 多变量线性回归
7.3.2 梯度下降
7.3.3 选择学习率和初始权重
7.3.4 实用范例
7.4 扩展和变体
7.4.1 解释多变量线性回归模型
7.4.2 使用权重衰减设置学习率
7.4.3 处理类别型描述性特征
7.4.4 处理类别型目标特征:logistic回归
7.4.5 建模非线性关系
7.4.6 多项式logistic回归
7.4.7 支持向量机
7.5 总结
7.6 延伸阅读
7.7 习题
第8章 深度学习
8.1 主要思想
8.2 基础知识
8.2.1 人工神经元
8.2.2 人工神经网络
8.2.3 神经网络的矩阵运算
8.2.4 为什么非线性激活函数是必要的
8.2.5 为什么网络深度很重要
8.3 标准方法:反向传播和梯度下降
8.3.1 反向传播:算法的一般结构
8.3.2 反向传播:误差梯度的反向传播
8.3.3 反向传播:更新网络中的权重
8.3.4 反向传播:算法
8.3.5 实用范例:使用反向传播训练前馈网络完成回归任务
8.4 扩展和变体
8.4.1 梯度消失和ReLU
8.4.2 权重初始化和不稳定梯度
8.4.3 处理类别型目标特征:softmax输出层和交叉熵损失函数
8.4.4 早停法和随机失活:防止过拟合
8.4.5 卷积神经网络
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证