搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
应用预测建模
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787111533429
  • 作      者:
    (美)马克斯·库恩(Max Kuhn),(美)谢尔·约翰逊(Kjell Johnson)著
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2016
收藏
编辑推荐

这本关于数据分析的优秀图书广受好评,荣获2014年Ziegel奖,还被很多教师选为“数据科学”课程的教材。本书专注于预测建模的实际应用,介绍了从数据预处理到建模再到模型评估和选择的整个过程,以及背后的统计思想,涉及各种回归技术和分类技术。从解决实际问题延伸到模型拟合,以及随之出现的主题,如处理类不平衡、选择预测因子等在实践中经常出现的问题,作者意在为读者提供预测建模过程的指导,并结合开源软件R语言来求解实际问题,详细给出R代码和处理的步骤。R包AppliedPredictiveModeling包含了书中例题和习题使用的数据,以及用于重复书中每一章分析的R代码。

展开
作者简介

马克斯·库恩(Max Kuhn)
康涅狄格州格罗顿市辉瑞全球研发非临床统计部主任,在制药和诊断行业已有近20年应用预测模型的经验,他还是很多R包的作者。
谢尔·约翰逊(Kjell Johnson)
博士,在药物研发和其他行业有近20年统计咨询和预测建模经验,曾任辉瑞全球研发统计部主任。 

展开
内容介绍

  这是一本专注于预测建模的数据分析书,意在为实践者提供预测建模过程的指导,比如如何进行数据预处理、模型调优、预测变量重要性度量、变量选择等。读者可以从中学到许多建模方法以及提高对许多常用的、现代的有效模型的认识,如线性回归、非线性回归和分类模型,涉及树方法、支持向量机等。第10章和第17章分别研究混凝土混合物的抗压强度和作业调度两个案例。
  作者重实际应用,轻数学理论,从实际数据出发,结合开源软件R语言来求解实际问题,详细给出R代码和处理的步骤。R包AppliedPredictiveModeling包含书中使用的数据,以及可以用于重复书中每一章分析的R代码,让读者能在一定精度范围内重复本书的结果,并自然地将书中的预测建模方法应用到自己的数据上。章后附有习题,方便读者巩固所学。
  这本业界互相推荐的好书,适合所有数据分析人员阅读。

展开
精彩书评

关于预测分析和数据建模,网络上有各种各样的图书……根据关联性、流行性、线上排名以及为你的业务增值的能力,我们选出了《应用预测建模》……
— Timothy King Business Intelligence Solutions Review, solutions-review.com

我曾用这本书作为数据科学课程的辅助教材,因为数据科学需要涵盖处理数据、模型评估和机器学习方法等方面的内容,所以我使用了一系列不同的资料。如果下次我还教授数据科学课程,我将只用这本书,因为它包含了这个领域所有方面的内容。
— Louis Luangkesorn lugerpitt.blogspot.com

关于回归和分类模型的预测技术,这部著作提供了非常有用的实践课程……两位作者不仅是建模和预测领域公认的专家,也是R包开发者和统计方法领域公认的专家……对于在应用复杂统计技术时需要直接帮助的学生和实践者,这本书是非常有益的。
— Stan Lipovetsky Technometrics

展开
目录

译者序
前言
第1章导论
1.1预测与解释
1.2预测模型的关键部分
1.3专业术语
1.4实例数据集和典型数据场景
1.5概述
1.6符号
第一部分一般策略
第2章预测建模过程简介
2.1案例分析:预测燃油效能
2.2主题
2.3总结
第3章数据预处理
3.1案例分析:高内涵筛选中的细胞分组
3.2单个预测变量数据变换
3.3多个预测变量数据变换
3.4处理缺失值
3.5移除预测变量
3.6增加预测变量
3.7区间化预测变量
3.8计算
习题
第4章过度拟合与模型调优
4.1过度拟合的问题
4.2模型调优
4.3数据分割
4.4重抽样技术
4.5案例分析:信用评分
4.6选择调优参数值
4.7数据划分建议
4.8不同模型间的选择
4.9计算
习题
第二部分回归模型
第5章衡量回归模型的效果
5.1模型效果的定量度量
5.2方差偏差的权衡
5.3计算
第6章线性回归及其扩展
6.1案例分析:定量构效关系建模
6.2线性回归
6.3偏最小二乘法
6.4惩罚模型
6.5计算
习题
第7章非线性回归模型
7.1神经网络
7.2多元自适应回归样条
7.3支持向量机
7.4K近邻
7.5计算
习题
第8章回归树与基于规则的模型
8.1简单回归树
8.2回归模型树
8.3基于规则的模型
8.4装袋树
8.5随机森林
8.6助推法
8.7Cubist
8.8计算
习题
第9章溶解度模型总结
第10章案例研究:混凝土混合物的抗压强度
10.1模型构建策略
10.2模型性能
10.3优化抗压强度
10.4计算
第三部分分类模型
第11章分类模型的效果度量
11.1类预测
11.2评估预测类
11.3评估类概率
11.4计算
第12章判别分析和其他线性分类模型
12.1案例分析:预测是否成功申请经费
12.2逻辑回归
12.3线性判别分析
12.4偏最小二乘判别分析
12.5惩罚模型
12.6最近收缩质心
12.7计算
习题
第13章非线性分类模型
13.1非线性判别分析
13.2神经网络
13.3灵活判别分析
13.4支持向量机
13.5K近邻
13.6朴素贝叶斯
13.7计算
习题
第14章分类树与基于规则的模型
14.1基本的分类树
14.2基于规则的模型
14.3装袋决策树
14.4随机森林
14.5助推法
14.6C5.0
14.7比较两种分类预测变量编码方式
14.8计算
习题
第15章经费申请模型的总结
第16章对严重类失衡的补救方法
16.1案例分析: 预测房车保险所有权
16.2类失衡的影响
16.3模型调优
16.4选择截点
16.5调整先验概率
16.6不等案例权重
16.7抽样方法
16.8成本敏感度训练
16.9计算
习题
第17章案例研究:作业调度
17.1数据切分和模型策略
17.2结果
17.3计算
第18章衡量预测变量重要性
18.1数值结果变量
18.2分类结果变量
18.3其他方法
18.4计算
习题
第19章特征选择介绍
19.1使用无信息预测变量的结果
19.2减少预测变量个数的方法
19.3绕封法
19.4过滤法
19.5选择偏差
19.6案例分析:预测认知损伤
19.7计算
习题
第20章影响模型表现的因素
20.1第Ⅲ类错误
20.2结果变量的测量误差
20.3预测变量的测量误差
20.4连续变量离散化
20.5模型预测何时是可信的
20.6大样本的影响
20.7计算
习题
附录
附录A各种模型的总结
附录BR语言介绍
附录C值得关注的网站
参考文献

展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证