译者序
前言
致谢
第1章引言
参考文献
第2章处理信息与认识数据
2.1例1:2006年出生数据
2.2例2:校友捐赠
2.3例3:橘子汁
参考文献
第3章标准线性回归
3.1用R函数估算线性回归模型
3.2例1:汽车燃油效率
3.3例2:丰田二手车价格
附录3.A模型过度拟合对回归预测均方误差的影响
参考文献
第4章局部多项式回归的非参数回归方法
4.1模型的选择
4.2密度估计和直方图平滑化的应用
4.3多重回归模型的拓展
4.4例题和软件
4.4.1例1:老忠实喷泉
4.4.2例2:NOx排放物
参考文献
第5章简约在统计建模中的重要性
5.1怎样防止低假阳率
参考文献
第6章多参数回归模型中基于惩罚算法的变量选择
6.1例1:前列腺癌
6.2例2:橙汁
参考文献
第7章Logistic回归
7.1对二分类响应数据建立线性模型
7.2Logistic回归模型中回归系数的解释
7.3统计推断
7.4对新样例的分类
7.5用R语言估计
7.6例1:死刑数据
7.6.1二分类Logistic回归:Minitab程序输出
7.6.2R语言输出结果的解释与分析
7.7例2:延误的航班
7.8例3:贷款验收
7.9例4:德国信贷数据
参考文献
第8章二元分类、概率和分类性能的评价
8.1二元分类
8.2使用概率作决策
8.3灵敏度和特异度
8.4例子:德国信贷数据
第9章最近邻分析分类
9.1k近邻算法
9.2例1:玻璃碎片的法医分析
9.3例2:德国信贷数据
参考文献
第10章朴素贝叶斯分析:一种由以分类为主的变量对分类响应变量预测的模型
10.1例:航班延误
参考文献
第11章多项式Logistic回归
11.1计算软件
11.2例1:玻璃碎片的法医分析
11.3例2:重温玻璃碎片的法医分析
附录11.A简单三重矩阵的详述
参考文献
第12章分类和判别分析的深入探讨
12.1Fisher线性判别函数
12.2例1:德国信用卡数据
12.3例2:Fisher鸢尾花数据
12.4例3:玻璃碎片的法医分析数据
12.5例4:MBA申请数据
参考文献
第13章决策树
13.1例1:前列腺癌
13.2例2:摩托车加速度
13.3例3:回顾Fisher鸢尾花数据集
第14章回归、分类树、计算软件及其他实用分类方法的深入探讨
14.1有关树结构的R程序包
14.2卡方自动交互检验
14.3集成方法:Bagging算法、Boosting算法和随机森林
14.4支持向量机
14.5神经网络
14.6R程序包:关于数据挖掘的一个有用的图形用户界面
参考文献
第15章聚类
15.1k均值聚类
15.2另眼看聚类:将期望最大化算法应用于混合正态分布
15.2.1E步
15.2.2M步
15.3层次聚类过程
参考文献
第16章购物篮分析:关联规则和提升度
16.1例1:在线广播
16.2例2:收入预测
参考文献
第17章降维:因子模型和主成分分析
17.1例1:欧洲蛋白质的摄入数据
17.2例2:月度失业率数据
第18章带多重共线性输入的降维回归:主成分回归和偏最小二乘法
18.1三个例子
18.1.1例1:模拟数据
18.1.2例2:基于50个州的历史失业率预测某州下个月的失业率
18.1.3例3:预测下月失业率:比较不同方法样本外预测效果
参考文献
第19章文本数据:文本挖掘和情感分析
19.1逆多项式Logistic回归
19.2例1:餐馆评论
19.3例2:政治主张
附录19.A Gentzkow/Shapiro关于“slant”的估计和偏最小二乘的关系
参考文献
第20章网络数据
20.1例1:15世纪佛罗伦萨的婚姻与权力
20.2例2:友谊网络的连接
参考文献
附录A练习
附录B参考文献
展开