搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
R数据分析秘笈
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787111531739
  • 作      者:
    (美)维西瓦·维斯瓦纳坦(Viswa Viswanathan),(美)珊蒂·维斯瓦纳坦(Shanthi Viswanathan)著
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2016
收藏
编辑推荐
  资深技术专家多年经验结晶,深入剖析R数据分析的实用方法、技巧和实践  通过80多个基于任务的实际应用案例,帮助你快速提升R数据分析能力,轻松搞定数据分析项目  用R进行数据分析已经成为各种机构的关注焦点。R让没有深厚的数学背景,仅对基本概念有一点直观理解的人们可以相当有效和仔细地考察他们的数据。  本书通过展示各种使用R来生成专业分析报告的方法来使你更上一层楼。它提供了各类重要分析和机器学习任务的例子,并且准备好了所需的数据可供读者立即尝试。同时书中详细讲解了如何快速调整示例代码来适应自己的需求,这将大大节约从零开始构建代码所需要的时间。  通过阅读本书,你将学到:  将数据导入R环境并为分析做好准备工作  执行探索性数据分析并生成有意义的数据可视化  应用一些机器学习技术来分类或者回归  借助数据归约技术来处理大型数据集  从时间序列数据中抽取特征并基于它预测未来  如何从社交网络数据中抽取出可行信息  实施地理空间分析  通过报告来呈现令人信服的分析结论,并建立一个架构让他人也能与数据交互
展开
作者简介
  Viswa Viswanathan,西顿霍尔大学斯蒂尔曼商学院计算和决策科学系副教授。他在获得人工智能领域的博士学位之后,曾在学术界度过了十年,然后转向软件产业,作为领军人物工作了十年。他于2011年重新回到学术界。  Shanthi Viswanathan,是一位经验丰富的技术专家,为许多企业客户提供技术管理和企业结构方面的咨询。她曾就职于Infosys科技、Oracle公司和Accenture。作为一名顾问,Shanthi为一些大型机构(如Canon、Cisco、Celgene、Amway、Time Warner Cable 和 GE等公司)提供数据架构和分析、高级数据管理、面向服务的架构、商业流程管理、建模等方面的帮助。
展开
内容介绍
  R作为一个可扩展的系统,其功能分布在众多的包中,每一个包囊括了大量函数,即使是经验丰富的使用者也不会指望能将所有的细节记在脑海中。本书旨在为已有一定基础的R用户提供现成的方法来实现很多重要的数据分析任务。当面对一个特定任务时,你可以在几分钟内找到合适的方法并实施,而不必在互联网或众多书籍中苦苦搜索。  本书从各类源数据的读入和调整,数据分析前的准备工作、清洗、转换,到面向各类需求的各种模型,再到能够显著提高效率的自动化报告系统knitr和交互式可视化系统shiny,最后到与Java、MySQL、MongoDB和Excel之间的配合工作,为初级和中级数据分析师准备了80多种实用方法,帮助你完成真实场景中的各项任务。  
展开
目录
译者序
作者简介
审校者简介
前言
第1章 获取并准备好材料—数据    1
1.1 引言    1
1.2 从csv文件中读取数据    1
1.3 读取XML数据    4
1.4 读取JSON数据    6
1.5 从定宽格式文件中读取数据    7
1.6 从R数据文件和R库中读取数据    8
1.7 删除带有缺失值的样本    10
1.8 用均值填充缺失值    11
1.9 删除重复样本    13
1.10 将变量缩放至[0,1]区间    14
1.11 对数据框中的数据做正则化或标准化    15
1.12 为数值数据分箱    17
1.13 为分类变量创建哑变量    18
第2章 那里面有什么——探索性数据分析    21
2.1 引言    21
2.2 创建标准化数据概览    21
2.3 抽取数据集的子集    23
2.4 分割数据集    25
2.5 创建随机数据分块    26
2.6 创建直方图、箱线图、散点图等标准化图像    29
2.7 在网格窗口上创建多个图像    37
2.8 选择图形设备    38
2.9 用lattice包绘图    39
2.10 用ggplot2包绘图    42
2.11 创建便于比较的图表    47
2.12 创建有助于发现因果关系的图表    51
2.13 创建多元图像    53
第3章 它属于哪儿——分类技术    55
3.1 引言    55
3.2 创建误差/分类–混淆矩阵    55
3.3 创建ROC图    58
3.4 构建、绘制和评估—分类树    61
3.5 用随机森林模型分类     66
3.6 用支持向量机分类    69
3.7 用朴素贝叶斯分类    72
3.8 用K最近邻分类    74
3.9 用神经网络分类    77
3.10 用线性判别函数分类    79
3.11 用逻辑回归分类    80
3.12 用AdaBoost来整合分类树模型    83
第4章 给我一个数——回归分析    86
4.1 引言    86
4.2 计算均方根误差    86
4.3 建立用于回归的KNN模型    88
4.4 运用线性回归    94
4.5 在线性回归中运用变量选择    99
4.6 建立回归树    102
4.7 建立用于回归的随机森林模型    108
4.8 用神经网络做回归    112
4.9 运用K-折交叉验证    114
4.10 运用留一交叉验证来限制过度拟合    116
第5章 你能化简它吗——数据简化技术    118
5.1 引言    118
5.2 用K-均值聚类法实现聚类分析    118
5.3 用系统聚类法实现聚类分析    124
5.4 用主成分分析降低维度    127
第6章 从历史中学习——时间序列分析    134
6.1 引言    134
6.2 创建并检查日期对象    134
6.3 对日期对象进行操作    138
6.4 对时间序列数据做初步分析    140
6.5 使用时间序列对象    143
6.6 分解时间序列    149
6.7 对时间序列数据做滤波    151
6.8 用HoltWinters 方法实现平滑和预测    152
6.9 创建自动的ARIMA模型    155
第7章 这都是你的关系——社交网络分析    157
7.1 引言    157
7.2 通过公共API下载社交网络数据    157
7.3 创建邻接矩阵和连边列表    161
7.4 绘制社交网络数据    164
7.5 计算重要的网络度量指标    176
第8章 展现你最好的一面——制作文档和呈现分析报告    182
8.1 引言    182
8.2 用R Markdown 和 knitR创建数据分析报告    182
8.3 用shiny创建交互式Web应用    191
8.4 用R Presentation为分析报告创建PDF幻灯片    196
第9章 事半功倍——高效且简洁的R代码    201
9.1 引言    201
9.2 利用向量化操作    201
9.3 用apply函数操作整行或整列    203
9.4 用lapply和sapply将函数应用于整组元素    206
9.5 在向量的一个子集上应用函数    208
9.6 用plyr完成分割–应用–组合策略    210
9.7 用数据表对数据进行切片、切块和组合    213
第10章 在哪儿——地理空间信息数据分析    219
10.1 引言    219
10.2 下载并绘制一个地区的谷歌地图    219
10.3 在已下载的谷歌地图上叠加数据    222
10.4 将ESRI形状文件导入到R中    224
10.5 使用sp包绘制地理数据    226
10.6 从maps包中获取地图    228
10.7 从包含空间及其他数据的普通数据框中创建空间数据框    229
10.8 通过合并普通数据框和空间对象生成空间数据框    230
10.9 为已有的空间数据框添加变量    234
第11章 友好协作——连接到其他系统    237
11.1 引言    237
11.2 在R中使用Java对象    237
11.3 从Java中用JRI调用R函数    243
11.4 从Java中用Rserve调用R函数    245
11.5 从Java中执行R脚本    248
11.6 使用xlsx包连接到Excel    249
11.7 从关系型数据库—MySQL中读取数据    252
11.8 从非关系型数据库—MongoDB中读取数据    256
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证