搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
R语言:实用数据分析和可视化技术
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787111499619
  • 作      者:
    (美)贾里德 P. 兰德(Jared P. Lander)著
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2015
收藏
编辑推荐
  

  资深数据专家凝炼数十年教学和实践经验,全面阐释如何使用R的20%功能完成80%的现代数据工作
  通过开源R软件,你可以构建强大的统计模型来解决许多极具挑战性的难题。对非统计学家来说,一直以来R都难于学习和使用,市面上很多介绍R语言的书籍都假设读者具有足够的预备知识,但本书则不同。
  本书融合资深数据科学家Jared P. Lander在教授R语言上的丰富经验,通过大量实例,详细讲解R语言的核心功能。对刚接触统计程序和模型的人来说,本书是一套堪称完美的教程,其内容的组织结构使得学习R语言变得简单和直观。本书集中介绍R 20%的功能,但这20%的功能足以完成80%的现代数据工作。
  通过阅读本书,你将学到:
  运用R处理数学问题:变量类型、向量、调用函数等
  功能强大、常用的数据结构:数据框、矩阵和列表
  创建直观的统计图形
  编写自定义函数
  分组操作提高效率
  合并和重塑多个数据集
  使用R的工具操作字符串和正则表达式
  创建正态分布、二项分布和泊松分布
  基本统计信息编程:均值、标准差以及t-检验
  建立线性、广义线性和非线性模型
  评估模型和变量选择的质量
  使用弹性网和贝叶斯方法防止过度拟合
  分析单变量和多变量时间序列数据
  通过K均值和分层聚类对数据进行分类
  用knitr准备报告、幻灯片和网页
  用devtools和Rcpp建立可重复使用的R包

展开
作者简介

  Jared P. Lander(贾里德 P. 兰德),资深数据专家,Lander Analytics公司创始人兼CEO,纽约开源统计编程聚会组织者,哥伦比亚大学统计学客座教授。在数据管理、多层次模型、机器学习、广义线性模型、可视化、数据管理和统计计算等多个领域拥有丰富经验。他致力于为各种类型的科技创业公司提供培训、融资、金融、医疗和人道主义救援等工作。他拥有哥伦比亚大学统计学硕士学位及瑞米伦贝格大学数学学士学位。

展开
内容介绍

  《R语言:实用数据分析和可视化技术》是资深数据专家数十年教学与实践经验的结晶,以简单直接的方式详细讲解R语言的所有基础知识,以及常见统计方法和模型在R中的操作规范,通过大量实例,帮助读者快速理解并掌握R的核心功能,有效解决实际工作问题。
  《R语言:实用数据分析和可视化技术》共24章,第1~3章介绍R语言的获取与安装、R环境的设置以及R包的基础知识;第4~5章介绍R语言基础知识和高级数据结构,涉及数学运算、向量、调用函数以及数据框、列表、矩阵和数组等;第6章介绍如何导入数据;第7章详细介绍统计图形的绘制,包括基本绘图和ggplot2;第8~10章介绍R函数编写,包括对结构、参数和返回规则的讨论,讲解if和ifelse以及复杂语句控制程序的流程、for和while循环迭代等;第11~13章介绍数据的分组操作、数据整理和字符串操作;第14~15章介绍概率分布与描述性统计;第16~20章介绍线性模型、广义线性模型、模型诊断、正则化与压缩以及非线性模型等;第21章介绍时间序列和自相关;第22章介绍各种聚类方式,包括K-means和分层聚类;第23章讨论可重复性、报告和利用knitr滑动展示;第24介绍如何创建R包

展开
目录

Contents
译者序
序言
前言
致谢
第1章 获取R  1
1.1 下载R  1
1.2 R版本  2
1.3 32位与64位  2
1.4 安装  2
1.5 R的社区版革命  8
1.6 小结  9
第2章 R环境  10
2.1 命令行界面  11
2.2 RStudio  12
2.3 Revolution Analytics RPE  20
2.4 小结  20
第3章 R包  21
3.1 包的安装  21
3.2 包的加载  23
3.3 创建一个包  24
3.4 小结  24
第4章 R语言基础  25
4.1 基本数学运算  25
4.2 变量  26
4.3 数据类型  28
4.4 向量  33
4.5 调用函数  37
4.6 函数文件  38
4.7 缺失数据  38
4.8 小结  39
第5章 高级数据结构  40
5.1 数据框  40
5.2 列表  47
5.3 矩阵  52
5.4 数组  54
5.5 小结  55
第6章 导入数据  56
6.1 导入CSV  56
6.2 导入Excel数据  57
6.3 读入数据库数据  58
6.4 导入其他统计工具数据  59
6.5 R二进制文件  60
6.6 包含在R中的数据  62
6.7 从互联网上抓取数据  62
6.8 小结  63
第7章 统计图形  64
7.1 基本图形  64
7.2 ggplot2  66
7.3 小结  78
第8章 编写R函数  79
8.1 hello world!  79
8.2 函数参数  80
8.3 返回值  82
8.4 do.call  83
8.5 小结  84
第9章 控制语句  85
9.1 if和else语句  85
9.2 switch语句  88
9.3 ifelse语句  89
9.4 复合检查  90
9.5 小结  91
第10章 循环,Un-R方式的迭代  92
10.1 for循环  92
10.2 while循环  94
10.3 控制循环  94
10.4 小结  95
第11章 分组操作  96
11.1 apply函数族  96
11.2 aggregate  99
11.3 plyr  102
11.4 data.table  106
11.5 小结  114
第12章 数据整理  115
12.1 cbind和rbind  115
12.2 连接  116
12.3 reshape2  122
12.4 小结  125
第13章 字符串操作  126
13.1 paste  126
13.2 把格式数据写成串(sprintf)  127
13.3 提取文本  128
13.4 正则表达式  132
13.5 小结  138
第14章 概率分布  139
14.1 正态分布  139
14.2 二项分布  144
14.3 泊松分布  148
14.4 其他分布  150
14.5 小结  152
第15章 描述性统计  153
15.1 概括性统计量  153
15.2 相关系数和协方差  156
15.3 t-检验  163
15.4 方差分析  169
15.5 小结  171
第16章 线性模型  172
16.1 简单线性回归  172
16.2 多元回归  177
16.3 小结  190
第17章 广义线性模型  191
17.1 逻辑斯蒂回归  191
17.2 泊松回归  194
17.3 其他的广义线性模型  198
17.4 生存分析  198
17.5 小结  202
第18章 模型诊断  203
18.1 残差  203
18.2 模型比较  208
18.3 交叉验证  211
18.4 Bootstrap  215
18.5 逐步变量选择  218
18.6 小结  221
第19章 正则化和压缩  222
19.1 弹性网络  222
19.2 贝叶斯压缩  235
19.3 小结  238
第20章 非线性模型  239
20.1 非线性最小二乘  239
20.2 样条  241
20.3 广义相加模型  245
20.4 决策树  249
20.5 随机森林  251
20.6 小结  251
第21章 时间序列和自相关  252
21.1 自回归移动平均模型  252
21.2 向量自回归  258
21.3 广义自回归异方差模型(GARCH)  263
21.4 小结  270
第22章 聚类  271
22.1 K-means  271
22.2 PAM  277
22.3 分层聚类  282
22.4 小结  284
第23章 可重复性、报告和利用knitr滑动展示  285
23.1 安装LATEX程序  285
23.2 LATEX初级  286
23.3 通过LATEX使用knitr  288
23.4 Markdown技巧  291
23.5 使用knitr和Markdown  292
23.6 pandoc  293
23.7 小结  295
第24章 创建R包  296
24.1 目录结构  296
24.2 包文件  297
24.3 包文档  302
24.4 包的检查、创建和安装  304
24.5 提交至CRAN  305
24.6 C++代码  305
24.7 小结  310
附录A 相关资源  311

展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证