搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
R语言大数据分析与挖掘/新工科新商科大数据与商务智能系列
0.00     定价 ¥ 55.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787121452383
  • 作      者:
    编者:谢笑盈//金康伟|责编:王二华
  • 出 版 社 :
    电子工业出版社
  • 出版日期:
    2023-03-01
收藏
畅销推荐
内容介绍
本书首先简要介绍了大数据分析与挖掘的相关概念,以及R语言的基础知识,以此来帮助读者了解、使用R语言;其次详细介绍了探索性数据分析、数据采集,以此来帮助读者了解数据的基本分析方法和数据的获取方法;然后着重介绍了目前主流的数据挖掘算法——时间序列算法、线性回归算法、分类算法、关联算法、聚类算法,从算法的原理到如何使用R语言进行算法实现都进行了详细的介绍并提供了实操代码,以此帮助读者学习数据挖掘及使用R语言完成数据挖掘任务;最后通过6个旅游行业的实际案例来帮助读者将学习到的知识运用到真实的业务场景中,并融会贯通整个知识体系。 本书无须读者具备R语言和大数据分析与挖掘的基础知识。无论是R语言初学者,还是熟练的R语言用户,都能从本书中找到有用的内容。本书既可以作为一本学习R语言的教材,也可以作为大数据分析与挖掘的工具书。
展开
目录
第1章 大数据分析与挖掘概论
1.1 大数据分析与挖掘
1.1.1 大数据定义
1.1.2 大数据分析与挖掘的概念
1.2 大数据分析与挖掘流程
1.2.1 数据获取
1.2.2 数据预处理
1.2.3 数据分析
1.2.4 数据解释
1.3 大数据分析与挖掘应用
1.3.1 优化任务
1.3.2 预测任务
1.3.3 分类任务
1.3.4 识别任务
第2章 R语言编程基础
2.1 R语言的安装及配置
2.1.1 R语言的获取和安装
2.1.2 RStudio的获取和安装
2.2 界面与菜单
2.2.1 RGui界面
2.2.2 RStudio界面
2.3 变量与数据类型
2.3.1 变量
2.3.2 数据类型
2.4 数据结构
2.4.1 向量
2.4.2 数组
2.4.3 矩阵
2.4.4 列表
2.4.5 数据框
2.4.6 因子
2.5 控制语句
2.5.1 条件语句
2.5.2 循环语句
2.6 函数
2.6.1 内置函数
2.6.2 自定义函数
第3章 数据预处理
3.1 数据表的基本操作
3.1.1 数据表保存
3.1.2 数据表读取
3.1.3 选取子集
3.1.4 连接数据库
3.2 数据分组、分割、合并和变形
3.2.1 数据分组
3.2.2 数据分割
3.2.3 数据合并
3.2.4 数据变形
3.3 缺失值、异常值、重复值处理
3.3.1 缺失值
3.3.2 异常值
3.3.3 重复值
3.4 数据类型的转换
3.4.1 判断数据类型函数
3.4.2 转换数据类型的函数
3.5 提取字符
3.5.1 截取字符
3.5.2 正则表达式
第4章 探索性数据分析
4.1 描述性统计方法
4.1.1 常用统计指标
4.1.2 数据总结
4.2 数据可视化
4.2.1 箱线图
4.2.2 直方图
4.2.3 散点图
4.2.4 饼图
第5章 数据采集
5.1 网络数据采集的原理
5.1.1 网页通信的过程
5.1.2 请求数据的方法
5.1.3 网页的组成元素
5.2 数据采集入门
5.2.1 数据采集常用包概述
5.2.2 数据采集前的准备
5.2.3 编写第一个数据采集
5.3 使用常用的R包采集数据
5.3.1 使用RCurl包获取网络数据
5.3.2 使用rvest包获取网络数据
5.3.3 使用httr包获取网络数据
5.4 爬虫限制处理
5.4.1 解决IP限制问题
5.4.2 验证码处理
5.4.3 登录问题处理
第6章 时间序列算法
6.1 时间序列算法概述
6.1.1 时序对象
6.1.2 时序平滑处理
6.1.3 时序季节性分解
6.2 时序指数模型
6.3 时序ARIMA模型
第7章 线性回归算法
7.1 一元线性回归模型
7.2 多项式回归模型
7.3 多元线性回归模型
第8章 分类算法
8.1 Logistic回归
8.1.1 Logistic回归算法原理
8.1.2 逻辑回归算法应用
8.2 决策树
8.2.1 决策树算法原理
8.2.2 决策树算法应用
8.3 支持向量机
8.3.1 支持向量机算法原理
8.3.2 支持向量机算法应用
8.4 朴素贝叶斯
8.4.1 贝叶斯定理
8.4.2 最大似然估计
8.4.3 朴素贝叶斯分类算法原理
8.4.4 朴素贝叶斯分类算法应用
8.5 人工神经网络
8.5.1 人工神经网络的基本概念
8.5.2 感知器和人工神经元模型
8.5.3 前馈神经网络
8.5.4 人工神经网络算法应用
8.6 随机森林
8.6.1 随机森林算法原理
8.6.2 随机森林算法应用
8.7 XGBoost算法
8.7.1 XGBoost算法的原理
8.7.2 XGBoost算法应用
第9章 关联算法
9.1 关联算法概述
9.1.1 相关名词
9.1.2 关联规则及频繁项集的产生
9.2 Apriori算法
9.2.1 Apriori算法概述
9.2.2 先验原理
9.2.3 连接步和剪枝步
9.2.4 Apriori算法流程
9.2.5 Apriori算法实例
9.3 ECLAT算法
9.3.1 ECLAT算法概述
9.3.2 ECLAT算法流程
9.3.3 ECLAT算法实例
第10章 聚类算法
10.1 聚类算法概述
10.1.1 聚类算法的类型
10.1.2 聚类算法评估的特点
10.2 K均值聚类算法
10.2.1 划分方法概述
10.2.2 K均值聚类算法的优缺点
10.2.3 K均值聚类算法的流程
10.2.4 K均值聚类分析案例
10.3 凝聚式层次聚类算法
10.3.1 凝聚式层次聚类概述
10.3.2 凝聚式层次聚类算法流程
10.3.3 凝聚式层次聚类算法实例
【应用案例1】景点舆情数据采集
【应用案例2】旅游电商平台数据采集
【应用案例3】旅游网站景点路线推荐
【应用案例4】旅游城市和景点的负荷预测
【应用案例5】精品旅行服务成单预测
【应用案例6】航班延误预测
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证