搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Spark大数据实时分析实战
0.00     定价 ¥ 75.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787568288446
  • 作      者:
    编者:付雯//聂强|责编:王玲玲
  • 出 版 社 :
    北京理工大学出版社
  • 出版日期:
    2020-12-01
收藏
畅销推荐
内容介绍
本书分为六个项目,通过真实大数据实时分析项目的导入,引导读者完成大数据实时分析平台Spark的搭建,通过对基于Hadoop生态圈中Yarn资源调度框架,搭建Spark日志管理系统,搭建Kafka分布式消息系统,在工作中实现使用SparkStreaming实时读取Kafka中的数据进行实时处理。 本书适用于大数据技术与应用、数据科学与大数据技术等电子信息类专业教学的教材,也可作为工程技术人员的参考书。
展开
目录
项目一 初识Spark技术
任务1.1 数据处理系统
1.1.1 数据存储技术
1.1.2 数据分析技术
1.1.3 批数据和实时数据
1.1.4 数据价值挖掘
任务1.2 实时数据处理
1.2.1 实时数据的价值
1.2.2 实时数据处理技术
1.2.3 Spark实时数据处理
项目二 Spark集群的构建与安装
任务2.1 Spark集群搭建
2.1.1 平台选择
2.1.2 软件选择
2.1.3 Spark集群构建流程
任务2.2 Spark集群规划
2.2.1 Spark集群节点划分
2.2.2 软件要求
2.2.3 网络拓扑结构规划
任务2.3 Spark安装准备
2.3.1 JDK安装
2.3.2 节点间的配置
2.3.3 Spark安装包下载
任务2.4 Spark集群搭建
2.4.1 配置Master节点
2.4.2 配置Worker节点
2.4.3 分发安装包
2.4.4 启动集群
任务2.5 验证Spark
2.5.1 验证Spark进程
2.5.2 验证WEBUI界面
2.5.3 验证集群功能
任务2.6 Spark客户端搭建
2.6.1 客户端介绍
2.6.2 客户端搭建及使用
项目三 Spark基于Yarn搭建
任务3.1 基于Yarn构建介绍
3.1.1 基于Yarn搭建环境配置
3.1.2 Hadoop集群
3.1.3 启动Hadoop集群
3.1.4 验证Hadoop集群节点
任务3.2 基于Yam搭建
3.2.1 节点划分配置
3.2.2 配置Spark on Yarn
3.2.3 验证Spark on Yarn
项目四 日志服务器搭建
任务4.1 日志服务器配置
4.1.1 HDFS配置
4.1.2 Spark配置
4.1.3 启动日志服务器
4.1.4 查看日志
任务4.2 验证日志服务器
4.2.1 Spark-Shell介绍
4.2.2 查看运行日志
4.2.3 启动日志服务器
4.2.4 查看日志
项目五 Kafka集群的构建与安装
任务5.1 集群搭建
5.1.1 运行平台支持
5.1.2 软件环境
5.1.3 集群构建流程
任务5.2 集群规划
5.2.1 集群节点划分
5.2.2 软件选择
5.2.3 网络结构规划
任务5.3 安装准备
5.3.1 节点免密
5.3.2 安装ZooKeeper协调系统
任务5.4 Kafka集群搭建
5.4.1 节点配置
5.4.2 集群脚本配置
5.4.3 分发安装包
5.4.4 集群启动
项目六 Kafka集群测试
任务6.1 分布式消息系统
6.1.1 Kafka介绍
6.1.2 Kafka架构
6.1.3 Kafka的特点
6.1.4 Kafka应用场景
任务6.2 测试Kafka
6.2.1 查看集群中的Topic
6.2.2 创建Topic
6.2.3 向Topic生产消息
6.2.4 从Topic消费消息
6.2.5 offset查看
6.2.6 删除Topic信息
任务6.3 测试Kafka Leader
6.3.1 Leader均衡机制
6.3.2 测试Leader均衡机制
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证