搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
大数据开发实战
0.00     定价 ¥ 119.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787111756934
  • 作      者:
    编者:韦宇杰//楚秦|责编:张淑谦
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2024-11-01
收藏
畅销推荐
内容介绍
本书深入探讨了大数据技术的核心概念和实际应用。从大数据的基础架构Hadoop开始,逐步解析了分布式协调服务Zookeeper、数据仓库Hive、面向列的数据库HBase等关键技术。此外,还介绍了数据迁移工具Sqoop、数据采集工具Flume、发布订阅消息系统Kafka等实用工具。本书还深入讲解了数据处理分析引擎Spark、全文搜索引擎Elasticsearch及分布式处理引擎Flink的工作原理和应用实例。最后,通过电商推荐系统实战和Flink实现电商用户行为分析两个案例,展示了大数据技术在实际业务中的应用。 本书附带全书实例源代码、电子版本教程(下载方式见封底),以及可扫码观看的长达13个小时的部分实例操作视频,帮助读者更深入了解大数据技术的具体内容,非常适合对大数据技术感兴趣的读者,尤其是想要深入了解大数据技术原理和应用的开发者和管理者阅读。
展开
目录
前言
环境搭建视频教程二维码清单
第1章 大数据简介
1.1 大数据的概述
1.2 大数据的特点
1.3 大数据的应用领域
1.4 目前企业应用的主流大数据技术
1.5 大数据开发流程
第2章 大数据基础架构Hadoop
2.1 Hadoop简介
2.2 Hadoop架构详解
2.2.1 分布式存储系统HDFS
2.2.2 分布式资源管理框架YARN
2.2.3 离线计算框架MapReduce
2.3 HDFS读、写文件流程
2.3.1 HDFS写文件流程
2.3.2 HDFS读文件流程
2.4 HDFS的实战操作
2.4.1 HDFS上传文件
2.4.2 HDFS创建文件
2.4.3 HDFS创建
2.4.4 HDFS重命名文件
2.4.5 HDFS删除文件
2.5 YARN原理
2.6 YARN调度器详解
2.7 MapReduce工作原理
2.8 MapReduce核心的原理Shuffle
2.8.1 Map端
2.8.2 Reduce端
2.9 MapReduce常用三大组件
2.9.1 MapReduce中的Partitioner
2.9.2 MapReduce中的Sort
2.9.3 MapReduce中的Combiner
2.10 MapReduce项目实战
2.10.1 清洗日志
2.10.2 统计电影最高评分
第3章 分布式协调服务Zookeeper
3.1 ZooKeeper简介
3.2 ZooKeeper结构和工作原理
3.2.1 ZooKeeper集群角色
3.2.2 ZooKeeper的数据结构
3.2.3 ZooKeeper的工作流程
3.2.4 ZooKeeper的监听器
3.3 ZooKeeper实战
3.3.1 ZooKeeper创建持久节点
3.3.2 ZooKeeper创建临时节点
3.3.3 ZooKeeper递归创建节点
3.3.4 ZooKeeper读取数据
3.3.5 ZooKeeper更新数据
3.3.6 ZooKeeper监听节点
3.3.7 ZooKeeper监听子节点
3.3.8 ZooKeeper实现服务注册与发现
第4章 数据仓库Hive
4.1 Hive简介和特点
4.2 Hive结构和原理
4.2.1 Hive结构
4.2.2 Hive运行的流程
4.2.3 Hive的HQL转换过程
4.3 电商用户行为分析
4.3.1 项目背景及目的
4.3.2 数据导入
4.3.3 数据清洗
4.3.4 数据分析
第5章 面向列的数据库HBase
5.1 HBase简介
5.2 HBase架构
5.2.1 HBase的组件
5.2.2 HBase工作机制
5.3 HBase数据模型
5.4 HBase读写流程
5.4.1 HBase写操作流程
5.4.2 HBase读操作流程
5.5 HBase的API示例
5.5.1 HBase创建表
5.5.2 HBase保持数据
5.5.3 HBase更新数据
5.5.4 HBase获取数据
5.5.5 HBase删除数据
5.5.6 使用HBase获取某一行数据
5.6 HBase存储订单案例
第6章 大数据开发实战数据迁移工具Sqoop
6.1 Sqoop架构和工作原理
6.1.1 Sqoop导入原理
6.1.2 Sqoop导出原理
6.2 Sqoop将HDFS数据导入MySQL
6.3 Sqoop将MySQL数据导入HDFS
第7章 数据采集工具Flume
7.1 Flume简介
7.2 Flume构成和工作原理
7.2.1 Flume构成
7.2.2 Flume工作原理
7.3 Flume实战
7.3.1 Flume监听目录实战
7.3.2 Flume一对多实战
7.3.3 Flume拦截器实战
7.3.4 Flume采集数据到HDFS
7.3.5 Kafka对接Flume实战
第8章 发布订阅消息系统Kafka
8.1 Kafka 简介
8.2 Kafka的消息生产者
8.2.1 Kafka生产者的运行流程
8.2.2 Kafka生产者分区
8.2.3 副本的同步复制和异步复制
8.2.4 Kafka消息发送确认机制
8.3 Kafka的Broker保存消息
8.3.1 存储方式与策略
8.3.2 Topic创建与删除
8.4 Kafka的消息消费者
8.4.1 消费机制
8.4.2 消费者组
8.5 Kafka 的存储机制
8.5.1 Kafka主题Topic
8.5.2 Kafka分片Partition
8.5.3 Kafka日志Segment File
8.6 Kafka 实战
8.6.1 Kafka发送消息
8.6.2 Kafka自定义分区发送消息
8.6.3 Spring Boot整合Kafka发送消息
第9章 数据处理分析引擎Spark
9.1 Spark 简介
9.2 Spark 运行原理
9.2.1 Spark的基本概念
9.2.2 Spark运行的原理
9.2.3 Driver运行在Client
9.2.4 Driver运行在Worker节点
9.3 Spark算子RDD
9.3.1 RDD的属性
9.3.2 RDD的依赖关系
9.3.3 RDD的shuffle过程
9.3.4 RDD的缓存和检查机制
9.4 Spark SQL
9.4.1 Spark SQL概念
9.4.2 Spark SQL的架构
9.4.3 DataSets和DataFrames
9.4.4 Spark SQL示例
9.5 Spark Streaming
9.5.1 Spark Streaming介绍
9.5.2 DStream转换操作
9.5.3 Spark Streaming窗口操作
9.5.4 DStream输入
9.5.5 DStream输出
9.5.6 DSFrame和SQL操作
9.5.7 Spark Streaming检查点
9.6 Spark Streaming接收Flume数据实战
9.7 Spark Streaming接收Kafka数据实战
第10章 全文搜索引擎Elasticsearch
10.1 Elas
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证