搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Hadoop与Spark大数据全景解析(视频教学版)
0.00     定价 ¥ 98.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302684800
  • 作      者:
    编者:邓杰|责编:赵军
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2025-04-01
收藏
畅销推荐
内容介绍
本书结合作者多年在大数据领域的开发实践经验,采用“理论+实战”的形式,以大量实例全面介绍Hadoop和Spark的基础知识及其高级应用。作者将丰富的教学经验,融入为读者精心录制的配套教学视频中,并提供了书中所有实例的源码,方便读者学习和实践。 本书分为4篇,共12章。第1篇(第1、2章)准备篇,主要介绍Hadoop和Spark的基本概念,以及如何快速搭建Hadoop和Spark的学习环境。第2篇(第3~6章)入门篇,涵盖Hadoop的高级特性、Spark的基础知识与高级特性,以及大数据安全。第3篇(第7~10章)进阶篇,深入讲解数据采集与清洗、数据存储与管理、数据分析与挖掘以及实时数据处理。第4篇(第11、12章)项目实战篇,通过Hadoop和Spark实现一站式数据分析系统设计,以及ChatGPT赋能Hadoop与Spark大数据分析的项目实战。 本书内容全面、结构清晰、案例丰富,既适合初学者自学,也适合开发者阅读,还可作为培训机构和高校相关课程的教学参考书。
展开
目录
第1篇 准备
第1章 了解Hadoop和Spark
1.1 什么是大数据处理
1.1.1 大数据概述
1.1.2 数据处理的挑战
1.2 为什么选择Hadoop和Spark
1.2.1 Hadoop的优势
1.2.2 Spark的优势
1.3 典型的大数据应用案例
1.3.1 行业应用案例
1.3.2 成功案例分析
1.4 Hadoop和Spark的设计理念
1.4.1 设计初衷
1.4.2 解读Hadoop和Spark的特性
1.5 本章小结
第2章 快速搭建Hadoop和Spark学习环境
2.1 Hadoop简介
2.1.1 起源与发展
2.1.2 核心组件介绍
2.2 基础环境的安装与配置
2.2.1 基础软件下载
2.2.2 实例:Linux操作系统的安装与配置
2.2.3 实例:SSH的安装与配置
2.2.4 实例:Java运行环境的安装与配置
2.2.5 实例:安装与配置Zookeeper
2.3 Hadoop和Spark环境搭建
2.3.1 实例:Hadoop环境搭建
2.3.2 实例:Spark环境搭建
2.4 HadoopMapReduce基础
2.4.1 MapReduce编程模型之Map阶段
2.4.2 MapReduce编程模型之Reduce阶段
2.5 本章小结
2.6 习题
第2篇 入门
第3章 Hadoop高级特性
3.1 HDFS架构深度解析
3.1.1 HDFS架构
3.1.2 数据块管理
3.1.3 命名空间
3.1.4 数据一致性
3.2 YARN调度器与资源管理
3.2.1 YARN基本原理
3.2.2 资源分配策略
3.3 Hadoop数据安全性
3.3.1 安全策略概述
3.3.2 Kerberos认证
3.4 Hadoop性能调优
3.4.1 集群性能监控
3.4.2 参数调优指南
3.5 Hadoop实战案例
3.5.1 实际问题解决
3.5.2 最佳实践分享
3.6 本章小结
3.7 习题
第4章 Spark基础特性
4.1 Spark简介
4.1.1 Spark发展历程
4.1.2 Spark核心思想
4.2 Spark核心组件
4.2.1 SparkCore
4.2.2 SparkSQL
4.3 Spark基本数据结构
4.3.1 RDD概述
4.3.2 DataFrame和DataSet介绍
4.4 内存管理
4.4.1 内存分配策略
4.4.2 内存回收机制
4.5 本章小结
4.6 习题
第5章 Spark高级特性
5.1 SparkSQL与结构化数据处理
5.1.1 使用SparkSQL进行数据查询和分析
5.1.2 SparkSQL数据类型与函数使用
5.2 SparkStreaming与实时数据处理
5.2.1 SparkStreaming的基本概念与架构
5.2.2 SparkStreaming与Kafka的集成与应用
5.3 SparkMLlib与机器学习
5.3.1 SparkMLlib的常用算法与应用场景
5.3.2 SparkMLlib与TensorFlow的比较与集成
5.4 SparkGraphX与图计算
5.4.1 图计算的基本概念与SparkGraphX的架构
5.4.2 SparkGraphX的常用算法与图数据处理
5.5 本章小结
5.6 习题
第6章 大数据安全
6.1 大数据安全性挑战
6.1.1 大数据安全的重要性
6.1.2 Hadoop与Spark安全特性
6.2 Hadoop安全架构
6.2.1 Hadoop安全模型
6.2.2 HDFS与YARN的安全机制
6.3 Spark安全实践
6.3.1 Spark的安全配置
6.3.2 Spark应用程序的访问控制
6.4 数据加密与隐私保护
6.5 身份认证与授权
6.6 本章小结
6.7 习题
第3篇 进阶
第7章 数据采集与清洗
7.1 Hadoop数据采集
7.1.1 数据源与采集工具
7.1.2 Hadoop数据采集流程与案例
7.2 Spark数据采集
7.2.1 Spark数据源接入方式
7.2.2 Spark数据采集的实践与优化
7.3 Hadoop数据清洗
7.3.1 数据清洗的基本概念与策略
7.3.2 使用MapReduce进行数据清洗
7.4 Hadoop与Spark数据处理对比
7.5 本章小结
7.6 习题
第8章 数据存储与管理
8.1 大数据存储架构
8.1.1 存储架构的演变
8.1.2 存储架构选择指南
8.2 存储格式与压缩
8.2.1 数据格式比较
8.2.2 压缩算法分析
8.3 数据分区与分桶
8.3.1 数据分区
8.3.2 数据分桶
8.4 数据仓库设计
8.5 本章小结
8.6 习题
第9章 数据分析与挖掘
9.1 大数据分析
9.2 数据挖掘算法
9.2.1 数据挖掘算法的分类与应用场景
9.2.2 常见的大数据挖掘算法及其实现原理
9.3 特征工程
9.3.1 特征提取与构建
9.3.2 特征类型与数据分析方法
9.4 本章小结
9.5 习题
第10章 实时数据处理
10.1 实时处理概念
10.1.1 实时数据处理的定义
10.1.2 实时数据处理与批处理对比
10.2 SparkStreaming
10.2.1 DStream
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证