前言
第一部分 基础
第1章 大数据计算系统概述
1.1 大数据计算系统的定义
1.1.1 大数据
1.1.2 大数据计算
1.1.3 大数据计算系统
1.2 常见的大数据计算系统
1.2.1 批处理计算框架Hadoop
1.2.2 分布式计算框架Spark
1.2.3 流计算系统Stom
1.2.4 分布式图计算框架GraphX
1.2.5 大数据计算系统的对比
1.3 大数据计算系统的监控与运维概述
1.3.1 概述
1.3.2 监控与运维的范围
1.3.3 大数据计算系统的监控与运维方法
1.3.4 大数据计算系统的运维目标
1.4 大数据计算系统的性能优化
1.4.1 提升大数据计算系统性能的途径
1.4.2 提升大数据计算系统性能的难度
1.4.3 运维与性能优化的关系
习题1
第二部分 应用实现
第2章 Hadoop的配置与编程
2.1 批处理计算框架概述
2.1.1 计算框架
2.1.2 批处理
2.2 Hadoop环境的配置与搭建
2.2.1 环境配置前的准备
2.2.2 Hadoop安装的预备知识
2.2.3 本地/独立模式的配置
2.2.4 伪分布式模式的配置
2.2.5 全分布式模式的配置
2.3 一个简单示例
2.3.1 环境与数据的准备
2.3.2 在IDEA下建立基于Maven的Hadoop项目
2.3.3 编写WordCount程序
2.3.4 Hadoop程序的运行过程与结果查看
2.4 MapReduce编程
2.4.1 MapReduce计算模型
2.4.2 MapReduce程序的运行过程
2.4.3 去重
习题2
第3章 HDFS及其应用
3.1 HDFS概述
……
第三部分 原理
第四部分 监控、运维与调优
展开