第一篇 工具实践篇
第1章 大数据与Linux系统实践
本章学习目的
1.1 Linux操作系统
1.2 Linux虚拟机
1.3 虚拟机软件安装部署
1.4 Linux Ubuntu安装部署
1.5 Linux虚拟机导入/导出
1.6 本章小结
本章习题
第2章 Hadoop分布式框架实践
本章学习目的
2.1 Hadoop分布式框架
2.2 JDK工具包
2.3 Hadoop分布式部署
2.4 本章小结
本章习题
第3章 Spark分布式框架实践
本章学习目的
3.1 Spark介绍
3.2 在Ubuntu环境中安装Spark
3.3 本章小结
本章习题
第4章 HDFS分布式文件系统实践
本章学习目的
4.1 分布式文件系统
4.2 分布式文件系统HDFS操作
4.3 本章小结
本章习题
第5章 Anaconda应用实践
本章学习目的
5.1 Anaconda介绍
5.2 Linux中Anaconda的部署与使用
5.3 本章小结
本章习题
第6章 Python应用实践
本章学习目的
6.1 Python简介
6.2 在Ubuntu中安装Python
6.3 在IDEA中进行Python实践
6.4 本章小结
本章习题
第二篇 数据库实践篇
第7章 MySQL关系型数据库实践
本章学习目的
7.1 关系数据库
7.2 安装MySQL
7.3 MySQL常用操作
7.4 本章小结
本章习题
第8章 HBASE非关系型数据库实践
本章学习目的
8.1 NoSQL数据库
8.2 HBase概述
8.3 HBase的部署与使用
8.4 本章小结
本章习题
第9章 Redis非关系型数据库实践
本章学习目的
9.1 Redis数据库简介
9.2 Redis安装与部署
9.3 Redis的使用
9.4 本章小结
本章习题
第10章 Hive数据仓库实践
本章学习目的
10.1 数据仓库
10.2 数据仓库Hive
10.3 Hive的部署与使用
10.4 本章小结
本章习题
第三篇 编程实践篇
第11章 HDFS分布式文件系统编程实践
本章学习目的
11.1 HDFS程序设计
11.2 HDFS程序设计实践
11.3 本章小结
本章习题
第12章 MapReduce分布式编程实践
本章学习目的
12.1 分布式计算基础
12.2 MapReduce架构演变
12.3 MapReduce编程模型
12.4 MapReduce编程实践——求聚合
12.5 MapReduce编程实践——求均值
12.6 MapReduce编程实践——去重
12.7 MapReduce编程实践——单表join连接
12.8 本章小结
本章习题
第13章 Python分布式编程实践
本章学习目的
13.1 Python开发环境
13.2 在IDEA中编写Python爬虫程序
13.3 本章小结
本章习题
参考文献
附录1 Hadoop 3.2.0 HDFS命令指南
1.用户命令
2.管理命令
3.调试命令
4.Hadoop常用命令快速一览
5.HDFS命令参考
6.分布式复制
7.管理员命令
附录2 课程实践报告
部分课后题答案
展开