《Hadoop核心技术》是一本技术深度与企业实践并重的著作,由百度的Hadoop技术工程师撰写,是百度Hadoop技术实践经验的总结。本书从使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解。
使用:详细讲解了HDFS存储系统、MapReduce计算框架,以及HDFS的命令系统;
原理:结合源代码,深度分析了MapReduce、HDFS、Streaming、Pipes、Hadoop作业调度系统等重要技术和组件的架构设计、工作机制和实现原理;
运维:结合百度的实际生产环境,详细讲解了Hadoop集群的安装、配置、测试以及管理和运维;
开发:详细讲解了HadoopStreaming、Pipes的使用和开发实践,以及MapReduce的编程实践和常见问题。
与市面上已有的Hadoop图书相比,本书最大的不同之处是它直击企业应用和实践Hadoop技术的痛点,深入讲解了企业最需要和最头疼的技术和问题,内容非常聚焦。
展开
—— 百度网页搜索部技术总监 沈抖
★本书主要对Hadoop的基本原理和优化配置由浅入深进行了详细分析,最后通过实战案例进一步讲解分析。本书对HDFS、MapReduce以及Hadoop Streaming 和 Pipes的实现机制进行了深度分析;对Hadoop调度作了详细说明,特别是对公平调度器(FairScheduler)的设计理念和配置优化做了详细剖析,无论是对于初学者还是熟悉Hadoop的同学本书都非常适合,特别适合MapReduce的开发人员、Hadoop集群运维人员、分布式计算工程师以及做数据挖掘的工程师和架构师。
—— 大数据资深专家和AdMaster技术副总裁 卢亿雷
★作为目前使用最为广泛的大数据处理平台,把Hadoop用起来很容易,但是要“用好”很难。“用好”要充分发挥平台的能力,解决各种复杂的业务需求,高效稳定地将Hadoop应用于生产系统。本书从Hadoop的基本使用开始讲解,逐步深入到实现机制分析,最后回归到实战级的应用开发,对Hadoop的开发、运维人员来说,是“用好”Hadoop的一本不可多得的参考书。
—— 腾讯高级工程师 蔡斌
★Hadoop很好地解决了大规模数据的存储和计算问题,在百度广泛使用,是核心基础平台之一。本书深入浅出,循序渐进地介绍Hadoop的核心技术,非常适合大家学习参考。
—— 百度网页搜索部Rank主任架构师 朱文佳