Impala是 Cloudera公司主导开发的新型查询系统,它提供 SQL语义,能查询存储在 Hadoop的 HDFS和 HBase中的 PB级大数据。Impala 1.0版比原来基于 MapReduce的 Hive SQL查询速度提升 3~90倍,因此, Impala有可能完全取代 Hive。作者基于自己在本职工作中应用 Impala的实践和心得编写了《开源大数据分析引擎Impala实战》。
《开源大数据分析引擎Impala实战》共分 10章,全面介绍开源大数据分析引擎 Impala的技术背景、安装与配置、架构、操作方法、性能优化,以及最富技术含量的应用设计原则和应用案例。《开源大数据分析引擎Impala实战》紧扣目前计算技术发展热点,适合所有大数据分析人员、大数据开发人员和大数据管理人员参考使用。
展开
——Cloudera副总裁 苗凯翔博士
★Impala是Hadoop生态圈不可或缺的一个环节,它提供SQL语义,能够对HDFS和HBase中的PB级大数据进行交互式实时查询,从而弥补了Hive批处理的不足。本书是国内第一本Impala专业书籍,相信对您有益。
——中国云计算专家咨询委员会副主任、秘书长中国信息协会大数据分会副会长 刘鹏
★这是国内第一本全面讲解Impala的书籍,既可以作为想快速搭建基于Hadoop的数据仓库的原数据库爱好者们的优秀参考书籍,又可以成为对Spark感兴趣的用户的架构理解入门书籍。本书融入作者多年的数据库和分布式工作的经验,可以说是Impala在目前国内最全面、最完整的技术讲解书籍。
——EasyHadoop社区创始人eXadoop公司创始人 向磊
★作者贾传青执着于技术并乐于分享,他一直想写一本看着舒服的技术书籍。希望本书能够为有兴趣研究Impala的专业人员或学习者有所帮助。
——慧聪网CTO 郭刚
★贾先生与我在多个大数据技术领域有过深入交流,贾先生深厚的技术功底和严谨的钻研精神给我留下深刻印象。非常高兴能看见贾先生的新著。这是我截至目前看到的,阐述Impala技术和应用最体系化的中文书籍,本书将带领读者快速地掌握这个技术,打开大数据时代的窗户。
——中信证券 庄伟波
★天下武学,唯快不破,窃以为IT系统亦是如此。本书中详尽地讲解了Hadoop生态系统中的实时分析引擎Impala,相信能帮助每个读者快速地掌握这-技术。
——山西联通 郭瑜敏
★在商业领域,如何发挥“大数据”的商业价值,帮助企业形成核心能力还没有形成-个成熟的框架模式.一些运用“大数据”技术的先行者们开展了积极的尝试,传青就是其中的-位专家.他的努力,所取得的成果和工作精神值得敬佩。
——《实用数据分析》译者中国邮政 刁晓纯博士