搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Storm实战:构建大数据实时计算
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787121226496
  • 作      者:
    阿里巴巴集团数据平台事业部商家数据业务部编著
  • 出 版 社 :
    电子工业出版社
  • 出版日期:
    2014
收藏
编辑推荐
    Storm以其简单、灵活、健壮而著称。随着大数据实时处理需求的强劲增长,Storm的出现填补了大数据处理生态系统的缺失,并被越来越多的公司所采用。
《Storm实战:构建大数据实时计算 》来自阿里巴巴集团数据平台事业部商家数据业务部一线经验的分享。团队专注于“数据让生意更简单”的大数据应用使命,一直致力于解决商家的大数据应用需求。并开发出量子恒道店铺经、江湖策、御膳房等重量级大数据开发、计算和分析工具。团队很早便开始使用Storm来处理实时大数据,结合实际的应用场景,积累了丰富的实践经验。《Storm实战:构建大数据实时计算》正是这些经验和心得的结晶,它一一解答了是Storm是什么,怎么做,如何做更好等关键的实际问题,对于从事大数据处理与分析的读者而言,是一本相当有价值的学习参考手册。
阿里巴巴集团技术丛书是抱持着为工程师服务的理念诞生的。
阿里的快速发展,使我们有机会见证技术变革的强大力量。在这过程中,我们经历了技术的变迁、兴衰、成败,既有收获也有教训。如今,阿里已成为一家令人瞩目的互联网公司,站在这样的时点上,回顾过去,放眼四周,我们深刻地觉得有必要将沉淀下来的一线经验与智慧,结集出版,理由有三。
1.回报。我们获得的种种经验与教训,只有在阿里这样快速成长、体量巨大的公司中才有机会亲历。这样的技术环境并不是每个工程师都有机缘遇到的。这些经历帮助了我们个人能力的提升,也帮助阿里成为一家技术实力过硬的公司。我们愿意把这些内容分享出来,帮助即将或已经面临类似问题的朋友们,如果他们可以从阅读中获得一些启发而少走弯路的话,将是我们的欣慰。
2.交流。在这套丛书里,我们同样会抛出我们的困惑、问题,借助丛书的平台,扩大工程师沟通的圈子,以书会友,共同探索、学习、提高。
3.温故知新。以结集的形式,将以往的经验与知识固化下来,既可便于以后查阅,也可以帮助我们系统地梳理思路,更为全面地审视、洞察、并理解过去发生的种种,为未来的变化做好更充分、扎实的准备。
基于以上的考虑,阿里巴巴集团技术丛书将立足于实践,着眼于问题,从工程师的视角解读技术的内涵。
让思考成为我们生活的乐趣,让阅读成为我们进步的阶梯!
展开
作者简介
  商家数据业务部, 隶属于阿里巴巴集团数据平台事业部,致力于“数据让生意更简单”的大数据应用使命。几年来,一直专注于解决商家的大数据应用需求,通过量子恒道店铺经已支撑起超过400万商家的日常经营决策,并为100万商家提供淘宝官方流量管理工具?D?D江湖策,让深度探索、优化流量成为可能。2013年开创性地推出云数据平台?D?D御膳房,作为完善的大数据开放、计算和分析云平台,打通了“阿里大数据”与“开放平台和服务市场体系”,为淘宝生态中的ISV和卖家提供海量丰富的阿里大数据、强大稳定的云计算处理能力和安全的数据应用开发容器,支持淘宝生态圈发展基于大数据分析的创新应用,深度助力卖家降低经营成本、提升效率,已为数百万的商家提供经营链路中的大数据应用解决方案。
  支撑这些的,是对大数据的分布式计算、仓库建设、数据挖掘、高并发网站构建、数据可视化等各个领域前沿技术的深入探索和应用。
展开
内容介绍
  随着大数据实时处理需求的强劲增长,Storm的出现填补了大数据处理生态系统的缺失,并被越来越多的公司所采用。阿里巴巴集团数据平台事业部商家数据业务部正是最早使用Storm的技术团队之一。
  《Storm实战:构建大数据实时计算》是一本系统并且具有实践指导意义的Storm工具书和参考书,对Storm整个技术体系进行了全面的讲解,不仅包括对基本概念、特性的介绍,也涵盖了一些原理说明。
  实战性很强,各章节都提供了一些小案例,同时对于本地,以及集群环境的部署有详细介绍,易于理解,操作性强。
  《Storm实战:构建大数据实时计算 》一共分为10章:第1章全面介绍了Storm的特性、能解决什么问题,以及和其他流计算系统的对比;第2章通过实际运行一个简单的例子,以及介绍本地环境和集群环境的搭建,让读者对Storm有了直观的认识;第3章深入讲解了Storm的基本概念,同时实现一个Topology运行;第4章和第5章阐述了Storm的并发度、可靠处理的特性;第6章~第8章详细而系统地讲解了几个高级特性:事务、DRPC和Trident;第9章以实例的方式讲解了Storm在实际业务场景中的应用;第10章总结了几个在大数据场景应用过程中遇到的经典问题,以及详细的排查过程。
展开
目录
第1章 Storm基础
1.1 Storm能做什么
1.2 Storm特性
1.3 其他流计算系统
1.4 应用模式

第2章 Storm初体验
2.1 本地环境搭建
2.2 Storm集群

第3章 构建Topology
3.1 Storm基本概念
3.2 构建Topology
3.3 小结

第4章 Topology的并行度
4.1 并行元素
4.2 配置并行度
4.3 一个运行中Topology的例子
4.4 如何更新运行中的Topology的并行度

第5章 消息的可靠处理
5.1 简介
5.2 理解消息被完整处理
5.3 消息的生命周期
5.4 可靠相关的API
5.5 高效地实现tupletree
5.6 选择合适的可靠性级别
5.7 集群的各级容错
5.8 小结

第6章 一致性事务
6.1 简单设计一:强顺序流
6.2 简单设计二:强顺序batch流
6.3 CoordinateBolt的原理
6.4 TransactionalTopology

第7章 DRPC
7.1 StormDRPC
7.2 总体概述
7.3 LinearDRPCTopologyBuilder
7.4 本地模式DRPC
7.5 远程模式DRPC
7.6 一个复杂的例子
7.7 非线性DRPC拓扑
7.8 LinearDRPCTopologyBuilder工作过程
7.9 高级进阶

第8章 Trident的特性
8.1 理解Trident
8.2 结合多个Trident任务
8.3 消费和生产Field
8.4 State(状态保存)
8.5 TridentTopology的执行过程
8.6 总结

第9章 Storm实例
9.1 一个简单的实例
9.2 复杂一点的实例
9.3 其他

第10章 常见应用问题分析
10.1 性能问题排查与定位
10.2 系统中常见的问题与排查
10.3 业务问题的定位与排查
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证