这是一本理论高度概括的书,从定义(what)、位置(where)、时机(when)和方法(how)的角度讲解流式处理最核心、最本质的概念、特性、设计和思考方式。
本书分为两部分:第一部分以Beam的编程模型为抓手讨论流式处理的种种核心问题,重点是相对高层次地讨论批处理数据处理模型以及流式数据处理模型;第二部分讨论流与表的二象性,即两者之间的类比与差异,对概念进行深入探讨,并讨论关于流式处理的“流和表”的思考方式。本书还概要浏览大数据处理系统的家族历史,深入讨论流式系统发展领域的一些重要贡献。
本书覆盖流式系统的核心理论和本质概念,适合大数据系统爱好者、相关专业学生、数据工程师、数据科学家和开发人员阅读和参考。尽管本书只是流式系统的导论读物,但是仍然需要读者了解大数据处理系统的基本原理并具备相关的使用经验。
展开