搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
云原生数据中台:架构、方法论与实践:architecture, methodology and practice
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787111678465
  • 作      者:
    彭锋,宋文欣,孙浩峰著
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2021
收藏
编辑推荐

(1)作者在Twitter等硅谷独角兽企业有多年大数据平台架构与开发经验,同时又在国内有数年数据中台建设经验,本书在内容上对这两方面的经验进行了充分比较和深度融合。

(2)本书得到了武汉大学计算机学院前院长、FaceBook和Twitter前工程总监、明略科技副总裁等多位国内外学术界和企业界专家的一致好评。

(3)从云原生角度切入,全面讲解云原生数据中台的架构、技术选型、落地方法论、实施路径和行业案例。


展开
作者简介

彭锋 

智领云科技联合创始人兼CEO

武汉大学计算机系本科及硕士,美国马里兰大学计算机专业博士,主要研究方向是流式半结构化数据的高性能查询引擎,在数据库顶级会议和期刊SIGMOD、ICDE、TODS上发表多篇开创性论文。

2005年加入世界五百强企业IAC Ask.com,任分布式系统及大数据工程总监,负责研发分布式操作系统及中间件,以及集团大数据平台的建设。2011年加入Twitter,任大数据平台主任工程师、公司架构师委员会大数据负责人,负责公司大数据平台及流水线的建设和管理。作为硅谷天使投资人,曾投资硅谷多家大数据相关初创企业,并担任技术指导和行业顾问。2016年回国联合创立智领云科技有限公司。


宋文欣

智领云科技联合创始人兼CTO

武汉大学计算机系本科及硕士,美国纽约州立大学石溪分校计算机专业博士。曾先后就职于Ask.com和EA(电子艺界)。在Ask.com期间,担任大数据部门技术负责人及工程经理,使用Hadoop集群处理实时搜索数据,形成全球第1大Search Ads Arbitrage用户;在EA期间,担任数字平台部门高级研发经理,从无到有组建EA数据平台团队,建设公司大数据平台,为EA全球工作室提供数据能力支持。

2016年回国联合创立智领云科技有限公司,组建智领云技术团队,开发了BDOS大数据平台操作系统。


孙浩峰

智领云科技市场总监

前CSDN内容运营副总编,负责网站内容和商务合作、新媒体方面事宜,关注云计算、大数据、人工智能、区块链等技术领域,对云计算、网络技术、网络存储有深刻认识。拥有丰富的媒体从业经验和专业的网络安全技术功底,具有超过15年的企业级IT市场传播、推广、宣传和写作经验,撰写过多篇在业界具有一定影响力的文章。


展开
内容介绍

这是一部从云原生角度讲解数据中台的业务价值、产品形态、架构设计、技术选型、落地方法论、实施路径和行业案例的著作,得到了国内外企业界和学术界的技术专家一致好评。

本书的作者在曾硅谷的Twitter等企业从事大数据平台的建设工作多年,随后又成功创办了国内领先的以云原生数据中台为核心技术和产品的企业。他们将在硅谷的大数据平台建设经验与在国内的数据中台建设经验进行深度融合,并系统阐述了云原生架构对数据中台的必要性及其相关实践,对国内企业的中台建设和运营具有很高的参考价值。

全书共18章,分为四个部分:

第1部分(第1~4章) 数据中台与硅谷大数据平台

首先,从起源、定义、能力、应用场景、建设目标、建设方法论总纲等角度对数据中台做了全面的介绍;其次,讲解了数据中台如何驱动数字化转型;Z后,通过对硅谷的Twitter等独角兽企业的数据平台和国内的数据中台进行对比,给出了这两种架构之间的异同点。核心内容是让读者透彻理解数据中台对于业务的价值。

第二部分(第5~8章) 数据中台架构与方法论

结合硅谷的数据平台的架构方法,讲解了数据中台的架构方法和9大原则、数据中台建设的全套准备工作和系统方法论,以及云原生架构与数据中台的融合。

第三部分(第9~15章)数据中台技术选型与核心内容

首先,全方位地介绍了建设数据中台时如何进行技术选型,然后重点讲解了数据湖、数据仓库、数据资产管理、数据流水线管理、数据中台应用开发、数据门户等数据中台建设的核心内容。

第四部分(第16~18章)数据中台案例分析

通过游戏、零售、物联网3个领域的案例讲解了数据中台的搭建、实现与运营。


展开
精彩书评

数字化转型是很多企业面临的巨大挑战,但是很多企业家根本没有意识到,除了管理上的变革,正确选择体系架构和底层技术也是成功必不可少的核心因素。本书重点讨论和介绍了分布式计算、大数据开发等技术的Z新进展,以及架构选择与业务需求之间的关联关系,同时从管理和技术的角度解读了数据中台的来龙去脉,试图为正在解决这些问题的企业和机构提供架构设计和方案落地等方面的参考。 

——何炎祥  武汉大计算机学院原院长/教授

 

在我Twitter负责Identity部门,包括私信、个人主页、和整个公司安全团队,如何使用大数据完成我们部门非常有挑战的工作。特别安全部门需要快速实时访问所有数据来在200毫秒内做出安全判断来防止任何形式的攻击(欺诈、盗号、假信息、垃圾信息)。 作为Facebook和Twitter的早期员工,我第1时间感受了这两家公司的开源文化对于全世界技术发展的影响。虽然Twitter内部没有数据中台这个名词,但我们充分体会到了云平台及大数据平台给企业生产力带来的巨大提升。希望这本书能够帮助大家更深入地了解云原生数据平台,充分发挥数据的威力。

 ——Roger Chen  投资人/前FaceBook、Twitter工程总监 


我与彭锋、宋文欣在Ask和EA都曾一起负责过大数据平台从无到有的建设。他们在大数据平台建设、扩展和如何为业务赋能等关键问题上都有前瞻性的思考和成功实践。在他们的带领下,大数据平台成为公司建设数据驱动文化以更好地服务用户、更快地拓展市场的核心驱动力。

——Navid Aghdaie  前Ask.com VP of Analytics, Head of Data & AI, Electronic Arts  


数据作为一种新的生产要素,不仅能够为企业赋能,而且可能成为资产,为企业创造直接价值,这不但是国家鼓励的战略方向,也是国际上区块链产业发展的重要趋势。本书以中台架构为立足点,实际上给出了一套创建数据资产的完整思路和技术架构,弥足珍贵。

 ——孟岩  Solv协议联合创始人/优证链通联合创始人/前CSDN副总裁


本书重视历史沿革,首先对信息化、数据仓库、大数据平台和数据中台等做了深入浅出的剖析;接着分析了数据中台与云原生之间的关系,使人有醍醐灌顶之感;Z后从数据中台建设与开源软件之间的关系切入,对应用技术、数据基础和集成开发的开源技术选型进行逐一分析,具有很强的指导性和实操性。

 ——卢亿雷 明略科技集团副总裁/中国计算机学会大数据常委和高性能委员/北京航空航天大学特聘教授

 

我与三位作者是老朋友,曾被初稿震撼到,料定本书必定会成为数据中台领域的经典之作。它详细介绍了数据中台的建设方法论和架构方法、数据中台与数字化转型,以及国内与硅谷公司的数据中台实践案例等,既有理论高度,又有实践指导意义。

 ——黄哲铿  中通快递集团研发创新总监 


展开
目录

前言

第一部分 数据中台与硅谷大数据平台

第1章 全面了解数据中台

1.1 数据中台概念的起源 3

1.1.1 艺电的“数据中台”改造 4

1.1.2 Twitter的数据驱动 6

1.2 什么是数据中台 8

1.2.1 数据中台建设的目标 8

1.2.2 如何实现数据中台建设的目标 11

1.2.3 数据中台的定义和4个特点 13

1.3 大数据平台与数据中台 16

1.3.1 为什么要建设数据中台 16

1.3.2 数据中台与传统大数据平台的区别 20

1.3.3 数据中台的评判标准 24

1.4 数据中台建设方法论总纲 24

1.5 本章小结 27

第2章 数据中台能力和应用场景

2.1 数据中台不是“银弹” 28

2.2 数据中台的核心能力 31

2.2.1 全局商业洞见 31

2.2.2 个性化服务 34

2.2.3 实时数据报表 38

2.2.4 共享能力开发新业务 39

2.3 数据中台的行业应用场景 41

2.3.1 互联网行业 41

2.3.2 连锁零售业 42

2.3.3 金融业 43

2.3.4 物联网 44

2.4 数据中台如何为企业赋能 45

2.4.1 组织架构 46

2.4.2 决策部门 48

2.4.3 业务部门 51

2.4.4 研发部门 53

2.4.5 大数据部门 55

2.5 本章小结 56

第3章 数据中台与数字化转型

3.1 数字化转型的4个阶段 58

3.1.1 信息化 58

3.1.2 数据仓库(数据平台1.0) 59

3.1.3 大数据平台(数据平台2.0) 61

3.1.4 数据中台(数据平台3.0) 63

3.2 数据驱动 64

3.2.1 面向用户的数据驱动产品及服务 66

3.2.2 面向内部业务部门的数据驱动服务 68

3.2.3 数据驱动的系统管理 71

3.3 数据中台如何支持数字化转型 72

3.3.1 从技术层面支持数字化转型 73

3.3.2 从组织架构层面支持数字化转型 74

3.4 本章小结 75

第4章 从大数据平台到数据中台

4.1 大数据平台建设阶段 76

4.1.1 大数据平台起步 77

4.1.2 系统自动化 77

4.1.3 大数据平台的生产化 78

4.2 数据管理及应用阶段 80

4.2.1 数据湖/数据仓库建设 80

4.2.2 数据管理 81

4.2.3 数据安全 82

4.3 数据能力中台化阶段 84

4.3.1 全局的数据治理 85

4.3.2 数据能力的复用和共享 85

4.3.3 云原生架构的支撑 85

4.4 DataOps 87

4.4.1 什么是DataOps 87

4.4.2 DataOps解决的问题 88

4.4.3 DataOps的目标功能 90

4.4.4 DataOps的主要技术 91

4.4.5 DataOps与数据中台 92

4.5 本章小结 93

第二部分 数据中台架构与方法论

第5章 数据中台建设须知

5.1 数据中台建设需要一套方法论 96

5.2 从失败的大数据项目中吸取教训 98

5.3 数据中台建设中的常见问题 99

5.4 评判数据中台建设效果 101

5.5 数据中台建设的人员规划 103

5.6 数据中台的技术选型要求 106

5.7 本章小结 107

第6章 数据中台建设方法论

6.1 基础架构 109

6.2 数据工具 114

6.3 顶层架构设计 115

6.4 数据规范 116

6.5 业务驱动 118

6.6 关键指标 120

6.7 明确责权利 125

6.8 管理迭代 127

6.9 数据中台建设流程 128

6.10 本章小结 130

第7章 数据中台的架构

7.1 数据中台的功能定位 132

7.2 数据中台架构设计的9大原则 135

7.3 典型的硅谷大数据平台架构 137

7.3.1 Twitter的大数据平台架构 137

7.3.2 Airbnb的大数据平台架构 140

7.3.3 Uber的大数据平台架构 141

7.3.4 云平台作为大数据平台的通用底座 143

7.3.5 硅谷大数据平台架构的共性和建设思路 145

7.4 数据中台架构 147

7.5 数据中台子系统 150

7.5.1 应用基础能力平台 151

7.5.2 数据基础能力平台 152

7.5.3 数据集成开发平台 154

7.5.4 数据资产运营平台 156

7.5.5 数据业务能力层 158

7.5.6 数据中台重点建设内容 159

7.6 本章小结 160

第8章 数据中台与云原生架构

8.1 云原生架构及云平台 161

8.2 PaaS平台的主要功能 165

8.2.1 资源管理 167

8.2.2 应用全生命周期管理 169

8.2.3 高可用和容错 170

8.2.4 运维平台 172

8.3 传统方式下搭建数据中台的难点 173

8.4 云原生架构对于数据中台建设的5大意义 175

8.5 数据中台的IaaS层选择 178

8.6 本章小结 180

第三部分 数据中台技术选型与核心内容

第9章 数据中台建设与开源软件

9.1 开源软件的起源和建设过程 185

9.2 开源软件的合理使用 189

9.3 集成开源软件的5个注意事项 192

9.4 应用基础能力平台的开源选择 193

9.5 数据基础能力平台的开源选择 196

9.6 数据集成开发平台的开源选择 203

9.7 本章小结 205

第10章 数据湖与数据仓库

10.1 数据湖 207

10.1.1 数据湖的起源与作用 208

10.1.2 数据湖建设的4个目标 211

10.1.3 数据湖数据的采集和存储 212

10.1.4 数据湖中的数据治理 216

10.2 数据仓库 218

10.2.1 数据建模方式 219

10.2.2 数据仓库建设的层次 221

10.2.3 数据仓库中的数据治理 225

10.2.4 数据清洗 229

10.3 数据中台中的数据仓库和数据湖建设 231

10.4 本章小结 233

第11章 数据资产管理

11.1 数据资产管理的难题 235

11.2 数据资产管理定义 238

11.3 主数据管理 239

11.4 元数据管理 242

11.4.1 元数据的分类 243

11.4.2 元数据管理系统的功能 245

11.5 开源的元数据管理系统 247

11.6 数据资产的ROI 249

11.7 本章小结 250

第12章 数据流水线管理

12.1 数据流水线的定义与模型 251

12.2 数据流水线中的应用类别 254

12.3 数据流水线的运行方式 256

12.4 数据流水线示例 257

12.5 数据流水线管理系统面临的挑战 259

12.6 数据流水线管理系统的功能需求 262

12.6.1 自动化流水线 262

12.6.2 数据管理 263

12.6.3 性能要求 264

12.7 数据流水线管理系统的组件 265

12.8 批流合一的数据流水线 266

12.9 本章小结 269

第13章 数据中台应用开发

13.1 数据应用的形态 270

13.2 应用开发工具 277

13.3 3种典型的数据中台应用 279

13.3.1 数据即服务 279

13.3.2 模型即服务 281

13.3.3 用户标签系统 282

13.4 数据中台应用的开发和管理 283

13.4.1 应用调度系统 284

13.4.2 多租户管理 285

13.4.3 持续集成和发布 286

13.5 本章小结 287

第14章 数据门户

14.1 数据门户出现的背景 288

14.2 硅谷的数据门户建设 289

14.2.1 Twitter的DAL和EagleEye 290

14.2.2 LinkedIn的Data Hub 292

14.2.3 Airbnb的Data Portal 293

14.2.4 Lyft的Amundsen 294

14.2.5 Netflix的Metacat 296

14.2.6 Intuit的SuperGlue 297

14.2.7 硅谷数据门户总结 298

14.3 数据门户的定位及功能 299

14.4 数据门户的实现原理 301

14.5 数据门户的社交属性 303

14.6 数据应用的自助及协同工作 304

14.7 数据智能运维 306

14.8 本章小结 308

第15章 管理数据中台的演进

15.1 不断演进的数据中台 310

15.2 人员变动下的数据管理 310

15.2.1 数据安全 311

15.2.2 数据能力的传递 312

15.3 数据和应用的演进 314

15.4 资源的演进 316

15.5 演进中的关键指标 318

15.6 本章小结 321

第四部分 数据中台案例分析

第16章 EA“数据中台”实践

16.1 建设背景 324

16.2 组织架构调整 327

16.3 建设过程 328

16.4 体系架构 333

16.5 数据治理 336

16.5.1 数据标准和规范 336

16.5.2 元数据管理 338

16.5.3 数据质量管理 339

16.6 数据应用产品 340

16.6.1 推荐系统 340

16.6.2 打造动态游戏体验 341

16.6.3 标签系统及游戏运营 343

16.7 EA“数据中台”功能总结 344

16.8 本章小结 345

第17章 零售行业的数据中台

17.1 零售行业的数字化转型 346

17.2 零售行业数据中台解决方案 347

17.3 零售行业数据中台的建设 349

17.3.1 数据汇聚 350

17.3.2 业务调研 352

17.3.3 数据仓库建设及数据分析 354

17.3.4 业务系统的能力反馈 356

17.4 零售行业数据中台的应用场景 357

17.4.1 用户标签体系 357

17.4.2 精准市场营销 359

17.5 本章小结 361

第18章 物联网领域数据中台建设

18.1 现代物联网的产业链 362

18.2 物联网与ABC 365

18.3 物联网数据中台架构 366

18.4 智慧建筑物联网数据中台应用 371

18.5 本章小结 374

展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证