前言
第1章 打造腾讯大数据平台
1.1 腾讯大数据的缘起
1.2 腾讯大数据的构建理念
1.3 腾讯大数据的总体架构
第2章 数据实时采集平台
2.1 接入层挑战
2.2 接入管理层TDManager
2.3 数据采集
2.4 数据总线
2.5 消息中间件
2.6 数据分拣
2.7 接入层展望
第3章 分布式存储平台
3.1 文件存储HDFS
3.2 统一存储Ceph
3.3 下一代大数据存储Ozone
3.4 KV存储HBase
第4章 分布式计算平台
4.1 批处理MapReduce
4.2 批处理Spark
4.3 批处理漂移计算SuperSQL
4.4 流处理Flink
4.5 SQL数据仓库Hive
4.6 任务调度
第5章 数据分析引擎
5.1 关系型OLAP:腾讯实时多维分析平台
5.2 关系型OLAP:ClickHouse
5.3 多维OLAP:Kylin
5.4 多维OLAP:Druid
第6章 资源调度平台
6.1 Yarn项目背景
6.2 调度器性能优化
6.3 集群的高可用性
6.4 多资源维度弹性管理
第7章 数据治理体系
7.1 元数据
7.2 数据资产管理
7.3 大数据安全
第8章 机器学习平台
8.1 图智能平台
8.2 Angel
8.3 联邦学习
第9章 数据内容挖掘
9.1 概览
9.2 广告内容挖掘
9.3 用户画像数据体系
9.4 用户画像构建方法
9.5 数据内容挖掘与推荐
9.6 数据内容挖掘与AI创作
第10章 大数据平台运营
10.1 大数据服务规划
10.2 大数据平台治理
10.3 自动化运维体系构建
10.4 平台运营成本优化
10.5 大数据运营分析与应用体系
第11章 大数据平台产品设计
11.1 TBDS大数据处理套件
11.2 Oceanus实时流式数据处理平台
11.3 ideX数据分析与探索挖掘工具
11.4 智能钛TI机器学习平台
第12章 企业级容器云平台GaiaStack
12.1 GaiaStack产品背景和目标
12.2 GaiaStack架构和技术特点
12.3 GaiaStack核心技术
第13章 大数据应用服务
13.1 智能客服机器人
13.2 移动推送
13.3 数据可视化产品小马BI
参考文献
展开