搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
数字化转型实践(构建云原生大数据平台)/数字化转型理论与实践系列丛书
0.00     定价 ¥ 109.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787121440069
  • 作      者:
    编者:金鑫//武帅|责编:王群
  • 出 版 社 :
    电子工业出版社
  • 出版日期:
    2022-08-01
收藏
畅销推荐
内容介绍
21世纪,互联网行业的爆发开启了全球数据量急剧增长的新时代,数据已经成为驱动企业数字化转型的核心力量。整个数据行业的技术能力不断提升,从数据库到数据仓库,再到开源大数据,都在经济社会中发挥着极其重要的作用。近年来,新兴数据技术与云计算相互辅助,共同发展,诞生了一系列云原生数据服务,让企业能够突破传统模式的局限,专注于业务,降本增效。本书以全球前沿的云原生服务为基础,详细展现了如何将数据存储、数据引入、批量数据处理、实时数据处理、数据仓库、数据可视化和机器学习等核心要素综合起来,逐步构建一个高效的大数据服务平台。 本书内容丰富,示例与图解清晰易懂,既能帮助大数据初学者迅速熟悉大数据技术的核心内容和流程,也适合已经熟悉大数据的技术人员通过云原生服务进一步优化解决方案。
展开
目录
第1章 数字化转型与数据技术
1.1 数字化转型
1.2 基于数据进行数字化转型
1.3 数据仓库
1.4 大数据
1.5 数据湖
1.6 云计算中数据技术的演进
1.7 本书目标
第2章 数据存储
2.1 数据存储的发展与趋势
2.1.1 集中式文件系统
2.1.2 网络文件系统
2.1.3 分布式文件系统
2.1.4 云原生存储
2.2 Azure Blob对象存储
2.2.1 数据冗余策略
2.2.2 分层存储
2.2.3 兼容HDFS的WASB文件系统
2.3 创建存储账号
2.3.1 订阅
2.3.2 资源组
2.3.3 存储账号
2.4 Azure数据湖存储
2.4.1 分层命名空间
2.4.2 兼容HDFS的ABFS文件系统
2.5 创建数据湖存储
2.6 基于HDFS访问数据湖存储
2.7 在HDInsight中访问数据湖存储
2.8 本章小结
第3章 数据引入
3.1 什么是数据引入
3.2 数据引入面临的挑战
3.3 数据引入工具
3.4 数据工厂
3.4.1 什么是数据工厂
3.4.2 创建数据工厂
3.4.3 数据工厂的主要组件
3.5 引入数据
3.5.1 数据复制
3.5.2 管道设计
3.5.3 参数化
3.5.4 监控
3.6 本章小结
第4章 批量数据处理
4.1 数据处理概述
4.2 数据处理引擎
4.2.1 MapReduce
4.2.2 Spark
4.3 Databricks
4.4 使用Databricks处理批量数据
4.5 Databricks的特性
4.5.1 依赖库管理
4.5.2 Databricks文件系统(DBFS)
4.5.3 密钥管理
4.5.4 Delta Lake
4.6 使用数据工厂处理批量数据
4.6.1 设计Data Flow
4.6.2 Data Flow的设计模式
4.6.3 如何选择Data Flow与Databricks
4.7 本章小结
第5章 实时数据处理
5.1 什么是实时数据处理
5.2 消息队列
5.3 Kafka的使用
5.3.1 创建虚拟网络
5.3.2 创建Kafka集群
5.3.3 配置IP advertising
5.3.4 生产者发送数据
5.4 实时数据处理引擎
5.5 使用Spark Structured Streaming处理实时数据
5.5.1 连通Kafka与Databricks
5.5.2 在Databricks中处理数据
5.5.3 使用Cosmos DB保存数据
5.6 Event Hub
5.7 本章小结
第6章 数据仓库
6.1 什么是数据仓库
6.2 云原生数据仓库
6.3 Synapse Analytics
6.3.1 什么是Synapse Analytics
6.3.2 Synapse SQL的架构
6.3.3 创建Synapse工作区
6.3.4 创建SQL池
6.3.5 连接SQL池
6.4 数据加载
6.4.1 数据加载方式
6.4.2 使用COPY导入数据
6.5 Synapse SQL的资源和负荷管理
6.5.1 资源类
6.5.2 并发槽
6.5.3 最大并发查询数
6.5.4 工作负荷组
6.5.5 工作负荷分类器
6.6 数据仓库发展趋势
6.6.1 挑战
6.6.2 趋势
6.7 Synapse Analytics的高级特性
6.7.1 Synapse 工作室
6.7.2 数据中心
6.7.3 无服务器SQL池
6.7.4 托管Spark
6.8 本章小结
第7章 数据可视化
7.1 数据可视化概述
7.2 数据可视化工具
7.3 Power BI
7.3.1 什么是Power BI
7.3.2 Power BI的构件
7.3.3 使用Power BI Desktop
7.3.4 使用Power BI服务
7.4 本章小结
第8章 机器学习
8.1 机器学习概述
8.1.1 算法类型
8.1.2 业务场景
8.2 机器学习的流程
8.3 机器学习的挑战与云原生平台的优势
8.4 云原生机器学习平台
8.4.1 创建工作区
8.4.2 创建数据存储库
8.4.3 创建数据集
8.4.4 创建计算资源
8.5 机器学习设计器
8.6 自动化机器学习
8.7 本章小结
参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证