搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
数据仓库原理与实践(数据科学与大数据技术十四五高等学校新工科计算机类专业系列教材)
0.00     定价 ¥ 62.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787113319984
  • 作      者:
    编者:康瑶//董亮|责编:闫钇汛//贾淑媛|总主编:陈明
  • 出 版 社 :
    中国铁道出版社有限公司
  • 出版日期:
    2025.03
收藏
内容介绍
  《数据仓库原理与实践》为“十四五”高等学校新工科计算机类专业系列教材之一,主要论述数据仓库的理论和实际应用,内容涵盖数据仓库的基本概念、数据模型、维度建模、技术架构、数据集成与存储、Hive数据仓库工具、Spark计算引擎、大数据任务调度系统、OLAP联机分析处理技术,以及企业级数据仓库综合项目实践等方面。
  《数据仓库原理与实践》内容特色鲜明,面向应用型本科,紧密结合企业级数据仓库设计需求。通过应用案例及项目实战介绍大数据技术在数据仓库中的应用。
  同时,《数据仓库原理与实践》内容丰富全面,既体现了数据仓库的理论知识,又注重实践应用。
  《数据仓库原理与实践》适用于高等院校数据科学与大数据技术、计算机科学与技术、软件工程等专业的高年级本科生,以及对大数据感兴趣的读者。
展开
目录
第1章 数据仓库概述
1.1 数据仓库与数据库
1.1.1 数据仓库的定义
1.1.2 数据仓库与操作型数据库
1.1.3 数据仓库的应用
1.2 数据仓库系统及开发工具
1.2.1 数据仓库系统的组成
1.2.2 大数据时代数据仓库开发工具
1.3 商业智能与数据仓库
1.3.1 商业智能
1.3.2 商业智能与数据仓库的关系
1.4 大数据时代数据仓库建设
1.4.1 大数据时代数据仓库的架构
1.4.2 大数据时代数据仓库的关键技术
1.4.3 大数据时代数据仓库应用存在的问题
小结
思考与练习

第2章 数据仓库的数据模型
2.1 数据仓库的数据模型分类
2.1.1 维度模型
2.1.2 范式模型
2.1.3 DataVault模型
2.1.4 Anchor模型
2.2 维度模型的相关概念
2.2.1 粒度
2.2.2 维度与维度表
2.2.3 度量与事实表
2.2.4 多维数据集
2.3 维度模型的结构
2.3.1 星状模型
2.3.2 雪花模型
2.3.3 事实星座模型
小结
思考与练习

第3章 数据仓库设计
3.1 数据仓库设计概述
3.1.1 数据仓库设计原则
3.1.2 数据仓库系统的建立模式
3.1.3 数据仓库规划
3.1.4 数据仓库设计过程
3.2 数据仓库需求分析
3.2.1 数据决策需求调研
3.2.2 业务系统及业务流程调研
3.2.3 数据调研及明确统计需求
3.3 数据仓库主题与主题域分析
3.3.1 主题
3.3.2 主题域
3.3.3 划分主题域及主题
3.4 数据仓库逻辑模型设计
3.4.1 数据仓库维度建模
3.4.2 数据仓库数据分层与粒度设计
3.5 数据仓库物理模型设计
3.5.1 确定数据的存储结构
3.5.2 确定索引策略
3.5.3 确定存储分配
3.6 数据仓库的部署与维护
3.7 数据仓库建模设计项目实践
3.7.1 项目背景
3.7.2 实训目标与实训内容
3.7.3 实训步骤
小结
思考与练习

第4章 数据仓库技术架构
4.1 数据仓库技术场景分析
4.2 数据仓库技术方案
4.2.1 数据仓库技术选型
4.2.2 数据采集与集成
4.2.3 数据存储
4.2.4 数据计算
4.2.5 任务调度
小结
思考与练习

第5章 数据集成与存储
5.1 大数据来源
5.1.1 多种离线数据源
5.1.2 多种实时数据源
5.1.3 多种数据类型
5.2 数据采集
5.2.1 Flume数据采集概述
5.2.2 数据采集组件
5.2.3 数据采集流程
5.2.4 故障转移
5.2.5 数据拦截器
5.2.6 数据采集项目实践
5.3 数据集成
5.3.1 SeaTunnel数据集成概述
5.3.2 部署与配置
5.3.3 数据集成项目实践
5.4 数据存储
5.4.1 数据存储类型与存储格式
5.4.2 数据压缩算法
小结
思考与练习

第6章 数据仓库工具Hive
6.1 Hive框架介绍
6.1.1 Hive框架概述
6.1.2 Hive功能特点
6.1.3 Hive应用场景
6.2 Hive框架部署与配置
6.2.1 Hive运行环境
6.2.2 Hive参数配置
6.3 Hive技术架构
6.3.1 Hive核心组件
6.3.2 Hive元数据服务
6.3.3 Hive客户端连接
6.4 HQL语法与应用
6.4.1 HQL语言基础
6.4.2 数据定义
6.4.3 数据操作
6.4.4 内置函数与自定义函数
6.4.5 项目实践
小结
思考与练习
……

第7章 基于Spark平台的数据计算
第8章 任务调度
第9章 OLAP(联机分析处理)
第10章 企业级数据仓库综合实训
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证