搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
基于元数据驱动通用操作器的数据仓储构建
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787307148826
  • 作      者:
    (瑞士)Bin Jiang著
  • 出 版 社 :
    武汉大学出版社
  • 出版日期:
    2014
收藏
作者简介
  Dr.BinJiang(蒋彬博士),于1986年获得德国Dortmund大学计算机科学硕士学位,于1992年获得瑞士苏黎世联邦理工学院计算机科学博士学位。求学期间,他在数据库管理系统领域的两篇论文分别发表在1990年和1992年的数据工程IEEE会议上,并被评为最优秀学生论文。 毕业后,他先后任职于瑞士多家银行及保险公司,早年在大型国际数据仓储咨询公司担任过系统工程师、软件工程师、系统分析员。至今,已担任了近二十年的数据仓储高级顾问以及架构师。
展开
内容介绍
  《基于元数据驱动通用操作器的数据仓储构建》主要关注数据仓储领域的两个有效性挑战。
  第一个,即其主要挑战是实践性挑战。与当今的其他构建数据仓储方法相比,采用《基于元数据驱动通用操作器的数据仓储构建》介绍的方法可以实质性地更经济、更快速、更安全地构建数据仓储。第二个有效性挑战是概念性挑战。通过围绕几个基本概念的精确讨论,对数据仓储构建领域的思考和探讨会变得更加有效。
  《基于元数据驱动通用操作器的数据仓储构建》覆盖了数据仓储构建的主要领域,包括数据仓储的定义和环境;数据仓储的4个类型、对数据仓储的5类共15个要求;2个方法论的总结及3个构建方法。《基于元数据驱动通用操作器的数据仓储构建》给出了一个高性能的参照系统结构。基于此参照系统结构,《基于元数据驱动通用操作器的数据仓储构建》系统地讨论了大量设计议题,包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则,并设计35个易学易做的构建练习。
  最后,《基于元数据驱动通用操作器的数据仓储构建》提出的方法已在实际的商业领域进行应用,其成效是对方法的有效性最有力的证实。
展开
精彩书摘
  《基于元数据驱动通用操作器的数据仓储构建》:
  3.1:M。一个源表的数据行被分配到多个目标表中,也有两种情况:
  (1)垂直型1:M。将源表的行按照一定的条件分成若干组,每个组对应一个目标表。
  (2)水平型1:M。将源表行数据的各列分成若干组,每个组对应一个目标表。
  4.M:N。包含上述子类的各种可能组合。当目标表的结构与源数据模型明显不同时就会出现这种情况。
  实际上,上述绝大部分转换类别中都涉及以下具体任务:
  (1)明确选取的源表中有多少列需要处理以适应目标表。
  (2)确定源表中有哪些列需要映射到目标表的哪些列中。
  (3)根据目标表确定源表列的排列顺序。
  有时,直接将源表转换成目标表的结构很难实现,甚至根本不可能做到。这种情况下就可以将整个转换过程分解为若干个简单的步骤。每一步产生的中间结果都存入“工作表”,通过使用“工作表”让转换过程变得易于实现,且更简单。当数据仓储的构建活动中应用了一些复杂的算法或者很复杂的数据结构时往往采用这种方法。
  ……
展开
目录
第1章 绪论
1.1 数据仓储与数据
1.2 数据仓储的上下文
1.3 数据仓储的分类
1.3.1 拓扑结构/后台分类
1.3.2 组织机构/前端分类
1.3.3 时间性/更新分类
1.3.4 地理特性/位置分类
1.4 数据仓储需满足的要求
1.4.1 功能性要求
1.4.2 信息性要求
1.4.3 操作性要求
1.4.4 经济性要求
1.4.5 安全性要求
1.5 数据仓储方法论
1.5.1 教条的开发方法:自上而下
1.5.2 实用的开发方法:自下而上
1.5.3 有效的方法:居顶不下
1.6 数据仓储构建的方法
1.6.1 老方法:手工ELT法
1.6.2 新方法:工具辅助的ETL法
1.6.3 现代方法:工具辅助的ELT法
1.6.4 未来的方法:基于MGO的ELT法
1.7 构建本书同时构建一数据仓储

第一篇 设计问题、概念和体系结构
第2章 体系结构概要
第3章 预备域
3.1 源应用系统
3.1.1 分析
3.1.2 接口
3.2 预备域
3.2.1 平面文件区
3.2.2 原始袁区
3.2.3 已预备表区
3.2.4 平面文件加载
3.2.5 错误拒绝
3.2.6 变化量识别
3.2.7 列清洗和域完整性的保证
3.2.8 行过滤
3.2.9 操作识别
3.2.1 0最小设计原则
第4章 处理域
4.1 数据
4.1.1 代码数据
4.1.2 对象数据
4.1.3 事件数据
4.2 时间性
4.2.1 历史化
4.2.2 归档
4.2.3 三时维
4.3 数据完整性
4.3.1 参照完整性
4.3.2 实体完整性
4.4 收集
4.4.1 事件数据归档
4.4.2 对象数据历史化
4.4.3 代码数据历史化
4.5 整合
4.5.1 对象标识转换
4.5.2 列数据转换
4.5.3 表模式转换
4.6 完整性保证
4.6.1 参照完整性保证
4.6.2 实体完整性保证
4.7 错误处理
4.8 处理域组件
第5章 存储域
5.1 中央存储区
5.1.1 逻辑数据模型和规范化
5.1.2 物理数据模型和去规范化
5.2 分析展示层
5.3 效能强化区
5.3.1 维度数据模型
5.3.2 特殊结构
5.3.3 模型转换
5.4 使用数据区
5.5 访问控制层
5.6 存储域组件
第6章 基础设施
6.1 进程管理
6.1.1 依赖关系图
6.1.2 事务模型
6.2 元数据管理
6.2.1 元数据
6.2.2 采集、管理和利用
6.3 对象组织

第二篇 组件、算法与技术
第7章 数据预备
7.1 平面文件加载
7.1.1 平面文件加载器
7.1.2 平面文件加载脚本
7.2 变化量识别
7.3 列清洗
7.3.1 缺省值
7.3.2 列清洗器
7.4 行过滤
7.4.1 日志机制
7.4.2 行过滤器
7.5 数据导出
第8章 数据处理
8.1 数据收集
8.1.1 对象建史器
8.1.2 事件归档器
8.1.3 行存储器
8.1.4 行移除器
8.2 数据整合
8.2.1 代理键生成器
8.2.2 键转换器
8.2.3 列数据转换器
8.2.4 关系代数运算符
8.2.5 连接构建器
8.3 参照完整性保证
8.3.1 等待空间管理器
8.3.2 外键处理器
8.3.3 代码表补充器
8.4 实体完整性保证机制
8.4.1 重叠检测器
8.4.2 优先权决定器
8.4.3 双时维重叠的基本组合
8.4.4 基本矩形分解器
8.4.5 重叠消除器
8.4.6 重叠解决举例
8.4.7 分析
……
第9章 数据存储

第三篇 构建范式及元数据驱动通用操作器
第10章 范式基础
第11章 元数据驱动的通用操作器

第四篇 生存环境及更多
第12章 基础设施环境
第13章 方法论与经济学上的分析
第14章 结束语
索引
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证