搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
复杂数据质量控制技术(精)
0.00     定价 ¥ 168.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302623342
  • 作      者:
    作者:曹建军//郑奇斌//刘艺//翁年凤|责编:贾斌
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2023-09-01
收藏
内容介绍
复杂性是大数据区别于小数据的本质特性,也是当前大数据质量控制与数据治理面临的核心挑战。本书围绕大数据的复杂性开展研究,旨在探索当前数据资源建设与利用过程中面临的挑战和技术难题,促进数据价值的充分释放。 全书分为6部分,共24章。第1部分概述(第1、2章),综述所研究数据控制技术的基本概念和任务定位,以及国内外的研究进展;第2部分实体分辨技术(第3~13章),研究了高维数据实体分辨、名称分辨、XML数据实体分辨和跨模态数据实体分辨等;第3部分真值发现技术(第14~18章),研究了单真值发现、多真值发现、文本数据真值发现,以及基于多蚁群优化和基于深度神经网络的真值发现等;第4部分基于数据依赖的数据质量控制技术(第19~21章),研究了数据录入辅助预测与推理方法、不一致数据检测与修复方法,以及有限先验知识下的全局数据质量评估;第5部分系统与平台(第22、23章),介绍了数据质量控制系统,以及数据治理平台的设计与实现;第6部分结束语(第24章),归纳总结了当前面临的风险和挑战。 本书务实求新,系统性强,易读性和可操作性好,既可作为数据质量控制与数据治理领域的进阶用书,又可作为数据资源建设与利用、信息技术等相关学科领域的教学参考或工程实践指导用书。
展开
目录
第1部分 概述
第1章 绪论
1.1 研究背景及意义
1.2 基本概念和任务定位
1.2.1 实体分辨
1.2.2 高维数据实体分辨
1.2.3 名称分辨
1.2.4 XML数据实体分辨
1.2.5 跨模态数据实体分辨
1.2.6 冲突消解与真值发现
1.2.7 不一致数据检测与修复
1.2.8 数据录入辅助预测与修复
1.2.9 数据质量评估
1.3 本书内容结构安排
本章参考文献
第2章 国内外研究进展
2.1 引言
2.2 高维数据实体分辨的研究进展
2.2.1 实体分辨方法
2.2.2 多目标蚁群算法
2.2.3 特征选择稳定性
2.2.4 不平衡数据分类方法
2.3 名称分辨的研究进展
2.3.1 机构名称分辨的研究现状
2.3.2 姓名消歧的研究现状
2.4 XML数据实体分辨的研究进展
2.4.1 文本比较方法
2.4.2 结构比较方法
2.5 跨模态数据实体分辨的研究进展
2.5.1 单模态表征
2.5.2 相似性度量方法
2.5.3 相似性匹配方法
2.6 真值发现的研究进展
2.6.1 结构化数据真值发现
2.6.2 文本数据真值发现
2.6.3 特殊场景下的真值发现
2.7 不一致数据检测与修复的研究进展
2.7.1 数据检测
2.7.2 数据修复
2.8 数据录入辅助预测与推理的研究进展
2.8.1 数据预测模型
2.8.2 智能人机接口
2.9 全局数据质量评估的研究进展
本章小结
本章参考文献
第2部分 实体分辨技术
第3章 高维数据特征选择的多目标蚁群算法
3.1 引言
3.2 理论方法
3.2.1 两档案设置
3.2.2 等效路径信息素增强策略
3.2.3 多样性度量指标
3.3 算法描述
3.3.1 路径选择概率公式
3.3.2 变异机制
3.3.3 两档案更新
3.3.4 信息素更新方式
3.3.5 算法伪代码及时间复杂度分析
3.4 实验与分析
本章小结
本章参考文献
第4章 高维数据特征选择稳定性研究
4.1 引言
4.2 特征选择稳定性指标分析
4.3 特征选择稳定性集成方法分析
4.4 演化算法特征选择稳定性提升方法
4.4.1 系统描述
……
第3部分 真值发现技术
第4部分 基于数据依赖的数据质量控制技术
第5部分 系统与平台
第6部分 结束语
附录 项目资助
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证