本书对数据与信息质量相关的大量研究问题进行了系统介绍和对比研究,对数据库和信息系统中数据与信息质量的研究现状和发展趋势进行了充分、整体、全面的综述。
为此,本书全面介绍了数据与信息质量研究的大量核心技术,包括记录链接(也称为对象识别)、数据集成、错误定位与修正,并在原创的综合方法框架下对相关技术进行讨论。详细分析了质量维度定义和所采用的模型,突出并讨论了解决方案之间的差异。此外,在将数据与信息质量作为独立研究领域进行系统描述的同时,还涉及源自其他领域的理论框架,如概率论、统计数据分析、数据挖掘、知识表示和机器学习。同时,本书对非常实用的解决方案也进行了详细介绍,包括方法论、最有效技术的基准测试、案例研究以及示例。
本书主要针对数据库和信息管理领域或者自然科学领域的研究人员,可以为他们探究对实验、流程以及现实生活产生影响的数据与信息提供帮助。相关资料涵盖了所有的基础知识和领域主题,并且包含了硕士和博士研究生课程的内容,而不需要其他辅助教科书。当面对被数据质量问题困扰的系统时,那些需要对领域主题和实践方法进行系统梳理的数据和信息系统的管理人员,也可以从完善的理论体系和具体的实践方法的结合中获得收益。
展开