数据质量是数据管理中极其重要的一个方面。现有数据库系统通常可支持大规模数据的创建、维护、使用。侧重于数据的“量”的管理。但真实世界中的数据通常是“脏”的。常见问题包括数据不一致、重复、不完整或时效性不强。数据库中的问题数据则带来诸多后果,例如:产生误导性或偏向性的分析结果与决策制定,以及效益、信誉以及客户的损失等。因而,数据质量管理可谓当务之急。与传统的数据管理任务不同。数据质量管理在语法和语义方面对数据错误进行检测并修正,以增强数据质量,进而为商业过程增值。
《数据质量管理基础》概述了数据质量的5个核心问题,即数据一致性、数据去重、数据时效性及信息完整性,提出了一个统一的基于数据质量规则的逻辑框架来解决上述问题。
《数据质量管理基础》适合作为研究生教材,也可供数据质量管理领域的研究者与实践者参考。
展开