2.评估数据仓库管理
评估数据仓库管理部分主要完成数据挖掘所需数据的管理功能。评估数据仓库中的数据质量高、格式统一,在最大程度上屏蔽了各种异构数据源对数据挖掘的质量和效率所带来的影响,因此评估数据仓库是数据挖掘较为理想的平台。在评估数据仓库中,并不是所有的数据都适合于数据挖掘,实际上只有那些粒度较低的数据才适合于数据挖掘。在数据挖掘的过程中,针对各个特定的目标,可以采用查询机制从评估数据仓库中将数据提取出来,并把这些数据放入二维关系表中,以供后续的预处理工作之用。二维关系表建立的目的是存放挖掘时的数据,同时也是为数据预处理提供缓冲的场所。另外,评估数据仓库管理部分为评估决策者提供导航器,以增强他们在评估数据仓库中的浏览能力,为他们操作数据提供帮助。
3.模型库管理
模型库管理部分主要负责提供和维护数据挖掘过程中所需的各种模型和算法。对评估数据仓库进行数据挖掘是一个非常繁杂的发现知识过程,需要的模型很多,并且各种模型往往要相互配合使用,因此这就要求模型管理部分结构灵活,功能强大,可采用的模型齐全。在模型库中提供有概念树、决策树、粗集、关联规则等模型,并且每种模型中又包含有具体的实现算法,可以针对不同的目标和数据单独或者联合地进行处理工作。另外,这一部分还可以装载其他分析模型。在模型库里,对这些分析模型和数据挖掘模型进行统一管理。
……
展开