第1章 绪 论
在实际工作中,要处理各种各样的矛盾问题,通过可拓变换,可以使“不是”变为“是”,“不行”变为“行”,例如,通过吃药,会使病人从有病变为无病,处方不同,病人病情的变化会不同,所属疾病的类型和程度的变化也不同;在化学实验中,改变不同的配方,会得到不同的结果;在经济活动中,对银行的利率采用不同的加息措施,经济从过热转化为不过热的程度和效果会不同;在市场营销中,决策者采用不同的措施,对产品从滞销变为畅销的作用也不同……在这些活动中,变换的知识起着重要的作用.由于计算机技术的发展,在上述活动过程中,积累了大量的数据。如何从这些变化的数据中,挖掘出有用的知识,进而为解决矛盾问题服务,这为数据挖掘的研究提出了重要的课题.
1.1数据挖掘与知识发现
1.1.1 知识发现过程
知识发现(knowledge discovery in database,KDD)是从数据中发现有用知识的整个过程.数据挖掘是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(Pattern)
KDD是从数据集中识别出有效的、新颖的、潜在有用的以及最终可理解的模式的高级处理过程,其中,数据集是事实F(数据库元组)的集合;模式是用语言L表示的表达式E,它所描述的数据是集合F的一个子集FE,它比枚举所有FE中元素更简单,称E为模式,发现的模式有一定的可信度,应该是新的,将来有实用价值,能被用户所理解.
展开