甚至换一种算法。另外,数据挖掘是面向最终用户的,因此需要对发现的模式进行可视化,或者需要将结果转换为用户易懂的表示。数据挖掘算法执行,仅仅是整个过程的一个步骤。数据挖掘质量的好坏有两个影响要素:一是所采用的数据挖掘技术的有效性;二是用于挖掘的数据的质量和数量。整个挖掘过程是一个不断反馈的过程。
(四)数据挖掘的应用
由于数据挖掘是一门具有广泛应用的新兴学科,针对特定领域的应用包括生物医学、DNA分析、金融、零售和电信等,需要在实践中将数据挖掘技术与特定领域知识结合在一起提供满足特定任务的数据挖掘解决方案。
下面以生物医学研究和商业应用为例来说明数据挖掘的应用。
1.生物医学研究
生物医学研究近年来有了迅猛的发展,从新药物的开发和癌症治疗的突破,到通过大规模序列模式和基因功能的发现,进行人类基因的识别与研究。
2.商业应用
商业或企业对数据挖掘的应用需求很大,商业应用领域有:市场营销、金融、银行、制造和通信等。商业上的大多数应用针对的是分类预测挖掘。
(1)市场营销数据挖掘在市场营销上的应用可分为两类:数据库市场营销和购物篮分析。前者的任务是通过交互式查询、数据细分和模型预测等方法来选择潜在的顾客以便向他们推销产品;后者的任务是分析市场销售数据(如POS数据库)以识别顾客的购买行。
展开