第1章 绪论
1.1 本书的撰写目的及意义
随着信息技术的高速发展,交通领域各行业都加快了信息化建设的步伐,信息化应用水平有了明显的提高,伴随数据库技术的迅速发展,以及信息系统的广泛普及,交通领域现行系统中积累的数据越来越多。大量积累的数据背后隐藏着许多非常重要的信息,人们希望可以对其进行更深层次的分析,以便更好地利用这些数据。数据挖掘促使数据库技术进入了更为高级的阶段,不仅能满足对过去的数据进行查询和遍历的需要,而且能找出各种数据之间潜在的联系和规律,促进信息的传递。
采用数据挖掘技术实现对交通领域各行业现有数据进行挖掘的任务,其前提是实现数据的全面整合,建立数据仓库或数据中心,才能在此基础上建立各相应的数据挖掘模型。但是,就目前交通领域各单位、处室现有的应用系统来说,有的是根据业务需求白行开发研制,有的是由部、省、厅等上级管理部门下发,由于各系统的建设时期、开发部门、使用设备、技术发展阶段以及能力水平都不同,数据分散在不同的应用系统中,无法实现数据的共享和互联互通。交通领域各部门间信息的不通畅导致上下级部门之间、单位内业务处室之间存在“信息孤岛”的现象,数据、信息在单系统内封闭运行,系统化监控机制无法实施,严重妨碍了交通领域管理的高效决策,不仅增加了业务处理的复杂程度,也降低了工作的效率。
有的系统虽然实现了数据的集中管理,但是只提供查询访问功能,大量的数据存储在各系统的数据库中,不能被充分利用。无法预测未来的发展趋势,充分发挥数据、信息的价值,缺乏挖掘数据背后隐藏知识的手段和功能,出现“数据爆炸但知识贫乏”的问题。
聚类分析作为数据挖掘与统计分析研究的一个重要方面,为探索未知的数据结构提供帮助,并能成为一系列数据分析的起点,已被广泛应用于道路交通、港口、航空、航务海事及海运等领域,并形成了系统的方法体系。许多文献已经对聚类分析进行了深入的研究,并结合实际问题提出了许多改进方法。然而综合国内外对聚类分析的研究,同时考虑到交通领域的现状,仍有很多极具挑战性的问题亟待解决。
……
展开