搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
动态数据流分类方法及其在民族信息数据挖掘中的应用
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787121246524
  • 作      者:
    姚远,张俊星,徐国凯著
  • 出 版 社 :
    电子工业出版社
  • 出版日期:
    2014
收藏
作者简介
  徐国凯,大连民族学院机电信息学院院长,教授,长期致力自动化专业教学和民族特需品文化数字化保护。获得国家科技支撑计划“民族特需品数字化关键技术研究及示范应用”课题支持。
展开
内容介绍
  《中国少数民族特需用品数字化工程丛书:动态数据流分类方法及其在民族信息数据挖掘中的应用》动态数据流挖掘是近年来学术界研究的热点问题之一,由于其本身具有海量性、实时性及动态变化性等特点,因此在利用传统数据挖掘方法对数据流进行处理时,很难得到令人满意的结果。
  《中国少数民族特需用品数字化工程丛书:动态数据流分类方法及其在民族信息数据挖掘中的应用》以动态数据流分类问题为切入点,着重介绍了近些年的动态数据流分类问题研究进展,提出了相关技术方法,以民族信息处理为背景,通过案例对相关技术方法进行深入说明。《中国少数民族特需用品数字化工程丛书:动态数据流分类方法及其在民族信息数据挖掘中的应用》内容新颖,融入了近年来学术界与工商业界提出的新方法和新技术,并给出了进一步扩展。
  《中国少数民族特需用品数字化工程丛书:动态数据流分类方法及其在民族信息数据挖掘中的应用》可作为信息与工程、计算机应用技术等专科、本科,以及研究生教学用书,也可供相关研究人员参考。
展开
精彩书摘
  《中国少数民族特需用品数字化工程丛书:动态数据流分类方法及其在民族信息数据挖掘中的应用》:
  6.数据流挖掘的研究方向
  数据流挖掘方法是建立在数据流数据的基础上的,因此无论什么研究方向均需要首先满足数据流的特点。通过前面介绍读者可以知道,从本质上说数据流具有三个特点,即海量性、实时性与动态变化性,因此要求数据流挖掘方法具有一定的负载能力、实时处理能力及自我更新能力。日前,所提出数据流挖掘相关算法的主要瓶颈在于如何调整和优化系统资源与压缩耗时方面。这种矛盾在高度复杂的网络环境中尤其明显,如社交网络、物联网等。在数据流三大基本特征的基础上衍生出的诸如数据流数据产生速度不均匀、数据缺失及数据概念漂移等问题都给数据流挖掘算法的发展与设计提出了挑战。通过对相关文献的汇总,当前数据流挖掘的研究方向如下。
  (1)设计一种在有限系统资源状态下的数据流挖掘方法。在某些特定情况下,需要对数据流在低端设备(如手机、平板电脑)上进行快速分析。这里的低端设备是相对于高端专业数据分析设备而言的。有限系统资源下的数据流分析算法需要对其进行调整,牺牲准确率换来低系统资源消耗,但是如何设计这个“度”是本领域研究的热点内容。此外,该研究方向往往与实际应用背景相结合,设计出针对特定环境、特定问题的数据流挖掘方法。
  (2)数据流的三种特性如同三条准则牢牢限制住算法的设计,因此如何设计出一种适应这三个约束条件的算法是另一个重要的研究方向。无论数据流分类问题还是聚类问题,首先都必须具有一定的复杂能力,即由于数据流产生的速度不均匀,因此需要相关挖掘算法能够适应数据流的这种变化。针对这个特点设计新的系统资源调度策略是一个常用方法。其次,数据流挖掘算法输出结果具有一定时效性,因此要求相关数据流算法对于数据处理的时间一定要尽可能缩短,最好是在下一个新数据产生之前完成数据挖掘工作。对于这个要求一般通过优化挖掘模型的运行步骤,减少数据流中样本数量及采用分布式方式进行挖掘等策略进行求解。最后,由于数据流是动态变化的,因此要求挖掘方法必须具有一定的适应能力,即自身更新机制。对于这个问题主要采用数据流动态变化检测方法与挖掘方法相结合的方式进行,一旦检测到数据流发生变化,立刻对数据挖掘模型进行更新。
  上述三种约束目前都有针对性方法进行解决,但是一种方法能够完全适应上述三种约束的目前学术界还没有统一认识,这也是该方向一直以来保持研究热度的原因。
  (3)探索加速数据流分析方法。传统数据挖掘方法是基于静态数据环境而设计的,因此当应用于数据流环境时往往出现“水土不服”的问题。如何通过修改、优化使得它们重新被数据流挖掘所用是该方向研究的核心内容。目前这个领域有两种方式:一种是对原始模型进行优化,以提高模型的运行速度满足数据流要求;另一种是将传统模型在分布式环境下进行重新设计,使其能够进行并行方式挖掘,同样为了适应数据流要求。
  (4)数据流管理系统研究。与传统数据管理系统类似,数据流同样需要进行管理,但是考虑到数据流特点(海量性),其管理系统中的查询、排序等操作需要进行针对性设计。
  (5)多数据流挖掘。在实际应用中,往往不存在单一数据流问题,大多数情况是同时面对多条(种)数据流进行挖掘。因此,该研究方向是设计一种策略能够同时对多条数据流进行挖掘,这种挖掘过程不同数据流之间既有独立性又有相关性,采用分布式策略是该领域的主要研究内容。
  ……
展开
目录
第1章 绪论
1.1 引言
1.2 数据挖掘概述
1.2.1 数据挖掘基本概念介绍
1.2.2 数据挖掘基本技术介绍
1.3 动态数据挖掘概述
1.3.1 动态数据挖掘概念介绍
1.3.2 数据流挖掘研究意义
1.3.3 动态数据分类方法国内外研究现状
1.4 本章小结

第2章 数据流挖掘技术
2.1 概述
2.2 数据流挖掘相关技术简介
2.2.1 滑动窗口技术
2.2.2 动态抽样技术
2.2.3 数据概要方法
2.2.4 更新策略
2.2.5 数据流预处理技术
2.3 数据流挖掘基本算法介绍
2.3.1 数据流聚类算法
2.3.2 数据流分类算法
2.3.3 数据流频繁规则挖掘算法
2.3.4 多数据流挖掘算法
2.4 数据流挖掘技术相关应用
2.5 本章小结

第3章 集成学习数据流分类技术
3.1 概述
3.1.1 集成学习基本理论
3.1.2 集成学习研究现状
3.2 Learn++系列算法
3.2.1 Learn++介绍
3.2.2 Learn+.NC
3.2.3 Learn+.DF
3.2.4 Learn+.MF
3.2.5 Learn++.NSE
3.3 基于SVM-SOM的数据流混合分类方法
3.3.1 SVM模型介绍
3.3.2 SOM模型介绍
3.3.3 粒子群与遗传算法介绍
3.3.4 SVM-SOM混合模型构建方法
3.4 集成学习结果合并方法
3.4.1 基于均值的合并方法
3.4.2 投票合并方法
3.4.3 其他合并方法
3.5 本章小结

第4章 增量式学习数据流分类方法
4.1 概述
4.2 传统分类器存在问题及解决方法
4.3 增量式相关算法介绍
4.4 基于轮转式结构的增量式数据流分类模型
4.4.1 算法介绍
4.4.2 实验及结果分析
4.5 其他增量式分类模型介绍
4.5.1 基于增量式学习的极端学习机分类模型
4.5.2 数据流可调节增量学习模型
4.5.3 基于增量式学习的非稳定数据流分类模型
4.5.4 基于增量式学习的LSVM模型
4.6 本章小结

第5章 数据流概念漂移挖掘方法
5.1 概述
5.1.1 概念漂移介绍
5.1.2 概念漂移研究现状
5.1.3 概念漂移检测方法介绍
5.3 基于KL-distance的数据流分类模型
5.3.1 算法介绍
5.3.2 实验结果
5.4 基于集成学习的概念漂移分类模型
5.4.1 算法介绍
5.4.2 实验结果
5.4 概念漂移可视化研究
5.4.1 可视化算法介绍
5.4.2 实验结果
5.5 本章小结

第6章 民族信息数据流挖掘应用
6.1 概述
6.2 少数民族信息数据挖掘现状
6.3 数据流分类在少数民族信息挖掘中的应用——少数民族乐器分类模型
6.3.1 模型框架
6.3.2 算法介绍
6.3.3 实验结果及分析
6.4 本章小结
参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证