搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
数据挖掘原理与算法
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787030254405
  • 作      者:
    邵峰晶[等]编著
  • 出 版 社 :
    科学出版社
  • 出版日期:
    2009
收藏
内容介绍
    《数据挖掘原理与算法(第2版)》第一版是国内第一本对数据挖掘技术基础算法进行详细描述的实用性教材。第二版在第一版基础上进行了较多的修订和补充。在系统阐述数据挖掘与知识发现技术的产生、发展,以及相关概念、原理、基本方法的基础上,从实用的角度出发,对数据挖掘中的关联、分类、聚类、序列等算法和技术进行了剖析,对每种技术均提供了代表性算法。同时,结合作者近年来所做的研究,对数据挖掘的应用问题进行了分类论述。最后,对目前数据挖掘的最新进展、应用趋势等进行了总结。<br>    《数据挖掘原理与算法(第2版)》可作为计算机、管理等专业高年级本科生与研究生课程的教材,也可作为数据挖掘领域的高级软件开发人员的参考书。
展开
精彩书摘
    第1章  导论<br>    1.1  数据挖掘的社会需求<br>    一切新事物的产生都是由需求驱动。让计算机能够自动、智能地分析数据库中的大量数据以获取信息是推动挖掘型工具产生并发展的强大动力。从生产成本的角度看,公司的人工费用在不断提升,产品与服务的价格持续下降,激烈的市场竞争迫使决策者想办法降低成本及扩大产品与服务的销售量来提高公司的竞争力。从计算机应用角度看,无论硬件与网络性能的提高,还是软件技术与功能的提高,都要求软件从单纯的管理功能向综合的分析功能转变。从数据管理角度看,历史数据是一笔宝贵的财富,而且这些数据正以几何级数或指数方式增长。从软件技术发展方向看,海量数据的智能分析对原来各个领域的技术都带来了极大的挑战,需要采用综合性的技术来迎接这些挑战。<br>    随着数据库技术的飞速发展以及人们获取数据手段的多样化,人类所拥有的数据急剧增加,随着大容量、高速度、低价格的存储设备相继问世,当今数据库的容量越来越大,已经达到TB(i),甚至PB的水平,但能够对这些数据进行有效分析处理的工具却很少。数据库系统往往只对已有数据进行存取和简单操作,人们很难通过这些操作获取数据隐含的深层语义,而这些描述数据整体特征和发展趋势的信息在决策制定过程中具有更加重要的价值和意义,它们可以指导政府、企业决策以获取更大的社会效益和经济效益。
展开
目录
第二版前言<br>第一版前言<br>第1章 导论<br>1.1 数据挖掘的社会需求<br>1.2 什么是数据挖掘<br>1.3 数据挖掘的数据来源<br>1.4 数据挖掘的分类<br>1.4.1 分类分析<br>1.4.2 聚类分析<br>1.4.3 关联分析<br>1.4.4 序列分析及时问序列<br>1.4.5 孤立点分析<br>1.4.6 其他分析<br>1.5 数据挖掘的体系结构与运行过程<br>1.5.1 数据挖掘的体系结构<br>1.5.2 数据挖掘的步骤<br>1.5.3 实例<br>1.5.4 数据挖掘的过程模型<br>1.5.5 数据挖掘主要厂商和产品<br>1.6 数据挖掘与其他相关技术<br>1.6.1 数据挖掘与数据库中知识发现<br>1.6.2 数据挖掘与联机分析处理<br>1.6.3 数据挖掘与信息检索<br>1.6.4 数据挖掘与机器学习<br>1.6.5 数据挖掘与数据融合<br>1.6.6 数据挖掘与统计学<br>1.6.7 数据挖掘与专家系统<br>1.6.8 数据挖掘与决策支持系统<br>1.6.9 数据挖掘与客户关系管理<br>1.6.10 软硬件发展对数据挖掘的影响<br>1.6.11 XML与面向Web的数据挖掘技术<br>1.7 数据挖掘工具的评价标准<br>1.8 数据挖掘的应用<br>1.9 数据挖掘的要求及挑战<br><br>第2章 数据仓库技术<br>2.1 数据仓库概述<br>2.1.1 数据仓库的定义<br>2.1.2 数据仓库查询系统<br>2.1.3 OLTP与OLAP<br>2.1.4 数据仓库与数据集市<br>2.1.5 数据仓库系统的结构<br>2.1.6 数据仓库中的元数据管理<br>2.2 数据仓库的建模<br>2.2.1 星型模型<br>2.2.2 雪花模型<br>2.2.3 混合模型<br>2.2.4 多维数据模型<br>2.3 联机分析处理<br>2.3.1 OLAP的功能及体系结构<br>2.3.2 OLAP数据组织模型<br>2.3.3 OLAP的Web结构<br>2.3.4 OLAP数据查询机制<br>2.4 海威数据仓库系统简介<br>2.4.1 Highway Decision Center V1.0系统结构<br>2.4.2 Highway Decision Center V2.0系统结构<br>2.4.3 海威数据仓库网络结构<br>2.5 数据仓库应用举例<br>2.5.1 信用卡资信分析<br>2.5.2 贷款分析<br><br>第3章 数据挖掘中的数据预处理<br>3.1 概论<br>3.2 数据预处理的基本步骤<br>3.3 数值属性的离散化与特征选择<br>3.3.1 Chi2算法简介<br>3.3.2 举例<br>3.3.3 讨论<br>3.4 概念分层<br>3.4.1 数据库中面向属性的归纳<br>3.4.2 概念分层的动态提炼<br>3.4.3 针对数值属性的概念分层的自动产生<br>3.5 数据抽样<br>3.5.1 数据挖掘不同领域中的抽样<br>3.5.2 数据挖掘中抽样方法<br>3.5.3 静态与动态抽样<br><br>第4章 关联规则<br>4.1 关联规则挖掘的基本概念<br>4.2 关联规则的发现算法<br>4.2.1 算法Aprio<br>4.2.2 算法AprioriTid<br>4.2.3 算法AprioriHybrid<br>4.2.4 生成规则<br>4.2.5 算法FP_Growth<br>4.2.6 算法ECLAT<br>4.2.7 基于粒计算的频繁模式挖掘算法<br>4.3 数值属性关联规则<br>4.3.1 基本概念<br>4.3.2 确定数值属性划分的聚类算法CP<br>4.4 多层关联规则挖掘<br>4.4.1 概念层次(conceptual hierarchies)<br>4.4.2 同层(same hierarehy)关联规则挖掘<br>4.5 约束性关联规则发现方法及算法<br>4.5.1 算法Separate<br>4.5.2 其他约束条件<br>4.6 关联规则的增量式更新算法<br>4.6.1 阈值的动态调整<br>4.6.2 数据库的更新<br>4.7 频繁项集的压缩<br><br>第5章 数据分类<br>5.1决策树基本算法<br>5.1.1决策树生成算法<br>5.1.2 决策树的修剪<br>5.2 决策树ID3<br>5.2.1 基本概念<br>5.2.2 定义<br>5.2.3 ID3算法<br>5.2.4 ID3算法优劣<br>5.3 决策树学习算法C4.5<br>5.3.1 使用增益率<br>5.3.2 处理未知值的训练样本<br>5.3.3 有连续值的属性<br>5.3.4 规则的产生<br>5.3.5 交叉验证<br>5.3.6 C4.5工作流程<br>5.4 分类与回归树<br>5.4.1 基本定义<br>5.4.2 构建树算法<br>5.4.3 修剪<br>5.4.4 决策树评估<br>5.4.5 内存管理及时间复杂性分析<br>5.5 SLIQ——一种快速可扩展的分类算法<br>5.5.1 扩展性问题<br>5.5.2 SLIQ分类器<br>5.5.3 数据结构及算法<br>5.6 SPRINT——数据挖掘中一种可扩展的并行分类器<br>5.6.1 数据结构<br>5.6.2 分割点的求解<br>5.6.3 分割<br>5.6.4 与SLIQ的对比<br>5.6.5 分类并行化<br>5.7 分类算法的评价<br>5.7.1 分类器准确率度量<br>5.7.2 ROC曲线<br>5.8 其他分类算法<br>5.8.1 人工神经网络<br>5.8.2 支持向量机<br>……<br>第6章 聚类分析<br>第7章 序列模式与时间序列<br>第8章 空间多维数据访问与可视化<br>第9章 开放式的数据挖掘系统<br>第10章 数据挖掘应用<br>第11章 数据挖掘新进展<br>参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证