目录
第1章 绪论1
1.1大数据及其挖掘技术1
1.2粒计算理论6
1.3粗糙集理论8
1.4基于粒计算与粗糙集的数据挖掘11
1.4.1面向海量数据的数据挖掘11
1.4.2面向动态数据的数据挖掘12
1.4.3面向复杂数据的数据挖掘14
1.5本章小结15
第2章 预备知识16
2.1经典粗糙集模型16
2.2面向复杂数据的扩展粗糙集模型18
2.2.1邻域粗糙集模型18
2.2.2集值粗糙集模型20
2.2.3不完备粗糙集模型20
2.3面向有噪声数据的概率粗糙集模型22
2.3.10.5概率粗糙集模型22
2.3.2决策粗糙集模型23
2.3.3变精度粗糙集模型23
2.4属性约简24
2.4.1属性约简的基本框架24
2.4.2启发式属性约简25
2.4.3不协调属性约简29
2.5粒度度量31
2.6本章小结32
第3章 并行大规模特征选择33
3.1并行特征提取方法33
3.1.1模型并行方法33
3.1.2数据并行方法34
3.1.3模型-数据并行方法35
3.2并行特征提取算法35
3.2.1评价函数的统一表示36
3.2.2评价函数的分治方法36
3.2.3基于MapReduce的并行属性约简算法39
3.2.4基于Spark的并行属性约简算法43
3.2.5基于粒计算的并行属性约简加速算法44
3.3实验分析46
3.3.1数据集和实验平台47
3.3.2与串行算法的对比47
3.3.3不同并行算法的对比51
3.3.4高维数据上的表现52
3.3.5天文大数据上的应用53
3.4本章小结54
第4章 近似集动态更新55
4.1知识粒度的变化性质55
4.2基于粒的近似集增量更新方法57
4.2.1等价类特征矩阵58
4.2.2等价类特征矩阵更新原理59
4.2.3基于粒的近似集更新算法61
4.3算例64
4.4算法复杂度分析68
4.5实验方案及性能分析68
4.5.1实验方案68
4.5.2实验结果69
4.6本章小结74
第5章 规则动态更新76
5.1等价类的向量和矩阵表示76
5.2等价类的泛化决策性质77
5.3基于最小辨识属性集的约简生成78
5.3.1最小辨识属性集及其生成算法78
5.3.2属性重要度矩阵80
5.3.3约简的生成81
5.3.4算例82
5.4属性值粗化细化的定义及性质84
5.4.1属性值粗化细化的定义84
5.4.2决策信息系统的动态性质85
5.4.3决策规则的动态性质87
5.5属性值粗化时规则更新原理及算法92
5.5.1属性值粗化时规则更新原理92
5.5.2属性值粗化时规则更新算法95
5.5.3算例97
5.6属性值细化时规则更新原理及算法99
5.6.1属性值细化时规则更新原理99
5.6.2属性值细化时规则更新算法102
5.6.3算例104
5.7算法复杂度分析106
5.8实验方案及性能比较109
5.8.1实验方案109
5.8.2实验结果110
5.9本章小结113
第6章 面向缺失数据的动态概率粗糙集方法114
6.1面向缺失数据的概率粗糙集模型115
6.2面向对象更新的动态概率粗糙集方法115
6.2.1条件概率的增量估计策略115
6.2.2概率粗糙近似集的增量更新方法121
6.3算法设计与分析123
6.4算例128
6.5实验方案与性能分析130
6.5.1实验方案131
6.5.2性能分析132
6.6本章小结139
第7章 复杂数据融合与高效学习算法141
7.1复合粗糙集模型141
7.2近似集的矩阵表示方法144
7.2.1基于矩阵运算的近似集构造方法144
7.2.2基于布尔矩阵的近似集表示方法146
7.2.3基于布尔矩阵的近似集计算方法147
7.3算法设计与复杂度分析148
7.3.1基于布尔矩阵的近似集计算算法148
7.3.2基于矩阵的近似集计算的批处理算法149
7.4近似集的多核并行计算方法150
7.4.1近似集的并行计算方法151
7.4.2GPU架构与CUDA 152
7.4.3基于Single-GPU的近似集计算算法154
7.4.4基于Multi-GPU的近似集计算算法1 55
7.5实验分析157
7.5.1实验设置157
7.5.2批处理算法的性能158
7.5.3 GPU算法的性能159
7.5.4 Multi-GPU算法的性能161
7.6本章小结163
参考文献164
展开