基于规则的分类算法主要利用了“A→C”规则的特征。在逻辑上,“A→C”表示A对C的支持,而“C→A”表示A对C的必要,在分类中如果能利用“C→A”的特征会提高分类精度。利用必要规则提高了分类算法的精度。进一步,考虑到不平衡数据集中起决定作用的是支持度小的稀有属性。训练时只采集稀有属性的规则,不平衡数据集上的分类测试达到了高的精度,并且分类器规则集小,训练与测试时间扩展性好。
请选择您读者所在的图书馆