第四章 决策树判别<br> 前面我们讨论了用线性判别函数设计分类器的方法。但是大量实际的模式识别问题并不是线性可分的,比如当两类样本的分布具有多峰性质并相互交错时,简单的线性判别函数往往会导致较大的分类错误。这种情况下就需要采用非线性分类器。<br> 从本章开始我们来讨论几种常用的、特别是在高能物理实验数据分析中常用的非线性分类方法。<br> 4.1 超长方体分割法<br> 我们首先讨论一种对于二类问题的最简单的非线性判别方法——超长方体分割法,它可以认为是决策树判别方法的一种最简单的特例,但是由于它简单、易实行的特点,在实验数据的多元分析中,特别是高能物理实验数据分析中,仍然有比较广泛的应用。<br> 4.1.1 超长方体分割法的基本思想<br> 在本节的讨论中,为了不失一般性,我们把样本分为信号和本底两个类别,信号指实验中所要研究的过程的事例样本,所有信号以外的样本都属于本底样本。<br> 超长方体分割法不是企图用一个决策规则把两类样本一次分开,而是采用分级的方法来解决分类问题。它的基本思想如图4.1所示。<br> ……
展开