第1章 统计学习理论基础
机器学习(Machine Learning,ML)是人工智能(Artificial Intelligence,AI)最具智能特征、最前沿的研究领域之一。基于数据的统计学习问题是现代智能计算技术的一个重要分支。基于数据的统计学习不同于传统的以渐进理论为基础的统计学,它模拟人类从实例中学习归纳的能力,主要研究如何从一些观测数据中挖掘出目前尚不能通过原理分析得到的规律,并利用这些规律去分析客观对象,对未知数据或无法观测的新数据进行预测和判断。
本章对机器学习、统计学习理论的生、学习过程的一致性条件、VC维理论、推广性的界、结构风险最小化等统计学习理论的基本内容进行了概述,为后续章节的学习提供理论基础。
1.1 机器学习
学习能力是学习行为的一个非常重要的特征,但至今人类对学习的机理尚不清楚。研究人员曾对学习给出过各种定义。
H.A.Simon认为,学习是系统所作的适应性变化,以使得系统在下一次完成同样或类似的任务时更为有效。
R.S.Michalski认为,学0 习是构造或修改对于所经历事物的表示。
从事具体智能系统研制的学者则认为学习是知识的获取。
上述观点各有侧重,第一种观点强调学习的外部行为效果,第二种则强调学习的内部过程。
机器学习主要研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。
展开