数据科学是在动态世界中不断发展变化的。本书旨在让读者掌握数据科学基础知识与技能,尽快进入理论与实践,奠定进一步发展的基础。
本书精选了5章内容。第1章为数据初等描述;第2章介绍传统统计基本思维方式,可作为参考;第3章系统深入地介绍有监督学习基础,包括回归及分类概念方法,重点介绍决策树;第4章介绍机器学习组合算法及模型;第5章详细介绍神经网络的基本概念。内容聚焦于决策树、神经网络等既基础又具扩展功能的方法,未罗列扩展性不强的方法。
本书支持R和Python两种编程语言,R代码穿插于正文,Python代码及说明性R代码附于每章之后。建议读者在学习数据科学的过程中通过处理数据自学编程,培养自己的编程能力。
本书与教学契合度高,无论经验丰富的教师,还是没有机器学习和数理统计教学经验的教师,都能轻松上手。其独特的数据驱动教学方式,能够极大地激发学生的学习兴趣,促使学生快速吸收知识,提升学习效果。
展开