本书的内容安排基本上按照数据科学的步骤及思维, 所有讨论都基于实际数据案例并通过R 和Python 两种软件实现. 内容包括数据及探索性数据分析、数据整理及清理、有监督学习的10 种分类及回归机器学习方法、无监督学习的两种方法. *后简要介绍网络爬虫技术, 供读者参考.
在课程内容的选择、课程进度及授课方式, 必须给任课教师以*大的自由度和自主权,一切依学生的基础、条件及需要而定. 我们应该介绍对学生*有帮助的内容, 而不是某些陈旧教条所认为“应该灌输” 的内容; 应该使学生的思维空间向无限的可能开放, 而不是约束在一个被主观认为“正确” 的狭隘方向. 科学就是在这种开放无拘束的环境下不断发展的.
展开