★ 数据科学流程概览,并通过Julia实现一个示例,说明了其中的关键点。
★ Julia IDE的选择。
★ 程序结构与函数。
★ 数据工程中的任务,如数据导入、数据清理、数据格式化和数据存储,以及如何执行数据预处理。
★ 数据可视化,以及一些简单但非常强大的用来进行数据探索的方法。
★ 数据降维和特征评价。
★ 各种机器学习方法,从非监督式学习(不同类型的聚类方法)到监督式学习(决策树、随机森林、
基础神经网络、回归树和极限学习机)。
★ 图分析,包括找出不同实体之间的联系以及如何对其进行挖掘以获取有用的知识。
本书主要内容包括:
本书的目标是教你如何使用Julia语言来应对现实世界中数据科学的艰巨挑战。在介绍了Julia对于数据科学社区的重要性和若干数据科学基本准则之后,本书讲解了Julia基础知识,包括如何安装Julia及其功能强大的程序库。本书通过丰富的示例展示了如何使用Julia命令、数据集和函数。
本书介绍并描述了专用的脚本和软件包。针对在数据科学流程中经常会遇到的问题,本书提供了有代表性的实用示例,并引导你通过Julia使用公开的数据集来解决这些问题。在很多情况下,使用现成的软件包和内置函数就可以完成任务。
本书每一章都包括一些思考题和练习,来帮助你加强学习效果,指导你使用Julia从头开始创建一个数据科学应用。
展开