本书首先向您介绍数据科学,然后教您安装和搭建数据分析编程环境所需的软件包。在机器学习中,您将学习机器学习的三项主要技术:监督学习、无监督学习和强化学习。您还将探索基本的分类与回归技术,如支持向量机、决策树以及逻辑回归等。
在前面的章节中,您将学习Python语言的基本功能、数据结构和语法,这些语言用于轻松处理大型数据集。您将学习用于矩阵计算和数据操作的Numpy库和Pandas库、学习如何使用Matplotlib创建可定制的可视化图表,并应用Boostinq算法XGBoost进行预测。
在后面的章节中,您将学习用于图像识别的卷积神经网络(CNN)、深度学习算法。您还将学习如何将人类的语言输入到神经网络中,建立一个可以处理语境信息的模型,以及创建人类语言处理系统进行结果预测。
学习完本书,您将能够理解并实现许多新的数据科学算法,并且有信心使用本课程以外的工具或库进行操作。
展开