第1章 数据科学概述
1.1 什么是数据科学?
1.2 大数据技术
1.3 数据未来
第2章 Python基础
2.1 编程环境与规范
2.2 数据类型、数据载体及运算
2.3 序列结构
2.4 程序流程控制
2.5 函数
2.6 字符串
2.7 文件操作
2.8 面向对象程序设计
第3章 科学计算――Numpy
3.1 计算基础
3.1.1 什么是科学计算?
3.1.2 Numpy基础
3.2 数组的创建与访问
3.2.1 创建数组
3.2.2 数组的访问
3.3 数组的基本操作
3.4 数组的基本运算
3.5 矩阵基础及运算
3.6 Numpy的简单应用
第4章 数据处理和分析――Pandas
4.1 数据结构
4.1.1 常用数据结构
4.1.2 数据类型
4.1.3 数据类型的简单使用
4.1.4 系列的基本使用
4.1.5 数据帧的基本使用
4.2 数据加载与文件格式
4.2.1 Pandas的I/O功能
4.2.2 数据读写与文件格式
4.3 数据清洗与预处理
4.3.1 检测与处理缺失值
4.3.2 检测和处理重复值
4.3.3 检测和处理异常值
4.3.4 数据转换
4.3.5 数据匹配
4.3.6 数据标准化
4.4 数据处理与分析
4.4.1 层次化索引
4.4.2 数据连接与合并
4.4.3 数据聚合与分组运算
4.5 时间序列分析
4.5.1 时间序列基础
4.5.2 时间戳(Timestamp)
4.5.3 时区(Timezone)
4.5.4 时期(Period)
4.5.5 时间差(Timedelta)
4.5.6 时间序列重构
4.6 Pandas高级应用
4.6.1 分类数据
4.6.2 链式编程技术
第5章 数据可视化――Matplotlib
5.1 绘图基础
5.2 二维图形可视化
5.3 三维图形可视化
5.4 使用动画
5.4.1 使用Animation模块创建动画
5.4.2 使用OpenGL创建动画
5.5 复杂网络结构可视化
5.5.1 网络可视化基础
5.5.2 网络图的生成
5.5.3 网络图的绘制
展开