第1章 数据分析概述
1.1 初识数据分析
1.1.1 为什么会有数据分析
1.1.2 怎样去做数据分析
1.2 数据分析的常用方法
1.2.1 5W1H分析法
1.2.2 逻辑树分析法
1.2.3 对比分析法
1.2.4 群组分析法
1.3 Python的安装与使用
1.3.1 Python的下载与安装
1.3.2 检验安装是否成功
1.3.3 第一个Python程序
1.4 数据分析工具库
1.4.1 NumPy
1.4.2 Matplotlib
1.4.3 Pandas
1.4.4 scikit-learn
1.5 Anaconda——最受欢迎的开源Python分发平台
1.5.1 初识Anaconda
1.5.2 Anaconda的安装与使用
1.6 本章小结
1.7 习题
第2章 数据集的获取与存储
2.1 数据获取
2.1.1 内部数据的获取方法
2.1.2 外部数据的获取方法
2.2 数据存储格式
2.2.1 CSV格式与Excel格式
2.2.2 HTML格式与JSON格式
2.2.3 二进制格式
2.3 数据库
2.3.1 建立数据库及数据表
2.3.2 使用Python连接数据库
2.4 本章小结
2.5 习题
第3章 NumPy——数组与矩阵运算
3.1 初识NumPy
3.1.1 NumPy简介
3.1.2 安装NumPy
3.2 NumPy数组操作
3.2.1 数组的概念
3.2.2 数组的属性
3.2.3 创建教组
3.2.4 数组运算
3.2.5 数组的切片和索引
3.2.6 数组重塑
3.2.7 数组迭代
3.3 NumPy矩阵操作
3.3.1 矩阵的创建
3.3.2 矩阵的运算
3.3.3 矩阵的转置与求逆
3.4 NumPy常用统计函数
3.5 NumPy——随机漫步
3.6 本章小结
3.7 习题
第4章 Pandas——高性能的数据结构和数据分析工具
4.1 初识Pandas
4.2 Pandas数据结构的基本操作
4.2.1 Series对象的创建
4.2.2 Series对象的属性
4.2.3 DataFrame对象的创建
4.2.4 DataFrame对象的基本操作
4.3 Pandas的计算与统计
4.3.1 DataFrame对象的基本计算
4.3.2 DataFrame对象与Series对象之间的基本计算
4.3.3 Pandas中常用的统计方法
4.4 Pandas其他常用函数
4.4.1 Pandas数据重复值处理
4.4.2 Pandas数据排序
4.4.3 Pandas数据合并
4.4.4 Pandas日期数据处理
4.5 实战1:泰坦尼克号乘客数据处理与分析
4.5.1 任务说明
4.5.2 任务实现
4.6 本章小结
4.7 习题
第5章 数据预处理
5.1 数据准备
5.1.1 数据的加载
5.1.2 堆叠合并数据
5.1.3 重叠合并数据
5.2 数据变换
5.2.1 数据分析与挖掘体系位置
5.2.2 数据变换的方法
5.2.3 常见操作
5.2.4 数据基本字段
5.2.5 数据类型转换
5.3 数据清洗
5.3.1 导入与查看数据集
5.3.2 缺失值处理
5.3.3 重复值处理
5.3.4 异常值处理
5.4 数据标准化
5.4.1 数据标准化的原因
5.4.2 数据标准化的方法
5.4.3 数据标准化的区别与意义
5.5 实战2:运动员数据分析预处理
5.5.1 任务说明
5.5.2 任务实现
5.6 实战3:豆瓣读书数据预处理
5.6.1 任务说明
5.6.2 任务实现
5.6.3 直观数据分析
5.7 本章小结
5.8 习题
第6章 Matplotlib——可视化绘图
6.1 Matplotlib的安装
6.2 Matplotlib的绘制流程
6.2.1 绘图结构——Figure、Axes、Axis、Artist
6.2.2 绘图流程
6.2.3 第一个交互式图表
6.2.4 其他常用操作
6.3 Matplotlib基础图表的绘制
6.3.1 散点图的绘制
6.3.2 直方图的绘制
6.31 3折线图的绘制
6.3.4 饼图的绘制
6.3.5 箱线图的绘制
6.3.6 正弦图和余弦图的绘制
6.3.7 误差条形图的绘制
6.3.8 玫瑰图的绘制
6.3.9 词云的绘制
6.4 Matplotlib高级图表
6.4.1 等值线图
6.4.2 风杆图
6.4.3 多序列条形图
6.4.4 多序列堆积条形图
6.4.5 多面板图
6.5 实战4:我国地区生产总值数据可视化
6.5.1 任务说明
6.5.2 任务实现
6.6 实战5:餐厅小费赠予情况数据可视化
6.6.1 任务说明
6.6.2 任务实现
6.7 本章小结
6.8 习题
第7章 机器学习与数据挖掘
7.1 机器学习概述
7.2 监督学习——分类与回归
7.2.1 七近邻算法
7.2.2 决策树
7.2.3 归分析
7.2.4 其他常见的分类与预测算法
7.3 聚类与关联分析
7.3.1 尼均值聚类分析
7.3.2 Apriori关联分析
7.4 数据结构与算法
7.4.1 树结构
7.4.2 排序
7.5 本章小结
7.6 习题
第8章 综合实战:就业分析
8.1 研究背景
8.2 分析目标
8.3 数据获取
8.4 数据处理
8.5 数据分析
8.6 本章小结
第9章 综合实战:
展开