第1章 初识Python数据预处理
1.1 数据预处理概述
1.1.1 认识数据
1.1.2 数据应用开发流程
1.1.3 数据预处理的目的
1.1.4 数据预处理的应用领域
1.2 高质量的数据
1.2.1 常见的数据问题
1.2.2 数据质量
1.3 数据预处理流程
1.3.1 数据获取与存储
1.3.2 数据清洗
1.3.3 数据集成
1.3.4 数据变换
1.3.5 数据规约
1.4 开发环境设置
1.4.1 Anaconda概述
1.4.2 Anaconda下载安装
1.4.3 Anaconda管理虚拟环境
1.5 Jupyter的使用
1.5.1 认识Jupyter
1.5.2 启动Jupyter Notebook
1.5.3 Jupyter工作原理
1.5.4 Jupyter使用方法
1.6 常用的数据预陂旺里工具
1.6.1 数值计算工具NumPy
1.6.2 数据处理工具SciPy
1.6.3 数据处理工具Pandas
1.7 本章小结
1.8 习题
第2章 数据获取与存储
2.1 数据准备
2.1.1 常见的数据类型
2.1.2 常见的数据文件格式
2.2 网络爬虫获邛蝴
2.2.1 认识网络爬虫
2.2.2 网络爬虫执行阶段
2.2.3 爬取百度logo
2.2.4 常见的数据存储方式
2.3 数据读写
2.3.1 可读写数据
2.3.2 读写CSV数据
2.3.3 读写JSON数据
2.3.4 读写XML数据
2.3.5 读写Excel数据
2.4 使用数据库实现数据存储
2.4.1 认识数据库
2.4.2 数据库存储数据
2.5 实战1:遍历文件批量抽取文本内容
……
第3章 数据清洗
第4章 数据集成
第5章 数据变换
第6章 数据规约
第7章 综合实战:家用热水器用户行为分析
第8章 综合实战:赏析中华古诗词
展开