本书源代码
目录
第1章网络爬虫
1.1网络爬虫简介
1.2HTTP的基础知识
1.2.1HTTP的特点
1.2.2HTTP请求和响应
1.3Python网络请求库
1.3.1urllib库
1.3.2requests库
1.4网页数据解析
1.4.1正则表达式
1.4.2网页数据解析库
1.5模拟浏览器
1.5.1Selenium简介
1.5.2安装驱动
1.5.3Selenium的安装
1.5.4Selenium的应用
1.6多进程爬虫和多线程爬虫
1.7移动端App数据爬取
1.7.1Charles的安装
1.7.2Charles的应用
1.8Scrapy框架
1.8.1Scrapy框架的组成
1.8.2Scrapy框架的运行流程
1.8.3Scrapy框架的安装
1.8.4Scrapy框架的应用
1.9分布式爬虫
第2章NumPy
2.1NumPy简介
2.2数组对象的创建
2.3数组对象的数据类型
2.4数组对象的属性和方法
2.5数组对象的访问
2.5.1索引访问
2.5.2迭代访问
2.6数组对象的算术运算
2.7数组对象的广播
2.8NumPy的通用函数
2.8.1算术运算函数
2.8.2数学运算函数
2.8.3连接函数
2.8.4分割函数
2.8.5统计函数
2.8.6排序函数
2.8.7条件筛选函数
2.8.8随机数函数
2.9NumPy的线性代数函数
2.10数组对象的保存和读取
2.10.1数组对象的保存
2.10.2数组对象的读取
第3章Pandas
3.1Pandas简介
3.2Series
3.2.1Series简介
3.2.2Series的创建
3.2.3Series的访问
3.3DataFrame
3.3.1DataFrame简介
3.3.2DataFrame的创建
3.3.3DataFrame的操作
3.4数据形式
3.4.1长型数据
3.4.2宽型数据
3.4.3长型数据和宽型数据的相互转换
3.5索引对象
3.6算术运算
3.7统计学方法
3.8函数应用
3.9排序
3.10去重
3.11文件的读写
3.11.1CSV文件的读写
3.11.2Excel文件的读写
第4章Matplotlib
4.1Matplotlib简介
4.2图表的组成
4.3rc参数
4.4图表的保存
4.5绘制折线图
4.6绘制柱状图
4.7绘制条形图
4.8绘制饼图
4.9绘制散点图
4.10绘制直方图
4.11绘制面积图
4.12绘制箱形图
4.13绘制小提琴图
4.14绘制热力图
4.15绘制子图
第5章Seaborn
5.1Seaborn简介
5.2图表的背景
5.3图表的边框
5.4绘制折线图
5.5绘制柱状图
5.6绘制直方图
5.7绘制散点图
5.8绘制分布散点图
5.9绘制分簇散点图
5.10绘制箱形图
5.11绘制小提琴图
5.12绘制核密度图
5.13绘制热力图
5.14绘制聚类热图
5.15绘制线性回归图
第6章pyecharts
6.1pyecharts简介
6.2pyecharts的安装
6.3图表的组成
6.4options模块
6.4.1文字样式配置项
6.4.2标签配置项
6.4.3标记点配置项
6.4.4线样式配置项
6.4.5标记线配置项
6.4.6分割线配置项
6.4.7区域填充样式配置项
6.4.8涟漪特效配置项
6.4.9分隔区域配置项
6.4.10初始化配置项
6.4.11标题配置项
6.4.12图例配置项
6.4.13提示框配置项
6.4.14工具箱配置项
6.4.15视觉映射配置项
6.4.16区域缩放配置项
6.5链式调用
6.6绘制折线图
6.7绘制柱状图
6.8绘制饼图
6.9绘制箱形图
6.10绘制涟漪散点图
6.11绘制水球图
6.12绘制仪表盘图
6.13绘制K线图
6.14绘制地图
第7章项目实战
7.1项目概述
7.1.1数据搜集
7.1.2数据存取
7.1.3数据清洗
7.1.4数据分析
7.1.5数据可视化
7.2程序编写
7.2.1数据搜集和数据存取
7.2.2数据清洗
7.2.3数据分析
7.2.4数据可视化