第1章 数据分析概述
第1课 什么是数据分析?
数据分析不等于计算
第2课 数据分析的步骤:PPDAC循环
第3课 Jupyter Notebook的安装方法
在Windows系统安装Jupyter Notebook
在macOS系统安装Jupyter Notebook
第4课 Jupyter Notebook的使用方法
启动Jupyter Notebook
输入代码并执行
关闭Jupyter Notebook
使用Anaconda Navigator便捷安装外部库
绘制图表并添加注释
第2章 收集数据的预处理
第5课 读取表格数据
什么是表格数据?
创建数据框
准备外部数据文件
读取数据文件
第6课 粗略观察数据
观察数据
提取列数据
提取行数据
提取元素数据
第7课 使用数据
添加列数据和行数据
删除列数据和行数据
根据条件提取数据
第8课 检查数据错误
缺失值的处理
删除重复数据
将字符串类型的数据转换为数值
第3章 用一个数值表示数据集合:代表值
第9课 将数据填平:平均值
求平均值
代表值用于数据的比较
第10课 平均值总能作为代表值吗?
分析平均值是否适合作为代表值
第11课 平均值相同的两种数据未必相同
第4章 通过图表直观地抓住特征
第12课 借助图表观察数据偏差
matplotlib的用法
seaborn的用法
借助直方图查看数据偏差
第13课 绘制基础图表
借助柱状图比较数据的大小
借助折线图查看变化趋势
借助饼图比较元素的占比
第14课 观察偏差的图表
借助箱线图比较数据的偏差
借助散点图查看两种数据的相关性
第15课 使图表更加清晰
突出图表的重点
在图表上添加一些线
第5章 判断数据常见或罕见:正态分布
第16课 用数值表示数据的偏差
查看一定范围内的数据量
第17课 自然界中的偏差
正态分布呈现钟形
为什么正态分布是自然界中极其常见的分布?
高尔顿板的模拟
正态分布能够通过计算求解
第18课 判断常见或罕见
比较偏差不同的数据
第19课 这份数据的偏差自然吗?
第20课 统一比较不同偏差的数据
偏差值:平均值为50的正态分布
IQ:平均值为100的正态分布
第6章 根据关系预测:回归分析
第21课 两种数据的相关性:相关系数
散点图
相关系数
第22课 在散点图上画线预测
第23课 循环绘制散点图
用颜色的“热度”表示相关矩阵:热力图
循环绘制散点图:散点图矩阵
第24课 鸢尾花数据
学无止境
展开