前言
第一部分 Excel数据分析基础
第1章 探索性数据分析入门
1.1 什么是探索性数据分析
1.1.1 观测值
1.1.2 变量
1.2 演示:对变量进行分类
1.3 小结:变量类型
1.4 在Excel中探索变量
1.4.1 探索分类变量
1.4.2 探索定量变量
1.5 本章小结
1.6 练习
第2章 概率论基础
2.1 概率与随机性
2.2 概率与样本空间
2.3 概率与实验
2.4 非条件概率与条件概率
2.5 概率分布
2.5.1 离散概率分布
2.5.2 连续概率分布
2.6 本章小结
2.7 练习
第3章 推断统计基础
3.1 推断统计框架
3.1.1 收集有代表性的样本
3.1.2 陈述假设
3.1.3 制订分析计划
3.1.4 分析数据
3.1.5 做出决定
3.2 数据由你主宰
3.3 本章小结
3.4 练习
第4章 相关性和回归
4.1 “相关并不等于因果”
4.2 相关性简介
4.3 从相关性到回归
4.4 Excel中的线性回归
4.5 反思结果:虚假关系
4.6 本章小结
4.7 高阶编程阶段
4.8 练习
第5章 数据分析栈
5.1 统计学、数据分析和数据科学
5.1.1 统计学
5.1.2 数据分析
5.1.3 商业分析
5.1.4 数据科学
5.1.5 机器学习
5.1.6 独特,但不排他
5.2 数据分析栈的重要性
5.2.1 电子表格
5.2.2 数据库
5.2.3 商业智能平台
5.2.4 数据编程语言
5.3 本章小结
5.4 下一步
5.5 练习
第二部分 从Excel到R
第6章 使用R之前的准备工作
6.1 下载R
6.2 RStudio入门
6.3 R包
6.4 升级R、RStudio和R包
6.5 本章小结
6.6 练习
第7章 R中的数据结构
7.1 向量
7.2 索引向量和提取子集
7.3 从Excel表格到R数据框
7.4 在R中导入数据
7.5 探索R数据框
7.6 索引R数据框和提取子集
7.7 将数据写入R数据框
7.8 本章小结
7.9 练习
第8章 使用R进行数据处理与可视化
8.1 使用dplyr包处理数据
8.1.1 按列操作
8.1.2 按行操作
8.1.3 聚合和连接数据
8.1.4 dplyr包和管道运算符
8.1.5 使用tidyr包重塑数据
8.2 使用ggplot2包可视化数据
8.3 本章小结
8.4 练习
第9章 使用R进行数据分析
9.1 探索性数据分析
9.2 假设检验
9.2.1 独立样本t检验
9.2.2 线性回归
9.2.3 训练集/测试集分离和验证
9.3 本章小结
9.4 练习
第三部分 从Excel到Python
第10章 使用Python之前的准备工作
10.1 下载Python
10.2 Jupyter Notebook入门
10.3 Python中的模块
10.4 升级Python、Anaconda和Python包
10.5 本章小结
10.6 练习
第11章 Python中的数据结构
11.1 numpy数组
11.2 索引numpy数组和提取子集
11.3 pandas数据框
11.4 在Python中导入数据
11.5 探索pandas数据框
11.5.1 索引pandas数据框和提取子集
11.5.2 把pandas数据框写入文件
11.6 本章小结
11.7 练习
第12章 使用Python进行数据处理与可视化
12.1 按列操作
12.2 按行操作
12.3 聚合和连接数据
12.4 重塑数据
12.5 可视化数据
12.6 本章小结
12.7 练习
第13章 使用Python进行数据分析
13.1 探索性数据分析
13.2 假设检验
13.2.1 独立样本t检验
13.2.2 线性回归
13.2.3 训练集/测试集分离和验证
13.3 本章小结
13.4 练习
第14章 结论和展望
14.1 进一步学习的方向
14.2 研究设计和商业实验
14.3 进一步学习统计方法
14.4 数据科学和机器学习
14.5 版本控制
14.6 道德准则
14.7 勇往直前
14.8 告别的话
展开