现实工作中,人们常常需要用数据说话。可是,数据自己不会说话,需要人对它进行分析和挖掘才能找到有价值的信息。概率统计是数据分析的通用语言,是大数据时代预测未来的根基。如果你有编程背景,就能以概率和统计学为工具,将数据转化为有用的信息和知识,让数据说话。本书介绍了如何借助计算而非数学方法,使用Python语言对数据进行统计分析。
通过书中有趣的案例,你可以学到探索性数据分析的整个过程,从数据收集和生成统计量,到发现模式和检验假设。你还将探索概率分布、概率法则、可视化技术,以及其他许多工具和概念。
这一版内容较第1版有很多改动,并且新增了回归、时间序列分析、生存分析和分析方法章节,以丰富你的知识。
通过学习本书,你将能够:
编写测试代码深入理解概率论和统计学;
运行实验检验统计行为特征,如生成服从各种分布的样本;
通过模拟理解数学上艰涩的概念;
学习贝叶斯估计等实用内容;
用Python从大部分数据源导入数据,不依赖由统计工具清洗的格式化数据;
用统计推理解读现实世界中的数据。
展开