搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
数据分析基础——基于Python的实现(基于Python的数据分析丛书)
0.00     定价 ¥ 49.00
图书来源: 浙江图书馆(由JD配书)
此书还可采购23本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787300307923
  • 作      者:
    主编:吴翌琳,甄峰
  • 出 版 社 :
    中国人民大学出版社
  • 出版日期:
    2022-07-01
收藏
作者简介
贾俊平,中国人民大学统计学院副教授,从事统计教学30多年,著有《统计学——基于R》《统计学——基于Excel》《统计学——基于SPSS》《统计学基础》《数据可视化分析——基于R语言》《统计学——Python实现》等多部教材和著作。《统计学》(第7版)荣获首届全国教材建设奖全国优秀教材二等奖。
吴翌琳,经济学博士,中国人民大学统计学院、中国调查与数据中心教授,主要从事经济统计分析、创新经济计量、指数编制与应用、数据可视化等应用统计方向的研究。
甄峰,中国人民大学统计学院副教授,经济社会统计系主任。国家统计局-中国人民大学数据开发中心副主任,国际统计学会当选会员,联合国大学创新与技术经济研究所(UNU-MERIT)附属研究员。
展开
内容介绍
本书是一本基于Python实现全部例题计算和分析的数据分析教材,书中例题解答均给出了详细的实现代码和结果。全书共11章。第1章介绍数据分析的相关概念以及Python的初步使用方法。第2~3章介绍数据的描述性分析方法,包括数据可视化分析和描述统计量分析。第4~6章介绍数据推断分析的基本理论和方法,包括概率分布、参数估计和假设检验。第7~11章介绍实际中常用的一些数据分析方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。
本书可作为高等院校各专业开设数据分析或统计学课程的教材,也可作为数据分析工作者、Python数据分析和可视化爱好者的参考书。
展开
精彩书摘
R和Python都是免费的开源编程语言,二者的侧重点有所不同。R是一款数据分析和可视化的专业软件,它提供了几乎所有的数据分析解决方案,其函数和语法更符合统计人员的思维和逻辑,并具有强大的帮助功能,容易学习和使用。可以说,R本身就是一本优秀的统计和数据分析教科书。Python则是一种面向对象的解释型高级编程语言,因其简单易学、拥有丰富而强大的开源第三方库等诸多优点,被应用于系统和网络编程、数据处理、云计算、人工智能等多个领域,已成为目前广泛使用的编程语言之一。数据分析仅仅是Python功能的一部分,而且并不是它的特别关注点。实际上,Python提供了数据处理、数据分析、科学计算、可视化等多个模块,如pandas、numpy、statsmodels、matplotlib、seaborn等,如果这些模块仍不能满足需要,那么使用者可以通过编程来解决数据分析问题。
展开
目录
第1章 数据分析与Python语言
1.1 数据分析概述
1.1.1 数据及其来源
1.1.2 数据分析方法
1.1.3 数据分析工具
1.2 Python的初步使用
1.2.1 Python的下载与安装
1.2.2 模块的安装与加载
1.2.3 查看帮助文件
1.2.4 编写代码脚本
1.3 Python数据处理
1.3.1 Python的基本数据结构
1.3.2 numpy中的数组
1.3.3 pandas中的序列和数据框
1.3.4 随机数和数据抽样
1.3.5 数据读取和保存
1.3.6 生成频数分布表
1.4 Python绘图基础
1.4.1 Python的主要绘图模块
1.4.2 基本绘图函数
1.4.3 图形布局
1.3.4 图形颜色、线型和标记
习 题
第2章 数据可视化分析
2.1 类别数据可视化
2.1.1 条形图
2.1.2 饼图和环形图
2.2 数据分布可视化
2.2.2 箱线图和小提琴图
2.2.3 点图
2.3 变量间关系可视化
2.3.1 散点图
2.3.2 散点图矩阵和相关系数矩阵
2.3.3 气泡图
2.4 样本相似性可视化
2.4.1 轮廓图
2.4.2 雷达图
2.5 时间序列可视化
2.5.1 折线图
2.5.2 面积图
2.6 可视化的注意事项
习 题
第3章 描述统计量分析
3.1 描述水平的统计量
3.1.1 平均数
3.1.2 分位数
3.1.3 众数
3.2 描述差异的统计量
3.2.1 极差和四分位差
3.2.2 方差和标准差
3.2.3 变异系数
3.2.4 标准分数
3.3 描述分布形状的统计量
3.3.1 偏度系数
3.3.2 峰度系数
3.4 一个综合描述的例子
习 题
第4章 推断分析的理论基础:概率分布
4.1 什么是概率
4.2 随机变量的概率分布
4.2.1 随机变量及其概括性度量
4.2.2 随机变量的概率分布
4.2.3 其他几个重要的统计分布
4.3 样本统计量的概率分布
4.3.1 统计量及其分布
4.3.2 样本均值的抽样分布
4.3.3 样本方差的抽样分布
4.3.4 样本比例的抽样分布
4.3.5 统计量的标准误
习 题
第5章 推断分析的基本方法:参数估计
5.1 参数估计的原理
5.1.1 点估计与区间估计
5.1.2 评量估计量的标准
5.2 总体均值的区间估计
5.2.1 一个总体均值的估计
5.2.2 两个总体均值差的估计
5.3 总体比例的区间估计
5.3.1 一个总体比例的估计
5.3.2 两个总体比例差的估计
5.4 总体方差的区间估计
5.4.1 一个总体方差的估计
5.4.2 两个总体方差比的估计
习 题
第6章 推断分析的基本方法:假设检验
6.1 假设检验的原理
6.1.1 提出假设
6.1.2 做出决策
6.1.3 表述结果
6.1.4 效应量分析
6.2 总体均值的检验
6.2.1 一个总体均值的检验
6.2.2 两个总体均值差的检验
6.3 总体比例的检验
6.3.1 一个总体比例的检验
6.3.2 两个总体比例差的检验
6.4 总体方差的检验
6.4.1 一个总体方差的检验
6.4.2 两个总体方差比的检验
6.5 正态性检验
6.5.1 正态概率图
6.5.2 S-W检验和K-S检验 )
习 题
第7章 类别变量分析
7.1 一个类别变量的拟合优度检验
7.1.1 期望频数相等
7.1.2 期望频数不等
7.2 多个总体比例的检验
7.2.1 多个总体比例的检验
7.2.2 多个总体比例的多重比较方法
7.3 两个类别变量的独立性检验
7.3.1 列联表与χ²独立性检验
7.3.2 应用χ²检验的注意事项
7.4 两个类别变量的相关性度量
7.4.1 φ系数和Cramer’s V系数
7.4.2 列联系数
习 题
第8章 方差分析
8.1 方差分析的原理
8.1.1 什么是方差分析
8.1.2 误差分解
8.2 单因子方差分析
8.2.1 数学模型
8.2.2 效应检验
8.2.3 效应量分析
8.2.4 多重比较
8.3 双因子方差分析
8.3.1 数学模型
8.3.2 主效应分析
8.3.3 交互效应分析
8.4 方差分析的假定及其检验
8.4.1 正态性检验
8.4.2 方差齐性检验
习 题
第9章 一元线性回归分析
9.1 确定变量间的关系
9.1.1 变量之间的关系
9.1.2 相关关系的描述
9.1.3 关系强度的度量
9.2 模型估计和检验
9.2.1 回归模型与回归方程
9.2.2 参数的最小二乘估计
9.2.3 模型的拟合优度
9.2.4 模型的显著性检验
9.3 利用回归方程进行预测
9.3.1 均值的置信区间
9.3.2 个别值的预测区间
9.4 回归模型的诊断
9.4.1 残差与残差图
9.4.2 检验模型假定
习 题
第10章 多元线性回归分析
10.1 多元线性回归模型及其参数估计
10.1.1 回归模型与回归方程
10.1.2 参数的最小二乘估计
10.2 拟合优度和显著性检验
10.2.1 模型的拟合优度
10.2.2 模型的显著性检验
10.2.3 模型诊断
10.3 多重共线性及其处理
10.3.1 多重共线性及其识别
10.3.2 变量选择与逐步回归
10.4 相对重要性和模型比较
10.4.1 自变量的相对重要性
10.4.2 模型比较
10.5 利用回归方程进行预测
10.6 哑变量回归
10.6.1 在模型中引入哑变量
10.6.2 含有一个哑变量的回归
10.7 Logistic回归
10.7.1 Logistic回归的基本原理
10.7.2 Logistic回归建模
习 题
第11章 时间序列分析
11.1 时间序列的成分和预测方法
11.1.1 时间序列的成分
11.1.2 预测方法的选择与评估
11.2 指数平滑预测
11.2.1 指数平滑模型的一般表达
11.2.2 简单指数平滑预测
11.2.3 Holt指数平滑预测
11.2.4 Winters指数平滑预测
11.3 趋势外推预测
11.3.1 线性趋势预测
11.3.2 非线性趋势预测
11.4 分解预测
11.5 时间序列平滑
习 题

参考书目
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证