搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
利用Python学习数据分析/智博数据分析技术图书
0.00     定价 ¥ 69.80
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787522617251
  • 作      者:
    作者:(日)山内长承|责编:韩莹琳|译者:李仙
  • 出 版 社 :
    中国水利水电出版社
  • 出版日期:
    2025-09-01
收藏
畅销推荐
内容介绍
《利用Python学习数据分析》用通俗易懂的文字结合大量代码,详细介绍了用Python进行数据分析的基本方法和技巧。全书共7章,具体内容包括数据分析的基础知识,Python与数据分析程序库,使用统计分析方法进行多维变量分析——相关分析/关联分析/回归分析/主成分分析/因子分析,使用机器学习算法进行多维变量分析——聚类分析/k-近邻算法/决策树/支持向量机,关联分析,时间序列数据分析和网络分析等。读者可以一边学习Python编程的基础,一边掌握数据分析的实践技术。 《利用Python学习数据分析》内容丰富,实践性强,适合大中专院校财务、人工智能、数据科学等相关专业学生学习,也适合作为读者学习数据分析技术的参考用书。
展开
目录
第1章 数据分析的基础知识
1.1 数据分析简介
1.2 变量与数据类型
1.3 分析方法概述
第2章 Python与数据分析程序库
2.1 Python简介
2.1.1 为什么使用Python
2.1.2 Python与其他编程语言的区别
2.2 运行环境与JupyterNotebook
2.2.1 下载和安装
2.2.2 使用JupyterNotebook
2.2.3 保存文件以及退出JupyterNotebook环境
2.3 数据分析程序库NumPy、pandas与机器学习库scikit-learn
2.3.1 NumPy
2.3.2 pandas
2.3.3 scikit-learn
2.4 可视化绘图程序库Matplotlib
2.4.1 绘图
代码2-1 绘制冰激凌消费支出与气温之间的关系图(1)
代码2-2 绘制冰激凌消费支出与气温之间的关系图(2)
2.4.2 用绘图方式表示两个变量之间的关系
代码2-3 绘制冰激凌消费支出与气温之间的关系图(3)
代码2-4 绘制冰激凌消费支出与气温之间的关系图(4)
2.5 数据访问
2.5.1 CSV文件的读写方法
2.5.2 用SQL读写数据库数据
代码2-5 通过MySQL读取数据
代码2-6 通过MySQL插入数据
代码2-7 在pandas中进行数据处理
代码2-8 在数据库中用SQL进行数据处理
2.6 处理缺失数据
2.6.1 缺失数据的表示方法
2.6.2 检测缺失值
2.6.3 删除和置换缺失值
第3章 使用统计分析方法进行多维度变量分析——相关分析/关联分析/回归分析/主成分分析/因子分析
3.1 相关分析与回归分析
3.1.1 相关分析
案例3-1 2016年平均气温与每个家庭的冰激凌月消费支出金额
代码3-1 冰激凌月消费支出与平均气温之间的相关系数
3.1.2 回归分析
代码3-2 计算冰激凌消费支出与气温之间的回归方程式(使用Scipy模块中的stats.linregress函数)
代码3-3 计算冰激凌消费支出与气温之间的回归方程式(使用scikit-learn的linear_model模块)
代码3-4 根据冰激凌消费支出和气温数据计算回归方程式(使用StatsModels的api.OLS模块)
3.1.3 多元回归分析
案例3-2 对波士顿房价进行多元回归分析
代码3-5 使用scikit-learn的linear_model模块进行多元回归分析(波士顿房价)
3.2 分类数据的关联分析
3.2.1 φ系数
代码3-6 使用奈坦尼克号乘客数据计算异变量之间的相关性
代码3-7 对苹果和橘子的喜好程度的相关性
3.2.2 古德-克鲁斯卡尔γ系数和肯德尔τ系数
代码3-8 计算肯德尔τ系数
代码3-9 根据列表中每个单元格的值计算肯德尔τ系数
代码3-10 使用scipy.stats.kendalltau计算肯德尔τ系数
3.2.3 χ2检验与克莱姆相关系数V
3.2.4 斯皮尔曼等级相关系数
代码3-11 计算斯皮尔曼等级相关系数
3.3 主成分分析
案例3-3 费希尔的鸢尾花数据主成分分析
代码3-12 根据费希尔的鸢尾花数据绘制花瓣长度和宽度的散点图
代码3-13 费希尔的鸢尾花数据集的主成分分析
代码3-14 对费希尔鸢尾花数据集绘制双标图
案例3-4 考试成绩的主成分分析
代码3-15 考试成绩的主成分分析
代码3-16 考试成绩的主成分分析以及绘制双标图
3.4 因子分析
3.4.1 因子分析的基本思路
3.4.2 使用Python进行因子分析
代码3-17 关于5个科目考试成绩的因子分析
代码3-18 使用双标图表示波士顿房价数据的因子分析
3.5 对应分析
代码3-19 使用mca程序库进行对应分析
第4章 使用机器学习算法进行多维度变量分析——聚类分析/k-近邻算法/决策树/支持向量机
4.1 聚类算法的基本思路
4.2 分层聚类
代码4-1 使用Scipy库进行分层聚类
代码4-2 对费希尔鸢尾花数据集进行分层聚类
4.3 使用k-均值算法进行非分层聚类
代码4-3 使用k-均值算法对费希尔鸢尾花数据集的花瓣长度和宽度进行聚类分析
4.4 使用EM算法估计高斯混合分布
4.4.1 估计高斯混合分布
4.4.2 使用Python进行高斯混合分布估计
代码4-4 生成高斯混合分布并进行聚类分析(1)
代码4-5 生成高斯混合分布并进行聚类分析(2)
4.5 k-近邻算法
4.5.1 k-近邻算法的基本思路
4.5.2 使用Python实现k-近邻算法
代码4-6 从费希尔鸢尾花数据集中抽取15条作为训练数据计算k-近邻算法
4.6 决策树算法
代码4-7 将学生考试成绩生成决策树
代码4-8 基于费希尔鸢尾花数据集生成决策树
4.7 支持向量机
代码4-9 使用SVM类对费希尔鸢尾花数据集(花瓣长度和宽度)进行分类
第5章 关联分析
5.1 关联分析详解
5.1.1 关联规则与分析指标
5.1.2 Apriori算法
5.2 使用Python进行关联分析
5.2.1 程序库mlxtend
代码5-1 使用mlxtend进
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证