搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
大数据分析基础
0.00     定价 ¥ 59.80
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302697954
  • 作      者:
    编者:李石明|责编:陈莉
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2025-08-01
收藏
畅销推荐
内容介绍
本书首先全面介绍了信息技术、计算机基础,以及计算机的起源与发展、计算机系统的组成、操作系统和文件管理等内容,然后深入探讨了Python编程的基础知识,包括编程环境、语法、流程控制、组合数据类型、函数和模块、常用的库等,并通过丰富的实操练习帮助读者掌握Python在文件管理、数据处理、科学计算等领域的应用能力。此外,本书涵盖了机器学习、大数据分析框架及国产大模型DeepSeek等内容,有助于读者建立从基础到前沿的Python知识体系。本书包含丰富的代码示例和综合案例,可以帮助读者快速掌握大数据分析理论和实用的编程技能。 本书适用于高等院校计算机相关专业的学生、Python编程初学者,以及对数据科学、机器学习感兴趣的读者。
展开
目录
第1部分 筑基篇——Python与数据科学的桥梁
第1章 信息技术与计算机基础
1.1 信息社会与计算机
1.1.1 信息与信息处理
1.1.2 计算机的起源与发展
1.1.3 计算机的分类和应用领域
1.1.4 计算思维
1.2 计算机基础知识
1.2.1 信息编码
1.2.2 计算机系统
1.2.3 操作系统和文件
本章小结
习题
第2章 Python编程基础
2.1 Python概述
2.1.1 产生背景
2.1.2 历史发展
2.1.3 版本更迭
2.1.4 应用分析
2.1.5 发展趋势
2.2 编程环境
2.2.1 安装Python解释器
2.2.2 选择合适的IDE
2.2.3 安装常用的库和工具
2.2.4 配置环境变量
2.2.5 测试和验证
2.3 基础知识
2.3.1 标识符
2.3.2 变量
2.3.3 数据类型
2.3.4 字符串的表示及格式化
2.3.5 语句input/output
2.4 流程控制
2.4.1 程序的基本结构
2.4.2 分支结构
2.4.3 循环结构
2.4.4 综合案例
2.5 组合数据类型
2.5.1 列表及其操作
2.5.2 元组及其操作
2.5.3 字典及其操作
2.5.4 集合及其操作
2.6 函数和模块
2.6.1 函数
2.6.2 实操练习:成绩管理系统
2.6.3 模块
2.6.4 实操练习:学生管理系统
2.7 常用的库
2.7.1 随机数random库
2.7.2 绘图工具turtle库
2.7.3 中文分词jieba库
2.7.4 词云工具wordcloud库
本章小结
习题
第3章 Python操作实践
3.1 文件和目录操作
3.1.1 基本概念
3.1.2 文件的打开与关闭
3.1.3 文件的读写
3.1.4 文件和目录的管理
3.1.5 实操练习:文件和目录管理
3.2 Word文档处理
3.2.1 安装python-docx库
3.2.2 创建新文档
3.2.3 修改现有文档
3.2.4 高级功能与扩展功能
3.2.5 实操练习:Word文档处理
3.3 PDF文件处理
3.3.1 安装PyPDF2和pdfplumber
3.3.2 内容提取
3.3.3 合并与拆分
3.3.4 加密与解密
3.3.5 实操练习:自动生成报告
3.4 Excel电子表格处理
3.4.1 安装依赖库
3.4.2 读取Excel中的数据
3.4.3 数据清洗与处理
3.4.4 将数据写入Excel
3.4.5 高级操作
3.4.6 实操练习:自动生成销售数据分析报告
3.5 PPT演示文稿处理
3.5.1 安装python-pptx库
3.5.2 创建基础PPT
3.5.3 高级功能
3.6 NumPy科学计算库
3.6.1 NumPy库概述
3.6.2 数组维度
3.6.3 数组对象ndarray
3.6.4 数组操作
3.6.5 数组运算
3.6.6 数据处理
3.6.7 实操练习:酒鬼漫步
3.6.8 实操练习:地区经济发展分析
3.7 Pandas数据处理与分析库
3.7.1 Pandas库概述
3.7.2 数据读取与写入
3.7.3 数据对象DataFrame与Series
3.7.4 实操练习:将多个DataFrame写入一个Excel的不同sheet的操作
3.7.5 实操练习:北京高考分数线统计分析
3.7.6 数据清洗与预处理(选讲)
3.7.7 实操练习:预处理销售数据(选讲)
3.7.8 数据聚合与分组(选讲)
3.7.9 实操练习:运动员信息的分组与聚合(选讲)
3.8 数据可视化工具Matplotlib和Seaborn
3.8.1 Matplotlib基础
3.8.2 绘制常见图表
3.8.3 Seaborn高级可视化
3.8.4 进阶用法
3.8.5 实操练习:数据可视化
3.8.6 实操练习:图示分析景点数据
本章小结
习题
第4章 机器学习基础
4.1 概述
4.2 scikit-learn库
4.2.1 核心功能
4.2.2 安装
4.2.3 实操练习:用KNN算法对鸢尾花数据集进行分类
4.3 监督学习
4.4 无监督学习
4.5 模型评估与优化
4.5.1 模型评估
4.5.2 模型优化
4.5.3 实操练习:用决策树对鸢尾花数据集进行分类
本章小结
习题
第2部分 进阶篇——分布式计算与生态工具
第5章 大数据基础及应用框架
5.1 大数据基础知识
5.1.1 概念及特征
5.1.2 发展现状
5.2 大数据分析理论与方法
5.2.1 基本理念
5.2.2 主要步骤
5.2.3 数据对象
5.2.4 主要模型
5.2.5 应用平台
5.3 大数据分析框架
5.3.1 Hadoop与HDFS
5.3.2 大数据的存储与访问
5.4 Spark数据处理平台
5.4.1 核心组件
5.4.2 基本概念
5.4.3 实操练习:词频统计
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证