搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
极速Python--高性能编码计算与数据分析(数据科学与大数据技术)
0.00     定价 ¥ 79.80
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302656296
  • 作      者:
    作者:(美)蒂亚戈·罗德里格斯·安道|责编:王军|译者:沈冲
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2024-03-01
收藏
畅销推荐
内容介绍
本书直击Python编程要害。对于大型数据项目,过慢的代码运行速度是毁灭性的。在机器学习和大规模数据分析中,除了使用高性能的Python代码,还要使用经过优化的库,并利用计算机硬件的多核处理能力。满足计算速度后,还要优化计算资源、控制计算成本,而本书为此提供了一整套高性能编程解决方案。 本书系统介绍了Python高性能编程的各种工具和方法,重点讲解了Python在大数据中的应用。书中配有清晰的示例和详细的分析,可帮助读者熟练掌握NumPy和Pandas,实现高性能的数据存储和I/O。本书高屋建瓴、不留遗漏,读者学习本书后,能从代码到架构对系利统进行整体优化。
展开
目录
第I部分 基础知识
第1章 对高效数据处理的迫切需求
1.1 数据泛滥的严重性
1.2 现代计算架构和高性能计算
1.2.1 计算机内部的变化
1.2.2 网络的变化
1.2.3 云计算
1.3 Python的局限性
1.4 解决方案小结
1.5 本章小结
第2章 发挥内置功能的最佳性能
2.1 分析同时具有IO和计算任务的应用程序
2.1.1 下载数据并计算最低温度
2.1.2 Python的内置分析模块
2.1.3 使用本地缓存
2.2 对代码进行分析以检测性能瓶颈
2.2.1 可视化分析信息
2.2.2 行分析
2.2.3 代码分析小结
2.3 优化基本数据结构:列表、集合、字典
2.3.1 列表搜索的性能
2.3.2 使用集合进行搜索
2.3.3 Python中的列表、集合和字典的复杂性
2.4 节约内存
2.4.1 Python内存估算
2.4.2 其他表示方法的内存占用
2.4.3 使用数组进行紧凑表示
2.4.4 串联知识点:估算Python对象的内存占用
2.4.5 Python对象内存占用小结
2.5 在大数据管道中使用惰性编程和生成器
2.6 本章小结
第3章 并发、并行和异步
3.1 编写异步服务器框架
3.1.1 实现与客户通信的框架
3.1.2 协程
3.1.3 使用简单的同步客户端发送复杂数据
3.1.4 实现进程间通信的其他方法
3.1.5 异步编程小结
3.2 实现基本的MapReduce引擎
3.2.1 理解MapReduce框架
3.2.2 开发简单的测试场景
3.2.3 第一次实现MapReduce框架
3.3 实现MapReduce并发引擎
3.3.1 使用concurrent.futures实现线程服务器
3.3.2 使用futures异步执行
3.3.3 GIL和多线程
3.4 使用多进程实现MapReduce
3.4.1 基于concurrent.futures的解决方案
3.4.2 基于多进程模块的解决方案
……
第II部分 硬件
第III部分 用于现代数据处理的应用和库
第IV部分 高级主题
附录A 搭建环境
附录B 使用Numba生成高效的底层代码
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证