Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。
Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。
本书会带你迅速了解使用HDF5对大小从GB至TB的数字数据集进行存档和共享的细节、实践以及陷阱,体验在Python语言中用HDF5存储科学数据。
通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主题。本书的例子对于Python2和Python3都适用。
本书包括以下内容:
设置HDF5工具并创建HDF5文件。
通过学习HDF5数据集对象来使用数据集。
理解数据集分块和压缩等高级功能。
使用组来学习如何利用HDF5层次性结构。
使用HDF5的属性来添加元数据,创建可以自解释的文件。
利用HDF5的类型系统创建有互操作性的文件。
使用引用,命名类型和维度标尺来表示数据之间的关系。
了解在Python中如何编写能跟HDF5互动的并行代码。
本书生产力和创造力的推进器的一个真实的完美例子。本书会让你觉得"HDF5很简单"。
展开