搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
高性能地理计算
0.00     定价 ¥ 59.00
图书来源: 浙江图书馆(由JD配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787030689351
  • 作      者:
    乐鹏
  • 出 版 社 :
    科学出版社
  • 出版日期:
    2021-06-01
收藏
内容介绍
《高性能地理计算》是作者结合现有高性能地理计算的理论、方法和应用所写的。《高性能地理计算》共六大部分(10章)。第一部分为高性能地理计算概述(第1章),阐述高性能地理计算的基本概念、发展历程和现状;第二部分为并行计算基础及并行编程基础(第2~3章),介绍并行计算的基本理论、并行编程入门知识等;第三部分为并行地理计算算法设计(第4~5章),阐述地理算法并行设计挑战、数据并行与任务并行地理算法、地理计算强度的理论与方法等;第四部分为高性能空间数据存储(第6章),介绍大规模数据管理技术,包括NoSQL/NewSQL数据库、内存数据库、阵列数据库等,并围绕对地观测大数据的时空立方体理论方法与设计实现进行介绍;第五部分为地理云计算、云GIS与地理流计算(第7~9章),介绍地理云计算概念、地理云计算服务、云GIS设计与实现、空间数据流处理等;第六部分为时空大数据平台(第10章),介绍融合高性能地理计算的时空大数据平台功能与应用。
展开
精彩书摘
第1章 绪论
  高性能地理计算是地理计算与高性能计算结合的产物。本章将首先介绍地理计算和高性能计算,然后介绍高性能地理计算的基本概念与内容,以及其对时空大数据GIS 的支撑。
  1.1 地理计算与高性能计算概述
  近年来,高性能计算技术快速发展,很多用户开始接触多核、多节点、普通计算机集群乃至服务器集群,高性能计算开始“飞入寻常百姓家”。计算机技术一直快速推动着地理信息系统(geographical information system,GIS)的发展,也催生了地理计算的研究。1996 年,在英国利兹大学召开了第一届地理计算(GeoComputation )大会,“地理计算”作为新词第一次出现。大会将“地理计算”解释为“利用计算机求解复杂空间问题的艺术与科学”(GeoComputation,1996)。
  广义地看,地理计算可以理解为计算机技术应用于地理问题求解的统称。狭义地看,地理计算可以理解为GIS 的延伸,包括建模、分析和计算体系在内的方法和技术。高性能地理计算则是应用现代高性能计算技术实现对大规模复杂地理问题高效求解的过程,包括计算机环境下地理信息的高效管理、处理与分析等。在时空大数据背景下,高性能地理计算成为快速挖掘数据价值、提供高效地理信息服务的重要途径。
  1.1.1 地理计算
  国际地理计算大会认为地理计算代表了计算机科学、地理学、地球信息学、数学和统计学的聚合和趋同,是一门交叉科学。20 世纪末以来,许多国际著名学者相继在地理计算领域展开研究,并给出了不同的定义。例如,Rees 等(1998)指出地理计算是“ the process of applying computing technology to geographical problems (应用计算技术求解地理问题的过程)”;Couclelis(1998)将地理计算定义为“ the eclectic application of computational methods and techniques to portray spatial properties,to explain geographical phenomena,and to solve geographical problems (计算方法和技术的折中应用,以描述空间属性、解释地理现象与解决地理问题)”;Gahegan(1999)认为地理计算的目的是“ to enrich geography with a toolbox of methods to model and analyze a range of highly complex,often non-deterministic problems(用一套方法工具集来丰富地理学,从而可以对一系列复杂度高的、常常是不确定性的问题进行建模和分析)”;Openshaw 等(2000)则强调地理计算为“ can be regarded,therefore,as the application of a computational science paradigm to study a wide range of problems in geographical and earth systems(the‘geo’)contexts (可以被视为一种计算科学范式的应用,用于研究地理和地球系统中的各种问题)”。因此,有的学者也将地理计算定义为计算科学在地理学或地学环境中的应用。其中,geo 意指做什么,computation 意指怎么做(李霖等,2008)。如果说传统的GIS 强调数据管理、基础算子、制图可视化等,那么地理计算强调在地理问题求解、建模与分析中怎么用计算技术。地理或环境数据、现代计算模型与方法、高性能计算硬件被认为是地理计算的三个重要组成部分(Openshaw,1998)(图1-1-1)。
  图1-1-1 地理计算的组成
  当代学者梳理了科学研究方法的变革历史,提出科学研究的四类范式,依次为实验科学、理论科学、计算科学、数据科学(Hey et al.,2011)。人类早期的科学研究,以记录与描述自然现象为主要特征,归为实验科学;后来科学家们开始建立模型,通过演算进行归纳总结,建立定律方程等对现象进行解释,如牛顿三大定律、麦克斯韦方程等,这些科学研究活动归为理论科学;理论科学的快速发展对实验设计和理论验证提出了越来越高的要求,科学家们开始用计算机对科学实验和复杂现象进行模拟仿真,计算在很多场合取代实验,成为验证理论假设的有效方法,这类科学研究被归为第三范式——计算科学;随着大数据时代的到来,在科学研究中,计算机不再局限于模拟仿真,还开始通过对大量的数据进行计算,分析得到未知的理论,这类研究被称为数据科学。计算科学通常在因果关系探究的基础上先做理论假设,再通过计算验证,而数据科学基于更全面的大数据,通过相关性分析,获得更科学的预测,同时反哺因果解读。无论计算科学还是数据科学,两者都对计算机技术提出了要求,包括数据的高效管理与计算等。
  计算科学是20 世纪末发展起来的交叉学科,成为解决许多科学问题的有效方法,也同时推动了地理计算的形成与发展。从计算科学角度看,地理计算是基于科学计算方法、计算机技术与工具的地理学应用研究,实现地理学问题在计算机上的建模、分析、统计等功能。科学计算是利用计算机模拟、预测和发现客观世界运动规律和演化特性的全过程(朱少平,2009),其通常包括建立数学模型、建立求解的计算方法和计算机实现三个阶段。地理计算针对的是地理世界时空变化规律和演化过程,需要数学建模、计算方法、并行算法、程序研制和高性能计算机等方面有机结合。
  传统的地理计算常常被定义为计算科学在地理中的应用,数据科学的发展为地理计算带来了新的视角。地理计算本身考虑的是计算机技术在地理问题中的应用,可以兼具计算科学与数据科学的特点。从数据科学的角度看,大数据分析方法、计算基础设施、存储管理方法等发生了根本性变化,包括从理论建模走向统计与机器学习,从集中式计算走向分布式计算与云计算,从传统关系型数据库走向分布式文件系统与非关系/分布式数据库。地理计算的方法、技术、工具等有望在数据科学的背景下进一步提升优化。
  1.1.2 高性能计算
  在处理各种计算问题时人们经常会遇到一些限制:一是由于需要进行大量的运算,一台普通的计算机无法在合理的时间内完成工作;二是由于需要处理的数据量过大而可用的资源有限,计算任务根本无法被执行。高性能计算(high-performance computing,HPC)就是在这种背景下诞生的,它强调使用多个处理器或计算机集群,包括专门或高端的高性能硬件,或是按一定方法将多个单元的计算能力进行整合,通过并行算法与软件实现等,实现单台计算机无法达到的运算速度,从而有效地克服这些限制。
  高性能计算是计算机科学(computer science )的一个分支,它通过聚集起来的计算能力提供比一般的桌面计算机或工作站更高的运算效率和性能,从而满足大规模科学、工程或商业问题的求解需求,如研究和制造超级计算机(supercomputer)、大型科学计算并行软件等。图1-1-2 是全球超级计算机排行榜TOP500 节选,每半年更新一次排名,我国研制的神威太湖之光、天河二号都曾位居前列。高性能计算的出现使科学家和工程师们能够解决复杂的计算密集型或数据密集型问题,因此,高性能计算直接服务于计算科学,被认为是继理论科学和实验科学之后科学研究的第三大支柱(迟学斌和赵毅,2007)。近年来,随着计算机技术的进步和飞速发展,高性能计算已成为一种涵盖并行处理、数据存储、输入输出、数据通信和系统扩展等多方面的综合性技术。
  图1-1-2 全球超级计算机排行榜TOP500 节选(TOP500,2020)
  当前高性能计算在实现技术上呈现出多元化的特点,不仅仅局限于超级计算机,普通的个人计算机(personal computer,PC)集群也可以实现大规模计算,一些主流的并行化实现技术包括面向线程并行的开放式多处理(open multi-processing,OpenMP)、面向进程
  并行的消息传递接口(message passing interface,MPI)、面向混合并行的OpenMP 与MPI 集成架构(Hager et al.,2010);利用图形处理器(graphic processing units,GPU)来提高通用计算性能的通用图形处理器(general purpose GPU,GPGPU )技术,如NVIDIA 公司推出的计算统一设备架构(compute unified device architecture,CUDA)(Lee et al.,2009);面向大规模集群的云计算(Yue et al.,2013;Vaquero et al.,2009)等。例如,Google 提出的MapReduce 分布式计算模型适用于通用计算机集群,可进行大规模数据集的高效处理,已在大数据领域中得到广泛的应用(Dean et al.,2008)。
  地理学从高性能计算的发展中获益良多,主要有两个原因(Cheng et al.,2012):第一,地理学包括自然地理学和人文地理学,它们都包含了一系列复杂的过程和相互作用;第二,地理学在时间和空间维度上收集到的大量数据如今已经超过了传统计算技术的处理极限。
  高性能地理计算是地理计算的重要组成部分和发展方向,可以包括但不限于时空数据分布式存储管理、时空数据并行计算、时空数据快速制图与可视化、时空数据高性能分析与挖掘等。
  早在2000 年,Openshaw 就指出驱动地理计算向高性能地理计算发展的主要因素有:①高性能计算技术的发展驱动了采用新的计算范式来建模、分析和解决地理问题;②需要创造一些新的方法来处理和分析日益增长的信息,这些信息大部分都是与地理空间相关的;③出现了越来越多的人工智能工具和计算智能方法,它们都非常适用于地理学的各种领域,为旧问题提供了更好的解决方案,也创造了全新的发展前景,同时也需要高性能计算作为技术支撑。
  如今,得益于高性能计算在科学和研究中发展的总体趋势,对于许多地理学者来说,高性能计算比以往任何时候都容易理解和接触。许多常用的地理处理分析工具和软件中已经对高性能计算的技术和方法进行了集成,如矩阵乘法和求逆等关键数学运算的并行化实现,以及各种易用的并行计算框架的调用接口。
  同时,随着大数据时代的到来,地理信息系统管理和处理的数据已经从TB 级增加到PB (十亿兆)级乃至EB(万亿兆)级,时空大数据已经成为大数据的重要组成部分。其不但表现在数据规模比以往更大,而且在类型、采集速度、价值密度、准确性及变化性等方面特点突出,增加了地理空间数据管理与处理的复杂性,同时也意味着传统的数据管理系统和计算能力也难以满足这些需求(Yue et al.,2016)。在时空大数据的背景下,有必要采用数据科学和计算科学的思维,发展高性能地理计算来创造空间数据处理的新技术与新方法。
  1.1.3 GIS 与高性能计算
  随着智慧城市的建设和发展,反映自然和人类活动的数据大规模增长,传统GIS 已无法满足时空大数据存储、计算、分析等需求,时空大数据的价值无法得到充分利用(Guo et al.,2017;Yue et al.,2016;李德仁等,2016,2014;李坚等,2013)。时空大数据类型多种多样,数据量巨大,要求处理速度快,亟须新的处理模式将时空大数据转化为人们所需的信息和知识。因此,如何充分利用海量时空数据,成为GIS 领域的重要挑战。在计算机领域,高性能计算的进展有助于化解大数据应用的挑战,能够解决大数据应用过程中数据存储和处理计算的难题。因此,在地理信息技术领域,可引入计算机领域的前沿技术,发展高性能
展开
目录
目录
第1章 绪论 1
1.1 地理计算与高性能计算概述 1
1.1.1 地理计算 1
1.1.2 高性能计算 3
1.1.3 GIS 与高性能计算 4
1.2 高性能地理计算概述 6
1.2.1 时空大数据分布式存储管理 8
1.2.2 时空大数据并行计算与流计算 10
1.2.3 时空大数据GIS 12
第2章 并行计算基础 14
2.1 概述 14
2.1.1 并行计算概念 14
2.1.2 计算机性能与发展 15
2.1.3 并行机分类 17
2.2 并行算法设计 21
2.2.1 并行分解方法 21
2.2.2 并行算法设计挑战 24
2.2.3 并行算法设计过程 24
2.3 并行算法性能评估 26
2.3.1 加速比与并行效率 27
2.3.2 可扩展性 27
2.3.3 加速比定律 28
第3章 并行编程基础 31
3.1 OpenMP 并行编程 31
3.1.1 进程与线程 31
3.1.2 OpenMP 指令 33
3.1.3 库函数与环境变量 40
3.1.4 OpenMP 环境运行 43
3.1.5 OpenMP 坡度计算 46
3.2 MPI 并行编程 57
3.2.1 MPI 概述 57
3.2.2 MPI 基础函数 58
3.2.3 MPI 通信 59
3.2.4 MPI 数据类型 63
3.2.5 MPI 环境运行与坡度计算 64
3.3 MapReduce 并行编程 72
3.3.1 MapReduce 计算模式 72
3.3.2 Hadoop 分布式系统 75
3.3.3 Spark 计算引擎 78
3.3.4 Spark 环境运行 80
3.4 GPU 并行编程 84
3.4.1 概述 84
3.4.2 CUDA 编程 85
3.4.3 CUDA 常用函数 88
3.4.4 CUDA 环境运行 89
第4章 并行地理计算 96
4.1 地理算法并行设计挑战 96
4.1.1 并行策略 96
4.1.2 负载均衡 100
4.1.3 数据I/O 104
4.1.4 通信 104
4.2 地理算法并行化 108
4.2.1 数据并行地理算法 108
4.2.2 任务并行地理算法 117
第5章 地理计算强度 124
5.1 概述 124
5.1.1 地理计算特征表达 125
5.1.2 计算强度评估 127
5.1.3 地理空间域分解 129
5.2 AI 地理计算强度预测 131
5.2.1 案例介绍 132
5.2.2 计算强度评估模型 135
5.2.3 地理空间域分解 137
5.2.4 实验结果分析 139
第6章 高性能空间数据存储 155
6.1 关系数据库与NoSQL 155
6.2 NoSQL 数据库 158
6.2.1 MongoDB 158
6.2.2 HBase 167
6.2.3 Redis 171
6.3 阵列数据库 177
6.3.1 概述 177
6.3.2 Rasdaman 179
6.3.3 SciDB 182
6.3.4 评测分析 187
6.4 时空数据立方 189
6.4.1 概述 189
6.4.2 时空立方体概念 191
6.4.3 GeoCube 设计与实现 195
第7章 地理云计算 206
7.1 概述 206
7.1.1 云计算简介 206
7.1.2 云平台介绍 208
7.1.3 边缘计算 214
7.2 地理云计算简介及地理信息处理云服务 215
7.2.1 地理云计算简介 215
7.2.2 地理信息处理云服务 216
第8章 云GIS 226
8.1 概述 226
8.2 云GIS 设计与实现 227
8.2.1 系统架构 227
8.2.2 分布式空间数据存储 228
8.2.3 分布式GIS 内核 231
8.2.4 结果分析 234
第9章 地理流计算 237
9.1 概述 237
9.1.1 技术背景 237
9.1.2 案例介绍 241
9.2 地理观测流 242
9.2.1 信息模型 242
9.2.2 计算模型 244
9.2.3 性能分析模型 245
9.2.4 系统架构 247
9.3 实时地理信息流处理 248
9.3.1 案例计算 248
9.3.2 结果分析 250
第10章 时空大数据平台 255
10.1 概述 255
10.2 时空大数据平台功能 256
10.2.1 平台概况 257
10.2.2 数据中心 257
10.2.3 计算中心 259
10.2.4 服务中心 260
10.2.5 管理中心 260
10.3 时空大数据平台应用 261
参考文献 274
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证