第1章 概述
随着第三次工业革命的兴起,特别是电子计算机技术的飞速发展,人们开始将地理信息与计算机相结合,形成地理信息系统(GIS),用以获取、处理、存储、管理、分析地理信息。互联网为GIS提供了一个信息交融、开放共享的平台环境,推动地理信息、地理知识及其需求急速发展。以互联网为媒介、以服务资源为载体的地理信息服务逐渐兴起,快速普及,成为使用地理信息的主流方式。
1.1 研究背景
大数据时代逐步发展出第四科学范式,即数据密集型科学,以计算机模拟计算为主的研究方式逐渐向基于数据驱动的研究方式转变。相关行业人员发布了大量的地理信息服务资源,这些服务资源主要通过空间数据基础设施(spatial data infrastructure,SDI)或其他设备对外界提供标准化的服务,或以专业领域中公认的文件格式进行共享。在计算机集群、分布式、云计算等技术的支持下,算力得到了极大加强,研究人员面临的问题已经不再是缺少数据,而是如何组织、整合、处理、使用海量数据资源。
第四科学范式昀大的转变之一即强调相关关系的网络协作( Hey et al.,2009;姜明智等,2018),基于网络服务的分布式协同计算已经成为天文学、生物医学等学科必不可少的基础研究环境,在天文发现、基因测序等复杂问题分析中起着举足轻重的作用。然而,在地理信息领域,由于地理信息数据量大而复杂、表达语义多样、结构化和非结构化格式混合、统一标准的覆盖率低,地理信息领域还基本未形成基于网络服务的分布式协同环境,导致地理信息服务“资源海量,集成困难;方法众多,组合乏力”。以应急管理、环境污染等问题为例,虽有大量在线相关的地理数据和空间处理服务可用,但由于不同服务间缺乏有效的协作机制,很难实现服务的即时和按需组合,以便协同解决问题。
网络与服务技术带来信息和方法的巨大穿透力,使得地理数据、信息和知识能够低成本端对端地传递给用户( Gong and Wu,2012;龚健雅等, 2013)。为促进地理信息服务组合,需要有效的组织方式管理现有的地理信息服务。基于地理信息服务实体的表达,构建动态可变、语义关联的地理信息服务网络,是组织众多地理信息服务的可行方法。从网络中提取相应的服务以及服务关系,并整合服务相关的计算资源(服务器、云计算平台等)、人力资源(服务提供者、领域专家、服务使用者等)和其他资源,不同的服务和资源相互协作,昀终实现地理信息服务的协同,如图 1-1所示。然而,受限于地理信息服务表达语义多样、结构化和非结构化格式混合、统一标准的覆盖率低等问题,迄今为止,地理信息服务网络仍难以形成(Jin et al.,2022)。
图1-1 地理信息服务、地理信息服务网络与服务协同的相互关系
近年来,面向互联网的服务架构(王艳东等,2011)、服务计算(吴吉义等,2015)和服务协同(张建博等,2012;杨2017)等技术日渐成熟。强调相关关系的网络协作(张静乐,2011)已在天文发现、基因测序等复杂问题分析中发挥作用。另外,服务实体表达能力大幅度增强,基于语义的服务表达已商业化应用,这些成果为地理信息服务协同的研究带来了新的机遇。
因此,本书将讨论近年来地理信息服务、地理信息服务网络、地理信息服务协同三个方面的相关成果,构成地理信息服务网络与协同的基础理论与技术方案,以探索实现地理信息服务网络与协同的方法。
1.2 地理信息服务
地理信息服务(geographic information service,GIService)是“地理信息”和“服务”的组合体。信息是对客观存在的反映,以数字、文字、符号、图形、图像、语言等介质作为载体,为对象、事件、事务等提供定性或定量的描述。地理信息(geographic information)则描述地理所蕴含和表达的地理含义,以及与地球表面空间位置直接或间接相关的事务或现象的信息,表示地表物体及环境所固有的数量、质量、环境、分布特征、联系和变化规律等特征。地理信息来源于地理数据( geographic data),地理数据是地理信息的载体,地理信息处理的实质就是对地理数据进行处理,从而获取有用的地理信息。类似的概念还包括空间信息(spatial information)、地理空间信息(geospatial information)等,这些概念与地理信息大致相同,主要是细节描述上略有偏差。例如,在空间信息的概念中,地理信息具有显著的空间分布性、多维性、时序性以及数据量大的特性,是空间信息的组成部分之一。本书主要使用地理信息这一定义,实际研究、文献资料中,亦使用空间信息或地理空间信息等概念。
从发展历程看,地理信息服务是地理信息系统(GIS)的延伸和必然趋势。*先,对地理信息的采集、存储、管理、分析和表现的需求促使GIS的诞生,且其随着计算机、图形操作系统等技术的发展而更新迭代。从早期的以系统为中心,单机、单用户模式的,仅支持地图的手扶跟踪数字化以及地图数据的拓扑编辑、分幅数据拼接等功能的**代GIS,发展为面向多机、多用户,支持二次开发的第二代GIS。“信息高速公路”“国家空间数据基础设施”“数字地球”等计划的实施,使GIS技术的发展和利用被国家层面所重视,GIS技术逐渐成为一种全球、国家、地区和区域信息化及数字化的核心技术之一。在此基础上,通过在GIS中引入Internet技术、分布式技术,能极大地增强地理信息数据和服务的共享。此外,组件化技术逐渐改造完成,大量开源GIS开发工具使原本限于桌面端的GIS功能能够迁移到网络环境中对外提供相应功能。借助互联网的开放性和共享性,分布在互联网中的地理信息以服务的方式不断传播、复用,驱使GIS由专业应用系统蜕变为社会化、面向大众的地理信息服务,普及到大众的日常生活中。例如,Google公司的 Google Map和 Google Earth,我国的天地图系统、百度地图、高德地图等服务与卫星遥感、移动通信等相结合,成为大众认识世界、获取地理信息、出行导航的窗口。服务化的思想深入人心,实现了第二代GIS向以网络服务为核心的第三代GIS的转变。当前,地理信息服务数量和种类的不断增多,为新一代的GIS——第四代GIS的建设提出了新要求,强调从信息向知识的转变,要求不仅能够在网上提供共享的地理信息服务,而且能够挖掘服务与服务之间的关系,探索多源异构的服务高效集成的方式,实现地理信息服务协同使用。综上所述,地理信息服务的发展历程如图 1-2所示。
图1-2 地理信息服务的发展历程
地理信息服务有狭义和广义之分。狭义的地理信息服务从网络技术的角度进行描述,即地理信息服务是一类基于Web服务体系架构和标准,采用相关互联网技术,在网络环境下提供GIS数据、分析、可视化等功能的服务和应用,可实现网络间不同机器(不同平台)的互操作。在不同的应用场景和研究领域中,也有地理信息网络服务、地理空间信息服务等相关说法,这些概念表示的含义是基本相近的。广义的地理信息服务是一种应用范式,可描绘与地理空间信息活动相关的所有资源,倡导“一切皆服务”,即地理信息服务的数据和服务功能,面向用户需求的不同层面的资源,包括知识、算力、人力资源等,都是共享服务的一部分。本书使用“地理信息服务资源”一词,来同时描绘狭义和广义的地理信息服务。
当前,地理信息服务的特点是:资源众多、分布广泛。可以将其大致归纳为三种服务资源类型——数据服务、处理服务,以及其他资源,如图1-3所示。地理信息数据服务成果众多,大多集中在信息门户中。例如,全球地质一体化服务门户 OneGeology
(Jackson,2007),美国政府的地理一站式网络门户 Geospatial One Stop(Goodchild et al., 2008),我国的国家地理信息公共服务平台天地图(蒋捷等,2017)等。地理信息处理服务则逐步发展了许多支持标准接口来发布处理功能的软件或在线服务,包括 52 North(Evangelidis et al.,2014)、GEOSS Clearinghouse(Liu et al.,2011)、ArcGIS的处理服务工具( Foerster and Stoter,2006)、GeoSquare(Wu et al.,2015)等;还有一些标准化的软件接口、功能组件或模型资源也提供了地理信息处理服务功能,如基于 Google Cloud的卫星影像数据可视化计算和分析处理平台 Google Earth Engine(Gorelick et al.,2017),以及一些由不同领域机构或专业组织发布的地学应用模型( Gan et al.,2020;Gichamo et al.,2020;Magno et al.,2018)。此外,自发地理信息(volunteered geographic information,VGI)倡导收集由大众通过移动互联设备自发地贡献的地理空间信息,这些结构化或非结构化的资源成为地理信息服务的一大补充( Sui et al.,2012),包括OpenStreetMap(OSM)、Wikimapia,以及包含地理信息标注(如时间、坐标、场景)的短视频、新闻报道、社交媒体(微博、推特)信息等。
图1-3 当前地理信息服务主要类型——数据服务、处理服务、其他资源
在地理大数据的影响下,地理信息服务呈现出智能化、大众化、一体化的现状和发展趋势。智能化表明,地理信息服务需要满足更高层次的需求,结合其他信息科学技术(如语义挖掘、机器学习、深度学习)一体化的发展趋势。例如,在海量的、多源异构的数据服务中准确获取、实时分析挖掘,提炼出有用的信息和知识,昀大地发挥服务价值。大众化指地理信息服务从行业应用领域进入公共大众生活的过程。如前文提到的,一方面,地图服务、位置服务、导航服务等使地理信息服务成为大众日常生活的一部分;另一方面,社会大众也成为地理信息服务的提供者,产生的众源地理数据 [社交媒体数据、路网轨迹数据,以及兴趣点( point of interest,POI)等]作为地理信息服务的一部分,在轨迹挖掘、地物识别等领域发挥了重要的作用( Akhmad Nuzir and Julien Dewancker,2017;Johnson and Iizuka,2016;Levin et al.,2017;单杰等,2014)。一体化则是从集成的角度思考如何整合地理信息服务。尽管大多数地理信息服务能够在互联网进行共享,但受限于服务来源、服务发现能力、服务使用方式等限制因素,难以形成“合力”,这无疑严重制约地理信息服务价值的全面发挥。因此,地理信息服务需要实现一体化的需求,这并非简单地将服务集中到一个平台上,而是研究如何把多源异构的地理信息服务高度逻辑化、语义化、智能化进行关联,促进行业间的服务协同,减少重复建设工作,达到资源利用的昀大化。
如何整合多源异构的地理信息服务资源,全方位满足地理信息服务智能化、大众化、一体化的需求,尚未形成权威性、指导性、标准化的成果,仍有较大的研究潜力。基于地理信息服务,构建地理信息服务网络,实现服务网络下的服务协同是本书提出的解决方案。
1.3 地理信息服务网络
网络(network)由节点和连线组成,描述了对象与对象之间的关联关系。在数学领域,网络被视为一种图(graph)结构。因此,服务网络是由服务为对象组成的图结构。
在地理信息领域,龚健雅、吴华意等率先提出了地理空间服务网络(geospatial service web,GSW)的概念(Gong et al.,2012;龚健雅等,2013)。多源异构、分布广泛的地理信息服务资源可以通过统一的架构来描述彼此之间的关联关系,将所有与服务有关的资源要素、规范、安全标准、服务组成等整理起来,如图1-4所示。GSW描绘了地理信息服务网络的基本框架,并解释了构建地理信息
展开