第1章绪论
近年来,随着互联网技术、对地观测技术、传感器技术和移动计算技术的快速发展,人类积累了海量多样、多源、多尺度、多模态、多维度地理空间数据,形成对地更全面的观测与认知。这些地理空间数据经过理解、分析、加工,可被应用到资源管理、环境治理、灾害预防、区域规划、城市管理、科学研究、教育和国防等多个重要领域中。如遥感影像具有时效性强、覆盖范围广泛等优点,通过遥感影像可观测、评估滑坡灾害,并对其发展趋势做出及时预测,对制定滑坡灾害调度方案、保障人民群众生命财产安全具有重要意义[图1.1(a)];再如通过出租车轨迹点数据推断停靠点的语义信息,从而挖掘居民活动规律和行为模式,为城市规划决策提供参考依据等[图1.1(b)]。这些对地理空间数据的应用逐渐成为关系民生民计、影响人类发展的核心要素,同时可发现这些应用的实施都离不开对地理空间数据准确、高效的语义理解。所谓语义理解,其核心是对地理空间数据语义的分类,即通过自动学习、挖掘地理空间数据特征获取地表区域的重要属性信息与指标。为更好利用地理空间数据服务人类社会,地理空间数据的语义分类自然而然成为地理空间数据研究的重点和热点。
图1.1 地理空间数据应用示例
地理空间场景语义分类的主要目的是识别地理空间数据中不同区域数据呈现出的高层语义信息,也可视作是一类特殊的场景语义分类任务。语义本意指语言所蕴含的意义,在计算机科学领域,语义指数据对应的现实世界事物所代表的概念的含义。在视觉图像领域中,语义进一步产生底层、中层、高层的层次化结构,依次对应图像处理层(低级视觉特征)、图像分析层(中间语义特征)和图像认知层(高级抽样语义)。高层语义包含场景语义、行为语义和情感语义等,其中场景语义理解不仅可以获取图像的整体信息,还可以感知到目标出现的上下场景信息,因此成为图像语义分类中的关键课题。通常情况下所说的场景语义分类指对自然图像场景语义的分类,这类图像场景内容可包罗万象,而地理空间场景与之非常不同。一般而言,地理空间场景指由一定地表区域内的一组地物对象组成的集合,根据地理空间数据类型的不同,地理空间场景呈现的方式也有一定差异。
栅格类型的地理空间数据,如遥感影像,可通过规则切割产生描绘局部区域的遥感影像场景,其与图像场景的内容表达方式相同,通过不同的颜色、纹理、结构传递不同的语义信息,对这一类地理空间场景的语义表达一般可借鉴图像视觉方法进行。但遥感影像与自然图像相比存在特殊性(如成像角度、目标类型等),因此对其语义特征的抽象还存在优化空间。此外,对于高光谱影像,其与普通三原色(RGB)图像波段数目存在着差异,多波段带来的信息量也需要额外处理。相比之下,另一类地理空间数据——矢量空间数据的视觉特征传递的信息十分有限(图1.2)。由于矢量类型地理空间场景是由一组地理对象及其空间关系——拓扑、距离和方向关系组成的集合,对这一类型的地理空间场景语义的表达则需要通过对象的几何特征与对象间的空间关系特征进行描述,与栅格类型地理空间场景的语义表达方式有较大差异。矢量数据和栅格数据是目前应用*广泛的两类地理空间数据类型,因此为实现对地理空间场景的语义理解,须厘清地理空间数据的特点,根据不同应用需求建立相应的地理空间场景语义分类模型,提供更高效的语义分类结果。
图1.2 武汉地区遥感影像数据与矢量空间数据对比
总体而言,本书将围绕地理空间场景语义分类理论、方法与应用,系统论述地理空间场景的概念与特点,以及地理空间场景语义分类发展与应用,并重点展开对地理空间场景语义分类理论与关键技术的介绍,包括矢量空间场景的空间相似理论与分类方法、栅格影像场景的语义特征表达与相似度计算、融合多源地理空间数据的聚类方法及基于深度学习地理空间场景分类方法等。
1.1 地理空间数据基本概念
地理空间数据是以点、线、面等方式采用编码技术对地理空间实体进行特征描述及在实体间建立相互联系的数据集。对地理空间实体进行描述的方法有两种,分别是基于对象的描述和基于场的描述。基于对象的模型在计算机中常用矢量数据结构来表示,矢量数据结构用空间离散点坐标来描述地理空间实体。基于场的模型在计算机中常用栅格数据结构表示,栅格数据结构把地理空间划分为均匀的网格,以此来描述地理空间实体。
1.1.1 矢量数据
所谓矢量,就是有一定大小和方向的量,在数学和物理中也称其为向量。纸面上用笔绘制的一条线段、绘图机在纸面上绘制的一条线段、计算机图形中的一条有向线段等,这些都是直观的矢量。线段长度代表大小,线段端点排列顺序代表方向。有向线段是由一系列有序的特征点来表示的,有向线段的集合便形成图形。矢量数据是表示地图图形中各个离散点(x, y)平面坐标的有序集合,它主要用来表示地图图形元素中几何数据间及它们和属性数据间的对应关系,以记录坐标的方式尽可能准确无误地显示出点、线、面等地理实体,它的坐标空间被假定为连续空间而不需要像栅格数据结构一样被量化,因此矢量数据可以更准确地定位实体在空间中的位置。
1. 矢量数据结构编码的基本内容
1)点实体
点实体是指所有被*立的一对(x, y)坐标所定位的地理或者制图实体。矢量数据结构中除点实体(x, y)坐标之外,还要存储其他一些描述点实体类型、制图符号及显示要求的相关数据。点作为空间不可再分割的地理实体既可具体又可抽象,例如地物点、文本位置点或者线段网络中的节点,若该点为不涉及其他信息的标志,那么记录时就应该包含标志类型、大小、方向及其他相关信息;若该点为文本实体时,所记录数据应该包含字符大小、字体、排列方式、比例、方向及与其他非图形属性的联系方式等信息。对其他类型的点实体也应做相应的处理。图1.3 是点实体矢量数据结构的一种组织方式。
图1.3 点实体的矢量数据结构
2)线实体
线实体可以定义为直线元素组成的各种线性要素,直线元素由两对(x, y)坐标定义。*简单的线实体仅储存其起止点坐标、属性、显示符和其他相关数据。比如线实体在输出过程中可使用实线或者虚线来刻画,这些信息都属于符号信息的范畴,表明了线实体是如何被输出的。尽管线实体没有用虚线来储存,但是仍然可以用虚线来输出。
弧和链由n组坐标对组成,它们可以描述任意连续且复杂的*线。构成*线的线元素越短,(x, y)坐标个数越多,则越接近一条复杂*线。为了节约存储空间和更准确地画出*线,唯一的方法就是加大数据处理工作量,即在线实体的记录上加一个指示字,开始显示程序后,该指示字通知程序要求数学内插功能(如样条功能)对数据点进行加密处理,并使之与原点相匹配,从而可以在输出设备上求出更准确的*线,显然数据内插使工作量增大。弧和链存储记录还需添加符号类型和其他信息。
单纯的线条或链条并不承载着相互联系的空间信息,而这些联系信息是进行排水网与道路网分析时不可或缺的。因此,应在数据结构上设置指针系统,使计算机能够在错综复杂的线网结构上逐线跟踪各条线路。指针的设置应基于节点,例如在水网各支流间建立联系关系,就必须采用该指针系统。指针系统由一个节点指向一条直线的指针、每一条由该节点开始的直线汇到该节点上的角等组成,这样就完全定义了该直线网络中的拓扑关系。
正如上所述,线实体多用于表达线状地物(公路、水系、山脊线),符号线及多边形的边界,有时也称“弧”“链”“串”,它们的矢量编码结构如图1.4 所示。在这些矢量编码中,唯一的标识码为系统排列序号,线标识码能识别线条的种类,起始点和终止点能以点号或坐标来表达,展示信息为展示时的文字或者符号等,与线条相关联的非几何属性能直接保存在线条文件里,或者通过标识码连接查找。
3)面实体
多边形(也称区域)数据,是刻画地理空间信息的主要类型。就区域实体而言,既有名称属性又有分类属性,多采用多边形来表达,例如行政区、土地类型、植被分布等;而标量属性有时则采用等值线(例如地形、降雨量等值线)来描述。
多边形矢量编码,不但要表示位置和属性,更重要的是要能表达区域的拓扑特征,如形状、邻域和层次结构等,以便恢复这些基本的空间单元作为专题图的资料进行显示和操作。因为需要表达的信息非常丰富,同时多边形操作繁多且复杂,所以对多边形进行矢量编码远比对点实体和线实体进行矢量编码更复杂、更重要。
在探讨多边形数据结构编码时,对多边形网有以下要求:①构成地图的每一个多边形都应具有唯一的形状、周长、面积等特征,尽管它们不像栅格结构那样基本单元简单规范,对土壤或者地质图中的多边形而言,更无法具有同样形状与尺寸。②地理分析所需的数据结构应能将各多边形之间的邻域关系记录下来,方法和水系网所记录的连接关系相同。③在专题地图中,上层多边形不全是同一级多边形,而是多边形内部嵌套较少(次一级)。例如一个湖的水域线可以看作土地利用图中一个岛状多边形,这个湖的岛则
是“岛中之岛”,这种被称为“岛”或者“洞”的结构,在多边形关系中难以处理。
2. 点、线、面实体坐标编码
任意一点、一条线和一个面的实体均可用一个直角坐标点(x, y)表示。此处,(x, y)既可与地面坐标的经度、纬度相对应,又可与数字化时建立起来的平面坐标系中的x、y相对应。对点而言,以一对(x, y)为单位;对线而言,以一组(x, y)有序坐标对为单位;对多边形而言,由一组有序但*尾相连且坐标一致、通过平滑的*线间隔抽样得到。在*线长度相同的情况下,取的点越多,后期复原时与原*线越靠近,相反取的点太少,复原后变成一条折线。图1.5 是点、线、面实体的坐标表示及坐标编码文件。
图1.5 点、线、面实体的坐标表示及坐标编码文件
1.1.2 栅格数据
1. 栅格数据的基本概念
在工作区域平面表象上,按照某种分解力有规律地分割行、列,形成很多格网,每一个网格单元称作像素(也称像元)。栅格数据结构其实就是像元阵列,即像元以矩阵形式聚集在一起,栅格内每一个像元都是栅格数据信息存储的基本单位,它们的坐标位置可由行、列号来决定。栅格数据按照一定的规则进行排列,因此所代表实体的位置关系隐含于行和列中。网格上每一个要素的编码都表示一个实体的性质或者是对该性质的编码方式,基于被表示的实体表象信息的不同,每一个像元都可以用不同的“灰度值”表示出来。如果每一个像元指定n位(bit),那么它的灰度值区间可以是0~2n ~1;将白、灰、黑三种颜色的不断变化定量为8 位,灰度值区间为0~255 ,总共256 个等级;如果每一个像元指定1 位,那么灰度值只有0~1 个等级,这种图像称为二值图像,0 表示背景,1 表示前景。实体可以分为点实体、线实体和面实体三类。点实体代表栅格数据的像元,线实体代表沿某一方向相连成一串的相邻像元集合,面实体代表集聚成的相邻像元。该数据结构方便计算机处理面状要素。
2. 栅格数据的图形表示
栅格结构就是用规则像元阵列表达空间地物或者现象分布情况的一种数据结构,它所展示的每一个数据都代表了地物或者现象属性特征。也就是说栅格数据结构是一个像元阵列,它以各像元行列号来定位,以各像元数值来代表实体类型、级别等属性,如图1.6 所示。
图1.6 栅格数据的图形表示
(1)点实体,表示为一个像元。
(2)线实体,表示为在一定方向上连接成串的相邻像元的集合。
(3)面实体,表示为聚集在一起的相邻像元的集合。
栅格数据表示的是地理数据在二维表面的离散化值。栅格数据中将地表划分成彼此相邻且规则排布的地块,每一地块对应一个像元。因此栅格数据比例尺是指栅格(像元)尺寸和地表对应单元尺寸的比值,像元代表的区域越大,对长度、区域等量测的影响越大。每一个像元的性质都是地表对应地块地理数据的近似,在性质上存在偏差。
3. 栅格数据层的概念
地理信息系统(geographic
目录
第1章绪论 1
1.1 地理空间数据基本概念 2
1.1.1 矢量数据 3
1.1.2 栅格数据 5
1.1.3 矢量数据与栅格数据的比较 7
1.2 地理空间场景语义分类 8
1.2.1 地理空间场景定义与语义形成 9
1.2.2 地理空间场景语义分类方法 10
1.2.3 地理空间场景分类技术发展 11
1.2.4 地理空间场景分类应用 13
第2章相似性理论与分类方法 16
2.1 相似性理论及度量 16
2.1.1 相似的定义与性质 16
2.1.2 相似度的计算方法 20
2.2 矢量空间场景相似性理论与特征表达 26
2.2.1 空间场景相似性理论 26
2.2.2 空间场景特征表达 26
2.3 遥感影像场景特征提取与表达 29
2.3.1 遥感影像场景特征提取 29
2.3.2 遥感影像场景特征表达 32
第3章矢量空间场景特征表达与相似度计算 34
3.1 几何形状表达与相似度计算 34
3.1.1 几何形状相似性度量 34
3.1.2 基于傅里叶变换的面实体几何相似性度量 36
3.1.3 基于多级弦长弯*度复函数的面实体综合形状相似性度量 42
3.2 拓扑关系表达与相似度计算 47
3.2.1 拓扑关系模型 47
3.2.2 基于九交模型的复合对象拓扑关系表达模型 50
3.2.3 复杂面实体的拓扑关系精细化表达 56
3.2.4 拓扑关系相似度计算 65
3.3 方向关系表达与相似度计算 70
3.3.1 方向关系模型 70
3.3.2 基于格网方向关系矩阵的方向关系相似度计算 71
3.3.3 顾及尺度差异复合空间对象的方向关系相似度计算 78
3.3.4 空间方向相似性二元组模型度量方法 82
3.4 距离关系表达与度量 93
3.4.1 距离空间 93
3.4.2 距离量算 95
3.5 矢量空间场景相似性度量 99
3.5.1 基于特征矩阵和关联图的空间场景相似性度量 99
3.5.2 基于多等级相关性反馈的空间场景匹配 106
3.5.3 顾及上下文特征的点模式相似度计算 111
第4章矢量空间场景语义分类与应用 116
4.1 矢量空间场景划分 116
4.1.1 TAZ 划分 116
4.1.2 多级图聚类划分 118
4.1.3 直觉模糊集多边形聚类划分 121
4.2 空间场景功能区挖掘 125
4.2.1 顾及兴趣点潜在上下文关系的城市功能区识别 126
4.2.2 基于出租车轨迹数据的地域间移动模式 135
4.2.3 基于轨迹数据挖掘的居民行为交互模式 143
4.3 地理空间场景功能识别 151
4.3.1 图卷积神经网络 151
4.3.2 基于图卷积神经网络和空间上下文的城市土地利用类型识别 155
4.3.3 实验设计与结果分析 159
第5章遥感影像场景语义分类与应用 163
5.1 传统遥感影像场景分类 163
5.1.1 底层特征描述子 163
5.1.2 中层特征描述方法 164
5.2 深度学习遥感影像场景分类 169
5.2.1 深度学习图像分类 169
5.2.2 基于自动编码器的遥感影像场景分类 171
5.2.3 基于卷积神经网络的遥感影像场景分类 172
5.2.4 基于生成对抗网络的遥感影像场景分类 174
5.3 迁移学习遥感影像场景分类 175
5.3.1 实验数据集 175
5.3.2 基于单层迁移特征的分类方法 177
5.3.3 基于多层迁移特征的特征融合分类方法 186
5.3.4 基于多层迁移特征的决策融合分类方法 195
第6章多模态地理空间场景语义分类与应用 204
6.1 多模态空间场景数据统一 204
6.1.1 多模态空间数据的数学基准框架统一 204
6.1.2 多模态空间数据的格式集成转换 210
6.1.3 地理空间场景多模态数据冲突检测 213
6.2 空间场景数据语义特征融合 215
6.2.1 多模态数据特征融合方法基础 215
6.2.2 空间数据跨模态相似性匹配 218
6.2.3 多模态空间数据语义融合方法 233
6.3 融合多模态数据的场景分类 247
6.3.1 顾及空间邻域关系的城市空间场景功能分类识别 247
6.3.2 顾及空间交互关系的城市空间场景功能分类识别 255
第7章地理空间场景语义分类展望 265
7.1 地理空间场景语义分类的发展趋势 265
7.2 地理空间场景语义分类的应用前景 266
参考文献 268