第1章绪论
视频监控系统是目前我国公共安全事件监测和应急管理的主要技术手段(高勇,2010)。作为面向城市公共安全综合管理的物联网应用中智慧安防和智慧交通的重要组成部分,以非结构化视频媒体数据为基础的安防监控信息已包含总量PB级甚至EB级的历史档案和实时接入的大规模密集型视频流(李清泉和李德仁,2014;李德仁等,2014a,2014b;Wang et al.,2012),它们构成国家公共安全和应急管理科技支撑体系的重要基础数据,标志着安防行业面临大数据时代跨越式发展的战略机遇与挑战(Manyika et al.,2011;牛文元和刘怡君,2012;Labrinidis and Jagadish,2012;曹建明,2013;Cukier and Mayer-Schoenberger,2013)。复杂地理社会环境下应急需求的实时性、综合性与知识性亟须新的监控视频处理模式支持数据的快速整合和知识的高效理解,从而真正发挥监控视频的大数据价值,提高视频监控系统在突发公共事件中智能化处理水平与实时决策能力(Jian et al.,2019;Wang et al.,2011;Kong and Liu,2011)。研究安防监控大数据深层次且高效的知识表达理论与数据组织策略,正是当下的重大基础理论与核心科学问题(Labrinidis a nd Jagadish,2012;Helbing,2013;Abbasi et al.,2016)。
面向上述科学问题,以下逐点介绍地理视频的概念及其数据组织研究背景,分析地理视频作为大数据的价值内涵及自适应组织研究策略的意义,总结相关核心问题在国内外的研究进展,并分析现有方法的适用性,*后提出地理视频大数据自适应关联组织研究的目标与意义,阐述关键内容与概念边界,介绍总体方案与主要技术思路。
1.1地理视频大数据组织方法科学研究的意义
1.1.1地理视频大数据组织研究的背景与需求
城市化进程的快速发展在聚集财富的同时也在聚集风险,城市公共安全由此成为决定国家安全形势的重要基石,并成为国家安防管理的重要命题(马凯,2009;李强,2010)。突发公共事件(Public Emergency)因其严重的社会危害性成为国内外公共安全保障领域的焦点(李强和顾朝林,2015)。日益严峻的社会安全形势迫切需要实现从传统事后处置向主动预防模式的根本转变(Kwan and Lee,2005)。我国为此在《国家中长期科学和技术发展规划纲要(2006—2020年)》中特别强调“加强对突发公共事件快速反应和应急处置的技术支持”。
视频监控(Video Supervisory)作为城市安防应急管理中*常用的技术手段,产生融合空间信息技术和计算机视觉技术的监控视频,形成一类包含地理时空信息的新型媒体数据,地理视频(Kim et al.,2003a)的概念由此被提出。作为感知环境动态变化的新型地理空间数据,地理视频不仅具有“侧面看世界”的能力,还具有对城市环境动态、实时和真实感表达的突出优势(刘学军等,2007;Lin et al.,2017),能提供可量测的实景影像(李德仁和胡庆武,2007;Nie et al.,2012),并能支持地理场景的增强现实(杜清运和刘涛,2007;宋宏权等,2012);相较于其他数字信号类型的监测数据,地理视频的数据内容更加符合人类分析、理解和决策的视觉感知认知特点,有助于人们直观透彻地感知城市自然环境与人文活动规律。基于视频监控系统的突发事件感知和应急响应,成为应对城市犯罪高发、警力资源不足、人力成本过高等警务犯罪防控中现实挑战的有力手段,对于提升重大突发事件应急综合信息服务能力、提升突发公共事件危机应对水平均具有重要意义。为此,国务院启动平安城市战略,投入3200亿元在660个城市的交通要道和公共场所安装总数超过2000万台的监控摄像机,初步建成全世界首*大规模的多级(街道、区、市、省、国家)视频监控网(高勇,2010;杨淑珍和赵源,2010),产生时空分辨率越来越高的TB级/天动态接入的实时视频流和总量PB级的视频档案。这些承载监控场景丰富信息价值的地理视频为公共安全和应急管理科技支撑体系提供了研究与应用的重要基础数据。
现有监控网获取的地理视频多以摄像机为数据采集基本单元,在接入并存储每个摄像机获取的地理视频数据的同时,基于摄像机时空参考信息,采取以行政区划为数据组织管理单元,并以交管、公安等职能部门为管理单位的分布式存档管理模式,以应对兼具数据密集与计算密集,并具有时效性的监控视频并行处理需求。典型的存档管理模式如图1-1所示,其中,数据中心作为元数据服务器,存储各子数据中心元信息;子数据中心在对其管理的几十至上千条监控线路进行区域划分的基础上,存储该区域内的所有视频数据;子数据中心的一个区域数据库存储该区域范围内所有监控线路获取的视频流信息;区域和子区域间通过摄像机时空元数据统一组织管理。因此,现有地理视频组织模式主要面向并适用于大数据流并行处理与持久存档管理。
然而,通过对涉案数据和案件信息进行快速整合和理解分析,可以发现,跨区域流动犯罪演变成为近20年犯罪的主要形式,流动犯罪已占各地犯罪总数70%~90%(李志俊,2006;张璇,2007);随着城市环境日趋复杂,公共安全事件逐步呈现出时间上多频次、空间上跨区域的多尺度流动性,以及多阶段演化、单体引发群体等多因素复杂性的新特征。这些特征一方面使涉案地理视频的时空范围从局部扩大到整体,迫使现有数据组织管理方式下的视频数据的处理范围和数据量急剧膨胀,大数据量和低价值密度的矛盾日益突出;另一方面还使涉案视频的内容特征从局部图像相似发展为全局内容相关,且相关性呈现地理空间局部稠密与全局稀疏特征(Heyer et al.,1999)。现有分散独立存档和局部解析分析的地理视频数据存档管理的组织模式,其由于缺乏“数据内容相关性”并存在“数据组织粒度的核心机制局限”,割裂了数据内容的整体性,制约了其知识的高效表达能力,从而导致现有组织策略与公共安全事件复杂性特征间的矛盾日益突出;特别是在涉案数据的检索中,基于现有组织条件的涉案数据检索,不仅存在急剧降低的涉案价值密度问题,还造成迅速扩大的虚警输出规模。由于缺乏信息的有机关联和检索的有效约束,监控视频检索局限于像素域中视觉特征的相似性分析,采取低维图像特征单模态独立匹配的主要方式进行;这种方式将产生低维图像与高维语义间的“语义鸿沟”(Semantic Gap)(Hauptmann et al.,2007;常军,2011),现有组织模式下的检索虚警输出难以避免(陆泉等,2014):以目标检测方法为例,固定单路监控视频平均虚警数为12%;然而,随着数据内容的多样性发展和数据规模的快速膨胀,搜索范围将急剧扩大,多路监控视频中目标检测的平均虚警输出率呈指数增长,从而需要大量的人工判读以获取真正有效的涉案信息。但考虑到人工判读时,人类视觉对两路及以上的视频图像进行连续观察将产生的错误与误差,如连续观察12min后平均错过45%的视频场景,甚至在连续观察22min后错过率将达到95%(视频浓缩)。因此,在现有数据规模的背景下,基于图像相似性检索策略的虚警输出信息量必将大大超出人工判读能力的极限(Zhong et al.,2014)。“查不准”的难题也直接导致当前监控视频信息量不断累积,难以有效应对新兴犯罪模式,极大地限制了全网监控视频的综合利用。
综上分析,面对现有分布式存储管理,且数据规模和复杂性急剧增长的全网地理视频数据集,如何在现有公共安全事件复杂演化新特征的背景下,高效准确地发现和获取涉案数据,成为以“从数据到决策”(Datato Decisions,D2D)为服务宗旨的监控网建设及其深度应用面临的瓶颈。为了满足应急需求日益迫切的实时性、综合性与知识性,“支持涉案数据快速整合和案件知识高效理解”的地理视频组织策略不仅是涉及计算机与地理信息系统(Geographic Information System,GIS)等多学科发展的基础理论,更是决定安防应急管理需求下地理视频数据集分析处理能力的科学问题,亦是视频监控系统理论方法与关键技术研究亟须解决的核心问题,因此,亟须发展缩小涉案知识深度挖掘所需搜索空间的地理视频数据组织技术,增强对涉案信息的准确定位能力,提高检索结果中的涉案价值密度,形成全网监控视频组织的新机制。
1.1.2地理视频大数据价值特征与创新组织方法研究策略
随着监控网络的普遍大规模布设和联合监控作业,地理视频的生产方式从依赖传统社会媒体的被动运营阶段,进一步发展为自动感知阶段。生产方式的转变提供了既快又易的数据获取途径,使大范围地理视频动态持续地“整体获取”成为可能:全网地理视频动态、海量、多源异构的非结构化复杂数据集,由此呈现兼具大数据体量大(Volume)、类型多(Variety)、变化速度快(Velocity)的“外部特征”和高维关联、低价值密度(Value)、非平稳的“内部特征”(Chen et al.,2011;郑宇,2013),不仅符合数字媒体大数据的定义,也符合典型的时空大数据特征。大数据的核心价值不在于其规模的“大”,而在于数据所反映的隐含规律或知识的“全”(李德仁等,2014a);也取决于数据内容中全局相关等科学特性(Helbing,2013);其少量依赖因果关系而主要面向关联性的任务,已成为大数据研究的主流科学模式(郭华东等,2014)。
相较于广义的时空大数据和计算机领域的专题数字媒体大数据,城市监控网络环境中多摄像联合获取的地理视频具有“面向多尺度城市运行空间整体获取”的特殊性(Mehboob et al.,2017)。城市运行空间是“城”所代表的地理空间和“市”所代表的人文空间紧耦合的二元空间,80%以上的城市运行信息涉及空间实体、实体的空间关系以及时空过程等空间概念(李德仁等,2014b)。由于地理空间的自相关特征,地理视频作为一类能够整体获取城市运行空间,并且紧密集成时空信息与媒体信息的新型地理空间数据,其数据内容所面向的城市运行过程,包括主要被关注的人文活动时间、地点、目的、行为方式、行为结果、影响以及对象间可能的交互关系,都具有与地理环境紧密相关的广域整体性;这种整体性决定了地理视频数据内容的地理属性与其非时空特征属性紧耦合,由此产生区别于传统数字媒体大数据存在于视频内外监控场景和场景对象要素之间的时空、对象、行为、尺度等多维地理关联的核心价值特征(He et al.,2017)。从重点刻画联网环境下地理视频之间全局地理关联的角度,将这类数据称为地理视频大数据(GeoVideo Big Data)。由此,地理视频大数据的独*价值不在于其海量的数据规模,而在于其对监控环境多时空尺度、多方位、多层次的全局展示,更在于其数据内容对应的多尺度城市运行环境中局部小尺度、阶段中尺度和多阶段联合的大尺度共同构成的多尺度复杂公共安全事件信息。时间、空间和尺度等地理要素间的多维相关性构成了挖掘和理解地理场景中复杂行为事件信息的基础(图1-2)。
综上分析,地理视频大数据存档组织管理对涉案数据快速整合和案件知识高效理解存在适用性的局限,因此“面向关联性”的大数据科学研究模式被重点关注,着重挖掘地理视频数据内容“多维地理关联”的大数据价值特征的组织研究策略被提出。这种策略的要点是在传统丰富视频内容语义的基础上,充分利用多维地理语义相关性发展地理视频大数据组织理论方法。
1.2国内外研究现状及趋势
针对地理视频大数据关联组织研究核心问题,从视频/地理视频数据组织策略和关联机制两方面总结现有研究进展与趋势,分析现有方法适用性,归纳凝练自适应组织方法研究需要侧重考虑的科学问题。
1.2.1地理视频数据组织策略研究
数据组织策略是决定数据应用能力的基础理论和关键问题。合理组织地理视频数据,可以有效缩小数据检索、分析和深度挖掘的搜索空间。传统地理视频数据的组织策略主要依托计算机多媒体领
展开