1.数据采集层
生态环境及其治理措施的相关数据资料是构建数字生态治理系统的重要基础,包含环境数据信息、地理数据信息、全球生态治理案例等,但是这些数据的来源较为分散,故系统的第一层级便是采集相关数据信息。数据采集来源主要划分为以下三大类:物联网监测设备、公共部门以及网络信息。具体采集途径和方法如下。
(1)物联网监测设备
物联网监测设备是指与互联网连接且能够进行数据收发的监测设备,这类设备构成了数据源产生的基础物理层,实现对生态环境信息的实时监测,确保获取真实准确的第一手信息资源,常见的物联网监测设备包括如下几类:一是生态环境监测传感器。生态环境监测传感器可以实时地将现场环境的各类信息通过传感器采集上传到互联网,从而实现生态环境的监测。这类设备可以提供最真实、可靠、准确的数据。二是视频监控设备。目前,我国视频监控设备已经形成了一定规模的“天眼监控系统”,可通过网络实现视频图像的监控及录像,甚至已经能够根据采集到的图像信息进行智能比对判断。数字生态治理系统可利用现有的视频监控设备,采集有关生态方面的视频图像数据,从而充实这一类型数据的来源。三是智能手机。在智能手机日益普及的今天,其功能日新月异,智能手机中安装的各类传感器可以为数字生态治理系统提供庞大的数据源,其分布广泛的特点使得数据采集更加全面。四是其他物联网设备。在人们的日常生活中,越来越多的物联网设备得到使用,像空调、冰箱、电视、空气净化器等家用电器,都在逐步走向智能化。该类设备拥有各类传感器,可以上传到网络,使得人们能够实时掌握设备所处环境的动态信息,故可以作为数据源加以采集。
(2)公共部门
我国关于生态环境及其治理方面的数据资料,主要由公共部门加以收集整理。目前我国公共部门运行中信息孤岛效应较为突出,相关部门自建数据体系,单兵作战,缺乏互通共享,致使有关数据资料出现重复采集,无形间增加了数据采集成本。因此,依托系统集成和集体行动整合各有关部门数据库的相关资料信息至关重要。环保、气象、交通、科技、国家地理、林业、海洋等生态信息亟待一体化方略加以整合,以充分利用现有资源构建起整体协同的生态治理数据库。以气象部门为例。气象部门拥有全国各地各个时间点的全部气象数据资料,如气温、湿度、风向、风速、降雨量、气压等等。除了这些基础性的记录外,气象部门的数据库中还记载着一些特殊的天气情况,如雷电、台风、冰雹、大雾等。又如环保部门。环保部门的主要任务是负责生态环境监测与治理、统计信息、出台环保制度等,以提升人们生活的环境质量。故环保部门拥有大量有关生态治理方面的数据资料,其中包括环境基础资料、治理方法、治理过程、治理效果等。再如交通部门。交通部门拥有全国各地所有交通干线的数据资料,除了其拥有的“天眼监控系统”可以提供大量宝贵的视频图像类数据资料以外,还可以提供尾气污染、自然灾害等信息,间接监控生态环境,为数字生态治理系统提供侧面、广泛、有力的数据信息。各个公共部门之间不应该是各自为政的碎片化存在,而应该是互动互融、共生共享的。
(3)网络信息
除了物联网监测设备及公共部门以外,网络上的信息也是数据采集的主要对象之一。网络信息业已成为人们获取知识和信息的重要途径之一,其实效性强、信息资源庞大丰富的特点,使得人们更乐于接受这种获取信息的渠道。故数字生态治理系统需要充分开发和利用好网络信息,力求从中挖掘出更多更有价值的生态治理数据信息。目前,网络信息可以重点关注以下几个数据来源:一是新闻媒体。新闻媒体工作者拥有很强的数据挖掘能力,他们会第一时间赶到现场获取资料并迅速编辑,然后通过网络及时发布,因而可作为系统数据信息的采集源。采集对象的关注重点应该放在较为知名和权威的新闻媒体上,随着自媒体发展越来越正规、壮大,像“今日头条”等大型自媒体也可纳入采集对象中来。二是应用程序。随着手机逐步智能化,应用程序也变得种类繁多,功能更加丰富。这些应用程序越来越注重分享、互动功能,从而使公众不仅能够获取信息,而且为网络增添了很多的数据信息。微博、抖音、微信等社交App的兴起,更是让公众变成了生态环境的“监督者”,公民个体均能提供即时的数据源,所以可筛选一些数据量大且权威的应用程序,将公众上传的碎片化数据进行筛选、分析、整合,进而挖掘一些对生态治理效果有价值的数据信息。三是其他方面的信息源。除了以上两种网络信息来源以外,网上一些知名的相关论坛也可以作为数据采集的来源。这些论坛中包含着与生态环境治理相关的很多科技成果、成功案例、科研项目等,可提供权威且专业的技术资料。
2.数据预处理层
在数字生态治理系统中,数据预处理层的功能是对来自采集层的数据进行预处理。数字生态治理系统管理的目标众多,涉及的数据具有规模巨大、复杂多样、流转速度快等鲜明的大数据特征。因此,为了对生态环境数据进行有效的分析,需要将这些来自前端的数据导入集中的大型分布式数据库或分布式存储集群,并进行数据的预处理。数据预处理可以分为数据清理、数据转换、数据规整三部分,主要任务是将数据进行筛选、分类、集成,对有价值的文本、数字、图片、视频等不同格式的数据采用不同的大数据清理技术,整合为统一标准后存入生态治理数据库。在数据清理阶段,可对采集层收集的数据进行去重、去噪、处理无效数据、处理缺失值、解决数据值冲突等操作。在数据转换阶段,可对数据进行特征提取、数据单位转换、数据规范化等处理,在此基础上,可进行数据维度、数据值、数据属性的规整。对数据的预处理可降低无效、错误、重复数据对数字生态治理数据库构建的影响,提高数据的准确性,并可以降低储存成本,大幅缩减数据检索和分析所用时间。
……
展开