第1章 概论
城市是人类活动*为密集的区域,人类对城市的研究从未停止。近年来,随着物联网、云计算、大数据、人工智能等新兴技术的普及,人类对城市的研究逐渐从传统数据、小范围、抽样概要尺度研究向以时空数据、大范围、连续精细监测为核心的定量研究演变。本章将对时空信息支撑下的城市定量研究时空数据环境、代表机构与发展挑战方面展开介绍。
1.1 城市定量研究时空数据环境
数据是城市定量研究的根基,是支撑起城市规划决策科学性的基石。城市定量研究发展至今,数据获取渠道从官方统计口径资料、政府行业主管部门资料到各种来源大数据,共同构成了种类丰富、形式多样的城市定量研究时空数据环境。官方的测绘数据具备高精度、高权威性,极具数据挖掘价值,包括有测绘行业数字正射影像图(digital orthophoto map,DOM)、数字高程模型(digital elevation model,DEM)、数字栅格地图(digital raster graph,DRG)、数字线划地图(digital line graph,DLG)的4D产品,以及自然资源调查等测绘成果数据。随着卫星遥感、物联网技术的蓬勃发展,以及社交媒体、智能手机等的广泛使用,更加具备开放特质的时空大数据涌现,这类新兴时空大数据的特点主要呈现出精度高(以单个的人或设施为基本单元)、数据量大(以千万级甚至是亿级为单位的记录数据量)、时效性高(每月、每日甚至是每分钟更新)、覆盖性广(不受行政区划限制)(龙瀛等,2018),可支撑城市定量、规划设计、商业资讯等方面研究。典型城市定量研究的时空数据从数据来源的角度可分为基础测绘数据、城市管理数据、运营商开放能力平台数据、企业产业数据、宏观经济统计数据和互联网大数据。
1. 基础测绘数据
基础测绘数据主要来源于测绘部门。例如,地形图包含丰富的自然地形地貌及城市基础设施,如水系、植被、建筑物、交通路网等。除此之外,基础测绘数据还包括数字正射影像图、数字高程模型、数字地表模型,以及近年来开展的实景三维中国建设成果,包括倾斜摄影测量模型、人工建模精细模型、建筑信息模型(building information model,BIM),以及新型基础测绘带来集成城市管理的地理实体属性信息。
2. 城市管理数据
城市管理数据包括城市土地利用现状、自然资源调查、土地权属、房屋建筑、地址门牌号、各类公共服务设施、地下空间设施等一系列城市对象。针对城市管理,广州市开展以“四标四实”(标准作业图、标准地址库、标准建筑物编码、标准基础网格,实有人口、实有房屋、实有单位、实有设施)为核心内容的规范城市管理专项行动工作,全面摸清人、地、房、设施和产业等信息。
3. 运营商开放能力平台数据
运营商开放能力平台可以提供手机信令数据等,手机信令数据挖掘在多个领域实现了应用,如城市职住平衡分析、城市空间结构识别、人口分布与空间活动的动态特征研究、区域交通出行特征研究、城镇体系规划中的应用研究等。手机信令数据样本量大、客观、全面、采样不会有很明显的倾向性,且数据具有较强的时空持续性,可以观测到人口移动出行整个过程,是其他数据源难以比拟的。
4. 企业产业数据
法人是指具有民事权利能力和民事行为能力,依法*立享有民事权利和承担民事义务的组织。企业产业数据具体包括法人基础信息,如组织机构代码、法人名称、状态、机构类型等;也包括法人注册登记信息、税务登记信息、统计信息等多个大类。基于政务网络、空间地理信息系统,以及支持多业务部门的数据集成和交换平台,按照统一的数据库编码标准,收集、比对、整合分散在税务、市场监管等部门的基础数据,集聚、整合各参建部门管理系统中涉及法人的基础信息(如组织机构代码、机构名称、机构类型、经济行业、业务/经营范围、机构地址、法定代表人等字段,以及机构变更、注销的相关信息),建设以组织机构代码为唯一标识的法人基础数据库。
5. 宏观经济统计数据
宏观经济统计数据以统计经济信息为基础,主要来源为政务管理部门如国家税务总局、统计局、发展和改革委员会、经济贸易委员会、市场监督管理总局、人力资源和社会保障局、财政局、**等部门的相关宏观经济统计数据。
6. 互联网大数据
兴趣点(POI)数据、网络地图数据、公交刷卡数据、ETC收费数据、共享单车数据、出租车数据等交通专题数据与房价数据、微博数据、夜间灯光数据等社会民生数据均为城市定量研究提供了丰富、有效的数据基础,与前文数据共同组成了支撑城市定量研究的时空信息底盘底数。
1.2 城市定量研究代表机构
目前在城市定量研究方面,国内已有多个代表机构在城市规划、城市计算、人口分析、交通优化、设施布局等多个城市管理领域开展了具有创新性、前瞻性的系列研究。
北京市城市规划设计研究院在数字规划方面,较早地开展了多项专题研究。基于遥感影像与开放数据的城市土地承载力评价,提出了基于空间分布的城市土地承载力评估方法,耦合遥感观测和社会开放数据,通过对土地利用空间分区和土地承载力指数的空间分级,估算人口承载数量阈值范围(胡腾云,2018);城乡规划公共设施优化布置及选址模型研究,建立了一套适合我国城乡规划公共设施优化布置及选址的模型框架体系;在技术上利用时空行为地理学理论方法,设计了充分兼顾供给均等性和需求差异性的模型算法;在数据上整合城市物质空间和公众时空行为数据作为支撑;在实践上研发模型系统,普及和推动规划支持技术应用,实现行业信息化工作的整合发展和变革创新(黄晓春等,2020);基于2008 年北京市连续一周的公交刷卡数据,结合2005年居民出行调查、地块级别的土地利用图,识别公交持卡人的居住地、就业地和通勤出行距离,并将识别结果在公交站点和交通分析小区尺度上汇总(龙瀛等,2012)。
北京清华同衡规划设计研究院同样开展了多领域城市定量研究。利用公交刷卡数据提取通勤人口交通出行量(OD)信息,以此判断城市各个功能区之间的关系,还可以通过长时间的数据积累,分析同一用户的OD变化特征,反映人口居住和工作地迁移情况(王鹏等,2014);通过出租车GPS轨迹识别人口出行特征,出租车轨迹数据量较大、分布均匀,数据不仅包含OD信息,还包含城市道路上汽车的实时车速,通过数据挖掘识别用地的性质和出行人口的行为特征(李苗裔等,2018);通过收集城市公共卫生资源POI数据、手机信令数据、高德交通态势数据,分析了福州公共卫生资源的空间布局与人口空间分布的关系,并以特殊公共卫生应急状态为背景,诊断出福州公共卫生资源缺乏的区域(孙士玺和王秀凤,2019)。
武汉大学城市化研究室以空间数据分析为核心技术支撑,近年来在多个方向开展了城市定量专题研究。利用遥感及规划大数据开展国土空间规划实施评估,实现空间评价的多个指标的精确计算与评估结果的专题制图。如公园绿地等城市公共服务设施的可达性研究与时空演变机制解析,从数量、质量和可达性三方面建立城市公共绿地评价体系,通过聚类分析和皮尔逊相关系数,探究公共绿地在街道水平上的分布不公平性及其与居民健康的空间关联,以期为城市绿地建设与空间布局优化提供参考(谭冰清等,2018)。又如城市工业用地与产业园区的空间影响机制研究,以工业用地效率测度为基础,将产业园区的空间影响机制进行定量化,通过地理加权回归与方差分解法的模型构建,决定工业用地效率中的劳动力、资本投入强度,且对相关因素空间异质进行了全面分析;采用网络搜索数据(百度指数数据),运用向量自回归(vector autoregression,VAR)模型、向量误差修正(vector error correction,VEC)模型、脉冲响应函数,以及面板数据模型对我国31个省(自治区、直辖市)生态文明关注度的时空特征、区域性差异及其影响因素进行研究(李霖等,2020)。
1.3 城市定量研究发展挑战
目前城市定量研究的应用方向与应用方法日趋成熟,形成了多个细分研究领域。对各项研究所需要的数据、常用方法与步骤、成果展现形式等均形成了一定规模的体系。但由于城市定量研究本身涵盖内容较广,面对的是综合性的社会问题,需要不同种类的数据进行支撑,其涉及大量的数据预处理工作,分析步骤也较为复杂,工作量较大,导致在处理大量异构数据与多层次分析的时候效率不高。此外,还面临数据资源很难共享、无法将多源数据综合分析和提高附加值、数据处理单调乏味等问题。
1.3.1 数据处理:多源数据融合处理挑战
在以往的城市定量研究过程中,受数据采集渠道的约束,一般直接采用调查问卷、统计年鉴或小范围内的地形图、土地规划等信息。这类数据获取渠道单一,格式规范标准,处理起来相对容易。随着新兴时空大数据崛起,除了传统的GIS、CAD这类国土规划数据,还有各类社交APP和点评网站,以及多专业融合趋势下的多专业数据汇集。*先数据整理过程较为麻烦,一般需要对数据进行ETL工作;其次数据格式来源多样,除了数字正射影像图、数字高程模型、建筑信息模型、激光点云(LAS)、倾斜摄影三维模型(OSGB)、统计数据(CSV、XLSX),以及多种数据库如数据仓库/数据湖(AWS RedShift)、OLTP型数据库(MySQL、MongoDB、SQL Server、Oracle、PostgreSQL)、OLAP型数据库(Apache Hive、Elasticsearch、ClickHouse、Apache Doris)、API数据源(JSON、Excel、CSV)等。
针对这些多源数据融合处理特点,可结合空间ETL工具进行自动化数据处理分析。空间数据涉及数据库、表格、文本、空间等形式的数据,对于不同存储格式、不同坐标系的空间数据,需要进行数据转换等预处理工作。如FME具备数百种数据格式相互转换能力,将丰富的GIS数据处理功能结合在一起,实现空间数据的多种类型的处理、整合、分析。有别于传统定量分析方法,FME将各类空间定量分析工具转换为模块函数,通过图形化界面进行自由拖拽搭配使用,将可重复步骤化解为自动化、流程化处理,并且通过空间数据转换处理,实现算子组装、可拖拽、可调整、参数化的效果。
1.3.2 分析工具:跨专业软件使用挑战
城市定量研究面临的数据丰富、需求多变的现状,需要团队成员具备熟练掌握测绘、地理信息、景观设计、建筑设计等多种跨专业软件的能力,甚至需要团队成员掌握代码开发能力。一般情况下跨专业软件需要经历较长时间的学习过程,给数据分析人员带来不小挑战。
针对跨专业软件使用难度较高的问题,可采用模块化的思维进行各个数据处理阶段的切割。根据不同的数据处理步骤,形成模块化的工具包。综合模块化的处理工具能够提供便捷、高效、快速的解决方案,通过将功能进行模块化封装,形成可自由转换、组合的各类转换器,并将转换器进行有机组合,在重构数据过程中提炼空间数据分析的原理、步骤,并形成一系列标准化的数据转换、融合、分析的模型。功能模块化的特点是预先集成一系列的转换器,通过零代码方式搭建数据处理分析流程,供用户自由搭配使用,基本实现所有空间处理分析功能。
1.3.3 成果要求:实时数据分析时效性挑战
城市定量研究已进入大数据分析阶段,大数据的种类多、价值高。实际上,大数据时代不意味着所有大数据都是开放使用的,如手机信令数据、公交刷卡数据、共享单车轨迹等大多不是开放的,数据获取成本较高。具备开放意义的商业网站、社交媒体网站等,其信息获取难度大,数据清洗过程复杂。因此,数据生产的自动化程度不高、海量数据处理耗时长,以及数据错误识别、智能化程度低等问题一直制约着大数据在城市定量研究中的应用。与此同时,城市定量研究从数据提供步入到数据产品服务的阶段,更多的数据成果产品响应要求是实时的。谷歌利用其地球引擎(Earth Engine)和人工智能技术,基于哨兵2号影像推出
展开