第一章大数据条件下轨道交通网络化客流组织理论
随着城市轨道交通线网的拓展与延伸,网络通达性增强,城市轨道交通从可选项逐步发展成市民出行的必选项。截至2020年底,全国(不含港澳台)共有45个城市开通城市轨道交通运营线路233条,运营总长度达7918.79公里。以北京为例,2019年全年累计完成客运量39.6亿人次,每天的平均运量超过1100万人次,客流强度超过1.8(客运量/运营里程)。特大城市依靠大规模修建地铁线路新增的路网运力远不能满足客流的剧增,高峰时段部分线路及车站能力不足已成为北京、上海、广州等大城市地铁运营的常态。因此,如何组织超大规模轨道交通路网的客流已经成为地铁管理者迫切需要解决的关键问题。
随着新技术的快速发展,在互联网+、物联网、大数据、云计算等科技不断发展的背景下,城市轨道交通数据爆炸式增长,5G网络作为新型基建的底层技术,为整个信息基础设施建设带来革命性转变,给轨道交通智能化升级、海量数据资源连接带来新的基础能力。各大城市纷纷提出智慧轨道交通运营理念。广州地铁将精准把握新一代技术发展方向,利用多层领域感知、人工智能、移动互联、主动协调等技术,聚焦智慧服务、智慧运行等领域,推进轨道交通网络向网联化、协同化、智慧化发展。上海地铁提出基于5G技术的城市轨道交通智慧运营服务体系,从多源数据采集与自由流转的数字化,逐渐升级到数据价值流动的智能化,以及进一步创造经济与社会价值的智慧化三化升级路线,*终实现新技术、新生态合作共筑下的业务智能联动、资源智慧匹配。同时,利用更加丰富、完善的多源信息和服务引导、方便乘客出行,试图解决超大规模轨道交通的客流组织问题。但这些智慧运营成果还处于起步阶段,有效性尚需验证。特别是,这些多源信息对客流组织的影响效果缺乏相应理论和方法的支撑。
面向超大规模轨道线网乘客出行行为特征和巨量客流演化规律问题,既有研究在多场景个体、群体行为的变化机理(如极端拥挤乘客反常和突发下乘客超常行为)刻画等方面可能失效。同时,超大规模轨道线网存在非受控和受控两类客流,即兼具道路客流的随机性和铁路客流的确定性(人、路、列车的匹配),导致这些多尺度(点线网不同层次)客流的演化机理难掌握。此外,既有的轨道线网供需匹配方法难以适应服务和不均衡需求的要求,无法实现超大规模轨道线网的精准供需匹配。
综上所述,在交通强国战略及轨道交通一体化(如粤港澳大湾区、京津冀等)运营背景下,准确掌握多源信息作用下超大规模超大运量轨道交通乘客出行行为特征及巨量客流的多尺度动态演化机理,揭示乘客出行信息与供需匹配的作用机理,实现客流诱导和客流控制的协同优化,满足乘客的个性出行需求和提升轨道交通的运营水平,促进轨道交通从群体性服务发展为个性化定制的精准服务,不但对保障超大型城市运行效率具有重要的应用价值,而且对丰富发展智慧轨道交通客流组织理论和方法也具有重要价值。
1.1大数据条件下轨道交通网络化客流组织理论框架
针对轨道交通线网多源运营数据复杂,乘客反常、超常行为识别难,需求把握不准和供需匹配粗放等问题,本书研究超大规模、超大运量轨道线网下客流大数据分析、乘客出行行为决策、需求演化和供需匹配评估机理的科学问题,提出超大规模轨道线网的多场景乘客出行行为建模、多尺度客流演化和不均衡供需匹配理论和方法。
第二章从宏观和微观角度进行轨道交通客流大数据挖掘。在宏观分析方面,面向城市轨道交通自动售检票(auto fare collection,AFC)数据的旅行时间异常分析,首先提出标准时间带构建方法,并以正常的出行时间范围为标准消除异常数据。然后,提出基于集成算法的旅行时间异常检测算法,识别封站时段旅行时间异常的客流量。在路网客流量异常分析方面,提出识别封站情况下异常的地铁车站进站客流的方法。*后,介绍面向地理数据的多源数据采集方法,包括城市全域的住宅小区数据、建筑面积数据、轨道站点路网可达性数据,以及路网密度数据等,从微观角度对乘客个体进行深入分析挖掘,构建乘客用户画像体系,以满足不同的运营组织需求。
第三章阐述数据驱动的乘客出行行为分析和建模方法。首先,建立封站条件下乘客出发车站选择行为模型;研究不同客流特征的旅行时间可靠性,基于累积前景理论建立考虑旅行时间可靠性的乘客出发时间选择模型;对拥挤大客流情况下的乘客乘车班次比例、拥挤大客流情况下的乘客反向乘车行为、拥挤条件下的路径选择行为进行研究,并对提出的模型进行验证。
第四章提出面向大数据的轨道交通客流预测方法,解决多场景、多粒度、高精度客流预测的问题,包括面向土地利用数据的轨道交通进出站量预测、时空短时客流预测、客流控制下轨道交通出站量预测和封站场景下轨道交通进出站量预测方法。在面向土地利用数据的轨道交通进出站量预测方法中,提出一种新的融合循环门控单元的图卷积网络(graph convolutional networks and gate recurrent unit,GCGRU)模型精准预测轨道交通的短时客流。该模型可以通过循环门控单元提取时间特征,通过图卷积网络(graph convolutional networks,GCN)提取空间特征,具有较好的精度和可解释性。同时,为了解决客流控制下的客流预测问题,我们提出利用列车时刻表、客流、客流控制数据对车站出站流量进行预测的神经网络模型。该模型对调整客流控制策略、缓解拥堵问题具有重要意义。在封站场景下的轨道交通进出站量预测方法中,我们提出基于新的封站情况下的轨道交通客流预测方法。与其他机器学习(machine learning,ML)模型相比,该方法预测精度较高,能较好地预测封站情况下轨道交通客流的情况。
第五章提出面向数据驱动的轨道交通路网状态识别方法,建立车站拥堵的评估指标。通过轨道交通路网、车站的历史数据对路网和车站状态分级,并结合预测交通状态评价指标判别路网预测状态的拥挤等级。根据OD(origin destination)量对车站进行关联度分析,形成关键区域,进一步识别关键车站。
第六章提出基于强化学习的轨道交通路网协同限流方法,深入探讨线网各车站协同客流组织的机理,明确各车站的关联和互动关系,构建适应超大规模路网拥挤客流管控的求解模型和算法。
第七章针对供需匹配不平衡,介绍数据驱动的轨道交通精准诱导方法及系统。具体而言,提出乘客出行前、中、后过程中结合乘客画像的精准诱导信息发布策略,提出基于Q-learning的结合乘客偏好的诱导信息发布优化方法。
本书在新技术条件下开展超大规模轨道客流组织研究,具有如下科学意义和应用价值。
(1)探索超大规模轨道线网乘客反常和超常行为的作用机理,围绕超大规模线网服务失效下乘客行为机理未知的科学问题,提出考虑乘客旅行时间可靠性的乘客出发时间选择行为模型,封站场景下基于决策场理论的乘客出发车站选择行为模型,反向乘客及其反常行为的分析理论和突发情况下乘客超常行为决策方法,解决超大规模、超大运量轨道线网极度拥挤和突发情况下的乘客轨迹估计不准确、断面客流量估计不准的难题。
(2)围绕受控和非受控客流在超大规模轨道线网的演化机理难掌握的难题,构建满足多场景(包括平日、客流控制、大型活动等)、多尺度的短时客流预测方法,克服外部因素考虑少和预测结果可解释性差的缺点,实现线网客流的精准估计,弥补既有研究估计不准确的缺陷。
(3)面向轨道交通路网和车站状态数据多、阈值难以确定的问题,提出基于数据驱动的聚类分级方法,解决海量数据的挖掘和点线网状态的内在关系挖掘等难题,利用数据驱动方法构建路网关键车站时空关联度的分析和计算方法,为进一步高效协同客流组织提供支撑。
(4)提出能力受控下的轨道交通区域多站协同限流方法和考虑实时信息作用的诱导策略优化方法,深入刻画限流策略、诱导策略与乘客行为、线网客流状态演化之间的互馈关系,开创满足不同服务需求的超大规模线网不均衡运输组织理论,实现大规模线网的精准复合客流组织理论。
(5)尝试解决长期以来轨道交通领域无法高效利用多源信息进行客流组织的难题,在提高轨道交通运营效率、乘客出行服务品质等方面带来间接的社会及经济效益。
本书涉及的多场景、多尺度需求和新技术+轨道交通客流组织是各轨道交通企业响应国家新技术在行业应用战略,构建智慧地铁迫切需要掌握的基础理论。
1.2国内外综述
1.2.1大数据条件下的乘客行为特性建模
结合本书研究的目标和内容,主要总结实时感知下的乘客出发车站、出发时间及路径选择行为的变化规律。
地铁乘客出行时间和出发车站选择行为的研究正在日益兴起,建模方法主要有多项logit(multinomial logit,MNL)模型、交叉嵌套logit(cross nested logit,CNL)模型等离散选择模型[1]。Thorhauge等[2]考虑出行者时间的灵活性因素,基于混合logit模型构建出行时间选择模型。Li等[3]研究高峰时段乘客的出发时间选择行为,采用两阶段控制函数方法构建解决价格内生性的乘客出发时间选择行为模型,分析社会经济和乘客个体特性对不同乘客的出发时间影响,为早高峰制定个性化的需求控制策略提供理论依据。乘客路径选择行为方面的研究相对较多,常见的方法有数学建模和数据挖掘两大类。Fosgerau等[4]采用MNL模型描述乘客的路径选择问题,并在大规模地铁网络应用中验证。Raveau等[5]考虑换乘主观感知、列车拥挤程度、网络拓扑和社会人口因素构建基于地铁网络的乘客路径选择logit模型,结合伦敦地铁和圣地亚哥地铁数据对模型参数进行校验和比较分析。Mai等[6]在此基础上进一步构建动态规划的方法,解决大规模路网下的路径选择问题,并以嵌套logit(nested logit,NL)模型为基准验证模型算法的有效性。近年来,数据挖掘方法成为乘客行为研究的热点。Kusakabe等[7]通过构建朴素贝叶斯概率模型估计乘客的出行行为特性,特别是出行目的的挖掘分析。Minseo等[8]利用贝叶斯方法和马尔可夫链蒙特卡罗法估计乘客选择路径行为。Xu等[9]考虑列车拥挤程度对乘客路径选择的影响,建立乘客出行选择行为的logit模型,并利用AFC数据、列车时刻表和满载率数据进行建模的参数标定。然而,这些研究乘客出行行为的模型均未考虑动态信息对乘客的影响,利用感知信息研究地铁乘客出行行为还处于起步阶段。
信息感知对出行者行为影响的研究在轨道交通领域不多,大多集中在道路和公共交通领域。很多研究都假设每名出行者可以根据收到的信息自动做出理性的选择。然而,个体并不总是采纳或服从收到的信息,只有一小部分乘客的出行路径是按照信息建议选择的。近年来,Ben-Elia等[12]使用混合logit模型研究道路旅行时间的不确定性和信息的准确性对驾驶员路径选择的影响。Van Essen等[13]从个人和路网系统角度综述出行信息对出行者行为的潜在影响,并重点强调有限理性和非自私行为在路径选择和信息反馈中的作用。对基于道路的先进出行信息系统,不少学者也进行了相关研究。Dell’Orco等[14]提出一种基于模糊数据融合的驾驶员动态选择行为模型,根据当前网络状况动态模拟用户对旅行时间变化的感知。Ma等[15]利用强化学习和贝叶斯学习构建出行者的日常路径选择模型,考虑内在的信息系统可靠性、外在的多源信息、用户历史经验,以及心理因素。案例结果表明,信息系统的可靠性越高,出行者越遵循系统的路线推荐。
随着互联网和移动大数据的发展,利用社交媒体和智能手机第三方应用程序(application,APP)进行道路相关信息感知的研究也相继出现。Rashidi等[16]综述了如何将社交媒体的各种资源和数据用于分析乘客出行特性,如出行目的、出行方式、活动时间、目的地选择,以及社会属性等。Zhang等[17]基于社交网分享的实际路线旅行时间、每条路线选择的
展开