北京对外交通枢纽乘客OD时空分布特征
基于交通大数据的京津冀城市群出行行为研究——以北三县为例

EXPERIENCE区域治理基于交通大数据的京津冀城市群出行行为研究——以北三县为例北京北控智慧城市科技发展有限公司 王嘉摘要:本研究基于互联互通卡数据和其他公开数据,得到的城市群间个体联程出行起终点、出行时间等出行需求数据。
结合城市群内行政区划层面的经济、人口等基本数据,进而构建京津冀城市群出行信息与起止点基本属性关联数据库,从而得出出行OD,进而分析京津冀城市群人们的出行行为。
关键词:交通大数据;京津冀城市群;出行行为中图分类号:C913.32 文献标识码:A 文章编号:2096-4595(2020)33-0019-0002居民出行调查中的出行特征分析是为现状交通分析评价、交通预测模型标定、交通网络规划等提供基本参数和指标。
从对出行的定义中可以看出,一次出行包含了出行目的、出行时间、出行端点、出行方式等信息。
基于对刷卡交易数据的适用性分析和出行规律的研究,本文选择了城市时空效率指标(出行时间、出行距离)、换乘效率指标(换乘次数、换乘时间)和舒适度指标(出行方式)等特征指标进行提取。
该出行特征分析可为交通管理者提供渠道掌握相关运输方式的运营情况,同时能够为城市群路网的交通现状分析、城市群跨区乘客在城市范围内的交通需求分析等提供支撑及决策支持。
一、城市群运输需求的基本特征分析区域间旅客运输的联系一直都以铁路、水运为主,但是近些年民航、公路交通运输有了很大的发展,公路和民航在区域交通旅客运输中也开始有了很大的市场。
其中京津冀区域间主要以公路和高速铁路运输为主。
北京作为全国的政治、商务中心,客运需求量极大,而天津和河北则扮演着大型中转城市,因此,京津冀区域的协同发展,对缓解城市群内客流需求失衡,缓解首都大客流压力,合理配置资源具有重要意义。
对城市群进行出行预测,首先要分析出行机理。
联程客运产生的内在机理的主要影响因素为外部环境、内部环境、城市群联程客运交通结构、交通供给及交通需求。
基于联程客运交通系统影响因素、构建因素间的因果关系,同时为描述联程客运交通系统结构,并依据人们真实交通需求形成的动态过程,全面分析联程客运供给和交通需求内在的机理影响关系。
交通大数据技术及其应用--课件--第5章-基于大数据的群体出行分析及预测技术全文

(1)网约出行数据集。网约车数据集来源于国内主要运营商 滴滴出行。
基于前述章节,需要把订单数据中连续的信息进行离散化 处理,离散处理后的数据集见表。
第5章 基于大数据的群体出行分析及预测技术 交通大数据应用技术
5.2 基于贝叶斯网络的城市区域出行需求稳定性分析技术
第5章 基于大数据的群体出行分析及预测技术 交通大数据应用技术
5.1 区域出行时空特性分析方法
5.1.1 不同区域居住者出行空间活动范围
第5章 基于大数据的群体出行分析及预测技术 交通大数据应用技术
5.1 区域出行时空特性分析方法
5.1.1 不同区域居住者出行空间活动范围
CBD区域样本用户Sch均值为32.2km2 ,以Sch的自然对数 [ln(Sch)]为横轴,统计ln(Sch)的频数及累积频率,如图所示。
第5章 基于大数据的群体出行分析及预测技术 交通大数据应用技术
5.2 基于贝叶斯网络的城市区域出行需求稳定性分析技术
5.2.2 基于贝叶斯网络的区域分类模型构建方法 5.2.2.1 模型构建
对于任一交通小区h来说,该交通小区共有K个主题特征,主题特征分 布θh服从参数αh的Dirichlet分布,对与某一主题zh,k下的单词分布,有服从 参数为β和γ的Dirichlet分布。假设共有K个主题,ψ为K×V t矩阵,V t表示不 同时间窗口个数,φ是K×V s矩阵,其中V s表示不同出行特征个数。ψtk (φsk) 矩阵中的每个元素表示不同特征的概率分布。综上,即可观测到交通小区h 中不同时间窗口w th下和出行特征w sh的联合概率分布。在任一交通小区内 的总共出行记录条数可以标记为Ntaz,上述整体生成模型的概率图模型可以
219336232_计划性大型活动散场期间地铁OD客流量预测方法

第23卷第3期2023年6月交 通 工 程Vol.23No.3Jun.2023DOI:10.13986/ki.jote.2023.03.018计划性大型活动散场期间地铁OD 客流量预测方法牛燕斌1,孙 琦2,王月玥2,陈 明1(1.北京市基础设施投资有限公司,北京 100101;2.北京轨道交通路网管理有限公司,北京 100101)摘 要:在计划性大型活动举办期间地铁客流量会超过平常高峰期的客流量.客流的激增不仅对城市轨道交通正常运营造成巨大的压力,甚至会引起严重的安全事故.本文在对计划性大型活动散场期间地铁客流在时空范围的规律研究基础上,根据大型活动散场时段的OD 客流量基础数据,结合影响因素特征数据,构建基于随机森林算法的计划性大客流预测模型,实现大型活动结束后在5min 粒度下的OD 客流量预测,并以北京凯迪拉克中心五颗松地铁站为例进行实例研究.选取演唱会和体育赛事的AFC 数据,对预测结果进行验证,并与SVM㊁XGBoost 算法对比,证明本文所提出的基于随机森林算法的客流预测模型方法具有更好的预测效果.关键词:城市轨道交通;客流预测;计划性大型活动;散场客流;随机森林;OD 客流量中图分类号:U 491.2文献标志码:A文章编号:2096⁃3432(2023)03⁃122⁃07收稿日期:2022⁃08⁃15.基金项目:京投公司2020年度科研项目‘面向智能调度的全时域客流仿真推演技术㊁网络化客流动态调控技术研究及示范应用“经费支持.作者简介:牛燕斌(1993 ),女,硕士,研究方向为交通大数据.E⁃mail:niuyanbin_01@.Prediction of Subway OD Passenger Flow during the end of Planned Large⁃scale EventsNIU Yanbin 1,SUN Qi 2,WANG Yueyue 2,CHEN Ming 1(1.Beijing Infrastructure Investment Co.,Ltd.,Beijing 100101,China;2.Beijing Metro Network Administration Co Ltd,Beijing 100101,China)Abstract :In the daily operation of urban rail transit,the passenger flow during the end of planned large⁃scale events will greatly exceed normal passenger flow,which not only causes great pressure on the normal operation of urban rail transit,but even leads to serious safety issues.This paper first analyzes the characteristics of subway passenger flow in the space and time range during the closing of planned large⁃scale events.Then,on the basis of massive origin_destination traffic flow data and the characteristic data of influencing factors,a planned large⁃scale passenger flow prediction model based on random forest algorithm is estimated.This model can predict the origin_destination traffic flow at a granularity level of 5minutes after the large⁃scale event.This paper takes the Wukesong Station of the Beijing CadillacCenter as an example and collects the AFC data of concerts and sports events to verify the prediction results.The results show that the passenger flow prediction model method based on the random forest algorithm proposed in this paper has a better prediction effect after being compared with the SVM and XGBoost algorithms.Key words :urban rail transit;passenger flow forecast;planned large⁃scale events;casual passengerflow;random forest;origin_destination traffic flow 第3期牛燕斌,等:计划性大型活动散场期间地铁OD客流量预测方法0 引言在城市轨道交通的日常运营中,大型活动(如大型体育赛事和演唱会)举办期间会超过平常高峰期的客流量,客流的激增还会增大城市轨道交通企业的运营压力,也考验城市轨道交通企业的运营管理能力和水平.大型活动客流激增,持续时间短,如果不能很好的预测与控制,将对城市轨道交通正常运营产生极大影响,甚至导致安全事故的发生.像北京这样的国际性大城市往往举办大型活动更为频繁,做好此类大型活动的轨道交通保障工作已经逐渐成为轨道交通的一项长期任务.过去,轨道交通管理人员往往凭借相关的经验部署安保措施,缺乏科学的理论支撑.但计划性大客流受到活动规模㊁活动类型㊁活动时长㊁场馆位置㊁天气状况等多方面因素影响,往往很难对地铁运营管理和安全保障做到精细化.如果能预知场馆附近地铁车站客流情况,并预测散场的客流OD量和客流分布,可为管理人员精细化科学管理提供参考,提前制定客流控制策略及运力运量配置方案,以确保大客流平稳有序.现阶段对轨道交通短时客流预测相关的研究主要有2种方法,1种是主流的四阶段法:为基础的客流预测模型;另1种是基于机器学习算法:为基础的客流预测方法.梁强升[1]总结了背景客流量和活动客流量的历史规律,并针对活动客流量基于灰色预测理论构建了大型活动期间地铁车站客流量预测模型.杨静等[2]基于深度学习将框架构建了多层结构的卷积神经网络,将活动客流特征与客流时空分布的映射关系进行拟合,保证其在活动散场大客流进站情况下的适用性.钱慧敏等[3]利用海量数据总结了大型体育赛事活动对周边轨道站点造成的影响,对其影响因素进行标准化处理,并基于影响因素构建梯度提升决策树模型㊁实现客流预测.付宇等[4]将大客流预测的内容具体到分钟级别的站点客流,同时分析大型活动开展前后城市轨道站点客流集散特征和日期㊁时段㊁天气等多维度影响因素,构建XGBoost模型进行客流预测.郑云霄[5]通过建立基于机器学习的大型活动下城市轨道交通客流预测框架,对客流进行了筛选,后续构建梯度提升回归树和随机森林相结合的客流组合预测模型对客流进行预测.Glisovi等[6]指出将神经网络应用于时间序列预测的效果良好,同时提出基于遗传算法和人工神经网络的混合模型.杨军等[7]提出1种基于灰色马尔科夫的大客流实时预测模型,利用马尔科夫修正模型同步提升客流数据的预测准确度.Yu等[8]通过将经验模式分解和反向传播神经网络相结合,提出新的混合预测方法.Liu等[9]为提高预测性能,提出基于深度递归神经网络的时间序列模型,利用神经网络独有的记忆功能捕捉时间序列的动态信息,从而学习不同时刻的数据之间的变化趋势,保证准确预测下一时刻客流预测结果.现阶段对于计划性大型活动的研究也越来越多,但是以上方法较多分析的散场结束后的进站量,而缺乏对OD客流量的分析.而在实际生产运营中,更为关注OD客流量.本文的研究对象为确定时间㊁确定场地㊁客流激增㊁持续时间短等特点的计划性大型活动.本文基于对演唱会和体育赛事这样的大型活动为切入点,研究大型活动期间的客流规律,并对O点车站㊁日期类型㊁天气㊁活动类型等诸多影响因素进行定性分析,构建基于随机森林算法的计划性大客流预测模型,实现大型活动结束后在5min粒度下的OD客流量预测.1 数据基础与影响因素分析1.1 活动定义本文研究的大型活动为确定时间㊁确定场地㊁客流激增㊁持续时间短,活动参与人数超过5000人的一次性服务的计划性大型活动,如大型赛事㊁演唱会等.其中大型赛事有足球赛㊁篮球赛等多种类型. 1.2 数据基础北京凯迪拉克中心(原名五棵松体育馆)毗邻五棵松地铁站,建筑面积6.3万m2,可容纳观众1.8万人,是国内少数几个能与NBA场馆相媲美的专业篮球馆,同时也是各大演唱会举办的热门场馆.本文以北京凯迪拉克中心为例探究计划性大型活动对轨道周边站点客流量的影响,选取五棵松站为研究对象.图1 五棵松站与凯迪拉克中心位置关系321交 通 工 程2023年本文收集2019年北京凯迪拉克中心30场大型活动,涉及体育赛事和演唱会活动.大型活动数据主要包含大型活动举办日期㊁星期㊁天气㊁活动名称㊁举办场馆及活动时间.如表1所示.表1 计划性大型活动示例数据日期星期天气活动名称场馆活动时间倍数2019⁃01⁃16三晴CBA常规赛/季后赛凯迪拉克中心21:25 21:454.895 2019⁃01⁃18五多云CBA常规赛/季后赛凯迪拉克中心21:35 22:204.194 2019⁃01⁃29二多云CBA常规赛/季后赛凯迪拉克中心21:45 22:005.198 2019⁃01⁃31四多云CBA常规赛/季后赛凯迪拉克中心21:30 21:554.512 2019⁃03⁃05二多云CBA常规赛/季后赛凯迪拉克中心21:45 22:005.928 2019⁃03⁃13三多云CBA常规赛/季后赛凯迪拉克中心21:30 21:504.472 2019⁃09⁃02一晴男篮世界杯凯迪拉克中心22:45 23:1555.059 2019⁃11⁃06三多云CBA常规赛/季后赛凯迪拉克中心22:10 22:3510.290 2019⁃11⁃08五晴CBA常规赛/季后赛凯迪拉克中心21:50 22:307.140 2019⁃11⁃20三晴CBA常规赛/季后赛凯迪拉克中心21:35 22:157.742 2019⁃11⁃28四晴CBA常规赛/季后赛凯迪拉克中心21:30 21:555.348 2019⁃12⁃10二雾转晴CBA常规赛/季后赛凯迪拉克中心21:45 22:107.825 2019⁃12⁃17二晴CBA常规赛/季后赛凯迪拉克中心21:45 22:155.050 2019⁃12⁃20五晴CBA常规赛/季后赛凯迪拉克中心21:40 22:255.119 2019⁃12⁃25三多云CBA常规赛/季后赛凯迪拉克中心21:50 22:409.416 2020⁃01⁃02四多云CBA常规赛/季后赛凯迪拉克中心21:30 21:555.010 2020⁃01⁃17五阴转晴CBA常规赛/季后赛凯迪拉克中心22:00 22:256.153 2020⁃01⁃19多云转晴天CBA常规赛/季后赛凯迪拉克中心21:45 22:106.497 2019⁃11⁃01多云转小雨CBA常规赛/季后赛凯迪拉克中心21:15 22:255.3661.3 影响因素分析计划性大型活动结束后观众进站客流量受多种因素影响,如活动类型㊁活动规模㊁天气状况㊁场馆离车站的距离㊁场馆位置㊁日期类型等因素,这些因素都会对大型活动当天结束后观众进站量产生影响.1)活动类型:大型赛事㊁演唱会.其中大型赛事有足球赛㊁篮球赛等多种类型,各类型的活动所吸引的观众数量是有差异的.演唱会的规模人数也因为不同歌手所拥有的粉丝数量有所差异,故将活动类型作为特征指标纳入因素集.2)活动规模:当北京有计划性大型活动时,北京交通委会提前告知指挥中心演出规模人数,以做好大型活动的交通相关保障工作.不同的规模人数对活动散场的进站量产生直接影响,即活动规模与活动散场地铁车站进站量呈正相关.3)场馆位置:不同场馆所容纳的观众人数不同,国家体育场(鸟巢),建筑面积25.8万m2,可容纳观众9.1万人.北京凯迪拉克中心(原名五棵松体育馆)毗邻五棵松地铁站,建筑面积6.3万m2,可容纳观众1.8万人.北京工人体育馆位于朝阳区三里屯工人体育场北路能容纳1.5万名观众.不同的场馆位置,意味着不同的活动规模.因而场馆位置和规模也是影响活动散场地铁车站进站量的1个关键因素.4)馆站距离:当场馆周边受影响站点为多个站点时,因不同站点距离场馆的距离有差异,可发现不同车站在散场期间的进站客流特征有较大差别.虽然在本文中主要以五棵松站作为实验案例,但是在考虑更为通用的模型架构时,将馆站距离作为其中影响客流的重要因素.5)天气状况:不同的天气对室外活动的开展有明显影响,当天气晴朗,人们出行的意愿强烈,客流明显增多;但当出现雨天,并且天气状况越差,客流减少越明显.虽然对于预约购票的计划性大型活421 第3期牛燕斌,等:计划性大型活动散场期间地铁OD客流量预测方法动,天气的变化对于参加活动的人数影响不大,但是当出现恶劣天气时,人们的出行欲望明显会降低,地铁客流会减少.因而天气也是在本研究中考虑的重要因素.日期类型:人们通常会选择在双休日和节假日参加大型活动来娱乐放松,因而会出现地铁客流大幅增长.而在工作日参加活动的人数会减少,因而日期类型也是在本模型中考虑的重要因素.2 活动期间客流规律分析2.1 散场进站量5min粒度下呈正态分布从凯迪拉克中心举办的大型活动当天的五棵松出站量和进站量分析发现,5min粒度分布有如下规律:散场客流量较小的情况下呈现近似正态分布;散场客流量较大的情况下,可能受到车站进站能力㊁图2 大型活动举办当日的进站量和出站量分布限流措施的限制,进站客流量峰值在1个数值左右徘徊,呈现出多峰值的情况.2.2 散场期间进站量突增在进站研究时段内,通过计算得到各日期对应时间段内进站客流总量的变化情况,具体见表1.表1中的倍数指的是活动举办日进站量是对应时间段内平日出站量的倍数,其中绝大部分日期其进站客流变化的系数区间为[4.194,10.290],即活动举办日进站量是对应时间段内平日出站量的4.19~10.29倍.但2019⁃09⁃02其进站量是对应时间段内平日出站量的55.06倍,其进站客流的突变程度更剧烈,这可能是由于当日活动为男篮世界杯赛事,活动等级高且活动持续时间较长.相比于出站客流,进站客流的增加速率快且进站持续时间短,即短时间内的进站客流会达到高峰,并保持短时间高爆发的状态,这表明进站客流有瞬时㊁数量大的特点,需要考虑车站容量㊁当前运能是否能满足客流需求.因此,大型活动散场进站客流是本文研究的重点.3 数据预处理3.1 影响因素标准化在预测中需要对影响因素(站点㊁日期类型㊁天气类型)标准化处理,以表1为标准化处理规则.3.2 预估活动规模人数由于在实验中缺乏大型活动筹办方预计的活动规模人数,遂在实验过程中考虑寻找其他可替代预估活动规模人数的数据.表4分析了活动前2h场馆附近地铁车站的出站量A㊁常规时间段出站总量以及活动散场期间地铁车站的进站量C之间的关系.另外,活动散场期间地铁车站的进站量C与活动规模人数成正相关521交 通 工 程2023年表2 影响因素标准化规则参数标准化站点五棵松=0,团结湖=1,东大桥=2日期类型工作日=0,节假日㊁双休日=1天气类型晴天=0,多云=1,小雨=2,中雨=3,大雨=4,阵雨=5,雷阵雨=6,暴雨=7,雾=8,霾=9,台风=10,暴风雨=11,小雪=12,中雪=13关系.从表4可分析得出,A-B≈C.因此在本研究中使用活动前2h内的出站总量A减去常规时间段出站总量B来预估活动规模人数.表3 活动规模人数分析人次日期星期活动前2h内的出站总量A常规出站量B活动散场期间地铁车站的进站量C预估活动规模A-B2019⁃01⁃16三9620805914931561 2019⁃01⁃18五11213805931503154 2019⁃01⁃29二877880591154719 2019⁃01⁃31四775880591764-301 2019⁃03⁃05二10389805913162330 2019⁃03⁃13三10266805914132207 2019⁃11⁃01五13110805960805051 2019⁃11⁃06三13195805935095136 2019⁃11⁃08五14411805942986352 2019⁃11⁃20三14619805951026560 2019⁃11⁃28四10467805920912408 2019⁃12⁃10二10712805929112654 2019⁃12⁃17二11046805925202987 2019⁃12⁃20五13078805937985019 2019⁃12⁃25三163968059613983373.3 场馆距车站距离馆站距离以高德地图上显示的距离为准/km. 4 大型活动散场地铁客流预测方法4.1 随机森林随机森林(Random Forest,RF)[10]属于集成学习,其核心思想是bagging,主要基于自主采样法(Bootstap sampling).随机森林可实现回归和分类2种任务.其中分类任务是对离散值的预测,回归任务是对连续值的预测,本论文中使用的是随机森林回归算法.简单地说,随机森林由决策树[11]构成,每棵树会对应1个分类或回归结果,对于分类问题,看结果多的那类就是分类结果,对于回归问题,取回归结果的算术平均值.输入:样本集D={(x1,y1),(x2,y2), ,(x m, y m)},特征数目为N,弱分类器迭代次数为T.输出:最终的强分类器为f(x)步骤:对于t=1,2, ,T:1)对训练集进行t次有放回的随机采样,共采集m次,得到包含m个样本的采样集D t.2)用采样集D t训练第t个弱分类器G t(x),在训练决策树模型的节点时,在节点上所有的样本特征中随机选择一部分样本特征n(其中n≪N),在这些随机选择的部分样本特征中选择1个最优的特征来做决策树的左右子树划分.3)对于分类问题,则对于1个输入样本,T棵树会有T个分类结果.而随机森林集成了所有的分621 第3期牛燕斌,等:计划性大型活动散场期间地铁OD 客流量预测方法类投票结果,将投票次数最多的类别指定为最终的输出,这就是1种最简单的Bagging 思想.4)对于回归问题,T 个弱学习器得到的回归结果的算术平均值为最终的模型输出.4.2 客流预测框架以O 点车站㊁日期类型(工作日设为1,周末设为2)㊁活动类型(体育赛事设为1,演唱会设为2)㊁天气(类型如下表所示)㊁活动开始前出站量㊁场馆距车站距离6个特征变量为影响因素.采用随机森林算法训练模型,利用基于历史数据训练好的模型实现目标日OD 预测的结果输出.客流预测框架如图3所示.图3 基于随机森林的客流预测架构图5 实例验证以五棵松地铁站为例,选取北京市2019年全年在凯迪拉克中心举办大型活动的AFC 刷卡数据㊁大型活动数据以及其他影响因素数据作为数据集,进行模型训练.本文使用Python 编程语言进行模型训练,并使用scikit⁃learn 中的算法工具进行模型参数调优工作.使用随机森林算法模型对北京市2020⁃01⁃02凯迪拉克中心举办大型活动散场期间的OD 客流量进行预测,统计分析全网385个车站OD 量预测结果的平均绝对误差(MAE)㊁平均相对误差(MRE)情况.同时使用SVM 和XGBoost 算法进行对比,实验结果如表4所示.表4 不同算法的预测结果对比OD 客流量样本数量SVMXGBoost随机森林MAE MRE /%MAE MRE /%MAE MRE /%y >10011714.791512.9754.2050<y ≤10011314.51910.0333.3440<y ≤500//////30<y ≤4031547.14412.04310.3520<y ≤3021979.79730.04728.9910<y ≤20381066.62534.65531.040<y ≤102274133.59274.66268.68y =011310.0010.0000.00MAE(X ,y )=1m ∑mi =1|^y l -y i |(1)MRE(X ,y )=1m∑mi =1|^yl -y i |y i(2)式中,X 为特征数据集;y 为OD 客流量,指在大型活动结束后散场时段内场馆附近的车站为O ,其他车站为D 的1对OD 客流数据;^yl 为预测结果;y i 为实际OD 客流量;m 为样本数量,指位于设定721交 通 工 程2023年区间内的OD对的数量.比如表4第1行,意思是从五棵松站进站从其他站出站的OD客流量大于100人次的只有一个站.从表4可分析得出,不管OD客流量在什么量级下,随机森林的预测效果都最好.6摇结束语本文以解决计划性大型活动散场期间地铁客流激增的安全问题为导向,分析了客流规律以及影响因素,以随机森林算法为预测框架,对计划性大型活动散场期间场馆附近车站的OD量进行短时预测.本文的主要研究结果有以下几点:1)本文对大型活动散场期间的客流规律进行了较为全面的数据分析,定性地分析了影响大型活动客流的六大因素,并对影响因素进行标准化.2)提出了基于随机森林的客流预测架构,以6个影响因素为基础特征进行预测.该预测框架具有可扩展性和泛化性.在实际问题中,客流会受到不同因素的影响,可对不同因素进行标准化特征,纳入该预测框架,进行预测.3)在实验验证阶段,对本文提出的随机森林预测模型与SVM和XGBoost等常用模型进行了对比,验证了基于随机森林模型的准确性,实验结果证明了基于随机森林的预测模型架构对于大型活动散场客流具有更好的预测效果.4)本文针对实际的北京指挥中心客流预测需要,预测粒度细化到5min粒度的OD客流量.参考文献:[1]梁强升.大型活动期间地铁车站客流预测方法研究[J].城市轨道交通研究,2021,24(10):196⁃199.[2]杨静,代盛旭,张红亮,等.大型活动散场期间地铁车站短时进站客流预测[J].科学技术与工程,2021,21(5): 2042⁃2048.[3]钱慧敏,徐海辉,翁剑成,等.基于AFC数据的体育赛事周边轨道站点短时客流预测[J].交通工程,2020, 20(6):30⁃36.[4]付宇,翁剑成,钱慧敏,等.基于XGBoost算法的大型活动期间轨道进出站量预测[J].武汉理工大学学报(交通科学与工程版),2020,44(5):832⁃836. [5]郑云霄.大型活动下城市轨道交通进出站客流短时预测研究[D].北京:北京交通大学,2019. [6]Glisovic N,Milenkovic M,Bojovic N,et al.A hybrid model for forecasting the volume of passenger flows on Serbian railways[J].Oper Res Int J,2016,16:271⁃285. [7]杨军,侯忠生.一种基于灰色马尔科夫的大客流实时预测模型[J].北京交通大学学报,2013,37(2):119⁃123,128.[8]Wei Y,Chen MC.Forecasting the short⁃term metro passenger flow with empirical mode decomposition and neural networks[J].Transportation Research Part C, 2012,21:148⁃162.[9]Liu DQ,Wu Z,Sun SR.Study on Subway passenger flow prediction based on deep recurrent neural network[J]. Multimedia Tools and Applications.(https:∥/ 10.1007/s11042⁃020⁃09088⁃x).[10]周志华.机器学习[M].北京:清华大学出版社,2016:178⁃181.[11]李航.统计学习方法[M].北京:清华大学出版社,2012:55⁃75.821。
北京城市轨道交通清分方法及结果应用

北京城市轨道交通清分方法及结果应用杜世敏;赵路敏【摘要】基于北京城市轨道交通多运营主体的特点,在大量理论研究、国内外调研和客流调查的基础上,通过简单的实例,描述了城市轨道交通客流及票款清分的基本流程,并对清分系统的输出结果及其应用方向进行了探讨.实践证明:清分方法不仅实现了运营主体和线路间客流、票款的清分清算,而且清分系统输出的数据结果相比传统调查数据,更加精确、可靠、全面.该清分方法在城市轨道交通运营信息统计分析、乘客出行诱导、运输能力评估及突发事件处置协调等多方面起到了重要的作用,为企业运营管理和政府相关部门决策提供了依据.【期刊名称】《城市轨道交通研究》【年(卷),期】2014(017)002【总页数】5页(P106-110)【关键词】城市轨道交通;网络化;清分方法;结果应用【作者】杜世敏;赵路敏【作者单位】北京市基础设施投资有限公司,100101,北京;北京市基础设施投资有限公司,100101,北京【正文语种】中文【中图分类】F530.7First-author’saddress Beijing Infrastructure InvestmentCo.,Ltd.,100101,Beijing,China随着城市轨道交通建设步伐的加快,北京的轨道交通运营管理已步入了多运营主体的网络化运营时代。
目前,北京已有14条运营线路,运营里程336 km,运营车站196座,换乘站21座。
其中地铁4号线和大兴线由北京京港地铁公司运营管理,其它线路由北京市地铁运营有限公司经营管理。
如此庞大的城市轨道交通网络,使得乘客出行的可达性和路径选择多样性大大增加。
虽然自动售检票(AFC)系统可以准确获取乘客进出的车站、时间及票种信息,但在一票无障碍的换乘模式下,系统难以准确获取起终点(OD)车站间乘客出行的路径和换乘的具体信息。
为了解决票款收入在运营主体间的合理分配问题,掌握客流在路网上的时空分布情况,非常有必要建立城市轨道交通网络的清分方法,同时为运营信息统计分析、乘客出行诱导、运输能力评估及突发事件处置协调等多业务提供技术支撑。
基于交通大数据的公交线路OD矩阵推断方法

基于交通大数据的公交线路OD矩阵推断方法胡继华;高立晓;梁嘉贤【摘要】With the popularity and broaden application of traffic big data,a method to infer the route OD matrix in multi-modal transit network is proposed.Firstly,the boarding stations of the passengers can be obtained by matching the IC card data with bus stop data recorded in the process of bus running.Then,the destination of the passengers can be analyzed combined with subway data.Finally,the route OD matrix are obtained according to the passengers' travel information.The method was implemented to infer the boarding station,alighting station and the route OD matrix used eight million IC card data records and six million bus stop data records collected in Guangzhou,China.The results show that the travel rule in the day is in line with that in morning peak period;the modes of transportation are diversified in Guangzhou etc.The public transit route OD matrix of whole city can be obtained accurately and the urban traffic characteristics can be revealed by this method.The proposed method has high practical value.%随着交通大数据的普及与广泛应用,提出了一种推断多模式交通网络线路OD矩阵的方法.首先,通过匹配乘客的刷卡数据和公交车辆报站数据获得乘客的上车站点,其次结合地铁刷卡数据准确分析乘客的下车站点,最后根据乘客的出行信息获得线路OD矩阵.利用广州一天近800万刷卡数据和600万公交报站数据进行了上车站点、下车站点以及OD矩阵的推断,结果表明:早高峰与全日出行规律一致;广州交通方式呈现多样化等.提出的方法可以更为准确地获得线路OD 矩阵,揭示城市交通特点,具有较高的实用价值.【期刊名称】《科学技术与工程》【年(卷),期】2017(017)011【总页数】6页(P309-314)【关键词】智能交通;线路OD矩阵;出行链;交通大数据;多模式交通网络【作者】胡继华;高立晓;梁嘉贤【作者单位】中山大学智能交通研究中心,广州510006;广东省智能交通系统重点实验室,广州510006【正文语种】中文【中图分类】U491.1OD是指人们出行的起点和终点。
2-3 起讫点(OD)调查分析

❖基本概念
城公市路居交民通出OD行分O布D调
❖ OD调查项目
流车动辆人运口载出特行性OD调 查交通量特征
❖ OD的抽样率及抽样方法 机载动运车货出物行种O类D调查
❖ OD调查的步骤
货物出行OD调查
❖ 城市交通OD调查
❖ 区域公路OD调查
❖ OD调查的资料整理与分析
2、区域公路网规划OD调查项目
❖ 交通枢纽客、货流OD调查----对境界线内或境界线 外但对规划区域道路运输有较大影响的铁路站(场)、 水运码头、民航机场等交通运输枢纽运送的旅客、货 物使用相应运输方式的出行OD调查。
❖ 机动车出行OD调查----对境界线内道路的机动车 出行OD进行的调查,是区域公路交通规划OD调 查的主要内容。
1
2
1
t11
t12
2
t21
t22
3
t31
t32
…
…
…
n
tn1
tn2
Aj tij i
A1
A2
2
3
∑
30
20
60
40
50
124
54
26
98
124
96
282
3
…
n Pi tij
j
t11
…
t1n
P1
t23
…
t2n
P2
t33
…
t3n
P3
…
…
…
…
tn3
…
tnn
Pn
A3
…
An T Pi Aj
总体估计值容易计算。 ❖ 例如,如果你把一本电话本作为抽样框,必须随意取出一
城市公交乘客OD并行推算与客流时空分析
城市公交乘客OD并行推算与客流时空分析城市公交乘客OD并行推算与客流时空分析摘要:随着城市化进程的不断加快,城市规模不断扩大,城市内部交通需求不断增加,城市公交系统成为人们出行的重要方式。
而城市公交的运行效率与可持续性取决于乘客OD(Origin-Destination)推算和客流时空分析的准确性和及时性。
针对目前乘客OD推算和客流时空分析存在的问题和挑战,本文提出了一种基于并行计算的公交乘客OD推算和客流时空分析方法。
具体地,本文通过基于SPSS模型的公交GPS数据预处理和处理,并行计算平台的建立和优化,提出了一种高效准确的公交乘客OD并行推算方法。
同时,本文还利用地理信息系统(GIS)与统计分析方法,对公交客流进行时空分析,使得城市公交系统的可持续性得到保障。
最后,针对本文中提出的方法进行了实例分析和对比验证,并分析了该方法的优势和不足。
关键词:城市公交、乘客OD推算、客流时空分析、并行计算、GIS引言城市公交作为城市交通系统中的重要组成部分,承担着城市内部人员出行的重要任务。
随着城市化的加速和城市规模的不断扩大,城市公交系统的运营效率和可持续性成为很多城市管理者和交通学者的重点研究对象。
从传统的城市公交系统到智能化公交系统,乘客OD推算和客流时空分析一直是研究的热点问题。
目前,传统的公交乘客OD推算以及客流时空分析方法存在的问题和瓶颈主要有以下几个方面:1)精度不足:传统的乘客OD推算方法往往需要大量的调查和统计工作,所以容易出现精度不足的情况;而客流时空分析也面临着数据的获取难度和不准确性的问题。
2)时效性差:传统的公交乘客OD推算一般需要耗费较长的时间,导致时效性差;而客流时空分析也需要花费大量时间和精力。
3)缺乏可视化和交互性:传统的公交乘客OD推算方法和客流时空分析方法缺乏可视化和交互性,无法直观表达和呈现城市公交客流数据。
针对上述问题和挑战,本文提出了一种基于并行计算的公交乘客OD推算和客流时空分析方法,以提高公交系统的运行效率和可持续性。
城市轨道交通短期客流OD预测模型研究与实现
专栏·安全与视频城市轨道交通短期客流OD 预测模型研究与实现张宇1,孙琦2,高彦宇2(1.北京市基础设施投资有限公司,北京100101;2.北京轨道交通路网管理有限公司大数据中心,北京100101)摘要:轨道交通短期客流预测在保障运营安全、制定科学的客运计划和组织方案、提高效率等方面具有重要意义。
目前我国对精细化短期客流预测,特别是OD 级预测的研究不多,尚未见成熟的预测方法或大型信息系统报告。
通过自下而上的研究方式,从路网客流构成单位OD 入手,根据轨道交通AFC (自动售检票系统)历史数据,分析轨道交通路网客流OD 时空分布规律与动态变化特征,并应用机器学习方法,建立基于OD 分布规律与特征映射的路网客流OD 精细化预测模型。
从近3个月(2019年10月—2020年1月)的预测结果分析显示,该模型在精细化短期客流预测方面效果显著。
关键词:城市轨道;短期OD 客流预测;AF 聚类;决策树;重点去向车站中图分类号:U231.92文献标识码:A 文章编号:1001-683X (2021)08-0133-08DOI :10.19549/j.issn.1001-683x.2021.08.1330引言近年来,北京城市轨道交通规模发展十分迅猛。
截至2019年底,北京轨道交通路网运营里程达到699.3km ,运营线路23条,运营车站共计405座,最高年度日均客流达1086万人次。
随着轨道交通网络的日益完善和客流不断增加,客流过度饱和现象时有发生,尤其是部分区段工作日早晚高峰时段拥堵严重,给运营安全带来巨大隐患[1]。
虽然利用视频监控自动监测和预警地铁客流密度的技术[2-3]在检测实时客流拥挤度方面取得了一定成效,但在准确度、精细化方面仍需要提升。
轨道交通路网精细化、全面的短期客流预测,对于客流聚集风险识别,有针对性地制定科学的客运计划和组织方案,降低运营风险,保障轨道交通运营安全,提高运营效率、降低运营成本更具有实际意义。
北京地铁交通枢纽行人特征的调查与分析
参考内容
本次演示通过对北京南站行人的特征参数进行调查,旨在了解行人的行为习 性和交通方式选择,为改善车站交通环境和提升行人出行体验提供参考。
一、行人特征参数调查
本次调查选择在北京南站进行,通过现场观察和计数的方式,收集行人的特 征参数。调查时间为2023年3月的每周一至周五,每天上午8:00至下午6:00。调 查对象为进出北京南站的行人,包括但不限于乘客、接送人员和工作人员。
感谢观看
1、确定评价因素:根据地铁车站的实际情况,确定人、设备、环境和管理 等四个方面的安全风险因素。
2、建立FTABN模型:依据各风险因素之间的相似关系,构建模糊相似关系矩 阵。然后利用拓扑学原理对矩阵进行层次化处理,形成FTABN模型。
3、风险评估:根据FTABN模型,对每个风险因素进行量化评估,确定其对地 铁车站安全的影响程度。
4、制定风险应对措施:根据风险评估结果,制定相应的风险应对措施,包 括人员培训、设备维护、环境改善和管理优化等。
四、实例分析
以某市综合交通枢纽中的地铁车站为例,运用FTABN对其安全风险进行评价。 通过收集数据、构建FTABN模型、风险评估和制定应对措施等步骤,得出该地铁 车站的安全风险等级为中等,并针对主要风险因素提出了相应的应对措施。
二、行人特征参数分析
根据调查数据,我们得出以下关于北京南站行人的特征分析:
1、人群构成:调查显示,北京南站行人多为学生、上班族和老年人。其中, 学生和上班族多为利用高铁通勤的乘客,老年人则多为来往于医院、公园等地的 出行者。
2、交通方式:在调查期间,行人主要以步行为主,约占60%。此外,地铁也 是重要的交通方式,约占25%,而公交车的比例相对较低,约占10%。值得注意的 是,有部分行人选择骑行共享单车或私家车前往车站,这可能与车站周边交通拥 堵有关。
一种基于od聚类的城市轨道交通客流廊道识别方法及其应用
一种基于od聚类的城市轨道交通客流廊道识别方法及其应用一种基于OD聚类的城市轨道交通客流廊道识别方法及其应用随着城市化进程的加快,城市轨道交通作为一种高效、便捷的交通方式,越来越受到人们的青睐。
然而,随着城市轨道交通的发展,客流量的增加也给城市交通管理带来了挑战。
为了更好地进行交通规划和运营管理,需要对城市轨道交通的客流进行准确的识别和分析。
在城市轨道交通系统中,OD(Origin-Destination)表示乘客的起点和终点,OD聚类是一种常用的客流分析方法。
通过对乘客的OD数据进行聚类分析,可以将乘客分为不同的群体,并根据不同群体的特征进行廊道识别。
廊道识别是指根据乘客的出行特征和需求,确定城市轨道交通中的主要客流廊道,从而优化线路规划和运营组织。
基于OD聚类的城市轨道交通客流廊道识别方法主要包括以下几个步骤:1. 数据采集:通过城市轨道交通系统的票务系统或智能卡系统等手段,获取乘客的OD数据。
这些数据包括乘客的起点、终点、出行时间等信息。
2. 数据预处理:对采集到的OD数据进行预处理,包括数据清洗、去除异常值等。
确保数据的准确性和完整性。
3. OD聚类:利用聚类算法对预处理后的OD数据进行聚类分析。
常用的聚类算法包括K-means算法、DBSCAN算法等。
通过聚类分析,可以将乘客划分为不同的群体。
4. 廊道识别:根据不同群体的特征进行廊道识别。
可以根据群体的OD分布、出行目的地集中度、出行时间等特征,确定主要的客流廊道。
5. 应用与优化:根据廊道识别结果,进行线路规划和运营组织优化。
可以合理安排车辆调度、优化站点设置等,提高城市轨道交通系统的运营效率和服务质量。
基于OD聚类的城市轨道交通客流廊道识别方法具有以下优势:1. 准确性:通过对乘客的OD数据进行聚类分析,可以更准确地划分出不同群体,并确定主要的客流廊道。
2. 高效性:采用聚类算法进行数据分析,可以快速处理大量的OD数据,并得出廊道识别结果。