用出租车GPS数据分析深圳道路交通情况
深圳市城市道路汽车行驶工况调查分析

深圳市城市道路汽车行驶工况调查分析刘跃明;高谋荣;李占玉【摘要】通过对深圳城市道路交通流量以及道路状况的调查分析,对道路状况进行了分类,采用GPS定位技术,实时记录了深圳市实际道路状况下汽车行驶的运行状况.通过对从GPS监测平台获取的大量速度数据的归纳分析,合成了深圳市道路的综合行驶工况,并与标准测试工况、主要城市工况进行了对比分析,指出了深圳城市道路汽车运行的特点.【期刊名称】《深圳职业技术学院学报》【年(卷),期】2010(009)001【总页数】4页(P40-43)【关键词】行驶工况;数据分析;测试轿车;GPS监测系统【作者】刘跃明;高谋荣;李占玉【作者单位】深圳职业技术学院汽车与交通学院,广东深圳518055;深圳职业技术学院汽车与交通学院,广东深圳518055;深圳职业技术学院汽车与交通学院,广东深圳518055【正文语种】中文【中图分类】U491随着深圳经济特区持续发展,汽车数量迅猛增长,交通拥挤、环境污染的问题进一步加重.汽车排放污染已经成为影响环境质量的重要污染源,国家对此加大了控制力度,制定出更严格的排放标准.深圳已经于2007年7月1日起执行国家第三阶段机动车污染物排放标准.但是我国目前使用的机动车排放标准是以欧洲标准工况EUE+EUDC为基础的,该工况与我国具体城市的实际道路汽车运行状况存在着较大差别,另外,各城市汽车运行工况之间的差别也很大,使用统一的测试标准难以真实地反映不同城市在用车的污染物排放量,很难建立起适合各城市具体情况的在用车辆“检测与维护”(I/M)体系.因此,调查分析本地区的汽车行驶工况,对道路交通管理、改善尾气排放的时空分布和制定出更为科学的控制对策有着十分重要的意义.1 数据采集与处理1.1 试验测试系统汽车行驶工况测试系统主要是利用车载GPS信号接收仪与GPS监控中心记录仪,实时记录瞬时速度.该测试系统是目前运营稳定、拥有大量用户的GPS监控系统,系统经过长期大量的商业运行,大量的监控数据表明记录瞬时速度准确度较高,能够很好的完成测试轿车行驶工况的测试.具体测试仪器及设备为:1)试验用车:大众捷达;2)汽车速度测试系统:汽车行驶速度的测取是研究行驶工况的基本数据,利用汽车上安置的GPS定位信号接收机(车载终端)及监控中心设备,实时记录测试车辆的瞬时速度以及行驶轨迹.该GPS监控系统采用深圳华强GPS监控系统,车载终端为GPRS-V36.1.2 路段选择道路调查是进行行驶工况的基础,其目的是从多条道路中筛选出有代表性的试验路线,能反映车辆在道路上的时间和空间规律,其结果能够以少量试验获得代表全局特征的统计结果.通过对建成区道路网的分析,选定了进行行驶工况测试的路线.汽车行驶工况主要受道路等级(快速路、主干道、次干道及支路,以及车道数、机非混合等)、交通强度(交通流量、饱和量)以及时间等因素的影响.通过实际调查、收集城市区域一个周期内交通流量的相关数据,进行了统计分析,确定了试验路线.所选定的试验路线见表1.测试时间为上午8:30~11:00,下午4:30~7:30,该时间段是交通流量高峰期,车量对道路的交通压力、排放污染最为严重.测试过程中,按规定的路段随机跟踪车辆,GPS仪器设置每隔2s自动记录一次数据,并利用IntellGIS软件进行数据回放,将数据导出到Excell表中.在测试过程中,被测轻型车按正常驾驶方式行驶,随车队自然行驶,所测的数据能真实反映城市道路交通及车辆行驶工况.表1 深圳市典型试验道路调查统计表序号道路分类道路名称辆/h交通流量北环大道 4519 1 城区快速道滨河大道 3651深南大道 3245龙珠大道 1537 2 城区主干道南油大道 1765沙河西路 1695笋岗西路 1749 3 城市次干道红荔路 1487 4 城市支路南新路 997侨香路 1213东门中路 12151.3 测量数据转换处理将GPS信号接收仪测量记录的数据按照一定的要求全部转到Excell表格中,再使用IntellGIS地理信息系统对Excell表中的内容进行回放,可以确定所需路段的行驶工况的参数:起始时刻、结束时刻、速度,最后进行数据的后期处理.2 行驶工况分析一个完整的行驶周期是指在速度、时间变化曲线上,以怠速模式开始,又以怠速模式结束的任何一段时间.在对每个区间的速度数据进行行驶工况的判断时,需作以下设定:怠速工况是指发动机在工作但车速等于零的状态;加速工况是指汽车第n+1秒速度与第n秒速度之差大于+0.1 m/s2;减速工况是指汽车第n+1秒速度与第n秒速度之差小于-0.1 m/s2;匀速工况是指汽车第n+1秒速度与第n秒速度之差介于±0.1 m/s2之间[1].各路段行驶工况的特征参数值,主要包括:加速时间比例、减速时间比例、匀速时间比例、怠速时间比例、平均速度(行程速度)、行驶速度(不包括怠速模式)、最高速度等.2.1 深圳市城区综合道行驶工况根据测试数据得出综合工况图、运行速度分布图、加减速时间分布图,见图1~3. 对深圳综合工况下汽车运行状况的测试表明(见图1),汽车运行测试期间,加减速频繁、怠速频繁,而匀速所占比例较小,平均车速较小,汽车运行效率明显偏低. 由图2可以看出,深圳市内汽车运行速度主要在20~60 km/h区间,且怠速占比较大,这与平交路口较多、车辆拥挤等因素有关.图1 汽车行驶综合工况图图2 测试期间不同运行速度占比由图3可以看出,汽车行驶过程中,加速、减速、怠速工况占比较大,在汽车的测试期间,加速运行时间站总运行时间的32.30%,减速运行时间占29.15%,怠速时间占20.15%,结合深圳市内道路状况来看,加减速比较频繁也反映出道路状况较好、车流量较大的特点.2.2 国内典型城市行驶工况对比国内典型城市行驶工况对比[2、3、4]见表2.从表2可以看出,由于国内城市交通中混合交通流较为严重,普遍存在较高的加、减速时间比率和较低的匀速时间比例,并且彼此较为相近,反映出了国内城市道路汽车行驶工况的一般规律和特点.图3 测试车辆加减速时间分布图深圳市内汽车行驶加减速频率较高,平均速度较高,匀速较少,怠速运行工况占比较高,这一方面反映出深圳的道路状况较好,汽车能以较高速度运行,另一方面,由于交通流量较大,平交路口较多,因此频繁的加减速的占比比其它城市较为突出.2.3 与典型国家地区行驶工况对比表3列出了深圳综合工况与美国和欧洲标准工况的行驶特征.表2 国内典型城市行驶工况对比特征参数道路加速时间(%)减速时间(%)匀速时间(%)怠速时间(%)平均速度(km/h)深圳市 32.30 29.15 18.4020.15 32.39北京市 25.29 30.85 27.34 16.52 19.98上海市 22.83 23.28 22.28 31.61 14.96南京市 30.26 28.19 23.00 18.55 26.4广州市 29.11 27.16 25.95 17.77 14.14香港 31.11 29.67 29.33 11.03 15.44表3 深圳城市综合道路工况及标准工况行使特征工况名称测试时间(s)平均速度(km/h)平均加速度(m/s2)平均减速度(m/s2)加速比例(%)减速比例(%)匀速比例(%)怠速比例(%)美国FTP75 1372 31.5 0.561-0.671 35.57 29.52 15.89 19.02欧洲ECE+EUDC 1185 33.2 0.483-0.671 26.58 18.90 29.37 25.12深圳综合道路 5110 32.39 0.37-0.40 32.30 29.15 18.40 20.15从表3中数据可以看出,实际测试的深圳综合工况下,汽车行驶特征与发达国家相比,大多数特征值基本一致,深圳综合道路的加减速比例与美国FTP75基本一致,略大于欧洲ECE+EUDC值,匀速比例明显大于欧洲ECE+EUDC值,这与深圳道路平交路口较多、汽车拥挤有关,尤其在平交路口拥挤更为严重,3 结论1)利用GPS测速系统测量汽车瞬时行驶速度,并通过大量采集数据的处理分析,分别建立起了深圳市实际道路的综合行驶工况,与国内相近城市比较,具有普遍存在的较高加、减速时间比率和较低的匀速时间比例,并且彼此较为相近.调查与资料反映出我国主要城市道路汽车行驶工况具有的普遍规律.2)GPS测速具有实时、快速、准确、不受道路因素干扰等优点,利用GPS技术测试汽车行驶工况,非常便捷和准确.3)汽车行驶工况是影响汽车污染物排放的重要因素,合成的工况较真实的反映了汽车在城市道路运行的状况,也反映出汽车怠速工况占比较大,在此工况下汽车污染物排放量尤为严重.因此改善汽车行驶工况,提高汽车行驶速度,避免频繁的加、减速,减少汽车交叉口的等候时间,缩小怠速时间比例可以大幅度降低汽车污染物排放.参考文献:[1] 訾琨,黄永青,涂先库,等.宁波市区汽车行驶工况和污染物排放调查研究[J].内燃机工程,2006,27(1):81-84.[2] 赵慧,张镇顺.香港城区汽车行驶工况的研究[J].环境科学学报,2000,20(3):312-315.[3] 周泽兴,袁盈,刘希玲,等.北京市汽车行驶工况和污染物排放系数调查研究[J].环境科学学报,2000,20(1):48-53.[4] 陈旭东,钱裕尧,焦庆宏,等.南京市轻型车行驶工况排放的分析研究[J].轻型汽车技术,2003(8):4-10.。
出租车载GPS轨迹数据挖掘与分析

出租车载GPS轨迹数据挖掘与分析一、引言GPS轨迹数据是由出租车上的GPS设备记录下的车辆位置、时间和速度等信息。
这种数据是实时生成的,包含大量的时间序列信息,具有重要的研究和应用价值。
本文将针对出租车载GPS轨迹数据展开挖掘与分析,探讨其应用于出行规划、交通流量预测等方面的潜力。
二、数据预处理由于GPS设备录制的数据存在定位偏差、缺失、误差等问题,需要对数据进行预处理。
预处理包括数据去噪、数据对齐、数据清洗等步骤。
1.数据去噪:通过滤波算法去除GPS轨迹中的噪声。
常用的滤波算法有移动平均滤波、中值滤波、卡尔曼滤波等。
2.数据对齐:将不同出租车的数据对齐,以便进行统一的分析。
可以使用时间对齐或地理位置对齐的方法。
3.数据清洗:对轨迹进行剔除异常值和重复数据等处理,确保数据的合理性和准确性。
三、基本统计分析在对GPS轨迹数据进行挖掘和分析之前,首先进行基本的统计分析,对数据的分布、特征进行了解。
1.车辆数量统计:统计不同时间段内出租车的数量变化情况,了解城市交通的高峰时段和低谷时段。
2.车辆行驶距离统计:统计不同车辆在不同时间段内的行驶距离分布,了解车辆的使用情况和行驶习惯。
3.行驶速度统计:统计不同时间段内车辆的平均速度分布,探究城市道路的交通状况和拥堵情况。
四、出行规律挖掘通过对GPS轨迹数据的挖掘和分析,可以发现人们的出行规律,进而为出行规划提供有针对性的建议。
1.出租车热点区域分析:通过聚类算法,发现城市的出行热点区域,为出租车的运营提供参考,优化车辆调度和资源配置。
2.出行时间分析:统计不同时间段内的出行量,了解城市交通的高峰和低谷时段,为交通拥堵预警和出行规划提供依据。
3.轨迹相似性挖掘:通过轨迹相似性算法,找出相似的轨迹,为出行规划提供参考,缩短出行时间和交通拥堵。
五、交通流量预测基于GPS轨迹数据的挖掘和分析,可以预测城市的交通流量,为交通管理和出行规划提供决策支持。
1.交通流量预测模型:建立交通流量预测模型,根据历史数据和实时数据,预测不同时间段和地点的交通流量,为交通信号控制和路线规划提供参考。
东北三省数学建模竞赛历年赛题

东北三省数学建模竞赛历年赛题2006 A:油田开发规划的合理编制问题
B:冬季北方室内空气交换问题
C:中国人口政策问题
2007 A:油田开发规划的合理编制问题
B:冬季北方室内空气交换问题
C:中国人口政策问题
2008 A:滑雪场定价问题
B:居民楼顶最佳保温层厚度
C:灾区物资分配问题
2009 A:运动界面追踪
B:丁克与人口增长
C:客观、合理的评价学生学习状况
2010 A:企业的营销管理问题
B:走遍全中国
C:封闭系统的货币分布问题
2011 A:食品质量安全抽样数据分析
B: 垃圾分类处理与清运方案设计
C:水资源短缺风险评价
D:用出租车GPS数据分析深圳道路交通情况
2012 A:深圳人口与医疗需求预测模型
B:手机用户精准识别
C:绿色机房模型评价与控制
D:打孔机生产效能的提高
2013 A:食品质量安全抽检数据分析
B:深圳关内外交通拥堵探究与治理
C:垃圾减量分类活动中社会及个体因素的量化分析
D:自然灾害保险问题的研究
2014 A:计划生育政策调整对人口数量、结构及其影响的研究B:基因组组装
C:垃圾焚烧厂的经济补偿问题
D:以深圳市为例探讨洪灾损失预测研究的科学性与严谨性2015 A:医保欺诈行为的主动发现
B:DNA序列的k-mer index 问题
C:福田红树林自然保护区湿地生态系统研究
D: 航班延误问题。
交通拥堵状况监测及分析

交通拥堵状况监测及分析
概述
本文档旨在介绍交通拥堵状况的监测和分析方法,以帮助城市规划者和交通管理部门有效应对交通拥堵问题。
交通拥堵监测方法
1. 传感器监测:通过在道路上设置传感器,收集车辆数量、速度和流量等数据,实时监测交通状况。
2. GPS数据分析:利用出租车、公交车等车辆上搭载的GPS 设备,收集位置和速度数据,分析交通拥堵情况。
3. 道路摄像头:通过安装在道路上的摄像头,观察道路车流情况和交通状况,进行交通拥堵监测。
交通拥堵分析方法
1. 数据挖掘:利用历史交通数据,通过数据挖掘技术,找出交通拥堵的规律和原因,以及预测未来可能出现的拥堵点。
2. 网络模拟模型:建立交通网络模拟模型,模拟不同情况下的交通流动,分析拥堵的原因和解决方案。
3. 空间分析:通过地理信息系统(GIS)等技术,对交通流动进行空间分析,找出拥堵点和瓶颈位置。
交通拥堵应对措施
1. 优化交通信号:根据交通拥堵情况,调整交通信号的时序,优化交通流动。
2. 建设交通基础设施:增设道路、修建高架桥等,扩大交通通道,缓解交通拥堵。
3. 提供公共交通工具:鼓励市民使用公共交通工具,减少私家车使用量,降低交通拥堵。
4. 推广交通拥堵信息共享:建立交通拥堵信息共享平台,及时向市民发布交通拥堵情况,引导出行路线选择。
结论
通过监测和分析交通拥堵状况,结合有效的应对措施,可以有效缓解交通拥堵问题,提高城市交通效率。
城市规划者和交通管理部门应加强数据收集和技术应用,以便更好地理解和处理交通拥堵现象。
出租车载GPS数据采集及研究

出租车载GPS数据采集及研究第一章绪论随着交通工具的日益普及,人们对出行的要求也越来越高。
其中有一个关键因素是导航,并且目前最主要的导航方式就是使用全球定位系统(GPS)。
而随着相应技术的提高,越来越多的交通工具采用了车载GPS导航系统。
其中包括出租车行业,出租车行业的GPS数据采集与研究已成为一个热门话题。
本文将从以下几个方面展开讨论:GPS在出租车行业中的使用、出租车载GPS数据采集、GPS数据在出租车行业中的应用以及未来的发展趋势。
第二章 GPS在出租车行业中的使用GPS在出租车行业中的使用体现在两个方面:一是在出租车导航系统中的应用,二是在出租车调度系统中的应用。
在出租车导航系统中,GPS技术可以为司机提供准确的路线指引,帮助司机更好地为乘客服务,节省时间和油耗。
同时,也可以实时跟踪车辆位置,提高调度和运营效率。
在出租车调度系统中,GPS技术可以根据车辆实时位置情况,优化调度方案,使车辆在最短时间内到达目的地。
第三章出租车载GPS数据采集出租车载GPS数据采集主要分为三个方面:GPS信号采集、车辆信息采集和数据存储与管理。
在GPS信号采集方面,可以通过车载GPS导航设备收集车辆位置和速度信息。
同时,也可以通过卫星接收器或移动通信设备实现车载数据的传输。
在车辆信息采集方面,可以采集车辆型号、出租车公司、司机信息等数据。
采集这些信息可以帮助出租车公司和管理部门更好地了解出租车行业的基本情况,并进行一些有效的政策制定。
在数据的存储与管理方面,需要对GPS采集到的数据进行分类和管理。
具体的方法可以将数据进行统一的编码,建立分层的数据结构,实现数据的分类和管理。
第四章 GPS 数据在出租车行业中的应用GPS数据在出租车行业中的应用主要体现在两个方面:出租车行业管理和出租车服务质量的提升。
在出租车行业管理方面,可以通过GPS数据分析实现对出租车的实时监控和调度。
例如,可以通过GPS技术准确地统计车辆行驶时间和里程数,以便出租车公司根据这些数据进行绩效考核。
基于出租车GPS数据聚类分析的交通小区动态划分方法研究

基于出租车GPS数据聚类分析的交通小区动态划分方法研究1. 本文概述你需要明确文章的研究背景和目的。
在这个段落中,你可以简要介绍交通小区的概念以及为什么动态划分交通小区对于城市交通管理和规划至关重要。
接着,你可以提到出租车GPS数据作为一种新兴的数据源,如何为交通小区的动态划分提供了新的视角和可能性。
你应该概述本文的主要研究内容和方法。
可以提及你将使用哪些数据预处理和聚类算法来分析出租车GPS数据,并简述这些方法如何帮助实现交通小区的动态划分。
你可以在概述中提及本文的预期成果和贡献。
例如,你可能期望通过研究提出一种新的交通小区划分方法,这种方法能够更准确地反映城市交通的实际动态,并为交通管理和规划提供更有价值的信息。
随着城市交通系统的日益复杂,有效的交通管理和规划变得尤为重要。
交通小区作为城市交通分析的基本单元,其合理划分对于理解交通流分布、优化交通资源配置具有重要意义。
传统的交通小区划分方法往往依赖于静态数据和经验判断,难以适应城市交通流的动态变化。
近年来,随着出租车GPS数据的广泛应用,我们有机会从新的视角审视交通小区的动态划分问题。
本文旨在探索基于出租车GPS数据的交通小区动态划分方法,以期为城市交通管理提供更为精准的决策支持。
通过收集和预处理城市出租车GPS数据,本文将采用先进的数据挖掘技术和聚类算法,对交通流模式进行深入分析。
研究将重点关注如何从动态数据中提取有意义的交通小区边界,并评估不同划分方法对交通流预测和规划的潜在影响。
最终,本文期望提出一种创新的交通小区动态划分框架,不仅能够提高划分的准确性和实用性,还能够为城市交通研究领域带来新的理论和实践贡献。
2. 相关理论与方法GPS技术简介:全球定位系统(GPS)的工作原理及其在交通领域中的应用。
出租车GPS数据特性:出租车GPS数据的类型、特点,包括其时间戳、经纬度、速度等信息。
聚类分析方法:介绍聚类分析的基本概念、类型(如Kmeans、层次聚类等)及其在数据分析中的应用。
基于GPS数据的出租车出行时空特征分析

基于GPS数据的出租车出行时空特征分析随着GPS技术的发展和普及,大量的出租车GPS数据被采集并存储。
这些GPS数据记录了出租车在城市中行驶的时空轨迹信息,为我们研究出租车出行的时空特征提供了宝贵的资源。
出租车是城市交通体系中重要的组成部分,出行行为的时空特征分析对交通规划、交通管理以及公共出行服务的优化具有重要意义。
通过对GPS数据的分析,可以深入了解出租车出行的时空特征,为城市交通规划和管理提供决策支持。
一、时空特征分析方法1. 数据采集与预处理首先,需要获取大量的出租车GPS数据。
现如今,很多出租车都配备了GPS设备,可以实时地采集车辆的位置信息。
这些数据可以通过无线网络传输到中心服务器,经过预处理后存储起来。
预处理包括数据清洗、数据脱敏等步骤,以保护用户隐私和数据安全。
2. 轨迹提取与分析对于每辆出租车,其GPS数据可以提供一段时间内的轨迹信息。
通过轨迹提取算法,可以将时空轨迹抽取出来,并进行分析。
轨迹提取算法有多种,如基于密度的轨迹提取算法、基于速度变化的轨迹提取算法等。
3. 时空特征的提取与计算基于轨迹数据,可以提取出租车出行的一些重要时空特征。
主要包括:(1)出发地与目的地分布:通过对出租车出发地和目的地的空间分布进行统计分析,可以了解出租车出行的主要热点区域和流向。
(2)出行距离和时间:分析出租车出行的平均出行距离和时间,可以了解出租车行驶的速度和行驶方向,以及交通拥堵情况。
(3)出行时间分布:通过分析出租车在一天中不同时段的出行情况,可以了解出租车出行的高峰时段和低谷时段。
(4)出行模式:通过对出租车出行模式的研究,可以了解出租车的工作规律和服务方式,对交通规划和出租车管理具有指导意义。
二、时空特征分析结果与应用通过对大量的出租车GPS数据进行时空特征分析,可以得到丰富的结果。
这些结果对于城市交通规划和管理具有重要意义。
1. 交通热点区域的发现通过分析出租车出发地和目的地的分布,可以确定城市中的交通热点区域,即出租车出行的重要路径和目的地。
出租车GPS定位数据的时空特征分析

出租车GPS定位数据的时空特征分析出租车是城市交通网络中重要的一部分,它们通常被视为城市有机交通体系的“最后一公里”。
随着GPS技术的发展和成本的下降,越来越多的出租车配备了GPS设备,这些设备可以在出租车上实时记录车辆的位置、速度、方向等信息,并将这些信息上传到后台数据库。
这些GPS定位数据可以为城市交通管理者提供丰富的数据来源,帮助他们了解城市交通流动情况,制定更好的交通规划和管理策略。
因此,对于出租车GPS定位数据的时空特征分析显得非常重要。
一、时空特征概述出租车GPS定位数据的时空特征涉及到时间和空间两个维度。
时间维度指的是出租车在一段时间内的移动情况,可以根据时间周期化分析。
空间维度指的是出租车在城市内部的路网中的行驶情况。
具体而言,出租车GPS定位数据的时空特征包括以下要素:1. 时间特征时间特征主要涉及出租车的行驶速度和行驶方向。
通过对时间特征进行分析,可以更好地理解城市交通流动的时空节律,如赶上高峰期的交通拥堵、市中心的交通压力等。
此外,时间特征还有利于对出租车的行驶轨迹进行优化,提高行驶效率,进一步减轻交通拥堵问题。
2. 空间特征空间特征主要涉及出租车在城市道路网中的行驶轨迹。
出租车行驶轨迹的长度、密度和与路网拓扑结构的匹配程度都是反映城市交通流动情况的重要指标。
通过对空间特征进行分析,可以更好地揭示城市道路网络的拥堵状况,进一步帮助交通管理者优化城市道路网络结构,提高城市交通运行效率。
二、时空分析方法为了更好地揭示出租车GPS定位数据的时空特征,需要采用一些常见的时空分析方法。
下面介绍两种常见的时空分析方法:1. 所在簇分析所在簇分析是一种空间数据分析方法,常用于寻找聚类性质。
在出租车GPS定位数据分析中,所在簇分析的目的是寻找交通拥堵区域。
具体而言,该方法首先将出租车轨迹数据划分为若干“簇”,然后对簇内的数据进行分析,计算每个簇的密度、半径和中心等指标。
最终,根据簇的特性和位置,可以定位出城市交通拥堵区域。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用出租车GPS数据分析深圳道路交通情况摘要一个完整的城市交通系统非常庞大复杂,这种情况使得数学建模交通问题分析求解的困难复杂度提高将完整的城市交通系统按照交通流向路网布局等特性划分为若干交通小区,然后对不同的交通小区进行数学建模,可以有效地降低这种复杂性。
各大城市出租车越来越多的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS实时数据。
原始数据主要保存出租车上装配的GPS终端所采集的数据目前对于交通小区的研究主要集中在应用层次,本文针对交通出行数据的空间分布特征,利用K-Means 空间聚类算法进行交通小区的自动划分,为城市交通系统的管理控制及规划提供技术支持,对交通出行数据进行优化,抽取出租车载客过程中乘客上下车的GPS 位置坐标。
基于聚类与交通小区划分的相似性,采用K- Means 聚类法进行交通小区的划分。
首先,通过聚类得到交通出行OD 矩阵,然后据此划分出交通小区。
基于Google Maps API,搭建了软件平台。
通过试验可以看出,这种动态划分方法得到的区域能够与现有的交通小区相吻合。
这种高实时的交通小区划分方法将对动态的OD 估计有着极大的参考价值。
关键词:GPS;交通小区;K-Means ;空间聚类算法;动态分析;k 均值聚类;边界计算一、 问题重述各大城市出租车越来越多的安装了GPS 终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS 实时数据。
原始数据主要保存出租车上装配的GPS 终端所采集的数据问题一,根据出租车载客的起讫点,结合深圳市的交通地图,恰当的划分交通小区,并选择小区中的某一点,用其经纬数值作为该小区的坐标。
问题二, 根据小区划分和出租车GPS 数据,给出载客出租车的OD 时空分布。
如:某时刻从坐标(,)i j 到(,)i j ''、(,)i j ''''的出租车有多少辆。
问题三, 由此,在合理的假设条件下,能否对人们出行的OD 时空分布进行推断?问题四, 根据出租车载客后的行驶数据,筛选出拥堵的路段时段以及拥堵的路口时段。
拥堵的标准自己设定,如某路段在某个时段平均行驶速度小于多少公里/小时(比如,10公里/小时),可认为是拥堵。
二、 模型假设一般来说,交通小区的划分应该遵循以下原则:(1)同质性,分区内的经济 社会等特性尽量一致(2)小区划分尽量不打破行政区的划分,以便可以利用行政区的统计资料(3)分区数量适当,中等城市不超过 50 个,大城市最多不超过100-150 个 数量太多将加重规划的工作量,数量太少又会降低调查和分析的精度(4)对于已做过 OD 调查的城市,最好维持原已划分的小区三、 符号说明 车牌号2.time 采集时间点(格式:YYYY/MM/DD hh:mm:ss)3.jd 经度4.wd 纬度5.status 车辆状态(0=非打表,即:空载;1=已打表,即:重载)6.v 车速(单位为:km/h)7.angle 行车方向(0=东;1=东南;2=南;3=西南;4=西;5=西北;6=北;7=东北)四、问题分析与模型建立4.1对问题的分析和模型建立4.1.1 交通小区概念交通小区是具有一定交通关联度和相似度的节点或连线的集合,反映了城市路网交通特征的时空变化特性交通小区具有同质性关联性动态性稳定性自组织性等特性[1]交通小区的划分是分析城市交通网络的一个很好的方式,因为交通小区内具有相似的交通特征和较强的交通关联性交通小区的划分与该城市的人口面积经济特征产业结构等密切相关,并在一定程度上反应了一个城市的吸引力4.1.2 交通小区划分概况国内部分城市在不同时期的交通小区的平均面积可以看出,单个小区的平均面积有逐年变小的趋势,划分小区的数量在逐渐增加传统的进行交通小区划分的方法主要基于大规模的人工抽样调查这种划分方法成本高周期长,调查的数据存在抽样率低抽样统计的精度不高数据更新周期长等问题由于我国大部分城市正处于快速发展期,土地利用不断变化,人口高速增长,通过这种方式进行交通小区的划分时效性较差本文通过交通出行数据的聚类运算,提供实时的交通小区的分布状态这种快速动态的划分方法弥补了传统划分方式的不足五、模型求解图1 交通小区分过程5 .1基于K均值聚类算法的交通小区划分方法5.1.1 划分方法本划分方法首先对坐标数据进行空间聚类运算,得到出行起讫点的OD矩阵,最后以此为依据进行交通小区的划分划分过程如图1所示5.1.2 出租车GPS 数据预处理试验中所用到的数据来源于北京奇华通讯有限公司,主要包括车辆GPS实时数据和车辆类型等相关数据信息原始数据表主要保存了出租车上装配的GPS终端所采集的数据,这些数据包括车牌号·时间·经纬度·速度以及该车的空重车状态等由于每天的数据量庞大(2.5 千万条/ 天),基于缩短数据查询时间以及提高整体运算性能等方面的考虑,需要对原始数据进行优化原始数据内容见表4表4 原始表据其中status字段代表的是出租车的空重车状态,当值为0 时表示车的状态为空车,值为 1 时表示车的状态为重车当status值由0 变为1 时,status值为1 的车的位置即为乘客上车时的位置;相反地,乘客下车时的位置也可以得到根据这一特性剔除原始表中的无用数据,优化后的数据见表500:00:305.1.3 聚类计算经过上一步的数据优化,即可得到由起讫点数据组成的数据集现在需要对这些数据进行聚类运算:一段时间内的起点或者讫点被划分为若干个区域,每个区域中的点分布紧凑区域与区域之间自然分开本文采用了K-Means聚类算法K-Means 聚类算法是一种分割式聚类方法,它是数据挖掘技术中一种经典的基于划分的聚类算法其目的在于从大量数据点中找出具有代表性的数据点,即中心点,然后再根据这些中心点进行后续的处理K-Means 算法采用了迭代更新的运算思想,聚类过程如下:首先从n 个数据点随机选择k 个点作为初始聚类中心;通过运算其它点与这些聚类中心点的相似度(距离),将其分别分配给与其相似度最高(距离最近)的中心点所在的聚类;然后对划分好后的聚类重新运算聚类中心这一过程不断重复直到标准测度函数开始收敛[8]5.1.4 对区域数据进行边界运算聚类运算结束之后,得到若干组包含中心点在内的一些坐标点,如图2 所示(点X表示出租车的坐标点,实心圆点表示交通小区中心)将所有聚类后的坐标通过GIS平台输出,通过这种方式很难看出不同区域之间的界线这时需要将区域的边界绘制出来本文采用的边界运算过程如下:首先建立平面直角坐标系,将坐标系以(0,0)为中心点均分为n等份区域(n 的值将决定边界运算结果的精度),每个区域的角度为360/n 如图3所示图3360 度分为n 份图4 距离中心点的距离然后,将某个聚类的点集放入该坐标系,使得区域中心点与坐标原点重合通过计算其它点与中心所形成的角的正余弦,即可得到每个点与中心点所形成的夹角,进而将这些点归入上一步所划分的区域依次计算第i个区域里每个点距离中心点的距离,记录距离中心点最远的点为ci 如图4中P点等最后,将这所有的ci 点相连接,即可得到点集的相应边界,如图5 所示5.2 试验平台搭建与实例分析5.2.1 试验平台搭建为了检验划分结果的准确度,本文搭建了具有GIS功能的试验平台平台使用Java 语言进行开发,GIS 功能采用GoogleMapsAPI解决方案平台通信过程如图6 所示5.2.2 实例分析通过上述方法,利用2008 年8 月 3 号北京市出租车GPS数据进行交通小区的划分,并将划分结果输出到GIS平台上,如图7 所示可以看出这种动态划分方法产生的结果能够与现有的部分交通小区相吻合(标注A为CBD小区,标注B为西郊小区)详细的OD矩阵数据见表 6表6中O 代表起点,D 代表讫点比如坐标位置(2,5)的值为2,代表某一段时间内,共有2 辆出租车从5 号区域前往2 号区域,并且乘客是在5 号区域上车,在2号区域下车六、模型评价与推广6.1 模型评价:本文通过对出租车GPS数据进行聚类运算,快速计算出不同时间段内出租车载客OD矩阵,进而将划分好的区域在GIS平台中显示出来从实验结果可以看出:这种划分方法能够反映出不同时间段内交通小区的绝对动态性以及相对稳定性的特征,对城市交通小区的划分具有很高的参考价值本文所使用的交通小区划分方法也存在一定的不足:首先,划分算法使用了纯粹的K-Means 空间聚类法,没有与现有的位置属性相结合,比如住宅区商业区等属性;其次,算法没有对出租车的特殊数据和异常数据进行处理,比如红绿灯停车GPS信号机发生故障等情况,这些都将影响最终结果的准确性;再次,针对特定时间段进行交通小区的划分更有代表性,比如早晚高峰等,本文没有对此展开讨论这些都是今后的改进方向6.2 模型推广:本文中的模型都是在综合考虑了各种不同情况下得出的满足实际需求的优化模型,因此它的适用性很强,可以推广到很多类似的现实问题。
七、参考文献[1]李晓丹,杨晓光,陈华杰.城市道路网络交通小区划分方法研究.计算机工程与应用,2009,45(5):19-22.[2]杨波,刘海洲.基于聚类分析的交通小区划分方法的改进.交通与运输,2007,(7):23-26.[3]徐吉谦.交通工程总论.北京:人民交通出版社,2003.[4]马超群,王瑞,王玉萍,严宝杰,陈宽民.基于区内出行比例的城市交通小区半径计算方法.交通运输工程学报,2007,(1):68-72.[5]张会娜,李枫.OD 矩阵估计问题研究综].预测技术,2007,(12):49-51.[6]张志强.人工神经网络在板形板厚综合控制中的应用研究.秦皇岛:燕山大学,2005.[7]李霞,杨长海.K-Means 聚类算法在客户细分中的应用.五邑大学学报,2008,22(4):49-51.[8]王祝文,刘菁华,任莉.基于K均值动态聚类分析的地球物理测井岩性分类方法.华东理工大学学报,2009,32(2):152-156。