出行轨迹演绎性时序聚类分割算法

合集下载

时空轨迹聚类方法研究进展

时空轨迹聚类方法研究进展
∞ 代表完全不相似), 是 [0, ∞) ( 0 代表完全相似, 它
轨迹 和人的笔迹轨迹 、 化学领域中分子的运动
[19] [20]
轨迹 、 气象学领域中气团 和飓风的轨迹
[21] [22]
[23-24]
以及
体育领域中球员的运动轨迹
[25-26]
等。
3 时空轨迹聚类方法
为了从时空轨迹数据中提取其相似性与异常, 并发现其中有意义的模式, 时空轨迹聚类分析方法 被广泛采用。该方法的主要目的是试图将具有相 似行为的时空对象划分到一起, 而将具有相异行为 的时空对象划分开来。其关键是根据时空轨迹数 据的特点, 设计与定义不同轨迹间的相似性度量。 因为要将数据集划分成不同的类别, 必须定义一种
o 表示的, 当给定某一个时刻 t (t ∈ R ) 时, 通过该函
+
到空间的映射, 由一个以时间为自变量的连续函数 数可以得到 t 时刻该对象所处的 d 维空间 Rd (一般 是二维或者三维空间)中的位置。 o:R+ → Rd 2.2 时空轨迹的模型 从定义中我们可以看出, 时空轨迹是连续的, 但通常用一组时空记录点序列, 以离散的方式表 示。例如, 对时空对象的实际轨迹曲线进行采样, 用得到的集合来代表时空轨迹 [5]。因此, 时空轨迹 的模型如式(2)所示:
[13]
相似性的测度来度量同一类样本间的类似性和非 同类样本间的差异性[27], 而各种时空轨迹聚类方法 间的主要区别也正是在于其相似性度量的不同。 两个对象之间的相似度(Similarity)是这两个对 象相似程度的数值度量, 相异度(Dissimilarity)是这 两个对象差异程度的数值度量, 距离(Distance)常被 看作是相异度的同义词 [28]。因而, 两个对象越类 似, 它们的相似度就越高, 相异度就越低, 距离越 小。通常, 相似度的取值范围是[0,1](0 代表完全不 相似, 1 代表完全相似), 而相异度(距离)的取值范围

智能交通系统的车辆轨迹预测技巧

智能交通系统的车辆轨迹预测技巧

智能交通系统的车辆轨迹预测技巧智能交通系统是现代城市交通管理的重要组成部分,它利用先进的技术手段,通过获取、处理和分析交通数据,提供实时的交通信息和服务。

其中,车辆轨迹预测是智能交通系统的重要功能之一,它通过分析车辆历史轨迹数据,预测未来的车辆行驶路线和时间,为交通管理者和驾驶员提供参考依据,帮助他们做出更准确的决策,提高交通效率和安全性。

在实际应用中,车辆轨迹预测技巧的准确性和实时性是关键因素。

以下将介绍一些常用的车辆轨迹预测技巧,以期帮助读者更好地理解和应用智能交通系统。

1. 基于统计模型的预测方法统计模型是最常见的车辆轨迹预测方法之一。

通过分析历史车辆轨迹数据,建立统计模型,并使用该模型对未来车辆轨迹进行预测。

常用的统计模型包括线性回归、ARIMA模型、马尔可夫链等。

这些模型能够利用历史数据中的规律性信息来进行预测,其准确性较高,但对实时性要求较高的情况下,则存在一定的局限性。

2. 基于机器学习的预测方法机器学习技术在智能交通系统中得到了广泛应用,包括车辆轨迹预测。

机器学习方法能够通过对历史轨迹数据的学习,建立复杂的预测模型,能够更好地解决实时性和准确性的问题。

常见的机器学习方法包括神经网络、支持向量机、随机森林等。

这些方法能够利用大数据和复杂算法来进行车辆轨迹预测,能够更好地适应不同道路环境和交通状况的变化。

3. 基于深度学习的预测方法随着深度学习技术的发展,深度神经网络在车辆轨迹预测中也得到了广泛应用。

深度学习模型如循环神经网络(RNN)、长短期记忆网络(LSTM)等可以捕捉时间序列数据的依赖关系,使得对车辆轨迹的预测更加准确。

同时,深度学习模型还可以处理大规模数据,学习复杂的空间特征与时间序列之间的关系。

这使得基于深度学习的预测方法在具备大规模车辆轨迹数据的场景中具有较高的优势。

4. 基于数据挖掘的预测方法数据挖掘技术也可以应用于车辆轨迹的预测。

通过挖掘历史轨迹数据中的隐藏规律和模式,可以进行精确的预测。

基于出租车GPS数据聚类分析的交通小区动态划分方法研究

基于出租车GPS数据聚类分析的交通小区动态划分方法研究

基于出租车GPS数据聚类分析的交通小区动态划分方法研究1. 本文概述你需要明确文章的研究背景和目的。

在这个段落中,你可以简要介绍交通小区的概念以及为什么动态划分交通小区对于城市交通管理和规划至关重要。

接着,你可以提到出租车GPS数据作为一种新兴的数据源,如何为交通小区的动态划分提供了新的视角和可能性。

你应该概述本文的主要研究内容和方法。

可以提及你将使用哪些数据预处理和聚类算法来分析出租车GPS数据,并简述这些方法如何帮助实现交通小区的动态划分。

你可以在概述中提及本文的预期成果和贡献。

例如,你可能期望通过研究提出一种新的交通小区划分方法,这种方法能够更准确地反映城市交通的实际动态,并为交通管理和规划提供更有价值的信息。

随着城市交通系统的日益复杂,有效的交通管理和规划变得尤为重要。

交通小区作为城市交通分析的基本单元,其合理划分对于理解交通流分布、优化交通资源配置具有重要意义。

传统的交通小区划分方法往往依赖于静态数据和经验判断,难以适应城市交通流的动态变化。

近年来,随着出租车GPS数据的广泛应用,我们有机会从新的视角审视交通小区的动态划分问题。

本文旨在探索基于出租车GPS数据的交通小区动态划分方法,以期为城市交通管理提供更为精准的决策支持。

通过收集和预处理城市出租车GPS数据,本文将采用先进的数据挖掘技术和聚类算法,对交通流模式进行深入分析。

研究将重点关注如何从动态数据中提取有意义的交通小区边界,并评估不同划分方法对交通流预测和规划的潜在影响。

最终,本文期望提出一种创新的交通小区动态划分框架,不仅能够提高划分的准确性和实用性,还能够为城市交通研究领域带来新的理论和实践贡献。

2. 相关理论与方法GPS技术简介:全球定位系统(GPS)的工作原理及其在交通领域中的应用。

出租车GPS数据特性:出租车GPS数据的类型、特点,包括其时间戳、经纬度、速度等信息。

聚类分析方法:介绍聚类分析的基本概念、类型(如Kmeans、层次聚类等)及其在数据分析中的应用。

大数据分析师如何进行人员定位和轨迹分析

大数据分析师如何进行人员定位和轨迹分析

大数据分析师如何进行人员定位和轨迹分析在当前信息爆炸的时代,大数据成为了企业决策和运营的重要资源。

作为大数据分析师,人员定位和轨迹分析是其中重要的任务之一。

本文将介绍大数据分析师如何利用现有数据进行人员定位和轨迹分析的方法和技巧。

一、人员定位分析1. 数据收集人员定位分析的第一步是收集足够的数据。

数据来源可以包括传感器、智能设备、社交媒体、行为日志等多种渠道。

这些数据可以包括位置信息、手机信号、社交关系等。

2. 数据清洗与整理收集到的数据中可能存在噪音和冗余信息,需要进行数据清洗与整理。

清洗数据可以有效提高后续分析的准确性和可靠性。

3. 数据分析与建模在进行人员定位分析时,可以利用各种统计学和机器学习算法进行数据分析与建模。

其中,常用的算法包括聚类分析、时间序列预测、随机森林等。

4. 结果可视化与报告人员定位分析得出的结果需要进行可视化呈现,以便帮助决策者更好地理解分析结果。

常用的可视化工具包括数据图表、地图、动态展示等。

同时,还需要撰写相应的报告,将分析结果和结论清晰准确地呈现给决策者。

二、轨迹分析1. 轨迹数据收集轨迹分析的基础是轨迹数据的收集。

可以利用GPS定位、移动设备、公共交通数据等多种方式收集轨迹数据。

2. 数据预处理轨迹数据可能存在重复点、噪音和缺失值等问题,需要进行数据预处理。

常用的预处理方法包括去重、插值、异常点处理等。

3. 轨迹聚类分析利用聚类算法对轨迹数据进行分析,可以将轨迹点根据相似度进行聚类分组。

常见的聚类算法包括K-means算法、DBSCAN算法等。

4. 轨迹预测与推荐根据历史轨迹数据,可以利用时间序列分析等方法进行轨迹预测。

同时,还可以基于轨迹数据为用户提供个性化的推荐服务,如交通路线推荐、景点推荐等。

5. 可视化与应用将轨迹分析的结果可视化展示,可以帮助决策者更好地理解轨迹分析的结论。

同时,轨迹分析的结果可以应用于出行规划、城市交通优化、安全预警等领域。

总结:人员定位和轨迹分析是大数据分析师的日常工作之一,通过收集、清洗、分析和可视化数据,可以帮助企业做出更明智的决策和优化运营。

路径聚类分析实验报告(3篇)

路径聚类分析实验报告(3篇)

第1篇一、实验目的本次实验旨在通过路径聚类分析,深入理解聚类分析的基本原理和应用,掌握路径聚类算法的实现过程,并学会如何使用聚类分析解决实际问题。

通过实验,我们希望能够提高对数据挖掘和模式识别方法的理解,以及提高在实际应用中处理复杂数据的能力。

二、实验背景聚类分析是数据挖掘中的一个重要技术,它将相似的数据对象归为一类,从而发现数据中的隐藏模式和结构。

路径聚类分析是聚类分析的一种,它主要针对序列数据,如时间序列、空间轨迹等,通过分析数据对象之间的顺序关系来进行聚类。

三、实验内容1. 实验环境与工具- 操作系统:Windows 10- 数据库:MySQL- 聚类分析工具:Python(使用Scikit-learn库)2. 数据准备本次实验采用的数据集为某城市居民出行轨迹数据,包含居民出行的时间、地点、出行方式等信息。

数据集共有1000条记录,每条记录包含5个特征。

3. 实验步骤(1)数据预处理:对数据进行清洗、去重、缺失值处理等操作,确保数据质量。

(2)特征工程:对原始特征进行转换和提取,如将时间转换为时间戳、计算出行距离等。

(3)路径聚类分析:使用Scikit-learn库中的KMeans聚类算法对数据进行路径聚类分析。

(4)结果分析与可视化:对聚类结果进行分析,绘制聚类效果图,并评估聚类效果。

四、实验结果与分析1. 数据预处理经过数据预处理,数据集共包含1000条记录,每条记录包含5个特征。

预处理后的数据满足实验要求,为后续聚类分析提供了可靠的数据基础。

2. 特征工程通过特征工程,我们将时间转换为时间戳,并计算出行距离。

这样,特征维度从5个增加到7个,有助于提高聚类效果。

3. 路径聚类分析使用Scikit-learn库中的KMeans聚类算法对数据进行路径聚类分析,设置聚类数为5。

聚类过程耗时约1分钟。

4. 结果分析与可视化(1)聚类效果图通过聚类效果图可以看出,聚类效果较好,不同聚类之间存在明显的界限。

一种面向轨迹信息的时序数据流异常检测算法

一种面向轨迹信息的时序数据流异常检测算法

一种面向轨迹信息的时序数据流异常检测算法
高嘉伟;刘建敏
【期刊名称】《计算机工程》
【年(卷),期】2018(044)005
【摘要】针对传统聚类算法多数无法对时序数据流进行聚类的问题,提出一种基于密度和网格的聚类算法.引入动态划分网格的方法,通过当前数据块内数据的特征动态地设置网格划分、网格密度阈值等参数并自适应地生成网格,将其转化为不同类型的图并分别进行聚类.分析某一个体的轨迹,采取按时间段的个体轨迹划分方法检测个体异常轨迹.实验结果表明,该算法可根据用户的需求得到不同时间段内数据的聚类结果,适用于处理轨迹信息等时序数据流的异常检测问题.
【总页数】9页(P25-32,46)
【作者】高嘉伟;刘建敏
【作者单位】山西大学计算机信息与技术学院,太原030006;计算智能与中文信息处理教育部重点实验室,太原030006;山西大学计算机信息与技术学院,太原030006
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种检查面向对象程序中数据流异常的方法 [J], 郭健强;蔡希尧
2.一种基于轨迹大数据离线挖掘与在线实时监测的出租车异常轨迹检测算法 [J],
韩博洋;汪兆洋;金蓓弘
3.一种基于一类支持向量机的时序异常检测算法 [J], 王婉湘
4.一种检查面向对象程序中数据流异常的方法 [J], 郑云
5.一种面向审查的过程内数据流异常自动检测方法 [J], 卞磊;刘超;金茂忠
因版权原因,仅展示原文概要,查看原文内容请购买。

基于手机信令数据居民出行链提取算法

基于手机信令数据居民出行链提取算法

基于手机信令数据居民出行链提取算法肖志权; 张子民; 毛曦; 樊文平【期刊名称】《《北京测绘》》【年(卷),期】2019(033)010【总页数】4页(P1192-1195)【关键词】手机信令数据; 聚类; 出行链; 停留点【作者】肖志权; 张子民; 毛曦; 樊文平【作者单位】山东建筑大学测绘地理信息学院山东济南250100; 中国测绘科学研究院北京100039【正文语种】中文【中图分类】P2080 引言目前随着我国城市化进程的加快,外来人口急速增加不仅是推动城市发展的动力同时也是造成城市拥挤重要因素之一[1]。

居民日常出行与交通状况密切相关,因此掌握居民的日常出行规律可以对城市规划、交通状况预测、城市就业率等提供合理的技术支持。

传统的居民出行链提取通常是以问卷调查的方式,这种方式不仅消耗大量的人力、物力、财力[2]。

而且调查的精度因受到人的主观因素影响而难以控制,与传统问卷调查相比手机信令数据因具有时空连续性、数据客观性、数据样本大、覆盖区域广等优势越来越受到人们的关注。

如闫晴等基于手机信令数据的长春市活动空间特征与社区分异研究[3]。

廖锟等基于手机信令数据的区域住房价格与居民出行特性相关性研究[4]。

当前基于手机数据居民出行链提取的主要依据是判定停留点和时间序列提取出行轨迹。

其中研究居民出行轨迹的数据有三种:移动定位数据、公共交通刷卡数据、GPS终端轨迹数据[5]。

判定停留点算法主要有三大类:基于速度停留点提取、基于密度停留点提取、基于方向停留点提取。

王媛等使用车载GPS数据和DBSCAN聚类算法提取出游客出行停留点,并基于日维度出行链识别游客出行时空分布[6]。

王艳涛等基于GPS、基站、wifi数据的时间聚类提取停留点,通过时间特征和叠加地图方式识别居住和工作地[7]。

苗壮等使用MapReduce框架清理手机信令大数据和DBSCAN聚类算法识别职住地,通过核密度函数将职住地以热力图的形式展示[8]。

平面空间时空轨迹快速聚类算法研究

平面空间时空轨迹快速聚类算法研究

平面空间时空轨迹快速聚类算法研究刘翔;王斌君;王靖亚;贺滢睿【期刊名称】《科学技术与工程》【年(卷),期】2015(0)24【摘要】针对现有聚类分析算法对平面空间时空轨迹进行聚类的不足,提出了基于区域的快速聚类方法。

借助先验知识确定输入参数,使用符合现实情况的切比雪夫距离或曼哈顿距离度量点间距离以划分聚类簇,区分人的各个常驻地点;使用区域叠加的概念度量点的密度,确定簇的质心以获得每个常驻地点的中心坐标;在保证算法复杂度的前提下确定簇的边缘点,标注人在每个常驻地点的活动范围。

相比现有算法,该算法更适用于时空轨迹数据分析。

%In contrast to the deficiency in the existing clustering algorithms for spatio-temprol trajectory in planar space, put forward the fast clustering algorithm based on region, with the aid of prior knowledge to determine the input parameters, utilize Chebyshev distance or Manhattan distance which conform to the reality to measure the dis-tance between two points to partition cluster, therefore distinguish the resident place. Utilize the concept of region to measure the density of points, therefore determine the cluster center in order to get the center coordinate in each resident place. On the premise of guaranteeing the algorithm complexity to determine the bunch of edge points and denote people’ s activities scope in each resident place. Compared with the existing algorithms, the proposed algo-rithm is more suitable for spatio-temprol trajectory analysis.【总页数】7页(P173-179)【作者】刘翔;王斌君;王靖亚;贺滢睿【作者单位】中国人民公安大学网络安全保卫学院,北京102600;中国人民公安大学网络安全保卫学院,北京102600;中国人民公安大学网络安全保卫学院,北京102600;中国人民公安大学网络安全保卫学院,北京102600【正文语种】中文【中图分类】TP391.3【相关文献】1.基于移动对象轨迹段分割的聚类算法研究 [J], 张亚昕2.真实场景运动目标轨迹有效性判断与自动聚类算法研究 [J], 潘奇明;程咏梅;杨涛;潘泉;赵春晖3.一种面向移动智能手机用户轨迹停留点提取的时空聚类算法研究 [J], 崔邓;沈敬伟;周廷刚4.基于子空间聚类算法的时空轨迹聚类 [J], 马林兵;李鹏5.基于联邦学习的船舶AIS轨迹谱聚类算法研究 [J], 吕国华;胡学先;张启慧;魏江宏因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第24卷第8期 2014年8月 

计算机技术与发展 

COMPUTER TECHNOLOGY AND DEVELOPMENT Vo1.24 Aug. No.8 

2014 

出行轨迹演绎性时序聚类分割算法 王 瑾 ,张小垒 ,韩 勇 ,张 涛 ,陈 戈 (1.中国海洋大学信息科学与工程学院,山东青岛266100; 2.中国科学院空间应用工程与技术中心系统工程部,北京100000) 

摘要:对于大规模出行轨迹数据进行出行方式研究时,除了要对行程中OD(起点一终点)进行提取,还要对其间交通方式 进行判别。然而,一段行程中,往往包含多种交通方式,如何更精细地从中提取多种交通方式,提升最终交通规划效果,是 目前出行方式研究的关键问题。在使用移动智能终端采集出行轨迹的基础上,对出行轨迹进行不同交通方式的转换点提 取,最终提出了演绎性时序聚类分割算法进行出行轨迹的分段,并对其进行实验验证。结果表明算法对于分割不同交通 方式段,达到了很高的精度。 关键词:移动智能终端;出行轨迹;交通方式;演绎性时序聚类分割算法 中图分类号:TP399 文献标识码:A 文章编号:1673—629X(2014)08—0022—04 doi:10.3969/j.issn.1673—629X.2014.08.006 

Apriority Sequential Clustering Segmentation Algorithm of Travel Paths 

WANG Jin ,ZHANG Xiao—lei ,HAN Yong ,ZHANG Tao ,CHEN Ge。 (1.School of Information Science&Engineering,Ocean University of China,Qingdao 266100,China; 2.System Department,Technology and Engineering Center for Space Utilization of Chinese Academy of Sciences,Beijing 100000,China) 

Abstract:When studying transportation mode with large—scale travel trajectory data,need tO not only extract the origin and destination model from the trip,but also determine the transportation mode.However,a joumey often contains a variety of transpo ̄ation modes.How to extract the travel pa ̄erns and enhance the effect of the final transportation planning is the key problem of transportation research.Based on mobile intelligent terminal tO collect travel paths and the point of the travel path of diferent transportation mode,put forward the apri— Ority sequential clustering segmentation algorithm for segmentation of the travel path.The method is verified by experiment.Results show that the algorithm for separating different transportation period is of very high accuracy. Key words:mobile intelligent terminal;travel path;transportation mode;apriority sequential clustering segmentation algorithm 

0 引 言 一直以来,出行方式研究在交通规划与交通系统 管理中都发挥着重要的作用。近年来,随着移动智能 终端的普及和GPS技术的发展,基于移动智能终端采 集数据为出行方式研究提供了新的技术手段 。 然而,制约利用该技术进行出行方式研究发展的 主要问题是一段行程中不同交通方式的分段提取。在 移动智能终端采集数据领域,国外的移动定位技术已 

较成熟,已设计出将定位信息转化为交通信息的系统, 得到出行轨迹、交通流等相关数据,但较少的在出行方 式划分等方面进行研究 。而国内,多利用移动通信 基站 或者信令数据进行出行信息采集来进行OD调 查研究,杨飞等曾针对传统出行调查的局限性,指出利 用移动智能终端获取OD信息的优势 ;刘淼等使用 移动智能终端获取OD信息 ,但两者均未涉及出行 轨迹的分割。关于出行轨迹分段大都在提供外设 (GPS便携设备)的基础上进行 。 

收稿日期:2013—10—15 修回日期:2014—01—18 网络出版时间:2014—05—21 基金项目:科技部科技型中小企业技术创新基金(12C26214204374) 作者简介:王瑾(1988一),女,河南漯河人,硕士研究生,研究方向为地理信息系统、智能终端应用、数据挖掘;韩勇,教授,研究方向为虚拟 地理环境及海洋地理信息系统;张涛,研究员,博士生导师,研究方向为高可靠软件测试验证技术、系统仿真与虚拟现实技术; 陈戈,教授,博士生导师,研究方向为卫星海洋遥感、海洋地理信息系统。 网络出版地址:http://wvr ̄.cnki.net/kcms/detail/61.1450.TP.20140524.2149.021.html 第8期 王瑾等:出行轨迹演绎性时序聚类分割算法 ・23・ 早期,大都通过携带GPS便携设备开展出行调 查,由于设备采集方式的限制,往往通过设定不同的时 间阈值 J、基于方向、借助路网等探索性方法 或者 根据基于聚类算法识别停留… 。这些方法仅仅对停 留及非停留(行程)部分进行分割,只是对目的地(活 动点)进行提取,而不能对活动点之间的交通方式转 换点进行识别,故也不能提取行程中复杂的交通方式。 Zheng等认为换乘和步行密切相关 ,针对 GPS便携设备获取的原始数据进行交通方式转换点的 提取,再设定距离阈值对不确定段进行合并,最终进行 步行段与非步行段的划分。这种分段方式针对GPS 原始数据进行分割,不依赖于数据的采集方式以及采 集环境,但是庞大的GPS原始数据量会给服务器承载 提出更高的要求。其次,该方法在交通方式转换点的 提取,全部在数据采集后期进行,未在数据采集过程中 进行,加大了后期的运算量。此外,方法中设置了速度 阈值以及加速度阈值进行步行段以及非步行段的判 别,但每个转换点的速度等统计量全是通过公式计算 而来,计算产生的误差在一定程度上增加了分段判别 误差。 针对以上问题,文中针对移动智能终端采集的数 据,对出行轨迹进行分段算法研究,在数据采集的同时 进行数据的预处理,初步识别交通方式,避免了后期计 算的误差,减轻了后期运算量。此外,对不同交通方式 进行分类组合,基于轨迹数据提出演绎性时序聚类分 割算法进行出行轨迹分段,理论及探索性方法结合使 用,大大提高了对不同交通方式段提取的精度。 

1 出行数据采集 针对移动智能终端开发的数据采集器采用等距采 集方法,每隔15 m采集一个轨迹点,以10个数据为一 组进行上传。数据上传到服务器端采用SQL Server 数据库存储,字段说明如下: (1)设备号:Name。移动智能终端的设备号作为 出行用户标识; (2)位置:Lat,Lon。出行的经纬度信息; (3)时间:Time。时间精确到秒,记录格式如:例 2013/05/25 18:25:21; (4)瞬时速度:Speed。通过移动智能终端中的 GPS采集出行的瞬时速度; (5)平均速度:AverageSpeed。该数据采集器以10 个数据为一组进行上传,计算的10个数据的速度平均 值作为该组定位数据的平均速度; (6)根据速度识别的出行方式:SMode。根据瞬时 速度,参考以往用户出行经验,结合出行方式自身特 征,选取合理的经验阈值进行初步分段,初步分为a, b,c,d四大类,依次为步行(速度小于2 m/s)、自行车 (速度介于2 m/s和6 m/s之间)、公交(速度介于6 m/s和15 m/s之间)、其他机动车(速度大于15 m/s) 等。SMode值确定如下: S( )= n 0≤'/3<2 6 2≤ <6 C 6≤/3<15 d ≥15 (7)每组数据的出行方式:Mode。该数据采集器 以10个数据为一组进行上传,后台判别10个数据中 的平均速度赋给AverageSpeed。依据(4)中的判别规 则判别该组数据的出行方式。 该数据采集方法在采集过程中就进行了阈值判别 的预处理过程,避免后期计算统计量产生的误差,此 外,分组上传出行数据,减少通信时间,提高获取数据 的精度,有利于后期分段算法的实现。 2出行轨迹分段 表1是微软亚洲研究院根据45个被访者长达6 个月的出行记录得出的换乘矩阵 。 表1 被访者出行换乘矩阵 % 根据表中数据可得,交通方式换乘与步行密切相 关 。在非步行的交通方式之间换乘概率极小,即 使换乘,中间也会伴随短暂的步行。 综上,针对一段出行中的交通方式转换点(为了 叙述方便,以下简称“转换点”)进行提取,基本等同于 行程中的所有步行段起点和终点的提取,换言之,对于 不同交通方式的分段,其实是对行程中步行段与非步 行段进行分割提取。 演绎性时序聚类分割算法如下: 演绎性时序聚类分割算法是通过对数据特征的观 察以及对数据规律的总结,针对出行轨迹数据进行的 探索性分割方法。不同于k均值聚类、层序聚类分析 算法,该方法依赖于数据采集方法,顺应了轨迹数据的 时序特征,运用严格的逻辑推理一演绎,进行算法过程 的推断。算法假定的前提是数据无失真,主要思路如 下: 1)出行方式二值化。 二值化是图像处理的基本操作。随着彩色图像二 值化算法的应用探索,扩展了传统意义的黑白图像二

相关文档
最新文档