基于支持向量机模型的地铁进站客流量预测

合集下载

地铁客流预测分析

地铁客流预测分析

地铁客流预测分析地铁作为城市交通的重要组成部分,其客流的准确预测对于地铁的运营管理、规划设计以及资源配置都具有至关重要的意义。

客流预测不仅能够帮助运营部门合理安排列车班次、优化运力配置,还能为规划部门提供决策依据,以适应城市发展和居民出行需求的变化。

地铁客流的产生和变化受到多种因素的综合影响。

首先是城市的人口规模和分布。

一个人口密集的区域往往会产生较大的地铁出行需求。

例如,城市的商业中心、大型住宅区以及学校、医院等公共服务设施集中的区域,通常是客流的主要产生地和吸引地。

其次,城市的土地利用规划也对地铁客流有着显著的影响。

不同功能区域的布局,如工作区、商业区和居住区的分离程度,会决定居民出行的距离和方向。

如果工作区和居住区距离较远,那么早晚高峰时段的通勤客流就会相对较大。

再者,时间因素也是不可忽视的。

工作日和节假日、一天中的不同时段,客流的特点和规模都有所不同。

工作日的早晚高峰时段,客流主要以通勤为主,呈现出明显的方向性和集中性;而节假日和周末,客流则更加分散,以休闲、购物和娱乐出行居多。

此外,天气状况也会对地铁客流产生一定影响。

恶劣天气如暴雨、暴雪等可能会导致更多人选择地铁出行,以避免地面交通的不便。

为了准确预测地铁客流,需要采用科学合理的方法和模型。

传统的客流预测方法主要基于历史数据的统计分析。

通过收集过往一段时间内地铁的客流量、出行时间、出行方向等数据,运用统计学方法找出客流的变化规律,并据此对未来的客流进行预测。

然而,这种方法存在一定的局限性。

它往往只能反映过去的客流情况,对于一些突发的、非常规的因素难以有效应对。

例如,城市举办大型活动、新的商业中心开业或者突发的公共卫生事件等,都可能导致客流出现较大的波动,而传统方法难以准确预测这些情况。

近年来,随着信息技术的不断发展,一些新的客流预测方法逐渐兴起。

基于智能算法的预测模型,如神经网络、支持向量机等,能够更好地处理复杂的非线性关系,提高预测的准确性。

基于机器学习的城市轨道交通短时客流预测研究

基于机器学习的城市轨道交通短时客流预测研究

基于机器学习的城市轨道交通短时客流预测研究基于机器学习的城市轨道交通短时客流预测研究随着城市人口快速增长和交通出行需求的不断增加,城市轨道交通作为一种高效的公共交通方式,逐渐受到人们的关注。

然而,由于城市轨道交通的复杂性和不确定性,准确预测客流变化成为保障运行安全和提升服务质量的重要课题。

近年来,随着机器学习技术的发展和应用,基于机器学习的城市轨道交通短时客流预测开始受到广泛关注。

城市轨道交通的客流变化受到多种因素的影响,包括时间、天气、节假日以及区域经济发展等。

传统的统计模型无法有效地捕捉这些复杂的非线性关系,而机器学习技术可以通过学习海量数据中的模式和规律,提供更准确的预测结果。

因此,基于机器学习的城市轨道交通短时客流预测日益受到研究者和相关部门的重视。

在基于机器学习的城市轨道交通短时客流预测研究中,数据是非常关键的因素。

传感器网络、候车、刷卡数据等大量数据的积累和采集为研究者提供了更多的信息,有助于建立更可靠的预测模型。

其中,神经网络、支持向量机、决策树和集成学习等机器学习算法被广泛应用于城市轨道交通客流预测中。

这些算法依靠数据的训练和学习,能够自动调整内部参数,从而优化预测结果。

在具体的研究中,首先需要进行数据的收集和处理。

对于不同城市的轨道交通线路,可以通过布置传感器网络来采集列车的运行数据、车站的候车数据和乘客流动数据。

通过对这些数据进行预处理,例如数据清洗、特征提取和数据标准化等操作,可以得到适合机器学习算法处理的数据集。

接下来,需要选择合适的机器学习算法,并使用划分好的数据集进行训练、验证和测试。

通过不断调整算法参数和模型结构,提高预测模型的准确性和鲁棒性。

此外,在城市轨道交通客流预测研究中,还需要考虑特殊情况的处理。

例如,突发事件、交通拥堵等因素会对客流产生较大的影响,因此需要对模型进行实时调整和更新。

同时,预测结果的可视化也是城市轨道交通管理部门和乘客了解交通状况的重要工具。

城市轨道交通短期客流预测方法_吕利民

城市轨道交通短期客流预测方法_吕利民

大客流预测模型
理论 +

较高
现有设备
通过表 5 的比较,可以从整体上对城市轨道交通 研究思路的算 法 有 一 个 比 较 清 晰 完 整 的 认 识,有 助 于 更加全面深入 地 了 解 和 吸 收 已 有 的 研 究 成 果,并 在 此 基础上思考和解决相关问题。
3 总结和展望
3. 1 短期客流预测开展原则
表 4 5 种实时判断修正实时预测算法比较
模型或算法
优点
不足
灰色马尔 科夫模型
修正灰色预测模型,提 高预测客流精确性,理论 较成熟
客流规律周期性只 对工 作 日 和 非 工 作 日 进行区分
在遵循客流规律的基 改进的灰色
础上 对 轨 道 交 通 短 期 客 马尔科夫模型
流进行预测
仅理论分析历史客 流 数 据,不 能 反 映 实 时 客流的情况
流预测模型库
未分析正常运营条 件 下 的 效 果,欠 考 虑 运 营 时 刻 表、清 分 算 法 等 综合因素
2. 2 短期客流预测算法比较
之前总结了目前城市轨道交通短期客流预测中
22
城市轨道交通短期客流预测方法
一些典型模型和算法的设计方法,其中 一 些 算 法能 够实时判断车站的短期客流情况,另外 一 些 能 预测
1. 3 传统客流预测方法的不足之处
城市轨道交通客运组织对客流预测模型设计提出 了很高的要求,但目前对于短期客 流 预 测 技 术 的 研 究 尚 处 于 起 步 和 发 展 阶 段,尽 管 出 现 了 少 量 综 合 实 时
表 1 短期客流预测研究意义
对象
意义
运营部门
为客运组织做出正确安排提供依据,降低拥堵 机率,提高服务水平,提升管理与服务,优化疏堵

轨道交通客流预测方法

轨道交通客流预测方法

轨道交通客流预测方法
轨道交通客流预测方法有多种,常见的方法包括以下几种:
1. 基于统计方法:通过历史客流数据进行分析和预测。

这种方法主要依靠数据的走势和规律来预测未来的客流情况,包括时间序列分析、回归分析等。

2. 基于模型方法:建立客流预测模型,通过对影响客流的各种因素进行建模和分析来预测客流情况。

常见的模型包括回归模型、ARIMA模型、神经网络模型等。

3. 基于机器学习方法:利用机器学习算法对历史数据进行训练,从而得到一个预测模型。

常见的机器学习算法有决策树算法、支持向量机算法、随机森林算法等。

4. 基于大数据方法:利用大数据技术对大量的实时数据进行分析和挖掘,以获取更准确的客流预测结果。

这种方法主要依靠大数据分析的能力和技术手段,如数据挖掘、深度学习等。

综合考虑,通常会结合多种方法进行客流预测,以提高预测的准确性和可靠性。

此外,还可以考虑其他因素,如天气、节假日等,以更全面地预测轨道交通客流。

211093834_地铁新线网站点客流量预测的自训练模型研究

211093834_地铁新线网站点客流量预测的自训练模型研究

运营管理1 研究背景随着城市交通需求的日益增长,原有地铁线网已无法满足人们的出行需求,许多大城市开始陆续建设地铁新线路以缓解城市交通压力。

站点客流量是地铁新线网规划设计和运营管理的重要依据。

因此,准确地预测地铁新线网的站点客流量具有重要意义。

目前,可以使用机器学习的方法预测地铁新线网的站点客流量。

首先,将既有站点的客流影响因素作为特征,将既有站点的历史客流量作为标签,进行模型训练。

然后,将地铁新线网的站点客流影响因素作为特征,输入训练好的模型,预测客流量。

例如,栾悦[1]构地铁新线网站点客流量预测的自训练模型研究王开鹏1,2,王 璞1,2(1. 中南大学交通运输工程学院,湖南长沙 410075;2. 轨道交通大数据湖南省重点实验室,湖南长沙 410075)建了人工神经网络模型,李嘉雯[2]构建了径向基神经网络模型,以预测新线网的站点客流量。

然而,由于作为训练样本的既有站点数量通常不够充足,导致机器学习模型可能存在欠拟合[3],难以更加准确地预测新线网的站点客流量。

自训练是解决训练集样本数量不足、提升预测精度的有效办法,其主要思路是根据训练集中少量的训练样本和测试集以外大量的未标记样本构造“伪标记样本”以扩充训练集[4]。

为了将自训练与新线网的站点客流量预测相结合,本文提出一种能够迭代创造新样本的自训练模型(Self-KNN-XGBoost ),以达到提升预测精度的目的。

首先,为满足自训练的平滑假设[4],使用K 最邻近模型(KNN )生成与已有训练样本相似的伪标记样本。

然后,使用预测性能优良的极端梯度提升模型(XGBoost )选择置信度最高的伪标记样本加入训练集中。

在迭代结束后,可得到扩充的训练集。

最后,使用扩充的训练集重新训练XGBoost 模型,并预测地铁新线网的站点客流量。

此外,利用深圳地铁11号线的开通作为案例检验模型的有效性。

实验结果显示,与几种常见的基准模型相比,本文所提出的模型具有更高的预测精度。

地铁客流预测与调度优化研究

地铁客流预测与调度优化研究

地铁客流预测与调度优化研究随着城市快速发展和人口的增长,地铁作为一种高效的公共交通方式,在城市交通中扮演着重要的角色。

准确预测地铁客流量并进行有效的调度优化,是确保地铁运行安全和乘客出行便利的关键。

本文将对地铁客流预测与调度优化展开研究,旨在提高地铁运行效率和乘客出行体验。

一、地铁客流预测地铁客流预测是指基于历史数据和统计分析方法,对未来一段时间内的客流量进行预测和估计。

它可以帮助地铁运营商制定合理的调度方案,为乘客出行提供更好的服务。

1. 数据收集与处理地铁客流预测的第一步是收集相关的历史数据,包括每个时段的客流量、天气情况等。

接下来,需要对数据进行清洗和处理,包括去除异常值、填补缺失值等。

2. 特征工程特征工程是地铁客流预测中非常重要的一步。

可以通过分析历史数据,提取出与客流量相关的特征,如时间、日期、假期、天气等。

这些特征可以用来构建预测模型。

3. 预测模型选择与训练针对地铁客流预测问题,可以选择合适的预测模型进行建模和训练。

常用的预测模型包括线性回归、ARIMA、支持向量机(SVM)等。

通过训练数据集,得到一个较为准确的客流预测模型。

4. 模型评估与优化完成模型训练后,需要对模型进行评估和优化。

可以使用一些指标如均方根误差(RMSE)、平均绝对百分比误差(MAPE)等来评估模型的准确性。

如果模型的准确性较低,可以通过调整模型参数或选择其他模型来进行优化。

二、地铁调度优化地铁调度优化是指根据预测的客流量,合理分配地铁资源并优化列车运行策略,以提高地铁系统的运行效率。

1. 资源分配根据预测的客流量,可以合理分配地铁资源,包括列车数量、发车间隔等。

在高峰期增加列车数量,减小发车间隔,以满足乘客出行需求;在低峰期则适当减少资源投入,降低运营成本。

2. 列车调度根据预测的客流量和分配的地铁资源,进行列车调度。

优化的列车调度应保证列车之间的稳定和均匀间隔,最大限度地减少乘客等候时间和拥挤程度。

3. 优化策略地铁调度优化还可以通过制定合理的策略来提高运行效率。

城市轨道交通客流预测和分析

城市轨道交通客流预测和分析1. 引言在现代城市化进程中,城市轨道交通系统是一个重要的公共交通工具,它能够承载大量的人员流动,并对城市的交通拥堵和环境污染产生重要影响。

因此,进行城市轨道交通客流预测和分析是提高交通系统运行效率、优化交通资源配置的关键。

本文将介绍城市轨道交通客流预测和分析的方法和应用。

2. 数据收集在进行城市轨道交通客流预测和分析之前,首先需要收集相关的数据。

这些数据包括轨道交通系统的运营数据、乘客进出站数据、天气数据、节假日数据等。

其中,轨道交通系统的运营数据包括列车到达和出发时间、列车运行速度等。

乘客进出站数据包括站点名称、进站时间、出站时间等。

天气数据包括温度、湿度、风速等。

节假日数据包括节假日名称和日期等。

这些数据可以通过网络爬虫、API接口、传感器等方式进行收集。

3. 数据预处理在收集到城市轨道交通相关数据后,需要对这些数据进行预处理。

预处理包括数据清洗、数据补全、数据变换等步骤。

数据清洗是指对数据中的错误、缺失、重复等问题进行处理;数据补全是指对缺失数据进行填充;数据变换是指对数据进行标准化、归一化等操作,以便更好地进行后续的分析和建模。

4. 特征提取在进行城市轨道交通客流预测和分析之前,需要从原始数据中提取有价值的特征。

特征提取的方法包括时间序列分析、统计分析、聚类分析等。

时间序列分析可以提取出轨道交通客流的周期性和趋势性;统计分析可以提取出轨道交通客流的均值、方差等特征;聚类分析可以将轨道交通客流划分为不同的类别,以便进行进一步的分析和建模。

5. 客流预测和分析模型基于提取的特征,可以使用各种统计模型和机器学习模型进行城市轨道交通客流的预测和分析。

常用的模型包括线性回归模型、支持向量机模型、神经网络模型等。

这些模型可以通过训练集进行参数估计,然后通过测试集进行模型的验证和评估。

根据具体的需求,可以选择适宜的模型进行城市轨道交通客流的预测和分析。

6. 应用案例城市轨道交通客流预测和分析在实际应用中具有广泛的应用价值。

交通流量预测中的支持向量机算法研究

交通流量预测中的支持向量机算法研究第一章:引言交通流量预测在城市交通管理和规划中起着至关重要的作用。

仅仅依靠实时数据和警报并不足以为城市交通提供足够的支持和保障。

因此,已经有越来越多的研究集中在交通流量预测上。

其中,支持向量机(SVM)算法是一种有效的方法,其在许多研究中取得了显著的应用和成果。

本文将重点介绍SVM和其在交通流量预测中的应用。

文章包括四个章节,分别是:SVM算法原理、SVM在交通流量预测中的应用、实验结果和结论。

通过阅读本文,读者将对SVM及其在交通流量预测中的应用有更深入的了解。

第二章:SVM算法原理支持向量机是一种二分类模型,其基本思想是将数据映射到高维空间中,在新的空间中通过一个超平面将数据分类。

其数学基础是约束优化问题的解,具体可以通过以下公式表示:$$min\frac{1}{2}||w||^2$$约束条件是:$$y_i(w\cdot x_i+b)-1\geq0, i=1,2,...,n$$其中$x_i$为样本特征向量,$y_i$为对应的类别标签,$w$为模型的参数,$b$为偏移量。

在上述限制条件下,模型可以找到最优的二分类超平面。

当数据是非线性时,SVM通过对数据进行核函数映射,从而将数据映射到高维空间中。

这些映射函数经常被称为内核函数,SVM的学习过程就是寻找最适合的核函数,以便在高维空间中找到最佳的超平面。

第三章:SVM在交通流量预测中的应用交通流量预测是通过历史数据对未来交通流量进行估计的过程。

在通常情况下,我们可以采用多种方法进行交通流量预测,如基于时间序列、神经网络等。

SVM是一种新的方法,其在交通流量预测领域中已经取得了很好的效果。

(一)SVM在交通流量预测中的优势与其他预测方法相比,SVM在交通流量预测中具有以下一些优势:1、灵活性高,适用于不同场景和不同的数据特征2、可以处理高维数据,包括不同的特征3、对于非线性数据的预测效果好(二)SVM在交通流量预测中的应用在交通流量预测中,SVM算法被广泛应用。

地铁线路客流预测与优化研究

地铁线路客流预测与优化研究一、引言地铁作为现代城市交通系统的重要组成部分,承担着越来越多的城市居民出行需求。

为了提高地铁的运营效率和服务质量,客流预测与优化研究变得至关重要。

通过对地铁客流进行准确预测,并在此基础上对地铁线路进行优化,可以有效地满足广大乘客的出行需求。

二、地铁客流预测方法1. 数据分析方法地铁客流预测的关键在于对大量的数据进行分析和处理。

通过对历史客流数据的统计分析,可以得到某一时段、某一线路上的平均客流量,并据此作为预测未来客流的依据。

同时,还可以运用数据挖掘技术,如聚类分析、关联规则挖掘等,挖掘出影响客流量的关键因素,进一步提高预测的准确性。

2. 机器学习方法机器学习方法在地铁客流预测中起着重要作用。

通过建立预测模型,可以根据历史客流数据来预测未来某一时段的客流量。

常用的机器学习方法包括支持向量机、神经网络、随机森林等。

根据数据集的特征不同,选择合适的算法进行训练和预测,以得到准确的客流预测结果。

三、地铁线路优化策略1. 线路规划优化通过客流预测,可以确定地铁线路上的高峰和低谷时段,从而对线路进行合理的规划和优化。

在高峰时段增加列车班次和车厢数量,以应对乘客需求的峰值;而在低谷时段则可以适当减少列车班次,降低运营成本。

此外,还可以通过设计不同的线路路径,将客流合理分担到不同的线路上,提高整体运营效率。

2. 站点分布优化合理的站点分布对地铁线路的运营效率和乘客出行体验至关重要。

通过分析乘客的出行特征和需求,对地铁站点进行合理设置和调整。

在重要交通枢纽、商业中心和人口密集区域设置更多的站点,以便乘客在出行时能够更方便地接驳其他交通工具或到达目的地。

同时,对于线路上相邻站点的距离也需要进行科学考虑,以提供更好的出行体验。

3. 运营策略优化除了线路规划和站点分布的优化,还需要对地铁运营策略进行针对性的优化。

例如,在高客流时段采取优先进站和离站措施,以缩短乘客的候车和上下车时间;在线路交叉口设置调度监控系统,以提高列车运行的稳定性和安全性。

基于SVM的在线交通流量预测研究

基于SVM的在线交通流量预测研究随着城市发展,交通问题已经成为人们生活中最普遍的问题之一。

交通拥堵问题不仅仅影响了城市的经济发展,还危害了人们的身体健康和精神状态。

因此,改善城市的交通状况已成为了城市发展的重要议题之一。

交通拥堵问题的解决,需要我们对交通流量进行科学的预测和控制。

目前,交通流量的预测已成为了交通领域研究的热点之一。

在线交通流量预测是指根据历史交通数据,来预测未来某一地区的交通流量状况。

在线交通流量预测可以为城市交通管理部门制定更加高效和科学的交通方案提供参考。

近年来,基于支持向量机(SVM)的在线交通流量预测逐渐得到了广泛应用。

SVM是一种常见的机器学习算法,可以通过构建非线性模型来解决复杂的预测问题。

SVM具有良好的数据拟合能力和泛化能力,能够较好地处理高维、非线性和噪声干扰等问题。

在SVM模型中,常使用径向基函数核函数(RBF)进行建模,通过训练模型来获得最佳的预测参数。

具体来说,将训练集引入SVM模型中进行训练,从而确定最优的SVM模型参数。

SVM模型二分类预测任务的目标即为找到一个最优划分超平面,将正负数据分割开,并且离该超平面最近的样本点被称为支持向量,与该样本点相邻的两条平行的超平面分别称为上下分界超平面。

此外,在建立SVM模型时,还需要考虑数据集的选择和特征选择。

数据集的选择将直接影响模型的预测效果,常用的数据集主要有道路基本信息、历史交通流量数据、天气和人群数据等。

在选择特征时,采用合适的特征提取方式,可以充分发挥数据集的特性,提高预测精度。

总的来说,基于SVM的在线交通流量预测可以大大提高城市交通运输的管理水平。

它可以帮助政府部门制定科学合理的交通规划,降低城市交通拥堵率,为市民提供更加高效优质的出行体验。

虽然目前已经取得了一定的研究成果,但是仍有一些问题需要解决和深入研究。

例如,如何解决模型过度拟合或欠拟合问题等。

期望未来能够有更多的学者参与到相关研究中,为城市交通管理提供更多有效的解决方案。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于支持向量机模型的地铁进站客流量预测作者:郭文肖为周秦菲菲来源:《河北工业科技》2019年第01期摘要:为了更精确地预测短期站点客流量,动态调整城市轨道交通的日常客流方案,采用支持向量机模型对预测地铁客流量。

首先,通过对AFC数据分析,利用上周同期进站量、前一天同期进站量、当日前两个时段进站量以及高峰和非高峰时段参数作为模型的输入变量;然后,构造支持向量机预测模型并运用粒子群算法优化模型(PSO-SVM模型),实现地铁站点客流量预测,并进行不同模型预测误差的比较分析;最后,以苏州地铁数据为例,预测汾湖路地铁站的进站客流量。

结果表明,优化模型能够有效改善预测误差,预测结果更为准确,证明PSO-SVM方法能有效用于地铁进站客流量的预测研究,为地铁进站客流量预测提供了新的方法。

关键词:交通运输工程;城市轨道交通;客流预测;支持向量机;进站客流量中图分类号:U2395文献标志码:Adoi: 10.7535/hbgykj.2019yx01006GUO Wen, XIAO Weizhou, QIN Feifei. Prediction of subway entry flow based on support vector machine model[J].Hebei Journal of Industrial Science and Technology,2019,36(1):31-35.Prediction of subway entry flow based on supportvector machine modelGUO Wen, XIAO Weizhou, QIN Feifei(School of Rail Transportation, Soochow University, Suzhou, Jiangsu 215131,China)Abstract:In order to predict the short-term station passenger flow more accurately and apply it to the daily passenger flow organization of urban rail transit in time, the support vector regression model is used to predict the subway passenger flow. The input variables are the same stopping volume of last week, the same stopping volume of the previous day, the two stopping volume of this day,and the parameters of peak and non-peak periods from the analysis of AFC data. Then the support vector machine prediction model is constructed and the particle swarm optimization model is used to improve the parameters(PSO-SVM model) to predict the subway passenger flow, and the prediction errors of different models are compared. Finally, taking the Suzhou Metro data as an example and the passenger flow of FenHu Road station is predicted. The passenger flow forecast of the subway station is realized. The prediction results show that this method can effectively improve the prediction error and the prediction results are more accurate, proving the PSO-SVM method can be effectively applied to the study of subway passenger flow prediction as a new method for the prediction of subway passenger entry flow.Keywords:transport engineering; urban rail transit; passenger flow prediction; support vector machine; passenger entry flow城市軌道交通在缓解城市道路拥堵方面发挥着重要作用,随着城市轨道交通线网规模的扩大,根据客流量变化动态调整运输组织方案,保障地铁安全有效运营尤为重要。

进站客流量是客流量预测的重要组成,影响进站设施布置和进站流线组织[1],能够帮助轨道交通运营部门编制车站日常运营组织。

现有预测的方法有很多种,基于数学与统计理论的预测方法主要有时间序列模型、回归预测模型、卡尔曼滤波模型、神经网络模型、非参数回归预测方法、支持向量机模型预测等方法。

王莹等[2]利用SARIMA模型对北京地铁进站客流量进行时间序列建模,但没有考虑时间以外的其他信息,而轨道交通是复杂的非线性系统,会受到多种因素的影响。

孟品超等[3]运用历史客流相似性特点,通过滑动平均法来预测地铁站点各个时间段的客流量,该方法对历史客流要求较高。

客流预测方法通常集中于神经网络模型[4]、非参数回归预测方法[5]、支持向量机模型预测方法[6]。

非参数回归预测方法不需要先验知识,但需要足够的历史数据;神经网络模型对初始权值非常敏感,算法稳定性差。

而支持向量机模型预测方法能够较好地解决“局部极小点”、“非线性和维数灾难”、“小样本”等问题,但大多应用在故障检测以及道路交通方面。

王惟等[7]利用小生境粒子群算法优化支持向量机模型来预测道路交通流。

邓浒楠等[8]根据短期公交客流具有非线性、随机性和复杂性的特点,以及支持向量机单核核函数存在自适应能力较弱的问题,提出了一种基于多核最小二乘支持向量机的公交客流预测方法,兼顾交通状态的规律性和时变性特征。

刘润莉[9]运用蚁群算法改善支持向量机模型预测地铁进站日客流量,但预测效果不佳。

赵钰棠等[10]通过构造支持向量机模型预测地铁进站小时客流量,但预测因子的选择比较单一。

第1期郭文,等:基于支持向量机模型的地铁进站客流量预测河北工业科技第36卷笔者在自动售检票系统提供的乘客刷卡数据的基础上,采用支持向量机模型,考虑到地铁客流的特性,结合支持向量机模型工具箱对客流数据进行学习训练,运用粒子群优化算法进行参数寻优确定预测模型,并通过预测数据与原始数据对比来验证预测的有效性。

1预测模型原理1.1支持向量机算法支持向量机(SVM)是建立在VC维和结构化经验风险最小化原理的基础上的一个凸二次优化问题,可以在模型的复杂性和学习能力之间寻求最佳折中,可以较好地解决“小样本”、“非线性和维数灾难”等问题,具有良好的推广性[11]。

对于给定的样本集{(xi,yi)|i=1,2,…,k},(其中xi为输入值,yi为输出值),假设其服从于未知函数y=f(x)。

首先用函数g(x)=(w·x)+b对样本数据集拟合,并使得函数f和函数g之间的距离最小,即损失函数R(f,g)=∫L(f,g)dx。

根据结构风险最小化原则,非线性支持向量可以求解为min[12‖w‖2+C∑ki=1(ξi+ξ*i)],yi-(w·x)-b≤ε+ξi,(w·x)+b-yi≤ε+ξ*i,ξi,ξ*i≥0,(1)其中:ε>0,为拟合精度;ξi为目标之上超出ε部分所设;ξ*i为目标之下超出ε部分所设;常数C>0代表惩罚系数;w,b为特征空间的分类器;利用Lagrange优化方法将上述问题转化为对偶问题:max[-12∑ki,j=1(ai-a*i)(aj-a*j)(xi·xj)-ε∑ki=1(ai+a*i)+∑ki=1yi(a*i-ai)],∑ki=1(ai-a*i)=0,ai,a*i∈[0,C],(2)其中ai与a*i为Lagrange因子。

通过核函数K(xi,xj)将其转换为高维空间,此时求解得到回归函数:f(x)=(w·x)+b=∑ki=1(a*i-ai)K(xi·xj)+b*。

(3)核函数K(xi,xj)的选取在支持向量机运用计算中十分重要。

常用的核函数有多项式核函数,径向基核函数以及Sigmoid核函数。

采用Gauss径向基函数,式(4)作为核函数:K(x,x′)=exp(-‖x-x′‖2/σ2)。

(4)在运用支持向量机模型建模中,参数的选取对模型精度和推广能力有着直接影响,进而影响模型的预测性能。

总希望能够找到最佳的参数组合。

现有的参数选取确定方式有交叉确定法、经验法等传统方法以及粒子群算法、遗传算法等智能算法。

交叉确定法是将样本数据划分为K组,任意抽取K-1组样本作为训练集并将训练结果用于剩余样本的验证,经过多次训练和验证,直到所有样本皆作为验证样本,计算成本偏高,樣本需求大,在实际操作中存在困难。

而经验法则需要根据参数与样本间的先验公式来确定,需反复实验。

经典的遗传算法进行参数寻优时易得到局部最优解,而粒子群算法通过不断调整自身最优和种群最优的关系能够很好地避免陷入局部最优解问题,寻得参数最佳组合,因而本文选取粒子群算法来进行参数寻优[12]。

1.2粒子群算法粒子群算法(PSO)[13]是通过模拟鸟群的觅食行为从而求解优化问题。

首先,在解空间内随机初始化鸟群,鸟群内的每一只鸟称为“粒子”,这些“粒子”在全部解空间内以某种规律移动,经过若干次迭代后找到最优解。

在每一次迭代中、粒子通过跟踪2个“极值”来更新自己。

在目标搜索空间中,有一个n个粒子组成的粒子群,每个粒子包含了2个D维的向量,位置向量xi=(xi1,xi2,…,xiD)以及速度向量vi=(vi1,vi2,…, viD)。

粒子群中存在适应度函数以衡量粒子在整个解空间的好坏。

因此在整个粒子群进行解空间搜索时会有2个最优极值,一个是粒子本身的最优解pi=(pi1,pi2,…, piD),另一个极值是整个微粒子群目前找到的最优解pg=(pg1,pg2,…,pgD),找到这2个极值后,不断比较粒子的适应值与自身最优解与种群最优解之间的关系,从而每个粒子依据式(5)和式(6)不断更新自己的飞行速度和位置。

相关文档
最新文档