多分类器组合的交通拥堵预测模型研究_李春英

合集下载

基于深度学习的交通流量预测研究

基于深度学习的交通流量预测研究

基于深度学习的交通流量预测研究近年来,由于城市化进程的不断加速,交通拥堵问题成为制约城市发展的重要因素之一。

交通流量预测作为交通管理和规划的重要手段,能够提前预测道路交通状况,为交通部门和驾驶员提供有效的决策依据。

随着深度学习技术的迅猛发展,基于深度学习的交通流量预测引起了研究者的广泛关注,并取得了显著的成果。

传统的交通流量预测方法主要依赖于统计学模型,如线性回归模型、ARIMA模型等。

这些模型在一定程度上能够提供一定精度的预测结果,但受限于人为制定的特征和假设条件,无法充分挖掘交通数据中的深层信息。

相比之下,基于深度学习的交通流量预测方法具有更强的自动学习能力,能够直接从原始数据中提取特征并预测未来的交通流量。

基于深度学习的交通流量预测方法主要分为两种:时空特征融合和模型融合。

时空特征融合方法主要通过卷积神经网络(CNN)或循环神经网络(RNN)实现,将交通数据中的时空特征进行融合和提取。

CNN能够有效地提取空间特征,而RNN则能够捕捉时间序列的特征。

这两种网络的结合能够更全面地表达交通数据的特征。

模型融合方法则通过将多种深度学习模型进行融合,充分利用各个模型的优势,提高预测的准确性和稳定性。

在时空特征融合方法中,卷积神经网络(CNN)广泛应用于交通流量预测。

CNN能够通过多个卷积层和池化层,逐渐提取原始数据中的空间特征。

例如,可以将路段划分为网格,将每个网格上的车辆数量作为输入,通过多层卷积和池化操作,得到各个网格的特征表示。

然后,将这些特征连接起来,通过全连接层预测未来的交通流量。

此外,循环神经网络(RNN)也被用于交通流量预测。

RNN能够捕捉时间序列的依赖关系,通过记忆过去的状态,预测未来的交通流量。

将RNN与CNN 相结合,可以同时考虑时空特征,提高预测的准确性。

在模型融合方法中,集成学习是一个常用的技术。

集成学习通过将多个基模型进行集成,得到一个更为准确和稳定的预测结果。

例如,可以通过Bagging方法,采用不同的深度学习模型训练多个基模型,并利用投票或平均策略进行预测结果的融合。

高速公路路段交通流量预测与拥堵分析研究

高速公路路段交通流量预测与拥堵分析研究

高速公路路段交通流量预测与拥堵分析研究随着城市发展和交通需求的增加,高速公路已经成为现代交通体系中不可或缺的一部分。

然而,随之而来的问题就是高速公路拥堵,给人们的出行带来了许多不便。

因此,预测交通流量和分析拥堵现象成为了城市规划和交通工程领域的热门研究话题。

要解决高速公路上的交通拥堵问题,首先需要准确预测交通流量。

交通流量的预测是指利用历史数据和数理模型等手段,对未来一段时间内车辆在各路段的流量进行预测。

这一过程中,需要考虑的因素包括但不限于车辆类型、时间段、天气等。

通过分析历史数据和车辆行驶规律,我们可以发现交通流量在不同时间段之间存在着周期性和规律性的变化。

例如,在早晚高峰期间,交通流量较大;而在夜间,交通流量相对较小。

利用这些规律性的变化趋势,我们可以基于数据拟合和统计模型,对未来的交通流量进行预测。

一种流行的方法是利用机器学习算法进行交通流量预测。

机器学习是指计算机利用数据和统计学方法进行自主学习和优化的一种人工智能技术。

对于交通流量预测来说,我们可以输入大量历史数据,通过机器学习算法训练模型,使其具备根据实时数据进行预测的能力。

这样,我们就可以借助这些模型对未来交通流量进行预测,并采取相应的交通管理措施,以减轻道路拥堵。

然而,光对交通流量进行预测还不够,我们还需要进一步分析交通拥堵的原因和影响因素,才能够制定出更加精确有效的缓解拥堵措施。

交通拥堵的原因可以归结为两个方面:供给因素和需求因素。

供给因素主要是指道路和交通基础设施的状况,包括道路宽度、设计标准、交叉口设置等。

较低的供给水平会导致交通流量超过道路承载能力而造成拥堵。

需求因素则主要考虑交通参与者的行为和需求状况,例如车辆载客率、出行目的等。

通过对这些因素的分析和研究,我们可以找到改善高速公路交通拥堵的切入点。

一种常用的分析方法是交通模拟仿真。

这种方法模拟车辆在道路上的运行情况,并根据实际交通条件和参与行为等因素,预测交通流量和拥堵状况。

基于大数据的交通拥堵分析与控制研究

基于大数据的交通拥堵分析与控制研究

基于大数据的交通拥堵分析与控制研究在城市化快速发展的时代,交通拥堵已经成为了许多大城市面临的一个棘手问题。

交通拥堵不仅会浪费人们的时间和精力,也会对城市的环境和经济造成巨大的影响。

因此,对于交通拥堵的分析与控制研究也成为了许多城市管理者和交通专家关注的焦点。

大数据时代的到来为交通拥堵的分析与控制提供了一个全新的角度和工具。

在互联网和移动通信技术的支持下,交通数据的采集和分析已经变得更加可行和实用。

通过大数据技术,我们可以更加准确地了解交通状况、预测未来交通趋势、优化交通流以及制定更加科学合理的交通规划和管理策略。

一、大数据采集与处理通过移动通信技术,我们可以采集到各种交通数据,包括车辆位置、速度、路线,以及交通事件、路段拥堵情况等信息。

这些数据的处理和分析可以帮助我们更加深入地了解交通状况,并从中发现一些规律和趋势。

例如,北京市“交通大脑”系统就采用了大数据技术,实时采集车辆位置和速度数据,将各个路段的车辆流量和速度等信息进行可视化展示。

这样的数据处理分析可以让城市管理者更加清晰地了解各个路段的拥堵情况,及时调度交通流量,避免交通拥堵。

二、交通拥堵模型交通拥堵模型是基于大数据技术的交通控制的核心。

通过收集和分析交通数据,可以建立交通拥堵的数学模型,用于预测和控制未来的交通状况。

例如,利用交通拥堵模型可以预测未来的交通流量并对路线进行优化。

在交通拥堵的时候,可以通过调整交通信号灯控制时间、设置临时车道等方式,缓解交通拥堵状况。

三、个性化交通服务在大数据技术支撑下,交通管理者可以为公众提供个性化交通服务。

例如,通过收集用户数据和行车历史,可以为用户提供更加个性化的交通出行建议和服务。

交通管理者还可以通过大数据分析,针对不同交通用户提供不同的出行建议和服务,既符合个人需求又让整体交通流畅。

四、大数据在城市交通规划中的应用大数据在城市交通规划中也有着非常广泛的应用。

通过收集和分析交通数据,可以发现城市交通的热点和瓶颈,为城市交通规划提供更加精准的数据支持和指导。

交通量预测的方法

交通量预测的方法

交通量预测的方法交通量预测是指通过对道路、交通工具和交通参与者的分析,预测未来交通流量和拥堵情况的一种方法。

交通量预测对于交通规划、交通运输管理和交通基础设施建设非常重要,可以帮助决策者制定合理的交通政策和优化交通网络。

下面将介绍几种常用的交通量预测方法。

1. 经验模型方法经验模型方法是基于历史数据和统计分析的预测方法。

这种方法通常利用历史交通数据和相关的影响因素(如天气、节假日等)建立数学模型,并根据模型进行预测。

常见的经验模型方法包括回归分析、时间序列分析和灰色系统模型等。

这些方法可以通过对历史数据的拟合来预测未来交通量,但不考虑交通系统的动态变化和非线性关系。

2. 交叉影响分析方法交叉影响分析方法是指通过研究不同因素之间的相互关系,来预测交通量的一种方法。

这种方法通常将交通量视为多个影响因素的综合结果,通过建立这些影响因素之间的关系模型来进行预测。

常见的交叉影响分析方法包括结构方程模型、因子分析和模糊关联分析等。

这些方法可以更准确地模拟各个因素之间的影响关系,提高预测精度。

3. 基于机器学习的方法基于机器学习的方法是指利用机器学习算法来预测交通量的一种方法。

这种方法通过对交通数据进行训练和学习,建立预测模型,并利用模型对未来交通量进行预测。

常见的基于机器学习的方法包括支持向量机、随机森林和神经网络等。

这些方法可以根据大量数据进行精确的模型训练和预测,具有较高的预测精度。

4. 综合模型方法综合模型方法是将多种预测方法结合起来,综合考虑各种因素的影响,进行交通量预测的一种方法。

这种方法通过构建多种预测模型,并结合模型的预测结果,进行综合预测。

常见的综合模型方法包括层次分析法、模糊综合评价和灰色关联分析等。

这些方法可以考虑到各种因素的权重和关联程度,提高预测结果的可靠性和准确性。

总的来说,交通量预测是一个复杂而关键的问题,需要综合考虑多个因素,并采用合适的分析方法。

不同方法各有优缺点,选择适合的方法取决于预测的具体需求和可用的数据。

基于车辆轨迹数据的交通拥堵识别与预测研究

基于车辆轨迹数据的交通拥堵识别与预测研究

基于车辆轨迹数据的交通拥堵识别与预测研究随着城市化的不断推进,交通拥堵正逐渐成为我们生活中日益突出的问题。

在这个背景下,基于车辆轨迹数据的交通拥堵识别与预测成为了研究的热点。

本文将探讨这一领域的重要性、困难性以及当前的研究成果。

第一部分:交通拥堵的影响与需求交通拥堵给我们的生活带来了巨大的不便,它不仅浪费了大量的时间和能源,还增加了空气污染和道路事故的风险。

因此,准确地识别和预测交通拥堵情况对于提高交通效率、减少能源消耗和改善环境质量具有重要意义。

而基于车辆轨迹数据的分析是实现这些目标的有效途径。

第二部分:基于车辆轨迹数据的交通拥堵识别方法目前,基于车辆轨迹数据的交通拥堵识别主要依靠数据挖掘和机器学习技术。

研究人员通过采集大量车辆行驶数据,并结合地理信息系统等辅助数据,利用聚类分析、时间序列分析和神经网络等算法对车辆轨迹进行挖掘和分析,以识别和刻画交通拥堵的特征和模式。

这些方法可以帮助我们深入洞察交通拥堵的成因和演化规律,为交通管理部门制定有效的应对策略提供科学依据。

第三部分:基于车辆轨迹数据的交通拥堵预测方法除了识别交通拥堵,基于车辆轨迹数据的研究还包括预测交通拥堵的方法。

预测的准确性对于交通管理具有重要意义,可以帮助交通管理者提前做出调整,减轻拥堵情况。

预测方法主要利用历史车辆轨迹数据和相关辅助数据,通过时间序列、回归分析等模型来建立拥堵情况与其他因素之间的关系,并对未来的交通拥堵状况进行预测。

这种方法的应用能够提高交通管理的效率,并为公众提供更准确的交通信息,帮助人们规划出行路线。

第四部分:研究挑战与未来发展方向基于车辆轨迹数据的交通拥堵识别与预测虽然在近年取得了很大的进展,但仍然面临许多挑战。

首先,数据采集和处理的成本较高,需要投入大量人力和物力。

其次,由于交通拥堵的多样性和复杂性,建立准确的预测模型仍然存在困难。

同时,交通拥堵状况往往与其他因素密切相关,如天气、道路状况等,综合考虑这些因素对拥堵的影响将是未来研究的重要方向。

短时交通流量预测模型研究与优化

短时交通流量预测模型研究与优化

短时交通流量预测模型研究与优化摘要:随着城市交通流量的不断增加,短时交通流量的预测和优化成为城市交通管理的重要课题。

本文旨在研究和优化短时交通流量预测模型,以提高城市交通流量管理的效率和准确性。

引言:在现代城市生活中,交通拥堵问题严重影响了人们的出行效率和生活质量。

因此,预测和优化交通流量成为城市交通管理的关键。

通过研究短时交通流量预测模型,可以准确预测和及时调整交通流量分布,以提高道路利用率和减少拥堵现象。

一、短时交通流量预测模型的研究1. 数据收集与处理对于交通流量的预测,关键是准确收集和处理数据。

通过交通摄像头、交通监测设备以及车辆GPS数据等方式获取关键数据,然后运用数据处理技术进行清洗和分析,为后续的模型建立提供可靠的数据支持。

2. 建立统计模型基于历史数据的分析,可以建立基于统计学的预测模型,如ARIMA模型、灰色模型等。

这些模型可以对短时交通流量进行趋势分析和周期性分析,为交通管理部门提供实时的交通流量预测结果。

3. 机器学习模型随着机器学习技术的不断发展,可以利用神经网络、决策树和支持向量机等机器学习模型来预测交通流量。

这些模型可以利用大量历史数据进行训练,从而根据历史数据和实时数据进行预测,提高预测的准确性和精度。

4. 实时数据分析为了更准确地预测交通流量,必须实时获取交通数据并进行实时分析。

通过实时数据分析,可以发现交通流量的变化趋势和特征,为交通管理部门提供有效的决策支持。

二、短时交通流量预测模型的优化1. 特征选择在建立预测模型时,必须选择合适的特征。

特征选择既要能体现交通流量的特点,又要避免特征之间的冗余性。

通过特征选择技术,可以提高模型的预测准确性和效率。

2. 参数优化对于机器学习模型,参数的选择对预测结果的准确性和稳定性有很大影响。

通过参数调整和优化算法,可以找到最优的参数组合,提高模型的性能。

3. 集成学习通过集成多个预测模型,可以提高预测的准确性和鲁棒性。

集成学习技术可以将多个模型的预测结果进行加权融合,从而得到更可靠和准确的预测结果。

基于机器学习的城市交通流量预测研究

基于机器学习的城市交通流量预测研究

基于机器学习的城市交通流量预测研究随着城市化进程的加速,城市交通问题日益凸显。

交通拥堵不仅浪费了人们的时间和精力,还增加了能源消耗和环境污染。

为了有效地缓解交通拥堵,提高交通系统的运行效率,城市交通流量的准确预测显得至关重要。

近年来,机器学习技术的迅速发展为城市交通流量预测提供了新的思路和方法。

一、城市交通流量预测的重要性准确的城市交通流量预测能够为交通管理部门提供决策支持,帮助他们优化交通信号灯设置、调整道路规划、合理安排公共交通资源等。

对于出行者来说,交通流量预测可以帮助他们选择最佳的出行路线和出行时间,减少出行成本和时间浪费。

此外,对于物流企业来说,准确的交通流量预测有助于优化配送路线,提高物流效率。

二、传统交通流量预测方法的局限性传统的交通流量预测方法主要包括基于历史数据的统计方法和基于数学模型的方法。

统计方法通常简单直观,但对于复杂的交通状况和非线性关系的处理能力有限。

数学模型方法虽然能够考虑一些交通因素之间的关系,但往往需要对交通系统进行大量的简化假设,导致预测精度不高。

三、机器学习在城市交通流量预测中的应用机器学习算法具有强大的学习和泛化能力,能够自动从大量的数据中提取特征和规律,从而更好地处理交通流量预测中的复杂性和不确定性。

(一)决策树算法决策树通过对数据进行分裂和归纳,构建出一棵决策树来进行预测。

它能够清晰地展示预测的逻辑和规则,但容易出现过拟合的问题。

(二)支持向量机算法支持向量机通过寻找一个最优的超平面来对数据进行分类或回归预测。

在处理小样本和高维数据时具有较好的性能,但计算复杂度较高。

(三)神经网络算法神经网络是一种模拟人脑神经元结构的算法,具有很强的非线性拟合能力。

多层神经网络可以学习到数据中的深层次特征,但训练时间长,参数调整复杂。

(四)集成学习算法集成学习通过组合多个弱学习器来构建一个强学习器,如随机森林和Adaboost算法。

能够提高预测的稳定性和准确性。

四、基于机器学习的城市交通流量预测的数据来源(一)传感器数据包括道路上的车辆检测器、摄像头等设备采集的数据,如车流量、车速、车型等。

基于机器视觉的交通拥堵检测与预测系统研究

基于机器视觉的交通拥堵检测与预测系统研究

基于机器视觉的交通拥堵检测与预测系统研究随着城市化程度的不断提高和交通流量的剧增,交通拥堵问题已经成为了城市发展面临的重要挑战之一。

交通拥堵不仅浪费了大量的时间和能源,还对环境和人体健康造成了严重影响。

因此,如何准确地检测和预测交通拥堵成为了城市交通管理的热点问题之一。

本文将介绍一种基于机器视觉的交通拥堵检测与预测系统,并探讨其研究方法和应用前景。

一、研究背景和意义交通拥堵是城市发展中普遍存在的问题,尤其是在高峰时段和拥挤的交通枢纽。

人工检测方法繁琐且耗时,无法满足实时监测和预测的需求。

利用机器视觉技术来解决这一问题具有很大的潜力和优势。

机器视觉可以通过图像和视频数据分析来实现交通拥堵的监测和预测,具有高效、准确、实时等特点,可为交通管理者提供决策和调度依据,提高交通效率和减少拥堵状况。

二、研究方法1. 数据采集:利用摄像头、监控设备或者无人机等工具,对道路交通场景进行数据采集。

采集到的数据包括图像、视频和其他相关环境信息。

2. 图像预处理:对采集到的图像进行预处理,包括去噪、灰度化、边缘检测、目标分割等操作,以便后续的特征提取和分析。

3. 特征提取:在预处理的基础上,通过图像处理和计算机视觉技术提取图像中的交通相关特征。

例如,车辆的数量、速度、密度、行驶轨迹等信息。

4. 数据集建立:基于采集到的数据和提取到的特征,建立交通拥堵的训练数据集和测试数据集,以便进行机器学习和模型训练。

5. 模型训练和优化:利用机器学习、深度学习和计算机视觉等技术,建立交通拥堵检测和预测的模型。

通过对训练数据进行模型训练和优化,提高模型的准确性和稳定性。

6. 算法实现和系统集成:将训练好的模型应用到交通拥堵检测与预测系统中,并进行算法实现和系统集成。

系统应具备实时性、稳定性和可靠性,为交通管理者提供可视化的交通拥堵检测结果和预测报告。

三、系统应用与前景基于机器视觉的交通拥堵检测与预测系统具有广泛的应用前景和实际价值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

50882010,31(23)计算机工程与设计ComputerEngineeringandDesign
0引言
交通拥堵是交通拥挤和交通堵塞的统称,目前各国用来
衡量交通拥堵的参数主要有拥堵时间、排队长度、车速等。中
国公安部则对拥堵路段给出了定义:车辆在车行道上受阻且
排队长度超过lkm的状态。美国诺贝尔奖获得者GaryS.Becker
曾做过一个测算,全球每年因交通拥堵造成的损失占GDP的
2.5%
[1]
,造成巨大的资源浪费。在中国由于汽车保有量的急剧

上升,这种趋势还在增加。对于交通拥堵的治理,应该尽量做
到事前处理,即当道路的交通状态出现轻度拥挤现象时,能够
通过拥堵预测系统分析出短时间内的交通状态变化趋势,然
后利用GPS信息平台、广播等发出预警,诱导车辆进行合理分配行驶、加强秩序管理,来避免拥堵或缓解拥堵程度。国内外大多数文献对于交通拥堵识别预测方法,主要有人工判别法、模糊理论、模式识别、神经网络等技术,不过单独利用其中一种方法进行交通拥堵的判别,其准确率及可靠性难以保证[2]。并且多数文献中主要利用交通流信息来预测交通拥堵,利用交通流检测信息及环境信息多源组合来进行城市交通拥堵判别的文献较少。文中充分考虑各种环境因素的基础上采用多分类器组合的方法来保证模型的稳定性,为提高预测的准确程度,采用了Bagging类算法形成单分类器的训练集,然后通过简单多数投票法对城市道路的交通状态进行集成决策。实验数据表明,多分类器组合的模型在城市道路拥堵预测方面是可行的,可以提高BP神经网络的泛化能力和获得更高的识别率,能够为交通拥堵预警及诱导系统提供数据上的支持。1输入数据处理分析现实中一些环境因素对于城市道路交通状态的影响是非
常重要的,比如暴雨经常容易造成交通瘫痪,上、下班的高峰
时段容易造成道路拥挤,另外节假日和一些市政施工等也会
造成道路拥挤。因此本文对于交通状态预测模型的输入数据
主要有两部分组成:一类是环境因素,对于环境因素的处理涉

收稿日期:2010-05-20;修订日期:2010-07-22。

智能技术
李春英,汤志康,曹元大:多分类器组合的交通拥堵预测模型研究2010,31(23)5089
及到如何将定性的描述转换成定量的数据作为多分类器模型
的输入。另一类是交通流参数,由交通部门直接获得。由于
其原始数据基本上都存在噪声,必须根据经验知识对数据进
行预处理,主要包括相关性分析、数据噪声的清理、输入数据的归一化等[3]。1.1环境因素数据处理根据德克萨斯大学交通部对交通拥堵来源分类的数据研究,文中对于交通状态所涉及的环境因素主要从4个方面进行处理:(1)气候W的影响。气候影响分成5个等级,借助于天气预报的预警信号颜色,没有出现预警信号时,用0.1表示;蓝色预警信号用0.3表示;黄色预警信号用0.5表示;橙色预警信号用0.7表示;红色预警信号用0.9表示。(2)时段T的影响。上下班高峰7:30-9:00和16:30-18:30用0.9表示;中午上、下班11:30-15:00用0.7表示;9:00-10:30用0.5表示;20:30-22:00用0.3表示;其余时段用0.1表示。(3)特殊事件S的影响。主要涉及市政工程,道路维修,交通事故,体育盛会等。道路无特殊事件的时候用0.1表示,当存有上述特殊事件的时候,可按照对交通状态的影响程度依次用0.3、0.5、0.7、0.9表示。(4)假日H的影响。非假日时用0.1表示,周六、日时用0.3表示,其它法定的节假日按照休假的时间长短依次用0.5、0.7、0.9表示对交通的影响程度。1.2交通流参数的处理2007版《城市道路交通管理评价指标体系》对于城市交通通行状况的描述主要涉及到3个方面:①交叉路口阻塞率,衡量整个路网饱和程度的指标;②平均行程延误;综合地反映出城市路网的整体性能和城市交通管理的效率及水平。③高峰时段建成区主干道平均车速,用以评价道路的通畅程度,高峰时段主干道平均车速是指建成区早、晚交通流高峰时主干道上机动车的平均行程车速。由于模型的输入参数中已经考虑了与交通拥堵相关的环境因素,所以我们在模型输入参数中的交通信息仅仅使用路段平均行程车速表示观测路段的长度(m),表示第表示单位时间内检测到的车辆总数(veh)。平均行程车速也可以由GPS浮动车和线圈检测数据进行组合后得出观测路段的平均行程时间[4],然后通过路段长度与平均行程时间之比得出平均行程车速。每个城市的交通状态与平均行程车速之间的对应程度各不相同,需要通过经验数据得出,以肇庆市为例将路段平均行程车速划分为4个级别:①通畅:该路段的平均行程车速≥25km/h。②拥挤:该路段的平均行程车速10km/h≤<25km/h,相当于骑自行车的速度。③堵塞:该路段的平均行程车速3km/h≤<10km/h,相当于步行速度。④死锁:该路段的平均行程车速<3km/h,车辆几乎不能前行。综合环境因素和平均行程车速可得到多分类器的输入变量=,,ÖµºÍÉÏһʱ¼äÐòÁеÄ4个环境因素共7个因素,作为多分类器交通状态判决系统的输入,实时得出下一时间序列的交
通状态,然后根据给定的阈值

≤0.1死锁,0.1<≤0.8拥挤,0.8<

1+
50902010,31(23)计算机工程与设计ComputerEngineeringandDesign
结果的显著变动,而对稳定的学习算法效果不明显,有时甚至
使预测精度降低。Bagging是一种通过重取样技术提高组合
学习的差异性。其基本思想是:单分类器的训练集通过重复
抽样的方式自主选择若干样本组成,训练集的规模与原始数
据集规模相当,通过处理后一些样本在训练集中出现的概率
是随机的。Bagging方法通过重新选取训练集,增加各训练集
之间的差异,从而使单分类器模型参数的差异度增加,提高整
个多分类器的泛化能力。因此本模型采用Bagging类算法来
提高预测模型的稳定性和精度。
2.2组合规则
常见的组合规则有投票法、基于概率的方法等,这些方法
需要苛刻的前提条件:各分类器要相互独立。Kittler给出了多
分类器组合的理论框架,在此基础上得出组合的两个基本规
则:和规则与积规则。其中和规则表现出较好的分类性能,原
因是和规则对误差影响的抵制力较强。本模型采用和规则中
的一种:简单多数投票法,由单分类器对样本进行预测(决策),
每一个单分类器对自己所预测的类投一票,得到票数最多的
类就是分类器系统的最终预测结果。在投票的时候,对各单
分类器一视同仁,各个单分类器的权值相同。设样本类别总
数为=1,2,…,
£¬ÏµÍ³µÄ×îÖÕ·ÖÀà½á¹û¿É±íʾΪ
[3]
:=

argmax{1,2,…,1
{}

2.3性能评价
构造出多分类器模型后,需要评价该多分类器模型对给
定问题的泛化程度,以便了解该模型对数据进行分类时的性
能表现如何,是否足够适合用于给定的问题。评价多分类器
的一个基本要求是:测试集当中不能包含用于训练单分类器
时的训练样本,否则会导致“用训练集进行测试”的方法论上
的错误。由于分类器对训练它的数据存在着过分特化的现象,
所以,如果用训练数据来评价分类器的话,可能会得到过于乐
观的估计。本模型的仿真实验是用样本集的一部分作为训练
数据,余下的样本用于检测分类器的分类性能。
多分类器系统的性能通常用识别率来评价,即被正确识
别的测试样本数占总测试样本的比率,但是仅仅通过识别率
来评价一个多分类系统的优劣存在一定的不足之处,因为同
一个分类系统可以通过增大识别的阈值
李春英,汤志康,曹元大:多分类器组合的交通拥堵预测模型研究2010,31(23)5091
多分类器模型的处理过程保持不变。
仿真结果分成两种情况:考虑环境因素的影响时如图3
所示,图中显示随着单分类器个数的增加,当单分类器数量超
过30个时预测结果基本趋于稳定;没有考虑环境因素的影响
时仿真结果如图4所示,可以看出随着分类器数量的增加其
预测精度同样会得到提高,但其稳定性并不理想,也就是说本
文所列出的4类环境因素对于城市道路交通状态是有影响的。
因此,通过比较两类仿真结果可以说明以下几个问题:其一,
该多分类器模型对交通状态预测有较好的适用性,识别率接
近90%,而误报率仅为3%,理论上可以为城市交通诱导、预警
系统提供数据支撑;其二,多分类器模型的预测效果优于单个
分类器,可以提高进一步系统的泛化能力,由图3可以看出多
分类器模型的识别率高于单分类器15%;其三,考虑环境因素
时预测精度及模型稳定性都要优于单纯利用交通流参数

相关文档
最新文档