一种用于城市交通的优化声音识别仿真

合集下载

智能交通系统中的虚拟仿真与实时优化方法

智能交通系统中的虚拟仿真与实时优化方法

智能交通系统中的虚拟仿真与实时优化方法智能交通系统是指利用先进的信息与通信技术,对道路、车辆和交通参与者进行智能化管理和控制的系统。

随着城市化进程的不断推进和交通拥堵问题日益严重,智能交通系统正逐渐成为解决交通问题的关键手段之一。

在智能交通系统中,虚拟仿真和实时优化是两个重要的技术方法。

虚拟仿真是指通过计算机模拟交通系统的运行,从而获得系统的运行状态和性能指标。

在智能交通系统的设计和优化过程中,虚拟仿真可以帮助交通规划员和决策者更好地了解现有系统的运行情况,发现潜在的问题,并进行预测和优化。

虚拟仿真可以模拟道路网络、车辆行驶路径、交通需求、信号控制等各个方面的情况,通过调整参数和变量,评估不同的交通管理策略的效果。

虚拟仿真在智能交通系统中具有多个优点。

首先,虚拟仿真可以避免在真实环境中进行试验的风险和成本,同时还可以模拟各种复杂的交通情景,在不同的条件下进行测试和优化。

这样一来,交通规划员和决策者可以通过多次仿真实验,找到最佳的交通管理策略,从而提高整体交通系统的效率和安全性。

其次,虚拟仿真可以快速反馈结果,使得决策者能够及时地了解改变参数和策略的结果,进而对交通系统进行实时的调整和优化。

此外,虚拟仿真还可以进行交通情景的演练,为紧急情况下的交通控制提供帮助。

总的来说,虚拟仿真对提升交通系统的效率和安全性,降低管理成本和风险具有重要的作用。

实时优化是指在交通系统运行过程中,根据实时的交通信息和系统状态,动态调整交通管理策略,以达到最佳的效果。

实时优化的目标是实现交通系统的高效率、低延迟和低碳排放。

为了实现实时优化,智能交通系统采集各种交通数据,包括车辆行驶速度、交通流量、道路状况等,并将其实时传输到中央控制中心。

中央控制中心利用这些实时数据,使用优化算法快速计算出最佳的信号控制策略,并将其发送给信号控制设备进行执行。

交通管理者还可以根据需要,在实时优化的基础上,设置不同的优化目标,如减少拥堵、提高道路通行能力等。

基于虚拟现实技术的交通场景仿真与优化

基于虚拟现实技术的交通场景仿真与优化

基于虚拟现实技术的交通场景仿真与优化随着科技的不断发展和创新,人们对于信息和数据的处理能力,已经达到了一个前所未有的高度。

随着互联网技术、大数据技术以及包括人工智能、物联网技术等在各行各业中的普及和应用,都已经带来了巨大的改变。

在交通出行方面,虚拟现实技术的应用也越来越多。

一、虚拟现实技术的介绍虚拟现实技术(Virtual Reality)是一种能够利用计算机等技术模拟出真实世界环境的技术。

通俗的说,就是模拟一个虚拟的环境,并让人们在这个虚拟环境中感受到仿佛身临其境的感觉。

在虚拟现实技术中,通过3D影像与交互式系统融合,在合适的设备下,可以让使用者直接获得视听感受。

尊从现实数据模拟,在仿真场景中进行操作与修改,以达到可视化的效果,真实世界与虚拟世界的结合,让人们能够在虚拟现实中体验到现实世界不曾有的体验,可以创造出完全不同于现实情形的场景。

二、虚拟现实技术在交通场景中的应用基于虚拟现实技术的交通仿真系统,可以重现道路交通、城市交通、高速公路交通等各种不同路段的情况,既可以利用真实现实数据进行模拟,也可以根据特定的需求和情况进行场景的创造,以此来达到更好的交通规划和优化。

例如,在城市的道路交通中,通过虚拟现实技术的仿真,可以模拟出不同时间段内不同车流量的情况,并进行相应的配置,使得交通繁忙的情况得到缓解,同时也能够优化道路的规划和设计。

在高速公路交通方面,通过虚拟现实的技术,可以针对较为危险和特殊的交通情况进行场景的模拟,以此来做有效的仿真测试和模拟演练,提升规范化行驶,避免车祸的发生。

同时,借助人工智能、大数据等技术,还可以通过数据分析和预测,对未来交通拥堵、安全等问题进行相关的优化。

例如,在高峰期时加强公交线路,可以优化道路利用率,降低拥堵的发生,方便出行。

三、虚拟现实技术在交通场景中的优势1.提高交通规划的便捷性和准确性:利用虚拟现实技术,能够对不同车辆、行人等行为数据进行模拟,以此为基础,对于交通场景的仿真模拟,能够更加方便地进行调整和定位。

《基于MATSim与SUMO的多分辨协同交通仿真系统设计与实现》范文

《基于MATSim与SUMO的多分辨协同交通仿真系统设计与实现》范文

《基于MATSim与SUMO的多分辨协同交通仿真系统设计与实现》篇一一、引言随着城市化进程的加速,交通问题日益突出,对交通仿真系统的需求也日益增长。

为了更准确地模拟和预测城市交通状况,本文提出了一种基于MATSim与SUMO的多分辨协同交通仿真系统设计与实现。

该系统旨在提高交通仿真的准确性和效率,为城市交通规划、管理和优化提供有力支持。

二、相关技术概述1. MATSimMATSim(Multi-Agent Transport Simulation)是一种基于多智能体系统的交通仿真工具,能够模拟大规模交通网络中的个体行为。

它具有高度的灵活性和可扩展性,适用于各种交通场景的仿真。

2. SUMOSUMO(Simulation of Urban MObility)是一款开源的微观交通仿真软件,能够对城市交通网络进行精确的仿真和模拟。

SUMO支持多种交通模式,包括汽车、公共交通、自行车等,具有丰富的功能和灵活的接口。

三、系统设计1. 系统架构本系统采用多分辨协同的架构设计,将MATSim与SUMO 进行集成。

其中,MATSim负责宏观层面的交通仿真和规划,而SUMO则负责微观层面的车辆行为模拟和交通流分析。

两者通过数据交换和协同工作,实现多分辨的交通仿真。

2. 数据流程本系统的数据流程主要包括数据输入、数据处理、数据输出三个部分。

首先,从城市交通网络中获取道路、交通流、车辆等数据作为输入;然后,通过MATSim和SUMO进行多分辨的交通仿真和模拟;最后,将仿真结果以图表、报告等形式输出,供用户使用。

3. 功能模块本系统包括以下功能模块:数据预处理模块、MATSim仿真模块、SUMO模拟模块、数据分析与可视化模块等。

其中,数据预处理模块负责对输入数据进行清洗和整理;MATSim仿真模块负责进行宏观层面的交通仿真和规划;SUMO模拟模块负责进行微观层面的车辆行为模拟和交通流分析;数据分析与可视化模块则负责将仿真结果进行统计和分析,并以图表、报告等形式进行展示。

城市交通规划中的交通仿真技术使用教程

城市交通规划中的交通仿真技术使用教程

城市交通规划中的交通仿真技术使用教程交通是城市发展的重要支撑,而城市交通规划则是保障城市交通有序发展的基础。

随着城市化进程的加速,城市交通拥堵问题日益突出,因此,合理的交通规划显得尤为重要。

交通仿真技术作为城市交通规划中的重要工具,可以帮助规划者预测交通系统的运行状况、评估交通方案的可行性,并为城市交通规划提供科学依据。

本文将为大家介绍城市交通规划中交通仿真技术的使用方法与步骤。

一、交通仿真技术简介交通仿真技术是利用计算机模拟交通系统运行的一种方法。

其基本原理是根据现实道路网络和交通流的基本参数,建立交通仿真模型,并通过模拟交通流的生成、传播和交互等过程,预测交通系统的运行状况。

交通仿真技术的主要应用领域包括交通规划、交通管理、交通设施设计等。

二、交通仿真技术的使用方法1. 数据收集与处理:交通仿真技术需要依赖大量的数据来建立仿真模型,因此,首先需要收集城市交通相关的数据,包括道路网络图、交通流量、车辆速度等。

然后通过数据处理的方法将原始数据进行清洗和整理,以提高数据的准确性和完整性。

2. 建立仿真模型:建立交通仿真模型是仿真技术的核心环节。

根据收集到的交通数据,选择合适的仿真软件或工具,建立准确的道路网络拓扑结构和交通流模型,并设置相关的参数和约束条件。

3. 编制交通方案:根据交通仿真模型的建立,可以通过改变交通流量、信号配时等参数来模拟不同的交通方案。

通过多次模拟实验,评估各种方案下的交通运行情况,寻找最优的交通方案。

4. 评估仿真结果:根据交通仿真模型的运行结果,对交通流量、通行速度、拥堵程度等指标进行评估。

如果仿真结果不理想,可以尝试调整参数或修改交通方案,然后重新运行仿真模型,直到达到预期的效果。

5. 方案优化与调整:通过交通仿真技术的使用,可以获取到各种交通方案的优缺点。

根据评估结果,可以进行方案的优化和调整,提出改善城市交通的措施和建议。

三、常用的交通仿真软件目前,市面上有许多交通仿真软件可供选择。

VISSIM交通仿真软件模型的构建

VISSIM交通仿真软件模型的构建

VISSIM交通仿真软件模型的构建VISSIM交通仿真软件是一款用于城市交通模拟的工具,可以帮助交通工程师和规划师评估不同交通策略的效果,预测交通流量和拥堵情况,优化道路设计和信号灯控制。

在使用VISSIM之前,需要进行模型的构建。

下面是VISSIM交通仿真软件模型的构建流程。

第一步:定义区域首先,需要定义仿真区域的范围和形状。

可以选择一个现有的地图文件或者手动绘制道路的形状。

VISSIM支持多种导入格式,包括AutoCAD、Shapefile、OpenStreetMap等。

选择合适的导入格式后,可以将地图导入到VISSIM中进行编辑和调整。

第二步:添加道路在定义好区域后,需要在地图上添加道路。

通过VISSIM的“道路编辑器”可以添加和编辑各种类型的道路元素,如车道、交叉口、地下通道等。

在添加道路时,需要确定车道数、道路宽度、道路类型等参数。

为了保证模拟的精度和真实性,需要参考现实中的交通规划和道路设计标准。

第三步:定义车辆和行人VISSIM可以模拟各种类型的车辆和行人,并且可以根据实际情况调整其行为和特性。

在模拟车辆时,需要设置车辆类型、颜色、速度、加速度等参数。

在模拟行人时,需要设置行人类型、速度、行走路径等参数。

可以通过VISSIM的“行为模型编辑器”来定义车辆和行人的行为和特性。

第四步:设置交通信号灯和控制在仿真中,交通信号灯和控制是必不可少的。

可以在VISSIM中设置各种类型的信号灯和控制器,并且可以调整它们的时序、周期和配时。

通过VISSIM的“信号灯编辑器”可以方便地设置信号灯和控制器的参数。

第五步:定义路口和交叉口第六步:保存和导出模型完成模型的设置后,需要保存和导出模型,在VISSIM中保存的模型可以随时打开和修改。

还可以将模型导出为各种格式的文件,如CSV、TXT、SHX等,以便在其他软件中使用和分析。

总结VISSIM交通仿真软件模型的构建需要经过多个步骤,包括定义区域、添加道路、定义车辆和行人、设置交通信号灯和控制、定义路口和交叉口、保存和导出模型等。

城市规划中的交通流量模拟仿真方法

城市规划中的交通流量模拟仿真方法

城市规划中的交通流量模拟仿真方法在城市规划中,交通流量模拟仿真方法具有重要的作用,可以帮助规划者预测和评估不同交通方案的效果,优化城市交通网络布局,提高道路通行效率和交通系统的可持续性。

本文将介绍几种常用的交通流量模拟仿真方法,并分析其优缺点。

一、传统模型方法1. 道路交通容量模型道路交通容量模型是一种经验模型,基于车辆流量、道路几何特征等因素来预测道路能够容纳的车辆数量。

这种模型计算简单,适合用于预测现有道路的交通状况。

然而,由于它只考虑了道路状况,没有考虑到交通需求的变化和网络效应,因此在城市规划中的应用受到了限制。

2. 微观交通仿真模型微观交通仿真模型基于个体车辆行为进行建模,并考虑车辆之间的相互影响。

通过模拟车辆的运行轨迹和交通规则等细节,可以更准确地模拟交通流量。

然而,由于建模复杂度较高,需要大量的数据和计算资源支持,因此在城市规划中的应用受到了一定的限制。

二、基于智能交通系统的模型方法1. 基于传感器数据的模型智能交通系统通过安装传感器在道路网络中收集交通数据,如车辆流量、速度等,然后利用这些数据进行交通流量模拟和分析。

这种方法不仅准确性较高,而且能够快速获取实时数据,对于评估交通方案的效果非常有帮助。

然而,由于需要大量的传感器设备和数据处理能力,成本较高,仍然有一定的局限性。

2. 基于Agent的模型基于Agent的模型是一种新兴的交通流量模拟方法,通过对交通参与者的行为进行建模,模拟车辆、驾驶员和交通管理者之间的相互作用。

这种方法能够更好地反映人的行为决策和交通系统的动态变化,对于研究交通拥堵、事故等问题具有较好的效果。

然而,由于模型的复杂性和计算量较大,需要高性能计算设备的支持。

三、仿真结果分析与应用通过交通流量模拟仿真方法,规划者可以获取各种交通方案的模拟结果,进行性能评估和比较。

基于模拟结果,可以对城市交通网络进行优化设计,提高道路通行能力和交通系统的可持续性。

1. 交通拥堵预测和缓解通过模拟分析交通流量,可以预测拥堵情况,并针对性地提出缓解措施,如增加道路容量、优化交通信号控制等,以改善城市的交通拥堵状况。

城市交通流仿真与优化方法

城市交通流仿真与优化方法

城市交通流仿真与优化方法一、城市交通流仿真概述城市交通流仿真是一种利用计算机技术和数学模型来模拟和分析城市交通系统运行状态的方法。

随着城市化进程的加快,城市交通问题日益突出,交通拥堵、交通事故频发等问题严重影响了城市居民的生活质量和城市的可持续发展。

因此,城市交通流仿真技术在交通规划、管理和优化中发挥着越来越重要的作用。

1.1 城市交通流仿真技术的核心特性城市交通流仿真技术的核心特性主要包括以下几个方面:- 高度模拟真实性:通过高精度的数学模型和计算机技术,能够真实地模拟城市交通系统的各种运行状态。

- 动态性:能够模拟城市交通流在不同时间段的变化情况,为交通管理和优化提供动态的参考依据。

- 多因素考虑:在仿真过程中,能够综合考虑交通流量、交通流速度、交通信号控制等多种因素,全面分析城市交通流的运行状态。

1.2 城市交通流仿真的应用场景城市交通流仿真的应用场景非常广泛,包括但不限于以下几个方面:- 交通规划:通过仿真技术,可以预测未来交通流量的变化趋势,为交通基础设施的规划和建设提供科学依据。

- 交通管理:利用仿真技术,可以实时监控交通流量,及时调整交通信号,缓解交通拥堵。

- 交通安全:通过仿真技术,可以分析交通事故的发生原因,提出预防措施,提高交通安全性。

二、城市交通流仿真的模型与方法城市交通流仿真的模型与方法是实现仿真技术的关键,主要包括以下几个方面:2.1 交通流模型交通流模型是描述城市交通流运行规律的数学模型,常见的交通流模型包括:- 跟驰模型:模拟车辆在道路上的跟驰行为,考虑车辆之间的安全距离和速度变化。

- 车道变换模型:模拟车辆在道路上的车道变换行为,考虑车辆的变道意图和变道时机。

- 信号控制模型:模拟交通信号灯对交通流的控制作用,考虑信号灯的周期和相位。

2.2 仿真方法仿真方法是指利用计算机技术实现交通流模型的计算和模拟,常见的仿真方法包括:- 微观仿真:模拟单个车辆的运行状态,考虑车辆之间的相互作用,适用于小范围、高密度的交通流仿真。

基于VISSIM微观仿真的城市交叉口优化方案评价

基于VISSIM微观仿真的城市交叉口优化方案评价

基于VISSIM微观仿真的城市交叉口优化方案评价随着城市交通拥堵问题日益严重,交叉口作为道路的重要组成部分,在城市交通系统中起着至关重要的作用。

而交叉口优化是提高道路通行效率和交通安全的重要措施之一、VISSIM作为一种常用的微观交通仿真软件,可以模拟城市交通网络中的交叉口行驶情况,用于评估和优化城市交叉口的设计方案。

本文将基于VISSIM微观仿真,探讨城市交叉口优化方案的评价方法,并分析其优缺点,为城市交通规划和设计提供参考。

一、VISSIM微观仿真原理VISSIM是一种基于微观仿真原理的交通模拟软件,主要用于模拟城市道路交通流动情况。

其仿真原理是将道路、车辆、信号灯等交通要素建模,并通过运行仿真模型,模拟车辆在道路网络中行驶的过程。

VISSIM可以根据道路网络结构、车辆流量、信号灯控制等因素,评估不同交叉口设计方案的通行效率和交通安全性。

二、城市交叉口优化方案评价方法1.交通流量分析:通过VISSIM模拟分析不同交叉口的交通流量、拥堵情况和车辆停车等待时间,评估交叉口的通行能力和效率。

2.信号灯优化:通过VISSIM模拟分析不同信号灯控制方案对交叉口通行效率的影响,比较绿波车道、均衡信号灯配时等优化方案的效果。

3.车辆行驶路径分析:通过VISSIM模拟分析车辆行驶路径选择对交叉口通行效率的影响,评估优化交叉口位置和布局方案的可行性。

4.交通事故风险评估:通过VISSIM模拟分析交叉口的交通事故风险,评估不同交叉口设计方案对交通安全性的影响,提出相应的改进建议。

三、城市交叉口优化方案评价优缺点分析1.优点:(1)可以全面模拟交叉口的通行情况,评估不同设计方案的效果,为决策提供科学依据。

(2)可以模拟各种交通组织形式和控制方式,比较不同交叉口优化方案的优劣。

(3)可以分析交叉口通行效率、交通安全性等多个指标,综合评价优化方案的综合效果。

2.缺点:(1)模型参数设定较为复杂,需要大量现场数据和准确性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

收稿日期:2018-02-12 修回日期:2018-06-13 网络出版时间:2018-11-15基金项目:甘肃省自然科学基金(1504GKCA 018)作者简介:郑 皓(1994-),男,硕士研究生,研究方向为机器学习;赵庶旭,教授,博导,CCF 会员(27584M),研究方向为智能交通与机器学习㊂网络出版地址:http :// /kcms /detail /61.1450.TP.20181115.1047.022.html一种用于城市交通的优化声音识别仿真郑 皓,赵庶旭,屈睿涛(兰州交通大学电子与信息工程学院,甘肃兰州730070)摘 要:随着机动车违法鸣笛现象日益严重,汽车鸣笛声识别可以识别违法鸣笛车辆,并对该行为给出科学有力的证据,因此对城市交通治理有着重要意义㊂传统方法主要包含基于GMM -HMM 的概率模型算法㊁支持向量机等㊂但其准确率较低,且过程麻烦,给交管部门进行人工复核造成了很大困难㊂针对此问题,以城市交通汽车鸣笛声识别为背景,结合深度信念网络(DBNs )强大的非线性建模和特征提取能力,提出了一种优化的声音识别方法㊂该方法采用汽车鸣笛声信号的梅尔频率倒谱系数(MFCC )以及其一二阶差分作为特征参数,用于DBN 网络的输入,对样本数据进行建模并提取更深层的特征,最后加入softmax 分类器来实现汽车鸣笛声信号的匹配和识别㊂该方法获得比GMM -HMM 更好的识别效果㊂并通过仿真实验证明了该方法的有效性㊂关键词:神经网络;深度信念网络;特征提取;梅尔频率倒谱系数;汽车鸣笛声识别中图分类号:TP 391.9 文献标识码:A 文章编号:1673-629X (2019)02-0060-05doi :10.3969/j.issn.1673-629X.2019.02.012An Optimized Voice Recognition Simulation for Urban TrafficZHENG Hao ,ZHAO Shu -xu ,QU Rui -tao(School of Electronics and Information Engineering ,Lanzhou Jiaotong University ,Lanzhou 730070,China )Abstract :With the increasingly serious whistle of motor vehicles ,the whistle recognition of the car can identify the whistle -blowing vehi⁃cle and give strong scientific evidence to the behavior ,which is of great significance to the urban traffic control.The traditional methods mainly include probabilistic model algorithm based on GMM -HMM ,support vector machine and so on ,but their accuracy is low and the process is troublesome ,which makes it difficult for the traffic control department to carry out manual review.In order to solve this prob⁃lem ,based on the recognition of whistle sound in urban traffic vehicles ,we present an optimized sound recognition method in combination of the powerful nonlinear modeling and feature extraction capabilities of DBNs (deep belief networks ).The MFCC (Mel -frequency cepstrum coefficients )and its first and second order differences are used as the characteristic parameters for the input of the DBN net⁃work ,and the sample data are modeled and further features are extracted ,Finally softmax classifier is introduced to achieve the car whistle signal matching and identification.This method gives better recognition than GMM -HMM ,and its effectiveness is proved by the simula⁃tion.Key words :neural networks ;depth belief network ;feature extraction ;Mel -frequency cepstrum coefficients ;car whistle sound recognition1 概 述从20世纪末开始,城市居民的机动车持有量和驾驶员的数量在大幅增加,城市交通呈日渐繁忙的趋势,交通拥堵现象也变得越来越严重㊂众所周知,除了机动车尾气排放对大气环境造成的影响,机动车的鸣笛声也给城市环境造成了越来越大的影响㊂再加上部分驾驶员环境保护意识淡薄,以至于汽车的违法鸣笛在城市区域频繁发生,对市民的正常生活造成了恶劣的影响㊂保持道路交通的安全㊁畅通㊁有序,遏制汽车违法鸣笛行为的上升势头,成为交管和环境保护部门函待解决的重要问题㊂因此,相关执法部门也颁布了相应的法律法规来禁止或者限制机动车在医院㊁居民区㊁学校等城市人口密集区鸣笛,但是这一规定在具体执行中却遭到了巨大的困难,人工执法来判断违法鸣笛车辆不仅效率低,且浪费了大量的人力物力,换来的是较低的可靠性和大量的误判,可行性不高㊂同济大学孙懋珩团队2010年提出了一种基于麦克风阵列和闭式球形差值算法的汽车鸣笛声识别系第29卷 第2期2019年2月 计算机技术与发展COMPUTER TECHNOLOGY AND DEVELOPMENT Vol.29 No.2Feb. 2019统,用于协助相关执法部门准确有效地锁定违法鸣笛车辆的位置[1-3]㊂近年来国内部分城市也开始引入汽车违法鸣笛识别系统对违法鸣笛行为进行监控,例如北京协和医院西门的 电子警察监管”系统㊁沈阳的 声呐电子警察”系统等㊂但是这些只能单方面地确定目标车辆的位置,且准确性不高,存在较多误判㊂特别是针对部分司机拒不承认鸣笛行为的现象,不能给出有力的证据㊂所以要对鸣笛识别系统的识别结果进行人工复核,将识别到的目标车辆鸣笛声与鸣笛声识别系统捕捉到的声音信号加以匹配和鉴别,进一步提升汽车鸣笛声定位的准确性㊂传统的鉴别方法主要有基于GMM-HMM的概率模型算法[4]㊁支持向量机等㊂在深度学习的研究上,2011年,Hinton等[5-6]提出了使用深度信念网络在电话语音中提取深层特征,对电话语音进行识别,给出仅19.4%的错误率㊂2012年,Andrew等[7]提出一种顺序深度信念网络模型(SDBN),其在所有隐藏层及输出层使用固有的顺序模型,使得潜在变量可以模拟长距离现象,在TIMIT 电话识别实验中效果较好㊂2015年,周晓敏等[8]提出了一种基于小波矩和BP网络的声音识别方法,用于噪声环境下的声音识别,并取得了不错的效果㊂2017年,陈秋菊等[9]提出了一种基于优化正交匹配追踪和深度置信网络的声音识别方法,用于不同环境声音影响下的声音识别,并且能够有效地识别各种不同环境下的声音事件㊂因此深度学习技术在声音识别问题中有着巨大的优势㊂GMM模型作为一个使用时间较长的传统模型,存在很多缺点,例如:需要对数据的状态做出假设;需人工选择特征参数且不易于多种特征的组合;不能接受较大维度的数据输入,计算复杂;判决准确率不高㊂因此,文中提出一种基于深度信念网络的识别方法㊂结合深度神经网络强大的非线性建模能力和特征提取能力,对识别到的目标车辆加以鉴别,以提高识别的准确性,从而提高人工复核的效率,对鸣笛识别系统的识别结果提供科学有力的支持㊂2 数据预处理2.1 预处理通过麦克风阵列采集到的汽车鸣笛声音频信号是模拟信号,需要对其进行采样和量化,获得可用于计算机处理的数字音频信号㊂此过程通过麦克风和计算机声卡完成,采用Cool Edit Pro2.1软件完成对汽车鸣笛声信号的采集并获得音频信号片段,用于后期的处理㊂2.2 特征提取2.2.1 梅尔频率倒谱系数梅尔频率倒谱系数[10](Mel-frequency cepstrum coefficients,MFCC)的分析是根据人的听觉机理,基于滤波器组的频率分析,滤波器组的带宽间隔约为临界子带的间隔㊂期望获得更好的声音特性,MFCC分析依据的听觉机理有两个㊂(1)人的主观感知频域的划定不是线性的,如式1所示:F mel=1125log(1+f/700)(1)其中,F mel是以梅尔(Mel)为单位的感知频率;f 是以Hz为单位的实际频率㊂(2)临界带(critical band)㊂频率群相应于人耳基底膜分成许多很小的部分,每一部分对应一个频率群,对应于同一频率群的那些频率的声音,在大脑中是叠加在一起进行评价的㊂按临界带的划分,将声音在频域上划分成一系列频率群组成了滤波器组,即Mel滤波器组㊂2.2.2 MFCC的提取过程MFCC的提取过程如图1所示㊂图1 MFCC提取流程(1)信号预处理㊂预处理的部分包括预加重㊁分帧和加窗函数三个步骤㊂预加重:预加重处理其实就是将音频信号通过一个高通滤波器,目的是提升信号的高频部分,使信号的频谱变得更平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱㊂高通滤波器的传递函数一般设为:H(z)=1-αz-1 (2)其中,α的值介于0.9~1.0之间,通常取0.97㊂分帧:现在成熟的信号处理技术往往分析的都是时不变信号即稳态信号,由于音频信号是一个准稳态信号,把它切分成较短的帧,在每帧中可将其看作稳态信号,可以用处理稳态信号的方法来处理㊂同时,为了使一帧与下一帧之间的参数能较平稳地过渡,在相邻两帧之间有互相重叠的部分㊂加窗函数:加窗函数的目的是为了减少信号在频域中的泄漏㊂对比矩形窗和汉明窗可以看出,矩形窗的主瓣宽度小于汉明窗,具有较高的频谱分辨率,但是矩形窗的旁瓣峰值较大,因此各谱线之间的相互干扰㊃16㊃ 第2期 郑 皓等:一种用于城市交通的优化声音识别仿真较为严重㊂相比之下,虽然汉明窗的主瓣宽度较宽,约为矩形窗的一倍多,但是它的旁瓣衰减较大,具有更平滑的低通特性,能在较高的程度上反映短时信号的频率特性,适合处理频谱表现复杂,存在多个频率分量的信号㊂所以文中选择对每一帧信号加汉明窗㊂信号χ(n)经过预处理后为χi(m),其下标i表示分帧后的第i帧㊂(2)快速傅里叶变换(FFT)㊂对每一帧信号进行FFT变换,从时域数据转变为频域数据,如下:X(i,k)=FFT[χi(m)](3) (3)计算谱线能量㊂对每一帧FFT后的数据计算谱线能量,如下: E(i,k)=[X(i,k)]2(4) (4)计算通过Mel滤波器的能量㊂将求出的每帧谱线能量通过Mel滤波器,并计算在Mel滤波器中的能量㊂在频域中相当于把每帧的能量谱E(i,k)(其中i表示第i帧,k表示频域中的第k 条谱线)与Mel滤波器的频域响应相乘并相加,如下: S(i,m)=∑N-1k=0E(i,k)H m(k),0≤m<M(5) (5)计算DCT倒谱㊂把Mel滤波器的能量取对数后计算DCT,如下: mfcc(i,n)=2M∑M-1m=0log[S(i,m)]cosπn(2m-1)2M(6)其中,S(i,m)是由上一步求出的Mel滤波器能量;m是指第m个Mel滤波器(共有M个);i表示第i 帧;n是DCT后的谱线㊂2.2.3 梅尔频率倒谱系数差分系数上一节得到的是静态的MFCC系数,只能表征音频谱的即时信息㊂实验表明,音频谱的动态信息中也包含了很重要的成分,可以对声音信号加以区分,可以提高对汽车鸣笛声音的识别准确率㊂音频倒谱的动态信息可以用来表征声音信号的特征参数随时间变化的规律㊂这里引入MFCC的一阶差分和二阶差分系数,来表示音频信号的动态特征㊂然后将原始的MFCC 特征和MFCC动态特征组合作为特征向量进行训练和识别,可以明显提高识别性能㊂2.3 特征表示由特征参数的曲线表示可以看出,同一辆汽车鸣笛声不同帧的特征参数存在一定的相似性,不同汽车鸣笛声的特征参数很明显具有一定的差异性,通过这种差异性,将不同汽车的鸣笛声加以区分,并将同一辆汽车的鸣笛声作匹配处理,从而对现有的汽车违法鸣笛识别系统做一个准确性的验证,以进一步提高其识别的准确性㊂3 DBNs网络模型3.1 人工神经网络的组成与生物神经网络类似,人工神经网络的基本计算单元是人工神经元,一般是由多个输入和一个输出组成的非线性单元,可以有反馈输入和阈值参数,同时能够与其他神经元连接㊂在人工神经网络中,神经元常被称为 处理单元”;为了方便对人工神经网络的描述,在整个网络中,把单个的人工神经元称为网络 节点”㊂人工神经元是对生物神经元的一种形式化描述,它抽象地模仿了生物神经元的信息处理过程,并用数学语言来描述生物神经元处理信息的过程㊂为了直观地对生物神经元的结构和功能进行模拟,采用结构图的方式,将人工神经元模型结构表示出来㊂3.2 网络的拓扑结构文中用到的深度信念网络(deep belief networks, DBNs)相比于传统的GMM-HMM模型有很多优点,包括不需要对输入数据的状态做假设,易于多种特性的组合,使用更多的数据来约束一个参量,以取得更好的识别结果㊂整个网络结构包含多个隐层,即由多个RBM堆叠而成,相邻两层节点之间的关系为全连接,采用无监督的预训练方法对权值w进行初始化,最后一个隐层和输出层之间用softmax网络连接,通过误差反向传播算法(back propagation,BP)对整个网络参数进行调整㊂RBM(restricted Boltzmann machines)是一种随机神经网络[11-13],它借鉴了统计物理学思想㊂神经元状态变化引入了统计概率㊂图2为RBM的结构,由一个输入层和一个隐层组成,之间由权值w连接㊂图2 RBM结构单个神经元结构如图3所示,包含多个输入和一个输出,参数包括和每个输入所连接的权值w以及偏量b㊂而单个神经元的输入和输出所对应的激活函数为P j(b j,W ij),如下:Pj=σ(bj+∑n i=1W ij v i)(7)其中σ(x)=11+e-x(8)㊃26㊃ 计算机技术与发展 第29卷图3 神经元结构3.3 网络模型的训练(1)训练RBM,训练的目的是由初始化权值w到确定性权值w,由输入数据结合权值和偏量计算出p 的值,当p的值大于一个随机值时,神经元u更新为1,否则为0,即神经元的开和关㊂(2)根据隐层H的值计算出重建数据,希望输入数据和重建数据相差越来越小,即两者做差,更新权值w㊂(3)只有当第一个RBM完成训练之后,得到了H 层的值,才可以进行下一个RBM的训练㊂接下来就是用有监督的反向传播算法微调每层之间的权值w,如图4及式9-11所示㊂P(uj=1v)=σ(b j+∑n i=1W ij v i)(9)P(vi=1h)=σ(b j+∑n i=1W ij h j)(10)Δw ij=ε∂log p(v)∂w ij≈ε(<v i h j>data-<v i h j>recon)(11)图4 DBN网络结构图4为文中所用的网络结构图㊂首先由2.2节所述方法提取汽车鸣笛声的MFCC特征参数,以及它的一㊁二阶差分;将该特征参数作为网络的输入层(In⁃put)输入网络,对第一层RBM进行训练,得到第一个隐层(Hidden layer1)的参数,包括连接各神经元的权重以及到各个神经元的偏量㊂将第一个隐层作为第二个RBM的输入,逐层进行训练㊂最后在第三个隐层下方加入softmax网络作为输出层(Output)对输入数据进行分类㊂4 实 验4.1 实验过程共采集了10辆不同汽车个体的鸣笛声样本㊂样本数据来自兰州军鼎车辆检验中心,数据采集的先后顺序随机,分别是:(1)宇通(一),大客;(2)大众朗逸,轿车;(3)金杯,轻型封闭货车;(4)中联重型载货专项作业车;(5)大众桑塔纳,轿车;(6)宇通(二),大客;(7)丰田,中型普通客车;(8)大众帕萨特(一),轿车;(9)江淮,中型普通客车;(10)大众帕萨特(二),轿车㊂将每辆汽车的鸣笛声数据视为一个类,因此实验中数据包含10个类,每一类均包含1000条样本数据,该样本数据均出自同一辆汽车,即所有样本个数为1000*10=10000个㊂样本分帧:单个数据样本时长均为0.05s,约2230个采样点(采样频率为44.1kHz,数据位数16位,单声道),256点分为一帧,两帧之间重复长度为128点,即单个样本共分为16帧,即构成一个连续16帧的特征块,将这些特征块作为深度神经网络训练样本的输入㊂MFCC参数:以每帧为单位提取特征参数,取前12阶,即每帧数据的特征参数为12维,所以每个样本共包含12*16=192维特征参数,作为DBN网络的输入层㊂标签的选择:文中用到的数据种类可分为10个类,即需要十个标签对样本数据进行标注㊂训练模型:DBN输入层:192维特征参数;DBN输出层:10维(10个标签);训练集:每个类取800条样本数据作为训练集,共800*10=8000条样本;验证集:每个类取100条样本数据作为验证集,共100*10=1000条样本;测试集:每个类取100条样本数据作为测试集,共100*10=1000条样本㊂将MFCC及其一阶差分的组合作为特征参数进行输入,进行上述实验㊂将MFCC和其一阶差分,二阶差分的组合作为特㊃36㊃ 第2期 郑 皓等:一种用于城市交通的优化声音识别仿真征参数进行输入,进行上述实验㊂4.2 实验结果与分析实验结果可信性标准,用识别错误率(EER )来衡量,EER 越低,表示识别效果越好㊂EER 的计算方法如下:P EER =N f N(16)其中,N f 表示识别错误数据条数;N 表示实验数据总数㊂分别将MFCC ,MFCC +一阶差分,MFCC +一㊁二阶差分作为特征进行识别,第二行代表每种特征参数识别的错误率,可以看出MFCC 及其一阶差分,二阶差分的组合特征准确率较高㊂在选取的特征统一的情况下,选取的特征块所包含的帧数对识别准确率也存在一定的影响,当特征块帧数在16帧时识别效果较好㊂图5为不同特征组合与不同的测试声音长度对识别错误率的影响㊂可以看出,当输入特征选择36维MFCC ,即MFCC 与其一阶,二阶差分的组合时,测试声音长度越长,识别的错误率越低,识别效果越好㊂图5 特征组合与测试长度对准确率的影响在选取16帧的情况下,MFCC +dtm +dtmm 组合特征为输入数据的实验结果,与同样帧数下GMM 模型的错误率进行比较,错误率明显降低,识别效果显著提高㊂结果见表1㊂表1 DBN 与传统GMM 的准确率对比 %模型错误率GMM 32.9DBN11.2 所以基于DBN 模型的识别方法可以解决传统模型的缺点且显著提高识别效果㊂5 结束语提出了一种基于深度信念网络的声音识别方法,用于城市交通汽车鸣笛声识别㊂该方法通过深度信念网络,提取和学习汽车鸣笛声MFCC 特征参数中的深层特征,从而建立更精确的网络模型来对汽车鸣笛声加以匹配和鉴别㊂实验结果表明,该方法能准确地将不同汽车个体的鸣笛声加以匹配,相比于传统GMM 模型,效率更高,识别效果更好㊂解决了现有的汽车违法鸣笛识别系统中存在大量误判的现象,且为人工复核提供了科学有力的支撑,对今后的各种汽车违法鸣笛识别系统的准确性验证具有重要的意义㊂参考文献:[1] 孙懋珩,俞莹婷.汽车鸣笛声定位系统仿真[J ].声学技术,2009,28(5):640-644.[2] 施珂毅,孙懋珩.汽车鸣笛声定位算法研究及系统实现[J ].中国新通信,2009,11(1):64-67.[3] 徐 静,李卫红,孙懋珩,等.基于麦克风阵列的车辆鸣笛嗅探器[J ].数据采集与处理,2012,27:262-266.[4] 吕霄云.基于MFCC 和GMM 的异常声音识别算法研究[D ].成都:西南交通大学,2010.[5] MOHAMED A R ,SAINATH T N ,DAHL G ,et al.Deep be⁃lief networks using discriminative features for phone recogni⁃tion [C ]//IEEE international conference on acoustics ,speech and signal processing.Prague ,Czech Republic :IEEE ,2011:5060-5063.[6] MOHAMED A ,DAHL G E ,HINTON G.Acoustic modelingusing deep belief networks [J ].IEEE Transactions on Audio ,Speech ,&Language Processing ,2011,20(1):14-22.[7] ANDREW G ,BILMES J.Sequential deep belief networks[C ]//IEEE international conference on acoustics ,speech and signal processing.Kyoto ,Japan :IEEE ,2012:4265-4268.[8] 周晓敏,李 应.基于小波矩和BP 网络的声音识别[J ].计算机工程与应用,2015,51(3):192-196.[9] 陈秋菊,李 应.基于优化正交匹配追踪和深度置信网的声音识别[J ].计算机应用,2017,37(2):505-511.[10]蒋翠清,邵宏波.基于MFCC 与改进ACF 的汽车声音识别算法研究[J ].计算机技术与发展,2015,25(2):140-143.[11]张 娟,蒋 芸,胡学伟,等.基于快速持续对比散度的卷积受限玻尔兹曼机[J ].计算机工程,2016,42(9):174-179.[12]NOROUZI M ,RANJBAR M ,MORI G.Stacks of convolu⁃tional restricted Boltzmann machines for shift -invariant fea⁃ture learning [C ]//IEEE conference on computer vision and pattern recognition.Miami ,FL ,USA :IEEE ,2009:2735-2742.[13]MOCANU D C ,MOCANU E ,NGUYEN P H ,et al.A topol⁃ogical insight into restricted Boltzmann machines [J ].Ma⁃chine Learning ,2016,104(2-3):243-270.㊃46㊃ 计算机技术与发展 第29卷。

相关文档
最新文档