异常声音检测系统文献翻译

合集下载

融合注意力机制卷积神经网络的扬声器异常声分类

融合注意力机制卷积神经网络的扬声器异常声分类

融合注意力机制卷积神经网络的扬声器异常声分类周静雷;王晓明;李丽敏【期刊名称】《西安工程大学学报》【年(卷),期】2024(38)2【摘要】针对扬声器异常声非线性、非平稳且易受外部噪声干扰,以及因特征冗余而导致扬声器异常声识别率偏低的问题,提出一种基于变分模态分解(variational mode decomposition, VMD)和一维卷积循环注意力网络(1DCNN-BiLSTM-Attention)相结合的扬声器异常声分类方法。

首先,采集不同类型异常声信号,采用VMD对异常声信号进行分解并提取扬声器异常声特征,构建标签化的初始数据;其次,将特征数据输入至1DCNN-BiLSTM网络中进行初始化特征提取,利用注意力机制自适应优化网络对异常声特征的学习权重,提升网络对特征鉴别能力,并优化Dropout抑制网络在训练过程中存在的过拟合问题,构成1DCNN-BiLSTM-Attention分类网络;最后,将所提方法应用于扬声器异常声分类中。

实验结果表明:该方法可以有效提取到扬声器异常声中的关键特征,平均分类准确率为99.17%,与VGG16、RF和DCNN相比,其准确率分别提高了13.14%、0.56%,12.34%。

【总页数】8页(P101-108)【作者】周静雷;王晓明;李丽敏【作者单位】西安工程大学电子信息学院【正文语种】中文【中图分类】TN643【相关文献】1.融合词性和注意力的卷积神经网络对象级情感分类方法2.应用变分模态分解和随机森林特征选择算法的扬声器异常声分类3.结合卷积神经网络与注意力机制的多域特征融合ECG心率失常分类4.自适应变分模态分解与RCNN-3结合的扬声器异常声分类方法5.基于图卷积神经网络的自注意力的融合节点分类框架因版权原因,仅展示原文概要,查看原文内容请购买。

自动化外文文献英文文献外文翻译改进型智能机器人的语音识别方法

自动化外文文献英文文献外文翻译改进型智能机器人的语音识别方法

附件1:外文资料翻译译文改进型智能机器人的语音识别方法2、语音识别概述最近,由于其重大的理论意义和实用价值,语音识别已经受到越来越多的关注。

到现在为止,多数的语音识别是基于传统的线性系统理论,例如隐马尔可夫模型和动态时间规整技术。

随着语音识别的深度研究,研究者发现,语音信号是一个复杂的非线性过程,如果语音识别研究想要获得突破,那么就必须引进非线性系统理论方法。

最近,随着非线性系统理论的发展,如人工神经网络,混沌与分形,可能应用这些理论到语音识别中。

因此,本文的研究是在神经网络和混沌与分形理论的基础上介绍了语音识别的过程。

语音识别可以划分为独立发声式和非独立发声式两种。

非独立发声式是指发音模式是由单个人来进行训练,其对训练人命令的识别速度很快,但它对与其他人的指令识别速度很慢,或者不能识别。

独立发声式是指其发音模式是由不同年龄,不同性别,不同地域的人来进行训练,它能识别一个群体的指令。

一般地,由于用户不需要操作训练,独立发声式系统得到了更广泛的应用。

所以,在独立发声式系统中,从语音信号中提取语音特征是语音识别系统的一个基本问题。

语音识别包括训练和识别,我们可以把它看做一种模式化的识别任务。

通常地,语音信号可以看作为一段通过隐马尔可夫模型来表征的时间序列。

通过这些特征提取,语音信号被转化为特征向量并把它作为一种意见,在训练程序中,这些意见将反馈到HMM的模型参数估计中。

这些参数包括意见和他们响应状态所对应的概率密度函数,状态间的转移概率,等等。

经过参数估计以后,这个已训练模式就可以应用到识别任务当中。

输入信号将会被确认为造成词,其精确度是可以评估的。

整个过程如图一所示。

图1 语音识别系统的模块图3、理论与方法从语音信号中进行独立扬声器的特征提取是语音识别系统中的一个基本问题。

解决这个问题的最流行方法是应用线性预测倒谱系数和Mel频率倒谱系数。

这两种方法都是基于一种假设的线形程序,该假设认为说话者所拥有的语音特性是由于声道共振造成的。

基于属性规则的可学习异常检测系统(IJCNIS-V8-N11-7)

基于属性规则的可学习异常检测系统(IJCNIS-V8-N11-7)
I. J. Computer NSecurity, 2016, 11, 58-64
Published Online November 2016 in MECS (/) DOI: 10.5815/ijcnis.2016.11.07
I.J. Computer Network and Information Security, 2016, 11, 58-64
A Learnable Anomaly Detection System using Attributional Rules
59
In this paper, we focus on employing the power of attributional rules by utilizing AQ algorithm in adaptive incremental learning (AIL) of IDS. The model is endowed with a generalization capacity that covers new unknown attacks patterns. AQ4IDS is implemented with a two-class model implementation, which identifies network traffic as either normal or anomalous. This scenario represents a means for detection of new and zero day attacks. Moreover, the model is compared to other incremental methods to spotlight the efficacy of attributional rules, namely, the decision trees [5] and K* [6] algorithms. II. RELATED WORK

医用英语医学文献翻译4(缺5,9整理版)

医用英语医学文献翻译4(缺5,9整理版)

医⽤英语医学⽂献翻译4(缺5,9整理版)UNIT 1 TEXT B刷⽛,使⽤⽛线,以及每年2次的⽛齿检查是⼝腔卫⽣保健标准,但是保护你珍珠样洁⽩的⽛齿的好处远⽐我们知道的还要多。

在⼀篇评论⽂章中,塔夫茨⼤学⽛科医学院的⼀个教员破除了常见的⽛科神话,并概述了饮⾷和营养如何影响⼉童,青少年,孕妇,成年⼈和⽼年⼈的⼝腔健康。

误区1:⼝腔卫⽣的不良后果是限制嘴巴准妈妈也许不知道她们所吃的⾷物会影响到胎⼉的⽛齿发育。

在怀孕过程中的营养缺乏也许会使未出⽣的孩⼦在今后的⽣活中更容易出现蛀⽛。

“在14周到4个⽉⼤的时候,缺乏钙,维⽣素D,维⽣素A,蛋⽩质和卡路⾥会导致⼝腔软组织缺损,” Carole Palmer说。

Carole Palmer是,教育学博⼠(EdD),注册营养师(RD),塔夫茨⼤学教授,公共健康和社会服务系营养和⼝腔健康推进部的负责⼈。

有数据表明缺乏⾜够的维⽣素B6和B12可能是导致患唇裂和阻碍味觉形成的危险因素。

在童年的时候,最普遍的疾病是蛀⽛,⼤约⽐⼉童哮喘⾼五倍。

“如果⼀个⼉童因为蛀⽛⽽嘴巴受伤,他/她在学校会⽐较难集中注意⼒,⽽且会更喜欢吃容易咀嚼的⾷物,这些⾷物含有的营养往往更少些。

甜甜圈和点⼼这样的⾷物⼤多营养品质低下,含糖量⾼于其他需要咀嚼的富含营养的⾷物,⽐如⽔果和蔬菜,” Palmer说。

“⼝腔并发症与不良的饮⾷习惯会造成认知和⽣长发育问题,以及导致肥胖。

”误区2:吃越多糖,越容易蛀⽛这与你吃了多少糖⽆关,⽽是糖和⽛齿接触的时间有多少。

“⾷物,⽐如慢慢溶解的糖果和苏打⽔在嘴巴⾥停留的时间会⽐较久。

这增加了⽛齿暴露在⼝腔细菌由糖产⽣成的酸中的时间,” Palmer说。

有研究表明,⼗⼏岁的青少年⼤约40%的碳⽔化合物是由软饮料中摄取的。

这些源源不断地软饮料增加了⽛齿腐烂的风险。

⽆糖碳酸饮料和酸性饮料,⽐如柠檬⽔,往往被认为⽐含糖饮料对⽛齿更安全,但是经常⾷⽤的话仍会造成⽛齿釉质脱矿。

门禁监管系统外文翻译(含原文)access-control-system

门禁监管系统外文翻译(含原文)access-control-system

工业大学本科生毕业设计(论文)外文翻译毕业设计题目:楼宇门禁监管系统软件设计学院:信息科学与工程学院专业班级:通信工程0902学生:格根哈斯090404049指导教师:柏山2013年 03 月 18 日门禁管理系统原理门禁系统是最近几年才在国广泛应用的又一高科技安全设施之一,现已成为现代建筑的智能化标志之一。

门禁,即出入口控制系统,是对出入口通道进行管制的系统,门禁系统是在传统的门锁基础上发展而来的(英文E NTRANCE G UARD /A CCESS C ONTROL)。

在现实中访问控制是,我们的日常生活中的现象。

一车门上的锁,本质上是一种形式的访问控制。

在一家银行的ATM系统是一个PIN访问控制的另一种方式。

站在一家夜总会门前的安保人员是缺乏涉及信息技术,也许是更原始的访问控制模式。

拥有访问控制是当人寻求安全,或敏感的信息和设施时非常重要的.项目控制或电子钥匙管理的区域(和有可能集成),一个访问控制系统,它涉及到管理小资产或物理(机械)键的位置。

一个人可以被允许物理访问,根据支付,授权等。

有可能是单向交通的人,这些都可以执行人员,如边防卫兵,一个看门人,检票机等,或与设备,如旋转门。

有可能会有围栏,以避免规避此访问控制。

在严格意义上的访问控制(实际控制访问本身)的另一种方法是一个系统的检查授权的存在,例如,车票控制器(运输)。

一个变种是出口控制,例如的店(结帐)或一个国家。

在物理安全方面上的访问控制是指属性,建筑,或授权人一个房间,限制入口的做法。

在这些环境中,物理密钥管理还可以进一步管理和监控机械键区或某些小资产。

物理访问控制访问的一种手段,是谁,地点和时间的问题。

访问控制系统决定谁可以进入或退出,在那里他们被允许离开或进入,而当他们被允许进入或退出。

从历史上看,这已经部分实现通过钥匙和锁。

当门被锁定只有有人用一把钥匙可以通过门禁,这时取决于锁定如何配置。

机械锁和钥匙的钥匙持有人在特定的时间或日期允许访问。

基于HHT算法的扬声器异常音检测技术

基于HHT算法的扬声器异常音检测技术

基于HHT算法的扬声器异常音检测技术李云红;李小英;周静雷;潘杨【摘要】为了有效地检测扬声器异常音,提出一种基于希尔伯特-黄变换的异常音识别及去噪方法。

分析了小波变换的不足,再进行HHT分析。

建立常见的几类扬声器异常音数学模型,并经EMD分解得到包含异常振动信息的IMF分量,利用IMF分量特点进行去噪处理。

再求出各模拟异常音信号的Hilbert谱,采用图像二值化技术处理Hilbert谱,和小波变换时频谱比较后证明了HHT方法具有更多的优势。

而且,根据不同类型异常音在时频域的特征,即可判断出扬声器异常音类型。

matlab仿真实验结果表明,当归一化阈值取为0.065时,会得到清晰的图像,能更精确地检测出异常音类型。

%In order to detect the loudspeaker defects effectively, a new method of recognition and denoising based on HHT algorithm for loudspeaker defects is presented. The shortcomings of the wavelet transform are analyzed, the HHT analysis again. Several loudspeaker defect models are established to be processed by the use of the EMD method, in which the characteristics of the IMF component including abnormal vibration information are obtained for denoising. The Hilbert spectrum of loudspeaker defect signal is obtained to be processed by the use of the image binarization technology. It proves that the HHT method has more advantages in comparison with wavelet transform. What’s more, according to the characteristics of different loudspeaker defects in the time-frequency domain, the types of the loudspeaker defects can be well detected. Matlab simulation results show that, a clearimage will appear when the normalized threshold is 0.065, with which the types of loudspeaker defects can be detected more accurately.【期刊名称】《计算机工程与应用》【年(卷),期】2015(000)011【总页数】6页(P212-217)【关键词】异常音检测;希尔伯特-黄变换(HHT);小波变换(WT)【作者】李云红;李小英;周静雷;潘杨【作者单位】西安工程大学电子信息学院,西安 710048;西安工程大学电子信息学院,西安 710048;西安工程大学电子信息学院,西安 710048;西安工程大学电子信息学院,西安 710048【正文语种】中文【中图分类】TB52+3;TB541 引言目前,国内外扬声器的故障检测基本上都是在其生产的最后阶段靠人耳监听来辨别和判断的,这样做没有客观的标准。

一种基于特征点提取的扬声器异常声检测方法

一种基于特征点提取的扬声器异常声检测方法

一种基于特征点提取的扬声器异常声检测方法
宋华建;穆瑞林;周子奇
【期刊名称】《应用声学》
【年(卷),期】2022(41)2
【摘要】针对短时傅里叶变换在扬声器异常声检测中有效信息提取的随机性问题,提出了特征点法在扬声器异常声检测中的应用。

此方法基于扬声器经扫频信号激励所得响应信号的短时傅里叶变换时频图,用改进的尺度不变特征转换算法对合格扬声器与异常声扬声器做特征提取,并将多组特征点经分割剔除后叠加组成特征矩阵模板。

以合格扬声器样本提取特征曲线阈值构建检测模型判断扬声器是否存在异常声故障,以不同故障类型扬声器的专有特征点进行故障分类。

实验结果表明,此方法可有效提取扬声器异常声特征,故障样本检出率可达97.63%,故障分类精度可达95%。

【总页数】7页(P243-249)
【作者】宋华建;穆瑞林;周子奇
【作者单位】天津科技大学机械工程学院;天津市轻工与食品工程机械装备集成设计与在线监控重点实验室
【正文语种】中文
【中图分类】TN643
【相关文献】
1.一种扬声器异常音的时域特征检测方法
2.一种改进的扬声器异常音快速检测方法
3.一种基于复合滤波和曲线特征点提取的 QRS波实时检测算法
4.窗函数在扬声器异常声客观检测中的影响
5.VMD-Hilbert变换在扬声器异常声检测中的应用
因版权原因,仅展示原文概要,查看原文内容请购买。

在线翻译无声音输出解决方法

在线翻译无声音输出解决方法

在线翻译无声音输出解决方法
症状1:在浏览器中播放电视剧、音乐都有声音,但在线翻译无声音。

(含百度在线翻译、谷歌在线翻译、有道在线翻译等)
症状2:在win XP浏览器中播放电视剧、音乐有声音,但win 7下,在线翻译无声音。

(含百度在线翻译、谷歌在线翻译、有道在线翻译等)
故障可能性一:硬件设备音箱、麦克风出现故障
解决方法:这方面包括硬件故障和接线、接口等方面,我们必须检测音箱和麦克风是否烧坏,是不是声音调到最小了。

还要去查看接线是否磨损,usb接口是否松动,接触不良等情况。

故障可能性二:声卡驱动出现故障
解决方法:鼠标右键单击“我的电脑”,选择“设备管理器”,然后查看“声音、视频输出”的前面是否有问号和感叹号的标志。

如果有的话可能是驱动未安装或者安装未完成的情况,建议安装驱动精灵来检测驱动的故障。

故障可能性三:音频设备被禁用
解决方法:打开控制面板,选择“声音和音频设备”,然后在弹出的窗口上的属性栏的设置进行检测验证,查看音量、声音、音频、语声和硬件几个按钮是不是自己被设置了静音的情况。

故障可能性四:可能是乱装软件造成,使其原有的声音驱动被破坏或被占据,哪该怎么办呢?这可以通过软件扫描修复。

解决方法:安装高效音频控制器,可以解决此问题。

realtek高清晰音频管理器目前支持window7,解决了window7前面板不能输出问题。

但是和SRS Audio Sanbox不兼容,两者只能使用一个,SRS和这个在Win7里不能同时用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于音频的声音监测监控系统 C.克莱维尔,T.阿赫瑞特,G.理查德 法国泰利斯研究技术中心,.法国巴黎市奥赛德斯地区,邮政编码75634 巴拉尔特街46号13号信箱. 科博维尔科技园

摘要:

目前声音监测监控系统研究涉及多媒体监控应用在嘈杂环境中的音频事件检测。为监视或国土安全的系统。以自动检测异常情况下,在基于视觉线索的同时,异常事件将被检测到,比如枪声,但它可能是更容易检测到一个给定的事件使用的音频信息。自动音频检测系统是基于一个新奇的检测方法,它提供了一个解决方案来检测异常(异常音频事件)在公共场所连续录音。我们特别集中于对变量和不稳定的条件下检测鲁棒性和降低的错误拒绝率,这是特别在监控应用中的重要。另外,我们利用潜在的不同类型的武器,通过建立分层分类系统的声学信号之间的相似性。 1.简介:

音频事件分类/检测是科学界的兴趣日益增长的热点。尤其是在音频检索和索引应用的上下文中,而且在多媒体事件检测的音频可以被用来作为一种补充的信息源,如下文中的情况下。在监视或国土安全(安全的公共场所,如地铁,机场,银行,...)大多数系统仅基于视觉线索来检测异常的情况。典型的异常情况,包括自然的损害,如火灾,地震,洪水等,身体或心理威胁和侵略人类(绑架人质等)。在一些情况下,音频比视频传达了一个更重要的信息。然后,我们的目标是使用声学线索作为补充信息,自动检测并分析异常情况。 完成多媒体自动监控系统,然后由不同的模块,提供了从不同的方式,将合并信息融合系统形势分析。音频模块,在这种有针对性的系统将使用声乐和非声乐表现异常的情况下,双方感情的内容,并将处理[2]典型的事件,如哭声,枪声或爆炸。在本文中,我们提出了一个方法来开发音频键事件检测系统。虽然我们目前仅限事件检测系统音频检测的方法和遵循的方法,这个系统可以扩展到其他类别特征的声音异常的情况下,在一个给定的环境中。

音频检测系统的主要困难之一,往往是环境噪声的非平稳性,这可能是响亮的音频事件来检测相比。本文提出的音频检测系统基于一个新奇的检测方法[6]。事实上,新型音频检测提供了解决方案,以检测异常异常声音事件,即当给定的距离超过预定义的阈值的正常位置的模型。本文的重点是自动处理的音频事件检测系统的两个主要问题,即鲁棒性检测对变量和不利条件和减少错误拒绝率,这是特别重要的监控应用。特别是,我们充分利用潜在的不同类型的武器,通过建立分层分类系统的声学信号之间的相似性。 本文的组织如下。首先,我们的音频检测系统是在第2部分。然后,数据库和测试协议,用于对系统进行评估在第3部分中给出。不同的实验结果在第4部分。最后,我们建议在第5部分的一些结论和未来的工作。 2.音频检测系统 我们的音频检测系统的目标是分类,输入音频流为连续段,并根据这些细分集的两个主要类(代表环境的声学特性的射门类和正常类)的标签。我们的音频架构事件检测系统包括特征提取模块,培训模块,用于建立模型的两个类(使用高斯混合模型或GMM)和分类模块,基于以前的机型,标签的连续音频段。如图2所描述的,所输入的音频是第一分段的短帧(20毫秒),但以0.5秒的段(具有50%的重叠)。

2.1 音频特征提取 特征提取,分析每帧20毫秒与50%的重叠。计算功能选择时下最流行的音频处理算法,并更容易适合我们的分类问题。短时能量描述的信号能量,在一个给定的时间内,将可选地称为响度或体积。 1.13向量梅尔频率倒谱系数。前两个频谱统计矩,即是平均的功率谱,对于一个给定的时间和频谱扩展的频谱重心。 2.叙述上述各功能。特征向量维主成分分析程序,然后降低。我们维持13维向量第一部分为显著。每个分析帧的输入音频。

2.2训练步骤 对于每个类高斯混合模型(GMM)建立。为每个类高斯适当数量的估计要归功于贝叶斯信息标准[3]。模型的参数估计采用传统的期望最大化算法[7],初始化一个基本的二元分裂矢量量化算法。

2.3检测步骤 检测采用最大后验(MAP)的决策规则:获得每个分析时间短帧的概率乘以每类模型计算平均后的LOG概率是0.5秒的决定窗口。“决定”窗口,然后分类,它具有最大后验得分。沉默窗户都没有考虑,并且将自动删除。 3.数据库和协议 3.1数据库 语料库生态条件,如监控应用,典型的音频事件不是因为异常情况主要是因为数据的机密性,但也很少被记录。为了尽可能接近真正的条件,我们为我们的应用程序已建成的人工数据从听起来满心欢喜国家法国公共广播提取一组多个公共场所和枪声的CD录音5]。所录用的事件数据库:共134杆(296秒)组成的手枪,步枪(R),(S)冲锋枪,手榴弹(G)和炮火(C)被提取。说明武器重新分区射击类数据列在表1中。

武器 冲锋枪 手榴弹 手枪 加农炮 气枪 文件数 5 15 79 8 27 长度 5s 24s 134s 28s 105s 表一

环境数据库:CD提供各种公共场所录音(主线站,机场,证券交易所,展览馆,体育场,市场,...),被称为周围序列。最具代表性的类型的地方(市场)总计797秒四个不同类型的市场。对于每四个记录的最后75秒的录音,保持正常类培训。其余的环境数据库用于测试数据库建设。

3.2.协议 测试数据库的音频和周边序列之间的混合结果。一个音频发生在随机时刻与各地方信号噪声比(SNR)为每个序列。SNR的计算方法的注射插入和数据预先标准化beforemixing的周边序列的部分。每个测试序列的长度为30秒,是随机选取的测试部分市场周边之间序列。对于每一个的SNR(从20到5 dB)134共计约67分钟的序列产生相应的测试提供134张。这种混合测试序列提供了一个模拟的异常情况公共场所尽可能接近现实(在枪发生的情况下)。尽管他们的人工自然,这些序列使我们能够控制的信噪比,因此测试系统的噪声鲁棒性,但也有地面的真相测试文件的注释(即所有的枪杀事件在周围序列的精确定位)。 注解:计算错误拒绝比(FR)和误检测(FD)的比值被定义为如下的总体结果由下式给出: FR=故障检测的事件数数进行检测,FD=虚假检测窗口数

)FD误检的窗口数(误检查比

总得窗口数

我们使用留下一杆交叉验证法的射门类培训:在每个测试序列的训练步骤,在测试数据库中被检测到每一个音频从训练数据库中删除。

)FR错误的窗口数(错误拒绝比

总得窗口数4.实验 4.1实验一:训练数据库 这第一个实验的目的是更好地理解拍摄的训练数据库中的噪声电平的效果。对于射击类,一个数据库的与周边序列片段拍摄混合产生从最初134拍摄。从20日至5分贝的信噪比,按5DB/S的速度提取。图3提供的拍摄检测到的结果,为每个SNR水平的测试序列的一组具有不同的训练数据库的SNR水平。正如所预期的结果迅速降解的SNR条件下的测试序列时减小,或者换句话说,当拍摄的能量减小比周边序列能量。特别是在清洁音频(培训)数据库提供虚假排斥在最嘈杂的测试序列的不足的结果。然而,它也可以可以看出,太嘈杂射门训练数据库的使用引发了相当多的误检率,在最坏的情况下,达到43%(5分贝的信噪比训练数据库和5分贝的信噪比的测试序列条件。

这个实验说明了虚假排斥和虚假检测时,选择适当的信噪比水平拍摄及周边序列训练数据库之间需要权衡。对于监控应用中,特别重要的是保持错误拒绝率尽可能地低,它似乎具有20分贝的信噪比训练数据库(低于11%,错误拒绝虚假词义小于15%),在所有测试条件下得到可接受的结果。 4.2:实验二 在以前的实验中,只有两个因素已考虑:开枪情况和正常情况。可是开枪类被定义记录在表1由不同种类的武器。他们有一个特定的声学特征,这意味着更多不同的签名是最糟糕的拍摄模式应该是由于声波混乱。为了减少混乱,并最终提高我们的检测系统性能,在合理情况下,认为可以建立更具体型号。其基本思想是,拍摄数据分割成子类声学密切的培训项目,聚集了足够大的数字。由于我们的数据库规模有限,不可能建立一个具体型号为每种武器类,因此,我们打算合并对于一个给定的距离是接近类。一个方便的方式来表示每一种武器的子类之间的距离是层次分类([10])。为配合我们的问题,并带来相关的子类,我们选择了反相关系数聚集距离。每个音频的代表出席了由他们的每个分析窗口的平均值和标准偏差。结果列于图4。我们的问题,并把相关的子类接近,我们选择反相关系数(1-R皮尔逊)聚集距离。声学措施,每次拍摄时作出假设上每个分析窗口分类的平均值和标准偏差列于图4。两个子类之间的拓扑距离相当于反相关值(1-R)。我们可以观察到,手枪(P)和步枪(R)是非常封闭的,就像手榴弹(G)和大炮(C)。这意味着,手枪和步枪声值更多相关例如比手枪和手榴弹的。一个单一的子类,似乎是更加孤立:冲锋枪枪(S),尽管它更接近设定的(P + R)。该三个子类(P+ R,S和G+ C)代表了最好的权衡之间的独立性(即:距离的其他子类)和未知声音的类别(即:足够数量的训练每个子类和最大号码子类)。

我们的第二个实验中,然后由使用4类(3个武器类和正常类)的分类系统,并评估这种分层方法的性能相比以前的二元分类。为每个决定窗口的后验概率得分相对应的三个武器类普通类的后验概率得分的计算和比较。使用下面的决策规则在每个分类,然后进行分类拍/正常对P+ R /正常,S/正常G+ C /正常:音频

相关文档
最新文档