基于泛化高斯模型infomax算法的水声信号盲分离
一种改进的自然梯度语音信号盲分离算法

一种改进的自然梯度语音信号盲分离算法
岳建杰;赵旦峰;张成
【期刊名称】《应用科技》
【年(卷),期】2015(000)003
【摘要】自然梯度算法有较快的收敛速度、良好的分离性能,在盲信号分离中占有重要地位。
基于自然梯度的盲源分离算法一般分为固定步长和变步长的自然梯度算法,固定步长的自然梯度算法存在分离速度与稳定性之间的矛盾,即步长越长时分离速度快,但是稳态误差又得不到保障;步长太小分离速度又达不到要求。
为了改善分离速度与稳定性之间的矛盾,提出了一种变步长的方法来,并用其改进了固定步长的标准自然梯度算法,成功地用于混合语音信号的分离,该方法取得比标准自然梯度算法更好的分离效果,具有更快的收敛速度。
【总页数】5页(P30-34)
【作者】岳建杰;赵旦峰;张成
【作者单位】哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨150001;哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨150001;哈尔滨工程大学自动化学院,黑龙江哈尔滨150001
【正文语种】中文
【中图分类】TN971.1
【相关文献】
1.一种改进的瞬时混合语音信号盲分离算法 [J], 李大辉;李长荣;杨阳
2.基于单声矢量传感器的语音信号时频掩蔽盲分离改进算法 [J], 陈晓屹;王英民
3.一种基于TMS320C6713的语音信号频域盲分离算法 [J], 刘朝晨;吴强;殷超;李清石;许宏吉;李玉军
4.改进FOA算法在语音信号盲分离中的应用 [J], 肖正安
5.峭度自然梯度盲分离改进算法 [J], 王灵伟;舒勤;陈飞龙
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于Infomax的盲分离算法及其稳定性

一种基于Infomax的盲分离算法及其稳定性
王法松;李宏伟;沈远彤
【期刊名称】《应用数学》
【年(卷),期】2005(18)1
【摘要】本文讨论具有超高斯分布与亚高斯分布的混合源信号的分离问题 ,提出了一种有效的分离算法———拓广的Infomax算法 ,并分析了该算法的渐近稳定性 ,与原有的Infomax算法相比 ,本文所提算法具有更广泛的应用范围 .
【总页数】7页(P85-91)
【关键词】盲源分离;独立成分分析;超高斯;亚高斯;Infomax算法
【作者】王法松;李宏伟;沈远彤
【作者单位】中国地质大学数理系
【正文语种】中文
【中图分类】O172.4
【相关文献】
1.基于Infomax的偏亚高斯信号盲源分离算法 [J], 王振纬;许刚
2.基于泛化高斯模型infomax算法的水声信号盲分离 [J], 余洁;谢宏;杨文璐
3.基于泛化高斯模型infomax算法的水声信号盲分离 [J], 余洁;谢宏;杨文璐
4.一种基于免疫算法的盲信号分离算法 [J], 何庆;骆忠强
5.基于扩展Infomax算法的变步长在线盲分离 [J], 马守科;何选森;许广廷
因版权原因,仅展示原文概要,查看原文内容请购买。
基于小波半软阈值消噪的盲源分离方法

软阈值法进 行 消 噪 处 理,消 噪 效 果 如 图 3~ 图 5
所示.
给定的阈值;
n 为信号长 度;
J 为最大分解
j 为 分 解 尺 度;
尺度.
硬阈值函数 处 理 后 的 小 波 系 数 的 连 续 性 差,
在阈值λ 处^
ωj,k 不连续,当进行信号重构时,将会
产生振荡,并使重构信号产生较大的均方差.
以提高其分离性能.实验验证了所提出方法的有效性和可行性.
关键词:盲源分离;小波;半软阈值;故障诊断
中图分类号:
TN911.
7 DOI:
10.
3969/
.
s
sn.
1004
132X.
2016.
03.
010
ji
B
l
i
ndSou
r
c
eS
epa
r
a
t
i
onBa
s
e
don Wa
v
e
l
e
tS
emi
s
5] 刘明黎 .
用[
制造业自动化,2012(
J].
10):
70
72.
硕士研究生,武汉军械士官学校弹药与仓储系 教 授. 主 要 研 究 方
工程学院教授.张颖江,男,
1959 年 生. 湖 北 工 业 大 学 计 算 机 学
系讲师.曹宏安,男,
1981 年生.武 汉 军 械 士 官 学 校 弹 药 与 仓 储
o
f
tThr
e
s
ho
l
dDe
no
i
s
i
ng
基于S变换的水中目标信号检测技术

基于S变换的水中目标信号检测技术梁清; 尹松【期刊名称】《《电声技术》》【年(卷),期】2019(043)007【总页数】6页(P20-25)【关键词】S变换; 特征分析; BP神经网络【作者】梁清; 尹松【作者单位】杭州应用声学研究所浙江杭州310023【正文语种】中文【中图分类】TB567水中目标辐射噪声信号属于非平稳时变信号,而时频分析是研究非平稳信号的有效工具之一。
为了获得信号的时变频谱特性,众多的学者提出了形式多样的时频分布函数,可多达几十种。
其中典型的方法大致可以分为如下:线性时频分析(小波变换、短时窗傅立叶变换和S变换)和非线性时频分析(wigner-ville分布等),这些方法有各自的特点,在不同的领域有着广泛的应用。
其中,S变换是一种无损可逆的时频分析工具,它综合了短时窗傅立叶变换和小波变换的优势,以时间和频率为变量来描述信号的能量密度和时间强度。
S变换不存在交叉项的干扰,同时对信号的解析清晰度要高于小波变换。
本文利用S变换时频方法分析舰船噪声的相位特征,局部谱特征估计,同时进行基于S变换的奇异值熵的特征分析,最后应用BP神经网络方法对目标信号实现分类识别。
1 S变换的定义美国物理学家Stockwell在前人研究时频分析方法的基础上,于1996年提出一种较新的时频分析方法称作S变换。
S变换是一种无损可逆的线性时频分析工具,它综合了STFT和小波变换的一些优点而克服了它们的不足;它与以Wigner-Ville分布为代表的非线性时频分析方法的主要区别在于不存在交叉项的影响。
信号x(t)的一维连续正变换表达式如下[1]:(1)式中Sx(·)是x(t)的S变换,f为频率,τ,t是时间,τ是控制时间轴上高斯窗的位置。
其连续反变换:(2)下面推导S变换。
首先定义一个高斯窗函数g(t)如下式:(3)对时间序列x(t)乘以窗函数g(t),即对高斯窗函数进行伸缩与平移。
(4)高斯窗的选取是因为它在时间和频率上具有较好的压缩性[2]。
基于字典稀疏性的脑图像数据盲分离方法

基于字典稀疏性的脑图像数据盲分离方法
冯宝;刘晓刚
【期刊名称】《计算机工程》
【年(卷),期】2015(041)012
【摘要】针对独立成分分析(ICA)方法的独立性假设在实际脑图像分析中很难完全满足的问题,根据脑图像数据的特点,提出一种基于字典稀疏性的盲分离方法.结合字典学习和盲分离技术,利用源信号在所选字典中的稀疏性,将盲分离的过程转换到稀疏域中,通过在稀疏域中对源信号施加稀疏性约束进行盲分解.采用脑激活区定位实验对该方法进行验证,并用线性相关方法进行结果比较.结果证明,与ICA方法相比,该方法得到的激活体素平均时间序列与实验任务更相关,激活体素空间分布也更集中,具有较高的求解质量和求解效率,可用于更好地分析脑图像数据,在稀疏域中进行盲分解时提高盲分解的质量.
【总页数】6页(P269-274)
【作者】冯宝;刘晓刚
【作者单位】桂林航天工业学院自动化系,广西桂林541004;桂林航天工业学院自动化系,广西桂林541004
【正文语种】中文
【中图分类】TP393.41
【相关文献】
1.基于代理函数优化的稀疏性字典学习 [J], 高磊;陈曾平
2.弱稀疏性下的欠定语音盲分离方法 [J], 王国鹏;刘郁林;罗颖光
3.基于行列式和稀疏性约束的NMF的欠定盲分离方法 [J], 卢宏;赵知劲;杨小牛
4.基于稀疏性的欠定语音盲分离方法研究 [J], 王国鹏;刘郁林;罗颖光
5.基于低分辨率图像自举和双重稀疏性字典训练的单幅图像超分辨率重构 [J], 艾娜;彭进业;王珺;王琳
因版权原因,仅展示原文概要,查看原文内容请购买。
基于深度神经网络的高环境适应性水声通信系统研究

基于深度神经网络的高环境适应性水声通信系统研究作者:付晓梅贾碧群王思宁来源:《湖南大学学报·自然科学版》2021年第10期摘要:深度神经网络中的自动编码器(Autoencoder,AE)通过收发端两个神经网络模块进行全局优化,利用端到端的训练方式以提高通信系统的可靠性. 然而,现有对AE的研究未针对信道进行特殊設计,尤其对于时变的水声信道的多径效应,难以进行灵活调整,降低了该方法的实用性. 本文提出一种提高水声通信系统信道环境适应性的Attention-Autoencoder网络模型,基于Attention网络可以高效地从大量信息中筛选出关键信息的特点,设计了一种针对水声信道的Attention机制,该机制能够增加网络提取水声信道特征的能力,使系统的适应性大大提高. 仿真验证和湖试实验结果表明,基于Attention-Autoencoder网络模型的通信系统与基于文献中AE模型和没有引入神经网络的水声通信系统相比,具有更高的信道环境适应性.关键词: OFDM;水声通信;注意力网络(Attention);自动编码器(Autoencoder,AE)中图分类号:TN 929.3 文献标志码:AResearch on Underwater Acoustic Communication System withHigh Environmental Adaptability Based on Deep Neural NetworkFU Xiaomei JIA Biqun WANG Sining(School of Marine Science and Technology,Tianjin University,Tianjin 300072,China)Abstract:The Autoencoder(AE) in the deep neural network is globally optimized through two neural network modules at the transmitter and receiver,and uses end-to-end training to improve the reliability of the communication system. However,the existing research on the AE does not have a special design for the channel,especially for the multipath effect of the time-varying underwater acoustic channel,and thus it is difficult to make flexible adjustments,which reduces the practicability of the method. This paper proposes an Attention-Autoencoder network model to improve the adaptability of the underwater acoustic communication system channel environment. Based on the Attention network's characteristic that it can efficiently filter out key information from a large amount of information,an Attention mechanism for the underwater acoustic channel is designed. The mechanism can increase the ability of the network to extract the characteristics of the underwater acoustic channel and greatly improve the adaptability of the system. Simulation verification and lake test results show that the communication system based on a comparision of. Attention-Autoencoder network model with the AE model in the literature and the underwater acoustic communication system without the introduction of neural networks,has a higher channel environment adaptability.Key words:orthogonal frequency division multiplexing(OFDM); underwater acoustic communication;attention;autoencoder(AE)水声通信在海洋信息数据采集、环境监测、沿海石油勘探等方面发挥着重要的作用. 水声信道由于具有快时变、窄带宽、显著的多径效应和多普勒频移等特性,是最复杂的信道之一[1],在水声通信系统中需要准确估计和跟踪信道状态信息(CSI).近年来,将深度神经网络(Deep Neural Net-work, DNN)引入水声通信的接收端,取得了一些积极进展,文献[2]利用深度神经网络代替信道估计模块,与最小二乘(LS)算法相比提高了信道估计的精度;文献[3]利用深度神经网络直接代替信道估计与均衡,提高了系统的可靠性;文献[4]使用深度神经网络代替接收端的解调、信道估计与均衡及星座图解映射几个部分,较大程度地降低了系统误码率.与仅用于接收端的DNN模型不同,自动编码器(Autoencoder,AE)是一种由收发端两个神经网络模块组成的模型,通常,AE模型中发送端网络用于编码,接收端网络用于解码[5-7];文献[8]提出利用自动编码器构建端到端的通信系统,将通信系统的接收端和发送端用自动编码器替代,结果表明基于该自动编码器的系统性能优于传统的无线通信系统;文献[9]将整个系统均用自动编码器表示,包括编码器、信道正则器和解码器几个部分,以便更加准确地恢复输入的信号;文献[10]利用自动编码器实现一个端到端的通信系统,并将这一思路拓展到MIMO 系统中;文献[11]将自动编码器应用到OFDM系统,利用自动编码器代替OFDM 的发送端和接收端,结果表明在多径信道环境下,基于自动编码器的OFDM系统比传统方法能更好地进行信道均衡和频率偏移补偿.然而,现有的大部分的深度神经网络均在无线通信中应用广泛,由于水声信道特征与陆上无线通信的信道具有不同的特性,现有的深度学习模型无法直接应用于水声通信中. 研究过程中我们发现,大部分现有基于深度学习的系统只是把深度神经网络当做一个“黑盒子”,没有针对信道环境进行设计与优化,缺乏考虑实际测试场景的因素,无法根据特定的场景环境进行迅速调整,离线完成训练的网络无法适用于有一定变化的测试环境.注意力(Attention)模型将网络的权重重新分布,使注意力专注于重要的输入,当神经网络处理大量的输入信息时,可以借鉴人脑的注意力机制,只选择一些关键的信息进行处理并规避干扰,从而增加网络提取特征的能力. 利用Attention网络的特点,文献[12]将Attention网络设计成层叠结构用于全局图像的感知与识别,以达到更加精准的图片分类结果;文献[13]中提出了一种顺序注意模型处理图像字幕,通过考虑相应的顺序关系来处理视觉注意,从而很好地利用了单词内在联系来增强句子解码过程中的视觉信息;文献[14]提出了一种基于残差学习和时空注意力机制的卷积神经网络(R-STAN),使其更加注重区分时间和空间特征,解决了视频中存在着大量的时空冗余信息的问题.为了提高适应性,本文在传统OFDM水声通信系统中加入AE,并引入一种针对水声信道的Attention机制,该机制能够增加网络提取水声信道特征的能力,并保留了具体的通信模块,如编码、星座映射、调制、加循环前缀等过程,避免了整个基于Attention-Autoencoder的水声通信系统成为一个巨大的“黑匣子”,使系统的可控性和环境适应性大大提高.1 基于Attention-Autoencoder的水声通信系统基于Attention-Autoencoder模型的水声通信系统框图如图1所示. 发送端的输入是随机生成的,经过星座图映射为符号,符号映射方式为QPSK,串并变换后进行快速傅里叶算法逆变换(inverse fast Fourier transform, IFFT),从频域信号X(k)获得时域信号,记作X(n)∈R M. 将进入自动编码器的发送端网络训练后记作x′(n),为了降低符号间干扰和子载波间干扰,在x′(n)的前端插入循环前缀(CP),得到t(n)∈R N. 进入Attention网络后,通过激励函数Tanh层和Softmax层得到概率权重后再与原输入h(n)相乘,其目的是通过Softmax激活层将输入的权重进行调整,更加忽略或侧重某个输入,从而更专注于找到未知水声信道的显著有效信息,这样可以有效筛选数据,使系统的泛化能力提高,最后将Attention网络的输出还原成复数形式h′(n),再将信道h(n)与信号进行卷积,M表示信号的长度,N表示信号t(n)的长度. 卷积过程如式(1)所示:2 Attention-Autoencoder網络模型2.1 Attention网络2.2 Autoencoder网络3 网络训练Attention-Autoencoder网络模型以端到端的方式训练信号数据,该模型使用离线训练结合在线测试的方式以减少运行所消耗的时间. 基于Bellhop的水声信道模型获得不同环境下的训练和测试数据集,训练集与测试集的样本个数分别为400和100,并结合真实实验环境1、2、3、4进行进一步验证. OFDM水声通信系统的参数如表1所示,在每次仿真中会随机生成 0,1 序列作为系统的输入数据流,分别表示为导频信息与信号信息,其比值为1 ∶ 1,导频插入方式为块状导频. 经网络传输后接收到的数据和原始生成的随机传输数据被称为训练数据. 神经网络在训练过程中通过调整每个神经元的权重,最小化输出Y(k)与输入X(k)之差.4 仿真实验与分析4.1 水声信道环境本文基于Stojanovic等[15]模拟了7种不同的环境如表2所示,用来测试系统对环境的适应性. 分别考虑传输距离、最大时延扩展和多普勒频移几个影响因素.4.2 Attention网络对水声信道冲激响应的影响为了验证上述Attention网络的效果与作用,我们将未经过Attention网络的水声信道冲激响应与经过Attention网络后的水声信道冲激响应归一化后进行了对比,如图6所示.图6比较了利用仿真环境2训练模型、用仿真环境3进行测试,经过Attention网络和未经过Attention网络的水声信道冲激响应,从图中可以看到,经过Attention网络后的信道多径数明显减少,只保留了水声信道中的最大径,这表明利用Attention网络机制可以有效地对水声信道多径信息进行筛选,尽量保留最大的信道冲激响应,过滤抑制其他的较小径,这种设计针对强多径的水声信道具有较好的实际物理意义.与仅用于接收端的DNN模型不同,自动编码器(Autoencoder,AE)是一种由收发端两个神经网络模块组成的模型,通常,AE模型中发送端网络用于编码,接收端网络用于解码[5-7];文献[8]提出利用自动编码器构建端到端的通信系统,将通信系统的接收端和发送端用自动编码器替代,结果表明基于该自动编码器的系统性能优于传统的无线通信系统;文献[9]将整个系统均用自动编码器表示,包括编码器、信道正则器和解码器几个部分,以便更加准确地恢复输入的信号;文献[10]利用自动编码器实现一个端到端的通信系统,并将这一思路拓展到MIMO 系统中;文献[11]将自动编码器应用到OFDM系统,利用自动编码器代替OFDM 的发送端和接收端,结果表明在多径信道环境下,基于自动编码器的OFDM系统比传统方法能更好地进行信道均衡和频率偏移补偿.然而,现有的大部分的深度神经网络均在无线通信中应用广泛,由于水声信道特征与陆上无线通信的信道具有不同的特性,现有的深度学习模型无法直接应用于水声通信中. 研究过程中我们发现,大部分现有基于深度学习的系统只是把深度神经网络当做一个“黑盒子”,没有针对信道环境进行设计与优化,缺乏考虑实际测试场景的因素,无法根据特定的场景环境进行迅速调整,离线完成训练的网络无法适用于有一定变化的测试环境.注意力(Attention)模型将网络的权重重新分布,使注意力专注于重要的输入,当神经网络处理大量的输入信息时,可以借鉴人脑的注意力机制,只选择一些关键的信息进行处理并规避干扰,从而增加网络提取特征的能力. 利用Attention网络的特点,文献[12]将Attention网络设计成层叠结构用于全局图像的感知与识别,以达到更加精准的图片分类结果;文献[13]中提出了一种顺序注意模型处理图像字幕,通过考虑相应的顺序关系来处理视觉注意,从而很好地利用了单词内在联系来增强句子解码过程中的视觉信息;文献[14]提出了一种基于残差学习和时空注意力机制的卷积神经网络(R-STAN),使其更加注重区分时间和空间特征,解决了视频中存在着大量的时空冗余信息的问题.为了提高适应性,本文在传统OFDM水声通信系统中加入AE,并引入一种针对水声信道的Attention机制,该机制能够增加网络提取水声信道特征的能力,并保留了具体的通信模块,如編码、星座映射、调制、加循环前缀等过程,避免了整个基于Attention-Autoencoder的水声通信系统成为一个巨大的“黑匣子”,使系统的可控性和环境适应性大大提高.1 基于Attention-Autoencoder的水声通信系统基于Attention-Autoencoder模型的水声通信系统框图如图1所示. 发送端的输入是随机生成的,经过星座图映射为符号,符号映射方式为QPSK,串并变换后进行快速傅里叶算法逆变换(inverse fast Fourier transform, IFFT),从频域信号X(k)获得时域信号,记作X(n)∈R M. 将进入自动编码器的发送端网络训练后记作x′(n),为了降低符号间干扰和子载波间干扰,在x′(n)的前端插入循环前缀(CP),得到t(n)∈R N. 进入Attention网络后,通过激励函数Tanh层和Softmax层得到概率权重后再与原输入h(n)相乘,其目的是通过Softmax激活层将输入的权重进行调整,更加忽略或侧重某个输入,从而更专注于找到未知水声信道的显著有效信息,这样可以有效筛选数据,使系统的泛化能力提高,最后将Attention网络的输出还原成复数形式h′(n),再将信道h(n)与信号进行卷积,M表示信号的长度,N表示信号t(n)的长度. 卷积过程如式(1)所示:2 Attention-Autoencoder网络模型2.1 Attention网络2.2 Autoencoder网络3 网络训练Attention-Autoencoder网络模型以端到端的方式训练信号数据,该模型使用离线训练结合在线测试的方式以减少运行所消耗的时间. 基于Bellhop的水声信道模型获得不同环境下的训练和测试数据集,训练集与测试集的样本个数分别为400和100,并结合真实实验环境1、2、3、4进行进一步验证. OFDM水声通信系统的参数如表1所示,在每次仿真中会随机生成 0,1 序列作为系统的输入数据流,分别表示为导频信息与信号信息,其比值为1 ∶ 1,导频插入方式为块状导频. 经网络传输后接收到的数据和原始生成的随机传输数据被称为训练数据. 神经网络在训练过程中通过调整每个神经元的权重,最小化输出Y(k)与输入X(k)之差.4 仿真实验与分析4.1 水声信道环境本文基于Stojanovic等[15]模拟了7种不同的环境如表2所示,用来测试系统对环境的适应性. 分别考虑传输距离、最大时延扩展和多普勒频移几个影响因素.4.2 Attention网络对水声信道冲激响应的影响为了验证上述Attention网络的效果与作用,我们将未经过Attention网络的水声信道冲激响应与经过Attention网络后的水声信道冲激响应归一化后进行了对比,如图6所示.图6比较了利用仿真环境2训练模型、用仿真环境3进行测试,经过Attention网络和未经过Attention网络的水声信道冲激响应,从图中可以看到,经过Attention网络后的信道多径数明显减少,只保留了水声信道中的最大径,这表明利用Attention网络机制可以有效地对水声信道多径信息进行筛选,尽量保留最大的信道冲激响应,过滤抑制其他的较小径,这种设计针对强多径的水声信道具有较好的实际物理意义.与仅用于接收端的DNN模型不同,自动编码器(Autoencoder,AE)是一种由收发端两个神经网络模块组成的模型,通常,AE模型中发送端网络用于编码,接收端网络用于解码[5-7];文献[8]提出利用自动编码器构建端到端的通信系统,将通信系统的接收端和发送端用自动编码器替代,结果表明基于该自动编码器的系统性能优于传统的无线通信系统;文献[9]将整个系统均用自动编码器表示,包括编码器、信道正则器和解码器几个部分,以便更加准确地恢复输入的信号;文献[10]利用自动编码器实现一个端到端的通信系统,并将这一思路拓展到MIMO 系统中;文献[11]将自动编码器应用到OFDM系统,利用自动编码器代替OFDM 的发送端和接收端,结果表明在多径信道环境下,基于自动编码器的OFDM系统比传统方法能更好地進行信道均衡和频率偏移补偿.然而,现有的大部分的深度神经网络均在无线通信中应用广泛,由于水声信道特征与陆上无线通信的信道具有不同的特性,现有的深度学习模型无法直接应用于水声通信中. 研究过程中我们发现,大部分现有基于深度学习的系统只是把深度神经网络当做一个“黑盒子”,没有针对信道环境进行设计与优化,缺乏考虑实际测试场景的因素,无法根据特定的场景环境进行迅速调整,离线完成训练的网络无法适用于有一定变化的测试环境.注意力(Attention)模型将网络的权重重新分布,使注意力专注于重要的输入,当神经网络处理大量的输入信息时,可以借鉴人脑的注意力机制,只选择一些关键的信息进行处理并规避干扰,从而增加网络提取特征的能力. 利用Attention网络的特点,文献[12]将Attention网络设计成层叠结构用于全局图像的感知与识别,以达到更加精准的图片分类结果;文献[13]中提出了一种顺序注意模型处理图像字幕,通过考虑相应的顺序关系来处理视觉注意,从而很好地利用了单词内在联系来增强句子解码过程中的视觉信息;文献[14]提出了一种基于残差学习和时空注意力机制的卷积神经网络(R-STAN),使其更加注重区分时间和空间特征,解决了视频中存在着大量的时空冗余信息的问题.为了提高适应性,本文在传统OFDM水声通信系统中加入AE,并引入一种针对水声信道的Attention机制,该机制能够增加网络提取水声信道特征的能力,并保留了具体的通信模块,如编码、星座映射、调制、加循环前缀等过程,避免了整个基于Attention-Autoencoder的水声通信系统成为一个巨大的“黑匣子”,使系统的可控性和环境适应性大大提高.1 基于Attention-Autoencoder的水声通信系统基于Attention-Autoencoder模型的水声通信系统框图如图1所示. 发送端的输入是随机生成的,经过星座图映射为符号,符号映射方式为QPSK,串并变换后进行快速傅里叶算法逆变换(inverse fast Fourier transform, IFFT),从频域信号X(k)获得时域信号,记作X(n)∈R M. 将进入自动编码器的发送端网络训练后记作x′(n),为了降低符号间干扰和子载波间干扰,在x′(n)的前端插入循环前缀(CP),得到t(n)∈R N. 进入Attention网络后,通过激励函数Tanh层和Softmax层得到概率权重后再与原输入h(n)相乘,其目的是通过Softmax激活层将输入的权重进行调整,更加忽略或侧重某个输入,从而更专注于找到未知水声信道的显著有效信息,这样可以有效筛选数据,使系统的泛化能力提高,最后将Attention网络的输出还原成复数形式h′(n),再将信道h(n)与信号进行卷积,M表示信号的长度,N表示信号t(n)的长度. 卷积过程如式(1)所示:2 Attention-Autoencoder网络模型2.1 Attention网络2.2 Autoencoder网络3 网络训练Attention-Autoencoder网络模型以端到端的方式训练信号数据,该模型使用离线训练结合在线测试的方式以减少运行所消耗的时间. 基于Bellhop的水声信道模型获得不同环境下的训练和测试数据集,训练集与测试集的样本个数分别为400和100,并结合真实实验环境1、2、3、4进行进一步验证. OFDM水声通信系统的参数如表1所示,在每次仿真中会随机生成 0,1 序列作为系统的输入数据流,分别表示为导频信息与信号信息,其比值为1 ∶ 1,导频插入方式为块状导频. 经网络传输后接收到的数据和原始生成的随机传输数据被称为训练数据. 神经网络在训练过程中通过调整每个神经元的权重,最小化输出Y(k)与输入X(k)之差.4 仿真实验与分析4.1 水声信道环境本文基于Stojanovic等[15]模拟了7种不同的环境如表2所示,用来测试系统对环境的适应性. 分别考虑传输距离、最大时延扩展和多普勒频移几个影响因素.4.2 Attention网络对水声信道冲激响应的影响为了验证上述Attention网络的效果与作用,我们将未经过Attention网络的水声信道冲激响应与经过Attention网络后的水声信道冲激响应归一化后进行了对比,如图6所示.图6比较了利用仿真环境2训练模型、用仿真环境3进行测试,经过Attention网络和未经过Attention网络的水声信道冲激响应,从图中可以看到,经过Attention网络后的信道多径数明显减少,只保留了水声信道中的最大径,这表明利用Attention网络机制可以有效地对水声信道多径信息进行筛选,尽量保留最大的信道冲激响应,过滤抑制其他的较小径,这种设计针对强多径的水声信道具有较好的实际物理意义.。
水下声目标的梅尔倒谱系数智能分类方法
水下声目标的梅尔倒谱系数智能分类方法张少康; 田德艳【期刊名称】《《应用声学》》【年(卷),期】2019(038)002【总页数】6页(P267-272)【关键词】水下声目标识别分类; 梅尔倒谱系数; 长短时记忆网络; 智能分类【作者】张少康; 田德艳【作者单位】海军潜艇学院青岛 266000; 青岛海洋科学与技术试点国家实验室青岛 266000【正文语种】中文【中图分类】TP391.40 引言传统水下声目标识别分类方法需要人工提取具有可推广性、泛化能力强的特征数据,其过程繁琐复杂,专业性强,需要人的参与,识别分类过程具有较强的人机交互特性。
近几年,随着浮标潜标、水下滑翔机、AUV、UUV 等水下无人潜航器的发展,基于水下无人移动平台的声学探测体系正在不断建立完善。
水下声目标识别分类是水声探测的“瓶颈”,同时也是关键技术之一。
未来水下无人声学探测预警体系要求潜航器本身具备水下声目标识别分类能力,而传统水下声目标识别分类方法已无法满足此要求,因此研究智能化水下声目标识别分类方法具有重要意义。
一直以来,特征向量提取方法都是水下声目标识别分类的研究重点,基于听觉特征的水下声目标特征提取方法是研究热点之一,其中,基于语音识别方法提取梅尔倒谱系数(Mel frequency cepstrum coefficient, MFCC)进行水下声目标识别是常用的方法之一。
如文献[1]介绍了差分梅尔频率倒谱系数的概念和相应的特征提取方法,对水下目标进行了基于MFCC 特征提取方法仿真研究和实验分析;文献[2]将MFCC 特征应用于船舶和鲸类水下声信号的特征提取中,提取了船舶和鲸类声信号的MFCC 特征,通过高斯混合模型对提取的MFCC特征进行训练和识别分类,讨论MFCC维数变化和不同MFCC 特征组合对识别分类性能的影响;另外文献[3–5]也进行了MFCC 特征提取相关方面的研究工作,并取得了一定的研究成果。
近几年来,以深度学习为代表的人工智能算法发展迅速,深度学习是人工神经网络的发展,于2006年被提出[6],目前已发展出自编码器(Auto encode, AE)[7]、深度置信网络(Deep belief networks,DBN)[8]、卷积神经网络(Convolutional neural network,CN N)[9−10]、循环神经网络(Recurrent neural networks, RNN)[11−13]、生成对抗网络(Generative adversarial network, GAN)[14−15]及其相关变种等多种模型,在各个领域得到广泛的应用,其中,长短时记忆(Long short-term memory, LSTM)网络在语音识别领域应用效果显著。
一种自适应算法的语音信号盲分离
摘
要 :盲信号处理算法 主要有批处理算法和 自适应算法两类 ,本文 导出 了一 种批处理 和 自适 应相结 合的快速 独立分
量分析 ( at nee dn C m o et nls ,F tC Fs Idpn et o p nn A a i a A)算法 ,将该算法应用于语音信号盲分离处理 ,通过综合 实验 ,从分 ys s I
l o t m n d p i g f h ag r h a d a a t e a o t m ,te f s id p n e tc mp n n n l ss ag r h f r s e c i a b i d s p ai n p o e sn s i v i h a t n e e d n o o e ta ay i o t m o p e h s l l e a t rc s ig i l i n g n r o p e e t d i i p p r h o g h o r h n ie e p r n s t e r s l h w ta a t C ag r h h sg o i a e a ai n e- r s n e n t s a e .T r u h t e c mp e e s x e me t , h e u t s o tF s A l o t m a o d sg ls p r t f h v i s h I i n o i in yfo t i a a eo msa ds e t fce c rm e s n lw ain a d t eman e a u t n p rmee .F t C g rtm a h g u e oe a d a t p r t n h i v l ai a a tr es o o s s I l i a Aa o h h s
语音识别系统设计中的声学模型训练方法
语音识别系统设计中的声学模型训练方法在语音识别系统设计中,声学模型训练方法是至关重要的环节。
声学模型是语音识别系统的重要组成部分,它的训练方法直接影响着识别系统的性能和准确度。
本文将探讨一些常见的声学模型训练方法,介绍它们的原理和应用情况。
一、高斯混合模型(GMM)高斯混合模型是一种常用的声学模型训练方法,它基于统计建模的原理。
GMM假定语音信号的声学特征服从高斯分布,通过拟合多个高斯分布来表示语音信号的特征分布。
在声学模型训练中,首先需要提取语音信号的特征向量,常用的特征向量包括梅尔频率倒谱系数(MFCC)和滤波器组频率特征(FBANK)。
然后,通过使用EM算法来估计GMM的参数,包括每个高斯分布的均值、方差和权重。
在训练过程中,要使用大量标注好的语音数据来训练声学模型。
训练数据通常包括语音的文本标注和相应的特征向量。
通过最大似然估计的方法,可以调整GMM的参数使其最好地拟合训练数据。
训练完成后,声学模型就可以用于识别未知语音的特征。
二、深度神经网络(DNN)深度神经网络是近年来发展起来的一种强大的声学模型训练方法。
DNN是一种多层感知器模型,通过多层神经元的组合和非线性变换来对语音信号进行建模。
与GMM相比,DNN能够学习到更复杂的语音特征表示,从而提高识别准确率。
DNN的训练过程是通过反向传播算法来进行的,首先通过随机初始化权重和偏置,然后逐渐调整它们使得DNN的输出与标注的语音标签最匹配。
与GMM相比,DNN需要更大规模的训练数据来获得更好的性能。
此外,为了避免过拟合现象,还需要进行正则化和提前停止等技术手段。
三、循环神经网络(RNN)循环神经网络是一种特殊类型的神经网络,常用于处理序列数据,如语音和文本。
RNN的一个重要特点是它可以通过时间步骤之间的信息传递来处理动态序列数据。
在语音识别中,RNN常常被用来对声学特征进行建模。
RNN的训练过程类似于DNN,通过反向传播来调整权重和偏置。
【国家自然科学基金】_盲源信号分离_基金支持热词逐年推荐_【万方软件创新助手】_20140801
科研热词 盲源分离 独立分量分析 故障诊断 非平稳信号 盲信源分离 振动与波 高阶累积量 频谱分析 频域 非负矩阵分解 非线性盲源提取 非线性盲源分离 非平稳 雅克比方法 阈值函数 重盲源分离 近似联合块对角化 跳频信号 贝叶斯推论 语音信号处理 船舶 航空发动机 联合对角化 线性聚类 第二代小波 稀疏成分分析 相合束广义特征分解 相关系数分析 盲解卷积 盲源信号分离 盲信号处理 盖尔圆理论 白化 滚动轴承 源数估计 测向 波束形成 水下航行器 歌曲数据库 次序不确定性 最小输出能量 最大比合并 时频比 时频分析 时频分布 时差估计 旨源分离 旋转机械 排列模糊 振源 投影梯度算法 小波多分辨率分析
2012年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2011年 科研热词 盲源分离 独立分量分析 飞机 脑电信号 独立成分分析 梯度算法 循环累积量 信息处理 雅可比旋转 跳频信号 超定 负熵 贝叶斯推论 舱音 舱青 稀疏表示 稀疏分量分析 矩阵联合对角化 盲信号分离 独立变量分析 熵估计 涡扇发动机 波恩-约旦分布 欠定盲源分离 欠定盲分离 欠定混合 模糊聚类 机械振源 最大信噪比 故障诊断 振动信号处理 振动信号 循环平稳信号 广义hough变换 局域均值分解 小波重构 小波变换 小波分解 参考源信号 压缩感知 半盲分离 信源估计 信号源噪声 交流电机调速系统 互相关系数 主成分分析 fast ica 推荐指数 12 3 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1