【CN110119805A】基于回声状态网络分类的卷积神经网络算法【专利】

合集下载

【CN110110840A】一种基于忆阻神经网络的联想记忆情感识别电路【专利】

【CN110110840A】一种基于忆阻神经网络的联想记忆情感识别电路【专利】

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910324683.9(22)申请日 2019.04.22(71)申请人 中国地质大学(武汉)地址 430000 湖北省武汉市洪山区鲁磨路388号(72)发明人 王雷敏 邹化宇 (74)专利代理机构 武汉知产时代知识产权代理有限公司 42238代理人 孙丽丽(51)Int.Cl.G06N 3/00(2006.01)G06N 3/063(2006.01)(54)发明名称一种基于忆阻神经网络的联想记忆情感识别电路(57)摘要本发明提供了一种基于忆阻神经网络的联想记忆情感识别电路,该电路包括输入单元、逻辑判断单元、突触单元、学习速度调节单元、输出处理单元和输出单元;所述输入单元用来模拟神经网络中的输入神经元;输出单元用来模拟神经网络中的输出神经元;该电路用于实现一种基于忆阻神经网络的联想记忆情感识别方法;利用神经网络,建立基于忆阻神经网络的联想记忆情感识别模型,用来模拟人类感知器。

本发明的有益效果是:基于忆阻神经网络的联想记忆情感识别电路的集成化程度更高,实现了对人类学习速度变化的模拟,更好的对人类情绪变化进行模拟,提高智能机器模拟人类思考和行为的可能性;增强了模拟神经网络的仿生能力和实用性。

权利要求书2页 说明书8页 附图3页CN 110110840 A 2019.08.09C N 110110840A权 利 要 求 书1/2页CN 110110840 A1.一种基于忆阻神经网络的联想记忆情感识别电路,其特征在于:该电路包括输入单元、逻辑判断单元、突触单元、学习速度调节单元、输出处理单元和输出单元;所述输入单元包括第一输入单元、第二输入单元和第三输入单元,用来模拟神经网络中的3个输入神经元;逻辑判断单元包括第一判断单元和第二判断单元,用来模拟神经网络中的神经元根据3个输入神经元的输入信号进行判断当前所处的状态,所述状态包括学习状态和遗忘状态;突触单元用来模拟神经元之间的突触S1、S2、S3、S4、S5和S6,其中,突触S1和突触S6为亢奋突触,突触S2和突触S5为抑制突触,且突触S1、S2、S5和S6各自的阻值固定不变,即突触强度不会发生变化,用于模拟神经元的无条件反射,突触S3和突触S4为可根据自身输入和输出端的电压的不同在某一范围内变化的阻值,即突触的强度可发生变化,用于模拟神经元的条件反射;学习速度调节单元包括第一调节单元和第二调节单元,用来模拟神经网络中的神经元判断是否是第一次学习,若是,则学习速度调节单元不作出反馈;若否,则学习速度调节单元与逻辑判断单元通过加法器共同作用于突触单元中的突触S3或突触S4,导致突触S3或突触S4输入输出两端的电压变小,从而导致突触S3或突触S4的阻值变化速度变快,模拟神经网络中的突触强度快速增强,使第二次及之后学习情感识别所需的学习时间减少;输出处理单元包括第一处理单元和第二处理单元,用来对突触输出的内容进行求和处理,便于输出单元输出;输出单元包括第一输出单元和第二输出单元,用来模拟神经网络中的输出神经元,输出情感识别类别;突触S1的电路为:电阻R1的输出端分别连接电阻R2的输入端和第一运放器的输入信号1端,电阻R2和第一运放器的输入信号1端及输出端连接;突触S2的电路为:电阻R3的输出端分别连接电阻R4的输入端和第二运放器的输入端,电阻R4和第二运放器的输入信号1端及输出端连接;突触S3的电路为:忆阻器M1的输出端分别连接电阻R5的输入端和第三运放器的输入端,电阻R5和第三运放器的输入信号1端及输出端连接;其中,第一运放器、第二运放器和第三运放器的输入信号2端均接地;突触S1和突触S5的电路相同,突触S2和突触S6的电路相同,突触S3和突触S4的电路相同;第一输入单元的输出端分别连接突触S1中的电阻R1的输入端、突触S2中的电阻R3的输入端和第一判断单元的输入端IN1,第二输入单元的输出端分别连接第一判断单元的输入端IN2和第二判断单元的输入端IN1,同理,第三输入单元的输出端分别连接突触S5中电阻R7的输入端、突触S6中电阻R9的输入端和第二判断单元的输入端IN2,第一判断单元的输出端通过加法器分别连接图突触S3的输入端和第一调节单元的输出端,第二判断单元的输出端通过加法器分别连接图突触S4中的忆阻器M2的输入端和第二调节单元的输出端,突触S1的输出端和突触S6的输出端均连接第一处理单元的输入端,突触S2的输出端和突触S5的输出端均连接第二处理单元的输入端,突触S3的输出端分别连接第一处理单元的输入端和第一调节单元的输入端,突触S4的输出端分别连接第二处理单元的输入端和第二调节单元的输入端,第一处理单元的输出端连接第一输出单元的输入端,第二处理单元的输出端连接第二输出单元的输入端。

【CN110111783A】一种基于深度神经网络的多模态语音识别方法【专利】

【CN110111783A】一种基于深度神经网络的多模态语音识别方法【专利】

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910284551.8(22)申请日 2019.04.10(71)申请人 天津大学地址 300072 天津市南开区卫津路92号(72)发明人 喻梅 程旻余童 高洁 刘志强 徐天一 于瑞国 李雪威 胡晓凯 (74)专利代理机构 天津市北洋有限责任专利代理事务所 12201代理人 李林娟(51)Int.Cl.G10L 15/22(2006.01)G10L 15/25(2013.01)G10L 15/06(2013.01)G10L 25/30(2013.01)(54)发明名称一种基于深度神经网络的多模态语音识别方法(57)摘要本发明公开了一种基于深度神经网络的多模态语音识别方法,包括以下步骤:基于汉语音素构建句子级别的语料文本,并录制多模态数据,包括:彩色图像、深度图像、深度数据以及音频信息;获取说话人发音过程中的唇部图像与音频信号,对唇部图像进行加窗分帧,对图像进行DCT变换及PCA降维,选取合适维度的图像特征与音频的MFCC特征做特征拼接,形成新的多模态音频特征;搭建中文的自动语音识别系统,使用深度神经网络-隐马尔科夫模型进行声学模型的建模,并选取多模态语音特征拼接作为输入,进行训练与测试解码,降低字和句子的识别错误率。

本发明降低了声学模型在词和句子的识别错误率。

权利要求书1页 说明书8页 附图5页CN 110111783 A 2019.08.09C N 110111783A权 利 要 求 书1/1页CN 110111783 A1.一种基于深度神经网络的多模态语音识别方法,其特征在于,所述方法包括以下步骤:基于汉语音素构建句子级别的语料文本,并录制多模态数据,包括:彩色图像、深度图像、深度数据以及音频信息;获取说话人发音过程中的唇部图像与音频信号,对唇部图像进行加窗分帧,对图像进行DCT变换及PCA降维,选取合适维度的图像特征与音频的MFCC特征做特征拼接,形成新的多模态音频特征;搭建中文的自动语音识别系统,使用深度神经网络-隐马尔科夫模型进行声学模型的建模,并选取多模态语音特征拼接作为输入,进行训练与测试解码,降低字和句子的识别错误率。

【CN110111797A】基于高斯超矢量和深度神经网络的说话人识别方法【专利】

【CN110111797A】基于高斯超矢量和深度神经网络的说话人识别方法【专利】

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910271166.X(22)申请日 2019.04.04(71)申请人 湖北工业大学地址 430068 湖北省武汉市洪山区李纸路(72)发明人 曾春艳 马超峰 武明虎 朱栋梁 赵楠 朱莉 王娟 (74)专利代理机构 北京科家知识产权代理事务所(普通合伙) 11427代理人 陈娟(51)Int.Cl.G10L 17/02(2013.01)G10L 17/08(2013.01)G10L 17/18(2013.01)(54)发明名称基于高斯超矢量和深度神经网络的说话人识别方法(57)摘要本发明公开了一种基于高斯超矢量和深度神经网络的说话人识别方法,包括说话人特征提取阶段,深度神经网络设计阶段,说话人识别与决策阶段,本发明通过深度神经网络与说话人识别系统模型相融合,结合高斯超矢量和深度神经网络的多层结构在提高评价模型的表征能力方面的显著效果,并且本发明提出的说话人识别方法在背景噪声的环境下能够有效提升系统的识别性能,在降低噪声对系统性能影响、提高系统噪声鲁棒性的同时,优化系统结构,提高了相应说话人识别产品的竞争力。

权利要求书3页 说明书9页 附图1页CN 110111797 A 2019.08.09C N 110111797A1.一种基于高斯超矢量和深度神经网络的说话人识别方法,应用于说话人识别,其特征在于,所述基于高斯超矢量和深度神经网络的说话人识别方法包括:S1:说话人特征提取;1-1)采集原始语音信号并依次预加重、分帧、加窗,快速傅里叶变换(FFT)、三角窗滤波、求对数、离散傅里叶变换(DCT)、差分参数、倒谱均值和方差归一化(CMVN);1-11)预加重:为了消除发声过程中,声带和嘴唇造成的效应,来补偿语音信号受到发音系统所压抑的高频部分y=x(n)-a*x(n -1),0.95<a<0.97 (1)式中x(n)表示输入信号;1-12)分帧:将N个采样点集合成一个观测单位,称为帧;1-13)加窗:将每一帧乘以汉明窗,以增加帧左端和右端的连续性,x(n)表示分帧之后的信号1-14)快速傅里叶变换(FFT):将时域信号转化到频域进行后续的频率分析式中s(n)表示输入的语音信号,N表示傅里叶变换的帧数;1-15)将能量谱通过一组Mel尺度的三角形滤波器组,定义为一个有M个三角滤波器的滤波器组,中心频率为f(m),m=1,2,…,M;各f(m)之间的间隔与m值成正比;1-16)经离散余弦变换(DCT)得到MFCC系数:将上述的对数能量带入离散余弦变换,式中M为三角滤波器的个数;L是MFCC系数的阶数;1-17)差分:为了使特征更能体现时域连续性,可以在特征维度增加前后帧信息的维度,常用的是一阶差分和二阶差分;1-18)倒谱均值和方差归一化可以消除平稳信道影响,提升特征的鲁棒性;1-2)给出一组训练按步骤1-1)提取出MFCC特征,训练通用背景模型(Universal Background Model,UBM);1-21)若某条语音数据对应的特征为X,其中X={x 1,x 2,…x T },且假设其维度为D,用于计算其似然函数的公式为:式中该密度函数由K个单高斯密度函数p k (X t )加权得到,其中每一个高斯分量的均值μk 和协方差∑k 的大小分别为:1×D和D ×D;权 利 要 求 书1/3页2CN 110111797 A。

一种基于卷积神经网络和激光测振的中医诊断方法[发明专利]

一种基于卷积神经网络和激光测振的中医诊断方法[发明专利]

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201911213400.X(22)申请日 2019.12.02(71)申请人 山东浪潮人工智能研究院有限公司地址 250100 山东省济南市高新区浪潮路1036号浪潮科技园S05楼北六层(72)发明人 孙善宝 罗清彩 于玲 马辰 (74)专利代理机构 济南信达专利事务所有限公司 37100代理人 姜明(51)Int.Cl.G16H 50/20(2018.01)G06N 3/04(2006.01)A61B 5/00(2006.01)A61B 5/02(2006.01)(54)发明名称一种基于卷积神经网络和激光测振的中医诊断方法(57)摘要本发明公开了一种基于卷积神经网络和激光测振的中医诊断方法,属于神经网络在医疗辅助诊断中应用的技术领域。

本发明的基于卷积神经网络和激光测振的中医诊断方法通过激光测振装置采集脉象数据,将多次采集的脉象数据输入到卷积神经网络中组成训练数据集,将训练数据集进行切脉网络模型训练,形成切脉神经网络,并得到切脉神经网络模型;被检测者的脉象数据输入到切脉神经网络模型中,形成脉象结果输出。

该发明的基于卷积神经网络和激光测振的中医诊断方法更加具有针对性,更加符合受测人群的需求特点,并且使得数据更加准确合理,具有很好的推广应用价值。

权利要求书1页 说明书6页 附图3页CN 110752032 A 2020.02.04C N 110752032A1.一种基于卷积神经网络和激光测振的中医诊断方法,其特征在于:通过激光测振装置采集脉象数据,将多次采集的脉象数据输入到卷积神经网络中组成训练数据集,将训练数据集进行切脉网络模型训练,形成切脉神经网络,并得到切脉神经网络模型;被检测者的脉象数据输入到切脉神经网络模型中,形成脉象结果输出。

2.根据权利要求1所述的基于卷积神经网络和激光测振的中医诊断方法,其特征在于:该方法具体包括以下步骤:S1、通过激光测振装置收集切脉神经网络的训练数据;S2、将采集的训练数据按照不同人群进行划分,形成多个训练数据集;S3、将多个训练数据集在云端进行训练,得到多个针对不同人群的切脉网络模型;S4、将获得的多个切脉网络模型的参数固定,加入模型选择网络,将被检测者的个人信息预处理后作为输入,进行切脉网络模型训练;S5、将得到的切脉网络模型进行融合,形成切脉神经网络;S6、通过训练数据中的测试集对切脉神经网络进行验证,并根据结果调整步骤S2中训练数据集的划分方法,进行多次训练,得到切脉神经网络模型;S7、通过激光测振装置采集被检测者的脉象数据;S8、将被检测者的个人信息和脉象数据,输入到切脉神经网络模型中;S9、切脉神经网络提取脉象特征,进行分类,将诊断结果输出。

【CN110110780A】一种基于对抗神经网络和海量噪声数据的图片分类方法【专利】

【CN110110780A】一种基于对抗神经网络和海量噪声数据的图片分类方法【专利】

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910358002.0(22)申请日 2019.04.30(71)申请人 南开大学地址 300350 天津市津南区海河教育园区同砚路38号(72)发明人 杨巨峰 程明明 孙晓晓 陈丽怡 (74)专利代理机构 天津耀达律师事务所 12223代理人 侯力(51)Int.Cl.G06K 9/62(2006.01)(54)发明名称一种基于对抗神经网络和海量噪声数据的图片分类方法(57)摘要一种基于对抗神经网络和海量噪声数据的图片分类方法,解决使用深度学习进行图片分类任务时数据不足的问题。

该方法将网络图像与标准数据集中的图像同时作为训练数据送入卷积神经网络中,并使用类别标签和来源标签分别表示图像内容上的类别及数据来源;分别计算标签预测损失和来源识别损失得到联合损失,通过最小化联合损失,使网络数据和标准数据的表现趋向于一致。

该方法可用于计算机视觉的各种细分类任务中,大量网络数据作为训练数据可以有效地提升卷积神经网络的分类性能。

本方法在训练过程中采用对抗策略使得模型对于数据的来源变得不敏感、网络数据与标准数据能够很好地混合在一起。

权利要求书1页 说明书4页 附图2页CN 110110780 A 2019.08.09C N 110110780A权 利 要 求 书1/1页CN 110110780 A1.一种基于对抗神经网络和海量噪声数据的图片分类方法,用于训练卷积神经网络使网络数据与标准数据趋于一致来提高模型的分类性能,其特征在于,包括:a.将带有噪声的海量网络图像与标准数据集中的图像同时作为训练数据送入卷积神经网络中,对于每个训练数据的图像样本,使用类别标签和来源标签分别表示图像内容上的类别以及图像的数据来源;b.根据步骤a中卷积神经网络的最后一层特征,使用Softmax函数对图像类别计算标签预测损失,当分类任务的识别准确率越高时标签预测损失越小;c.根据步骤a中卷积神经网络的最后一层特征,基于对抗神经网络的思想,使用交叉熵损失函数计算来源识别损失,为了从网络数据中学习,需要使数据来源的分类准确率降低,因此需要使来源识别损失的值变大;d.根据步骤b中的标签预测损失和步骤c中的来源识别损失计算得到联合损失,为便于优化网络,将来源识别损失的值取负数并与标签预测损失加权求和作为联合损失;e.在训练卷积神经网络的过程中最小化步骤d中的联合损失,网络模型趋向于更好地分类图片类别,同时网络数据和标准数据的表现趋向于一致,减弱了噪声的影响,使得图片类别标签分类的准确率得到提高。

一种基于卷积神经网络和双耳表征的自然语音情感识别方法[发明专利]

一种基于卷积神经网络和双耳表征的自然语音情感识别方法[发明专利]

专利名称:一种基于卷积神经网络和双耳表征的自然语音情感识别方法
专利类型:发明专利
发明人:张石清,赵小明
申请号:CN201911330520.8
申请日:20191220
公开号:CN111312215A
公开日:
20200619
专利内容由知识产权出版社提供
摘要:本发明涉及语音和图像处理、模式识别领域,公开了一种基于卷积神经网络和双耳表征的自然语音情感识别方法,包括步骤:A)采集语音信号,获得与四种语音Mel频谱片段对应的语音RGB图像三通道输入矩阵;B)构建四个语音深度卷积神经网络,获得四种语音Mel频谱片段学习到的CNN特征;C)采用基于块的特征池化方法将四种语音Mel频谱片段学习到的CNN特征分别聚合成固定长度的全局性语句特征;D)采用两阶段分数层融合方法进行融合,获得语音情感识别分类结果。

本发明不仅利用双耳表征进行特征学习,并且提出了基于块的特征池化方法,采用两阶段分数层融合方法进行融合,语音情感识别结果准确率高。

申请人:台州学院
地址:318000 浙江省台州市市府大道1139号
国籍:CN
代理机构:杭州杭诚专利事务所有限公司
代理人:尉伟敏
更多信息请下载全文后查看。

一种基于1D卷积神经网络的室性异位搏动检测方法[发明专利]

专利名称:一种基于1D卷积神经网络的室性异位搏动检测方法
专利类型:发明专利
发明人:刘健,宋爽,程绍龙
申请号:CN201710300072.1
申请日:20170428
公开号:CN107137072A
公开日:
20170908
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于1D(Dimension)卷积神经网络的室性异位搏动检测方法,由于卷积神经网络普遍应用于二维图像处理方面,而心电信号属于一维的时间序列,本发明针对心电信号的特点设计了一种一维卷积神经网络用于检测室性异位搏动;同时,针对心电信号的特点,给出心电信号具体分割参数,并将心率失常数据库分割得到的一系列单个心拍数据输入到专门设计的一维卷积神经网络中进行训练,与以往的方法相比,鲁棒性更强,检测精度更佳。

申请人:北京科技大学
地址:100083 北京市海淀区学院路30号
国籍:CN
代理机构:成都行之专利代理事务所(普通合伙)
代理人:温利平
更多信息请下载全文后查看。

一种基于卷积神经网络的言语置信度评测方法[发明专利]

专利名称:一种基于卷积神经网络的言语置信度评测方法专利类型:发明专利
发明人:梁瑞宇,谢跃,赵力,包永强,王青云,唐闺臣
申请号:CN201710099098.4
申请日:20170223
公开号:CN106901758A
公开日:
20170630
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于卷积神经网络的言语置信度评测方法。

该方法首先对采集的语音样本进行分帧,并提取每帧的梅尔倒谱系数,构成单通道梅尔倒谱系数图像;然后构建六层卷积神经网络,构建前三层为使用尺寸不同的卷积滤波器的卷积层,第四层为生成全局特征图的聚合层,第五层和第六层为由2048个线性修正单元的全连层;最后将梅尔倒谱系数图像输入构建的卷积神经网络进行言语置信度评测。

实验结果显示,该置信度评测方法对谎言的识别率达到73%。

申请人:南京工程学院
地址:211167 江苏省南京市江宁科学园弘景大道1号
国籍:CN
代理机构:江苏圣典律师事务所
更多信息请下载全文后查看。

一种基于深度神经网络的多类声学特征整合方法和系统[发明专利]

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202010073244.8(22)申请日 2020.01.22(71)申请人 厦门大学地址 361000 福建省厦门市思明区思明南路422号(72)发明人 李琳 李铮 洪青阳 (74)专利代理机构 厦门福贝知识产权代理事务所(普通合伙) 35235代理人 陈远洋(51)Int.Cl.G10L 15/06(2013.01)G10L 15/16(2006.01)G10L 15/02(2006.01)(54)发明名称一种基于深度神经网络的多类声学特征整合方法和系统(57)摘要本申请公开一种基于深度神经网络的多类声学特征整合方法和系统。

包括利用已知语音数据训练并建立基于深度神经网络的多类声学特征整合模型,以确定或更新多类声学特征整合模型的网络参数;将从待测语音中提取的多类声学特征输入已训练好的具有网络参数的多类声学特征整合模型中,并提取帧级别深度整合特征向量或段级别深度整合特征向量。

该方案支持语音识别、语音唤醒、语种识别、说话人识别、防录音攻击欺骗等语音任务中多种声学特征整合向量的提取,可根据实际语音任务充分挖掘多种声学特征的内在联系,用于改善语音任务应用的识别精准度和稳定性。

权利要求书2页 说明书13页 附图8页CN 111276131 A 2020.06.12C N 111276131A1.一种基于深度神经网络的多类声学特征整合方法,其特征在于,所述方法包括:S1:利用已知语音数据训练并建立基于深度神经网络的多类声学特征整合模型,以确定或更新所述多类声学特征整合模型的网络参数;S2:将从待测语音中提取的多类声学特征输入已训练好的具有所述网络参数的所述多类声学特征整合模型中,并提取帧级别深度整合特征向量或段级别深度整合特征向量。

2.根据权利要求1所述的一种基于深度神经网络的多类声学特征整合方法,其特征在于,所述S1步骤中的所述深度神经网络包括至少两个浅层特征网络分支、支持多个声学特征的特征整合网络、至少两个全连接的隐藏层和一个面向实际语音任务的输出层。

基于深度卷积神经网络的人类胚胎心脏超声图像的去噪方法[发明专利]

专利名称:基于深度卷积神经网络的人类胚胎心脏超声图像的去噪方法
专利类型:发明专利
发明人:刘斌,许钊
申请号:CN202010409165.X
申请日:20200514
公开号:CN111563858A
公开日:
20200821
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于深度卷积神经网络的人类胚胎心脏超声图像的去噪方法,包括如下步骤:获取具有时间序列和空间序列特征的超声图像数据集并选取中心图像、确定该中心图像的相邻图像;计算中心图像中心像素与相邻图像对应搜索域中每个像素的相似度;根据相似度信息计算相邻图像对应的中心像素灰度值并对该中心像素灰度值进行取平均值操作得到中心像素的最终灰度值,构建深度卷积神经网络模型,将未去噪的超声图像输入至完成训练的深度卷积神经网络模型中进行去燥处理获得噪声图像与干净图像的差即残差图像。

申请人:大连理工大学
地址:116024 辽宁省大连市高新园区凌工路2号
国籍:CN
代理机构:大连东方专利代理有限责任公司
更多信息请下载全文后查看。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910387770.9
(22)申请日 2019.05.10
(71)申请人 东南大学
地址 210096 江苏省南京市玄武区四牌楼2

(72)发明人 夏亦犁 王新 裴文江 
(74)专利代理机构 南京众联专利代理有限公司
32206
代理人 蒋昱
(51)Int.Cl.
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称基于回声状态网络分类的卷积神经网络算法(57)摘要本发明提供基于回声状态网络分类的卷积神经网络算法,主要包括:用ESN代替CNN模型中的全连接层,并推导出了新的残差迭代公式,在此基础上该模型继续沿用CNN的反向传播算法训练CNN的隐藏层参数,以及使用线性回归法则训练ESN的输出权重。

通过在MNIST手写数字识别数据集、Fashion MNIST物体识别数据集和ORL人脸识别数据集上的仿真实验证明了本发明的可行性,同时实验结果反映出该模型既保留了CNN多层次特征提取的能力,又通过引入ESN模块减少了算法的训练时间以及提升了其在小样本数据
集上的性能。

权利要求书3页 说明书6页 附图2页CN 110119805 A 2019.08.13
C N 110119805
A
1.基于回声状态网络分类的卷积神经网络算法,其特征在于:所述基于回声状态网络分类的卷积神经网络算法包含卷积层、池化层和ESN层三种结构,所述模型的前向传播算法和反向传播算法的给出如下;
E -CNN的前向传播算法:
E -CNN的前向传播算法按照该隐藏层的类型可分为以下三种情况:
(1)该隐藏层是卷积层的情况;
设第l层是卷积层,则l的取值范围是l=2,3,...,L -1,
其中第L层表示网络的输出层,表示第l层的第i个输入图片或特征图,共有I个图片或特征图,a j n ,l 表示第l层的第j个输出特征图,共有K个输出特征图;W ij 表示
向a j n ,l 映射的卷积矩阵,b j l 表示为该过程的
偏置,
则该卷积层的运算过程可表示为:其中,“*”表示第l层的卷积核与第l -1层各个输出特征图进行不补零卷积操作;σ(·)表示该隐藏层的激活函数;
(2)该隐藏层是池化层的情况:
设第l层是池化,该层池化矩阵的大小为k ×k;该层的一个输入及其对应输出分别表示为a n ,l -1、a n ,l ,
则池化操作的表达式如(2)所示;
其中,down(·)表示下采样函数;
(3)该隐藏层是ESN层的情况:
首先将ESN层可以转化为一个包含两个隐藏层的网络结构,其a n ,L -1(t+1)表示t+1时刻ESN的第n个输入;h n (t)表示与a n ,L -1(t)对应的储备池状态向量;a n ,L -1(t+1)与h n (t)分别经过W in 、W R 两个权重的处理输出为h n (t+1);h n (t+1)表示与aa n ,L -1(t+1)对应的储备池状态向量,设aa n ,L -1(t+1)=h n (t+1)=f(zz n ,L -1(t+1))为一个中间输出变量,t+1时刻第n个储备池
状态向量表示为:
其中,W in 、W R 分别表示储备池输入矩阵、储备池矩阵;f(·)表示储备池激活函数,这里取tanh,t+1时刻第L层第n个输出可表示为:aa n ,L -1(t+1)经输出权值W out 加权后,再经过一个激活函数σ(·)处理后的输出向量,即
权 利 要 求 书1/3页2CN 110119805 A。

相关文档
最新文档