基于神经网络的信息处理方法和设备的制作流程

合集下载

基于神经网络算法的智能设备故障诊断系统的设计

基于神经网络算法的智能设备故障诊断系统的设计

基于神经网络算法的智能设备故障诊断系统的设计随着智能设备的普及和广泛应用,智能设备故障诊断系统的需求也越来越重要。

传统的故障诊断方法,主要是基于人工经验和专业知识,但由于设备结构复杂,标准化程度低,人工诊断准确率低,效率低,成本高,无法满足快速、准确的故障诊断需求。

因此,基于神经网络算法的智能设备故障诊断系统应运而生。

一、神经网络算法介绍神经网络是一种结构类似人脑的算法,是一种模仿人类神经系统模式的算法。

它可以从数据中学习,并基于数据进行推理、决策。

对于智能设备故障诊断系统来说,神经网络算法可以通过对设备的信号和表现进行学习、分析、预测,并识别设备的故障类型。

二、神经网络的应用在实际应用中,神经网络算法可以应用于多个领域。

例如,在工业领域中,神经网络可以对设备故障进行智能诊断和预测。

在医学领域中,神经网络可以应用于医学图像识别和疾病预测。

在金融领域中,神经网络可以应用于风险评估和市场预测。

在物联网领域中,神经网络可以应用于智能交通、智能家居、智能制造等多个方面。

三、智能设备故障诊断系统的设计针对智能设备故障诊断系统的需求,该系统的设计流程如下:1. 数据采集:通过传感器或其他检测设备采集设备的状态数据,包括工作电压、工作温度、工作时间、运行频率等。

2. 数据预处理:将采集到的原始数据进行预处理、清洗、去噪、降维等操作,以提高数据的质量和减小数据集规模。

3. 特征提取:通过特征提取技术,从预处理的数据中提取出与故障相关的特征,例如时间序列分析、频域分析、小波分析等。

4. 模型建立和训练:利用神经网络算法,进行模型的建立和训练,并对模型进行优化,使得模型的泛化能力和预测准确率更高。

5. 故障诊断和预测:将实时采集到的状态数据输入已训练好的神经网络模型中,进行故障的诊断和预测,并输出故障种类、位置和程度等信息。

6. 诊断反馈和维护:将诊断结果反馈给操作员,并进行故障的修复和维护。

四、智能设备故障诊断系统的优点相比传统的故障诊断方法,基于神经网络算法的智能设备故障诊断系统有以下优点:1. 自适应性和灵活性较强:由于神经网络算法可以从数据中学习和推理,因此具有自适应性和灵活性,可以适应不同设备和环境的变化。

基于BP神经网络的设备预测维修(全文)

基于BP神经网络的设备预测维修(全文)
为了减少迭代次数,加快收敛,常采取学习率的自适应调整、增加权重动量项及初始权值与偏差值随机化的组合方法。如果将遗传算法与BP神经XX络结合起来,得到一种混合算法。此算法首先用遗传算法对神经XX络的参数进行优化,得到一个权值范围,再用BP算法在这个小空间范围内搜索出最优解。用遗传算法修正XX络参数,代替了直接用梯度法求XX络参数的方法,提高了算法的搜索效率。遗传算法不仅能对XX络参数进行优化,还能对XX络结构和XX络输出进行优化。
y=[y1,y2]T=[设备状态,维修类别]T
隐层结点数选择如下公式计算:
式中s为样本数,取s=60,i为输入层结点数,i=8,k为隐层结点数,由此式计算出的最小k=6。
三、实例分析
本例对某大型钢铁企业的直流电机工作状态进行计算分析,预测其工作状态并与专家分析、经济大修模型和模糊聚类法方法加以比较。选取60组样本,对样本数据进行预处理,用BP神经XX络算法在Mtlb中对XX络进行训练,得到权值及偏差值。图3是XX络计算的收敛曲线。
选择9组检验样本,从计算输出得到的设备工作状态可以看出,3种方法的决策与专家分析作比较,正确率分别为56%、90%和100%。由此可见,BP神经XX络方法是行之有效的。
此,一般的预测方法难以对混沌的动力学行为进行较好的描述。混沌系统的长期行为具有不可预测性,但对于短期行为,只要延迟时间充分大,就可以用设备运行状态的振动时间序列重构相空间,并通过对分形维数和李氏指数的研究,建立相空间的预测模式,从而对临修设备的维修时间进行预报。目前常用的预测模式有相空间线性模式、相空间非线性模式、李雅普诺夫指数模式和混沌神经XX络模式等。进一步的研究将混沌理论与神经XX络结合用于设备预测维修。
3、状态预测。设备工作状态与设备的振动、温度、服役期、维修次数等技术参数和工作环境有关。状态预测是根据设备的点检记录和状态监测,运用BP神经XX络方法预测设备未来工作状态,决定设备是否需要维修及进行怎样的维修?需要多少维修费用?

基于神经网络的信号处理技术研究与应用

基于神经网络的信号处理技术研究与应用

基于神经网络的信号处理技术研究与应用随着人工智能技术的不断发展,基于神经网络的信号处理技术也越来越受到关注和研究。

基于神经网络的信号处理技术可以有效地对信号进行分析、提取和处理,为多个领域的应用提供了更为精确和高效的数据支持。

神经网络是一种类似于人脑神经系统的计算模型,通过大量的实例训练可以提高其对数据的准确性和可信度。

在信号处理领域,基于神经网络的信号处理技术可以对信号进行多层次的特征提取和分类,具有对噪声和失真敏感度低、抗干扰能力强等优点。

一、基于神经网络的信号处理技术基于神经网络的信号处理技术主要包括以下几个方面:1.信号分析:在信号处理中,信号分析是非常重要的一个环节。

传统的信号分析方法通常是通过基础数学方法,如傅里叶变换等,对信号的频域、时域等特征进行描述和分析。

而基于神经网络的信号处理技术则可以通过特征提取和分类的方式,将信号分为不同的类别,并对信号进行更为细致和深入的分析。

2.信号提取:基于神经网络的信号处理技术可以通过卷积神经网络、循环神经网络等模型,对信号进行多层次的特征提取,提高信号的准确性和可靠性。

3.信号识别:在实际应用中,信号的识别是基于神经网络的信号处理技术的重要应用之一。

通过对信号进行特征提取和分类,可以实现对不同类型信号的自动识别和分类,如语音、图像、生物等信号。

4.信号复原:在实际应用中,信号复原是比较常见的需求。

基于神经网络的信号处理技术可以通过重建模型、补全缺失信息等方式,对信号进行重构和复原。

二、应用领域基于神经网络的信号处理技术可以广泛运用于多个领域,如:1.医疗行业:基于神经网络的信号处理技术可以应用于医疗诊断、疾病预测等方面。

例如,通过对脑电信号进行分析和识别,可以实现对癫痫发作的实时监测和预警。

2.通信行业:基于神经网络的信号处理技术可以应用于通信信号的自动检测和识别。

例如,可以通过对通信信号数据进行分析和学习,实现对不同类型信号的自动分类和识别。

基于神经网络的智能控制方法

基于神经网络的智能控制方法

基于神经网络的智能控制方法智能控制是近年来兴起的一种控制方法,它借助于神经网络的强大计算能力,能够对复杂的系统进行智能化的控制与决策。

本文将介绍基于神经网络的智能控制方法,并探讨其在实际应用中的潜力和优势。

一、神经网络简介神经网络是一种模拟人脑神经系统的计算模型,它由大量的神经元通过连接构成,能够对海量的信息进行高效的处理和学习。

神经网络具有自适应性、容错性和并行处理能力等特点,被广泛应用于图像识别、语音处理、自动驾驶等领域。

二、智能控制方法的基本原理基于神经网络的智能控制方法主要包括感知、决策和执行三个阶段。

感知阶段通过传感器采集系统的输入信号,并将其转化为神经网络可以处理的形式。

决策阶段利用训练好的神经网络对输入信号进行学习和判断,生成相应的控制策略。

执行阶段将控制策略转化为实际控制信号,通过执行器对系统进行控制。

三、基于神经网络的智能控制方法的优势1. 强大的学习能力:神经网络具有良好的自适应性和学习能力,能够通过大量的训练样本不断优化模型的参数,使之具备更好的控制性能。

2. 复杂系统的控制:神经网络可以对具有较高维度和非线性特性的复杂系统进行控制,能够应对更加复杂的实际场景和问题。

3. 实时性和适应性:神经网络能够在实时性要求较高的情况下对输入信号进行快速处理和决策,具备较强的适应性和反应能力。

4. 容错性和鲁棒性:神经网络在面对部分信息丢失或者噪声干扰时,仍能够保持较好的控制性能,具备较强的容错性和鲁棒性。

四、基于神经网络的智能控制方法的应用1. 智能交通系统:利用基于神经网络的智能控制方法,可以对交通流量进行实时监测和调度,达到优化交通流的效果,提高道路的通行能力和交通效率。

2. 工业自动化:神经网络可以应用于工业自动化领域中的生产线控制、设备故障预测等任务,提高生产效率和产品质量。

3. 智能机器人:通过神经网络实现智能机器人的导航、目标识别和路径规划等功能,使其具备更强的自主决策和执行能力。

深度学习技术原理及应用案例

深度学习技术原理及应用案例

深度学习技术原理及应用案例深度学习技术是人工智能领域的一个重要分支,其基于神经网络的理论和算法,可以模仿人脑的神经系统处理信息的能力,实现对大量数据的自动分类、识别、预测等任务。

本文将介绍深度学习技术的原理,并着重阐述其在图像识别、自然语言处理、游戏智能等方面的应用案例。

一、深度学习技术原理深度学习技术基于神经网络的思想,其核心是通过一系列的神经元模拟信息的传递和转化,进行数据的高效处理。

在神经网络中,输入数据被送入输入层,经过一系列的隐层,最终输出结果在输出层给出。

神经元在这个过程中扮演着重要的角色,其将输入数据通过激活函数转化为输出信号,输出信号又传递给下一层神经元进行处理。

深度学习技术的名称来源于神经网络中多层的隐层,这些隐层可以对输入数据进行多次的映射和转换,提高对数据的处理效率和准确性。

深度学习技术的训练也是基于神经网络的反向传播算法,该算法通过计算神经网络输出结果与实际结果之间的差异,并根据误差对神经元的权重进行调整,从而实现损失函数下降,模型的优化。

深度学习技术的训练需要大量的数据和计算资源,因此其较为依赖于高性能的计算设备和数据集资源。

二、深度学习技术在图像识别中的应用案例深度学习技术在图像识别领域有着广泛的应用,其中最具有代表性的案例是物体识别。

物体识别是指将图像中的物体进行分类和识别,例如将图片中的猫、狗、汽车等物体进行标识。

相对于传统的识别算法,深度学习技术在物体识别中具有更高的准确性和鲁棒性。

其中,卷积神经网络(CNN)是实现图像识别任务的最经典模型之一。

CNN通过多层卷积处理、池化操作和全连接层等进行图像特征的提取和分类。

通过卷积操作,CNN可以有效地捕捉图像中的局部特征。

同时,池化操作则可以对输入数据进行下采样,减小计算量同时提高模型的鲁棒性。

三、深度学习技术在自然语言处理中的应用案例深度学习技术在自然语言处理(NLP)领域的应用也逐渐成熟。

NLP是指对自然语言进行识别、理解、生成和应用的技术。

基于神经网络的机械设备故障诊断技术

基于神经网络的机械设备故障诊断技术

基于神经网络的机械设备故障诊断技术随着科技的不断进步和机械设备的广泛应用,机械设备故障诊断问题日益凸显。

传统的故障诊断方法需要大量的人工经验和实践经验,存在很大的局限性。

随着神经网络技术的逐渐发展和应用,它已成为机械设备故障诊断中的一种非常有效的方法。

本文将介绍基于神经网络的机械设备故障诊断技术,包括其原理、应用及未来发展趋势。

一、神经网络原理神经网络是一种模仿人类神经系统结构和功能的计算模型。

它利用多个类似于神经元的处理单元进行信息的处理和传递,从而实现某些复杂问题的解决。

神经网络的基本结构包括输入层、隐层和输出层。

每个层中包含多个神经元,它们之间通过连接权重进行信息传递。

神经网络的训练是指根据训练数据对网络的连接权重进行优化,提高网络的预测能力和精度。

常用的训练方法包括反向传播算法、遗传算法等。

二、神经网络在机械设备故障诊断中的应用神经网络在机械设备故障诊断中的应用主要分为两类:基于传感器数据的故障诊断和基于信号分析的故障诊断。

1.基于传感器数据的故障诊断通过监控机械设备的运行状态,采集各种传感器数据,然后把这些数据作为神经网络的输入,进行训练和预测。

在实际应用中,通常采用多个传感器联合监测,从而提高故障诊断的准确性和可靠性。

例如,王贺等人提出了一种基于神经网络的故障预测方法,通过采集风力涡轮发电机的温度、振动等数据,建立神经网络模型,最终成功预测了故障发生的时间和类型。

2.基于信号分析的故障诊断对于某些信号特征突出的机械设备,可以采用基于信号分析的故障诊断方法。

例如,对于机械设备的声音和振动信号,可以提取其频率谱、阶次谱等特征参数,然后训练神经网络模型,进行故障诊断和预测。

例如,陈礼等人提出了一种基于神经网络的轴承振动信号诊断方法,其原理是提取了轴承振动信号的频率谱和相关参数,建立神经网络模型,最终实现轴承故障的预测和诊断。

三、基于神经网络的机械设备故障诊断技术的未来发展趋势随着神经网络技术的不断进步和应用,基于神经网络的机械设备故障诊断将会得到广泛的应用和发展。

基于神经网络方法的三维力柔性触觉传感器阵列解耦研究

基于神经网络方法的三维力柔性触觉传感器阵列解耦研究

基于神经网络方法的三维力柔性触觉传感器阵列解耦研究一、本文概述随着机器人技术的快速发展,对于机器人感知环境、实现精准操作的需求日益增强。

触觉传感器作为机器人感知外部环境的重要手段,其性能的提升对于机器人的智能化、精细化操作具有关键性作用。

其中,三维力柔性触觉传感器阵列由于其能够同时感知法向和切向的力信息,且具有柔性、可穿戴等特点,在机器人触觉感知领域具有广泛的应用前景。

然而,三维力柔性触觉传感器阵列的输出信号通常存在耦合现象,即不同方向的力信息相互干扰,影响了传感器的测量精度和稳定性。

因此,如何有效地实现三维力柔性触觉传感器阵列的解耦,成为了当前研究的热点和难点问题。

本文旨在研究基于神经网络方法的三维力柔性触觉传感器阵列解耦技术。

对三维力柔性触觉传感器阵列的工作原理和信号特性进行深入分析,明确解耦的重要性和必要性。

然后,结合神经网络强大的非线性映射能力和自学习能力,构建适用于三维力柔性触觉传感器阵列解耦的神经网络模型。

通过对模型的训练和优化,实现对传感器输出信号的精确解耦,提高传感器的测量精度和稳定性。

通过实验验证神经网络解耦方法的有效性,为三维力柔性触觉传感器阵列的实际应用提供理论和技术支持。

本文的研究不仅有助于推动机器人触觉感知技术的发展,还为其他领域中的多维传感器解耦问题提供了新的解决方案。

通过深入研究基于神经网络方法的三维力柔性触觉传感器阵列解耦技术,有望为未来的机器人技术发展和智能化应用奠定坚实的基础。

二、三维力柔性触觉传感器阵列基本原理三维力柔性触觉传感器阵列是一种能够同时感知并测量施加在其表面上的三维力(即法向力和两个正交切向力)的先进设备。

其基本原理基于柔性材料(如硅橡胶、聚酰亚胺等)的力学性能和传感器的电阻、电容或压电等物理特性的变化。

在力学层面,当外力作用于传感器表面时,柔性材料会发生形变,这种形变可以通过弹性理论来描述。

弹性理论提供了传感器受力与形变之间的定量关系,是理解传感器工作原理的基础。

1_4295071_神经网络在智能信息处理中的应用

1_4295071_神经网络在智能信息处理中的应用

第一章概述神经网络与智能信息技术处理是当今领衔世界信息技术处理潮流的一门边缘学科。

世界主要信息技术大国诸如日.美.德等均不遗余力里在研究这门技术。

各国都想通过研究和在这方面的研究的突破在21世纪的信息王国占领一席之地。

神经网络是一类新的计算模型,它是模仿人脑神经网络的结构和某些工作机制而建立的一种计算模型。

这种计算模型的特点是,利用大量的简单计算单元(即神经元)连成网络,来实现大规模并行计算。

神经网络的工作机理是通过学习,改变神经元之间的连接强度。

常用的神经计算模型有多层感知机、反传网络、自适应映射网络等。

最流行的神经网络学习算法是BP算法(Back-propagation algorithm)。

自1986年美国科学家莫克兰迪发表了"Parallel Distributed Processing"论著后,从事人工智能、计算机科学、信息科学的许多科学家对人工神经网络掀起了新的研究热潮。

1.1神经网络产生的背景人工神经网络(Artificial Neural Networks)理论是在怎样的科学背景下产生的呢?要回答这个问题,首先要明确什么是“智能”和“智能理论”?虽然到目前为止对“智能”还没有一个统一、确切的定义,但简单说来,智能是指人们认识客观事物并运用知识解决实际问题的能力。

它表现为运用知识认识新情况、解决新问题、学习新方法、预见新趋势、创造新思维的能力。

智能的高低反映在对客观事物认识的深刻、正确、全面的程度以及运用知识解决实际问题的速度和质量上。

有了对什么是“智能”的解释,就不难推而得知什么是“智能理论”。

简言之,“智能理论”包括两个基本问题:探索人类智能的奥秘(研究人类的认识过程)和运用—从硬件结构上模拟人脑的构成;功能主义——撇开人脑的具体结构,仅从输出输入关系上构造出与人脑功能相一致的人工智能系统。

功能主义成了传统人工智能理论的研究基础人工手段模仿人类的智能行为。

在对后一问题的研究上又有两种主导思想:结构主义—。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

本公开涉及计算机数据处理领域。

本公开的实施例公开了基于神经网络的信息处理方法和装置、电子设备和计算机可读介质。

该基于神经网络的信息处理方法包括:获取输入信息;基于输入信息,采用元神经网络预测参数存储器中的各参数的概率分布,其中,参数存储器是预先基于主神经网络的全连接层构建的;基于参数存储器中的各参数的概率分布,确定主神经网络的全连接层关于输入信息的参数组合模式;基于全连接层关于输入信息的参数组合模式,更新主神经网络的全连接层,并基于更新全连接层之后的主神经网络对输入信息进行处理,得到所与输入信息对应的输出信息。

该方法实现了基于输入信息的主神经网络的参数的自动动态调整。

权利要求书1.一种基于神经网络的信息处理方法,包括:获取输入信息;基于所述输入信息,采用元神经网络预测参数存储器中的各参数的概率分布,其中,所述参数存储器是预先基于主神经网络的全连接层构建的;基于所述参数存储器中的各参数的概率分布,确定所述主神经网络的全连接层关于所述输入信息的参数组合模式;基于所述全连接层关于所述输入信息的参数组合模式,更新所述主神经网络的全连接层,并基于更新全连接层之后的主神经网络对所述输入信息进行处理,得到所与所述输入信息对应的输出信息。

2.根据权利要求1所述的方法,其中,所述方法还包括:利用主神经网络的特征提取层对所述输入信息进行特征提取,得到所述输入信息的抽象表示;以及所述基于所述输入信息,采用元神经网络预测参数存储器中的各参数的概率分布,包括:基于所述输入信息的抽象表示,采用元神经网络预测参数存储器中的各参数的概率分布;所述基于更新全连接层之后的主神经网络对所述输入信息进行处理,包括:基于更新后的全连接层对所述输入信息的抽象表示进行处理。

3.根据权利要求2所述的方法,其中,所述基于所述输入信息的抽象表示,采用元神经网络预测参数存储器中的各参数的概率分布,包括:将所述输入信息的抽象表示作为所述元神经网络的动态参数,利用包含所述动态参数的元神经网络预测参数存储器中的各参数的概率分布。

4.根据权利要求1所述的方法,其中,所述基于所述参数存储器中的各参数的概率分布,确定所述主神经网络的全连接层关于所述输入信息的参数组合模式,包括:将所述概率分布中的概率值作为所述全连接层中的对应参数所表征的权重系数,基于所述权重系数对所述主神经网络的全连接层的上一层的各节点进行加权求和之后做非线性变换,得到所述主神经网络的全连接层关于所述输入信息的参数组合模式。

5.根据权利要求1-4任一项所述的方法,其中,所述主神经网络是基于与所述输入信息同类型的样本信息预先训练得到的。

6.一种基于神经网络的信息处理装置,包括:获取单元,被配置为获取输入信息;预测单元,被配置为基于所述输入信息,采用元神经网络预测参数存储器中的各参数的概率分布,其中,所述参数存储器是预先基于主神经网络的全连接层构建的;确定单元,被配置为基于所述参数存储器中的各参数的概率分布,确定所述主神经网络的全连接层关于所述输入信息的参数组合模式;处理单元,被配置为基于所述全连接层关于所述输入信息的参数组合模式,更新所述主神经网络的全连接层,并基于更新全连接层之后的主神经网络对所述输入信息进行处理,得到所与所述输入信息对应的输出信息。

7.根据权利要求6所述的装置,其中,所述装置还包括:提取单元,被配置为利用主神经网络的特征提取层对所述输入信息进行特征提取,得到所述输入信息的抽象表示;以及所述预测单元进一步被配置为:基于所述输入信息的抽象表示,采用元神经网络预测参数存储器中的各参数的概率分布;所述处理单元进一步被配置为:基于更新后的全连接层对所述输入信息的抽象表示进行处理。

8.根据权利要求7所述的装置,其中,所述预测单元进一步被配置为:将所述输入信息的抽象表示作为所述元神经网络的动态参数,利用包含所述动态参数的元神经网络预测参数存储器中的各参数的概率分布。

9.根据权利要求6所述的装置,其中,所述确定单元进一步被配置为按照如下方式确定所述主神经网络的全连接层关于所述输入信息的参数组合模式:将所述概率分布中的概率值作为所述全连接层中的对应参数所表征的权重系数,基于所述权重系数对所述主神经网络的全连接层的上一层的各节点进行加权求和之后做非线性变换,得到所述主神经网络的全连接层关于所述输入信息的参数组合模式。

10.根据权利要求6-9任一项所述的装置,其中,所述主神经网络是基于与所述输入信息同类型的样本信息预先训练得到的。

11.一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。

12.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。

技术说明书基于神经网络的信息处理方法和装置技术领域本公开的实施例涉及计算机技术领域,具体涉及计算机数据处理技术领域,尤其涉及基于神经网络的信息处理方法和装置。

背景技术复杂决策系统的目标通常需要由多个策略来完成。

神经网络可以用于对复杂决策系统建模来表达其中各子系统之间的非线性关系。

但是,复杂决策系统通常包含多种不同的策略,如果只使用一个具有固定参数的神经网络建模,无法在同一个网络中学习得到多种不同的参数组合方式。

也即,复杂决策系统的输入通常是变化的,使用同一个神经网络无法实现不同输入的情况下的策略调整。

目前的方案是使用混合专家网络(Mixture of Expert,MOE),设置不同的专家网络对不同的策略建模,然后使用同一个门控矩阵从不同的专家网络中进行选择。

技术内容本公开的实施例提出了基于神经网络的信息处理方法和装置、电子设备和计算机可读介质。

第一方面,本公开的实施例提供了一种基于神经网络的信息处理方法,包括:获取输入信息;基于输入信息,采用元神经网络预测参数存储器中的各参数的概率分布,其中,参数存储器是预先基于主神经网络的全连接层构建的;基于参数存储器中的各参数的概率分布,确定主神经网络的全连接层关于输入信息的参数组合模式;基于全连接层关于输入信息的参数组合模式,更新主神经网络的全连接层,并基于更新全连接层之后的主神经网络对输入信息进行处理,得到所与输入信息对应的输出信息。

在一些实施例中,上述方法还包括:利用主神经网络的特征提取层对输入信息进行特征提取,得到输入信息的抽象表示;以及上述基于输入信息,采用元神经网络预测参数存储器中的各参数的概率分布,包括:基于输入信息的抽象表示,采用元神经网络预测参数存储器中的各参数的概率分布;上述基于更新全连接层之后的主神经网络对输入信息进行处理,包括:基于更新后的全连接层对输入信息的抽象表示进行处理。

在一些实施例中,上述基于输入信息的抽象表示,采用元神经网络预测参数存储器中的各参数的概率分布,包括:将输入信息的抽象表示作为元神经网络的动态参数,利用包含动态参数的元神经网络预测参数存储器中的各参数的概率分布。

在一些实施例中,上述基于参数存储器中的各参数的概率分布,确定主神经网络的全连接层关于输入信息的参数组合模式,包括:将概率分布中的概率值作为全连接层中的对应参数所表征的权重系数,基于权重系数对主神经网络的全连接层的上一层的各节点进行加权求和之后做非线性变换,得到主神经网络的全连接层关于输入信息的参数组合模式。

在一些实施例中,上述主神经网络是基于与输入信息同类型的样本信息预先训练得到的。

第二方面,本公开的实施例提供了一种基于神经网络的信息处理装置,包括:获取单元,被配置为获取输入信息;预测单元,被配置为基于输入信息,采用元神经网络预测参数存储器中的各参数的概率分布,其中,参数存储器是预先基于主神经网络的全连接层构建的;确定单元,被配置为基于参数存储器中的各参数的概率分布,确定主神经网络的全连接层关于输入信息的参数组合模式;处理单元,被配置为基于全连接层关于输入信息的参数组合模式,更新主神经网络的全连接层,并基于更新全连接层之后的主神经网络对输入信息进行处理,得到所与输入信息对应的输出信息。

在一些实施例中,上述装置还包括:提取单元,被配置为利用主神经网络的特征提取层对输入信息进行特征提取,得到输入信息的抽象表示;以及上述预测单元进一步被配置为:基于输入信息的抽象表示,采用元神经网络预测参数存储器中的各参数的概率分布;上述处理单元进一步被配置为:基于更新后的全连接层对输入信息的抽象表示进行处理。

在一些实施例中,上述预测单元进一步被配置为:将输入信息的抽象表示作为元神经网络的动态参数,利用包含动态参数的元神经网络预测参数存储器中的各参数的概率分布。

在一些实施例中,上述确定单元进一步被配置为按照如下方式确定主神经网络的全连接层关于输入信息的参数组合模式:将概率分布中的概率值作为全连接层中的对应参数所表征的权重系数,基于权重系数对主神经网络的全连接层的上一层的各节点进行加权求和之后做非线性变换,得到主神经网络的全连接层关于输入信息的参数组合模式。

在一些实施例中,上述主神经网络是基于与输入信息同类型的样本信息预先训练得到的。

第三方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面提供的基于神经网络的信息处理方法。

第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现第一方面提供的基于神经网络的信息处理方法。

本公开的上述实施例的基于神经网络的信息处理方法和装置、电子设备及计算机可读介质,通过获取输入信息,随后基于输入信息,采用元神经网络预测参数存储器中的各参数的概率分布,其中,参数存储器是预先基于主神经网络的全连接层构建的,然后基于参数存储器中的各参数的概率分布,确定主神经网络的全连接层关于输入信息的参数组合模式,根据参数组合模式调整主神经网络的全连接层的参数,之后基于调整全连接层的参数之后的主神经网络对输入信息进行处理,得到所与输入信息对应的输出信息,实现了基于输入信息的主神经网络的参数的自动动态调整,可以针对不同的输入使用不同的参数组合模式来执行神经网络的信息处理任务,解决了单一策略的模型表达能力差的问题,针对复杂任务可以达到良好的处理效果。

附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:图1是本公开的实施例可以应用于其中的示例性系统架构图;图2是根据本公开的基于神经网络的信息处理方法的一个实施例的流程图;图3是根据本公开的基于神经网络的信息处理方法的另一个实施例的流程图;图4是根据本公开的基于神经网络的信息处理方法所使用的算法原理示意图;图5是本公开的基于神经网络的信息处理装置的一个实施例的结构示意图;图6是适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。

相关文档
最新文档