深度学习研究概述_刘钰鹏

合集下载

基于深度学习的开放领域对话系统研究综述

基于深度学习的开放领域对话系统研究综述

研究成果不断出现,已有的综述都未能全面而深入
1 引 言
进行总结.Chen等人[3]针对所有对话系统进行综
述,但是基于深度学习的开放领域对话系统仅为其
让机器具备与人交流的能力是人工智能领域的 中的一部分,无论是模型还是关键问题都未能进行
一项重要工作,同时也是一项极具挑战的任务.1951 深入描述和分析.张伟男等人[13]仅对对话系统的评
的进展,但受手工设定规则等方面的影响,其稳健 性、可扩展性和领域适应性都有缺陷,也不适用于开 放领域.近年来,随着互联网上社交数据的快速增 长,数据驱动的开放领域对话系统逐渐成为了学术 界关注的热点,人机对话系统也由服务的角色逐步
表1我错很啊好..你呢? 那太好了.
1)(犛犮犺狅狅犾狅犳犛狅犳狋狑犪狉犲犪狀犱犕犻犮狉狅犲犾犲犮狋狉狅狀犻犮狊,犘犲犽犻狀犵犝狀犻狏犲狉狊犻狋狔,犅犲犻犼犻狀犵 100871) 2)(犐狀狊狋犻狋狌狋犲狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲犪狀犱犜犲犮犺狀狅犾狅犵狔,犘犲犽犻狀犵犝狀犻狏犲狉狊犻狋狔,犅犲犻犼犻狀犵 100871) 3)(犖犪狋犻狅狀犪犾犈狀犵犻狀犲犲狉犻狀犵犚犲狊犲犪狉犮犺犆犲狀狋犲狉犳狅狉犛狅犳狋狑犪狉犲犈狀犵犻狀犲犲狉犻狀犵(犘犲犽犻狀犵犝狀犻狏犲狉狊犻狋狔),犅犲犻犼犻狀犵 100871) 4)(犗犳犳犻犮犲狅犳狋犺犲犆狔犫犲狉狊狆犪犮犲犃犳犳犪犻狉狊犆狅犿犿犻狊狊犻狅狀狅犳犘犲犽犻狀犵犝狀犻狏犲狉狊犻狋狔,犅犲犻犼犻狀犵 100871)
智能音箱也已走进千家万户.在开放领域对话系统 息和查询),建立对话的长期依赖关系,给出更加符
方面,微软针对不用语种开发了聊天机器人xiaoice、 合对话逻辑的回复.
rinna、Zo、Ruuh等,使用用户达到数千万.
假设狇表示作为查询的话语,狉表示回复话语,

深度学习基础教程

深度学习基础教程

深度学习基础教程标题:深度学习基础教程导语:深度学习是一种机器学习的分支,它模拟人脑神经网络的工作原理,通过多层次的神经元来处理和分析大量的数据。

本篇文章将详细介绍深度学习的基础知识和步骤,帮助初学者快速入门。

正文:一、深度学习的基本概念和原理1. 了解深度学习的定义和作用2. 了解神经网络和深度学习的关系3. 了解前馈神经网络的结构和工作原理4. 了解反向传播算法及其在深度学习中的应用二、深度学习的主要应用领域1. 计算机视觉:图像分类、目标检测和图像生成2. 自然语言处理:文本分类、语义理解和机器翻译3. 语音识别:语音转文字和语音合成4. 强化学习:智能游戏和机器人控制三、深度学习的步骤和流程1. 数据预处理a) 收集和清洗数据b) 数据标准化和归一化c) 数据划分为训练集、验证集和测试集2. 模型构建a) 选择适合任务的神经网络结构b) 设计网络的层数和每层的神经元数目c) 定义激活函数和损失函数3. 模型训练a) 初始化模型参数b) 使用训练数据进行前向传播和反向传播c) 更新参数以最小化损失函数d) 重复以上步骤直到收敛4. 模型评估a) 使用验证集评估模型性能b) 根据评估结果调整模型参数c) 重复以上步骤直到满足预期性能指标5. 模型应用a) 使用测试集评估模型泛化能力b) 部署模型到实际应用中c) 监控和调整模型性能四、深度学习实践和学习资源推荐1. 深度学习框架和工具介绍a) TensorFlowb) PyTorchc) Keras2. 学习资源推荐a) 推荐书籍:《深度学习》、《神经网络与深度学习》等b) 在线教程和课程:Coursera、Udemy、机器之心等网站c) 论坛和社区:Stack Overflow、GitHub等结语:深度学习作为一种强大的机器学习方法,已经在各个领域展现出许多成功的应用。

通过本篇文章的学习,读者可以了解深度学习的基本概念、原理和应用步骤,并掌握深度学习的核心算法和工具。

深度学习研究进展

深度学习研究进展

深度学习研究进展
刘建伟;刘媛;罗雄麟
【期刊名称】《计算机应用研究》
【年(卷),期】2014(031)007
【摘要】鉴于深度学习的重要性,综述了深度学习的研究进展.首先概述了深度学习具有的优点,由此说明了引入深度学习的必要性;然后描述了三种典型的深度学习模型,包括卷积神经网络模型、深度信任网络模型和堆栈自编码网络模型,并对近几年深度学习在初始化方法、网络层数和激活函数的选择、模型结构、学习算法和实际应用这四个方面的研究新进展进行了综述;最后探讨了深度学习在理论分析、数据表示与模型、特征提取、训练与优化求解和研究拓展这五个方面中有待进一步研究解决的问题.
【总页数】11页(P1921-1930,1942)
【作者】刘建伟;刘媛;罗雄麟
【作者单位】中国石油大学自动化研究所,北京102249;中国石油大学自动化研究所,北京102249;中国石油大学自动化研究所,北京102249
【正文语种】中文
【中图分类】TP181
【相关文献】
1.深度学习用于无人机影像树种识别研究进展 [J], 罗仙仙;许松芽;严洪;肖美龙;陈正超
2.深度学习驱动的水下图像预处理研究进展综述 [J], 彭小红;梁子祥;张军;陈荣发
3.分布式深度学习隐私与安全攻击研究进展与挑战 [J], 周纯毅;陈大卫;王尚;付安民;高艳松
4.基于深度学习的进出口水产品品种鉴别技术研究进展 [J], 刘晓静;原志伟;张维刚
5.遮挡人脸表情识别深度学习方法研究进展 [J], 南亚会;华庆一
因版权原因,仅展示原文概要,查看原文内容请购买。

基于改进深度学习算法的船舶柴油机故障诊断技术

基于改进深度学习算法的船舶柴油机故障诊断技术

Vol. 43, No. 4Apr., 2021第43卷第4期2021年4月舰船科学技术SHIP SCIENCE AND TECHNOLOGY基于改进深度学习算法的船舶柴油机故障诊断技术黄金娥,刘鹏鹏(海军研究院,北京100161)摘 要:随着数据挖掘技术的发展,深度置信网络(DBN )这类深度学习算法被越来越多运用到工程领域。

在故障诊断领域,结合DBN 强大的自适应特征提取和非线性映射能力,可以摆脱以往对专家经验的依赖。

基于此,本文为有效地监测柴油机气缸运行状态,提出一种基于改进深度学习算法的船舶柴油机故障诊断技术。

先将原始信号的频域形式输入DBN 当中,采用蚱猛优化算法(GOA)搜索DBN 的最优参数组合,并建立起最佳的柴油机气缸故障诊断模型。

经测试验证,本文提出的诊断模型能够准确识别柴油机气缸运行状态并进行故障诊断,诊断率可以达到99.5%以上,具有较好的工程实用价值。

关键词:柴油机气缸;蚱猛优化算法;深度置信网络;数据挖掘中图分类号:TH113.1 文献标识码:A文章编号:1672 - 7649(2021)04 - 0131 - 04 doi : 10.3404/j.issn.l672 - 7649.2021.04.026Fault diagnosis technology of marine diesel engine based on improved deep learning algorithmHUANG Jin-e, LIU Peng-peng(Naval Research Institute, Beijing 100161, China)Abstract: With the development of data mining technology, deep learning algorithms such as deep belief network(DBN) are widely used in engineering. In the field of fault diagnosis, the dependence on expert experience could be avoid ­able with the strong adaptive feature extraction and nonlinear mapping ability of DBN. Based on this, in order to find out theabnormal operation of diesel engine cylinder efficiently and timely as well as diagnose its fault accurately, a marine dieselengine fault diagnosis technology based on improved deep learning algorithm is proposed in this paper: Inputting the origin ­al signal in frequency domain into DBN, searching the optimal parameter combination of DBN through Grasshopper optim ­ization algorithm (GOA), and establishing the optimal cylinder fault diagnosis model of diesel engine. The test results indic ­ate that the diagnosis model is able to identify the running state of diesel engine cylinder accxirately, and is able to carry out fault diagnosis with the diagnosis rate up to more than 99.5%, which proves to be of good engineering practical value.Key words : diesel engine cylinder ; grasshopper optimization algorithm ; deep belief n etwork ; data mining0引言随着现代舰船及其武器装备性能的提升,对船用柴油机运行要求也越来越高。

基于深度学习的航空雷达目标检测与跟踪系统

基于深度学习的航空雷达目标检测与跟踪系统

基于深度学习的航空雷达目标检测与跟踪系统Introduction航空雷达目标检测与跟踪系统在航空交通管制、军事侦察、气象研究以及无人机导航等领域具有重要的应用价值。

随着深度学习技术的发展,基于深度学习的目标检测与跟踪方法成为了当前研究的热点。

本文将介绍一个基于深度学习的航空雷达目标检测与跟踪系统,并讨论其在航空领域中的潜在应用。

目标检测与跟踪方法深度学习的快速发展为目标检测与跟踪提供了先进的方法。

在航空雷达目标检测与跟踪系统中,常用的方法包括基于卷积神经网络(CNN)的目标检测与跟踪方法以及基于循环神经网络(RNN)的目标跟踪方法。

基于CNN的目标检测与跟踪方法通过对雷达图像进行特征提取和目标识别来实现目标检测和跟踪。

首先,利用卷积层和池化层对雷达图像进行特征提取,将其转化为一系列的特征图。

接着,通过全连接层和Softmax回归对特征图进行分类,以判断是否存在目标。

最后,使用非极大值抑制(NMS)算法对检测到的目标进行过滤和去重。

这样就可以实现目标检测。

而目标跟踪则可以通过将连续帧之间的特征进行匹配和对齐来实现。

与此同时,基于RNN的目标跟踪方法能够利用时间序列上的信息来提高目标跟踪的准确性。

这种方法通常将雷达序列数据输入到循环神经网络中,利用RNN的记忆机制对目标进行跟踪。

通过对雷达生成的序列数据建模和学习,系统能够有效地跟踪目标的位置和运动轨迹。

系统性能评估与应用展望航空雷达目标检测与跟踪系统的性能评估是验证系统效果的关键环节。

主要评估指标包括目标检测准确率、目标跟踪精度、系统响应速度等。

为了提高系统性能,可以采用数据增强、网络结构优化和多模态融合等方法。

基于深度学习的航空雷达目标检测与跟踪系统有广泛的应用前景。

首先,对于航空交通管制来说,可以利用该系统来实现对飞机、无人机等空中目标的实时监测与追踪,提高航班安全性。

其次,该系统在军事侦察方面的应用也有很大潜力,可用于目标识别、情报收集等任务。

深度学习驱动的水下图像处理研究进展

深度学习驱动的水下图像处理研究进展

深度学习驱动的水下图像处理研究进展目录一、内容概括 (2)二、水下图像处理的重要性与挑战 (3)三、深度学习在水下图像处理中的应用 (4)3.1 深度学习算法概述 (5)3.2 水下图像增强技术 (6)3.3 水下图像目标识别与检测 (8)四、深度学习驱动的水下图像处理研究进展 (9)4.1 研究现状与发展趋势 (11)4.2 关键技术突破与进展 (12)4.3 应用领域拓展与案例分析 (14)五、深度学习算法在水下图像处理中的性能评估与优化策略 (15)5.1 性能评估指标与方法 (17)5.2 优化策略与技术手段 (18)5.3 实际应用中的性能表现分析 (19)六、水下图像处理技术面临的挑战与未来展望 (21)6.1 当前面临的主要挑战与问题 (22)6.2 未来发展趋势与前沿技术预测 (23)6.3 技术创新与应用拓展的思考与建议 (25)七、结论与展望总结全文,再次强调研究的重要性和价值,明确未来的研究方向和目标26一、内容概括本篇论文综述了深度学习在水下图像处理领域的最新研究进展,重点探讨了深度学习算法在水下图像增强、目标检测与识别、图像分割及深度估计等方面的应用。

随着人工智能技术的不断发展,水下机器人和无人潜水器等智能设备的应用日益广泛,对水下图像处理技术的要求也不断提高。

传统的图像处理方法在复杂多变的水下环境中往往表现不佳,而基于深度学习的端到端学习方法能够自动提取特征并学习到复杂的映射关系,因此在近年来得到了广泛的关注和研究。

本论文详细介绍了深度学习模型(如卷积神经网络、循环神经网络、生成对抗网络等)在水下图像处理中的应用,并对其优缺点进行了分析。

论文还讨论了水下图像处理中面临的挑战,如光照变化、水下噪声、成像设备特性等因素对图像质量的影响。

针对这些问题,研究者们提出了一系列新的方法和技巧,如基于深度学习的图像预处理与后处理技术、多模态数据融合策略、迁移学习等,以提高水下图像的质量和处理性能。

深度强化学习在语音识别中的应用研究

深度强化学习在语音识别中的应用研究

深度强化学习在语音识别中的应用研究随着人工智能技术的不断发展,深度强化学习作为其重要分支之一,受到了越来越多的关注。

在语音识别领域,深度强化学习的应用已经展现出了其巨大的潜力和优越的性能。

本文将从深度强化学习的基本原理、语音识别的特点以及深度强化学习在语音识别中的应用等方面进行论述。

一、深度强化学习的基本原理深度强化学习是一种在智能体与环境之间进行交互的机器学习方法。

其基本思想是通过强化学习算法,在智能体与环境之间的互动中,不断地优化动作策略,从而获得最大的奖励。

具体而言,智能体在环境中执行某些动作,环境会根据这些动作返回奖励或惩罚,智能体根据奖励或惩罚进行调整,从而逐步改善策略,使得智能体获取到最大的奖励。

深度强化学习中最常用的方法是深度神经网络和Q-learning算法。

深度神经网络是一种能够处理大规模复杂数据的神经网络,其层次结构和参数优化算法使其非常适合处理语音、图像和自然语言等复杂数据。

Q-learning算法则是一种强化学习中的基本算法之一,其核心思想是通过不断地拟合动作价值函数,从而获得最优的动作策略。

深度强化学习通过将深度神经网络与Q-learning算法结合起来,实现了对复杂环境的高效学习和精准预测。

二、语音识别的特点语音识别是自然语言处理领域的重要分支之一,其主要是通过将音频信号转换成文本,从而实现对语言的理解和处理。

语音识别的特点在于信号稀疏性、语音多样性以及噪声复杂性。

首先,由于语音信号的稀疏性,其信息密度比其他信号要低得多。

这就意味着在进行语音信号的处理时,需要考虑到信号的稀疏性,采取合适的算法和模型进行处理。

其次,语音信号的多样性也给语音识别带来了许多挑战。

语音信号的多样性表现在说话者的不同、口音的不同、语速的不同等各个方面。

因此,在处理语音信号时需要使用多个模型或者多个特征描述,以适应不同的语音特征。

最后,噪声复杂性也是影响语音识别的关键因素之一。

语音信号在实际采集和传输的过程中,会受到各种各样的干扰和噪声,这些因素都会影响语音信号的质量和准确性。

《深度学习PPT》第3章 人工神经网络与深度学习

《深度学习PPT》第3章 人工神经网络与深度学习

数据输出
外部环境
数据输入
执行
深度学习(端到端网络,一组 函数集)
知识库
学习
深度学习的基本模型
在深度学习的过程中,外部环境以某种形式提供信息(数据)来源,学习将外部 信息(数据)加工为知识,并放入知识库;知识库中存放指导执行部分动作的一 般原则,要兼顾表达能力强,易于推理、易于完善及扩展知识表示等要求;执行 环节利用知识库中的知识完成某种任务,并把完成任务过程中所获得的一些信息 反馈给学习环节,指导进一步学习。
(2)人工神经元模型 人工神经元是对生物神经元结构和功能的模拟,一般是一个多输入单输出的非线 性器件 其功能是: 对每个输入信号进行处理以确定其强度(加权); 确定所有输入信号的组合效果(求和); 确定其输出(激活特性)。
3 of 57
3.1 探秘大脑的工作原理
第3章 人工神经网络与深度学习
3.1.1 人类活动抽象与深度学习模型
24 of 57
高级大数据人才培养系列丛书
第3章 人工神经网络与深度学习
3.1 探秘大脑的工作原理 3.2 人脑神经元模型 3.3 M-P模型 3.4 人脑神经网络的互连结构 3.5 人工神经网络的学习 3.6 人工神经网络的特点 3.7 神经网络基本概念与功能 3.8 深度学习其它网络结构 习题
6 of 57
3.1 探秘大脑的工作原理
(5)深度学习算法 数据输 出
外部环 境
第3章 人工神经网络与深度学习
数据输入
执行
深度学习(端到端网络,一组函数集)
知识库
学习
深度学 习
深度学习的基本模型
人的活动过程伴随信息传递、知识处理和智能的形成过程,其信息 传输模型如图所示
7 of 57
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习的经典算法
深度学习是机器学习的一个分支,也有监督学习与无监 督学习之分。例如,卷积神经网络(CNNs),多层感知机 等属于监督学习;深度置信网络(DBNs)、自动编码器、 系数编码等属于无监督学习。本文分别以卷积神经网络和深 度置信网络为例进行介绍。 2.1 卷积神经网络(CNNs) Hubel 和 Wiesel 在研究猫脑皮层时,发现了一种可以有 效降低反馈神经网络的复杂性的独特神经网络结构。受此启 发,Fikushima、LeCun 等学者提出卷积神经网络,并将其成 功运用。而今,卷积神经网络已经发展成为一种具有高准确 率的图像识别方法。 卷积神经网络是一种包含卷积层和次抽样层两种特殊
[1]
词,预测对应于该单词的目标单词,效果明显优于 RNNenc 模型。 近一段时间,深度学习被图形领域的学者所关注。Bu 等 人 [4] 也 将 深 度 学 习 引 入 3D 模 型 中。 他 们 通 过 对 Google 3D Warehouse 的分析,选择基于特征的描述符。首先,他 们使用尺度不变的热核描述符和平均测地线距离提取 3D 模 型的低层描述符,然后生成中层描述符 LGA-BoF(the local geodesic-aware bag-of-features),最后构建深度置信网络, 并将中层描述符作为输入进行学习。Qin 等人 [5] 首次将深度 学习引入 3D 模型的检索中,他们选择基于视图的 3D 描述符 即 LFD,从 10 个光域对模型进行拍照,每个光域获取 20 个 角度的模型图像信息,然后从这些图像中提取泽尼克矩描述 符作为深层神经网络的输入进行学习,学习后的分类效果比 较理想。
参考文献
[1]SMOLENSKY P. Information Processing in Dynamical Systems : Foundations of Harmony Theory[A]//Rumelhart D E,McClelland J L.Parallel Distributed Processing[M]. Cambridge MA: MIT Press,1986:194-281. [2]Hinton G E, Salakhutdinov R R. Reducing the D i me nsi onal it y of D a ta Wit h N e ur a l N e t w or ks[ J] . Science,2006(5786):504-507. [3]D Bahdanau,K Cho,Y Bengio.Neural Machine Translation by Jointly Learning to Align and Translate[M].Los Alamos:Eprint Arxiv,2014. [4]Shuhui Bu, PengchengHan, ZhenbaoLiu , JunweiHan , HongweiLin.Local Deep Feature Learning Framework for 3D Shape[J].Computers&Graphics,2015:117-129. [5]Fei-wei QIN, Lu-ye LI, Shu-ming GAO, Xiaol i n g YA N G , X i a n g C H E N . A D e e p L e a r n i n g A p p r o a c h to the Classification of 3D CAD Models[J].Comput & Electron,2014:91-106.
1 深度学习的简介
深度学习的“深度”是相对于传统的分类、回归等“浅 层学习”方法而言的。浅层学习方法会出现因样本和计算单 元有限而对复杂函数的表示能力产生限制的缺陷,致使这些 浅层方法针对复杂分类问题的泛化能力受到一定制约。而深 度学习的实质在于通过海量数据和构建多隐层的人工神经网 络,经过训练对原始信号进行逐层特征变换,将样本在空间 的特征表示映射到新的特征空间,无监督地学习,得到层次 化的特征表示。 深度学习的层次结构一般由输入层、隐层、输出层组成。 其中,相邻层的节点之间有连接,同一层节点之间无连接。 这种分层训练的模式就是模拟人类大脑对外部输入的声音、 图像、文本等数据进行从低维到高维的特征提取,从而解释 外部数据的过程。而深度学习正是因为其具有多层非线性映 射的深层结构,才可以完成复杂函数的函数逼近。
结构层的非完全连接的神经网络结构。卷积层由多个用于抽 取表征的特征平面构成,每个特征平面由许多神经元构成。 卷积神经网络是一个多层的神经网络,每层由多个二维平面 组成,而每个平面上分布着多个独立神经元,上一层中的局 部单元输出量作为下一层邻近单元的输入。输入图像通过可 训练的滤波器加偏置量进行卷积,卷积后在卷积层产生多个 映射平面。次抽样层的特征映射平面需要将卷积层输出的映 射平面中的每组像素通过求和、加权、偏置等操作,再经过 sigmoid 函数的处理得到。之后,次抽样层输出的映射平面 经过滤波处理后得到新的卷基层,并将其进行与次抽样层相 同的处理得到下一层。最终,这些像素值被光栅化,并连接 成一个向量输入到传统的神经网络,得到输出。一般情况下, 都是先进行表征提取,将每个神经元的输入与前一层的局部 感受野相连,通过一系列操作获取表征。一旦该局部表征被 提取,它与其他表征间的位置关系便被确定下来。特征提取 后一般进行特征映射操作。网络的每个计算层由多个特征映 射组成,每个特征映射单元为一个平面,平面上所有神经元 的权值相等。特征映射结构采用严格递增函数 sigmoid 函数 作为卷积网络的激活函数。它能较好地平衡线性和非线性之 间的行为,使得特征映射具有位移不变性。 此外,由于相同映射面上的神经元共享权值,因而减少 了网络自由参数的个数,降低了网络参数选择的复杂度。构 建过程中,卷积神经网络每一个特征提取层后都会跟随一个 次抽样层。这种特有的两次特征提取结构、局部感受野、权 值共享以及时间或空间亚采样等几种结构思想结合起来,获 得了某种程度的位移、尺度、形变不变性。 2.2 深度置信网络(DBN) 深度置信网络是由多个受限玻尔兹曼机(RBM)堆叠 而成的。RBM 是由 G.E.Hinton 等提出的一种基于能量理论 的概率模型,并通过热力学能量函数定义了一个概率分布。
计算机工程应用技术
信息与电脑 China Computer&Communication
2016 年第 3 期
深度学习研究概述
刘钰鹏
(北方民族大学,宁夏 银川 750021)
摘 要: 深度学习作为机器学习的一个新的研究方向,近年来在许多领域的应用中取得了突破性进展。2006 年, Geoffrey Hinton 教授发表的一篇文章开启了深度学习在学术界和工业界的浪潮。如今,深度学习已经在许多领域的应 用中具有举足轻重的地位。2012 年,谷歌 Google Brain 项目建立的深度神经网络学习模型,在语音识别和图像第一个重点研究方向便是深度学习。同年, MIT Technology Review 杂志将深度学习列为 2013 年十大突破技术之首。本文将主要介绍这一逐渐兴起的新技术的基本 概况。 关键词:深度学习;层次性学习;深度置信网络;卷积神经网络 中图分类号:TP18 文献标识码:A 文章编号:1003-9767(2016)03-052-02
作者简介:刘钰鹏(1990-),男,山东牟平人,研究生在读。研究方向:基于深度学习的三维 CAD 模型检索。
— 52 —
2016 年第 3 期
信息与电脑 China Computer&Communication
计算机工程应用技术
RBM 结构分为可视层(v)和隐层(h),每一层节点之间无 连接,但层与层之间通过权值 w 彼此连接。这也是 RBM 的 一个优点,其所有可视的节点独立于其他可视节点(隐层节 点亦然)。 RBM 的传统训练方法:初始化可视层后,在可视层与 隐层之间交替进行吉布斯采样,即用条件分布概率 P(h|v) 计 算隐层;将其输出作为可视层的输入,同样用条件分布概 率 P(h|v) 来计算;重复进行这样的采样过程,直到可视层和 隐层达到平稳分布的状态。这种方式下,通常需要使用次数 较多的采样,尤其是在数据的特征维度较高时,使得训练效 率不高。因而,Hinton 提出了一种快速算法,称作对比散度 (contrastive divergence,CD)学习算法。这种算法使用训 练数据初始化可视层后,只需要较少次迭代就可获得对模型 的估计 。 深度置信网络是将多个 RBM 堆叠起来。DBNs 训练分 为两个阶段:预训练与微调。预训练时,每一层都是进行无 监督学习,将前一层的输出作为后一层的输入,直至最高层。 将训练好的网络参数值作为整体网络参数的初始值,之后便 是微调,即利用有监督的学习对网络进行训练。
4 结 语
深度学习已经成功应用于很多领域的模式分类问题。这 一领域虽处于发展初期,还存在许多问题,但其对机器学习 领域的影响力不容小觑。
3 深度学习应用
近年来,深度学习在图形图像、语音、文字数据的处 理应用上取得了优异效果。图像是深度学习最早尝试的应用 领 域。Vincent 等 人 将 CNNs 应 用 在 MNIST 数 据 库 手 写 体 识别中。由于使用局部感受野方法获取观测特征与平移、 缩 放 和 旋 转 无 关,CNNs 在 手 写 体 识 别 的 效 果 极 其 理 想。 Kavukcuoghi 等人采用无监督方法来学习多层稀疏卷积特征, 用于图像识别。与采用线性解码器从稀疏特征中重构图像的 方法不一样的是,这种方法训练了一个有效的前馈编码器, 从输入中预测准稀疏(Quasi Sparse)特征。2012 年 10 月, Hinton 教授以及他的两个学生采用更深的卷积神经网络模型 在著名的 ImageNet 问题上取得了世界最好成果,使得对图 像识别的研究工作前进了一大步 [2]。Hinton 构建的深度神经 网络模型是使用原始的自然图像训练的 , 没有使用任何人工 特征提取方法。在自然语言处理领域,D.Bahdanau 等人在 K.Cho 突出的一种基于循环神经网络的向量化定长表示模型 (RNNenc)的基础上,克服该模型中固定长度的缺点,提 出了 RNNsearch 的模型 [3]。该模型在翻译每个单词时,根据 该单词在源文本中最相关信息的位置以及已翻译出的其他单
相关文档
最新文档