关于深度学习的综述与讨论
《2024年深度强化学习理论及其应用综述》范文

《深度强化学习理论及其应用综述》篇一摘要:深度强化学习作为人工智能领域的一项重要技术,结合了深度学习和强化学习的优势,为解决复杂问题提供了有效的方法。
本文综述了深度强化学习的基本理论、发展历程、关键技术及其在各个领域的应用,旨在为读者提供一个全面而深入的理解。
一、引言深度强化学习是人工智能领域的一个新兴分支,它结合了深度学习和强化学习的优点,通过在模型中引入神经网络来处理复杂的决策问题。
近年来,深度强化学习在多个领域取得了显著的成果,成为人工智能领域的研究热点。
本文将对深度强化学习的基本理论、发展历程、关键技术及其应用进行综述。
二、深度强化学习基本理论深度强化学习是强化学习与深度学习的结合,其基本思想是通过神经网络来逼近决策过程,并利用强化学习的反馈机制进行学习。
在深度强化学习中,智能体通过与环境交互,学习到一种策略,以最大化长期回报。
该过程包括感知环境状态、选择动作、接收反馈和更新策略等步骤。
三、深度强化学习的发展历程深度强化学习的发展经历了从简单的基于值函数的方法到复杂的基于策略梯度的方法的演变过程。
早期的研究主要关注于如何将神经网络与强化学习相结合,以解决简单的决策问题。
随着深度学习技术的发展,深度强化学习开始在复杂问题上取得突破性进展。
近年来,随着算法和计算能力的不断提高,深度强化学习在多个领域的应用取得了显著成果。
四、关键技术(一)神经网络:神经网络是深度强化学习的核心组成部分,它能够处理复杂的感知和决策问题。
常见的神经网络结构包括多层感知机、卷积神经网络和循环神经网络等。
(二)值函数逼近:值函数逼近是深度强化学习中的一种关键技术,它通过逼近价值函数来指导决策过程。
常见的值函数逼近方法包括基于监督学习的回归方法和基于无监督学习的自编码器方法等。
(三)策略梯度方法:策略梯度方法是另一种重要的深度强化学习方法,它直接对策略进行参数化并利用梯度信息进行优化。
这种方法在处理复杂问题时具有较高的灵活性。
国外近十年深度学习实证研究综述主题、情境、方法及结果

国外近十年深度学习实证研究综述主题、情境、方法及结果一、概述:二、主题分类:计算机视觉:该主题主要关注图像识别、目标检测、图像生成等任务。
研究者利用深度学习模型,如卷积神经网络(CNN),在图像分类、人脸识别、物体检测等任务上取得了显著成果。
自然语言处理:自然语言处理是深度学习的另一重要应用领域。
研究者使用循环神经网络(RNN)、长短期记忆网络(LSTM)、变压器(Transformer)等模型进行文本生成、情感分析、机器翻译等任务,推动了自然语言处理技术的发展。
语音识别与生成:深度学习在语音识别和语音合成方面也有广泛应用。
研究者利用深度学习模型进行语音特征提取、语音识别和语音合成,提高了语音技术的准确性和自然度。
游戏与人工智能:深度学习在游戏领域的应用也日益增多。
研究者利用深度学习模型进行游戏策略学习、游戏内容生成等任务,提高了游戏的智能性和趣味性。
医疗与健康:深度学习在医疗领域的应用也备受关注。
研究者利用深度学习模型进行疾病诊断、药物研发、医疗影像分析等任务,为医疗健康领域的发展提供了有力支持。
这些主题分类展示了深度学习在不同领域和应用场景中的广泛应用和巨大潜力。
通过对这些主题的深入研究和分析,我们可以更好地理解深度学习的发展趋势和应用前景。
1. 计算机视觉在计算机视觉领域,深度学习技术的应用已经取得了显著的突破。
近年来,卷积神经网络(CNN)成为了该领域的主导模型,特别是在图像分类、目标检测、图像分割等方面。
AlexNet、VGG、GoogleNet、ResNet等模型的出现,不断刷新了图像分类任务上的准确率记录。
主题:计算机视觉的核心任务是让机器能够像人一样“看懂”图像和视频,从而进行自动分析和理解。
深度学习通过模拟人脑神经元的连接方式,构建出复杂的网络结构,实现对图像的高效特征提取和分类。
情境:计算机视觉的应用场景非常广泛,包括人脸识别、自动驾驶、医学影像分析、安全监控等。
在这些场景中,深度学习模型需要处理的数据集往往规模庞大,且存在噪声、模糊等问题,因此模型的鲁棒性和泛化能力成为研究重点。
《2024年多模态深度学习综述》范文

《多模态深度学习综述》篇一一、引言随着信息技术的飞速发展,人类正面临着一个多元、异构、复杂的数据世界。
在这个世界中,多模态数据因其丰富的信息表达和多样的数据来源,正逐渐成为人工智能领域的研究热点。
多模态深度学习作为处理多模态数据的有效手段,其研究与应用日益广泛。
本文旨在全面回顾多模态深度学习的研究现状,总结其关键技术和发展趋势,以期为后续研究者提供参考。
二、多模态深度学习的定义与分类多模态深度学习是一种融合多种模态数据,通过深度学习技术进行特征提取、表示学习和任务求解的方法。
多模态数据包括但不限于文本、图像、音频、视频等,这些不同模态的数据在信息表达和感知方式上具有互补性。
根据应用场景和任务需求,多模态深度学习可分为跨模态检索、多模态融合、多模态生成等。
三、多模态深度学习的关键技术1. 数据预处理:在多模态数据处理过程中,需要对不同模态的数据进行预处理,包括数据清洗、特征提取、数据对齐等。
这些预处理步骤对于提高多模态深度学习的性能至关重要。
2. 特征表示:特征表示是多模态深度学习的核心任务之一。
通过深度学习技术,可以将不同模态的数据映射到同一特征空间,实现跨模态的语义理解和信息交互。
3. 融合策略:多模态融合策略包括早期融合、晚期融合和混合融合等。
早期融合主要在数据预处理阶段进行融合,晚期融合则是在特征或决策层面进行融合。
混合融合则结合了早期和晚期融合的优点,根据任务需求灵活调整融合策略。
4. 模型训练:多模态深度学习需要设计合适的模型结构和训练方法。
常用的模型包括循环神经网络、卷积神经网络、生成对抗网络等。
针对多模态数据的特性,需要设计具有跨模态交互能力的模型结构,并采用合适的优化算法进行训练。
四、多模态深度学习的应用领域多模态深度学习在各个领域都有广泛的应用,包括但不限于以下方面:1. 图像与文本的跨模态检索:通过多模态深度学习技术,实现图像与文本之间的跨模态检索,提高检索的准确性和效率。
2. 人机交互:多模态深度学习可以实现在自然语言处理、语音识别、手势识别等多模态信息的融合和处理,提高人机交互的智能性和便捷性。
《2024年深度学习相关研究综述》范文

《深度学习相关研究综述》篇一一、引言随着科技的飞速发展,深度学习作为人工智能领域的重要分支,已经成为当前研究的热点。
深度学习以其强大的特征学习和表示学习能力,在图像识别、语音识别、自然语言处理、机器翻译等多个领域取得了显著的成果。
本文旨在全面综述深度学习的基本原理、发展历程、主要应用以及当前面临的挑战与未来发展趋势。
二、深度学习的基本原理与发展深度学习是基于神经网络的一种机器学习方法,其核心思想是通过构建多层神经网络来模拟人脑的思维方式,实现从原始数据中自动提取高级特征和抽象表示的目的。
深度学习的理论基础主要来源于人工神经网络、统计学和优化理论等学科。
随着硬件技术的进步和计算能力的提升,深度学习的发展经历了从浅层学习到深层学习的过程。
早期的神经网络模型由于计算资源的限制,通常只有几层结构,难以处理复杂的任务。
而随着深度学习算法的改进和计算机性能的飞跃,深度神经网络的层数不断增加,能够更好地处理大规模数据和复杂任务。
三、深度学习的主要应用1. 图像识别:深度学习在图像识别领域取得了显著的成果,如人脸识别、物体检测、图像分类等。
通过训练深度神经网络,可以自动提取图像中的特征,实现高精度的识别效果。
2. 语音识别:深度学习在语音识别领域也取得了重要突破,如语音合成、语音转文字等。
通过构建大规模的语音数据集和复杂的神经网络模型,可以实现高度逼真的语音合成和高效的语音转文字功能。
3. 自然语言处理:深度学习在自然语言处理领域也有广泛的应用,如机器翻译、情感分析、问答系统等。
通过构建语言模型和上下文感知模型,可以有效地理解和生成自然语言文本。
4. 机器翻译:深度学习在机器翻译领域的应用已经取得了巨大的成功。
通过训练大规模的平行语料库和复杂的神经网络模型,可以实现高质量的翻译效果。
四、当前面临的挑战与未来发展趋势尽管深度学习在多个领域取得了显著的成果,但仍面临一些挑战和问题。
首先,深度学习的可解释性仍然是一个亟待解决的问题。
多模态深度学习方法综述

多模态深度学习方法综述深度学习是一种模仿人脑神经网络结构和运作方式的机器学习方法,已经在图像识别、语音识别和自然语言处理等领域取得了巨大成功。
然而,传统的深度学习方法只利用单一模态的数据进行训练和预测,无法有效融合多种不同模态的信息。
为了更好地利用多模态数据,研究人员提出了多模态深度学习方法,该方法可以融合多种不同模态的数据,提高预测和分类任务的性能。
本文将对多模态深度学习方法进行综述,并探讨其在不同领域的应用前景。
一、多模态深度学习方法的基本原理多模态深度学习方法通过融合多种不同模态的数据,可以利用不同模态之间的互补信息提高模型的性能。
基本原理是将不同模态的数据输入到不同的网络分支中,然后通过多层神经网络进行特征提取和融合,最终得到一个综合的表示向量。
具体而言,多模态深度学习方法可以分为两个主要步骤:模态特征提取和模态融合。
(一)模态特征提取在多模态深度学习方法中,每个模态的数据都需要通过相应的网络分支进行特征提取。
以图像和文本数据为例,可以使用卷积神经网络(CNN)提取图像的视觉特征,使用循环神经网络(RNN)提取文本的语义特征。
这些特征提取器可以学习到不同模态数据中的高级特征表示。
(二)模态融合在模态特征提取之后,需要将不同模态的特征融合到一个统一的表示向量中。
常用的融合方法包括加权融合、拼接融合和逐层融合。
加权融合通过学习每个模态特征的权值,对特征进行加权求和;拼接融合将不同模态特征按照一定的顺序拼接在一起;逐层融合则将不同模态特征分别输入到不同层的神经网络中,逐层融合特征表示。
二、多模态深度学习方法的应用领域多模态深度学习方法在多个领域中得到了广泛的应用,并取得了显著的成果。
(一)图像和文本领域在图像和文本领域,多模态深度学习方法可以用于图像标注、图像检索和图像生成等任务。
通过融合图像和文本数据,可以提取更多的语义信息,提高图像标注和图像检索的准确性。
同时,通过图像生成模型,可以根据文本描述生成与之匹配的图像。
深度学习心得范文

深度学习心得范文一、引言深度学习是一种基于神经网络的机器学习方法,近年来在图像识别、语音识别、自然语言处理等领域取得了巨大的突破和应用。
在我学习深度学习的过程中,我深刻认识到了深度学习的强大能力和广阔前景,也对深度学习领域的研究和应用产生了极大的兴趣。
在这篇心得中,我将结合自己的学习和实践经验,分享我对深度学习的认识和思考。
二、理论学习在深度学习的理论学习方面,我首先了解了神经网络的基本原理和结构。
神经网络是深度学习的基础,它由多个神经元层组成,每个神经元接收上一层神经元的输出作为输入,并进行加权求和和激活函数等操作,最后输出结果。
深度学习通过不断深化神经网络的层数,提高网络的表示能力,从而实现更复杂的任务。
我还学习了深度学习中常用的优化算法,如梯度下降、RMSProp 和Adam等。
这些优化算法能够帮助神经网络高效地学习和优化模型的参数。
同时,我也了解了深度学习的常见模型和架构,如卷积神经网络(CNN)、循环神经网络(RNN)和生成对抗网络(GAN)等。
这些模型在图像分类、序列问题和生成任务等方面表现出色,广泛应用于实际场景中。
在深入学习理论的过程中,我深刻认识到深度学习的核心思想是从数据中学习,并且需要大量的数据和计算资源支持。
深度学习是一种端到端的机器学习方法,不需要人工提取特征,通过神经网络自动学习数据的特征,并从中进行高级表示和决策。
这种数据驱动的特点使得深度学习在处理大规模数据和复杂任务时具有巨大优势。
三、实践探索除了理论学习,我也进行了一些深度学习的实践探索。
我首先在图像分类问题上进行了实践,使用了深度学习库Keras和TensorFlow 来搭建和训练卷积神经网络模型。
通过对已有的图像数据集进行训练和测试,我深刻感受到了深度学习模型的高准确率和泛化能力。
在图像分类实践中,我还尝试了迁移学习的方法。
通过将预训练的卷积神经网络模型作为特征提取器,我可以在较小的数据集上进行训练,并获得较好的效果。
《2024年深度学习相关研究综述》范文

《深度学习相关研究综述》篇一一、引言深度学习作为人工智能领域的一个重要分支,近年来在学术界和工业界引起了广泛的关注。
它通过模拟人脑神经网络的运作方式,实现对复杂数据的处理和识别,从而在计算机视觉、自然语言处理、语音识别等多个领域取得了显著的成果。
本文将对深度学习的基本原理、发展历程、主要应用以及当前研究热点进行综述。
二、深度学习的基本原理与发展历程深度学习是机器学习的一个分支,其核心思想是通过构建多层神经网络来模拟人脑神经网络的运作方式。
它通过大量的训练数据,使模型学习到数据的内在规律和表示方法,从而实现更加精准的预测和分类。
自深度学习概念提出以来,其发展经历了几个重要阶段。
早期的神经网络由于计算能力的限制,模型深度较浅,无法充分挖掘数据的内在规律。
随着计算能力的不断提升,尤其是GPU等硬件设备的普及,深度学习的模型深度逐渐增加,取得了显著的成果。
同时,随着数据量的不断增长和大数据技术的不断发展,深度学习的应用领域也在不断扩大。
三、深度学习的主要应用1. 计算机视觉:深度学习在计算机视觉领域的应用非常广泛,包括图像分类、目标检测、人脸识别等。
通过深度神经网络,可以实现图像的自动识别和分类,从而在安防、医疗、自动驾驶等领域发挥重要作用。
2. 自然语言处理:深度学习在自然语言处理领域也取得了显著的成果,包括语音识别、文本分类、机器翻译等。
通过深度神经网络,可以实现对人类语言的自动理解和生成,从而在智能问答、智能助手等领域发挥重要作用。
3. 语音识别:深度学习在语音识别领域也具有广泛的应用,如语音合成、语音识别等。
通过训练深度神经网络模型,可以实现高质量的语音合成和准确的语音识别。
4. 其他领域:除了上述应用外,深度学习还在推荐系统、医疗影像分析、无人驾驶等领域发挥了重要作用。
四、当前研究热点1. 模型优化:针对深度学习模型的优化是当前研究的热点之一。
研究者们通过改进模型结构、优化算法等方式,提高模型的性能和计算效率。
《2024年多模态深度学习综述》范文

《多模态深度学习综述》篇一一、引言随着信息时代的到来,人工智能、大数据等领域的迅速发展,单一模式的信息处理已经难以满足现代技术的需求。
其中,多模态深度学习成为了跨领域、跨媒体、跨信息类型研究的热点问题。
本综述将就多模态深度学习的定义、方法、研究进展及其在各个领域的应用进行综合概述,并讨论目前面临的主要挑战与未来发展方向。
二、多模态深度学习定义及理论基础1. 定义:多模态深度学习是深度学习的一个子集,指运用多种形式的感知数据进行数据理解和模型学习的技术。
这些感知数据可以是图像、文本、音频、视频等不同类型的数据。
2. 理论基础:多模态深度学习基于神经网络理论,通过深度学习算法对不同模态的数据进行特征提取和融合,以实现跨模态信息的处理和理解。
三、多模态深度学习方法1. 数据融合方法:在多模态深度学习中,数据融合是一个重要的步骤。
其主要目的是将来自不同模态的数据进行有效的整合和利用。
常见的融合方法包括早期融合、中期融合和晚期融合等。
2. 模型训练方法:在多模态深度学习中,常用的模型训练方法包括多任务学习、联合学习和迁移学习等。
这些方法旨在提高模型的泛化能力和鲁棒性,使得模型可以更好地处理和理解多模态数据。
四、多模态深度学习在各领域的应用1. 图像-文本分析:如新闻推送、商品推荐等需要分析图像和文本的场景中,多模态深度学习可以通过结合图像和文本信息,提高理解和推理的准确性。
2. 语音-语言处理:在语音识别、机器翻译等领域,多模态深度学习可以通过融合语音和语言信息,提高系统的准确性和效率。
3. 视频分析:在视频监控、自动驾驶等领域,多模态深度学习可以通过分析视频中的图像、音频和文本等信息,实现更精确的场景理解和预测。
五、研究进展与挑战近年来,多模态深度学习在理论研究和应用方面都取得了显著的进展。
然而,仍面临许多挑战和问题,如不同模态数据间的语义鸿沟、模型泛化能力等问题。
为了解决这些问题,未来的研究需要关注以下方向:1. 模型结构优化:需要设计更加灵活、可解释性更强的多模态深度学习模型,以提高模型的性能和鲁棒性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DOI : 10.11992/tis.201808019网络出版地址: /kcms/detail/23.1538.TP.20181025.1409.002.html关于深度学习的综述与讨论胡越1,罗东阳1,花奎1,路海明2,张学工1,3(1. 清华大学 自动化系,北京 100084; 2. 清华大学 信息技术研究院,北京 100084; 3. 清华大学 生命学院,北京100084)摘 要:机器学习是通过计算模型和算法从数据中学习规律的一门学问,在各种需要从复杂数据中挖掘规律的领域中有很多应用,已成为当今广义的人工智能领域最核心的技术之一。
近年来,多种深度神经网络在大量机器学习问题上取得了令人瞩目的成果,形成了机器学习领域最亮眼的一个新分支——深度学习,也掀起了机器学习理论、方法和应用研究的一个新高潮。
对深度学习代表性方法的核心原理和典型优化算法进行了综述,回顾与讨论了深度学习与以往机器学习方法之间的联系与区别,并对深度学习中一些需要进一步研究的问题进行了初步讨论。
关键词:深度学习;机器学习;卷积神经网络;递归神经网络;多层感知器;自编码机;学习算法;机器学习理论中图分类号:TP18 文献标志码:A 文章编号:1673−4785(2019)01−0001−19中文引用格式:胡越, 罗东阳, 花奎, 等. 关于深度学习的综述与讨论[J]. 智能系统学报, 2019, 14(1): 1–19.英文引用格式:HU Yue, LUO Dongyang, HUA Kui, et al. Overview on deep learning[J]. CAAI transactions on intelligent systems,2019, 14(1): 1–19.Overview on deep learningHU Yue 1,LUO Dongyang 1,HUA Kui 1,LU Haiming 2,ZHANG Xuegong 1,3(1. Department of Automation, Tsinghua University, Beijing 100084, China; 2. Institute of Information Technology, Tsinghua Uni-versity, Beijing 100084, China; 3. School of Life Sciences, Tsinghua University, Beijing 100084, China)Abstract : Machine learning is a discipline that involves learning rules from data with mathematical models and com-puter algorithms. It is becoming one of the core technologies in the field of artificial intelligence, and it is useful for many applications that require mining rules from complex data. In recent years, various deep neural network models have achieved remarkable results in many fields, and this has given rise to an interesting new branch of the machine learning: deep learning. Deep learning leads the new wave of studies on theories, methods, and applications of machine learning. This article reviews the relationships and differences between deep learning and previous machine learning methods, summarizes the key principles and typical optimization algorithms of representative deep learning methods,and discusses some remaining problems that need to be further addressed.Keywords : deep learning; machine learning; convolutional neural network; recursive neural network; multilayer per-ceptron; auto-encoder; learning algorithms; machine learning theory从现象中发现规律,是人类智能最核心的能力之一,人们也很早就开始研究如何用数学方法来分析数据中的规律。
从1930年Fisher 线性判别和1950年感知器算法开始,诞生了模式识别学科,研究从数据中学习分类信息的数学方法,形成了最早的机器学习研究。
“机器学习”这个术语也是20世纪50年代末提出来的,最初并不专指从数据中学习,更多地包括了机器推理等经典人工智能问题,直到20世纪后期才逐渐被用来专指从数据中学习。
现在,这2个术语的含义已经非常接近,模式识别专指对数据的分类,机器学习收稿日期:2018−08−24. 网络出版日期:2018−10−26.基金项目:国家自然科学基金项目(61721003).通信作者:张学工. E-mail :zhangxg@ .第 14 卷第 1 期智 能 系 统 学 报Vol.14 No.12019 年 1 月CAAI Transactions on Intelligent SystemsJan. 2019则指学习数据中的各种规律尤其是分类规律,而“深度学习”是机器学习中最新发展起来的一类方法的总称。
很多模式识别方法和统计学习方法,如线性判别、近邻法、罗杰斯特回归、决策树、支持向量机等,已经在很广泛的问题上取得了成功,如广告点击率预测[1-3]、希格斯子信号识别[4]、基于基因表达的疾病分型[5-6]等。
这些统计学习方法往往直接根据特征对样本进行分类,不进行特征变换或只进行一次特征变换或选择。
与深度学习方法相比,这些方法中特征变换较少,或者依赖于上游处理来对特征进行变换,所以被有些人称作“浅层模型”或“浅层学习方法”。
这些浅层模型在很多应用上取得了成功,但是也存在很大局限,即模型的效果非常依赖于上游提供的特征。
一方面,构造特征的过程是很困难的,需要对问题有丰富的先验知识,对原始数据详尽地了解;另一方面,在先验知识不充分的情况下,需要人为构建的特征数目庞大,如某些广告点击率预测算法中人工构造的特征维数高达数亿维[1, 7]。
深度学习是一种深层的机器学习模型,其深度体现在对特征的多次变换上。
常用的深度学习模型为多层神经网络,神经网络的每一层都将输入非线性映射,通过多层非线性映射的堆叠,可以在深层神经网络中计算出非常抽象的特征来帮助分类。
比如:在用于图像分析的卷积神经网络中,将原始图像的像素值直接输入,第一层神经网络可以视作边缘的检测器,而第二层神经网络则可以检测边缘的组合,得到一些基本模块,第三层之后的一些网络会将这些基本模块进行组合,最终检测出待识别目标。
深度学习的出现使得人们在很多应用中不再需要单独对特征进行选择与变换,而是将原始数据输入到模型中,由模型通过学习给出适合分类的特征表示。
当前,深度学习是机器学习领域最热门的分支,并且有多个高度集成化的方法平台可以让使用者无需对方法原理充分了解就可以搭建程序进行实验和应用。
本文尝试结合笔者的理解对最典型的深度学习方法原理进行综述,对深度学习与以往机器学习方法的关系进行讨论,并对未来需要研究的问题进行展望。
1 机器学习简史深度学习的基础是人工神经网络,其发展经历了3次大的起伏。
1943年,受生物神经元工作模式的启发,心理学家McCulloch和数学家Pitts 发表了神经元的数学模型[8]。
1949年,Hebb[9]提出神经元上连接的强度可以通过训练调整的思想。
1957年,Rosenblatt[10]提出感知器(perceptron)的概念和模型,提出了用数据训练其参数的算法并用当时的电子管硬件实现,成为第一个可学习的机器。
这些工作构成了后来人工神经网络的基础,当时的感知器模型只有一层,1969年Minsky等[11]指出感知器模型无法学习如异或这样的非线性关系,虽然可以通过试凑多个感知器模型的叠加来实现非线性分类,但对这种多个感知器构成的模型如何构造和如何训练其参数难以解决。
而在同一时期,1956年夏天在Dartmouth召开的暑期研讨会发起了以符号主义和知识推理为核心的人工智能(AI)研究,也就是经典AI研究,伴随着这一时期经典AI的快速发展[12-13],人工神经网络尚在萌芽阶段(当时还未出现“人工神经网络”这个术语)就进入了第一次低谷。
人工神经网络(artificial neural networks,ANN)这一术语被广泛使用是在20世纪80年代,并很快被简称为神经网络(neural networks,NN)。
1982年,Hopfield等[14]提出了一个具有完整理论基础的神经网络模型。
20世纪80年代中期,反向传播(back-propagation,BP)算法被应用于训练神经网络[15-18],解决了多层感知器无法训练的问题,从而使神经网络具有了非线性表示能力,以BP算法训练的多层感知器(multi-layer perceptron,MLP)成为最成功的神经网络模型。
同期,Kohonen[19]发展了自组织映射(self-organizing map,SOM)竞争学习神经网络模型。
这些方法在很多模式识别问题上取得了很好的效果,掀起了神经网络研究真正的高潮,现在人们通常称之为神经网络研究的第二次高潮。
限制性玻耳兹曼机(restrictive Boltzman machine,RBM)等非监督学习模型也是在这一时期被提出来的[20]。
但神经网络方法也存在很多问题。
首先,多层感知器虽然具有极强的非线性表示能力,但也因此导致参数解空间中存在大量的局部极值,使用梯度下降法进行训练很容易产生一个并不好的局部极小值,导致多层感知器在很多问题上推广能力较差。