深度学习中的无监督学习方法综述①

合集下载

深度学习中的无监督学习方法综述

深度学习中的无监督学习方法综述

深度学习中的无监督学习方法综述一、本文概述深度学习,作为机器学习领域的一个分支,近年来在多个领域取得了显著的成果,尤其是在图像识别、语音识别、自然语言处理等领域。

深度学习模型的强大性能在很大程度上依赖于大量有标签的数据进行训练。

然而,在实际应用中,往往难以获取足够数量和质量的标注数据,这限制了深度学习模型的广泛应用。

因此,无监督学习在深度学习中扮演着越来越重要的角色。

本文旨在综述深度学习中的无监督学习方法,包括自编码器、生成对抗网络、聚类算法等,并分析它们的原理、应用场景以及优缺点。

通过本文的综述,我们希望能够为读者提供一个全面而深入的理解,帮助读者更好地掌握无监督学习在深度学习中的应用,并激发更多研究者和实践者在这一领域的探索和创新。

二、无监督学习的基本原理无监督学习是机器学习的一个分支,它的主要任务是从没有标签的数据中发现和提取有用的信息和结构。

与有监督学习相比,无监督学习不需要提供预定义的标签或结果,而是依赖于数据本身的结构和关系进行学习。

聚类:无监督学习的一种常见任务是聚类,即将数据点分组,使得同一组内的数据点尽可能相似,而不同组的数据点尽可能不同。

聚类算法如K-means、层次聚类、DBSCAN等,都是基于数据点的距离或密度进行分组。

降维:无监督学习还常用于降维,即减少数据的特征数量,同时保留尽可能多的信息。

降维算法如主成分分析(PCA)、t-SNE、自编码器等,通过找到数据的主要特征或结构,将数据从高维空间映射到低维空间。

密度估计:无监督学习还可以用于估计数据的概率密度函数。

这可以通过参数方法(如高斯混合模型)或非参数方法(如核密度估计)来实现。

密度估计对于异常检测、生成模型等任务非常有用。

表示学习:无监督学习的一个重要方向是表示学习,即学习数据的低维、有意义的表示。

这可以通过自编码器、生成对抗网络(GANs)等深度学习模型来实现。

表示学习的目标是使得学习到的表示能够捕获数据的本质结构和特征,从而有利于后续的监督学习任务。

深度学习中的无监督学习方法与应用(十)

深度学习中的无监督学习方法与应用(十)

深度学习中的无监督学习方法与应用深度学习是一种基于数据表示学习的机器学习方法,其目的是对输入数据进行建模,以便能够对未知数据进行预测。

在深度学习中,无监督学习方法起着至关重要的作用。

无监督学习是指从没有标签的数据中学习模型的过程,这种学习方法在深度学习中被广泛应用,为机器学习领域带来了巨大的变革。

一、无监督学习方法的原理在深度学习中,无监督学习方法主要包括自编码器、生成对抗网络(GAN)和聚类算法等。

自编码器是一种常用的无监督学习方法,其原理是通过将输入数据压缩成编码表示,再将编码表示解压缩成与原始数据相似的输出。

通过训练自编码器,可以学习到数据的有效表示,为后续的分类和预测任务提供基础。

生成对抗网络是另一种重要的无监督学习方法,其原理是通过训练一个生成网络和一个判别网络来学习数据的分布,从而能够生成具有相似分布的数据。

聚类算法则是将数据根据其相似性进行分组,为数据分析和模式识别提供有力支持。

二、无监督学习方法在图像处理中的应用在图像处理领域,无监督学习方法发挥着重要作用。

通过自编码器和生成对抗网络等方法,可以对图像数据进行特征提取和图像生成。

例如,自编码器可以学习到图像的有效表示,使得图像可以在低维空间中被重构。

生成对抗网络则可以生成具有逼真度的图像,为图像合成和增强提供了新的可能性。

此外,聚类算法也可以对图像数据进行分析和分类,为图像检索和图像识别提供支持。

三、无监督学习方法在自然语言处理中的应用在自然语言处理领域,无监督学习方法同样发挥着重要作用。

通过自编码器和生成对抗网络等方法,可以对文本数据进行特征提取和文本生成。

例如,自编码器可以学习到文本的语义表示,使得文本可以在低维空间中被表示。

生成对抗网络则可以生成具有逼真度的文本,为文本生成和翻译提供了新的可能性。

此外,聚类算法也可以对文本数据进行分析和分类,为文本聚类和情感分析提供支持。

四、无监督学习方法在推荐系统中的应用在推荐系统中,无监督学习方法也发挥着重要作用。

深度学习技术中的无监督学习方法探究

深度学习技术中的无监督学习方法探究

深度学习技术中的无监督学习方法探究无监督学习是深度学习领域的一种重要方法,它以无需标注数据的方式,从大量未标注的数据中发现隐藏的模式、结构和表示。

相比有监督学习,无监督学习更具挑战性,因为在大多数真实世界的应用中,我们无法获得足够的标注数据,而仅仅依靠未标注数据进行学习则更具实用性。

本文将深入探究几种常见的无监督学习方法,包括自编码器、生成对抗网络和聚类算法。

首先,我们来介绍自编码器。

自编码器是一种神经网络模型,用于学习数据的有效表示。

它由两部分组成:编码器和解码器。

编码器将输入数据映射到一个低维的表示空间,而解码器则将这个低维表示重新映射回原始输入空间。

通过使用自编码器,我们可以学习到一种压缩表示,从而可以用较少的信息来表示输入数据。

自编码器在无监督学习中应用广泛,例如图像降噪、数据压缩和特征学习等方面。

其次,我们将讨论生成对抗网络(GAN)。

GAN是一种通过博弈过程将生成器和判别器相互对抗的框架,用于生成与训练数据相似的新数据。

生成器和判别器是两个神经网络模型,生成器试图生成与真实数据无法区分的新样本,而判别器则试图将生成的样本与真实样本区分开来。

通过反复训练生成器和判别器,GAN能够逐步提高生成器生成的样本的质量。

GAN在图像生成、图像修复和数据生成等任务中取得了显著的成果,并成为无监督学习中的重要研究方向。

最后,我们将介绍聚类算法,它是一种无监督学习方法,用于将数据分组成具有相似性的簇。

聚类算法的目标是通过最大化簇内的相似度和最大化簇间的差异性,来获得对数据的有效表示。

常用的聚类算法包括K-means、层次聚类和密度聚类等。

这些算法能够自动地将数据进行分组,发现数据的内在结构,并且对于无监督学习中的数据探索和数据预处理都具有重要意义。

综上所述,无监督学习在深度学习技术中扮演着重要的角色。

自编码器、生成对抗网络和聚类算法等无监督学习方法为深度学习任务提供了强大的工具。

通过无监督学习,我们能够从未标注的数据中发现隐藏的模式和结构,为后续的任务提供有价值的先验信息。

深度学习中的无监督学习方法综述①

深度学习中的无监督学习方法综述①

2016 年 第 25 卷 第 8 期

计算机系统应用
会被进行一定程度的抽象, 得到一个更深层的编码
(code), 然后可以通过第二层变换(decoder)得到一个近
似于输入数据(input data)的输出数据(output data). 如
果输入数据和输出数据相等, 则表明该编码是无损的
如今深度学习方法在许多应用中都取得了比较好 的效果, 但是却缺乏坚实的理论基础, 针对特定问题 需要多少层的神经网络, 每层神经网络需要多少个神 经单元, 都只有经验公式, 没有理论支撑. 深层网络 架构本身可以比浅层网络更简洁地表达复杂关系, 但 是深层架构的不可或缺性和无监督学习算法的必要性 还有待进一步论证. 不可否认的是, 作为构建深度学 习的重要方法, 无监督学习技术所起的作用是不容忽 视的. 无监督学习技术可以在没有标签的情况下自主 学习数据的抽象形式, 不仅拓展了学习的范围, 也为 神经网络提供了一个较优的初始化参数, 因此, 理解 和分析无监督学习技术的机理和方法, 对于理解和拓 展深度学习具有非常重要的意义.
论文的其余部分是这样组织的, 第 1 节介绍了无 监督学习方法及其在深度学习中的应用, 第 2 节介绍 确定型的无监督学习方法-自编码及降噪自编码技术, 第 3 节介绍概率型的无监督学习方法—基于受限玻尔 兹曼机的对比散度学习方法, 第 4 节介绍了基于无监 督学习方法的深度学习系统并简要介绍了两类无监督
2016 年 第 25 卷 第 8 期

计算机系统应用
深度学习中的无监督学习方法综述①
殷瑞刚 1, 魏 帅 2, 李 晗 2, 于 洪 2
1(解放军第 181 医院, 桂林 541002) 2(国家数字交换系统工程技术研究中心, 郑州 450002)

无监督学习的使用方法(Ⅰ)

无监督学习的使用方法(Ⅰ)

无监督学习的使用方法无监督学习是机器学习领域的一个重要分支,它以数据的特征为基础,通过对数据的模式和结构进行分析和挖掘,从而实现对数据的自动分类、聚类、降维等任务。

与监督学习不同,无监督学习不需要标记好的训练数据,因此在处理大规模数据时具有明显的优势。

本文将介绍一些常见的无监督学习算法以及它们的使用方法。

一、无监督学习算法1. 聚类算法聚类算法是无监督学习中最为常见的一类算法,它的主要目标是将数据集划分为若干个不同的类别,使得同一类别内的数据相似度较高,不同类别之间的数据相似度较低。

常见的聚类算法包括K均值聚类、层次聚类、DBSCAN等。

K均值聚类是一种基于距离的聚类算法,它以数据点之间的距离作为相似度的度量,通过迭代的方式将数据划分为K个不同的类别。

层次聚类算法则是一种自底向上的聚类方法,它以数据点之间的相似度作为度量,逐步合并相似度高的数据点,直到所有数据点都合并为一个类别。

DBSCAN是一种基于密度的聚类算法,它通过寻找数据集中的高密度区域来确定类别,从而克服了K均值聚类对于类别数量的先验假设。

2. 降维算法降维算法是一种将高维数据映射到低维空间的方法,它的主要目标是保留数据的重要信息同时减少数据的维度。

常见的降维算法包括主成分分析(PCA)、t-分布邻域嵌入(t-SNE)等。

PCA是一种线性的降维算法,它通过找到数据中的主成分来实现降维,从而能够在保留数据重要信息的同时减少数据的维度。

t-SNE是一种非线性的降维算法,它通过在高维空间中对数据点之间的相似度进行映射,将数据映射到低维空间中,从而实现降维并保持数据的局部结构。

3. 关联规则挖掘算法关联规则挖掘算法是一种挖掘数据集中频繁出现项集的方法,它的主要目标是发现数据集中项集之间的关联规则。

常见的关联规则挖掘算法包括Apriori算法、FP-growth算法等。

Apriori算法是一种基于候选集的方法,它通过迭代的方式发现频繁项集,并由频繁项集生成关联规则。

强化学习算法中的无监督学习方法详解(Ⅰ)

强化学习算法中的无监督学习方法详解(Ⅰ)

强化学习算法中的无监督学习方法详解强化学习是一种通过不断试错和学习来达到最优决策的机器学习方法。

在强化学习中,无监督学习方法起着至关重要的作用。

无监督学习是指模型在学习过程中没有标签或者反馈信息的情况下进行学习。

在强化学习中,无监督学习方法可以帮助智能体在环境中自主学习和探索,为其提供更多的信息和策略。

本文将详细介绍强化学习算法中的无监督学习方法,包括深度强化学习、自编码器和生成对抗网络等。

深度强化学习深度强化学习是强化学习算法与深度学习相结合的一种方法。

它通过使用深度神经网络来近似值函数和策略函数,从而提高学习的效率和表现。

深度强化学习中的无监督学习方法主要集中在无模型方法和有模型方法两种。

无模型方法是指智能体在学习过程中不需要对环境进行建模,而是直接通过与环境的交互来学习。

其中,价值迭代算法和策略迭代算法是两种常用的无模型深度强化学习方法。

价值迭代算法通过学习最优值函数来得到最优策略,而策略迭代算法则是直接学习最优策略。

这两种方法都可以通过深度神经网络来进行近似计算,从而提高学习的效率和表现。

有模型方法则是指智能体在学习过程中需要对环境进行建模,通过建立环境模型来进行规划和学习。

其中,模型基础的强化学习和模型预测控制是两种常用的有模型深度强化学习方法。

模型基础的强化学习通过学习环境的动力学模型来进行规划和学习,而模型预测控制则是通过学习环境的预测模型来进行规划和学习。

这两种方法同样可以通过深度神经网络来进行近似计算,从而提高学习的效率和表现。

自编码器自编码器是一种无监督学习方法,它通过学习数据的压缩表示来进行特征学习和数据生成。

在强化学习中,自编码器可以被用来学习环境的特征表示和状态空间的表示,从而提高智能体对环境的理解和学习能力。

其中,变分自编码器和生成对抗网络是两种常用的自编码器模型。

变分自编码器是一种概率生成模型,它通过最大化数据的边缘似然来进行数据的生成和学习。

在强化学习中,变分自编码器可以被用来学习环境的状态表示和策略函数的表示,从而提高智能体的学习效率和表现。

深度学习中的无监督学习方法与应用(Ⅰ)

深度学习中的无监督学习方法与应用(Ⅰ)

深度学习中的无监督学习方法与应用在深度学习领域,无监督学习方法一直备受关注。

与监督学习不同,无监督学习不需要标记的训练数据,而是通过对数据的自动学习和聚类来发现数据中的模式和结构。

这种方法在处理大规模数据、自然语言处理、图像识别等领域有着广泛的应用。

本文将探讨无监督学习在深度学习中的方法和应用。

一、无监督学习方法无监督学习方法主要包括自编码器、生成对抗网络(GAN)、聚类等。

其中,自编码器是一种常见的无监督学习方法。

它通过将输入数据编码成潜在空间的表示,再将其解码成原始输入来学习数据的特征。

自编码器可以用于降维、特征提取和去噪等任务。

生成对抗网络是另一种重要的无监督学习方法,它由生成器和判别器组成,通过对抗训练来生成接近真实数据的样本。

聚类算法则是将数据分成不同的类别,常见的算法包括K均值、层次聚类等。

二、无监督学习在图像处理中的应用在图像处理领域,无监督学习方法有着广泛的应用。

自编码器可以用于图像去噪,通过学习数据的特征来去除图像中的噪声。

生成对抗网络可以用于图像生成,它可以生成逼真的图像样本,被广泛应用于风格迁移、图像修复等任务。

聚类算法可以用于图像分割,将图像分成不同的区域,有助于图像分析和理解。

三、无监督学习在自然语言处理中的应用在自然语言处理领域,无监督学习方法也有着重要的应用。

自编码器可以用于词嵌入,将词语映射到低维空间的表示,有助于语义分析和情感分类。

生成对抗网络可以用于文本生成,它可以生成逼真的语言模型,被广泛应用于对话系统、机器翻译等任务。

聚类算法可以用于文本聚类,将文本分成不同的类别,有助于信息检索和文本分类。

四、无监督学习在其他领域的应用除了图像处理和自然语言处理,无监督学习方法还在其他领域有着重要的应用。

在推荐系统中,自编码器可以用于推荐商品,通过学习用户的行为特征来提高推荐的准确性。

在金融领域,聚类算法可以用于风险管理,将客户分成不同的风险组,有助于个性化的金融服务。

五、未来展望随着深度学习技术的不断发展,无监督学习方法将会得到更广泛的应用。

深度学习中的无监督学习技术

深度学习中的无监督学习技术

无监督学习是深度学习中的一个重要领域,它主要关注在没有明确标签或监督的情况下,如何从数据中自动提取有用的特征和模式。

无监督学习技术广泛应用于数据挖掘、图像识别、自然语言处理等领域。

无监督学习的主要应用场景包括:1. 聚类分析:通过将数据划分为不同的组或类别,以便更好地理解和解释数据。

这种方法在无监督学习中被广泛应用,因为它不需要明确的标签或监督。

2. 降维:通过将高维数据降至低维空间,以便更好地理解和分析数据。

这种方法有助于减少数据的复杂性,并提高模型的性能和效率。

3. 生成模型:通过生成新的数据或样本,无监督学习技术可以帮助创建有用的数据流和产品。

这种方法可用于自动创建新的图像、音频或文本数据,从而提高自动化程度和工作效率。

在深度学习中,无监督学习通常采用监督学习的方式来获得有用的特征和模式。

一种常见的技术是无监督的神经网络(如自编码器),通过学习数据的表示层次结构,能够自动从数据中提取有用的特征和模式。

另一种是无监督的迁移学习,通过利用已标记数据的先验知识,对无标签数据进行无监督学习,并从中获得有用的特征和模式。

无监督学习的优势在于它能够处理大规模的数据集,并且可以自动发现数据的内在结构和模式。

然而,它也存在一些挑战,如如何有效地处理高维数据和噪声数据,以及如何避免过拟合和欠拟合等问题。

未来无监督学习技术的发展方向包括更高效的算法和模型设计,以及更广泛的应用领域。

例如,随着深度学习技术的不断发展,无监督学习技术有望在自然语言处理、计算机视觉、智能推荐等领域发挥越来越重要的作用。

此外,随着大数据和人工智能的结合,无监督学习技术有望在更广泛的领域得到应用,如医疗诊断、金融分析、智能交通等。

总之,无监督学习技术是深度学习中一个重要的研究方向,它能够自动从大规模数据中提取有用的特征和模式,并应用于各种领域。

随着算法和模型的不断优化,无监督学习技术的应用前景将更加广阔。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(4)
代价函数如下所示,
1 × a(3) − x 2
(5)
2
但是在实际应用过程中, 一般要考虑系数正则化,
因此需要在代价函数里面加入这一项, 则代价函数就
如式(6)所示.

a(3)
−x
2

× ( W (1)
2+
W (2)
2
)
(6)
2
2
容易看出在自编码网络中输入输出数目相同, 当
隐含单元数目和输入输出单元数目一样时, 则恒等函
2016 年 第 25 卷 第 8 期

计算机系统应用
会被进行一定程度的抽象, 得到一个更深层的编码
(code), 然后可以通过第二层变换(decoder)得到一个近
似于输入数据(input data)的输出数据(output data). 如
果输入数据和输出数据相等, 则表明该编码是无损的
2016 年 第 25 卷 第 8 期

计算机系统应用
深度学习中的无监督学习方法综述①
殷瑞刚 1, 魏 帅 2, 李 晗 2, 于 洪 2
1(解放军第 181 医院, 桂林 541002) 2(国家数字交换系统工程技术研究中心, 郑州 450002)
摘 要: 从 2006 年开始, 深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨 大成功, 其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此, 对深度学习中的无监督学习方法进行了介绍和分析, 主要总结了两类常用的无监督学习方法, 即确定型的 自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法, 并介绍了这两类方法在深度学习系统中的应 用, 最后对无监督学习面临的问题和挑战进行了总结和展望. 关键词: 自编码; 受限玻尔兹曼机; 无监督学习; 深度学习; 神经网络
Introduction of Unsupervised Learning Methods in Deep Learning
YIN Rui-Gang1, WEI Shuai2, LI Han2, YU Hong2
1(Chinese People’s Liberation Army 181th Hospital, Guilin 541002, China) 2(National Diering & Technological R&D Center, Zhengzhou 450002, China)
深度学习是由多层神经网络组成, 需要一层一层 地抽取主要特征, 忽略次要细节, 所以深度学习中采 用的无监督学习方法需要满足三个条件:
① 可以从多维空间中抽取主要特征映射映射至 低维空间;
② 具有递归性; ③ 算法不能太过复杂, 否则深层架构的计算量 太大. 从原理上来说 PCA 等数据降维算法同样适用于深 度学习, 但是这些数据降维方法复杂度较高, 并且其算 法的目标太明确, 使得抽象后的低维数据中没有次要信 息, 而这些次要信息可能在更高层看来是区分数据的主 要因素. 所以现在深度学习中采用的无监督学习方法通 常采用较为简单的算法和直观的评价标准. 目前深度学 习中的无监督学习主要分为两类, 一类是确定型的自编 码方法及其改进算法, 其目标主要是能够从抽象后的数 据中尽量无损地恢复原有数据, 一类是概率型的受限波 尔兹曼机及其改进算法, 其目标主要是使受限玻尔兹曼 机达到稳定状态时原数据出现的概率最大.
2016 年 第 25 卷 第 8 期
最近的研究结果证明了深度学习方法在多个机器 学习和人工智能领域的有效性, 特别是图像和语音处 理领域. 2012 年 Hinton 和 Krizhevsky 等人[4]利用 GPU 实现了一个深度神经网络, 在 ImageNet[5]的比赛中取 得了创纪录的结果, 他们训练了一个参数规模非常大 的深度神经网络, 并通过 dropout 方法来抑制模型的过 拟合, 在大规模图像分类任务上 Top 5 分类精度达到 了 84.7%, 比第二名使用的 Fisher 向量编码算法[6]要高 大约 10 个百分点. 2011 年以来, 微软研究院和谷歌的 语音识别研究人员先后采用 DNN 技术降低语音识别 错误率 20%~30%, 是语音识别领域 10 多年来最大的 突破性进展[7]. 虚拟人脑是谷歌 2012 年研发出来的 基于深度学习的具有自动学习能力的人工智能项目. 它采用 1000 台计算机共 16000 个计算节点, 利用 YouTube 网站上的视频作为训练集, 花费 3 天的时间 训练出 9 层的深度自编码器网络. 其训练出来的深度 神经网络已经可以模拟一些人脑的功能. 在完全没有 标签的情况下, 该网络能够自动地从训练集中学习到 某些概念, 例如, 当输入是“猫”的图像时某些节点的 响应会很强烈, 而当输入的是“人脸”时另外一些节点 会响应强烈, 而且这些节点对于输入图像的旋转, 平 移等变化具有一定的不变性[8].
(这只是一个理想情况). 编码和解码过程可由式(1)至
式(4)表示, 其中 a(2)为编码结果, a(3)为解码结果, 均为
向量形式:
z(2) = W (1) x + b(1)
(1)
a(2) = f (z(2) )
(2)
z(3) = W (2) x + b(2)
(3)
a(3) = f (z(3) )
论文的其余部分是这样组织的, 第 1 节介绍了无 监督学习方法及其在深度学习中的应用, 第 2 节介绍 确定型的无监督学习方法-自编码及降噪自编码技术, 第 3 节介绍概率型的无监督学习方法—基于受限玻尔 兹曼机的对比散度学习方法, 第 4 节介绍了基于无监 督学习方法的深度学习系统并简要介绍了两类无监督
20 世纪八十年代 Hopfield 将能量函数引入到神经 网络中, 用非线性动力学解释循环反馈网络的运行[1], 同一时期, 反向传播算法(Back Propagation 算法, 简 称 BP 算法)[2]给多层神经网络提出了一种可靠的学习 方法, 引起了神经网络的一次高潮. 但是在实际应用 中, 如果在神经网络初始参数完全随机的情况下, BP 算法被证明在浅层神经网络中是有效的, 而对于更深 层网络效果不佳, 这是因为在 BP 算法中误差是反向 传播的, 对底层参数的影响较小, 也就是梯度弥散问 题. 而复杂问题往往需要更多的抽象, 自然会对应到 深层网络, 比如对自行车的图像识别来说, 通常需要
2 确定型无监督学习
2.1 自编码及稀疏自编码 自编码可以看作是一个特殊的 3 层 BP 神经网络,
特殊性体现在需要使得自编码网络的输入输出尽可能 近似, 即尽可能使得编码无损(能够从编码中还原出原 来的信息).
一个典型的自编码例子[15]如图 1 所示, 从可见层 到第一个隐含层的转换相当于是一个编码过程 (encoder), 从第一个隐含层到输出层相当于一个解码 过程(decoder). 自编码过程使用的一般都是无标签数 据, 输入数据(input data)经过第一层变换(encoder), 就
Abstract: Since 2006, Deep Neural Network has achieved huge access in the area of Big Data Processing and Artificial Intelligence, such as image/video discriminations and autopilot. And unsupervised learning methods as the methods getting success in the depth neural network pre training play an important role in deep learning. So, this paper attempts to make a brief introduction and analysis of unsupervised learning methods in deep learning, mainly includs two types, Auto-Encoders based on determination theory and Contrastive Divergence for Restrict Boltzmann Machine based on probability theory. Secondly, the applications of the two methods in Deep Learning are introduced. At last a brief summary and prospect of the challenges faced by unsupervised learning methods in Deep Neural Networks are made. Key words: auto-encoders; restrict boltzmann machine; unsupervised learning; deep learning; neural network
首先从像素中抽象出线条, 再抽象圆形, 再抽象出轮 子, 最后抽象出自行车, 事实上生物的脑神经系统的 确具有丰富的层次结构, 比如曾获得过诺贝尔医学和 生理学奖的 Hubel-Wiesel 模型. 与之相比, 浅层网络 往往难以达到理想效果, 这也导致单靠 BP 算法难以 在实际应用取得理想效果. 2006 年 Hinton 等人[3]提出 了用自学习初始化参数, 然后再逐步调优的方法来解 决深层网络的学习问题, 深层神经网络才开始受到重 视. 自此之后, 无监督的初始化学习方法和深度学习 的框架受到很多机器学习和人工智能领域的研究者广 泛学习和研究.
如今深度学习方法在许多应用中都取得了比较好 的效果, 但是却缺乏坚实的理论基础, 针对特定问题 需要多少层的神经网络, 每层神经网络需要多少个神 经单元, 都只有经验公式, 没有理论支撑. 深层网络 架构本身可以比浅层网络更简洁地表达复杂关系, 但 是深层架构的不可或缺性和无监督学习算法的必要性 还有待进一步论证. 不可否认的是, 作为构建深度学 习的重要方法, 无监督学习技术所起的作用是不容忽 视的. 无监督学习技术可以在没有标签的情况下自主 学习数据的抽象形式, 不仅拓展了学习的范围, 也为 神经网络提供了一个较优的初始化参数, 因此, 理解 和分析无监督学习技术的机理和方法, 对于理解和拓 展深度学习具有非常重要的意义.
相关文档
最新文档