深度学习基础理论

合集下载

深度学习的基本理论与方法_图文

• 限制波尔兹曼机（Restricted Boltzmann Machine）
• 定义：假设有一个二部图，同层节点之间没有链接，一层是可视层，即输入数据层（v)，一层是隐藏层(h)，如果假设所有的节点都是随机二值（ 0，1值）变量节点，同时假设全概率分布 p(v,h)满足Boltzmann 分布，我们称这个模型是Restricted BoltzmannMachine (RBM)。
• Deep Boltzmann Machine(DBM)
Deep Belief Networks是在靠近可视层的部分使用贝叶斯信念网络（即有向图模型），而在最远离可视层的部分使用Restricted Boltzmann Machine的模型。
• 卷积波尔兹曼机（Convolutional RBM）
深度学习的具体模型及方法
• 降噪自动编码器(Denoising AutoEncoders)
• 在自动编码器的基础上，对训练数据加入噪声，自动编码器必须学习去去除这种噪声而获得真正的没有被噪声污染过的输入。因此，这就迫使编码器去学习输入信号的更加鲁棒的表达，这也是它的泛化能力比一般编码器强的原因。
Inference: prediction, recognition
• 良好的特征表达，对最终算法的准确性起了非常关键的作用； • 识别系统主要的计算和测试工作耗时主要集中在特征提取部分； • 特征的样式目前一般都是人工设计的，靠人工提取特征。
动机——为什么要自动学习特征
• 实验：LP-β Multiple Kernel Learning
• 人脑视觉机理
人的视觉系统的信息处理是分级的
高层的特征是低层特征的组合，从低层到高层的特征表示越来越抽象，越来越能表现语义或者意图

深度学习理论与实践

深度学习理论与实践深度学习是人工智能领域的一项重要技术，通过构建具有多个隐层的神经网络，能够实现对大规模数据的高效处理和学习。

本文将介绍深度学习的理论基础及其在实践中的应用。

一、深度学习的理论基础深度学习的理论基础主要包括神经网络结构、损失函数和优化算法等方面。

1. 神经网络结构神经网络是深度学习的基础，它通过模拟人脑神经元的连接方式来实现对数据的处理和学习。

常见的深度学习网络结构包括前馈神经网络（Feedforward Neural Network）、卷积神经网络（Convolutional Neural Network）和循环神经网络（Recurrent Neural Network）等。

2. 损失函数损失函数是衡量模型预测结果与真实值之间差异的指标，通过最小化损失函数来优化模型。

常见的损失函数包括均方误差（Mean Squared Error）、交叉熵损失函数（Cross Entropy Loss）等。

3. 优化算法深度学习的优化算法用于更新模型参数，以减小损失函数的值。

常见的优化算法包括随机梯度下降（Stochastic Gradient Descent）、Adam 优化算法等。

二、深度学习在实践中的应用深度学习在各个领域都有广泛的应用，下面将以图像识别和自然语言处理为例介绍深度学习在实践中的应用。

1. 图像识别深度学习在图像识别领域取得了显著的成果。

通过构建深度卷积神经网络，可以实现对图像中的物体、场景等内容的自动识别和分类。

深度学习模型在大规模图像数据集上进行训练，并通过反向传播算法来更新网络参数，从而实现较高准确率的图像识别。

2. 自然语言处理深度学习在自然语言处理领域也有广泛应用。

通过构建深度循环神经网络等模型，可以实现对文本的情感分析、机器翻译、问答系统等任务。

深度学习模型在大规模文本数据集上进行训练，通过学习词语之间的语义关系来实现对文本的理解和处理。

三、深度学习的发展与挑战深度学习在过去几年取得了快速发展，但同时也面临着一些挑战。

“教、学、评”一体化的深度学习教学实践探究

“教、学、评”一体化的深度学习教学实践探究篇一“教、学、评”一体化的深度学习教学实践探究一、引言在当今的教育环境中，深度学习已经成为了教育改革的重要方向之一。

深度学习强调学生对知识的深度理解、应用和创新，而不仅仅是停留在表面的记忆。

为了更好地实现深度学习，我们需要将“教、学、评”三个环节有机地结合起来，形成一个完整的教学实践体系。

本文将探究“教、学、评”一体化的深度学习教学实践，以期为教育实践提供有益的参考。

二、“教、学、评”一体化的深度学习教学实践的理论基础深度学习理论：深度学习强调学生对知识的深度理解、应用和创新，需要学生在学习过程中积极主动地参与和思考。

教学设计理论：教学设计理论为“教、学、评”一体化的深度学习教学实践提供了理论支持和实践指导，是实现有效教学的重要手段。

评价理论：评价理论是实现“教、学、评”一体化的重要基础，通过对学生的学习过程和学习成果进行评价，可以更好地反馈学生的学习情况和教师的教学效果。

三、“教、学、评”一体化的深度学习教学实践的具体实施教学目标的设计：教师在设计教学目标时，应充分考虑学生的实际情况和学科特点，制定出具体、可操作的教学目标。

同时，教学目标应贯穿于整个教学过程，成为教学活动的导向。

教学内容的选择与组织：教学内容的选择应紧扣教学目标，注重知识的内在联系和逻辑关系。

教学内容的组织应遵循学生的认知规律，由浅入深、由易到难，逐步引导学生深入理解知识。

教学方法的选择与创新：教学方法的选择应根据教学目标和教学内容来确定。

在教学过程中，教师应注重启发式教学，引导学生主动思考和探究。

同时，教师还应积极探索新的教学方法和技术，以适应教育发展的需要。

学习方式的引导与培养：在深度学习的教学实践中，教师需要引导学生转变学习方式，培养学生的自主学习和合作学习能力。

教师应鼓励学生积极参与课堂讨论和合作学习，促进知识的交流和分享。

教学评价的实施与反馈：教学评价是“教、学、评”一体化深度学习教学实践的重要组成部分。

深度学习的理论基础和数据处理方法

深度学习的理论基础和数据处理方法近年来，深度学习已经成为计算机科学、人工智能领域的热点话题。

深度学习是指利用多层神经网络学习输入数据特征的机器学习方法，其成功应用已经涵盖了图像识别、自然语言处理、语音合成等多个领域。

深度学习的研究离不开理论基础和数据处理方法，下面我们探讨一下深度学习的这两个方面。

一、理论基础深度学习的理论基础主要来自于神经网络，而神经网络的理论基础则是统计学中的决策论。

决策论是指利用统计学方法对待处理数据的行为做出决策。

常见的统计学方法包括极大似然法、最小二乘法和贝叶斯方法等，这些方法大都与概率论有关。

在决策论中，设计一个能够最小化总体误差的算法是很常见的问题，而神经网络恰好是一种解决这种问题的算法。

神经网络在设计时考虑到了人类神经系统的结构，其基本单元为神经元。

神经元由多个输入端和一个输出端组成，其输出是某种激活函数的输出。

通常情况下，神经元的输入会被乘以相应的权重，然后加上一个偏置项，以作为其输出的函数输入。

当多个神经元组合成了一个网络时，其能够有效地接收和处理输入信息，从而输出预测结果。

如果将其与决策论相结合，就可以得到一种强大的预测算法。

由于神经网络的模型很容易变得非常复杂，这就需要损失函数来衡量网络输出结果之间的距离，从而将训练误差最小化。

最常见的损失函数是均方误差函数。

这个函数非常直观，就是计算实际输出和预测输出之间的误差平方和，而神经网络训练的目标就是将这个均方误差最小化。

我们知道，神经网络训练需要大量的数据来提高网络模型的预测准确率。

然而，现实数据往往具有很强的噪音和复杂性，这就要求处理这些数据的方法与模型具有足够的鲁棒性。

二、数据处理方法数据处理也是深度学习中不可忽视的一环。

在深度学习中，数据处理旨在将原始数据转化为模型能够接受并处理的输入数据格式。

如果数据处理不当，会影响后续模型的表现和预测准确率。

数据预处理可以包括对数据进行清洗、正则化、标准化等多个步骤。

深度学习的内涵及认知理论基础探析

深度学习的内涵及认知理论基础探析深度学习的内涵及认知理论基础探析近年来，深度学习在人工智能领域取得了突破性的进展，广泛应用于图像识别、语音识别、自然语言处理等多个领域。

深度学习的内涵涉及到神经网络、深度结构和学习算法等方面，同时也借鉴了认知心理学的理论基础。

本文将探讨深度学习的内涵及其与认知理论基础的关系。

深度学习是一种机器学习的方法，其核心是神经网络。

神经网络模型由多个层次的神经元组成，每个神经元通过学习自动调整权重和偏置值，从而使得模型能够实现对数据的抽象和表示。

深度学习中的“深度”指的是多层次的网络结构，每一层都包含多个神经元，通过前向传播和反向传播的方式进行学习和优化。

在深度学习的背后，有着认知心理学的理论支持。

认知心理学研究人类的认知过程和内在的心理机制，深度学习借鉴了认知心理学的一些基本原理和思想。

其中，认知认知理论是深度学习与认知心理学之间最为相关的理论之一。

认知认知理论提出了人们处理信息的方式，包括输入、存储、加工和输出。

深度学习通过神经网络的层次结构和神经元之间的连接方式模拟了这一认知过程。

每一层的神经元都可以看作是对输入信息的加工，并最终输出结果。

通过多层网络的组合，深度学习可以实现更复杂的信息加工和分类任务。

此外，深度学习中的激活函数也与认知认知理论相关。

激活函数是神经元的非线性映射，能够增加网络的表示能力。

认知认知理论认为人脑中神经元之间的连接和激活函数是非线性的，这样可以更好地处理复杂的信息。

深度学习中采用的常见激活函数，如sigmoid函数、ReLU函数等，也是为了增加网络的非线性能力。

此外，深度学习还应用了认知认知理论中的“分层处理”的思想。

认知心理学认为人类的认知过程是分层次进行的，从低层次的感知到高层次的抽象和规划。

深度学习中的多层次网络结构也可以看作是一种分层次的信息处理方式，通过底层的特征提取和高层次的语义关联，实现更复杂的任务。

总之，深度学习的内涵涉及到神经网络、深度结构和学习算法等方面，与认知心理学的认知认知理论有着紧密的关系。

深度学习基础(PPT36页)

CNN的优点
参数减少与权值共享如下图所示，如果我们有1000x1000（每个隐层神经元都连接图像的每一个像素点），就有 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 = 1 0 1 2个连接，也就是10^12个权值参数。
局部连接网络，每一个节点与上层节点同位置附近10x10的窗口相连接，则1百万个隐层神经元就只有 16 0100 18 0，即10^8个参数。其权值连接个数比原来减少了四个数量级。
深度学习可以通过学习一种深层非线性网络结构，实现复杂函数逼近，表征输入数据分布式表示，并展现了强大的从少数样本中集中学习数据及本质特征的能力。
深度学习的实质
通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。因此，“深度模型”是手段，“特征学习”是目的。
人脑的视觉机理
1981年的诺贝尔医学奖获得者 David Hubel和Torsten Wiesel发现了视觉系统的信息处理机制，他们发现了一种被称为“方向选择性细胞的神经元细胞，当瞳孔发现了眼前的物体的边缘，而且这个边缘指向某个方向时，这种神经元细胞就会活跃。
由此可知人的视觉系统的信息处理是分级的，高层的特征是低层特征的组合，从低层到高层的特征表示越来越抽象，越来越能表现语义或者意图，抽象层面越高，存在的可能猜测就越少，就越利于分类。
与神经网络的异同
深度学习与神经网络的异同
神经网络
深度学习
深度学习与神经网络的异同
相同点
二者均采用分层结构，系统包括输入层、隐层（多层）、输出层组成的多层网络，只有相邻层节点之间有连接，同一层以及跨层节点之间相互无连接，每一层可以看作是一个logistic 回归模型。

深度学习的基本原理和应用

深度学习的基本原理和应用一、深度学习的基本原理深度学习是一种通过模仿人脑神经网络的方式进行学习和处理数据的机器学习方法。

其基本的核心原理是通过多层次的神经网络，以及大量的数据进行训练，从而能够从数据中提取出特征信息并进行分类或预测。

1. 多层次神经网络深度学习的核心是多层次的神经网络，每一层神经元都能够接收前一层的输出信息，并将其转化为更为抽象的特征表示。

这些层次可以很深，甚至达到数十层，从而能够处理更为复杂的任务。

2. 特征提取深度学习的另一重要特点是自动特征提取。

在传统机器学习方法中，需要手动进行特征提取，而在深度学习中，神经网络会自动学习并提取数据的特征。

这样可以减少对人工特征提取的依赖，提高了数据处理的效率。

3. 数据训练深度学习需要大量的数据进行训练，这些数据分为训练数据、验证数据和测试数据。

通过反向传播算法，神经网络不断调整参数，使网络输出结果与实际结果更为接近。

二、深度学习的应用深度学习凭借其在图像处理、自然语言处理、语音识别等方面的优异表现，被广泛应用于各个领域。

1. 图像处理深度学习可以应用于图像分类和目标检测等任务。

例如，人脸识别、车辆识别等，深度学习能够对图像中的人脸或车辆进行自动识别分类。

2. 自然语言处理深度学习可以进行语言情感分类、文本分类、机器翻译等任务。

例如，深度学习可以应用于智能语音助手中，自动识别用户语音输入并转化为文字，再进行相关操作。

3. 语音识别深度学习可以应用于语音识别中，例如自动识别用户的语音输入、语音翻译等方面。

深度学习使用了不同类型的神经网络架构，如循环神经网络（RNN）和卷积神经网络（CNN），以提高语音识别的准确性。

三、深度学习的未来发展深度学习在人工智能领域中具有重要意义，其未来将继续发挥更为重要的作用。

随着深度学习技术的不断进步，其在图像处理、语音识别、自然语言处理等方面的应用领域将会不断扩大。

例如，深度学习可能支持更为智能化的医疗诊断、自动驾驶等系统的应用。

深度学习的理论与发展历程

深度学习的理论与发展历程深度学习是一种机器学习领域中的重要分支，它通过模拟人脑神经网络的结构和功能，实现了对大规模数据的自动分析和学习。

深度学习的发展可以追溯到上世纪50年代的人工智能研究，但直到最近几年才真正取得了突破性的进展。

本文将介绍深度学习的理论基础和其发展历程，以及对未来的展望。

一、深度学习的理论基础深度学习的理论基础可以追溯到神经网络的研究。

神经网络是一种受到生物神经系统启发的计算模型，它由一系列的神经元组成，通过神经元之间的连接和传递信息来实现学习和决策。

深度学习则是在神经网络的基础上进行了深化和扩展。

深度学习的核心概念是多层次的神经网络结构。

传统的神经网络只有一层或者少数几层神经元，而深度学习则拥有多层次的神经元结构。

这种多层次结构使得深度学习能够处理更加复杂和抽象的问题，从而提高了模型的表达能力和学习能力。

深度学习的另一个重要概念是反向传播算法。

反向传播算法是一种通过计算梯度来调整神经网络参数的方法，它能够有效地训练深度学习模型。

通过反向传播算法，深度学习模型可以根据输入数据和期望输出之间的差异来自动调整网络参数，从而实现对数据的准确分类和预测。

二、深度学习的发展历程深度学习的发展历程可以分为三个阶段：起步阶段、爆发阶段和应用阶段。

起步阶段始于上世纪50年代的感知机模型。

感知机是一种最早的神经网络模型，它由两层神经元组成，可以实现对输入数据的二分类。

然而，感知机模型的局限性限制了其在更复杂问题上的应用。

爆发阶段始于上世纪80年代的反向传播算法的提出。

反向传播算法的引入解决了训练深层神经网络的困难，使得深度学习模型的训练效果得到了显著提升。

此后，一系列的深度学习模型被提出，包括多层感知机、卷积神经网络和循环神经网络等。

这些模型在图像识别、自然语言处理等领域取得了重要的突破。

应用阶段始于近年来深度学习在各个领域的广泛应用。

深度学习模型在图像识别、语音识别、自然语言处理、推荐系统等领域取得了令人瞩目的成果。

深度学习的理论与实践

深度学习的理论与实践随着人工智能的迅速发展，深度学习作为其中的一个重要分支，成为了人们关注的焦点。

深度学习是一种模仿人脑神经细胞网络的机器学习技术，它的理论和实践具有重要性和挑战性。

一、理论基础深度学习的理论基础是神经网络。

神经网络的原理是模拟生物神经元的工作方式，通过输入和输出来学习数据。

一个神经元可以接收多个输入信号，每个输入信号有一个权重。

这些输入信号和权重的加权和通过一个激活函数并加上偏置项后，得到了神经元的输出。

在深度学习中，神经网络被扩展为多层结构。

这些层之间的每个神经元都与相邻层的所有神经元连接。

层与层之间的神经元可以有不同的功能，如卷积层、池化层、全连接层等。

二、实践技巧深度学习的实践技巧包括数据预处理、超参数调整、网络结构优化、正则化技术和模型集成等。

数据预处理是深度学习中非常重要的一步。

通常包括数据清洗、数据归一化、数据增强等技术。

超参数调整是指在训练深度学习模型时，需要手动调整的一些参数，如学习率、批量大小、迭代次数等。

合理的超参数设置可以提高深度学习模型的性能。

网络结构优化是指通过改变神经网络的结构来优化模型的性能。

通过增加或减少层数、神经元数量等参数，可以得到更有效的模型。

正则化技术是避免过度拟合的重要手段。

如L1、L2正则化、Dropout等技术可以一定程度上减轻模型过度拟合的问题。

模型集成可以提高模型的性能。

如将多个不同的深度学习模型结合起来，可以得到更好的效果。

三、深度学习的应用深度学习的应用非常广泛，包括计算机视觉、自然语言处理、语音识别、推荐系统等领域。

在计算机视觉中，深度学习可以用于图像分类、物体检测、人脸识别等任务。

在自然语言处理中，深度学习可以用于机器翻译、文本分类、情感分析等任务。

在语音识别中，深度学习可以用于语音识别、语音合成等任务。

在推荐系统中，深度学习可以用于推荐商品、推荐音乐等任务。

总之，深度学习是一项极具前景的技术，它可以提高计算机处理数据的能力和效率。

细说PyTorch深度学习：理论、算法、模型与编程实现

目录分析
书籍目录是书籍的骨架，它决定了读者对书籍内容的初步认识和了解。下面是对《细说PyTorch深度学习：理论、算法、模型与编程实现》这本书的目录进行详细分析。
该书的目录结构清晰，层次分明，为读者提供了一个直观且易于理解的阅读路线。全书共分为四个部分，分别是基础篇、进阶篇、实践篇和拓展篇。每个部分都针对不同的主题进行了详细的阐述，为读者提供了从基础知识到实践应用的全过程指导。
《细说PyTorch深度学习：理论、算法、模型与编程实现》是一本全面介绍PyTorch深度学习的书籍，既适合初学者入门，也适合有一定经验的读者深入学习。通过阅读本书，读者可以深入了解深度学习的基本理论、算法、模型以及编程实现，提高自己的深度学习水平。
精彩摘录
《细说PyTorch深度学习：理论、算法、模型与编程实现》精彩摘录
在的浩瀚海洋中，深度学习犹如一艘高速航行的航船，引领着我们探索未知的领域。而PyTorch，作为一个广受欢迎的深度学习框架，为研究者们提供了一个强大的平台，帮助我们在这片广阔的海洋中乘风破浪。
在《细说PyTorch深度学习：理论、算法、模型与编程实现》这本书中，作者深入浅出地讲解了PyTorch深度学习的方方面面，从理论到实践，从算法到模型，从编程基础到高级应用。这本书不仅适合初学者入门，也适合资深研究者深入探讨。
在基础篇中，作者从深度学习的基本概念入手，介绍了PyTorch的基本操作和核心组件。这一部分的内容主要包括PyTorch的安装配置、张量计算、神经网络构建、优化器和损失函数等基础知识。这些内容对于初学者来说非常友好，可以帮助他们快速上手PyTorch并理解深度学习的基本原理。
在进阶篇中，作者深入探讨了一些高级主题，如深度学习中的梯度消失和爆炸问题、模型正则化、过拟合处理等。还介绍了PyTorch的一些高级特性，如动态计算图、自定义层和模型等。这些内容可以帮助读者更深入地理解深度学习的内在机制，并提升他们的模型设计和优化能力。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

19
Sparse Coding稀疏编码
20
Sparse Coding稀疏编码
• Sparse coding分为两个部分：
1）Training阶段：
给定一系列的样本图片[x1, x 2, „]，我们需要学习得到一组基[Φ 1, Φ 2, „]，也就是字典。训练过程就是一个重复迭代的过程，交替更改a和Φ使得下面这个目标函数最小。
21
Sparse Coding稀疏编码
• 2）Coding阶段：
给定一个新的图片x，由上面得到的字典，通过解一个LASSO问题得到稀疏向量a。这个稀疏向量就是这个输入向量x的一个稀疏表达了。
22
深度学习的常用模型
• 3、Restricted Boltzmann Machine (RBM)限制波尔兹曼机 • 4、Deep Belief Networks深信度网络 • 5、Convolutional Neural Networks卷积神经网络
8
关于特征
在不同对象上做训练时，所得的边缘基底是非常相似的，但对象部分和模型就会完全不同了。
9
关于特征
4、需要有多少个特征
我们知道需要层次的特征构建，由浅入深，但每一层该有多少个特征呢？
10
深度学习思想
• 对堆叠多个层，也就是说这一层的输出作为下一层的输入。通过这种方式，并且使得输入与输出的差别尽可能地小，就可以实现对输入信息进行分级表达了。 • 深度学习的实质，是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。因此，“深度模型”是手段，“特征学习”是目的。
深度学习入门理论
1
主要内容
1 2
人脑视觉机理关于特征
3
4 5
深度学习思想
训练过程常用模型
2ห้องสมุดไป่ตู้
人脑视觉机理
人的视觉系统的信息处理是分级的，神经-中枢-大脑的工作过程是一个不断迭代、不断抽象的过程。
3
目前我们通过机器学习去解决这些问题的思路都是这样的（以视觉感知为例）：
4
关于特征
特征是机器学习系统的原材料。如果数据被很好的表达成了特征，通常线性模型就能达到满意的精度。对于特征，我们需要考虑四个方面： 1、特征表示的粒度 2、初级（浅层）特征表示 3、结构性特征表示 4、需要有多少个特征
• • • •
5
关于特征
1、特征表示的粒度
学习算法在一个什么粒度上的特征表示，才有能发挥作用？
6
关于特征
2、初级（浅层）特征表示
像素级的特征表示方法没有作用，那怎样的表示才有用呢？
7
关于特征
3、结构性特征表示
小块的图形可以由基本edge构成，更结构化，更复杂的，具有概念性的图形如何表示呢？
14
AutoEncoder自动编码器
• 2）通过编码器产生特征，然后训练下一层。这样逐层训练：
将第一层输出的code当成第二层的输入信号，同样最小化重构误差，就会得到第二层的参数，并且得到第二层输出的code，也就是原输入信息的第二个表达了。其他层就用同样的方法炮制。
15
AutoEncoder自动编码器
• 3）有监督微调：到这里，这个AutoEncoder还不能用来分类数据，可以在AutoEncoder的最顶的编码层添加一个分类器，然后通过标准的多层神经网络的监督训练方法（梯度下降法）去训练。微调分为两种，一个是只调整分类器（黑色部分）：
16
AutoEncoder自动编码器
• 另一种：通过有标签样本，微调整个系统：
12
深度学习的常用模型
• 1、AutoEncoder自动编码器
• 自动编码器就是一种尽可能复现输入信号的神经网络。具体过程简单的说明如下： • 1）给定无标签数据，用非监督学习学习特征：
13
AutoEncoder自动编码器
通过调整encoder和decoder的参数，使得重构误差最小，这时候我们就得到了输入input信号的第一个表示了，也就是编码code了。因为是无标签数据，所以误差的来源就是直接重构后与原输入相比得到。
18
深度学习的常用模型
• 2、Sparse Coding稀疏编码
• 将一个信号表示为一组基的线性组合，而且要求只需要较少的几个基就可以将信号表示出来。 • 稀疏编码算法是一种无监督学习方法，它用来寻找一组 “超完备”基向量来更高效地表示样本数据。
目标函数： Min |I – O| + u*(|a1| + |a2| + … + |an |)
11
深度学习训练过程
• 1）使用自下上升非监督学习
从底层开始，一层一层的往顶层训练，采用无标定数据（有标定数据也可）分层训练各层参数。
• 2）自顶向下的监督学习
就是通过带标签的数据去训练，误差自顶向下传输，对网络进行微调，基于第一步得到的各层参数进一步微调整个多层模型的参数，这一步是一个有监督训练过程
在研究中可以发现，如果在原有的特征中加入这些自动学习得到的特征可以大大提高精确度，甚至在分类问题中比目前最好的分类算法效果还要好！
17
AutoEncoder自动编码器
• AutoEncoder存在的一些变体：
• a）Sparse AutoEncoder稀疏自动编码器 • b）Denoising AutoEncoders降噪自动编码器
23
24