深度学习之自动编码器总结_20160216

合集下载

堆叠自动编码器的深度学习理论解读(Ⅱ)

深度学习技术是人工智能领域的热点之一，而堆叠自动编码器（stacked autoencoder）是深度学习中的一种重要模型。

本文将对堆叠自动编码器的深度学习理论进行解读。

一、自动编码器的基本原理自动编码器是一种无监督学习的神经网络模型，其基本原理是将输入数据进行编码和解码，通过最小化重构误差来学习输入数据的有效表示。

堆叠自动编码器是将多个自动编码器层叠在一起，形成深层网络结构。

自动编码器包括编码器和解码器两部分。

编码器将输入数据映射到隐藏层表示，而解码器则将隐藏层表示映射回输入空间。

这样，自动编码器可以学习到输入数据的有效表示，并且可以用于特征提取和降维。

二、堆叠自动编码器的结构堆叠自动编码器由多个自动编码器组成，每个自动编码器的输出作为下一个自动编码器的输入。

这样，堆叠自动编码器可以学习多层次的特征表示，从而提高模型的表达能力。

在堆叠自动编码器中，每个自动编码器可以看作是对数据进行一次非线性变换。

通过堆叠多个非线性变换，可以学习到更加复杂的数据表示。

这种逐层训练的方式可以有效地解决深层神经网络训练中的梯度消失和梯度爆炸等问题。

三、堆叠自动编码器的训练方法堆叠自动编码器的训练方法通常采用逐层训练的方式。

首先，对每个自动编码器进行单独训练，得到每一层的参数。

然后，将每个自动编码器的编码器部分作为下一层自动编码器的输入，重新进行训练。

通过多次迭代训练，可以得到一个深层的堆叠自动编码器模型。

在训练过程中，通常采用无监督的训练方法，即通过最小化重构误差来学习数据的表示。

同时，为了避免过拟合，可以采用正则化技术或者添加噪声的方式来增加模型的泛化能力。

四、堆叠自动编码器的应用堆叠自动编码器在深度学习中有着广泛的应用。

首先，堆叠自动编码器可以用于特征提取和降维，可以学习到数据的高阶特征表示，从而提高模型的分类性能。

其次，堆叠自动编码器还可以用于生成模型，可以学习到数据的分布，并且可以生成与原始数据类似的新样本。

如何利用自动编码器进行异常检测的深度学习方法(五)

在当今信息爆炸的社会中，随着大数据技术和深度学习算法的快速发展，异常检测在各个领域中变得越来越重要。

自动编码器作为一种深度学习方法，在异常检测中发挥着重要作用。

本文将探讨如何利用自动编码器进行异常检测的深度学习方法。

首先，让我们来了解一下自动编码器的基本原理。

自动编码器是一种无监督学习算法，其目标是将输入数据进行编码和解码，从而使得解码后的数据与原始输入数据尽可能接近。

自动编码器由编码器和解码器两部分组成，编码器将输入数据映射到潜在空间中，而解码器则将潜在空间中的数据映射回原始数据空间。

通过训练自动编码器，我们可以得到一个学习到的数据表示，这个表示可以用来重构输入数据，同时也可以用来进行异常检测。

在异常检测中，我们可以利用自动编码器的重构误差来判断输入数据是否为异常。

具体来说，我们可以计算输入数据经过自动编码器重构后的误差，如果这个误差超过了一个阈值，我们就可以将这个输入数据标记为异常。

这种基于重构误差的异常检测方法在实际应用中表现出了较好的效果。

除了基于重构误差的方法，我们还可以利用自动编码器的编码部分来进行异常检测。

具体来说，我们可以将输入数据通过编码器映射到潜在空间中，然后利用潜在空间中的数据表示来进行异常检测。

在潜在空间中，我们可以利用聚类或者密度估计等方法来发现异常数据点。

这种基于潜在空间的异常检测方法在处理高维数据时表现出了较好的效果。

另外，自动编码器还可以与其他深度学习模型相结合，从而提高异常检测的性能。

例如，我们可以将自动编码器与卷积神经网络（CNN）结合起来，利用CNN 对输入数据进行特征提取，然后再利用自动编码器对提取的特征进行编码和解码。

这样的结合可以充分发挥各自模型的优势，从而提高异常检测的准确性和鲁棒性。

总之，利用自动编码器进行异常检测的深度学习方法具有较好的效果和广阔的应用前景。

通过深入理解自动编码器的原理和特点，我们可以设计出更加有效的异常检测算法，从而在各个领域中发挥重要作用。

如何利用自动编码器进行异常检测的深度学习方法(Ⅱ)

深度学习技术的发展为异常检测提供了全新的可能性，其中自动编码器作为一种无监督学习的深度学习模型，被广泛应用于异常检测领域。

本文将介绍如何利用自动编码器进行异常检测的深度学习方法，并探讨其在实际应用中的优势和挑战。

一、自动编码器概述自动编码器是一种用于学习数据表示的神经网络模型，其基本结构包括编码器和解码器两部分。

编码器将输入数据映射到潜在空间中的低维表示，而解码器则将低维表示映射回原始数据空间。

通过训练自动编码器，可以学习到数据的高度抽象的表示，这对于异常检测具有重要意义。

二、深度学习在异常检测中的应用传统的异常检测方法通常依赖于特征工程和手工设计的规则，面对复杂的数据分布和高维度的特征空间时，往往难以取得良好的效果。

深度学习技术的出现为异常检测带来了新的希望，其优势在于可以自动从数据中学习到高层次的特征表示，避免了对特征工程的依赖，同时能够处理高维度、非线性和大规模的数据。

三、自动编码器在异常检测中的应用自动编码器作为一种无监督学习的深度学习模型，可以有效地学习到数据的复杂特征表示，因此在异常检测中得到了广泛的应用。

通过训练自动编码器，我们可以从正常数据中学习到其特征表示，然后利用学习到的表示对新的数据进行重构，如果重构误差超过设定的阈值，则可以将其视为异常数据。

四、深度自动编码器在异常检测中的优势相比传统的基于规则和特征工程的异常检测方法，基于深度学习的自动编码器方法具有以下优势：1. 能够学习到数据的高阶特征表示，对于复杂的数据分布具有更好的适应性；2. 无需依赖于手工设计的特征工程，避免了人工选择特征的主观性和局限性；3. 能够处理高维度、非线性和大规模的数据，适用于各种类型的异常检测问题。

五、深度自动编码器在异常检测中的挑战尽管深度自动编码器在异常检测中具有诸多优势，但在实际应用中也面临一些挑战：1. 训练深度自动编码器需要大量的标记数据，而在异常检测问题中通常只有少量的异常数据，这对于训练深度自动编码器提出了较高的要求；2. 深度自动编码器容易受到过拟合的影响，需要仔细设计模型结构和训练策略，避免模型过度拟合正常数据；3. 对于时间序列数据和非平稳数据，深度自动编码器的性能可能会受到一定的影响，需要进一步研究和改进。

如何使用自动编码器进行序列预测的深度学习方法(六)

在深度学习领域，自动编码器是一种常见的神经网络模型，用于无监督学习和特征提取。

自动编码器的一个重要应用是序列预测，即给定一系列输入数据，预测后续的数据。

在本文中，我们将讨论如何使用自动编码器进行序列预测的深度学习方法。

首先，我们需要了解自动编码器的基本原理。

自动编码器是一种由编码器和解码器组成的神经网络结构。

编码器将输入数据映射到一个低维的表示，而解码器则将这个低维表示映射回原始的输入数据。

通过这种方式，自动编码器可以学习输入数据的有效特征表示。

在序列预测任务中，我们可以将自动编码器应用为递归神经网络（RNN）的一种变种。

RNN是一种专门用于处理序列数据的神经网络结构，它具有记忆和时间依赖性。

通过将自动编码器与RNN相结合，我们可以实现对序列数据的有效建模和预测。

其次，我们需要确定适当的网络结构和参数设置。

在使用自动编码器进行序列预测时，我们需要考虑输入数据的维度、编码器和解码器的层数、隐藏单元的数量等因素。

此外，我们还需要选择合适的损失函数和优化算法，以便有效地训练模型并获得良好的预测性能。

接下来，我们将介绍一种常见的深度学习方法，即基于LSTM（长短期记忆）的自动编码器。

LSTM是一种特殊的RNN结构，它能够有效地捕捉序列数据中的长期依赖关系。

通过将LSTM与自动编码器相结合，我们可以实现对序列数据的有效建模和预测。

在实际应用中，我们可以使用基于LSTM的自动编码器来处理各种类型的序列数据，如时间序列数据、自然语言文本、音频信号等。

通过适当的数据预处理和特征工程，我们可以将原始的序列数据转换为适合模型输入的格式，并进行有效的训练和预测。

最后，我们需要进行模型的评估和调优。

在使用自动编码器进行序列预测时，我们需要对模型进行充分的评估和验证，以确保其具有良好的泛化能力和预测性能。

此外，我们还可以通过调整模型的超参数、正则化和集成学习等方法来进一步提高模型的性能。

综上所述，使用自动编码器进行序列预测是一种有效的深度学习方法。

自动编码器的基本原理解析(八)

自动编码器的基本原理解析自动编码器（Autoencoder）是一种神经网络模型，它具有将输入数据进行编码和解码的能力，通过编码和解码过程，自动编码器可以学习如何从输入数据中提取有用的信息。

自动编码器的基本原理包括编码器、解码器和损失函数等部分，下面将对自动编码器的基本原理进行解析。

一、编码器编码器是自动编码器的第一部分，它负责将输入数据进行压缩和提取特征，得到编码后的表示。

编码器通常由多层神经网络组成，每一层都包括多个神经元，每个神经元将输入数据进行线性组合和非线性变换，得到新的表示。

通过多层编码器的处理，输入数据将被压缩成更低维度的表示，这种表示可以捕捉输入数据的重要特征。

在编码器的训练过程中，目标是使得编码后的表示能够尽可能地保留输入数据的信息，并且具有一定的鲁棒性。

为了实现这一目标，编码器的参数需要通过反向传播算法进行优化，使得编码后的表示能够最大程度地减少输入数据的重构误差。

通过这种方式，编码器可以学习如何将输入数据进行有效的压缩和特征提取。

二、解码器解码器是自动编码器的第二部分，它负责将编码后的表示进行解码和重构，得到与输入数据尽可能相似的输出。

解码器也通常由多层神经网络组成，每一层都包括多个神经元，每个神经元将编码后的表示进行线性组合和非线性变换，得到重构后的表示。

通过多层解码器的处理，编码后的表示将被扩展成与输入数据相同维度的表示，这种表示可以代表编码后的信息的重构。

在解码器的训练过程中，目标是使得输出数据能够尽可能地接近输入数据，并且具有一定的平滑性。

为了实现这一目标，解码器的参数也需要通过反向传播算法进行优化，使得输出数据能够最大程度地减少与输入数据的重构误差。

通过这种方式，解码器可以学习如何将编码后的表示进行有效的重构和信息扩展。

三、损失函数损失函数是自动编码器的训练过程中使用的一种评价指标，它用于衡量编码后的表示与输入数据的重构误差。

常用的损失函数包括均方误差（MSE）和交叉熵（Cross Entropy）等，它们可以衡量编码后的表示与输入数据之间的差异程度。

探索使用深度学习和自动编码器改进代码生成

探索使用深度学习和自动编码器改进代码生成近年来深度学习在各个领域中取得了重大突破，其中之一就是在代码生成方面的应用。

代码生成是指利用机器学习算法生成程序代码的过程，它可以帮助开发人员更高效地创建软件系统。

在传统的代码生成方法中，常常需要人工编写规则和模板，然而这种方法通常不具备通用性和灵活性。

深度学习通过学习大量的代码示例，可以从中发现隐藏的模式和规则，并生成符合预期的代码。

其中一种常用的深度学习模型是自动编码器（autoencoder）。

自动编码器是一种无监督学习模型，它通过学习将输入数据编码为潜在空间中的稠密表示，并通过解码器将其重构为原始数据。

自动编码器由编码器和解码器两部分组成，它们可以被训练成一种能够压缩和重构数据的模型。

通过将自动编码器应用于代码生成，可以将代码转换为潜在空间中的表示，并通过解码器生成新的代码。

使用自动编码器进行代码生成的好处之一是可以生成具有语法正确性的代码。

自动编码器在训练过程中学习了输入代码的分布特征，并可以生成符合这些特征的新代码。

因此，生成的代码通常具有较高的语法正确性。

此外，自动编码器还可以用于代码变换和代码缺陷检测。

通过在潜在空间中对代码进行操作和修改，可以生成具有不同功能或风格的新代码。

例如，可以将自动编码器用于代码风格转换，将一种编程语言的代码转换为另一种编程语言的代码。

同时，自动编码器可以被用于检测代码中的异常或错误。

通过比较输入代码和重构代码的差异，可以识别可能存在的缺陷和错误。

在实际应用中，可以使用大规模的代码库来训练自动编码器。

通过输入大量的代码示例，自动编码器可以学习到代码的常见模式和规则。

然后，可以通过采样和修改潜在向量来生成新的代码。

生成的代码可以被用于创建新的软件系统、增加代码的多样性和可读性，或者用于代码的重构和维护。

然而，自动编码器在代码生成中也存在一些挑战和限制。

首先，生成的代码可能会存在一定的语义错误。

尽管自动编码器可以生成符合语法的代码，但它并不能理解代码的语义含义。

堆叠自动编码器的深度学习理论解读

深度学习理论解读：堆叠自动编码器深度学习是一种机器学习方法，其目标是通过模拟人类大脑的神经网络结构来实现对复杂数据的学习和理解。

深度学习的核心是神经网络，而神经网络中的自动编码器是一种重要的结构，堆叠自动编码器则是深度学习中的关键技术之一。

本文将对堆叠自动编码器的深度学习理论进行解读。

自动编码器是一种无监督学习算法，其主要目标是学习数据的稳健表示。

自动编码器通过将输入信号转换成一种稳健的编码表示，然后再将这种编码表示解码成原始输入信号。

自动编码器的结构包括编码器和解码器两部分，编码器将输入信号映射到编码表示，解码器将编码表示映射回原始输入。

通过训练自动编码器，可以学习到输入信号的有效表示，这对于数据的降维和特征提取非常有用。

堆叠自动编码器是一种多层的自动编码器结构，其主要特点是将多个自动编码器堆叠在一起形成深层网络。

堆叠自动编码器通常包括多个隐藏层，每个隐藏层都是一个自动编码器。

通过训练堆叠自动编码器，可以学习到更加复杂和抽象的表示，从而提高数据的表达能力和学习能力。

堆叠自动编码器的训练过程通常采用无监督学习方法，即不需要标注数据。

训练过程可以分为两个阶段：首先，对每个单独的自动编码器进行预训练，然后将这些预训练好的自动编码器组合成一个深层网络，在整体上进行微调。

预训练阶段通常使用无监督的逐层训练方法，即逐层地训练每个隐藏层的自动编码器，然后将其参数固定，再训练下一层的自动编码器。

这样逐层预训练的方法可以有效地解决深层网络训练过程中的梯度消失和梯度爆炸等问题，从而提高训练的稳定性和收敛速度。

堆叠自动编码器在深度学习中扮演着重要的角色，它具有以下几个优点。

首先，堆叠自动编码器可以学习到更加深层次的数据表示，从而提高数据的抽象能力和表达能力。

其次，堆叠自动编码器可以有效地解决深层网络训练过程中的梯度消失和梯度爆炸等问题，从而提高训练的稳定性和收敛速度。

此外，堆叠自动编码器还可以进行无监督学习，即在没有标注数据的情况下进行特征学习和表示学习，这对于大规模数据的处理非常有用。

自动编码器与卷积神经网络的比较分析(五)

自动编码器与卷积神经网络的比较分析引言自动编码器和卷积神经网络都是深度学习领域中常用的模型，它们在图像处理、语音识别和自然语言处理等方面都有着广泛的应用。

本文将从网络结构、训练方式、应用领域等方面对自动编码器和卷积神经网络进行比较分析，以期能够更深入地了解它们的优缺点和适用场景。

网络结构自动编码器是一种用于学习数据有效表示的神经网络模型，它由编码器和解码器组成。

编码器将输入数据映射到隐藏层表示，解码器则将隐藏层表示映射回原始输入。

自动编码器的目标是最小化重构误差，即输入与解码器输出之间的差异。

相比之下，卷积神经网络是一种专门用于处理具有网格结构数据（如图像）的神经网络模型。

它通过卷积操作和池化操作提取图像的特征，并通过全连接层进行分类或回归。

训练方式自动编码器的训练通常采用无监督学习的方式，即不需要标注数据。

其训练过程是通过最小化输入与输出之间的差异来学习数据的表示。

卷积神经网络的训练通常采用监督学习的方式，即需要标注数据。

其训练过程是通过最小化预测值与真实标签之间的差异来学习数据的特征。

应用领域自动编码器在特征学习、降维和生成模型等方面有着广泛的应用。

它可以用于图像去噪、图像超分辨率、图像生成等任务。

卷积神经网络在图像分类、目标检测、语义分割等方面有着广泛的应用。

它可以用于识别图像中的物体、分割图像中的物体等任务。

优缺点分析自动编码器的优点在于可以学习数据的有效表示，具有较强的特征提取能力。

然而，它的缺点在于训练过程容易陷入局部最优解，且对输入数据的噪声敏感。

卷积神经网络的优点在于具有较强的特征提取能力和对输入数据的鲁棒性。

然而，它的缺点在于需要大量的标注数据进行训练，且对图像的平移、旋转等变换敏感。

结论自动编码器和卷积神经网络在网络结构、训练方式、应用领域等方面有着不同的特点和适用场景。

在实际应用中，需要根据具体的任务和数据特点来选择合适的模型。

希望本文的比较分析能够帮助读者更好地理解自动编码器和卷积神经网络，并在实际应用中做出合理的选择。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

rand：
生成均匀分布的伪随机数。分布在（0~1）之间
主要语法：rand(m,n)生成m行n列的均匀分布的伪随机数
rand(m,n,'double')生成指定精度的均匀分布的伪随机数，参数还可以是'single'
rand(RandStream,m,n)利用指定的RandStream(我理解为随机种子)生成伪随机数
最后的W1的权值如下所示：
2.
根据代码中的sparseAutoencoderCost模块进行说明。
%将长向量转换成每一层的权值矩阵和偏置向量值；将theta中的数据赋值给w1，w2，b1，b2，这些矩阵的维度与其初始维度相同。
W1 =reshape(theta(1:hiddenSize*visibleSiபைடு நூலகம்e),hiddenSize,visibleSize);
b2 =theta(2*hiddenSize*visibleSize+hiddenSize+1:end);
% Costandgradient variables (your code needstocompute these values).
%Here, we initialize themtozeros.
b1grad = (1/m)*b1grad;%注意b的偏导是一个向量，所以这里应该把每一行的值累加起来
%计算b2grad
b2grad = b2grad+sum(d3,2);
b2grad = (1/m)*b2grad;
3.
3.1
%% CS294A/CS294W Programming Assignment Starter Code
%损失函数的总表达式 ;
%其中是代价函数
cost =Jcost+lambda*Jweight+beta*Jsparse;%cost等于
%******************************
%以上部分为进行前向计算的内容，以下部分实施反向传播
%反向算法求出每个节点的误差值
d3 =-(data-a3).*sigmoidInv(z3);%输出层；
%
%计算预测产生的误差
Jcost= (0.5/m)*sum(sum((a3-data).^2));%
%计算权值惩罚项，即权值衰减项
Jweight= (1/2)*(sum(sum(W1.^2))+sum(sum(W2.^2)));%
%计算稀释性规则项; a2的取值为10000个64位的值，每个64位的值是一个8*8图像的像素值；
cost=0;
W1grad =zeros(size(W1));
W2grad =zeros(size(W2));
b1grad =zeros(size(b1));
b2grad =zeros(size(b2));
Jcost=0;%直接误差
Jweight=0;%权值惩罚
Jsparse=0;%稀疏性惩罚
[n m] = size(data);%m为样本的个数，n为样本的特征数
repmat:
该函数是扩展一个矩阵并把原来矩阵中的数据复制进去。比如说B =repmat(A,m,n)，就是创建一个矩阵B，B中复制了共m*n个A矩阵，因此B矩阵的大小为[size(A,1)*m size(A,2)*m]。
使用函数句柄的作用：
不使用函数句柄的情况下，对函数多次调用，每次都要为该函数进行全面的路径搜索，直接影响计算速度，借助句柄可以完全避免这种时间损耗。也就是直接指定了函数的指针。函数句柄就像一个函数的名字，有点类似于C++程序中的引用。
一些malab函数：
bsxfun:
C=bsxfun(fun,A,B)表达的是两个数组A和B间元素的二值操作，fun是函数句柄或者m文件，或者是内嵌的函数。在实际使用过程中fun有很多选择比如说加，减等，前面需要使用符号’@’.一般情况下A和B需要尺寸大小相同，如果不相同的话，则只能有一个维度不同，同时A和B中在该维度处必须有一个的维度为1。比如说bsxfun(@minus, A, mean(A))，其中A和mean(A)的大小是不同的，这里的意思需要先将mean(A)扩充到和A大小相同，然后用A的每个元素减去扩充后的mean(A)对应元素的值。
深度学习之自动编码器
1.
1.1
实现自动便器的功能，除了本文档代码章节所列出的代码以外，还需要IMAGES.mat文件和minFunc功能模块。minFunc功能模块用于实现L-BFGS算法。具体算法可参看以下网址的文档：
/wiki/index.php/UFLDL教程
exist:
测试参数是否存在，比如说exist('opt_normalize', 'var')表示检测变量opt_normalize是否存在，其中的’var’表示变量的意思。
colormap:
设置当前常见的颜色值表。
floor：
floor(A):取不大于A的最大整数。
ceil:
ceil(A):取不小于A的最小整数。
实验基础：
其实实现该功能的主要步骤还是需要计算出网络的损失函数以及其偏导数，具体的公式可以参考前面的博文Deep learning：八(Sparse Autoencoder)。下面用简单的语言大概介绍下这个步骤，方便大家理清算法的流程。
1.计算出网络每个节点的输入值（即程序中的z值）和输出值（即程序中的a值，a是z的sigmoid函数值）。
%计算W1grad
W1grad = W1grad+d2*data';
W1grad = (1/m)*W1grad+lambda*W1;
%计算W2grad
W2grad = W2grad+d3*a2';%
%
W2grad = (1/m).*W2grad+lambda*W2;
%
%计算b1grad
b1grad = b1grad+sum(d2,2);
%% STEP 0: Here we provide the relevant parameters values that will
% allowyour sparseautoencoderto get good filters; you do not need to
randn：
生成标准正态分布的伪随机数（均值为0，方差为1）。主要语法：和上面一样
randi：
生成均匀分布的伪随机整数
主要语法：randi（iMax）在闭区间（0，iMax）生成均匀分布的伪随机整数
randi（iMax，m，n）在闭区间（0，iMax）生成mXn型随机矩阵
r =randi([iMin,iMax],m,n)在闭区间（iMin，iMax）生成mXn型随机矩阵
/wiki/index.php/UFLDL_Tutorial
代码中的checkNumericalGradient模块用于验证数值计算的梯度和解析法计算的梯度值之间的差距，不用于实现自动编码器的功能，可以不运行。
Train.m模块是整个自动编码器运行的顶层代码和框架；
实验流程：
首先运行主程序train.m中的步骤1，即随机采样出10000个小的patch，并且显示出其中的204个patch图像，图像显示如下所示：
然后运行train.m中的步骤2和步骤3，进行损失函数和梯度函数的计算并验证。进行gradient checking的时间可能会太长，我这里大概用了1个半小时以上（反正1个多小时还没checking完，所以去睡觉了），当用gradient checking时，发现误差只有6.5101e-11，远小于1e-9，所以说明前面的损失函数和偏导函数程序是对的。后面就可以接着用优化算法来求参数了，本程序给的是优化算法是L-BFGS。经过几分钟的优化，就出结果了。
%sum(a2,2)计算出a2矩阵中10000个64位的值中，每组64位值的和。
%
rho= (1/m).*sum(a2,2);%求出第一个隐含层的平均值向量
Jsparse=sum(sparsityParam.*log(sparsityParam./rho)+ ...
(1-sparsityParam).*log((1-sparsityParam)./(1-rho)));%
W2 =reshape(theta(hiddenSize*visibleSize+1:2*hiddenSize*visibleSize),visibleSize,hiddenSize);
b1 =theta(2*hiddenSize*visibleSize+1:2*hiddenSize*visibleSize+hiddenSize);
%其它层的统一计算公式为：
sterm= beta*(-sparsityParam./rho+(1-sparsityParam)./(1-rho));%因为加入了稀疏规则项，所以
%计算偏导时需要引入该项，即
d2 = (W2'*d3+repmat(sterm,1,m)).*sigmoidInv(z2);%
% Instructions
% %This file contains code that helps you get started on the
% programmingassignment. You will need to complete the code insampleIMAGES.m,
imagesc:
imagesc和image类似，可以用于显示图像。比如imagesc(array,'EraseMode','none',[-1 1])，这里的意思是将array中的数据线性映射到[-1,1]之间，然后使用当前设置的颜色表进行显示。此时的[-1,1]充满了整个颜色表。背景擦除模式设置为node，表示不擦除背景。