基于深度学习的头部姿态估计
头部姿态估计算法

如何实现精准头部姿态估计算法头部姿态估计算法是计算机视觉领域中一个重要的分支,主要用于实现人脸识别、动作捕捉、交互式游戏等应用。
本文将介绍实现精准头部姿态估计算法的关键步骤和技术要点。
首先,要获取头部姿态估计所需的图像数据。
传统方法是使用RGB 相机拍摄人脸图像,但是此方法容易受到光线、角度等因素的影响,导致精度不高。
为此,近年来出现了通过用红外线获取深度信息的3D 相机,可以更准确地获取人脸三维形态数据。
其次,要通过计算机视觉技术进行姿态估计。
常用的方法有基于特征点和神经网络的方法。
特征点方法是先通过机器学习算法训练一组特征点,然后提取人脸图像中的特征点,通过特征点的位置变化计算头部的姿态。
神经网络方法是通过深度学习技术构建一个神经网络模型,直接输出头部的三维旋转角度。
两种方法各有优缺点,根据实际情况进行选择。
最后,要进行姿态的调整和优化。
由于姿态估计算法的精度有限,为了提高精度,需要通过一些手段进行姿态的调整和优化。
常用的方法有姿态预测、滤波和反馈控制等。
综上所述,实现精准头部姿态估计算法需要充分考虑数据获取、算法选择和姿态优化等关键因素。
有了这些技术支持,我们可以更准确地捕捉人体动作特征,为各种应用场景提供更加优质的用户体验。
一种基于深度学习的头部姿态估计模型

一种基于深度学习的头部姿态估计模型
刘亚飞;王敬东;刘法;林思玉
【期刊名称】《计算机与数字工程》
【年(卷),期】2022(50)2
【摘要】针对传统头部姿态估计网络存在空间结构信息易丢失问题,论文提出一种将胶囊网络与传统卷积神经网络相结合的头部姿态估计网络模型。
该模型采用具有多级输出结构的传统卷积神经网络,将不同层级的空间结构信息和语义信息进行提取,同时利用胶囊网络能够充分保留特征信息的优点,将提取的特征进行编码,从而使其以胶囊的形式进行传递和输出,有效避免了空间结构信息丢失的问题。
实验结果表明,论文提出的模型在AFLW2000和BIWI数据集上的平均绝对误差分别为5.68和4.33,进一步提高了对头部姿态估计的准确度,并在室内条件下对光照变化、遮挡等具有较好的鲁棒性。
【总页数】7页(P305-310)
【作者】刘亚飞;王敬东;刘法;林思玉
【作者单位】南京航空航天大学自动化学院
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1.基于深度学习的驾驶员头部姿态参数估计
2.基于深度学习的头部姿态估计
3.一种基于监督流形学习的头部姿态估计方法
4.基于深度学习的三维点云头部姿态估计
5.基于深度学习的头部姿态估计方法研究
因版权原因,仅展示原文概要,查看原文内容请购买。
基于卷积神经网络模型的头部姿态估计方法研究

基于卷积神经网络模型的头部姿态估计方法研究基于卷积神经网络模型的头部姿态估计方法研究摘要:近年来,头部姿态估计技术在计算机视觉领域中得到了广泛的研究和应用。
本文针对头部姿态信息在人脸识别、动作捕捉等领域的重要性,基于卷积神经网络模型,提出了一种头部姿态估计的方法。
通过构建合适的训练数据集,利用深度卷积神经网络模型对头部姿态进行预测,并通过实验验证了方法的有效性。
结果表明,所提出的方法能够准确地估计头部的姿态。
1. 引言头部姿态估计是计算机视觉领域中一个重要的研究方向,它在人脸识别、动作捕捉、虚拟现实等领域都有广泛的应用。
头部姿态信息可以提供丰富的人脸形态信息,有助于人脸识别系统进行更精准的识别。
此外,头部姿态信息也可以用于动作捕捉,实现对人体动作的精准捕捉和分析。
因此,研究头部姿态估计方法具有重要的理论和应用价值。
2. 相关工作在过去的几十年中,研究者们提出了许多头部姿态估计方法。
传统的方法主要基于特征点匹配和统计机器学习等技术。
这些方法需要手工提取头部特征点,然后利用相应的算法进行姿态估计。
然而,由于头部的姿态变化复杂多样,传统方法在复杂场景下容易受到光照、遮挡等因素的干扰,导致姿态估计准确率较低。
为了解决这个问题,研究者们开始尝试使用深度学习方法进行头部姿态估计。
3. 方法设计本文提出的头部姿态估计方法基于卷积神经网络模型。
具体而言,我们构建了一个包含大量头部图像和标注姿态的训练数据集。
然后,我们使用卷积神经网络模型对训练数据进行训练,学习到头部姿态的特征表示。
在实际应用中,我们输入一张头部图像到训练好的模型中,模型将输出头部的姿态估计结果。
4. 实验及结果分析为了验证所提出的方法的有效性,我们利用公开的头部姿态数据集进行实验。
实验结果表明,所提出的方法在头部姿态估计方面具有较高的准确率。
与传统方法相比,所提出的方法具有更好的鲁棒性,能够在复杂场景下进行准确的姿态估计。
5. 总结与展望本文基于卷积神经网络模型提出了一种头部姿态估计方法,并通过实验证明了方法的有效性。
《基于深度学习的3D人体姿态估计研究》

《基于深度学习的3D人体姿态估计研究》一、引言随着深度学习技术的不断发展,其在计算机视觉领域的应用越来越广泛。
其中,3D人体姿态估计是计算机视觉领域的一个重要研究方向,其应用场景包括运动分析、人机交互、虚拟现实等。
本文旨在研究基于深度学习的3D人体姿态估计方法,以提高姿态估计的准确性和鲁棒性。
二、相关工作3D人体姿态估计是一个具有挑战性的问题,其主要目标是识别和跟踪人体在三维空间中的姿势和动作。
近年来,许多研究者提出了不同的方法来解决这个问题。
传统的基于模型的方法通常依赖于复杂的骨骼模型和参数化表示,但这些方法往往难以处理复杂的姿态和背景。
随着深度学习技术的发展,基于深度学习的3D人体姿态估计方法逐渐成为研究热点。
三、基于深度学习的3D人体姿态估计方法本文提出了一种基于深度学习的3D人体姿态估计方法。
该方法主要包含以下几个步骤:数据预处理、特征提取、姿态估计和后处理。
首先,我们需要对输入的图像进行预处理,包括图像裁剪、归一化等操作。
然后,通过卷积神经网络等深度学习模型提取图像中的特征信息。
这些特征信息可以包括颜色、纹理、边缘等信息,对于后续的姿态估计非常重要。
接下来,我们使用一种基于卷积神经网络的姿态估计器来预测人体的关键点位置。
这个估计器可以是一个单阶段或多阶段的网络结构,其目标是通过学习大量的训练数据来提高预测的准确性。
在这个过程中,我们可以使用诸如残差网络等先进的网络结构来提高模型的性能。
在姿态估计的过程中,我们还需要考虑一些复杂因素的影响,如光照变化、背景干扰等。
为了解决这些问题,我们可以采用一些后处理方法来进一步提高姿态估计的准确性。
例如,我们可以使用一种基于优化的方法来调整关键点的位置,或者使用一种基于多模态融合的方法来整合不同信息源的数据。
四、实验与分析为了验证本文提出的方法的有效性,我们进行了大量的实验。
我们使用了多个公开的3D人体姿态估计数据集来训练和测试我们的模型。
实验结果表明,我们的方法在多个数据集上均取得了较好的性能表现。
基于深度学习的人体姿态估计与行为识别技术研究

基于深度学习的人体姿态估计与行为识别技术研究深度学习技术的迅速发展在计算机视觉领域引起了巨大的关注。
其中,人体姿态估计与行为识别技术在许多应用中扮演着重要的角色,如动作捕捉、姿态分析、人机交互等。
本文将讨论基于深度学习的人体姿态估计与行为识别技术的研究进展和应用。
人体姿态估计是指从图像或视频中准确地推断出人体的姿态和关节角度。
过去的研究主要依赖于手工设计的特征和传统的机器学习方法。
然而,这些方法的性能受限于特征表示能力和模型的泛化能力。
随着深度学习的兴起,基于深度神经网络的人体姿态估计方法取得了巨大的进展。
一种常用的深度学习方法是卷积神经网络(Convolutional Neural Network,简称CNN)。
通过使用CNN对图像进行端到端的处理,可以自动学习图像的特征表示和关节位置的回归模型。
例如,一种经典的CNN架构是基于VGGNet的方法,它通过多个卷积层和全连接层来提取特征和回归关节位置。
此外,还有一些网络架构专门设计用于人体姿态估计,如Hourglass网络,它通过堆叠多个子网络来增强特征提取和关节位置回归的性能。
除了CNN,循环神经网络(Recurrent Neural Network,简称RNN)也被广泛应用于人体姿态估计和行为识别。
RNN可以建模时间序列数据的依赖关系,适用于视频序列中的姿态估计任务。
例如,LongShort-Term Memory(LSTM)网络是一种常用的RNN架构,具有记忆单元和门控单元,可以有效地捕捉长期依赖关系。
除了人体姿态估计,深度学习技术在人体行为识别方面也取得了显著的进展。
人体行为识别是指从视觉数据中识别出人类的动作或行为。
深度学习方法通过对图像或视频进行特征提取和分类,实现了高准确率的人体行为识别。
这些方法通常采用3D卷积神经网络或融合多个视图的方法,以捕捉时间和空间信息。
同时,一些研究还将关联关系模型引入人体行为识别,用于建模人体部分之间的关系,并提高分类的准确性。
《基于深度学习的目标检测及抓取姿态估计算法研究》

《基于深度学习的目标检测及抓取姿态估计算法研究》一、引言随着人工智能技术的不断发展,深度学习在计算机视觉领域的应用越来越广泛。
目标检测和抓取姿态估计是机器人视觉系统中的关键技术,对于实现机器人的自主操作和智能化具有重要意义。
本文将重点研究基于深度学习的目标检测及抓取姿态估计算法,以提高机器人的操作精度和效率。
二、目标检测算法研究2.1 传统目标检测算法传统目标检测算法主要依靠特征提取和分类器进行目标识别。
然而,这种方法对于复杂场景和多样性的目标往往难以取得满意的检测效果。
2.2 深度学习目标检测算法深度学习目标检测算法通过卷积神经网络提取目标的特征,并利用区域提议网络和回归方法实现目标的精准定位。
其中,基于深度学习的目标检测算法如Faster R-CNN、YOLO(You Only Look Once)和SSD(Single Shot MultiBox Detector)等在准确性和实时性方面表现出色。
2.3 本文研究内容本文将研究基于深度学习的目标检测算法,通过优化网络结构和参数,提高目标检测的准确性和实时性。
同时,针对不同场景和目标的特点,设计适应性强、鲁棒性好的目标检测模型。
三、抓取姿态估计算法研究3.1 传统抓取姿态估计算法传统抓取姿态估计算法主要依靠立体视觉或深度传感器获取目标的三维信息,然后通过几何计算和优化方法估计抓取姿态。
然而,这种方法需要复杂的硬件设备和繁琐的计算过程。
3.2 深度学习抓取姿态估计算法深度学习抓取姿态估计算法通过卷积神经网络学习目标的外观和空间信息,实现抓取姿态的快速估计。
其中,基于深度学习的端到端抓取姿态估计算法在实时性和准确性方面具有显著优势。
3.3 本文研究内容本文将研究基于深度学习的抓取姿态估计算法,通过设计合适的网络结构和损失函数,提高抓取姿态估计的准确性和鲁棒性。
同时,将目标检测和抓取姿态估计相结合,实现机器人在复杂环境下的自主抓取操作。
四、算法实现与实验分析4.1 算法实现本文将采用深度学习框架(如TensorFlow或PyTorch)实现目标检测和抓取姿态估计算法。
基于深度学习的人体姿态估计算法研究与实现

基于深度学习的人体姿态估计算法研究与实现深度学习在计算机视觉领域有着广泛的应用,其中之一就是人体姿态估计。
人体姿态估计是指通过对人体图片或视频进行分析,推断出人体的关节位置和姿态信息。
本文将研究和实现一种基于深度学习的人体姿态估计算法,并讨论其应用前景。
一、算法介绍在基于深度学习的人体姿态估计领域,目前最流行的模型是基于卷积神经网络(Convolutional Neural Network,简称CNN)的方法。
该方法通过从大量带有关节标注的人体数据集中学习,构建一个神经网络模型,实现对人体关节点的准确识别和姿态估计。
二、数据集准备与预处理在进行深度学习任务之前,需要准备一个带有关节标注的训练数据集。
这个数据集应该包含大量图片或视频样本,同时还需要有与之对应的关节标注信息。
数据集准备完成后,还需要对数据进行预处理,包括对图像进行缩放、裁剪和归一化等处理,以提高算法的鲁棒性和泛化能力。
三、网络结构设计在设计人体姿态估计算法的网络结构时,可以采用经典的CNN网络结构,如VGGNet、ResNet或Inception等。
此外,还可以将一些特定的结构或模块引入到网络中,如残差连接、多尺度特征融合或注意力机制等,以提高算法的性能。
四、训练与优化通过将准备好的数据集输入到网络中,可以进行模型的训练与优化。
在进行训练过程中,可以使用一些优化器和损失函数,如Adam优化器和均方差损失函数,以提高模型的收敛速度和姿态估计的准确性。
五、实验与评估在训练完成后,需要对算法进行实验与评估。
可以选择一些常用的评价指标,如关节误差、平均准确率等,来评估算法的性能。
同时,还可以与其他人体姿态估计算法进行对比实验,以验证算法的有效性和优越性。
六、算法应用人体姿态估计算法在很多领域都有广泛的应用前景。
例如,在人机交互、虚拟现实和运动捕捉等领域,人体姿态估计可以用于手势识别、动画控制和运动分析等应用。
此外,在医疗领域,人体姿态估计还可以用于康复辅助和老年人健康监测等方面。
基于深度学习的姿态识别技术研究

基于深度学习的姿态识别技术研究 近年来,由于计算机视觉技术不断发展,深度学习技术逐渐成为姿态识别领域的主流技术。姿态识别是指通过计算机视觉技术,自动地检测并识别出人体的姿态(即身体上的各个关节角度)。这项技术在实际应用中具有广泛的应用前景,例如人脸识别、机器人控制、运动分析等。
基于深度学习的姿态识别技术不同于传统的模板匹配和规则模型实现,它通过神经网络模拟人脑神经元的处理方式,从而实现了对于复杂数据的高效处理与表征。从理论上来说,深度学习的多层次神经网络可以自动地提取出原始输入数据中的高层次抽象特征,因此具有更强的表征能力。
在实际应用中,基于深度学习的姿态识别技术的难点在于如何提取有效的特征,并使用相应的分类算法实现识别。目前,该领域的主要发展方向是将CNN、LSTM等深度学习算法应用于卷积神经网络(Convolutional Neural Networks,CNNs)和循环神经网络(Recurrent Neural Networks,RNNs)中,将多个深度学习算法有机地结合起来。通过这种方式,可以获得更高的精度和更好的鲁棒性。 以人脸姿态识别为例,目前基于深度学习的人脸姿态识别方法主要有三类:1、单一模态人脸姿态识别;2、基于多视角数据的人脸姿态识别;3、基于混合模态下的人脸姿态识别。其中,基于混合模态下的人脸姿态识别是目前最为成熟的方法,它将不同模态(如RGB图像、深度图像、热图等)提取的特征结合起来,进一步提高了人脸姿态识别的准确率。
另外,基于深度学习的姿态识别技术也需要考虑到算法的实时性及可扩展性。针对这一问题,研究人员提出一种基于时域深度学习算法的实时姿态识别框架,可以在实现高准确度的同时,在功耗和计算资源方面更为节省。同时,该技术也可以被应用于更广泛的领域,如人机交互、体感游戏等。
总之,基于深度学习的姿态识别技术将会成为计算机视觉领域的重要技术,它将对于人类的生产生活产生重大影响。值得注意的是,尽管该技术的研究还有许多问题需要解决,但是,研究人员已经取得了一些显著的进展,并且在不断地探索和拓展该领域的应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第26卷第11期 2016年11月
计算机技术与发展
COMPUTER TECHNOLOGY AND DEVELOPMENT Vo1.26 No.11
Nov. 2016
基于深度学习的头部姿态估计 贺飞翔,赵启军 (四川大学视觉合成图形图像技术国防重点学科实验室,四川成都610065)
摘要:头部姿态估计在人工智能、模式识别及人机智能交互等领域应用广泛。好的头部姿态估计算法应对光照、噪声、 身份、遮挡等因素时鲁棒性较好,但目前为止如何提高姿态估计的精确度与鲁棒性依然是计算机视觉领域的一大挑战。 提出了一种基于深度学习进行头部姿态估计的方法。利用深度学习强大的学习能力,对输入的人脸图像进行一系列的非 线性操作,逐层提取图像中抽象的特征,然后利用提取的特征进行分类。此类特征在姿态上具有较大的差异性,同时对光 照、身份、遮挡等因素鲁棒。在CAS—PEAL数据集上对该方法进行了评估实验。实验结果表明,该方法有效地提高了姿态 估计的准确性。 关键词:头部姿态估计;深度学习;提取特征;分类 中图分类号:TP301.6 文献标识码:A 文章编号:1673—629X(2016l11—0O01—04 doi:10.3969/j.issn.1673—629X.2016.1 1.001
Head Pose Estimation Based on Deep Learning HE Fei-xiang,ZHAO Qi-jun (National Key Laboratory of Fundamental Science on Synthetic Vision,Sichuan University, Chengdu 610065,China)
Abstract:Head pose estimation has been widely used in the field of artificial intelligence,pattern recognition and intelligent human—corn— puter interaction and SO on.Good head pose estimation algorithm should deal with light,noise,identity,shelter and other factors robustly, but SO far how to improve the accuracy and robustness of attitude estimation remains a major challenge in the field of computer vision.A method based on deep learning for pose estimation is presented.Deep learning with a strong learning ability,it Can extract high—level im。 agefeatures oftheinputimage bythrough aseries ofnon-linear operation,then classifyingtheinputimage usingthe extractedfeature. Such characteristics have greater diferences in pose,while they a∞robust of Ughi,identity,occlusion and other factors.The proposed head pose estimationis evaluated ontheCAS-PEAL data set.Experimental results showthatthismethodis effectivetoimprovethe accu- racy of pose estimation. Keywords:headpose estimation;deepleaming;extractingfeature;classification
1概述 头部姿态是研究人类行为和注意力的关键,在人 际交往中,扮演着非常重要的角色。头部姿态的改变 也包含丰富的信息,例如同意、反对、理解、迷惑、惊喜 等。此外,头部姿态还是包括人脸识别、表情识别、视 线估计在内的许多智能系统在非约束条件下进行身份 识别与行为预测所需要的关键信息。因此,头部姿态 估计是计算机视觉与模式识别领域一个非常重要的应 用,其算法研究的意义非常大。 在计算机视觉领域,头部姿态估计 是指计算机 通过对输人图像或者视频序列的分析、预测,确定人的 头部在三维空间(相对于摄像机)中的位置及姿态参 量。通常说来,假设头部姿态估计是一个刚体变换,存 在pitch,yaw,roll三个方向自由度,如图1所示。由于 受非约束坏境中的投影几何形变、背影光照变化、前景 遮挡问题和低分辨率等因素的影响,使得头部姿态的 多自由度估计一直是一个富有挑战性的领域。 针对人脸头部姿态估计的算法,主要分为基于模 型的方法和基于人脸表观的方法。其中,基于模型的 方法 “ 主要是利用若干脸部特征点构成的模型,通 过提取不同姿态下模型的差异预测头部姿态。此类方 法实现简单、计算高效准确、易于理解,但强烈依赖特
收稿日期:2016-01-29 修回日期:2016—05—18 网络出版时间:2016-10—24 基金项目:国家自然科学基金资助项目(61202160,61202161);科技部重大仪器专项(2013YQ49087904) 作者简介:贺飞翔(1992一)。男,硕士研究生,研究方向为生物特征识别;赵启军,副教授,硕士研究生导师,研究方向为生物特征识别。 网络出版地址:http://www.enki.net/kems/detail/61.1450.TP.20161024.1117.076.html ・2・ 计算机技术与发展 第26卷 征点定位的准确程度,而准确的特征点检测在姿态变 化较大时仍然是一个急待解决的挑战。基于表观学 习 。。的方法是通过大 的洲练数据直接学习图像与 头部姿态之间的映射关系。与基于模型匹配方法相 比,其主要优点是提取基于表观的特征不依赖特征点 的位置,具有较高的鲁棒性与估计‘精确度。文中研究 的方法属于基于表观学习的方法。 图1 人脸头部姿态三个旋转方向 基于图像表观的学习方法解决姿态的问题通常呵 以看作是分类问题或者是回归问题。此类算法的核心 主要分为两部分:第一部分是提取图片中与头部姿态 变化紧密相关的特征,此类特征对人的身份、表情、光 照等无关因素鲁棒;第二部分是通过某种分类算法,对 提取的特征进行分类或回归对姿态角度进行估 ‘。 深度学习是机器学习中一个新的领域。从2006 年开始,深度学习在语音识别、计算机视觉(包括人脸 识别、特征点检测、人脸检测等)、自然语言处理以及 信息检索等领域性能优异。深度学习可通过学习一种 深层非线性网络结构,实现复杂函数逼近,其特有的层 次结构能够对数据局部特征进行多层次抽象化的学习 与表达。文中主要是利用深度学习强大的学习能力, 学习输入图片中与对象的身份、光照、表情等因素无 关,且仪与姿态有关的特征,然后通过分类,用以解决 头部姿态估计的问题。 2基于卷积网络头部姿态估计 2.1基于CNN的深度学习网络 文中采用的深度网络结构模型主要包括2个卷积 层(含2个采样层),后接1个全连接层和soft—max输 出层。如图2所示(图中外面的大立方体的长、宽、高 分别表示每一层特征图的个数与特征图的维度,里面 的小立方体和正方形分别表示卷积过程中卷积核的尺 寸与下采样过程中采样矩形框的尺寸,最后两层是全 连接中神经元的个数),输入图片 是尺度大小归一 化至32×32的灰度图像。图像输入到网络结构,逐层 对输入图片进行卷积与池化采样,提取抽象的特征,通 过soft—max对提取的抽象特征分类,网络的最终输出 为输入 片的头部姿态 当输入图片的尺寸发生变化 时,网络结构中每一层特征谱的高与宽都会发生相应 的变化。在提取图像特征的过程中,特征逐渐抽象化, 特征的维度逐渐下降,形成更加简洁抽象目.具有高度 区分性的特征,从而能够正确分类出输人图片中头部 姿态所属类别。 在巷积阶段,利用卷积核对特征图进行卷积操作, 加强原信号信息,并且降低图片噪音。在卷积神经网 络巾,每个卷积核能够提取输入特征图中所有位置上 的某一特定特征,每一个卷积滤波器共享相同的参数, 包括相同的权值矩阵与偏置项,从而实现同一个输入 特征图上的权值共享“j。权值共享的优点是在对图 片提取特征时不用考虑局部特征权重的差异(比如鼻 子、眼睛、嘴巴),使要学习的卷积神经网络模型的参 数数量大大降低。
图2 深度网络结构详图 为了提取能够预测输入图片中人脸头部偏转角度 的多个特征,需要使用不同的卷积核进行卷积操作。 卷积运算町表示如下: /=nlax(0,b +∑I1) ) (1) i 其中, 与/分别表示第i个输入特征图与第. 个
输出特征图; 是第i个输入特征图与第. 个输出特 7LE图之间的卷积核; 表示卷积;bI是第 个输出图的 偏置项。 为_r避免线性模型表达能力不够,通常需要对卷 积过后得到的特征图进行非线性化操作,防止过拟合。 常用的非线性函数主要有sigmoid、tanh、ReLU等。文 中对隐层神经元使用不饱和非线性函数ReLU。 下采样主要是实现特征的降维。由于图像局部相 关性原理,通过对图像进行下采样,在保留图像有用信 息的同时降低了特征图的维度。下采样阶段主要是对 单个特征图进行操作,主要有平均池化下采样与最大 池化_F采样 F均池化下采样是取邻域中的平均值作 为输出,最大池化下采样是取邻域中的最大值作为输 出。文中采,Efj的是最大池化下采样,过程可表示为: y:. = rnax Xj. +m, ・s+n } (2) 其中。 表示下采样过程中的第i个输出谱,其中 的每一个神经元是从第i个输入谱中s X s局部区域采 样得到的; t与n分别表示下采样框移动的步长。