面孔识别脑机制综述

关于自我面孔识别的脑机制的研究综述

沈祥英

教育科学学院心理学09370125

【摘要】自我面孔识别是自我参照加工的一种研究范式，反映了人们通过自我与他人的区分识别出自我面孔的过程。由于自我面孔识别的独特性而受到关注，关于自我面孔识别的研究也有很多。而关于其脑机制的研究近年也成为了热点问题。关于自我面孔识别的左右脑半球优势至今还存在争议。自我面孔识别的脑区涉及前额叶、脑岛、扣带回、颞叶、颞顶交界区和顶叶等多个脑区。搞清楚自我面孔识别的脑机制对于深入理解自我面孔识别的神经生理基础和精神疾病患者自我意识缺陷的病理机制和深入了解一般面孔识别、心理理论及自我发展等都具有重要意义。

【关键词】自我面孔识别脑机制脑区

1 引言

看一张你和别人的合照的时候，你是不是会第一个看自己的脸，然后再看别人的脸？或者在一大堆的快速呈现的照片中，要是其中有你的存在，你总能看到你自己的照片？我们对于有自己面孔的东西总是那么容易就注意到了。对于自我面孔识别这一特殊的现象引起了很多的研究和关注。自我面孔是个体区分自我与他人的重要特征，自我面孔再认能力也被认为是自我意识的一个重要标志。自我面孔识别是自我参照加工的一种研究范式，反映了人们通过自我与他人的区分识别出自我面孔的过程。

与识别他人面孔相比较, 自我面孔识别在行为反应、种系发生、个体发展以及神经机制等方面都表现出了它的独特性，目前这一领域已成为探究自我的一个重要组成部分【1】。行为指标方面，自我面孔识别在速度上快于识别他人的面孔；种系发生方面，只有人类和大猩猩等高级灵长类动物才具有识别自己面孔的能力；个体发展方面，儿童出生后不久即能识别他人面孔，但要在18个月左右才能表现出自我面孔识别能力；脑机制方面，神经心理学和脑成像研究结果表明自我面孔识别具有不同于识别他人面孔的神经机制，可能主要是右脑的功能【2】。

自我面孔识别主要有以下几个特征：1、自我面孔识别的优势效应，即人们对自我面孔的识别快于对他人面孔的识别；2、自我面孔识别的优势效应存在文化差

异，有的文化背景下的人不会产生这一效应；3、自我面孔识别的正性自我偏见，正性自我偏见是指个体在知觉自我的过程中产生的、并在社会比较中努力保持和提升自尊的倾向,目的是希望对自己产生满意感、能力感和有效感。最近研究者发现自我面孔识别也存在性自我偏见,而且具有内隐的特点【3】。、

自我面孔识别的这些特点是什么原因产生的呢？是因为人们在加工自我面孔的时候和加工他人的面孔所用的加工过程不一样?还是自我面孔识别所激活的脑区不一样？已有研究结果表明自我面孔识别主要与大脑右半球相关, 左半球也参与了加工,前部脑结构,如额叶和前扣带回都参与了自我面孔识别，但是自我面孔识别与哪些脑区相关还没有得出一致的结论【4】。下面我们就对于关于自我面孔识别过程中脑机制方面的研究进行简单的小结。

2 关于自我面孔识别的脑机制的研究

2.1 自我面孔识别的脑半球优势

2.11 左右半球无差异

自我面孔识别功能在脑半球中的定位一直是人们关注的焦点。最先对自我面孔识别的神经基础进行探讨的人是Sperry和Zaidel(1979)，他们用由于手术而我切断了两半球间的胼胝体2个癫痫病人作被试（由于半球间胼胝体的切断，投射到患者一侧半球的任何图片只能被该半球处理），通过短暂的偏侧化效应，他们给被试的一侧半球呈现自我刺激(例如，自己的照片)和非自我刺激(例如，家庭成员的照片)发现，自我面孔识别与亲密家人面孔识别几乎相同，认为可能两侧半球都有参与自我面孔识别【5】。

2.12 右半球优势

1999年，Keenan给一些健康被试呈现正立或倒立的自我、熟悉者和陌生人的面孔，实验要求被试尽快按键指出面孔属于哪一类（在用左手和右手两种反应条件下进行），实验发现，自我面孔识别显著快于熟悉者和陌生人，而且这种“优势”只在用左手反应时才发生，他们认为这种双手反应差异反映了右半球在自我面孔加工中的优势【5】。Keenan在后来的对脑裂患者的研究中也得到了相同的结论。

2001年Keenan对5名被试者左右脑半球分别进行麻醉，他们向患者呈现由名人面孔和患者自己面孔所合成的面孔图像，并要求患者记住。待患者从麻醉状态中恢复过来之后，他们向患者同时呈现患者自己的面孔和名人的面孔，要求患者选出先前呈现过的面孔（实际上麻醉期间出现的是两者的合成面孔）。结果左侧麻醉时，5名被试均选择自我；而右侧麻醉时，仅1例选择自我，表明右侧大脑半球可能是自我面孔识别的优势半球【5】。后来Platke等的一些研究也支持右脑半球在自我面孔识别中的优势。

2.13 左半球优势

Turk等（2002）给胼胝体切断被试的一侧半球投射患者自己和一名作家一一熟悉者面孔的合成图像，被试自己面孔的结合程度不断变化，在要求指出面孔是自己的还是作家的任务下，被试的左半球优先辨认出了自己的面孔，以高度熟悉的他人面孔代替自我面孔也获得了这一效果，这一实验表明左侧半球在自我面孔识别加工中占据优势【6】。

众多的研究得出了不一致的结论，所以对于自我面孔识别中是左半球还是右半球在占主导作用还有待进一步的研究。

2.2自我面孔识别的有关的脑区

2.21前额叶皮层

很多的实验研究都发现自我面孔识别与前额叶皮层有很大的关系。

Kircher等（2000）给被试呈现：自我-陌生人和同伴-陌生人的合成图像，让被试按照自己、熟悉者、陌生人对图像进行分类，通过功能磁共振成像（fMRI）技术，发现右边缘系统(脑岛、海马结构、杏仁核)、内侧颞叶和左侧前额叶下部和内侧额回都得到激活，而且与熟悉者相比，自我优先激活了左前额区【6】。

自闭症谱系障碍患者存在面孔识别的障碍主要与颞枕部的N170、额中央部的P400、及额叶的N300等部分的异常有关【7】。说明自我面孔识别与这些脑区有很大的相关。

Platek等（2004）呈现给被试一系列的名人面孔（在其中也有一些被试自己的面孔），让被试观察面孔时想人物的身份，结果在呈现出自我面孔时右前额叶（主要包括：右侧额上回、中回和下回）唤起较强【6】。

Uddin 等人让被试区分自己和熟悉他人的合成面孔,结果发现与熟悉他人面孔相比,自我面孔激活了右侧额下回(right inferior frontal gyrus)。这表明右侧额下回在区分自我与他人的时候具有重要的作用。还有研究发现自我声音的识别也会引起右侧额下回的激活，认为右侧额下回与自我的抽象表征有关。还有一项研究中, 被试在自我面孔识别之前进行了不同的“自我”概念的启动,让被试在一个包含“我”或者“我的”的故事中查数这类词汇的个数（独立性的(independent)自我概念启动）和在一个包含“我们”或者“我们的”的故事中查数这类词的个数（相互依存的(interdependent) 自我概念启动）,结果发现：在独立的自我概念启动条件下,自我面孔识别激活了右侧额中回(right middle frontal gyrus)【8】。

Platek 和Kemp 比较了原始的和变化了50%的自我,亲属,朋友和不认识他人的面孔识别, 结果发现内侧额回(medial frontal gyrus) 与前扣带回(anterior cingulate gyrus)共同参与了不确定情形下的自我与他人的分类与决策【8】。

2.22脑岛

Kireher等人研究发现右侧脑岛会对自我面孔以及自我描述性质的形容词产生广泛的激活反应。（常荷,董毅,汪凯.自我面孔识别的神经机制）另一项研究中,被试对从0 到30% 变化程度的自己、同伴、陌生人的面孔进行识别,结果发现自我识别激活了右侧脑岛(right insula)。Devue 等人的一项关于自我面孔和自我身体识别的研究表明,右前脑岛(right anterior insula) 在自我面孔识别与自我身体识别中同时激活【8】。这些结果都表明自我面孔识别与脑岛有关。

2.23扣带回

Taylor 等人让被试对自我、父母和同伴等不同熟悉度的面孔进行识别，发现自我面孔识别激活扣带回右侧,父母面孔识别激活扣带回双侧偏右,同伴面孔识别则激活左侧扣带回；有研究表明,自我面孔识别和自我身体识别同时激活了右侧前扣带回(right anterior cingulate cortex)；Platek 等人的研究将被试的面孔与成人或者孩子的面孔进行50% 的合成, 实验结果发现,人们在自我参照任务中面对不确定信息时的决策与左侧前扣带回有关；在一项判断图片中自己或者不熟悉他人的头部偏的转方向的研究中，通过正电子断层扫描(PET)发现,当提前告诉被试将会出现自己的面孔的时候,自我面孔激活了右侧前扣带回【8】。

2.24颞叶皮层

Feinberg等（1989）发现一个右侧颞顶部损伤的女子，她能用镜子识别他人，但对于镜子中的自己她却坚称那是“她自己的精确复制品”【9】。Kircher向被试呈现由自己或者同伴与某一陌生人的合成面孔,并让被试判断该图片是自己还是同伴,然后再完成形容词的自我描述任务，结果发现自我面孔识别与形容词自我描述任务都激活了左侧梭状回；Sugiura 研究发现,前颞皮层(anterior temporal cortex)在熟悉他人的面孔识别中被激活,但在自我面孔识别中却没有被激活；Verosky & Todorov让被试的对积极和消极两种效价的自己和他人的合成面孔进行辨别,发现随着自我面孔比例的增加,两种效价的面孔在颞叶皮层上的激活变化发生分离【8】。表明颞叶皮层与自我面孔识别相关。

2.25顶叶皮层

Spangenber(1998)发现一名右侧顶叶和周围白质轻度萎缩患者，她可以用镜子识别他人，但坚称她自己的镜像是一名与她长相相似的年轻女孩，经过指导后，患者仍坚称那是一个小女孩，不是她自己【9】。Uddin等人的研究发现自我面孔识别激活了右侧顶下叶(right inferior parietal lobule),并推测该区域负责自我面孔识别中的自我与他人的区分； Sugiura等人让被试对自己、朋友以及陌生人的面孔和名字进行熟悉与否的判断, 结果发现自我面孔激活了楔前叶(precentral)【8】。

2.26颞顶交界区

有研究采用低频率重复经颅磁刺激(rTMS)作用于被试双侧颞顶交界区和前额叶皮质，同时向被试呈现自我面孔、名人面孔和图像，结果发现当右侧颞顶交界处受刺激时，被试能较快识别出自我面孔；Breen等发现，老年痴呆晚期的患者丧失镜像自我识别能力可能与颞顶交界处脑组织的丧失有关；Platek SM等对正常者的脑功能成像研究也显示颞顶交界处在识别自我面孔时被激活【9】。

2.3自我面孔识别的相关脑电研究

在轻度认知障碍患者面孔早期加工的事件相关电位研究中，发现患者和正常者都出现了枕区的N170成分，而N170与面孔特征的结构分析有关，与熟悉度、性别、年龄和种族等视觉直接加工因素无关，这说明了面孔识别的特异性【9】。

Keyes等研究发现，相比于熟悉面孔和陌生面孔刺激，自我面孔刺激引起头后部区域N170波幅和额中央区域VPP波幅增加；同样也引起了头后部区域P2波幅和额中央区域N2波幅的减低，这表明自我面孔加工具有特异性【9】。

有实验向被试呈现姓名和面孔刺激，观察被试的行为反应及P300脑电波的变化，发现自我姓名-自我面孔、名人姓名-名人面孔、陌生人姓名一陌生面孔这三组在行为反应的时间和P300的波幅及潜伏期均存在差异。这也一定程度上反映了自我面孔识别的特异性【9】。

3 小结

对于自我面孔识别的脑半球优势，至今还没有一个确定的答案。虽然研究发现大脑两侧都有参与自我面孔识别，但是多数研究都认为右侧大脑半球可能构成自我面孔识别的神经基础。自我面孔识别是一个复杂的过程，自我面孔识别的脑区涉及前额叶、脑岛、扣带回、颞叶、颞顶交界区和顶叶等，而其具体的作用还不太清楚。目前对自我面孔识别脑电活动生理基础的研究尚少，N170和P300等脑电活动对自我面孔的优势能不能就反映自我面孔识别的特殊性，还需要进一步的探讨。

随着科技大发展对于自我面孔识别的研究技术也不断提高，最初的研究主要对脑裂患者或者正常人进行行为实验，通过观察被试用左右手反应时的差异，来判断脑半球优势。对特定脑损伤患者的研究，来定位自我面孔识别的脑区。后来逐渐采用fMRI、PET、ERP，rTMS等技术来对自我面孔识别进行脑区定位。使得对自我面孔识别的脑机制的研究越来越深入。但要能够确切的知道哪个特定的脑区域是负责自我面孔识别的哪个特定过程，还需要进一步深入的研究。

对于弄清楚自我面孔识别的脑机制有十分重要的意义。对自我面孔加工过程进行研究，将有助于深入理解自我面孔识别的神经生理基础和精神疾病患者自我意识缺陷的病理机制，对自闭症儿童的面孔识别障碍的研究和了解自我面孔识别的机制对我们深入了解一般面孔识别、心理理论及自我发展等也具有重要意义。

【参考文献】

【1】杨红升.自我面孔识别的独特性.心理科学.Psychological Science 2005, 28(6):1517- 1519 【2】杨红升,黄希庭. 自我信息加工的独特性.自人名识别研究的证据. 心理科学, 2007.30,1127–1129.

【3】建苓，陈旭，王婧.自我面孔识别的特征、影响因素及ERP研究述评. 心理科学进展. 2012, Vol. 20, No. 2, 240–247

【4】刘凌,杨丽珠.自我面孔识别的研究进展. 辽宁师范大学学报.2009. Vol. 32 No.3 【5】简洁. 无外部特征自我面孔识别左右半球的加工差异.陕西师范学院硕士论文.2006. 【6】李稳.探讨区分自我一他人面孔的神经基础.首都师范大学硕士学位论文.2009

【7】杨利芹.症谱系障碍患者自我面孔识别的研究现状. 安徽医科大学学报.2011.Aug;46(8) 【8】关丽丽,齐铭铭,张庆林,杨娟.自我面孔识别的脑机制. 心理科学进展.2011, Vol. 19, No. 9, 1313–1318

【9】常荷,董毅,汪凯.自我面孔识别的神经机制. 中华行为医学与脑科学杂志.2011年7月第二十卷第7期

NMF综述报告

人脸识别的非负矩阵分解(NMF)方法文献综述摘要：人类对整体的感知是基于对部分的感知，NMF（非负矩阵分解，Non-negative matrix factorization）的思想正是源于此。通过对矩阵分解因子加入了非负性约束，使得对高维非负原始数据矩阵的分解结果不存在负值，且具有一定的稀疏性，因而得到了相对低维、纯加性、拥有一定稀疏特性的分解结果。与PCA（主成分分析，principal components analysis）等传统人脸识别方法相比，NMF的基图像就是人脸的各个局部特征，并且通过对经典算法的一系列优化，改进的NMF算法的识别率和鲁棒性较传统方法有着显著优势。此外，NMF在机器学习、语义理解等领域也有着重要应用。关键词：非负矩阵分解（NMF）稀疏性改进的NMF 语义理解一、引言在实际中的许多数据都具有非负性，而现实中对数据的处理又要求数据的低秩性经典的数据处理方法一般不能够确保非负性的要求，如何找到一个非负的低秩矩阵来近似原数据矩阵成为一个关键问题。在这样的背景下，NMF方法应运而生。 NMF方法思想最早可以追溯到由Paatero和Tapper在1994年提出的正矩阵分解（Positive Matrix Factorization,PMF）[1]；此后1999年，Lee和Seung提出了一个以广义KL散度为优化目标函数的基本NMF模型算法，并将其应用于人脸图像表示[2]；2001年，Lee和Seung通过对基本NMF算法进行深入研究，又提出了两个经典的NMF算法，即基于欧氏距离测度的乘性迭代算法和基于广义KL散度的乘性迭代算法，并给出了收敛性证明[3]，这两种算法称为NMF方法的基准算法，广泛应用于各个领域。但是在实际应用中，由于经典的基准NMF算法存在收敛速度较慢，未利用统计特征，对光线、遮挡等敏感，以及无法进行增量学习等问题，各种改进的NMF算法被提出。其中包括Lin提出的基于投影梯度（Projected Gradient，PG）的NMF方法[3]，该方法有着很高的分解精度；Berry提出的基于投影非负最小二乘（Projected Non-negative Least Square，PNLS）的NMF方法[5]，通过这种方法得到的基矩阵的稀疏性、正交性叫基准NMF方法都更好；此外还有牛顿类方法[6]和基于有效集[7]的NMF方法等。二、NMF的基准算法 1.NMF模型给定一个非负矩阵(即)，和一个正整数，求未知非负矩阵和，使得用表示逼近误差矩阵。可以用下图表示该过程：

人脸识别文献综述

文献综述 1 引言在计算机视觉和模式识别领域，人脸识别技术（Face Recognition Technology，简称FRT）是极具挑战性的课题之一。近年来，随着相关技术的飞速发展和实际需求的日益增长，它已逐渐引起越来越多研究人员的关注。人脸识别在许多领域有实际的和潜在的应用，在诸如证件检验、银行系统、军队安全、安全检查等方面都有相当广阔的应用前景。人脸识别技术用于司法领域，作为辅助手段，进行身份验证，罪犯识别等;用于商业领域，如银行信用卡的身份识别、安全识别系统等等。正是由于人脸识别有着广阔的应用前景，它才越来越成为当前模式识别和人工智能领域的一个研究热点。虽然人类能够毫不费力的识别出人脸及其表情，但是人脸的机器自动识别仍然是一个高难度的课题。它牵涉到模式识别、图像处理及生理、心理等方面的诸多知识。与指纹、视网膜、虹膜、基因、声音等其他人体生物特征识别系统相比，人脸识别系统更加友好、直接，使用者也没有心理障碍。并且通过人脸的表情/姿态分析，还能获得其他识别系统难以获得的一些信息。自动人脸识别可以表述为：对给定场景的静态或视频序列图像，利用人脸数据库验证、比对或指认校验场景中存在的人像，同时可以利用其他的间接信息，比如人种、年龄、性别、面部表情、语音等，以减小搜索范围提高识别效率。自上世纪90年代以来，人脸识别研究得到了长足发展，国内外许多知名的理工大学及TT公司都成立了专门的人脸识别研究组，相关的研究综述见文献[1-3]。本文对近年来自动人脸识别研究进行了综述，分别从人脸识别涉及的理论，人脸检测与定位相关算法及人脸识别核心算法等方面进行了分类整理，并对具有典型意义的方法进行了较为详尽的分析对比。此外，本文还分析介绍了当前人脸识别的优势与困难。 2 人脸识别相关理论图像是人们出生以来体验最丰富最重要的部分，图像可以以各种各样的形式出现，我们只有意识到不同种类图像的区别，才能更好的理解图像。要建立一套完整的人脸识别系统(Face Recognetion System，简称FRS)，必然要综合运用以下几大学科领域的知识： 2.1 数字图像处理技术数字图像处理又称为计算机图像处理，它是指将图像信号转换成数字信号并利用计算机

社会科学研究方法文献综述

关于商业片植入式广告发展现状及存在问题的研究——受众心理的关注及营销策略、传播方式的使用文献综述姓名：王丹 20090257 曾艳 20090261 杨斯琦 20090259 唐梦佳 20090256 余颂庆 20090260 张文 20090262 吴霜 20090258 班级：市场营销03班指导老师：杨代福时间：2012-03-10

【引言】进入21世纪以来，由于行业竞争加剧等原因，商业片植入式广告异军突起，事实上，这种广告模式由来已久，也并非中国特色。植入式广告源于欧美，发展较为成熟，我国的植入式尚处萌芽阶段，负面问题频发，饱受舆论质疑。但不可否认的是，植入式广告不但比传统硬广告更有优势，而且也是快速收回投资成本、降低商业风险急加速媒介产业循环的好方法，作为产业链上重要一环，其存在不仅具有合理性，而且具良好的发展前景。那么，如何使商业片的植入式广告快速的进入其下一个发展阶段成为现阶段的重大问题。因此，对于影响植入式广告效果的重要因素（营销手段、传播方式以及受众心理），值得我们去研究和思考我们。【正文】一、植入式广告的文献研究现状植入式广告于上世纪20年代至20年代末开始萌芽、2000年以后才真正进入蓬勃发展期，虽然相对于传统传播形式的广告，植入式广告的发展历史并不长，但是以商业片植入式广告为代表的植入式广告已经成为广告发展的一股不可抵挡的趋势，而国内外专家、学者对植入式广告发展的方方面面也进行了深入研究和探讨，呈现出一定深度和广度的理论学说及典型案例，对于植入式广告产业发展发挥了作用。从国内外的研究现状看，对于植入式广告的研究成果可归纳为以下四个方面。 1.对于植入式广告的理论体系依据研究关于植入式广告所依据的理论体系的研究，主要集中在传播学理论的体现与运用；张金海在《20世纪广告传播理论研究》一书中指出，植入式广告在现代广告业的发展中越来越引人注目，体现了现代广告逐渐将目光放在广告传播的社会文化关注，而巧妙地利用传播学中的归因理论和“说服性传播”的效果理论，则可以将这种关注的社会化效果扩大；而吕善锟在其论文《电影中植入式广告的理论依据》中则明确提出，植入式广告之所以比传统的商业广告有更好的说服效果，正在于其运用了传播学中的归因理论、两级传播理论、“说服性传播”的效果研究、经典条件反射理论以及模仿理论等。

步态识别论文

课程论文步态识别学号：班级：通信122 姓名：楚舒琦

目录摘要 (3) 一、背景介绍 (4) 二、相关研究 (4) 三、主题（算法） (5) 基于线图模型的动态特征提取 (6) 基于整体的静态特征提取 (8) 识别 (9) 四、实验 (9) 五、结果讨论 (12) 六、总结 (12) 七、应用前景 (12) 八、技术难点及解决途径 (14) 技术难点 (14) 解决途径 (15) 九、参考文献 (16)

摘要步态识别是一种新兴的生物特征识别技术，旨在通过人们走路的姿态进行身份识别，与其他的生物识别技术相比，步态识别具有非接触远距离和不容易伪装的优点。在智能视频监控领域，比面像识别更具优势。对步态识别的优缺点以及步态识别所涉及到的运动分割、特征提取与选择、模式识别算法进行了综述,并对步态识别中存在的问题与未来的研究方向进行了讨论。关键词:生物特征识别;步态识别;特征提取;运动分割;动态时间规正

一、背景介绍步态是指人们行走时的方式，这是一种复杂的行为特征。罪犯或许会给自己化装，不让自己身上的哪怕一根毛发掉在作案现场，但有样东西他们是很难控制的，这就是走路的姿势。英国南安普敦大学电子与计算机系的马克·尼克松教授的研究显示，人人都有截然不同的走路姿势，因为人们在肌肉的力量、肌腱和骨骼长度、骨骼密度、视觉的灵敏程度、协调能力、经历、体重、重心、肌肉或骨骼受损的程度、生理条件以及个人走路的"风格"上都存在细微差异。对一个人来说，要伪装走路姿势非常困难，不管罪犯是否带着面具自然地走向银行出纳员还是从犯罪现场逃跑，他们的步态就可以让他们露出马脚。人类自身很善于进行步态识别，在一定距离之外都有经验能够根据人的步态辨别出熟悉的人。步态识别的输入是一段行走的视频图像序列，因此其数据采集与面像识别类似，具有非侵犯性和可接受性。但是，由于序列图像的数据量较大，因此步态识别的计算复杂性比较高，处理起来也比较困难。尽管生物力学中对于步态进行了大量的研究工作，基于步态的身份鉴别的研究工作却是刚刚开始。步态识别主要提取的特征是人体每个关节的运动。到目前为止，还没有商业化的基于步态的身份鉴别系统。二、相关研究信息融合：感知融合是人类感知外部世界的本能之一。人类可以非常自然地运用这一能力把来自人体各个感知器官眼耳鼻四肢的信息图像声音气味触觉组合起来并使用先验知识去估计理解和识别周围的环境以及正在发生的事情。融合理论正是对人类这一本能的模仿旨在利用计算机技术对按时序获得的多源观测信息在一定准则下加以自动分析综合以完成所需的决策和估计任务而进行的信息处理过程。信息融合的基本原理就像人脑综合处理信息一样充分利用多源信息通过对这些多源的观测信息的合理支配和使用把多源信息在空间或时间上的冗余或互补依据某种准则来进行组合以获得被测对象的一致性解释或描述。按照信息抽象的个层次可将信息融合分为3级（像素级融合特征级融合和决策级融合）。像素级融合是在采集到的原始数据上进行的融合是原始测报未经预处理之前就进行的综合和分析是最低层次的融合。

【CN110070029A】一种步态识别方法及装置【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910309192.7 (22)申请日 2019.04.17 (71)申请人北京易达图灵科技有限公司地址 100013 北京市朝阳区安定门外大街1 号1幢9层905室 (72)发明人袁飞　华仁红　马向军　孙文凤　 (74)专利代理机构北京路浩知识产权代理有限公司 11002 代理人王庆龙　苗晓静 (51)Int.Cl. G06K 9/00(2006.01) G06K 9/46(2006.01) G06N 3/04(2006.01) (54)发明名称一种步态识别方法及装置 (57)摘要本发明实施例提供一种步态识别方法及装置。方法包括：获取待识别视频中任一行人对应的人体关键点特征向量序列；将人体关键点特征向量序列输入至目标神经网络，根据目标神经网络的输出结果，识别人体关键点特征向量序列对应的行人身份；其中，目标神经网络是根据带有行人身份标签的人体关键点特征向量序列进行训练后得到的。本发明实施例提供的方法及装置，通过获取待识别视频中任一行人对应的人体关键点特征向量序列，并将该序列输入至目标神经网络，根据目标神经网络的输出结果，识别该序列对应的行人身份。通过充分利用人体关键点特征，自学习人体的步态特征，大大提高了步态识别的鲁棒性和准确性，并且，对硬件的要求较低，便于实际应用。权利要求书2页说明书8页附图2页CN 110070029 A 2019.07.30 C N 110070029 A

权　利　要　求　书1/2页CN 110070029 A 1.一种步态识别方法，其特征在于，包括：获取待识别视频中任一行人对应的人体关键点特征向量序列；将所述人体关键点特征向量序列输入至目标神经网络，根据所述目标神经网络的输出结果，识别所述人体关键点特征向量序列对应的行人身份；其中，所述目标神经网络是根据带有行人身份标签的人体关键点特征向量序列进行训练后得到的。 2.根据权利要求1所述的方法，其特征在于，所述获取待识别视频中任一行人对应的人体关键点特征向量序列，包括：获取待识别视频，所述待识别视频中包括若干个行人；对所述待识别视频进行采样，得到多帧图像并组成采样图像序列；将所述采样图像序列输入至人体关键点检测模型，得到所述待识别视频中任一行人对应的人体关键点特征向量序列。 3.根据权利要求1所述的方法，其特征在于，所述将所述人体关键点特征向量序列输入至目标神经网络，之前还包括：获取多个样本视频和每一样本视频中每一行人对应的行人身份标签，并获取每一样本视频中每一行人对应的人体关键点特征向量序列；将每一行人对应的人体关键点特征向量序列和行人身份标签的组合作为一个训练样本，得到多个训练样本并组成训练集；通过所述训练集对原始神经网络进行训练，得到所述目标神经网络。 4.根据权利要求3所述的方法，其特征在于，所述通过所述训练集对原始神经网络进行训练，得到所述目标神经网络，包括：将所述训练集中的任一训练样本输入至所述原始神经网络，根据所述原始神经网络的输出结果和所述训练样本中的行人身份标签计算所述原始神经网络的损失值；若所述损失值小于第一预设阈值，则将所述原始神经网络作为所述目标神经网络。 5.根据权利要求3所述的方法，其特征在于，所述通过所述训练集对原始神经网络进行训练，得到所述目标神经网络，包括：将所述训练集中的任一训练样本输入至所述原始神经网络，根据所述原始神经网络的输出结果和所述训练样本中的行人身份标签计算所述原始神经网络的损失值；若所述损失值小于第一预设阈值，则将所述原始神经网络作为候选神经网络；多次调整所述神经网络的结构，每调整一次则重复执行训练过程以得到对应的候选神经网络，并从得到的多个候选神经网络中选择一个作为所述目标神经网络。 6.根据权利要求5所述的方法，其特征在于，所述从得到的多个候选神经网络中选择一个作为所述目标神经网络，包括：从所述多个候选神经网络中，选择损失值小于第二预设阈值的若干个候选神经网络；基于验证集对所述若干个候选神经网络中的每一候选神经网络进行验证，得到每一候选神经网络的准确率，并将准确率最高的候选神经网络作为所述目标神经网络。 7.根据权利要求1-6任一所述的方法，其特征在于，所述目标神经网络为长短期记忆网络。 8.一种步态识别装置，其特征在于，包括： 2

基于matlab人脸识别技术开题报告

毕业设计（论文）开题报告毕业设计（论文）课题情况，根据所查阅的文献资料，每人撰写2500字以上的文献综述，文后应列出所查阅的文献资料。基于matlab人脸识别技术的实现文献综述一、MATLAB概述 MATLAB是矩阵实验室（Matrix Laboratory）的简称，是美国MathWorks公司出品的商业数学软件，用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境，主要包括MATLAB和Simulink两大部分。MATLAB主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中，为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案，并在很大程度上摆脱了传统非交互式程序设计语言（如C、Fortran）的编辑模式，代表了当今国际科学计算软件的先进水平。应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。而在本文中主要用到的功能是图像处理功能。二、BP神经网络概述人工神经网络（Artificial Neural Net works，简写为ANNs）也简称为神经网络（NNs）或称作连接模型（Connectionist Model），它是一种模范动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。人工神经网络发展的主要历程有:20世纪50年代末,Rosenblatt提出的感知器模型和Widrow提出的自适应线性元件,出现了简单的线性分类器;1986年,Rumelhart和Mcllelland 提出了层网络“误差反向传播算法(BP)”,使有导师学习多层感知器网络(ML PN)模式分类器走向实用化,在此基础上又派生出若干前向网络,如径向基函数网络( RBFN)和函数链网络等;1982年,美国加州工学院的物理学家Hopfield提出的一种用于联想记忆和优化计算的反馈网络模型,由于引进了“能量函数” 的概念,使网络走向具体电路有了保证;20世纪70年代,Watanabe 提出了使用模式子空间的概念来设计不同类别对应的子空间,由不同类别聚类的子空间实现模式识别; Kohonen提出的自组织特征映射网络模型等都为神经网络模式识别理论提供了进一步的根据。构成人工神经网络的三个基本要素是:神经元、络拓扑结构和网络的训练(学习)方法。神经元(节点)的作用是把若干输入加权求和,并对这种加权和进行非线性处理后输出。神经元的选择一般有以下特点:每个神经元都具有多个输入、个输出,具有闭值,采用非线性函数。 1、神经元

面部表情识别实验报告分析

面部表情识别实验实验报告小组成员：面部表情识别实验西南大学重庆 400715

摘要：情绪认知是一种复杂的过程，它包含观察、分析、判断、推理等，是借助于许多线索，特别是借助面部那些活动性更大的肌肉群的运动而实现的。所以，情绪认知的准确度受多种因素的影响。当我们与他人相互交往的时候，不管是不是面对面。我们都正在不断的表达着情绪，同时又正在观察，解释着的对方做出的表情，在人际交往过程中，情绪的表达和认知是十分的迅速和及时，那么人是借助于哪些表情来认知他人的情绪的呢？情绪识别实际上并不是针对表情本身的，而是针对这它背后的意义。例如：皱眉可能是一种情绪的表现，我们见到这种面部表情就试图解释潜在于它背后的情绪。尖锐，短促，声音嘶哑可能是一种情绪表现，我们听到这种语言表情就试图解释潜在于它背后的情绪捶胸，顿足可能是一种情绪的表现，我们见到这种动作表情就是试图解释潜在于它背后的情绪。对于这个复杂的问题，心理学家曾经做过许多的研究。面部表情认知的研究可分为两个步骤：第一步是面部表情刺激物的制作或选择，这可以用专门拍摄(录像)或图示来描画，也可以用完全装扮出的活生生的表情或自发的表情等。第二步时对表情进行识别评定。也可以用多种方法，如自由评定法，即让被试自由地对表情给出情绪词汇；或限制评定法，即向被试提供各种提供各种情绪词汇或情绪情境，要求被试只能根据所提供的情绪词汇或者情绪情境进行分类或者匹配等；或参照自由评定法，即向被试提供参考线索（如情境，人格特征等），让其说出所表达的情绪的词汇等。关键词：情绪表情认知线索

1 前言传统心理学把情绪列为心理现象的三大方面之一。情绪也是心理学理论体系中一个不可缺少的研究环节。情绪（emotion）是体验，又是反应；是冲动，又是行为；它是有机体的一种复合状态。情绪的表现有和缓的和激动的，细微的和强烈的，轻松的和紧张的等诸多形式，广泛地同其他心理过程相联系。自古以来，科学家们十分注意探讨情绪之奥妙，但与情绪的重要性不相适应的是，长期以来情绪研究一直是心理学尤其是实验心理学研究中的一个薄弱环节。造成这一现象的最主要原因是情绪所特有的复杂性以及由此衍生出来的情绪研究方法学上的困难。我国心理学家孟昭兰（1987）将理论认为面部表情是传递具体信息的外显行为面部表情是提供人们在感情上互相了解的鲜明标记。情绪过程既包括情绪体验，也包括情绪表现，而表情既是情绪的外部表现，也是情绪体验的发生机制；既是最敏锐的情绪发生器，也是最有效的情绪显示器。这就从机制上说明了以面部肌肉运动模式作为情绪标志的根据。面部表情（facial expression_r）的发生是有其客观的物质基础的：表情按面部不同部位的肌肉运动而模式化，面部反应模式携带着心理学的意义，那就是或快乐、或悲伤等具体情绪。但是，对表情进行测量的原则在于：所要测量的是面孔各部位的肌肉运动本身，而不是面部所给予观察者的情绪信息。该实验将14名被试分为两组进行表情认知的实验，实验目的在于通过实验了解面部表情认知的基本

人脸检测和识别技术的文献综述

人脸识别技术综述摘要：在阅读关于人脸检测识别技术方面文献后，本文主要讨论了人脸识别技术的基本介绍、研究历史,人脸检测和人脸识别的主要研究方法，人脸识别技术的应用前景，并且总结了人脸识别技术的优越性和当下研究存在的困难。关键词：人脸识别;人脸检测；几何特征方法;模板匹配方法;神经网络方法;统计方法;模板匹配;基于外观方法; 随着社会的发展，信息化程度的不断提高，人们对身份鉴别的准确性和实用性提出了更高的要求，传统的身份识别方式已经不能满足这些要求。人脸识别技术(FRT)是当今模式识别和人工智能领域的一个重要研究方向.虽然人脸识别的研究已有很长的历史,各种人脸识别的技术也很多,但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响,目前还没有一种人脸识别技术是公认快速有效的[1]基于生物特征的身份认证技术是一项新兴的安全技术，也是本世纪最有发展潜力的技术之一[2]。 1. 人脸识别技术基本介绍人脸识别技术是基于人的脸部特征，一个完整的人脸识别过程一般包括人脸检测和人脸识别两大部分，人脸检测是指计算机在包含有人脸的图像中检测出人脸，并给出人脸所在区域的位置和大小等信息的过程[3]，人脸识别就是将待识别的人脸与已知人脸进行比较，得

出相似程度的相关信息。计算机人脸识别技术也就是利用计算机分析人脸图象, 进而从中出有效的识别信息, 用来“辨认”身份的一门技术.人脸自动识别系统包括三个主要技术环节[4]。首先是图像预处理，由于实际成像系统多少存在不完善的地方以及外界光照条件等因素的影响，在一定程度上增加了图像的噪声，使图像变得模糊、对比度低、区域灰度不平衡等。为了提高图像的质量，保证提取特征的有有效性，进而提高识别系统的识别率，在提取特征之前，有必要对图像进行预处理操作；人脸的检测和定位，即从输入图像中找出人脸及人脸所在的位置，并将人脸从背景中分割出来，对库中所有的人脸图像大小和各器官的位置归一化；最后是对归一化的人脸图像应用人脸识别技术进行特征提取与识别。 2. 人脸识别技术的研究历史国内关于人脸自动识别的研究始于二十世纪80年代，由于人脸识别系统和视频解码的大量运用，人脸检测的研究才得到了新的发展利用运动、颜色和综合信息等更具有鲁棒性的方法被提出来变形模板，弹性曲线等在特征提取方面的许多进展使得人脸特征的定位变得更为准确。人脸识别的研究大致可分为四个阶段。第一个阶段以Bertillon，Allen和Parke为代表，主要研究人脸识别所需要的面部特征；第二个阶段是人机交互识别阶段；第三个阶段是真正的机器自动识别阶段；第四个阶段是鲁棒的人脸识别技术的研究阶段。目前，国外多所

文献综述的主要方法

文献综述的主要方法文献综述抽取某一个学科领域中的现有文献，总结这个领域研究的现状，从现有文献及过去的工作中，发现需要进一步研究的问题和角度。文献综述是对某一领域某一方面的课题、问题或研究专题搜集大量情报资料，分析综合当前该课题、问题或研究专题的最新进展、学术见解和建议，从而揭示有关问题的新动态、新趋势、新水平、新原理和新技术等等，为后续研究寻找出发点、立足点和突破口。文献综述看似简单．其实是一项高难度的工作。在国外，宏观的或者是比较系统的文献综述通常都是由一个领域里的顶级“大牛”来做的。在现有研究方法的著作中，都有有关文献综述的指导，然而无论是教授文献综述课的教师还是学习该课程的学生，大多实际上没有对其给予足够的重视。而到了真正自己来做研究，便发现综述实在是困难。约翰W.克雷斯威尔（John W. Creswell）曾提出过一个文献综述必须具备的因素的模型。他的这个五步文献综述法倒还真的值得学习和借鉴。克雷斯威尔认为，文献综述应由五部分组成：即序言、主题1（关于自变量的）、主题2（关于因变量的）、主题3（关于自变量和因变量两方面阐述的研究）、总结。 1. 序言告诉读者文献综述所涉及的几个部分，这一段是关于章节构成的陈述。在我看也就相当于文献综述的总述。 2. 综述主题1提出关于“自变量或多个自变量”的学术文献。在几个自变量中，只考虑几个小部分或只关注几个重要的单一变量。记住仅论述关于自变量的文献。这种模式可以使关于自便量的文献和因变量的文献分开分别综述，读者读起来清晰分明。 3. 综述主题2融合了与“因变量或多个因变量”的学术文献，虽然有多种因变量，但是只写每一个变量的小部分或仅关注单一的、重要的因变量。 4. 综述主题3包含了自变量与因变量的关系的学术文献。这是我们研究方案中最棘手的部分。这部分应该相当短小，并且包括了与计划研究的主题最为接近的研究。或许没有关于研究主题的文献，那就要尽可能找到与主题相近的部分，或者综述在更广泛的层面上提及的与主题相关的研究。 5. 在综述的最后提出一个总结，强调最重要的研究，抓住综述中重要的主题，指出为什么我们要对这个主题做更多的研究。其实这里不仅是要对文献综述进行总结，更重要的是找到你要从事的这个研究的基石（前人的肩膀），也就是你的研究的出发点。在我看来，约翰.W.克雷斯威尔所提的五步文献综述法，第1、2、3步其实在研究实践中都不难，因为这些主题的研究综述毕竟与你的研究的核心问题有距离。难的是第4步，主题3的综述。难在哪里呢？一是阅读量不够，找不到最相

人脸表情识别

图像处理与模式识别 ------人脸表情识别介绍摘要：人脸表情是我们进行交往和表达情绪的一种重要手段，不经过特殊训练，人类对其面部表情往往很难掩饰，所以，通过对人脸表情进行分析，可以获得重要的信息。人脸表情识别是人机交互的智能化实现的一个重要组成部分，也是模式识别、图像处理领域的一个重要研究课题，近几年来，受到了越来越多的科研人员的关注。本文综述了国内外近年来人脸表情识别技术的最新发展状况，对人脸表情识别系统所涉及到的关键技术: 人脸表情特征提取，做了详细分析和归纳。关键词：人脸定位；积分投影；人脸表情识别；流形学习；局部切空间排列Abstract:Facial expression is a kind of important means that we communicate and express the special training, People often difficult to conceal their facial , by the analyzing facial expression, we can obtain important information. Facial expression recognition is an important component that the implementation of human-computer interaction, and an important research topic in the field of pattern recognition, image processing, in recent years, more and more researchers focus on this topic. In this paper,we present the latest development of this area,and give a detailed analysisand summary for facial

人工智能研究方法的文献综述

人工智能研究方法的文献综述 1、前言本文综述了人工智能的主要研究方法，并对各方法进行分析和总结，并阐述了目前人工智能研究方法日趋多样化的研究现状。 2、主题研究方法，对一个问题的研究方法从根本上说分为两种：其一，对要解决的问题扩展到他所隶属的领域，对该领域做一广泛了解，研究该领域从而实现对该领域的研究，讲究广度，从对该领域的广泛研究收缩到问题本身；其二，把研究的问题特殊化，提炼出要研究问题的典型子问题或实例，从一个更具体的问题出发，做深刻的分析，研究透彻该问题，再一般化扩展到要解决的问题，讲究研究深度，从更具体的问题入手研究扩展到问题本身。人工智能的研究方法主要可以分为三类：一、结构模拟，神经计算，就是根据人脑的生理结构和工作机理，实现计算机的智能，即人工智能。结构模拟法也就是基于人脑的生理模型，采用数值计算的方法，从微观上来模拟人脑，实现机器智能。采用结构模拟，运用神经网络和神经计算的方法研究人工智能者，被称为生理学派、连接主义。二、功能模拟，符号推演，就是在当前数字计算机上，对人脑从功能上进行模拟，实现人工智能。功能模拟法就是以人脑的心理模型，将问题或知识表示成某种逻辑网络，采用符号推演的方法，实现搜索、推理、学习等功能，从宏观上来模拟人脑的思维，实现机器智能。以功能模拟和符号推演研究人工智能者，被称为心理学派、逻辑学派、符号主义。三、行为模拟，控制进化，就是模拟人在控制过程中的智能活动和行为特性。以行为模拟方法研究人工智能者，被称为行为主义、进化主义、控制论学派。人工智能的研究方法，已从“一枝独秀”的符号主义发展到多学派的“百花争艳”，除了上面提到的三种方法，又提出了“群体模拟，仿生计算”“博采广鉴，自然计算”“原理分析，数学建模”等方法。人工智能的目标是理解包括人在内的自然智能系统及行为，而这样的系统在实在世界中是以分层进化的方式形成了一个谱系，而智能作为系统的整体属性，其表现形式又具有多样性，人工智能的谱系及其多样性的行为注定了研究的具体目标和对象的多样性。人工智能与前沿技术的结合，使人工智能的研究日趋多样化。 3、总结人工智能的研究方法会随着技术的进步而不断丰富，很多新名词还会被提出，但研究的目的基本不变，日趋多样化的研究方法追根溯源也就是研究问题的两种方法的演变。对人工智能中尚未解决的众多问题，运用基本的研究问题的方法，结合先进的技术，不断实现智能化。人工智能与前沿技术密切联系，人工智能的研究方法必然日趋多样化。 4、参考文献（1）人工智能技术导论廉师友西安电子科技大学出版社2007.8 （2）人工智能研究方法及途径熊才权2005年第三期（3）人工智能学派及其在理论、方法上的观点蔡自兴1995.5 （4）人工智能研究的主要学派及特点黄伟聂东陈英俊2001第三期（5）人工智能研究对思维学的方法论启示尹鑫苏国辉2002.10第四期

面部表情识别与面孔身份识别的独立加工与交互作用机制_汪亚珉

心理科学进展 2005，13（4）：497~516 Advances in Psychological Science 面部表情识别与面孔身份识别的独立加工与交互作用机制* 汪亚珉1，2 傅小兰1 （1中国科学院心理研究所，脑与认知国家重点实验室，北京 100101）（2中国科学院研究生院，北京 100039）摘要面孔识别功能模型认为，面部表情识别与面孔身份识别是两条独立的并行路径。以往诸多研究者都认可并遵循二者分离的原则。但近期研究表明，面部表情识别与面孔身份识别存在交互作用。首先总结和分析已有的面部表情识别的研究成果，评述神经心理学与认知神经科学研究中的论争，然后介绍人脸知觉的分布式神经机制以及相关的实验证据，最后提出面部表情识别与面孔身份识别的多级整合模型，并展望研究前景。关键词面孔身份识别，面部表情识别，面孔识别功能模型，人脸知觉的分布式神经模型，多级整合模型。分类号 B842 面孔识别一直备受研究者关注。20世纪70年代，Ekman和Frisen系统地研究了人脸基本表情的文化普遍性，并从解剖学角度提出了6种基本的面部表情[1]。20世纪80年代，Bruce和Young系统地研究了人对面孔的识别及其影响因素，提出了经典的面孔识别功能模型[2]。自此，面孔识别成为认知科学研究领域中的热点问题之一。人能轻易地从不同表情中识别出同一个人的面孔（即面孔身份识别，facial identity recognition），也能从不同人的面孔上识别出同一种表情（即面部表情识别，facial expression recognition），识别得如此精巧，以至众多研究者相信，识别面孔与识别表情收稿日期：2005-04-24 * 本研究得到中国科技部973项目（2002CB312103）、国家自然科学基金重点项目（60433030）和面上项目（30270466）、中国科学院心理研究所创新重点项目（0302037）经费支持。通讯作者：傅小兰，E-mail: fuxl@https://www.360docs.net/doc/f27160166.html, 两者相互独立，互不干扰[2～7]。那么，这种分离识别究竟是如何实现的？面孔身份识别与面部表情识别究竟是彼此独立的还是相互作用的？这已成为认知科学（尤其是计算机视觉）面孔识别研究领域中亟待解决的一个重要问题。在过去开展的大量研究中，对面孔身份识别问题的探讨相对比较深入，而对面部表情识别的研究则囿于经典功能模型，并未能取得实质性进展。近年来随着脑认知研究技术的发展，面部表情识别的研究也在不断深入，研究者对面部表情识别与面孔身份识别间的关系也提出了新的阐释。本文在综述已有研究的基础上，试图进一步探讨面部表情识别与面孔身份识别之间的独立加工与交互作用机制。首先，基于经典面孔识别功能模型，分析传统的面孔身份识别与面部表情识别的并行分离加工观点，以及行为学、神经心理学与认知神经科学的研究发现；其

模式识别文献综述报告

指导老师：马丽学号：700 班级： 075111 姓名：刘建成绩：目录 ............................................................ 一、报告内容要点............................................................ 二、《应用主成分分解(PCA)法的图像融合技术》............................................................ 三、《基于类内加权平均值的模块 PCA 算法》............................................................

四、《PCA-LDA 算法在性别鉴别中的应用》 ............................................................ 五、《一种面向数据学习的快速PCA算法》 ............................................................ 六、《Theory of fractional covariance matrix and its applications in PCA and 2D-PCA》 ............................................................ 七、课程心得体会 ............................................................ 八、参考文献 ............................................................ 一、报告内容要点 ①每篇论文主要使用什么算法实现什么 ②论文有没有对算法做出改进（为什么改进，原算法存在什么问题，改进方法是什么） ③论文中做了什么对比试验，实验结论是什么？可以加入自己的分析和想法，例如这篇论文还存在什么问题或者缺点，这篇论文所作出的改进策略是否好，你自己对算法有没有什么改进的想法？二、《应用主成分分解(PCA)法的图像融合技术》第一篇《应用主成分分解(PCA)法的图像融合技术》，作者主要是实现用PCA可以提取图像数据中主要成分这一特点，从元图像获得协方差矩阵的特征值和特征向量，据此确定图像融合算法中的加权系数和最终融合图像。作者在图像融合的算法上进行改进，用PCA获得待融合的每幅图像的加权系数Wi。是这样实现的：计算待融合的i幅图像数据矩阵的协方差矩阵，从中获

自发表情识别方法综述

收稿日期：２０１５-０４-０３；修回日期：２０１５-０５-２６基金项目：国家自然科学基金资助项目（６１４６３０３４）作者简介：何俊（１９６９-），男，江西东乡人，副教授，硕导，博士，主要研究方向为人机交互技术、模式识别等（ｂｏｘｈｅｊｕｎ＠ｔｏｍ．ｃｏｍ）；何忠文（１９８６-），男，江西九江人，硕士研究生，主要研究方向为人机交互技术、模式识别等；蔡建峰（１９９０-），男，河北人，硕士研究生，主要研究方向为人机交互；房灵芝（１９８８-），女，山东人，硕士研究生，主要研究方向为人机交互．自发表情识别方法综述* 何俊，何忠文，蔡建峰，房灵芝（南昌大学信息工程学院，南昌３３００３１）摘要：介绍了目前自发表情识别研究的现状与发展水平，详细阐述了自发表情识别研究的内容和方法，以及自发表情识别研究的关键技术，旨在引起研究者对此新兴研究方向的关注与兴趣，从而积极参与对自发表情识别问题的研究，并推动与此相关问题的进展。关键词：表情识别；自发表情；特征提取中图分类号：ＴＰ３９１．４１文献标志码：Ａ文章编号：１００１-３６９５（２０１６）０１-００１２-０５ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１００１-３６９５．２０１６．０１．００３ＳｕｒｖｅｙｏｆｓｐｏｎｔａｎｅｏｕｓｆａｃｉａｌｅｘｐｒｅｓｓｉｏｎｒｅｃｏｇｎｉｔｉｏｎＨｅＪｕｎ，ＨｅＺｈｏｎｇｗｅｎ，ＣａｉＪｉａｎｆｅｎｇ，ＦａｎｇＬｉｎｇｚｈｉ（Ｉｎｆｏｒｍａｔｉｏｎ＆ＥｎｇｉｎｅｅｒｉｎｇＣｏｌｌｅｇｅ，ＮａｎｃｈａｎｇＵｎｉｖｅｒｓｉｔｙ，Ｎａｎｃｈａｎｇ３３００３１，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｔｈｉｓｐａｐｅｒｉｎｔｒｏｄｕｃｅｄｔｈｅａｃｔｕａｌｉｔｙａｎｄｔｈｅｄｅｖｅｌｏｐｉｎｇｌｅｖｅｌｏｆｓｐｏｎｔａｎｅｏｕｓｆａｃｉａｌｅｘｐｒｅｓｓｉｏｎｒｅｃｏｇｎｉｔｉｏｎａｔｔｈｅｐｒｅｓｅｎｔｔｉｍｅ，ａｎｄｐａｉｄｐａｒｔｉｃｕｌａｒａｔｔｅｎｔｉｏｎｔｏｔｈｅｋｅｙｔｅｃｈｎｏｌｏｇｙｏｎｔｈｅｒｅｓｅａｒｃｈｏｆｓｐｏｎｔａｎｅｏｕｓｆａｃｉａｌｅｘｐｒｅｓｓｉｏｎｒｅｃｏｇｎｉｔｉｏｎ．Ｔｈｉｓｐａｐｅｒａｉｍｅｄｔｏａｒｏｕｓｅｒｅｓｅａｒｃｈｅｒｓ’ａｔｔｅｎｔｉｏｎａｎｄｉｎｔｅｒｅｓｔｓｉｎｔｏｔｈｉｓｎｅｗｆｉｅｌｄ，ｔｏｐａｒｔｉｃｉｐａｔｅｉｎｔｈｅｓｔｕｄｙｏｆｔｈｅｓｐｏｎｔａｎｅ-ｏｕｓｆａｃｉａｌｅｘｐｒｅｓｓｉｏｎｒｅｃｏｇｎｉｔｉｏｎｐｒｏｂｌｅｍｓａｃｔｉｖｅｌｙ，ａｎｄｔｏａｃｈｉｅｖｅｍｏｒｅｓｕｃｃｅｓｓｅｓｃｏｒｒｅｌａｔｅｄｔｏｔｈｉｓｐｒｏｂｌｅｍ．Ｋｅｙｗｏｒｄｓ：ｆａｃｉａｌｅｘｐｒｅｓｓｉｏｎｒｅｃｏｇｎｉｔｉｏｎ；ｓｐｏｎｔａｎｅｏｕｓｆａｃｉａｌｅｘｐｒｅｓｓｉｏｎ；ｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎ表情识别被视为未来情感人机交互的重要技术［１］，吸引了国内众多高校和科研机构的参与和研究［２～６］。但目前国内外研究中比较常用的表情数据库中的人脸表情大都固定为正面，任务仅限于识别Ｅｋｍａ提出的六种基本表情（愤怒、高兴、悲伤、惊讶、厌恶和恐惧）。这不仅与实际表情不相符，而且忽视了真实表情中特有的脸部肌肉形变与头部运动之间的时空相关性。谷歌申请的新一代表情识别专利，挤眉弄眼方可解锁手机；荷兰开发的诺达斯（Ｎｏｌｄｕｓ）面部表情分析系统是世界上第一个商业化开发的面部表情自动分析工具，用户使用该系统能够客观地评估个人的情绪变化，可以跟踪人的表情变化。但二者均要求测试者的头姿基本保持不动，实时连续头姿估计阻碍了其在手机等智能终端领域的应用。因此，面向实际应用的非正面表情识别研究在国内外日益受到重视［７，８］。近十几年来，开展自发表情识别研究的机构主要有美国的加利福尼亚大学、卡耐基梅隆大学机器人研究所、匹兹堡大学心理学系，伊利诺伊大学、沃森研究中心、贝克曼研究所、伦斯勒理工学院、麻省理工大学媒体实验室、丹佛大学、德克萨斯大学计算机视觉研究中心、新泽西技术学院、芬兰的奥卢大学计算机科学与工程系机器视觉组、荷兰的阿姆斯特丹大学信息学院、澳大利亚的昆士兰科技大学科学与工程学院、加拿大的麦吉尔大学、日本的庆应义塾大学、爱尔兰的爱尔兰国立大学计算机视觉和成像实验室，中国的清华大学和中国科学技术大学等已经有人做了大量工作。目前该领域比较重要的国际会议包括计算机视觉与模式识别会议（ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ，ＣＶＰＲ）、模式识别会议（ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ，ＩＣＰＲ）、人脸与姿态自动识别会议（ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｕｔｏｍａｔｉｃＦａｃｅＧｅｓｔｕｒｅＲｅｃｏｇｎｉｔｉｏｎ，ＦＧＲ）。关于非正面表情识别的研究文章逐年增多，但国内还只是刚开始涉足该领域的研究［９］，一些非正面表情识别中的关键技术尚有待突破。但总的来说，对目前自发表情识别的研究和探索还处于初级阶段，对自发表情识别的研究还需要研究人员共同的努力。本文介绍了常用的自发表情数据库以及自发表情识别关键技术研究进展。１自发表情数据库１）ＵＳＴＣ-ＮＶＩＥ数据库ＵＳＴＣ-ＮＶＩＥ（ｎａｔｕｒａｌｖｉｓｉｂｌｅａｎｄｉｎｆｒａｒｅｄｆａｃｉａｌｅｘｐｒｅｓｓｉｏｎｓ）数据库［１０］是由中国科学技术大学安徽省计算与通讯软件重点实验室建立的一个大规模的视频诱发的集自发表情和人为表情的可见光和红外自发表情数据库。其中自发表情库由自发的表情序列和夸张帧组成，人为表情库仅由中性帧和夸张帧组成。该表情数据库包含年龄在１７～３１周岁的２１５名被试者的自发和人为的六种表情。２）ＶＡＭ数据库ＶＡＭ数据库［１１］采用的是以参加电视访谈节目（ＴＶｔａｌｋｓｈｏｗ）的方式诱发的自发表情数据库，记录了节目中年龄在１６～６９周岁的６位男嘉宾和１４位女嘉宾总共２０位嘉宾的面部表情和语音信息。该数据集由８３４名评估者使用两种方式进行评估：ａ）采用Ｅｋｍａｎ的六种基本表情类别进行标注；ｂ）第３３卷第１期２０１６年１月计算机应用研究ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓＶｏｌ．３３Ｎｏ．１Ｊａｎ．２０１６

教育研究方法文献综述_0

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 教育研究方法文献综述文献综述报告结构 1、引言：简要描述研究问题的性质，并进一步陈述研究问题（为什么研究） 2、综述的主体：简要报告其他人的发现与观点。通常将相关的研究放在一起讨论，并用小标题进行分类；详细介绍主要的研究工作，略提相对次要的研究策略：时间、流派、代表人物 3、总结：给出已有知识与观点的全貌 4、结论： 5、参考文献：引用过的文献、其他索引（格式引言家庭是知识、价值观、态度、角色和习惯代代相传主要的传播体。通过与家庭系统的互动, 子女形成自己的人格、思维模型和行为方即、家庭是人生最初始和最荃础的教育环境。有研究表明, 家庭环境对青少年的健康发展、学业成绩有着重要影响。那么到底家庭中的哪些因素对子女的学业成绩产生影响，家庭因素又是如何影响子女的学业成就的呢?一系列的研究表明:家庭因素中对子女学业成就产生影响的因素有很多，如家庭环境、父母文化教育程度、父母教养方式、家庭结构、家庭社会经济地位等等。 1，与家庭的社会经济地位相联系的各种客观因素，如家 1 / 17

庭的社会经济地位、家庭的破裂、家长的文化程度及职业类别等；（柳敏峰,徐长江,王黎华. 家庭因素对中学生学业成绩影响的调查研究,[J]. 教育测量与评价, 1674- 1536（ 2010） 03- 0043- 04.）1) 家长的文化程度、文化程度越高，采用情感温暖、理解的教养方式越多，采用拒绝、否认的教养方式则相对较少。从而使孩子增强了信心，培养了学习的兴趣，从而促进了学业成绩的提高。采用《父母教养方式评价量表》以及《家庭教育状况调查表》对德州三中学生进行了关于家长教养方式的调查和统计显示家长的文化程度差别较大且对学生的学业成绩有显著的影响。（【2】刘新宇德州三中学生学业成绩与家庭教育状况的相关性研究【J】山东师范大学教育硕士学位论文 2009）家长的职业 2) 职业为专业技术人员和企事业干部的家长，其子女学业成绩优秀的较多，而工人和个体劳动者的子女相对学业成绩优秀的较少。经分析，专业技术人员和企事业干部一般都具有良好的文化素养，有属于自己的比较理想的事业和职业,对个人的发展也看得很重,他们会通过自己的努力来实现个人的价值，他们有自己的生活目标、兴趣爱好,关注自身的情绪体验。他们多采取民主的教养方式,在精神层面会把自己和孩子视为相互独立的两个主体,尊重孩子的感受和发展。身为工人和个体劳动者的学生父母一般从事体力甚至重体力劳动，还有的为了生计外出打工，一般无自己满意的事业，很难实