人脸朝向识别

合集下载

人脸识别中人脸对齐的使用注意事项

人脸识别中人脸对齐的使用注意事项

人脸识别中人脸对齐的使用注意事项人脸识别技术在现代社会得到了广泛应用,它为安全监控、人脸验证和人脸分析等任务提供了强大的工具。

其中,人脸对齐是人脸识别中一项重要的预处理步骤。

本文将介绍人脸对齐的概念、作用以及在使用过程中需要注意的事项。

首先,我们来了解一下人脸对齐的概念。

人脸对齐指的是通过调整图像中人脸的位置和朝向,使得人脸在图像中的位置一致,并且眼睛、鼻子、嘴巴等特定位置对齐。

这种对齐操作可以有效地减小人脸识别算法受到的传感器、装置等因素的影响,提高人脸识别的准确率和鲁棒性。

人脸对齐在人脸识别中起到了关键的作用。

它可以解决人脸图像中的尺度变化、旋转变化和姿态变化等问题,减小了因为这些因素引起的特征点位置偏移,进而提高了人脸识别的准确度。

此外,人脸对齐还可以减小人脸识别算法对于光照变化和表情变化的敏感性,使得算法更加稳定和可靠。

在使用人脸对齐技术时,有一些注意事项需要我们要考虑到。

首先,由于人脸对齐需要用到人脸特征点的定位,因此要确保特征点的准确性和鲁棒性。

人脸特征点的定位准确性和鲁棒性直接影响到人脸对齐的效果,因此,在使用人脸对齐技术时,需要选择准确率较高的人脸特征点定位算法。

其次,人脸对齐的效果还与对齐算法的选择和参数的设定有关。

近年来,随着深度学习的发展,基于深度学习的人脸对齐算法取得了较好的效果。

在选择对齐算法时,要综合考虑算法的准确度、鲁棒性、计算效率等因素。

并且,对于不同的应用场景,可能需要设定不同的参数,以获得最佳的对齐效果。

另外,人脸对齐时需要考虑到人脸图像的质量和清晰度。

人脸图像的质量和清晰度会影响到对齐算法的效果。

因此,在进行人脸对齐时,务必选择质量较高、清晰度较好的人脸图像,以免对齐结果受到不良图像质量的影响。

此外,人脸对齐还需要考虑到隐私保护的问题。

在进行人脸对齐操作时,需要注意保护个人隐私和信息安全。

比如,在使用公共摄像头进行人脸对齐时,应该确保摄像头不会捕捉到其他人的隐私信息,并将个人信息保密和安全进行。

人脸朝向识别检测

人脸朝向识别检测

人脸朝向识别检测人脸识别技术(FRT)是当今模式识别和人工智能领域的一个重要研究方向。

虽然人脸识别的研究已有很长的历史,各种人脸的识别技术也很多,但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响,目前还没有一种人脸识别技术是公认快速有效的。

人脸朝向识别是一个复杂的模式识别问题,当人脸朝向不同的方向时,眼睛在图像中的位置差别较大。

本文将图片中描述眼睛位置的特征信息通过Sobel边缘算子提取出来作为LVQ神经网络的输入,人脸朝向作为神经网络的输出,利用Matlab工具箱通过对训练集的图片进行训练,得到具有预测识别功能的网络,从而可以对任意给出的人脸图像进行判断和识别。

学习向量量化LVQ(Learning Vector Quantization)神经网络,属于前向神经网络类型,在模式识别和优化领域有着广泛的的应用,其网络结构图如图所示。

LVQ神经网络由三层组成,即输入层、隐含层和输出层,网络在输入层与隐含层间为完全连接,而在隐含层与输出层间为部分连接,每个输出层神经元与隐含层神经元的不同组相连接。

隐含层和输出层神经元之间的连接权值固定为1。

输入层和隐含层神经元间连接的权值建立参考矢量的分量(对每个隐含神经元指定一个参考矢量)。

在网络训练过程中,这些权值被修改。

隐含层神经元(又称为Kohnen神经元)和输出神经元都具有二进制输出值。

当某个输入模式被送至网络时,参考矢量最接近输入模式的隐含神经元因获得激发而赢得竞争,因而允许它产生一个“1”,而其它隐含层神经元都被迫产生“0”。

与包含获胜神经元的隐含层神经元组相连接的输出神经元也发出“1”,而其它输出神经元均发出“0”。

产生“1”的输出神经元给出输入模式的类,由此可见,每个输出】经元被用于表示不同的类。

(3)Sobel算子进行边缘检测Sobel算子是一组方向算子,从不同的方向检测边缘。

Sobel算子不是简单求平均再差分,而是加强了中心像素上下左右4个方向像素的权重,运算结果是一幅边缘图像。

人脸朝向识别 3

人脸朝向识别 3

人脸朝向识别摘 要本文针对人脸五个朝向的识别问题,将抽象的人脸图像转化为具体的数值进行分析,建立了人脸朝向识别模型,简单有效的实现对人脸朝向的识别,正确率达到100%。

首先利用Matlab 软件将人脸图像变成灰度矩阵,并以图像的左上角为O 点,以图像的纵边为x 轴,横边为y 轴,建立直角坐标系。

而后对眼睛的位置进行粗定位,经观察得到眼睛的位置总处于x (60,150),y (40,380)∈∈区域中。

因灰度值越小的点颜色越黑【1】,矩阵中灰度值最小的点即可代表眼点的位置,得到一个眼点坐标11(,)A x y 。

后在排除此点周围30个单位以内所有点的修改矩阵中,重新寻找灰度值最小的点,得到另一个眼点坐标22(,)B x y 。

根据两眼点与中轴线的位置关系,得出两眼点均在人脸中轴左边12(,210)y y <,人脸朝向为左方;两眼点分别位于中轴两边,但中点位置靠左12(200)2y y +<,人脸朝向为左前方;两眼点分别位于中轴两边,且与中轴的距离相差不大12(200220)2y y+<<,人脸朝向为前方;两眼点分别位于中轴两边,但中点位置靠右12(220)2y y +>,人脸朝向为右前方;两眼点均在中轴右边12(,210)y y >,人脸朝向为右方。

最后,对该问题进行了进一步探讨,不仅解决了题中所给人脸图像(图像中轴线与人体中轴线重合)朝向识别问题,还进一步对图像中轴线与人体中轴线不重合的一般性问题提出解答思路。

关键词:人脸朝向、灰度矩阵、眼睛定位1.问题重述人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。

现有一组人脸朝向不同角度时的图像数据,图像来自不同的10个人(详见附件),每人五幅图像,人脸的朝向分别为:左方、左前方、前方、右前方和右方,如图1所示。

图1 人脸图像试建立人脸朝向识别模型,通过对人体脸部的分析确定人脸的朝向。

人脸朝向识别

人脸朝向识别

人脸朝向识别——数模论文一.问题重述人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。

现有10 个人的人脸照片,每人5 幅共计50 张。

每个人5 张照片的人脸朝向分别为:右方、右前方、前方、左前方和左方。

我们需要利用现有图像,建立人脸朝向识别数学模型,实现人脸朝向识别功能。

二.问题分析每张图片由一定的像素确定,每张不同图片互相区分则需要对这些像素进行观察找出其区别于其他图片的典型特征。

我们知道一张图像的像素维数十分庞大,如何实现降维处理并找出其特征点是一个关键。

我们采用了PCA(主成分分析法)降维处理并提取了特征值。

取40 张图片作为训练样本,把40 张图片的特征向量组成一矩阵并归一化处理得到了待训练的特征向量矩阵,这能够减小运算量和加快运算速度。

为了实现对图像的识别,则需要通过对样本的处理来实现对每个方向进行分类,BP 神经网络能够很好的解决这一问题。

输入训练样本后,不断地修改网络参数,即是不断调整权值,阈值使实际输出与目标输出的误差逐渐减小以至趋于零。

这样在一定的误差允许范围内可以得到一个比较准确的分类结果。

然后再选择新的图片按照相同的方法提取特征向量去检验系统的准确率。

三.基本假设1.假设每张图片各点的灰度值是都小于256 的;2.假设每张图片清晰可见,无污迹;3.假设每张图片的人脸方向均是标准的,偏差十分小。

4.假设照片中人物的肤色相同;5.假设照片拍摄过程中,人物所受光照强度相同;6.假设照片拍摄时刻,人物没有过于明显的表情;四.符号说明1. R :相关系数矩阵;2. λi (i = 1, 2,..., p ) :相关系数矩阵的特征值;3. ui(i = 1, 2,..., m) : 特征值对应的特征向量;4. xij : 像素矩阵的第i 行第j 列的灰度值;5. lij (i = j = 1, 2,..., p ) :各主成分载荷;。

基于学习向量量化神经网络的人脸朝向识别方法

基于学习向量量化神经网络的人脸朝向识别方法

基于学习向量量化神经网络的人脸朝向识别方法随着人工智能技术的不断发展,人脸识别技术已经逐渐成为一个不可或缺的应用领域。

而其中的人脸朝向识别技术,更是在多种场景下都有着广泛的应用。

当前的基于学习向量量化神经网络的人脸朝向识别方法,正是一种高效、准确且实用的技术手段。

学习向量量化(Learning Vector Quantization,LVQ)是一种对样本进行分类的神经网络模型。

它通常有监督地学习,通过不断更新权重矩阵,使输入样本在输出空间中分布得更加紧密。

基于这一原理,基于学习向量量化神经网络的人脸朝向识别方法,可以通过训练神经网络,将人脸的朝向信息进行了有效的提取和分类,从而实现对人脸朝向的识别。

具体来说,这种方法首先需要收集大量的人脸图像数据,同时标注它们的朝向信息,以供神经网络进行训练。

在训练过程中,神经网络会将每个样本映射到对应的分类结果中,而这些结果对应着不同的人脸朝向。

经过多轮迭代更新权重的过程,神经网络可以不断优化分类效果,提高对人脸朝向的识别准确率。

与传统的基于特征提取的方法相比,基于学习向量量化神经网络的人脸朝向识别方法具有以下优点:1. 不依赖特征工程,可以避免特征选择和提取的问题,减少了人为因素的干扰,提高了识别的准确性。

2. 通过大量的训练数据,可以提高模型的泛化能力,使其在更加复杂的场景下仍能保持高精度的识别结果。

3. 神经网络可以很好地处理各种类型的数据,包括图像、声音、文本等,因此具有更高的通用性和扩展性。

总之,基于学习向量量化神经网络的人脸朝向识别方法具有着广泛的应用前景。

随着数据量的增加和神经网络技术的不断发展,相信它的性能和效果还会不断提高。

人脸识别技术的使用技巧

人脸识别技术的使用技巧

人脸识别技术的使用技巧人脸识别技术是一种通过分析和比对人脸特征进行身份验证的先进技术。

随着技术的不断进步,人脸识别技术已经广泛应用于各个领域,如门禁系统、手机解锁、人证比对等。

为了更好地应用人脸识别技术,以下是几个使用技巧。

第一,保持合适的距离。

在进行人脸识别时,首先要确保与摄像头之间的距离合适。

一般推荐距离为0.5米至2米之间。

如果距离太近或太远,可能会导致识别失败或识别准确率降低。

因此,在使用人脸识别设备时要注意保持合适的距离。

第二,保持正脸。

人脸识别技术对于正脸的识别准确率较高,因此,在进行人脸识别时要尽量保持正脸朝向摄像头。

避免侧脸、低头或仰头等姿势,以免影响识别效果。

同时,要保持面部表情自然,不要做出夸张的表情,以提高识别准确率。

第三,注意光线条件。

光线条件的好坏直接影响人脸识别技术的效果。

在光线暗的环境下,可能会导致图像模糊、细节不清晰,从而影响识别准确率。

因此,在使用人脸识别设备时,要选择光线充足的环境,避免直接面对强光源,以获得更好的识别效果。

第四,定期更新人脸库。

人脸库是人脸识别技术的重要组成部分,包含了需要识别和比对的人脸信息。

为了提高识别准确率,定期更新人脸库非常重要。

随着时间的推移,人脸可能会发生变化,如年龄增长、发型改变等,如果不及时更新人脸库,可能导致无法识别的情况发生。

因此,要定期检测和更新人脸库,确保人脸信息的及时、准确。

第五,合理设置识别阈值。

识别阈值是人脸识别系统中的一个重要参数,用来控制识别的容错率和准确率。

阈值越高,识别的容错率越低,准确率越高;阈值越低,识别的容错率越高,准确率越低。

在使用人脸识别技术时,要根据实际需求和场景,合理设置识别阈值,确保满足安全性和便利性的要求。

第六,保护用户隐私。

在使用人脸识别技术时,保护用户的个人隐私是非常重要的。

要确保人脸识别系统的安全性,防止人脸数据被非法获取和滥用。

同时,在收集和使用人脸数据时,要遵循相关法律法规,取得用户的明确同意,严格限制数据的使用范围,加强数据保护措施,以保护用户的个人隐私权益。

人脸朝向识别

人脸朝向识别

基于BP网络的人脸朝向识别模型问题重述:人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。

现有一组人脸朝向不同角度时的图像数据,图像来自不同的10个人(详见附件),每人五幅图像,人脸的朝向分别为:左方、左前方、前方、右前方和右方,如图1所示。

图1 人脸图像试建立人脸朝向识别模型,对人脸的朝向进行识别。

1.问题的背景:人脸识别特指利用分析比较人脸视觉特征信息进行身份鉴别的计算机技术。

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,如人脸图像采集、人脸定位、人脸识别预处理、身份确认及身份查找等; 而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。

人工神经网络对人脸识别的研究也越来越广泛。

人工神经网络是一个非线性的有向图, 图中含有可以通过改变权大小来存放模式的加权边,并且可以从不完整的或未知的输入找到模式。

人工神经网络系统自诞生以来, 由于它固有的自学习、自适应、自组织和大规模并行处理能力, 以及具有信息的分布存储、并行处理意见自学能力等优点, 已经在信息处理、模式识别、智能控制、系统建模、系统辨识及优化等领域得到越来越广泛的应用。

尤其是基于误差反向传播算法的多层前馈网络(简称BP网络) , 可以以任意精度逼近任意的连续函数, 所以广泛应用于非线性建模、函数逼近、模式分类等方面。

可以说, BP 网络是人工神经网络中前向网络的核心内容, 体现了人工神经网络精华的部分。

一个具有r个输入和一个隐含层的神经网络模型结构如图3所示。

图3 具有一个隐含层的神经网络模型结构图BP网络的产生归功于BP算法的获得。

BP算法属于δ算法,是一种监督式的学习算法。

其主要思想为:对于q个输入学习样本:P1,P2,……P q,已知与其对应的输出样本为:T1,T2,……T q。

学习的目的是用网络的实际输出A1,A2,……A q,与目标矢量T1,T2,……T q,之间的误差来修改其权值,使A l,(l=l,2…,q)与期望的T l尽可能地接近;即:使网络输出层的误差平方和达到最小。

基于人工神经网络的人脸朝向识别模型

基于人工神经网络的人脸朝向识别模型

基于人工神经网络的人脸朝向识别模型基于人工神经网络的人脸朝向识别模型摘要:人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是模式识别中一个无法回避的问题。

本文针对此问题,建立了基于人工神经网络的人脸朝向识别模型。

首先,采用基于边缘检测Sobel算子的人脸特征向量提取,把图像转换为6行8列像素值,实现了人脸识别的特征提取,作为神经网络的输入。

然后根据实际情况,考虑到误差因素,我们创建一个3层的BP神经网络,输入层8个神经元,输出层3个神经元,中间层17个神经元。

选取50张人脸图像中的前30张,作为神经网络的训练样本,通过长达11分钟的训练,我们得到了比较好的网络。

接着,把训练好的神经网络用于测试剩余的20张人脸图像,输出的朝向结果与输入的朝向结果完全一致,识别率100%。

在BP网络中,由于我们采用了0.01的学习率,虽然识别率很高,但大大延长了网络的训练时间。

因此,我们觉得有必要建立一种训练时间和训练效果都较好的神经网络模型。

参照模型一,我们接着又建立了基于LVQ神经网络的人脸朝向识别模型二。

用于训练的样本和测试的样本都跟模型一相同。

与BP神经网络模型相比,不仅大大缩短了训练时间(缩短为1秒),而且保证了识别率为100%。

因此,针对人脸朝向识别的问题,采用基于LVQ神经网络的模型更好一些。

最后,我们从图像特征提取和神经网络构建两个方面出发,提出了可行的模型改进方法。

关键字:人脸朝向识别;BP神经网络模型;LVQ神经网络模型一、问题的重述人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。

现有一组人脸朝向不同角度时的图像数据,图像来自不同的10个人(详见附件),每人五幅图像,人脸的朝向分别为:左方、左前方、前方、右前方和右方。

现在需要建立人脸朝向识别模型,对人脸的朝向进行识别。

二、模型假设及符号说明1、模型的假设①所给的全部人脸图像都未出现损坏等问题;②人脸朝向仅分为5类:左、左前、前、右前、右,其他朝向不予考虑;③对于题目中所给的人脸图像,不考虑人脸的复杂表情问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人脸朝向识别摘要本文研究的是根据人脸图像对其朝向角度进行识别的问题。

首先,运用基于边缘检测Canny算子的随机Hough变换来定位瞳孔和鼻尖的坐标。

然后在人脸平面图上构造向量,计算偏向系数P。

将前30张人脸朝向图的P值作为参考数据,分析其特点以确定模型的识别区间。

然后利用标定好的识别模型对余下图片的人脸朝向进行识别并与实际朝向进行对比,得到模型的识别率r为XX,误判一张。

关键词:人脸朝向识别边缘检测随机Hough变换一.问题重述人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。

现有一组人脸朝向不同角度时的图像数据,图像来自不同的10个人(详见附件),每人五幅图像,人脸的朝向分别为:左方、左前方、前方、右前方和右方,如图一所示。

图一人脸图像试建立人脸朝向识别模型,对人脸的朝向进行识别。

二.模型假设1.人脸朝向只分左,左前,前,右前,右5个方向,其余朝向不予考虑:2.不考虑人脸中的复杂表情对提取的特征的影响。

三. 符号说明A 向左的人脸图像的集合 B向左前方的人脸图像的集合 C 向正前方的人脸图像的集合D 向右前方的人脸图像的集合 E向右的人脸图像的集合i d 边缘点集中的第i 个元素a x 提取的左眼点的横坐标b x 提取的右眼点的横坐标c x 提取的鼻子的点的横坐标a y 提取的左眼点的纵坐标b y 提取的右眼点的纵坐标c y 提取的鼻子的点的纵坐标两眼连线方向上的单位向量OMOM 方向的向量 P偏向系数r 模型识别率四. 问题分析题目要求建立人脸朝向识别模型,对10个人的不同朝向的脸进行识别。

由于所给的图片是二维的平面图,不同朝向的人脸的特征部位,如眼睛,鼻子,嘴等的位置差别明显,故将此作为识别朝向的依据。

根据得到的特征点坐标进行向量运算将此差别量化,再选择部分图片作为样本对偏向系数标定,就可以得到朝向识别的模型。

最后用模型对余下图片进行识别并分析其识别性能。

五. 模型的建立与求解5.1 Canny 算子进行边缘检测人脸图像存在多种影响识别效果的因素:采集环境光照,采集设备噪声,图像背景、服饰、发型,图像高维度。

在识别前, 需要对图像进行预处理。

然后再选择在图像去噪和边缘细节保留上具有相对较好的平衡的Canny 算子检测边缘。

5.1.1 高斯滤波消除噪声噪声也属于高频信号,图像处理之前需要先经过去噪,选择使用高斯滤波模板对图像进行卷积。

由高斯函数222(,)exp2y mx m x m y mx y G x y δ++--+=-∑∑,其中12n m -=即可得到图像中点的灰度A (x ,y )经过平滑滤波得到灰度值G (x ,y )。

5.1.2 求出偏导数图像的边缘有方向和幅度两个特征,通常沿边缘方向的像家变化剧烈,这种变化(不连续性)常可以利用求一阶导数的方法来检测边缘。

使用微分算子求G (x ,y )的偏导数⎥⎦⎤⎢⎣⎡--∙=⎥⎦⎤⎢⎣⎡--∙=111121G ,111121G y x , 梯度大小xy B B arctan,B B B 2y2x =+=θ。

由此得到偏导数'(,)x y G B B 。

5.1.3 非极大值抑制得到初步边缘点沿幅角方向检测磨制的极大值点即边缘点,遍历8个方向图像像素,把每个像素偏导值与相邻像素的模值比较,取其max 值为边缘点,置像素灰度值为0.8个临域幅角方向如表一所示。

图一 边缘方向示意图1 076543 25.1.4 双阀值检测由于单阈值处理时,合适的阈值选择较困难,常常需要采用反复试验,因此采用双阈值检测算法。

对经过非极大值抑制后的图像作用两个阈值th1,th2,th1=0.4th2,两个阈值作用后得到两个图像1、2,较大阈值检测出的图像2去除了大部分噪声,但是也损失了有用的边缘信息。

较小阈值检测得到的图像1则保留着较多的边缘信息,以此为基础,补充图像2中的丢失的信息,连接图像边缘即得到检测结果。

对题目所给图像文件中的人脸朝向图(1-1)进行边缘检测结果如图一所示。

图二 Canny边缘检测的结果5.2 随机Hough变换提取面部特征Hough 变换是图像处理中从图像识别几何形状的基本方法之一,应用很广泛。

Hough 圆检测可靠性高,对噪声、变形、部分区域残缺、边缘不连续等有较好的适应性。

可用改进后的随机Hough变换定位瞳孔的坐标111E x y,(,)E x y和222(,)将其作为眼睛的精确定位。

5.2.1 确定瞳孔圆参数参数d x , y至集合D ,并记录各点的首先构造边缘点集D存储所有边缘点()i i i梯度方向,初始化参数单元集P = NULL 。

然后从D 中随机选取3点()111d x , y ,()222d x , y ,()333d x , y ,代入下式22x + y + 2ax + 2by + c = 0计算这3点所确定的圆的参数p (a ,b ,c )。

然后判断法线方向与梯度之差是否在允许的范围内,若是则进行下一步,否则重新选择一组点知道符合为止。

5.2.2 检测人在P 中寻找候选圆c p ,满足c p p δ-<,δ是允许误差,若找到则转进行下一步,否则将p 插入P ,令其计数值为1。

若a - r < x i < a + r 且b - r < y i < b + r ,则计算d i 到候选圆心的距离, 若在允许的误差δ范围内,则将计数值加1 ,遍历正方形范围内所有的点。

当该参数对应的圆上的点数 min Mpc M >时,进行下一步,不然的话该圆为虚假圆,把该圆的参数特征从P 中剔除。

若检测到的为真实圆,判断已经检测到的圆是否已经达到了规定的数目,若是,则结束找寻;不然把圆上的点从边缘点集中除去,重置P=NULL 再进行找寻,直到合格为止。

图三 随机hough 变换得出瞳孔的圆同样运用MATLAB 的程序进行操作,提取鼻子的特征值。

5.2.3 确定瞳孔和鼻子的坐标根据上一步提取的特征,可以得到双眼的坐标(,)i i i E x y 左和(,)i i i E x y 右以及鼻子的坐标(,)i i i M x y 。

图四 眼睛的坐标表示5.3 人脸朝向分析参数的产生精确定位出眼睛和鼻子之后,特征提取的工作就完成了。

接下来,我们要分析出人脸朝向。

为了避免脖子和头发的干扰,我们取眼睛以下,嘴部以上区域进行分析。

5.3.1 计算模板准备选出一个正脸程度较好的人脸图像, 并且将该图像做Canny 边缘检测和随机Hough 变换后得到的人脸图和数据作为标准正向大头人脸模板。

双眼的坐标0a a x y E 左(,)和0b b x y E 右(,),a ,b=0,1,2,3,…通过查阅相关医学资料可得知,成人的眼部到嘴部的垂直距离一般在5cm 到7cm 之间,本题中我们对嘴的具体坐标的要求并不需要太精确,遂取其值为6cm 。

两眼的距离为0l ,0l =嘴的坐标为 0(,-6)22a b a bx x y y Z ++x鼻子的坐标为0c c (x y )M ,5.3.2 图像深度还原将要进行识别的人脸图片与事先取得的正向人脸模板中人脸外接矩形分别标出。

由于所给的图片都是相同规格的,图片上的相同线段的长度表示的实际距离相同。

将图片的边框作为人脸的外接矩形标出来。

5.3.3 判断标度的刻画 5.3.3.1 算法构造选取题目所给出的不同朝向的人脸图片1-1到6-5共30张图片,假设每张脸都将双眼的中点记为O ,则O 点得坐标为0(,)22a b a bx x y y O ++式中a ,b 均取1,2,3,…,19,20。

以O 点为起始点作沿双眼所在直线水平向右的单位向量λ,λ=(1,0)。

鼻子与中心点O的向量为OM(,)22a b a bc c x x y y OM x y ++=--将向量OM与单位向量λ进行向量相乘,其结果为P1()0()22a ba bc c x x y y P x y ++=⨯-+⨯-2a bc x x P x +=-图五朝向右前方的人脸的坐标图六朝向正前方的人脸的坐标5.3.3.2 刻画标度将经过前面步骤处理后的1-1到6-5号人脸朝向图片的相应的坐标值代入向量运算,计算出其P值。

将不同朝向的脸分别用A,B,C,D,E五个集合表示,其中A代表朝向左的人脸,B代表朝向左前方的人脸,C代表朝向正前方的人脸,D 代表朝向右前方的人脸,E代表朝向右的人脸。

将1-1到6-5每张脸所对应的P值放入该朝向的脸所对应的集合中去,再将各集合中的元素进行数据统计,得到每个集合所含元素的取值范围,结果如表二所示。

表二各集合的P值取值范围人脸朝向集合 A B C D E元素最大值Pmax元素最小值Pmin5.4 人脸的朝向进行识别5.4.1 人脸的朝向进行识别运用上述模型对余下的人脸朝向图片7-1到10-5分别进行一系列处理,最后计算得到P值。

将P与表二中的数据进行比对,将图片放入其所属的集合中去。

根据集合所代表的含义既可知道该图片中的人脸的朝向,结果如表三所示。

5.4.2 识别结果分析将运用模型进行人脸朝向识别所得的结果与真实的情况进行比对,统计识别正确的图片的数目n以及模型的人脸朝向识别的正确率r,结果如表四所示。

表三余下图片的识别结果图片7-1 7-2 7-3 7-4 7-5 8-1 8-2 8-3 8-4 8-5 编号识别朝向E D C B A E D C B A真实朝向9-1 9-2 9-3 9-4 9-5 10-1 10-2 10-3 10-4 10-5 图片编号识别朝向真实 E D C B A E D C B A表四模型识别结果的分析正确识别数n识别正确率r六.模型的评价与推广6.1 模型的优点1.在进行图片特征提取的时候,运用了改进的随机Hough变换的方法,不仅能有效而准确地精确定位人眼,而且处理速度也有了明显的提高。

2.将人脸朝向的问题转化为人脸平面图上的向量运算,将抽象的问题具体化,使模型简明易懂。

6.2 模型的缺点与改进由于题目只要求识别5个方向的朝向,为了简化运算和求解的过程,我们所建立的模型对数据的处理和最后结果的规划并没有做更精确的处理。

再将该模型运用到人脸具体朝向角度的识别时,应该双眼连线与冠状面的夹角的正弦来标度,这样得到的改进模型就可以识别到人脸朝向图的具体方位了。

杨增俊兰聪刘向前参考文献[1] 秦贵和,李宝玲.车载MOST网络音频播放节点的设计[J].计算机工程与应用,2007,43(26):94-96.[2] 沈杰,王正群等. 基于连续隐马尔可夫模型的人脸识别方法.[J]计算机工程与设计,2008,2(3):707~709.[3] 张明恒.基于面部朝向的驾驶员精神分散监测方法研究[D].吉林:吉林大学交通学院,2007.[4] 陈锐,李辉等.由人脸朝向驱动的多方向投影交互系统.小型微型计算机系统,2007 年4 月第4 期。

相关文档
最新文档