人脸检测与跟踪模型
人脸检测与识别的方法

人脸检测与识别的方法一、传统方法1.图像金字塔图像金字塔是指通过对图像进行多次减采样或加采样得到一系列分辨率不同的图像。
人脸检测中使用图像金字塔可以将输入图像在不同尺度下进行处理,从而实现对不同尺度的人脸进行检测。
2. Haar特征和级联分类器Haar特征是指用于检测人脸的一种灰度特征,它可以通过计算图像上不同区域的灰度差值来表示。
级联分类器是指通过级联多个简单的分类器来构建一个复杂的分类器,用于对图像中的人脸进行分类。
通过结合Haar特征和级联分类器可以实现高效的人脸检测。
3.高斯混合模型与皮肤颜色模型高斯混合模型是指将图像中的像素分布建模为几个高斯分布的加权和,通过对图像进行颜色建模可以用于判断像素是否属于人脸区域。
皮肤颜色模型是一种常用的方法,通过对肤色像素的统计分析可以辅助人脸检测。
二、深度学习方法1.卷积神经网络(CNN)卷积神经网络是一种深度学习模型,通过使用包含卷积层和池化层的结构可以从原始图像中学习到人脸特征。
通过在大量标注有人脸的数据集上进行训练,可以实现高效准确的人脸检测和识别。
2.目标检测框架目标检测框架是一种深度学习模型,通过将图像中的人脸看作一个目标并进行检测和定位。
常用的目标检测框架包括RCNN系列(如Faster RCNN、Mask RCNN)和YOLO系列(如YOLOv3)。
这些框架可以同时实现人脸检测和人脸识别。
3.人脸关键点检测人脸关键点检测是指通过深度学习模型来预测人脸中的关键点位置,如眼睛、鼻子、嘴巴等。
通过检测人脸关键点可以实现更加准确的人脸检测和识别。
常用的人脸关键点检测方法包括人脸解析模型(如BlazeFace)和人脸关键点检测模型(如Hourglass)。
总结:传统方法主要包括图像金字塔、Haar特征与级联分类器、高斯混合模型和皮肤颜色模型等;而深度学习方法主要包括卷积神经网络、目标检测框架和人脸关键点检测等。
随着深度学习技术的发展,深度学习方法在人脸检测与识别中取得了更好的表现,但传统方法在一些特定场景下仍然具有一定的优势。
掌握人脸识别技术的实时检测和跟踪功能

掌握人脸识别技术的实时检测和跟踪功能人脸识别技术是一种基于人脸图像进行身份验证和识别的先进技术。
随着人工智能的快速发展,人脸识别技术已经在许多领域得到广泛应用,包括安防、金融、社交媒体等。
其中,实时检测和跟踪功能是人脸识别技术的重要组成部分,它能够快速、准确地检测和跟踪人脸,并通过匹配数据库中的信息实现身份验证或者识别。
实时检测功能是指能够在实时视频流中快速检测到人脸的能力。
人脸检测是人脸识别技术的首要步骤,它能够从图像或视频中准确地定位和提取人脸区域。
实时检测功能能够迅速响应,实时处理来自监控摄像头等设备的视频流,实时提取人脸区域并进行后续处理。
这种功能在安防领域有着广泛的应用,可以用于识别陌生人或者搜寻失踪人员。
此外,在社交媒体平台中,实时检测功能还可以用于自动拍照时自动识别人脸并进行美颜等美化处理。
而跟踪功能是指能够在连续的视频帧中准确追踪并跟踪人脸的能力。
在实时监控视频中,人脸往往会在不同的帧中出现在不同的位置,并且可能出现旋转、遮挡和光照变化等问题。
跟踪功能能够通过连续的图像处理和目标跟踪算法,实时准确地追踪并跟踪人脸。
这种功能在安防领域起着重要的作用,可以用于定位和追踪可疑人员,并进行实时监控和报警。
要实现人脸识别技术的实时检测和跟踪功能,需要结合图像处理、机器学习和深度学习等技术。
首先,利用图像处理技术,对视频流中的每一帧进行预处理,提高图像质量和减少噪声,为后续的人脸检测和跟踪提供清晰的图像。
其次,用机器学习算法训练模型,提取人脸特征并建立人脸数据库,为后续的身份验证和识别提供基础。
最后,利用深度学习算法,训练神经网络模型,实现人脸检测和跟踪功能。
这样可以提高人脸识别的准确性和速度,并在大规模数据集上具有较好的泛化能力。
当然,在实现实时检测和跟踪功能时,还需要注意一些问题。
首先,考虑到人脸识别涉及个人隐私,必须保证数据的安全性和隐私保护,不得滥用或泄露用户的个人信息。
其次,要克服光照、遮挡和表情变化等因素的干扰,提高人脸识别技术的鲁棒性和稳定性。
天网工程人脸识别方案

天网工程人脸识别方案一、人脸识别技术的工作原理人脸识别技术是通过摄像头采集到的人脸图像,进行特征提取和比对分析,确定其身份信息。
其工作原理主要涉及到图像采集、图像处理和身份验证三个主要过程。
1.1 图像采集图像采集是人脸识别技术的第一步,重要的一步。
摄像头通过采集到的人脸图像,获取到人脸的外部轮廓、眼睛、鼻子、嘴巴等特征点,然后转化为数字化的数据进行处理。
1.2 图像处理图像处理是对采集到的人脸图像进行预处理和特征提取的过程。
包括人脸的检测、姿态校正、光照补偿、模糊处理等操作,以提高识别精度和鲁棒性。
1.3 身份验证身份验证是通过已有的人脸图像数据库,对采集到的人脸图像进行比对分析,确定其身份信息。
结合特征匹配、模式识别等算法,来实现精准和高效的人脸识别。
二、天网工程中人脸识别技术的应用场景在天网工程中,人脸识别技术被广泛应用于智慧城市、交通管理、治安防控等领域,具有以下几个主要的应用场景:2.1 智能视频监控通过人脸识别技术,可以将摄像头采集到的实时视频图像进行实时分析,实现对人脸的检测、识别、跟踪等功能,提高视频监控系统的智能化水平,提高对异常行为的识别和处理能力。
2.2 公共安全人脸识别技术可以协助执法机关对犯罪嫌疑人进行追踪、布控,提高破案的效率。
同时可以对重点地区、重点场所实施人员管理和访问控制,提高公共安全感。
2.3 交通管理利用人脸识别技术,可以识别违章驾驶人员,提高违章行为查处的效率,并可以对交通违章行为实施自动处罚,提高交通管理的科学性和规范性。
2.4 社会服务通过人脸识别技术,可以实现公共交通、餐饮购物、门禁出入的便捷化和智能化,提高用户体验和便利性。
2.5 智能支付人脸识别技术可以实现人脸支付,增加支付的安全性和便利性,提高金融支付的智能化水平。
以上这些应用场景,都展现了天网工程中人脸识别技术的重要性和应用前景。
三、天网工程中人脸识别技术的关键技术及挑战在天网工程中,人脸识别技术实现起来存在一些关键的技术和挑战。
人脸表情识别AI技术中的人脸表情分析和识别模型

人脸表情识别AI技术中的人脸表情分析和识别模型近年来,随着人工智能技术的不断发展,人脸表情识别AI技术逐渐引起了人们的关注。
人脸表情分析和识别模型作为其中重要的一环,对于实现准确的表情识别起着至关重要的作用。
本文将对人脸表情分析和识别模型进行探讨,以期加深对这一技术的理解。
一、人脸表情分析模型人脸表情分析模型是指通过对人脸图像进行处理和分析,来判断人脸表情所属类别的技术。
在这个模型中,首先需要进行人脸检测和人脸关键点定位的工作,以准确获取人脸区域及各个面部特征点的位置。
之后,通过提取人脸的纹理特征,如颜色、纹理等,将其转化为数值特征向量。
接着,利用机器学习算法对这些特征向量进行训练,构建分类器模型,从而实现对不同表情的识别和分类。
目前,常见的人脸表情分析模型主要包括传统的机器学习模型和深度学习模型。
传统的机器学习模型,如支持向量机(SVM)、人工神经网络(ANN)等,需要手动选择和提取特征,并通过特定的算法进行训练。
而深度学习模型则通过多层神经网络的结构,自动学习图像中的特征,进一步提升了模型的准确性和鲁棒性。
在人脸表情分析中,深度卷积神经网络(CNN)是最经典的深度学习模型之一。
它通过多层卷积层和池化层的组合,能够高效地提取图像中的特征。
此外,针对表情识别任务,还可以采用循环神经网络(RNN)结构来捕捉序列信息,如长时间的表情变化。
这些深度学习模型在表情识别准确度上取得了较好的效果,并已经在实际应用中取得了广泛的应用。
二、人脸表情识别模型人脸表情识别模型是建立在人脸表情分析的基础上,通过对人脸表情的判别来实现对具体表情的识别。
在这个模型中,首先需要将输入的人脸图像进行预处理,包括图像的归一化、去噪、增强等操作,以提高识别的准确性。
接着,通过训练好的表情分析模型获取图像中人脸的表情类别。
最后,通过与预先设置的表情库进行对比,确定输入图像所表达的具体表情。
人脸表情识别模型的准确度和鲁棒性直接受到表情分析模型的影响。
人脸追踪的应用原理

人脸追踪的应用原理1. 什么是人脸追踪人脸追踪是一种计算机视觉技术,用于在视频或图像序列中检测和跟踪人脸。
它通过分析图像中的特征点、形状、纹理等信息,识别人脸并跟踪它们的运动。
人脸追踪技术在许多领域有广泛的应用,包括人机交互、安防监控、虚拟现实等。
2. 人脸追踪的技术原理人脸追踪的技术原理可以分为以下几个步骤:2.1 人脸检测人脸追踪首先需要进行人脸检测,即在图像中确定人脸位置。
常用的人脸检测算法包括基于特征的方法、基于分类器的方法和基于深度学习的方法。
其中,基于深度学习的方法如使用卷积神经网络(Convolutional Neural Networks,CNN)进行人脸检测,能够取得较好的检测效果。
2.2 人脸特征点定位在人脸检测的基础上,需要进一步定位人脸的关键特征点,如眼睛、鼻子、嘴巴等位置。
这些特征点的定位可以通过监督学习方法、回归方法或深度学习方法来实现。
通过人脸特征点的定位,可以更精确地描述人脸的形状和姿态。
2.3 人脸跟踪人脸跟踪是指在连续的图像帧中追踪人脸的运动。
人脸跟踪算法通常基于人脸的运动模型来预测下一帧中的人脸位置,并通过与当前帧中的实际位置进行比较来更新模型。
常见的人脸跟踪算法包括基于颜色和纹理的方法、基于特征点的方法和基于深度学习的方法。
3. 人脸追踪的应用人脸追踪技术在许多领域有广泛的应用,包括但不限于以下几个方面:3.1 人机交互人脸追踪可以用于人机交互,实现人脸识别、表情识别、眼球跟踪等功能。
例如,人脸追踪可以用于游戏中的头部追踪,实现头部动作的实时捕捉,并将其应用于虚拟现实游戏中。
3.2 安防监控在安防监控领域,人脸追踪可以用于识别和跟踪潜在嫌疑人。
通过与数据库中的人脸特征进行比对,可以实时发现目标人物的行踪,并提供给相关部门进行进一步的处理。
3.3 虚拟现实人脸追踪在虚拟现实领域也有广泛的应用。
通过追踪用户的面部表情和眼球运动,可以实时调整虚拟现实场景的渲染效果,提升用户的沉浸感。
人脸识别技术的算法模型

人脸识别技术的算法模型人脸识别技术是计算机视觉领域中的一道难题,主要任务是通过数字图像或视频中的人脸来确认其身份。
目前,该技术已经成为了许多领域的关键工具,如边境管理、视频监控、金融服务等。
其应用领域的广阔和市场潜力的巨大,让人脸识别技术受到了越来越多的关注和研究。
那么人脸识别技术的算法模型是怎样的呢?一、人脸检测模型人脸识别的第一步是人脸检测。
其目的是从背景中准确确定人脸的位置。
常用的人脸检测方法包括Haar检测器、基于区域的CNN(R-CNN)、YOLO(You Only Look Once)等。
Haar检测器是基于Haar特征的一种传统的人脸检测模型。
它先将图像分成不同的区域并计算出每个区域内的Haar特征值,再通过AdaBoost算法进行分类,最后使用级联分类器对人脸进行检测。
R-CNN是在2014年提出的一种发现物体的方式,它需要在大量图像中共同学习目标物体的检测和分类。
该方法使用了区域建议网络(RPN)来生成可能的物体位置区域,然后再对这些区域进行分类。
YOLO是一种全新的目标检测算法,其优点是速度快,准确率高且可以检测多个物体。
该模型将图像分为多个格子,并对每个格子使用卷积神经网络进行分类和回归,最后再通过非极大值抑制来排除重叠的检测框。
人脸对齐模型的目的是将检测到的人脸对齐,以便在后续的特征提取过程中提高准确性。
常见的对齐方法包括在人脸上标记关键点(即人脸特征点)和基于三维模型的人脸对准方法。
基于关键点的对齐方法目前是最常用和最有效的方法之一。
该方法通过在人脸上标记多个关键点来确定人脸的几何形状,然后将脸部旋转、缩放和平移等变换以进行对齐。
人脸特征提取是人脸识别的核心过程,这是由于人脸图像所包含的信息太多太杂,而且不同人之间的面部特点也具有很强的差异性。
人脸识别模型的目的是提取出鲁棒性、代表性和可重复性强的特征来。
常见的模型包括Eigenface、Fisherface、LBPH(Local Binary Patterns Histograms)、DeepFace、VGGFace等。
cla概念 -回复

cla概念-回复什么是CLA?CLA,全称为Constrained Local Models(约束局部模型),是一种计算机视觉算法,用于人脸识别和人脸定位等领域。
它可以根据面部特征和形状进行人脸定位和识别,并且在不同角度、表情和光照等情况下都能取得较好的效果。
CLA算法的核心思想是使用形状约束和局部特征相结合的方式来进行人脸识别和定位。
CLA的工作原理:1. 特征点检测:CLA首先通过特征点检测算法,如SIFT(尺度不变特征变换)或SURF(加速稳健特征)等,提取出输入图像中的关键点。
这些关键点主要位于面部特征,如眼睛、鼻子、嘴巴等区域。
2. 形状建模:CLA使用训练数据集中的人脸样本来建立形状模型。
形状模型是通过对人脸样本的特征点进行统计建模得到的,可以表示不同人脸形状的变化范围。
形状模型通常采用主成分分析或保形变换来表示。
3. 特征描述:CLA使用局部特征描述子来表示面部特征,如LBP(局部二值模式)或HOG(方向梯度直方图)等。
这些描述子能够捕获面部特征的纹理和结构信息。
4. 人脸跟踪:CLA通过匹配当前帧中提取的特征点与形状模型进行匹配,从而实现人脸的跟踪。
具体来说,CLA使用细化的回归模型来更新特征点的位置,以减小跟踪误差。
5. 反变换:CLA采用反变换来校正图像中的旋转和缩放变换。
反变换是通过将图像变换为参考形状模型的尺度和旋转来实现的,从而提高人脸定位和识别的准确性。
6. 非刚性形状变换:CLA还可以处理面部表情和非刚性形状变换。
通过将形状模型与非刚性形状变换进行整合,CLA能够捕捉人脸的形变信息,从而在不同表情和角度下进行人脸定位和识别。
CLA的优点和应用:1. 高准确性:CLA能够在不同光照、角度和表情等复杂条件下,实现较高的人脸定位和识别准确性。
2. 实时性:CLA算法具有较快的处理速度,适用于实时人脸识别和跟踪等应用。
3. 鲁棒性:由于CLA采用了形状约束和局部特征相结合的方式,它对图像噪声、遮挡和人脸部分遮盖等具有一定的鲁棒性。
基于人脸肤色和特征的实时检测跟踪算法

第 3 卷第 4 4 期
2 0 年 4月 07
光 电工程
Op o Elc r n cEn n e i t — e to i gi e rng
V0 .4. 1 3 No. 4 Ap i 20 7 rl 0 ,
文章编号 :1 0 — 0 (0 70 — 0 4 0 3 5 2 0 )4 0 4 — 5 0 1 X
c aat f knc lr n Y b | oo p c . t os a p rs d ten nfc i ae a l n t c odn h rc r i oo C c l s a e Af r i w s u pe s ,h o —aes n raw s i a da c rig eo s i c r en e s e k e mi e
if r t n f sl,a d t e h k n ae ss g n e a e n i u sa d l sa l h d d e t h l se ig n o ma i i t o r y n h n t e s i r awa e me t d b s d o t Ga si n mo e t b i e u o t e c u t r s e s n
f ew s rpsd Mo igh ma—oyojc eeet ce o vdoacrigt tmp rl iee c gadsae a a o oe. vn u nb d betw r xr tdf m ie codn c p s a r o e oa df rn i n p n h
t h e merc c a a tr ff c n h o o h a tr fo g n n f c ,a d t e h a e wa o ae n i g . o t e g o t h r ce so a e a d t e c lr c a ce s o r a si a e n h n t e f c s lc t d i ma e i r Ac o d n ef c o a i n t e h a n h ud r a t r e tr di i e y d i i g c me au i g c nr l t t g , c r i g t t a e lc t , h e d a ds o l e r e c ne e lv d o b rv n a r sn o t r e y oh o p we l o sa S v me t r c ig wa aie . l o d r oe h c e a a tb l y f rl h h n e , r p ru d t g s ae y f r h Omo e n a k n s e l d I r e n a et d p a i t o g t a g s p o e p a i t tg o e t r z l t n h i i c n r t Ga s in mo e p r mee sWa r p s d E p r n s s o t a h r p s d me h d p ro mswe l n f c ee t n u so d l a a t r s p o o e . x e i me t h w h tte p o o e t o ef r l i a e d tc i o n k n nb t i l a k r u d a o lx b c g o n . a dt c ig i o h smp eb c g o n d c mp e a k r u d a r n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 人脸检测方法
3.1 模板匹配
人脸检测与跟踪的本质是确定输入图象中某一小窗口图象是否 为人脸。设训练样本图象尺寸为 n ×n , 输入图象尺寸 N ×N , N > n 。可检测的人脸范 围 n × n ~ N ×N 。检测 n ' ×n ' ( n ' ≥ n )的人脸时,将输入图象按比例 n ' / n 缩小 ,然后将一窗口 在此图象中滑动,取窗口图象作为测试图象送入检测模块 。 首先利用模板匹配进行粗检测,方法是:首先利用一屏蔽模板滤 掉测试图象边缘的无用信息(图 3),然后根据人脸灰度分布将人脸
r
[
]
T
的估计是:
$ x (t i ) = v
x i −1 − x i − 2 t i − t i −1
y − yi − 2 $ y ( t i ) = i −1 v t i − t i −1
(4)
4
预测目标坐标,即预测搜索中心为:
$ i +1 x y = $ i +1
$ x (t i ) v xi ⋅ (t i − t i −1 ) + v yi $ y (t i )
定义投影距离 ε p : ε p = Φ − Φ p 。||.||表示某中距离测度,这里采用均方距离。 ε p 反 映了样本 Γ 与子脸空间的距离,对于人脸样本 ε p 较小,而非人脸样本 ε p 较大。这种方法存 在两个缺点:① θ只能根据人脸样本确定。由于训练样本集中人脸的数量是有限的,很难 得到恰当的阈值θ。② 缺乏反例样本的信息。 为改进上述缺点,本文提出双空间检测的方法,即建立非人脸子脸空间,为叙述方便, 而将人脸子空间称为 α 空间。 人脸样本在空间分布上靠近 α 空间, 其在 α 以下称为 β 空间, 空间的投影有较少的信息损失,即与 α 空间的距离较小;而非人脸样本正相反,与 β 空间 的距离较小。测试样本 Γ 与 α 、 β 空间的距离分别为 ε p , ε p 。按以下规则判别( x,y )处是 否子脸:
图 1 人脸检测与跟踪模型 该模型主要包括人脸检测(DM)和人脸跟踪(TM)两个模块。系统启动后,首先启动 DM,对第一帧图象进行人脸检测,定位人脸后,向 TM 发出锁定信号。TM 根据锁定的人 脸提取参考特征, 开始进行人脸跟踪。 如果跟踪失锁, 向 DM 发出失锁信号, 重新启动 DM, 开始一个新的检测与跟踪过程。在摄象机随动系统的跟踪过程中,摄象机控制模块根据人 脸信息(位置、尺寸)动态调整摄象机姿态。 FDTM 的一个重要特征是,人脸跟踪模块依赖于人脸检测模块。我们知道,在模式识别 中存在识别精度与识别速度的矛盾,识别率越高,方法往往越复杂,势必降低速度。反之 亦然。产生这种现象的主要原因是由样本的分布性引起的。DM 必须是一个精度较高的检 测模块,而 TM 必须是一个实时跟踪模块。FDTM 的另一个特点是:TM 中的参考特征是基 于目标的动态特征,而不是根据先验知识的训练结果。这样,参考特征只是单独样本的特 征,有效性比较高,有利于实现高精度的实时跟踪。 对于摄象机随动的人脸检测与跟踪系统,需要不断判断人脸当前位置,当位置超出一定 范围时,向摄象机控制模块输出当前人脸坐标,根据摄象机模型计算参数,调整摄象机姿 态。而对于摄象机自主运动的系统,这部分不需要。 人脸检测与人脸跟踪并没有本质的差别, 二者都是取输入 图象中的窗口图象作为测试图象, 都是视平面上的搜索问 题。区别在于搜索路线的不同,如图 2。人脸检测的搜索 (a)人脸检测 (b)人脸跟踪 路线是顺序的,这样可以检测多个人脸。而人脸跟踪是围 图 2 搜索路线 绕搜索中心的放射状搜索。
2
量作为特征子脸,形成 L 维子脸空间。 基于特征子脸的人脸检测方法 特征子脸在 M 维图象中张成 L 维子空间。测试样本 Γ 经如下运算可变换成其在此空间的投影坐标:
2
v Ω = µ ⋅ (Γ − Ψ)
(2)
[ 向量 Ω = [ω , ω
v
1
其中 µ = µ 1 , µ 2 ,L , µ L
图 3 人脸模板
2
划分成不同区域,计算每个区域的灰度平均值表示该区域,用整个样本的灰度平均值规正, 得到一维连续特征向量。所有样本的平均向量是均方误差准则下的最佳参考样本。
3.2 特征子脸
• 基本思想 大多数人脸处理方法注重人脸的直观特征,而忽略了隐含在人脸样本集合内部的信息。 利用这些信息对人脸编码,可以作为人脸图象与非人脸图象的类间分离判据。从信息论的 角度,就是提取人脸图象的相关信息,一个简单途径是计算人脸图象样本集的分布。从数 学角度,就是寻找人脸图象分布的基本元素,即人脸图象样本集协方差矩阵的特征向量。 人脸图象在特征向量上的分量可以作为该图象的表征。这些特征向量称为特征脸 (eigenface)。Sirovich 和 Kirby 最早提出:人脸图象可以由权集合与一标准人脸图象集合 重建[5]。MIT 的 Pentland 等人继而提出特征脸的概念,并将这一方法应用于人脸识别[6]。 本文发展了特征脸的思想,提出了特征子脸的概念,理由是:① 人脸是器官的配置。 将一幅人脸图象的某个器官与另一幅人脸图象的相同位置交换,其各自作为人脸的属性不 变。 对于一个正面人脸,可以将其分为眼睛、面颊和下颌三个区域,分别以 ℜ E , ℜ C , ℜ M 表 示。②若样本象素数是 n,则求解协方差矩阵的计算复杂度为 o(n3),将人脸划分成小区域, 降低了样本维数,减少了计算量,提高了训练速度。 眼睛、面颊、下颌样本集协方差矩阵的特征向量称为特征眼、特征颊和特征颌,统称特 征子脸,其原理与特征脸相同。特征子脸在相应的图象空间中张成子空间,称为子脸空间。 求解方法 设训练样本集( ℜ E , ℜ C , ℜ M )为 F1 , F2 ,L , FN ,对其中每个元素用其样本灰度平 均 值 规 正 , 得 到 样 本 集 Γ1 , Γ2 ,L , Γ N
具有更强的检测能力,但显然计算量也增加了一倍。应用中我们可以首先用单空间方法排 除一部分背景图象,而用双空间方法检测与人脸极为相似的图象。正例样本与反例样本在 样本空间的分布上是不相同的, α 空间与 β 空间的维数通过实验确定。
4 人脸跟踪方法
4.1 运动模型
运动预测 一个简单的运动预测的方法是利用当前目标的相对位置和速度。 考虑到目标跟踪的计算 延迟,只能用过去的位置坐标来近似当前坐标。图 4 为跟踪信息流。 时间: t1 实际坐标: 跟踪坐标: s1 t2 s2 s1 t3 s3 s2 t4 s4 s3 图4 当前目标运动速度 v ( t i ) = v x ( t i ), v y ( t i ) s4 跟踪信息流 ti-1 si-1 si-2 ti si si-1 ti+1 si+1 si
1 引言
人脸检测是指在静态图象中定位人脸并输出人脸的位置及大小等信息。人脸跟踪的任 务是在连续图象中跟踪捕获人脸的运动。目前人们正致力于提高计算机的智能交互水平, 人类的面部提供了大量视觉信息,计算机的多种感知输入通道,如人脸识别、口型识别、 表情识别等,目前大多数系统都要求使用者固定在摄象机前的某一位置。然而,人总是处 于运动中的,尤其在信息交互过程中,对使用者的这种要求显然降低了系统的实用性[1][2]。 近年来,随着 Internet 的飞速发展及电视会议(Video Conference)研究的兴起,人们纷纷 探索低比特率(Low Bit-rate)的视频编码技术。其中一类是基于目标(Object-Oriented)的 方法,人脸检测与跟踪技术引起了人们的普遍关注,在这一领域有着重要的应用价值[3]。从 学术研究的角度,人脸检测与跟踪是一类极有意义的模式识别问题[2]。 对于人脸检测,国际上曾提出了模板匹配(固定模板、变形模板),人脸规则,样本学 [2] 习 等方法,而在人脸跟踪中一般采用运动与模型技术相结合的方法[4]。目前国际上的研究 普遍将人脸检测与人脸跟踪作为两个独立的系统,没有形成统一的人脸检测与跟踪模型, 使得有些系统只能检测静态人脸[2],而有些系统只能跟踪动态人脸[4]。目前大多数方法的缺 陷是检测精度低,实时性不够理想。 本文从建立人脸检测与跟踪模型的角度出发, 将人脸检测与人脸跟踪作为一个系统的两 个环节, 建立 FDTM ( Face Detection & Tracking Model ) 模型, 并给出模型结构和工作流程。 该模型适用于彩色/灰度图象,摄象机随动/自主运动等不同应用环境。本文提出了特征子脸 的概念进行复杂背景下的人脸检测,提出由运动预测和运动目标检测构成的运动模型和人 脸肤色模型进行实时人脸跟踪。
{
{
} 。计算所有样本的平均样本Ψ。规正样本
(1)
}
Φ i = Γi − Ψ 。协方差矩阵
C=
1 N
∑Φ Φ
i =1 i
N
T i
求解协方差矩阵 C 的特征值及特征向量。若训练样本图象分辨率是 M × M ,则 C 是
M × M 2 的矩阵,共可求得特征值及特征向量 N 个。选择 L 个具有最大特征值的特征向
2 人脸检测与跟踪模型 —FDTM
FDTM 结构如图 1。 该模型主要包括人脸检测(DM)和人脸跟踪(TM)两个模块。系统启动后,首先启动 DM,对第一帧图象进行人脸检测,定位人脸后,向 TM 发出锁定信号。TM 根据锁定的人 脸提取参考特征, 开始进行人脸跟踪。 如果跟踪失锁, 向 DM 发出失锁信号, 重新启动 DM, 开始一个新的检测与跟踪过程。在摄象机随动系统的跟踪过程中,摄象机控制模块根据人 脸信息(位置、尺寸)动态调整摄象机姿态。 FDTM 的一个重要特征是,人脸跟踪模块依赖于人脸检测模块。我们知道,在模式识别 中存在识别精度与识别速度的矛盾,识别率越高,方法往往越复杂,势必降低速度。反之 亦然。产生这种现象的主要原因是由样本的分布性引起的。DM 必须是一个精度较高的检
2
]
T
,L , ω L
]