模式识别在人脸识别中的应用
人脸识别技术的发展历程与应用案例

人脸识别技术的发展历程与应用案例近年来,随着技术的不断发展,人工智能技术愈加成熟,人脸识别技术也逐渐走进人们的日常生活。
人脸识别技术是指基于数字图像处理、模式识别和计算机视觉等技术实现的人脸图像自动识别技术。
它应用广泛,从安保、金融、医疗到生活娱乐等领域都有应用。
下面将介绍一下人脸识别技术的发展历程和应用案例。
一、人脸识别技术的发展历程人脸识别技术的起源可以追溯到上世纪60年代,当时人们开始尝试使用计算机对人脸进行特征提取。
但当时的技术受限于计算机处理速度慢,数据量小等因素,无法实现准确的人脸识别。
直到20世纪90年代后,随着摄像头、计算机性能、算法和人工智能技术的不断改进,人脸识别技术才迎来了大发展。
在21世纪初期,人脸识别技术已经成熟到可应用于实际场景中。
其中,基于2D图像的传统人脸识别技术已经广泛应用于警务、金融、教育等领域。
而近年来,基于3D面部识别的技术已经开始发展,并且具有更高的精度和准确性。
二、人脸识别技术的应用案例1.公安领域在公安领域,人脸识别技术被广泛应用于视频监控、刑侦案件排查等方面。
以短视频平台为例,平台可以很好地根据用户的面部特征,快速呈现相关的短视频,这需要人脸识别技术的支持。
在刑侦领域,人脸识别技术有助于公安人员迅速通过视频监控系统辨认犯罪嫌疑人并加以抓捕,提高了破案效率。
2.金融领域在金融领域,人脸识别技术可以应用于ATM机、移动支付等方面,提高用户支付的安全性。
同样,人脸识别技术可以较高的精度通过检测用户脸部的重要性特征来防止账号被盗用。
3.医疗领域在医疗领域,通过人脸识别技术,医生可以在临床中更准确地诊断疾病,减少漏诊和误诊的情况。
同时,该技术可以用于医院内患者的身份识别和在医疗设备启动时的身份核验,提高医院管理运营的效率。
4.生活娱乐领域在生活娱乐领域,人脸识别技术的应用更多是智能家居、人脸支付、虚拟游戏等领域。
例如,在智能家居中,人脸识别可以根据个人的面部特征,配置家庭的创意和娱乐环境,提高居住体验。
模式识别的应用实例

模式识别的应用实例模式识别的应用实例:人脸识别技术在安全监控中的应用引言:随着科技的不断进步,模式识别技术在各个领域得到了广泛的应用,其中人脸识别技术作为一种非常重要的模式识别技术,正逐渐渗透到我们的日常生活中。
本文将重点介绍人脸识别技术在安全监控领域的应用,探讨其实际应用价值和存在的挑战。
一、人脸识别技术的基本原理人脸识别技术是一种通过计算机对人脸图像进行分析和识别的技术。
其基本原理是通过摄像头采集人脸图像,然后使用图像处理和模式识别算法对图像进行处理和分析,提取出人脸的特征信息,再与事先建立的人脸库进行比对,最终确定身份。
二、人脸识别技术在安全监控中的应用1. 出入口管理人脸识别技术可以应用于大型企事业单位的门禁系统中,通过将人脸识别设备与门禁系统相结合,实现对人员进出的严格管理。
只有事先注册过的人员才能被识别通过,从而有效防止陌生人进入。
此外,人脸识别技术还可以与身份证信息进行对比,确保所呈现的人脸与身份证信息一致,增加门禁系统的安全性。
2. 监控系统人脸识别技术在监控系统中的应用也十分广泛。
通过在监控摄像头上加装人脸识别设备,可以实时对监控区域内的人脸进行识别。
一旦出现异常情况,如陌生人进入、重点人员出现等,系统可以即时报警,提高监控系统的响应速度和准确性。
3. 公共安全人脸识别技术在公共安全领域的应用也非常重要。
例如,在机场、车站等交通枢纽站点,可以通过人脸识别技术对旅客进行身份验证,提高安检效率和准确性。
同时,人脸识别技术还可以应用于警务系统中,通过对犯罪嫌疑人的人脸进行识别,加快破案进度。
三、人脸识别技术在安全监控中的优势1. 高度准确人脸识别技术具有高度准确性,能够对人脸图像进行精确的分析和识别。
相比传统的安全监控手段,如刷卡、密码等,人脸识别技术更加安全可靠。
2. 高效便捷人脸识别技术的识别速度快,可以实现实时的人脸识别和比对,大大提高了安全监控系统的效率和便捷性。
不需要额外的操作,只需正常行走,即可完成识别。
人脸识别技术的应用场景及使用方法详解

人脸识别技术的应用场景及使用方法详解人脸识别技术是一种通过计算机视觉和模式识别技术来识别和验证人脸的技术。
它具有快速、准确、非接触等特点,因此在各个领域都有广泛的应用。
本文将详细介绍人脸识别技术的应用场景以及使用方法。
一、应用场景1. 安全领域:人脸识别技术在安全领域的应用是最为广泛的。
它可以用于身份识别与验证,例如在边境安全控制、机场安检、银行系统中,通过人脸识别来确认身份,提高安全性。
此外,人脸识别还可以用于犯罪侦查,通过与数据库中的犯罪嫌疑人照片比对,协助警方追踪犯罪嫌疑人。
2. 出入管理:人脸识别技术在出入管理方面也有重要的应用。
传统的刷卡或密码方式容易被冒用,而人脸识别技术通过与注册的人脸图像比对,可以实现更加安全的出入管理。
这在企业、学校、公共场所等都有广泛的应用,可以提高出入安全性、减少人力成本。
3. 金融领域:人脸识别技术也在金融领域得到了广泛应用。
例如,可以用于人脸支付,用户无需携带银行卡或手机,通过人脸识别技术即可完成付款。
此外,人脸识别还可以用于ATM机的安全认证,提高提款的安全性。
4. 教育领域:人脸识别技术在教育领域也逐渐得到应用。
例如,可以用于学生考勤系统,通过人脸识别技术可以准确记录学生的出勤情况,提高教学管理效率。
另外,人脸识别还可用于学生监控系统,通过人脸识别来确保学生的安全,避免校园欺凌等问题。
5. 智能家居:人脸识别技术还可以应用于智能家居,例如通过人脸识别来实现智能门锁的自动开关。
家庭成员只需通过人脸识别即可进出门,提高家庭安全性,免去了使用钥匙、刷卡等的麻烦。
二、使用方法1. 数据采集与预处理:首先,需要采集一定数量的人脸图像作为训练样本。
采集时应充分考虑不同人的不同面部表情、角度和光照等因素。
采集的图像需要进行预处理,包括去除噪声、对齐姿态、人脸检测等操作。
2. 特征提取与建模:接下来,需要提取人脸图像中的特征信息。
常用的特征提取方法包括主成分分析(PCA)和局部二值模式(LBP)等。
了解模式识别在人工智能开发中的应用

了解模式识别在人工智能开发中的应用人工智能(Artificial Intelligence)作为一种复杂的技术体系,拥有多个重要的研究领域,其中之一就是模式识别(Pattern Recognition)。
模式识别是指通过对大量数据进行学习和分析,从中发现出现频率较高的模式,并将这些模式应用到新的数据中,从而实现对未知数据的自动分类和预测。
模式识别在人工智能开发中的应用广泛而深远,从语音识别到图像处理,从数据挖掘到自然语言处理,都离不开模式识别的支持。
下面我们将介绍一些典型的人工智能应用领域,以及模式识别在其中的作用。
首先,语音识别是一个重要的应用领域,它涉及将人的语音转化为可被机器理解的文本或指令。
模式识别在语音识别中的作用非常显著。
通过对大量语音数据进行分析和学习,模式识别可以识别出不同人的声音特征,并根据这些特征将语音与语义进行匹配。
例如,语音助手(Voice Assistant)就是通过模式识别技术来实现自然语言交互的,通过识别用户的语音指令并做出相应的反应。
其次,图像处理也是人工智能中的一个重要领域,模式识别在其中起着关键作用。
在图像处理中,模式识别被用于识别出图像中的物体、人脸、动作等特征,并实现对图像的分析和理解。
例如,人脸识别技术就是通过模式识别算法,将图像中的人脸特征与预先存储的人脸模式进行对比,从而实现对人脸的识别和认证。
图像识别技术还被广泛应用于安防领域、智能交通等地方,为社会带来了更高的安全性和便捷性。
此外,数据挖掘也是利用模式识别实现的一项重要任务。
在大数据时代,模式识别可以帮助我们从庞大的数据中发现隐藏的模式和规律,从而揭示数据背后的价值和趋势。
例如,在金融领域,模式识别可以对股票市场的行情进行分析和预测,并为投资者提供决策支持。
而在医疗领域,模式识别可以帮助医生分析病人的病史和样本数据,从而辅助疾病的诊断和治疗。
最后,自然语言处理也是人工智能中一个重要的研究领域。
模式识别在自然语言处理中可以帮助机器理解和处理人们的语言表达。
模式识别在图像识别中的应用

模式识别在图像识别中的应用模式识别是一种通过对数据进行分析和处理,识别数据中的规律和特征的技术。
在图像识别领域,模式识别发挥着至关重要的作用,帮助计算机系统理解和识别图像中的内容。
本文将探讨模式识别在图像识别中的应用,介绍其原理、方法和实际应用场景。
一、模式识别原理模式识别是一种基于数据分析的技术,其原理主要包括特征提取、特征匹配和分类识别三个步骤。
1. 特征提取特征提取是模式识别的第一步,通过对图像数据进行处理,提取出具有代表性的特征信息。
在图像识别中,特征可以是图像的边缘、纹理、颜色等。
特征提取的质量直接影响到后续的分类和识别效果。
2. 特征匹配特征匹配是将提取出的特征与已知的模式进行比对,找出它们之间的相似性和差异性。
通过特征匹配,可以确定图像中是否存在某种特定的模式或对象。
3. 分类识别分类识别是模式识别的最终目的,即将图像分到不同的类别中。
通过建立分类模型,将提取出的特征与已知类别的特征进行比对,从而实现对图像的自动分类和识别。
二、模式识别方法在图像识别中,常用的模式识别方法包括传统的机器学习方法和深度学习方法。
1. 机器学习方法机器学习方法是一种基于数据和统计学习的技术,通过对大量数据的学习和训练,建立模型来实现对图像的识别和分类。
常用的机器学习算法包括支持向量机(SVM)、K近邻算法(KNN)和决策树等。
2. 深度学习方法深度学习是一种基于人工神经网络的技术,通过多层次的神经网络结构,实现对图像数据的高级特征提取和学习。
深度学习在图像识别领域取得了巨大的成功,如卷积神经网络(CNN)和循环神经网络(RNN)等。
三、模式识别在图像识别中的应用模式识别在图像识别中有着广泛的应用,涵盖了各个领域和行业。
1. 人脸识别人脸识别是图像识别领域的一个重要应用方向,通过模式识别技术可以实现对人脸的自动检测、识别和验证。
人脸识别技术在安防、金融、医疗等领域有着广泛的应用。
2. 物体识别物体识别是指识别图像中的各种物体和实体,通过模式识别技术可以实现对不同物体的分类和识别。
基于人工智能的人脸识别技术研究及应用

基于人工智能的人脸识别技术研究及应用前言随着科技的发展,越来越多的人工智能技术被广泛应用于各个领域中。
其中,人脸识别技术是一项热门的应用之一。
它的重要性在于,它可以为许多日常生活和工作场景提供便利。
本文将介绍基于人工智能的人脸识别技术的研究进展和应用。
一、人脸识别技术的介绍人脸识别技术是一种基于人工智能的模式识别技术,它旨在将人脸中的主要特征提取出来并进行识别。
在实际应用中,人脸识别技术可以用于识别和验证人员身份、智能监控、刑侦和安全防范等方面。
二、人脸识别技术的研究进展1. 人脸识别技术的发展历程人脸识别技术的发展历程可以追溯到上个世纪50年代,并在1988年开始被商业化。
随着计算机处理速度的提高和机器学习算法的不断改进,人脸识别技术已经取得了重大进展。
2. 人脸识别技术的主要算法目前,人脸识别技术主要采用的算法包括人工神经网络算法、决策树算法和支持向量机算法等。
其中,深度学习算法是目前最火热的一种算法。
它可以处理大量复杂的数据,并通过多层神经网络对数据进行分类和识别。
3. 人脸识别技术的关键技术在实际应用中,人脸识别技术需要面对许多技术难题,如光照、姿态、表情、年龄、人种等方面的干扰。
因此,如何解决这些技术问题,成为了人脸识别技术研究的关键之一。
现在,许多新型的人脸识别技术正在被开发出来,以解决这些问题。
三、人脸识别技术的应用1. 人脸识别技术在安防领域中的应用人脸识别技术已经被广泛应用于安防领域中,如智能门禁、刑侦和巡逻等。
使用人脸识别技术可以使安全检查更加高效和准确,同时也可以防止身份欺骗和非法入侵。
2. 人脸识别技术在社会生活中的应用人脸识别技术不仅可以被应用于安防领域,还可以被应用于社会生活中。
比如,在人脸支付、出入校园和自动签到等方面。
这种技术可以给社会生活带来重大的便利和效率提高。
3. 人脸识别技术在医疗领域中的应用人脸识别技术还可以被应用于医疗领域中,如在病人识别、个性化治疗和健康评估等方面。
人脸识别技术研究及其应用

人脸识别技术研究及其应用随着技术的不断发展,人类已经进入了信息化时代,各种智能设备和应用也随之出现。
在这方面,人脸识别技术是一种比较新的技术,它可以通过对人脸图像的采集、分析、处理等一系列技术手段来识别出人物身份。
人脸识别技术不仅具有高精准度、高效率、易操作等优点,而且在各个领域有广泛的应用。
一、人脸识别技术的研究人脸识别技术的研究可以追溯到上世纪六七十年代,但当时技术水平相对较低,只能对一些简单的人脸图像进行处理,实现人脸的自动识别还有一定的困难。
随着计算机技术的不断发展,人脸识别技术也得到了快速的发展和应用。
在研究方法上,人脸识别技术主要是采用数字图像处理技术、模式识别技术、人工智能技术等手段进行研究。
数字图像处理技术可以对图像进行预处理,增强图像的质量和信息量。
模式识别技术可以对图像进行分类和识别,从而达到人脸识别的目的。
人工智能技术可以模拟人类的思维和认知过程,更加精准地进行识别。
二、人脸识别技术的应用人脸识别技术在各个领域都得到了广泛应用。
下面就一些典型的应用进行介绍:1. 安防领域在安防领域,人脸识别技术可以用于门禁系统、监控系统等。
门禁系统可以通过人脸识别技术自动辨识员工,并记录工作考勤时间等信息。
监控系统则可以通过人脸识别技术识别出重点人员,并及时采取措施,保护重要场所的安全。
2. 社会管理人脸识别技术在社会管理领域也有广泛应用。
例如,在警务系统中,可以将犯罪嫌疑人的照片通过人脸识别技术快速匹配到人口系统中的信息,从而加快犯罪的侦查速度。
在人口普查中,人脸识别技术可以对人口数据进行核验和更新。
3. 金融领域人脸识别技术在金融领域也有广泛应用,尤其是在ATM机、网银等领域。
通过人脸识别技术可以对用户进行身份验证,进一步保证用户财产的安全。
4. 医疗领域在医疗领域,人脸识别技术可以用于病人的身份验证和医生的考勤系统中。
通过人脸识别技术可以避免医疗事故和病人身份混淆。
三、人脸识别技术存在的问题随着人脸识别技术的广泛应用,也暴露出了一些问题,例如:1. 精度问题人脸识别技术存在识别精度不够高的问题。
模式识别技术在视频监控中的应用

模式识别技术在视频监控中的应用近年来,随着科技的不断发展,视频监控技术也在不断地发展和完善。
而模式识别技术的应用,使得视频监控技术的应用领域更加广泛。
本文将探讨一下模式识别技术在视频监控中的应用及其优势。
一、什么是模式识别技术模式识别技术是指利用数学、统计学和计算机科学等多学科的知识研究和发现事物之间的规律、特征和联系的一种学科。
在计算机视觉中,模式识别是指将一组数据转换成另一组数据的过程,这些数据之间有着特定的关系。
模式识别技术可以被广泛应用于图像处理、语音识别、自然语言处理和视频监控等领域。
二、模式识别技术在视频监控中的应用1、人脸识别人脸识别是模式识别技术在视频监控领域应用最广泛的领域之一。
人脸识别是指通过计算机视觉技术,将输入的图像与数据库中的人脸信息进行对比,判断这个人是否为系统中的人员,从而实现识别和监控。
这种技术的应用广泛,可以应用于安防、门禁、人脸支付等多个领域。
2、车牌识别车牌识别技术是指通过用摄像头拍摄车辆的车牌号码,再通过计算机视觉技术进行图像处理和特征提取,最终实现对车辆的车牌号码的自动识别。
这种技术除了可以用于路边停车场的管理外,还可以应用于高速公路的计费、违章拍摄、政府车辆管理等多个领域。
3、异常行为识别异常行为识别是指通过对视频监控画面进行分析和处理,识别出视频画面中出现的异常行为。
这种技术可以检测出人员的恶意攻击、打架斗殴、逃逸等行为,并在第一时间内对这些行为进行报警和处理。
三、模式识别技术的优势1、高效率模式识别技术可以根据输入的数据,自动学习和识别出数据中的特定模式和规律。
与传统的方法相比,模式识别技术可以在更短的时间内实现对数据的处理和分析,从而提高处理效率。
2、高精度模式识别技术可以对输入的数据进行精细化处理,从而提高处理的准确性。
在视频监控领域中,模式识别技术可以通过不断学习和优化,提高对异常行为和人脸识别的准确率,从而减少误报率和漏报率,并提高视频监控的效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模式识别在人脸识别中的应用目前在人脸定位领域,几何模型匹配方法得到了广泛的使用。
本文对几何模型匹配方法进行了研究,提出了一套完整的人脸定位算法。
在预处理部分,采用了特别的增强人脸特征与脸部皮肤之间对比度的方法及局域取阈值二值化方法,改进了预处理的效果。
在图像分割部分,实现了经典的分合算法,并且使用成组算法改进了分合的效果。
在人脸匹配部分,实现了基于眼睛和嘴的几何模型匹配,并对评价函数的构造进行了研究。
此篇论文所涉及到的是人脸的定位和识别。
简单来说,所谓人脸的定位,就是在照片(静态图像)或视频(动态图像)中标出人脸所在的位置,把人脸选取出来。
而人脸的识别就是把选取出来的人脸与数据库中已有的人脸进行比较,找出匹配的档案来。
有的文献把人脸的定位和识别统称为人脸识别,定位和识别则是两个主要的步骤。
完整的人脸识别系统涉及到决定照片或视频中有无人脸,并计数,定位,定出大小,然后根据数据库识别出个人,可能的话还要识别表情,以及根据脸的图像做出描述(瓜子脸,丹凤眼等等就是日常生活中“描述”的例子),或者反过来根据描述挑选匹配的人脸图像。
从模型匹配的方法来看,目前的人脸定位算法可以粗略地分为两大类:第一类是利用人脸各器官之间的几何关系的方法;第二类是利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法。
第一类方法利用了明显的先验知识,因而方法简单明了,执行速度较快,对人脸的方向和表情有一定的适应性(在一定的变化范围内面部特征的相对几何关系变化很小), 但是准确率往往不高(漏判和误判),而且对预处理要求高,依赖于所有面部特征都完整地被提取,所以对转角较大的侧脸, 光照极度不均匀, 部分脸被遮蔽(眼镜, 围巾等)适应性不好。
第二类方法利用了更多的图像信息, 准确率高,不易受欺骗;缺点是计算量大,而且使用的人脸模板受人脸库中已有资料的影响,可能会有通用性不好的问题(比如不同人种的人脸模板不能通用)。
利用人脸各器官之间的几何关系的方法可以作为完整的人脸定位算法的一个基础,就是说利用几何匹配先大致找到图像中的人脸(可能含有很多错误),然后使用利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法来确证,剔除实际不是人脸的区域。
这样既可以利用第一类方法的速度优势,又可以利用第二类方法的准确度优势。
从一幅图中,按一定规则划分出感兴趣的部分或区域叫做分割。
对于利用人脸各器官之间的几何关系的人脸定位方法来说,分割算法是十分重要而关键的。
在这里,感兴趣的部分是人脸的器官(眼睛,嘴巴,眉毛,鼻子等等)。
分割算法如果能够有效地把人脸器官和脸的其他部分分离开来,并且保持器官的完整性(比如嘴巴没有破碎成几段),就是成功地达到了目的。
最常见的几类方法是:按像素或处理过的像素的灰度值进行分割(其实就是取阈值做二值化);提取边缘,利用边缘进行分割;区域生长方法。
区域生长方法寻找互相连接在一起,并有相同特征的像素所形成的区域(我把这样的区域称作特征块或者“物体”),是实现图像分割的一种重要方法。
区域是一个二维连通区,所以生成区域的办法大致有三类:局部法:这是根据像素的性质或像素的临近像素的性质决定像素分在什么区域;总体法:这是根据遍及整幅图中大量像素的性质决定把一群像素划分到一个区域中;分裂合并法(简称分合):这是利用状态空间技术分裂或合并区域,用图结构表示区域和边界,这时要利用局部和总体的合并与分裂准则。
图像分割的目的是把人脸的器官与脸的其他部分分离开来,并保存每个器官的完整性。
在照片中,人脸比较明显而易辨别的特征主要是面部器官:眼睛,嘴巴,鼻子和眉毛。
鼻子往往与脸的反差不大,因此通常用鼻孔代替。
这几个面部特征在灰度图像中一般比周围区域暗。
尤其是眼睛和嘴巴在绝大部分情况下都清晰可见。
因此图像分割可以利用的特征就是:灰度比周围区域暗的区域。
在我的毕业设计中,为了减少图像分割这一步的运算量,预处理的时候就对图像做了二值化。
因此事实上分割的对象已经是黑白图像,分割简化为找出所有黑色的连通区域,它们都成为人脸器官的候选者。
对分割算法有两个要求:1、一定的抗噪声能力。
经过二值化的黑白图像中,难免会有很多与主旨无关的细碎黑色像素连接了本应分开的特征,而某些单一的特征也可能会破碎成几块。
要求分割算法具有一定的能力抵抗这些噪声,将应该分开的特征分开,应该成为整体的部分连起来。
2、运行速度要快。
人脸定位和识别系统常常作为实时应用,在这些场合要求系统的运行不能耗时过长,否则就失去意义了。
从几何匹配方法来看,最耗时的步骤就是图像分割这一步。
所以这一步的速度决定了整个人脸定位方法的运行速度。
分合算法的目的是把图像分割为许多这样的区域:具有某种共同特征并且相互连通的像素分在同一个区域,而特征不同或者不相互连通的像素分在不同的区域。
判定区域R内的像素是不是具有共同的特征需要均匀性判据H(R),H(R)为True表示区域均匀,否则表示不均匀。
一般应用的均匀性判据往往是区域内的灰度比较均匀,比如区域内最大和最小的灰度值之差不超过一定阈值(5)。
在我的应用中,因为图像已事先做了二值化,所以均匀性的判定有所不同。
我只关心黑色的区域,因为只有黑色区域可能代表人脸特征。
当一个区域中黑色像素占了绝大部分时,我就认为它是均匀的。
分合算法采用金字塔数据结构。
首先讨论以像素计的边长是2的整数次幂的正方形图像。
塔的底层(第0层)是原始图像(在我的应用中是已经过二值化的图像)。
用相邻排作正方形的四个像素作为子结点,计算上一层相应像素的取值。
这样每上溯一层(层编号加1),像素数目成为原来的1/4。
当整幅图只剩下一个像素时,金字塔构造完毕(见图1)。
数据结构某一层中的一个像素事实上代表了第0层中2j个像素组成的一个数据方块(j是该层编号)。
图1 金字塔数据结构为了表示和计算方便起见,用编码来代表这样的一个数据块。
设数据结构中最高一层的编号为n,则这个编码共有n位。
把一个方块内的四个子方块按照图2顺时针标记为1,2,3,4。
为了表示一个数据块,我们首先把原始图像划分成四个正方形,第一位编码就描述该数据块落在了1,2,3,4中哪个正方形里。
然后对包含该数据块的正方形再划分为四个小正方形,第二位编码就描述该数据块落在了哪个小正方形里。
如此反复,直到某个小正方形恰好是该数据块,此后的编码就全部取0,表示不必再细分。
例如图2所示的3层金字塔结构:图2 数据块编码规则对于一幅普通的图像,一般都不会恰好是正方形,边长也不会恰好是2的整数次幂。
我便以128×128的方块作为基本单位,用m×n个这样的方块对图像做覆盖。
遇到图像中某个部分填不满一个方块的情形,就补上白色(白色不作为特征,看成空白)。
每个方块都产生自己的一个7层金字塔数据结构,相互独立地运行分裂算法和合并算法。
在相邻归并算法中,不处于同一个128×128划分块但是相邻的数据块应该被归入同一个特征块,所以数据块编码需要在全图像内唯一。
我使用的数据块编码是在每个金字塔7位编码的基础上再加两位,分别表示在m×n个128×128划分块中该数据块所处的划分块的x和y位置。
因此完整的编码是9位。
根据子结点像素计算父结点像素时常用的是灰度平均法。
我的应用中有所不同:如果四个像素中白色占了3块以上则父结点像素赋值为白色;如果黑白2:2对角分布也赋值为白色;如果黑色占了三块以上则赋值为黑色;如果黑白2:2各占据一侧则赋值为黑色。
这样的好处是可以消除一部分不紧密的连接(2:2对角分布),而保留所有可能的紧密的连接(2:2同侧分布)。
图3 2:2对角和2:2同侧分布分合算法的思路是(5):任取一层数据结构,检验其均匀性H,若对于该结构中某一区域R有H(R)=false,则分裂这个区域为4个子区;若4个彼此相邻属于同一个父结点的区域Rk1,…,Rk4满足H(Rk1∪Rk2∪Rk3∪Rk4)=true,则合并它们成为单一区域。
当不再有区域可分裂或合并时,停止分割。
如果二任意相邻区域Ri 和Rj(可以不属于同一个父结点;可以有不同的大小)使得H(Ri ∪Rj)=true,则合并它们。
分割算法的描述如下:1.把金字塔数据结构中起始某个中间层的数据块编码全部压入工作堆栈RgStack。
2.从RgStack弹出一个数据块编码Code。
如果Code代表的数据块不均匀,就把Code分裂为四个数据块,再把颜色为黑色的那些块的编码压入堆栈RgStack。
如果均匀,或者Code代表的已经是不可分的像素,那么把Code压入中间结果堆栈RgCode。
3.反复执行2,直至堆栈RgStack空。
合并算法的描述如下:1.把中间层里所有均匀的数据块的编码存入工作队列RgA。
2.从RgA出队一个编码Code。
在RgA中寻找和Code属于同一个父结点的其他数据块。
如果找不齐所有四个,那么把Code和找到的都从RgA删除,而压入中间接果数组RgCode。
如果找齐了,那么把这四个编码都从RgA删除,而把父结点的数据块编码入队到RgA中。
3.反复执行2,直至队RgA空相邻归并算法的描述如下:1.从RgCode中弹出一个编码,压入工作堆栈RgStack。
2.从RgStack中弹出一个编码Code,将它入队到RgA。
扫描RgCode,把所有与Code相邻的数据块的编码都压入堆栈RgStack。
3.反复执行2,直至栈RgStack空。
此时RgA里面存有的一系列数据块编码就是属于同一个特征块的,可以用来计算这个特征块的形状属性并保存起来。
具体计算方法见2.4“形状属性的计算”。
4.反复执行1-2-3,直至栈RgCode空引入成组算法出于如下事实:一些本属于同一个脸部器官的特征块在分合之后仍然是分开的。
分开的特征块的中心、大小、取向等等参数相对于一个代表完整的器官的特征块而言都是错误的,导致后面的几何匹配得不到正确结果。
成组算法就是用来把挨得足够近的可能本属于同一个器官的特征块合并起来(尽管它们并不是连通的)。
算法有两个特点:1. 合并半径取决于待合并的特征块的大小(一个重要参数-最大合并半径Nmax事先指定),特征块越大,则合并半径越小;2. 如果待合并的两个数据块中任一个大于Nmax,那么它们必须位于同一主轴上(主轴的定义在形状属性的计算中介绍)才能合并。
下面的伪代码描述了成组算法,其中N(i)代表第i个块Bi 包含的像素个数,Nb代表图像中特征块的总数。
Procedure Groupingfor N := 1 to NmaxdoR := 8 – 6 * (N-1) / (Nmax-1)for i :=1 to Nbdoif N(i) = N then“找到所有位于Bi 的r邻域内的特征块{Bj}”if {Bj} ≠φthen“从{Bj }中找出离Bi最近的块Bk”if (N(k) < Nmax ) or (Bk与Bi位于同一根主轴上) then“把Bi 和Bk合并”end forend forend Grouping预处理常常有以下几个目的:把图像变成便于后续处理的形式;提高对比度,抑制背景而突出面部特征;去除噪声和其他有害的信息。