人脸的性别分类
人脸性别识别综述

C m u r n we g n e h o g o p t o l ea d T c n l y电脑 知 识 与技术 eK d o
Vo . , . 0 Ap i 2 ,p.3 0 23 2,3 5 17 No 1 , rl 01 p 2 5 - 5 2 5 1
人脸 性 别 识 别综 述
I SN 0 9 3 4 S 10-04
E— i e u @C C . e .n ma l d f C Cn t : c ht:w .n s e. t / ww d z . t n p/ n c T l 8 — 5 - 6 0 6 5 9 9 4 e: 6 5 5 9 9 3 + 1 6 0 6
过程 , 而且 男 性 脸 和 女 性 脸 的 认 知 过程 是 不 同 的 , 通过 实验 说 明 了男 性 脸 的 识别 率高 于女 性 脸 。而 且在 归类 同性 别 的 人 脸 时 正 确 率 较 高 。随 着 人脸 检测 技 术 的发 展 , 人 脸 性 别 识 别 的 研 究 也 越来 越 多 , 对 识别 方法 也 日渐 成 熟 , 早 期 盛 行 的 神 经 网络 方 法 , 展 到 近 从 发 期 的 支 持 向 量机 和 A a os方 法 , 别 精 度也 越 来 越 高 。而 且 有 一些 人 脸 性 别 识 别 技 术 已 经成 功 的应 用 到 很 多 商 业领 域 。 d B ot 识 本 文 主要 是 对 现有 的人 脸 性 别 识 别 方法 进行 总结 和 归 纳 , 一 些 典 型 的特 征 提 取 和性 别 分 类 方 法 作 简 单 介 绍 。并 对 今 后 的研 对
别 技 术 的重 要 组 成 部 分也 受 到 了广 泛 地 关 注 。人 脸 性 别 识 别 就 是 向计 算 机 输 人 人 脸 图 像 , 过 某 种 方 法或 运 算 , 出其 性 别 。这 种 经 得 识 别 对 人 眼 来 说 很 简单 , 对 计 算 机却 并 不 是 一 件 容 易 的事 情 。从 上 世 纪 9 但 O年 代 初 期 开 始 , 国外 一 些 学 者 就 开始 了人 脸 性 别 识 别 问 题 的 研 究 。9 1年 ,ol 19 G l mb等 人l 练 了一 个 两层 神经 网络 用 来 识 别 9 o l _ 训 0张 人脸 图 像 的性 别 , 创 了人 脸 性 别 识 别 的 先 河 。 开 但在 早 期. 主要 是 源 于心 理 学 研 究 的 需 要 或 纯 粹作 为一 个 实 验 问 题 来 看 待 的 , ,e eio等人 1 为人 脸 性 别 识 别 是 一 个 非 常 高效 的认 知 如 Clr l n 认
人脸识别中的性别识别技术与应用

人脸识别中的性别识别技术是一种重要的生物识别技术,它利用人脸图像来识别个体的性别,广泛应用于安全、医疗、金融等领域。
首先,让我们来了解一下性别识别的基本原理。
性别识别主要依赖于人脸图像中的一些特征,如眼睛、眉毛、鼻子、嘴唇等部位的形状、大小、位置等。
通过对这些特征的分析和比较,可以确定人脸图像属于男性还是女性。
目前,性别识别技术主要基于计算机视觉和机器学习算法,如支持向量机、神经网络等。
在人脸识别系统中应用性别识别技术,可以带来许多实际的应用价值。
首先,在安全领域,性别识别技术可以帮助公安部门更好地追踪犯罪嫌疑人,提高安全监控系统的效率。
其次,在医疗领域,性别识别技术可以帮助医生更好地识别病人,提高诊断的准确性。
此外,在金融领域,性别识别技术可以帮助金融机构更好地管理客户信息,防止欺诈行为的发生。
在具体的应用方面,人脸识别中的性别识别技术已经在多个领域取得了显著的成果。
例如,在人脸识别门禁系统中,可以通过对进出人员的脸部图像进行性别识别,从而实现对人员的进出管理。
在社交网络中,可以通过性别识别技术来分析用户的社交行为和兴趣爱好,从而更好地为用户提供个性化的服务。
此外,在人脸识别技术在人脸搜索、人脸视频监控等领域也得到了广泛的应用。
然而,尽管人脸识别中的性别识别技术在许多领域取得了显著的成果,但仍存在一些挑战和问题。
首先,人脸图像的质量和光照条件等因素会对性别识别的准确性产生影响。
其次,性别识别的准确性还受到个体差异和种族差异等因素的影响。
此外,性别识别技术还存在一些隐私和伦理问题,需要进一步研究和解决。
未来,随着人工智能和计算机视觉技术的不断发展,人脸识别中的性别识别技术将会更加精确和可靠。
同时,我们也需要进一步研究和解决性别识别技术面临的挑战和问题,如提高算法的鲁棒性、减少隐私和伦理问题的影响等。
总之,人脸识别中的性别识别技术是一种重要的生物识别技术,具有广泛的应用价值。
未来,随着技术的不断进步和应用领域的拓展,性别识别技术将会在更多领域发挥重要作用。
基于卷积神经网络的人脸年龄识别与性别分析技术研究

基于卷积神经网络的人脸年龄识别与性别分析技术研究人脸年龄识别与性别分析技术是计算机视觉领域中的核心研究方向之一。
随着深度学习技术的快速发展,基于卷积神经网络(Convolutional Neural Network,CNN)的人脸年龄识别与性别分析技术受到越来越多的关注。
本文将围绕人脸年龄识别与性别分析技术的研究现状、方法原理、数据集选择、实验结果等方面进行详细介绍。
一、研究现状人脸年龄识别与性别分析技术是计算机视觉领域的研究热点之一,在相关学术期刊和会议上有大量的研究文章发表。
早期的研究大多采用机器学习中的特征提取算法,如LBP(Local Binary Patterns)、HOG(Histogram of Oriented Gradients)等。
但是这些方法对于人脸变化较大的情况效果不佳,同时需要手工设计特征提取算子,使得算法的应用范围受限。
近年来,深度学习技术的发展为人脸年龄识别与性别分析技术带来了很大的突破。
其中,卷积神经网络(CNN)是深度学习中的一种重要架构,被广泛应用于人脸年龄识别与性别分析任务。
CNN能够自动学习特征,无需手工设计特征提取算子,从而提升了算法的性能和泛化能力。
二、方法原理基于CNN的人脸年龄识别与性别分析技术主要包括两个核心部分:特征提取和年龄/性别分类。
在特征提取阶段,通过构建卷积神经网络模型,以人脸图片为输入,经过一系列卷积层、池化层和全连接层的处理,提取出人脸图片中的高层次特征表示。
在年龄/性别分类阶段,将提取得到的特征输入到分类器中进行年龄或性别的预测。
三、数据集选择在进行人脸年龄识别与性别分析任务时,选择合适的数据集对于算法的性能提升具有重要意义。
目前比较常用的数据集有FERET、IMDB和Adience等。
其中,FERET数据集包含了约14,000张不同姿态、光照条件下的人脸图片,用于人脸识别、年龄估计和性别分类等任务。
IMDB数据集包含了约4万张电影中的演员照片,用于明星人脸识别和年龄性别分析等任务。
基于面部特征的性别识别

批脸部轮廓之内的人脸照片进行了不同的处理 , 片在 屏幕上形成 的视角为 57 × 8 8 。 .。 .。 0 其 中一种处理是使用空 间过滤 ( aa f en) s tl lr g p i t i i 设计 :2 ( 被试性 别 :男 v. s 女) ×2 ( 图片性 将 白人男女脸部图片从 2 62 87 个像素分别减少到 别 :男 v. s 女) × ( 4 分区:内轮廓 、眼睛、鼻子 7 6 、19 、4 8以及 12个 像 素 ,结果 发 现 女 和嘴 巴) 的混合 实验 。 18 7 2 4 1 性脸 部图片 的识 别在 19 个 像素 时就处于 随机水 72 程序 :随机呈现 4 幅人脸 图片 ,男女各 2 0 O
发现男性和女性 的面部结构有显著差异 ,尤其是 为研究对象 ,将脸部划为内轮廓 、眼睛、嘴 巴、 鼻子等四个区域 ,寻找最能够有效帮助人们进行 颔下点与耳垂之间的距离 ,即左耳最低点与下巴 最低 点之间 的距 离 ,男性 要显 著长 于女J 3 I1 生[ 。近期 性别判 断的脸部部位 。
一
平,而男性脸部图片在 12 个像素水平上的识别 幅。程序 自动以 O 1 %的像素 比率读取 图片 ,因此 正确率还显著的高于随机水平 ,这表 明识别出男 最初被试看不到图片。要求被试单击按钮来增加
程。人们能轻而易举地辨别一个人到底是男性还 睛的形状 、颜色等 ;后者指的则是这些面部主要 是女性。即使把所有文化线索 ( 诸如发型、化妆 器官之间相对的空间关 系。男性与女性 的面部在 等)去 除 ,成人对性别 的识别 正确率依然接 近 形态特征和结构上存在着差异 ,因而特征信息和 10 t 0 %” ,而 7 的儿童对于同样的任务正确率达 结构信息都可以为性别判断提供帮助。在早期的 岁 a l 到 8 %[ 0 2 1 些数 据表 明 ,面 部解 剖 学 所 提供 的 研 究 中 ,结 构 受 到 的关 注 更 多 ,比如 Sma对脸 。这
人脸识别技术的年龄和性别分类算法研究与评估

人脸识别技术的年龄和性别分类算法研究与评估近年来,随着人工智能技术的迅猛发展,人脸识别技术逐渐成为了一种重要的生物特征识别技术。
其中,年龄和性别分类算法作为人脸识别技术的两个重要分支,受到了广泛的关注和研究。
本文将就人脸识别技术的年龄和性别分类算法进行深入探讨和评估。
首先,我们来了解一下人脸识别技术的基本原理。
人脸识别技术是通过对人脸图像进行特征提取和匹配,来实现对人脸的自动识别和分类。
其中,年龄和性别分类算法是在人脸识别技术的基础上,通过分析人脸图像中的特征,来判断被识别者的年龄和性别。
这一技术在安防、人机交互等领域具有广泛的应用前景。
在年龄和性别分类算法的研究中,研究者们主要采用两种方法:基于特征的方法和基于深度学习的方法。
基于特征的方法主要是通过提取人脸图像中的一些特定特征,如皱纹、眼角弧度等,来判断被识别者的年龄和性别。
这种方法的优点是简单易懂,计算速度较快,但是其准确性和鲁棒性相对较低。
而基于深度学习的方法则是通过构建深度神经网络模型,通过大量的训练数据进行训练,来实现对年龄和性别的准确分类。
这种方法的优点是准确性较高,鲁棒性较强,但是需要大量的训练数据和计算资源。
在评估年龄和性别分类算法的性能时,我们主要关注两个指标:准确率和召回率。
准确率是指分类结果中正确的比例,而召回率则是指分类器能够正确识别的比例。
这两个指标相互影响,我们需要在准确率和召回率之间进行权衡。
在实际应用中,我们可以根据具体的需求,选择适当的分类算法和参数设置,来实现最佳的分类效果。
除了准确率和召回率,我们还需要考虑年龄和性别分类算法的健壮性和隐私保护性。
健壮性是指算法对于光照、姿态、遮挡等因素的鲁棒性,即在复杂环境下仍能保持良好的分类效果。
隐私保护性则是指算法在进行人脸识别时,对个人隐私信息的保护程度。
在实际应用中,我们需要综合考虑这些因素,选择合适的年龄和性别分类算法。
总结起来,人脸识别技术的年龄和性别分类算法是人工智能技术的重要应用之一。
人种面部特征分类

人种面部特征分类
面部特征是人类身体的重要组成部分,每个人的面部特征都是独一无二的。
通过观察面部特征,我们可以辨别出不同的人种。
不同人种的面部特征展示出多样的美丽和独特之处。
亚洲人的面部特征通常表现为黄色或浅棕色的皮肤,黑色的眼睛,单眼皮或双眼皮的眼睛,杏仁形的眼睛,平坦的鼻梁,略微凹陷的颧骨,柔和的面部轮廓。
亚洲人的面部特征给人一种温和、亲切的感觉。
他们的眼睛通常透露出智慧和深思熟虑的神情。
非洲人的面部特征通常表现为深色的皮肤,宽大的鼻子,浓密的嘴唇,宽大的眼睛,高高的颧骨,丰满的脸颊。
非洲人的面部特征充满了力量和活力,给人一种勇敢、坚定的感觉。
他们的面部特征常常散发出自信和乐观的气息。
欧洲人的面部特征通常表现为白皙的皮肤,深色的眼睛,高挺的鼻子,棱角分明的下颚,高高的额头。
欧洲人的面部特征给人一种高贵、优雅的感觉。
他们的面部特征常常透露出智慧和自信。
美洲原住民的面部特征通常表现为棕色的皮肤,深色的眼睛,高高的颧骨,略微突出的下巴,直直的鼻梁。
美洲原住民的面部特征给人一种自然、纯朴的感觉。
他们的面部特征常常散发出宽容和平和的气息。
通过对不同人种的面部特征的观察,我们可以发现人类的多样性和
美丽。
每个人种的面部特征都有其独特之处,每个人的面部特征都值得被尊重和赞美。
无论我们来自何方,我们都应该珍视自己的面部特征,并尊重他人的面部特征。
让我们共同创造一个多元、包容的社会,让每个人都能自豪地展示自己独特的面部特征。
人脸识别算法的性别识别方法
人脸识别算法的性别识别方法人脸识别技术是一种通过计算机对人脸图像进行分析和比对的技术,广泛应用于人脸识别、人脸检测、人脸跟踪等领域。
其中,性别识别算法是人脸识别技术的一个重要组成部分。
本文将介绍人脸识别算法中常用的性别识别方法。
一、人脸特征提取在性别识别的过程中,首先需要对人脸图像进行特征提取。
人脸特征提取是将复杂的人脸图像通过一系列算法转化为更加简洁、有意义的特征向量,以便于后续的性别分类。
目前常用的人脸特征提取方法包括主成分分析(PCA)、线性判别分析(LDA)等。
PCA方法通过寻找最大化数据方差的特征向量来实现降维,将高维的图像数据转化为低维的特征向量。
而LDA方法则通过线性投影的方式,最大化同类样本的间隔,最小化异类样本的间隔,以获得更好的分类性能。
这两种方法在性别识别中均有应用。
二、分类器训练与测试在人脸特征提取之后,需要使用特征向量进行性别分类器的训练和测试。
常见的分类器包括支持向量机(SVM)、人工神经网络(ANN)等。
支持向量机是一种常见的监督学习方法,通过构建一个决策边界,将数据划分为不同的类别。
在性别识别中,支持向量机可以根据训练集的特征向量来学习判别性别的规律,最终得到一个具有较好分类性能的模型。
人工神经网络模拟了人脑神经元之间的连接和传递方式,通过对大量数据进行学习和训练,提取出特征,并通过不同的神经元层进行特征的组合和计算,最终得到性别分类的结果。
人工神经网络具有较强的非线性拟合能力,适合处理复杂的人脸图像。
三、数据集的准备与标注在进行性别识别的算法训练和测试之前,需要准备一个充足且准确标注的数据集。
数据集应包含不同姿态、光照条件、表情等变化的人脸图像,以保证算法的鲁棒性和泛化能力。
同时,还需要为数据集进行性别标注,即对每张人脸图像进行男性或女性的分类标记。
标注的准确性对于算法的训练和测试非常重要,需要尽可能避免标注错误和偏差。
四、算法性能评价在性别识别算法的研究中,评价算法的性能是十分重要的。
融合AdaBoost和启发式特征搜索的人脸性别分类
些重要 的新 的研究领域 。在 国内外 的研 究中 ,对 人脸性别 识别 的研究较少 ,但它 的作 用却 不小 。在 研究人脸 性别分类
一
较操作产生一个二进制特 点 ,每个二进制特点作为一 个弱分 类器 ( 所谓弱分类器 就是其 分类性 能仅仅强于 随机猜 测的分 类器 ),在这里 ,当比较操作为 “ 真” 时,其输 出结果代表 是 “ 男性” ,否 则 ,为 “ 女性” ,分 别用数字 “ ”和 “ l 0
这个问题上,G ti等应用 R F ua1 t2 B s和判定树的混合系统干
F R T图像库 上 ,分辨 率为 6 * 2 EE 4 7 ,达 到了 9 %的准确性 。 6
来表示。人脸图像中的每一对像素点的每一个比较操作都有
一
个弱分类器 ,我们用来作为研究 的人脸 图像 大小 为 2 0 02 ,
中 分 号, P9 圈 类 T31
融合 A a os 和启发 式特征搜 索的人脸性别分类 d B ot
朱文球,刘 强
( 南工业大学计算机系 ,株洲 4 0 ) 湖 0 8 1 2
精 蔓 :提 出一种基于 A ao s dB ot的人脸 性别分类 方法 ,从一 张低分辨率 灰度人脸 图像 中辨 认 出一 个人的性男 。将启发 式搜索算法 融于 Ⅱ
wi e sta 0 x lc mp r on p rto s h s ac e a c rce f te S t ls h n 5 0 pie o ai so eai n ,te e m th t c u a is o h VM — a e lsi e s whc h e tca sf r u ls e h s h b sd ca sf r ih te b s ls ie sp b ih d i i
人脸识别中的性别与年龄分类技术研究
人脸识别中的性别与年龄分类技术研究1.引言人脸识别技术是一种基于人脸图像或视频进行身份识别的技术。
它可以在不需要密集的用户交互的情况下识别或验证一个或多个用户。
人脸识别技术已经得到了广泛的应用,例如,安全控制、人脸解锁等。
人脸识别技术的一项重要应用是人脸性别与年龄分类。
2.人脸识别技术的基础2.1 人脸检测人脸检测是人脸识别技术的第一步,它的目标是找出被分析的图像或视频中的人脸。
人脸检测是一个非常重要的技术,因为它是识别或验证的前置条件。
人脸检测方法有很多,其中最常用的是基于特征的方法和基于机器学习的方法。
基于特征的方法将图像或视频中的人脸和事先定义好的人脸特征进行比较,找出最佳匹配。
基于机器学习的方法则是通过训练模型从已知人脸图像中学习人脸特征,并根据学习到的特征来检测新的人脸。
2.2 人脸对齐人脸对齐是将人脸图像或视频中的人脸调整为标准位置和大小的过程。
正确的人脸对齐可以提高后续算法的性能,并且使得不同角度和灯光下的人脸变得具有更好的比较性。
2.3 人脸表示人脸表示是将人脸图像或视频中的人脸转换为一组数值的过程。
这些数值可以表示人脸的特征,例如人脸的几何形状、纹理、颜色等。
常见的人脸表示方法包括主成分分析(PCA)、线性判别分析(LDA)、局部二值模式(LBP)等。
3.人脸性别与年龄分类技术3.1 性别分类技术性别分类是根据人脸图像或视频中人脸的特征来将人脸分为男性和女性。
常见的性别分类算法包括支持向量机(SVM)、随机森林(Random Forests)以及卷积神经网络(CNN)等。
其中SVM是一种常用的分类算法,它利用核函数将输入数据映射到高维空间,并在高维空间中找到一个最优的分类边界。
随机森林是一种强大的分类算法,它是由多个决策树组成的集成学习器。
每个决策树基于一个随机的样本和特征子集来进行训练,最终的分类结果是通过“投票”方式获得的。
相比于SVM和随机森林,CNN在性别分类方面表现更为出色。
人脸图像中的性别分类与年龄估计
人脸图像中的性别分类与年龄估计人脸图像中的性别分类与年龄估计是计算机视觉领域中的一个重要研究方向。
随着人工智能技术的不断发展,人脸识别技术已经广泛应用于安防、金融、医疗等领域。
而性别分类与年龄估计是人脸识别技术中最基础、最重要的任务之一。
性别分类是指根据一个人的面部图像,判断其是男性还是女性。
在过去,传统的方法主要依靠面部特征如下巴、嘴唇等进行判断,但这些方法往往不够准确。
而随着深度学习技术的发展,特别是卷积神经网络(CNN)在图像处理方面取得了巨大成功,基于深度学习的方法在性别分类任务上取得了很大突破。
基于深度学习的方法主要依靠大规模数据集进行训练,并通过卷积神经网络提取图像特征。
这些特征包括面部轮廓、眼睛位置、嘴唇形状等,并通过全连接层进行性别分类。
此外,还可以通过增加网络的深度、宽度等方式提高分类的准确性。
近年来,一些研究者还提出了基于注意力机制的方法,通过学习图像中不同区域的重要性来提高分类性能。
年龄估计是指根据一个人的面部图像,估计其年龄范围。
与性别分类不同,年龄估计是一个更加复杂的任务,因为人脸图像中往往包含了更多的信息。
过去的方法主要依靠面部纹理、皱纹等特征进行估计,但这些方法在复杂场景下往往效果不佳。
基于深度学习的方法在年龄估计任务上也取得了显著进展。
这些方法主要依靠大规模数据集进行训练,并通过卷积神经网络提取图像特征。
与传统方法不同的是,基于深度学习的方法可以自动学习到更加有区分力和鲁棒性强的特征,并通过回归模型进行年龄估计。
近年来,在性别分类与年龄估计任务上取得了一些重要研究进展。
例如,在数据集规模方面,一些研究者构建了更大规模的人脸数据集,以提高模型的泛化能力。
在模型结构方面,一些研究者提出了一些新的网络结构,如残差网络、注意力机制等,以进一步提高分类与估计性能。
在特征提取方面,一些研究者引入了更多的上下文信息,如姿态、表情等,以提高分类与估计的准确性。
然而,在性别分类与年龄估计任务上仍然存在一些挑战。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
武勃 艾海舟 肖习攀 徐光佑 (清华大学计算机科学与技术系,智能技术与系统国家重点实验室,北京 100084) 摘要: 人脸的性别分类是指根据人脸的图象判别其性别的模式识别问题。 本文系统地研究了 不同的特征提取方法和分类方法在性别分类问题上的性能,其中包括主分量分析(PCA)、 Fisher 线性鉴别分析(FLD)、最佳特征提取、Adaboost 算法、支持向量机(SVM)。给出 了在我们的 9 姿态人脸库、FERET 人脸库和一个网络图片人脸库上的对比实验结果。实验表 明人脸中的性别信息集中存在于某个子空间中, 因此在分类前对样本进行适当的压缩降维不 但不会明显降低分类器的性能, 而且可以大大减少分类的时间开销。 最后介绍了将性别分类 器与自动人脸检测和特征提取平台集成起来的基于人脸图象的性别判别系统。 关键词:性别分类,主分量分析,线性鉴别判别,Adaboost,支持向量机
T
散度矩阵为 S w = P (ϖ 1 ) S1 + P (ϖ 2 ) S 2 ,其中 P (ϖ i ) 是第 i 类的先验概率;样本的类间离散 度矩阵为 S b = ( µ1 − µ )( µ1 − µ ) + ( µ 2 − µ )( µ 2 − µ ) 。Fisher 准则定义为
T T
J F ( w) =
1, h( x ) = 0,
∑
T
t =1
α t g t ( x) ≥ threshold 。理论上随着弱分类器个数的增加,得到的强分类器在
otherwise
训练样本上的分类错误按指数递减[12]。 ( 4 ) PCA+ADABOOST+SVM 从理论上讲,显然由 Adaboost 算法挑选出来的本征向量要优于简单的根据本征值大小 挑选出来的本征向量。因为根据本征值大小挑选出来的本征向量只在表示熵[8]的意义下是 最优的,它没有考虑任何类别信息,而 Adaboost 算法则是充分考虑了各个本征向量的线性 分类能力。因此不妨用 Adaboost 挑选的本征向量集合对训练样本进行投影降维,然后再用 降维后的特征向量训练 SVM 分类器。 ( 5 ) FLD+CSCIE+SVM 主分量分析虽然在表示熵的意义下是最优的, 但它并没有充分利用训练样本中的类别信 息,这些信息显然对分类器的训练是有用的。最佳特征抽取方法[8]应该包含两部分信息, 其一是包含在类平均向量中鉴别信息的最优压缩信息, 理论上这部分信息就是具有统计不相 关性的最优鉴别信息[14], 对于两类的情况这部分等价于 FLD 抽取的信息; 另一是包含在类 中心化向量中的鉴别信息提取。有关最佳特征抽取在[8]中有系统阐述,这里只简单介绍。 Fisher 线性判别分析是主分量分析的直接推广。对于两类问题,设两类样本集合分别 为ϖ 1 和ϖ 2 ,定义各类内离散度矩阵为 S i = E[( x − µ i ) ( x − µ i ) | ϖ i ] ,i = 1,2 ;总类内离
1
的结论是:样本尺度大小对 SVM 分类器有一定影响,这个结果与[6]有所不同。最后,我们 采用 PCA+SVM 方法实现了一个自动性别分类系统,在网络图片人脸库上的正确率为 79.75%。 本文的实验共用到了三个人脸库——清华大学计算机系的 9 姿态人脸库、 FERET 人脸库 和网络图片人脸库。 用 FERET 人脸库是由于它是当今世界上公认的比较完全, 规模较大的人 脸库,具有一定的代表性。使用网络图片人脸库是因为其更接近实际应用。
~ =P 一化处理,第 i 类第 j 个分量的归一化方差为 γ ij i
γ ij ,其中 λ j 是产生矩阵 S w 的第 j 个 λj
本征值, Pi 是第 i 类的先验概率。 γ ij 是第 i 类第 j 个分量的方差, γ ij 可以由下式计算
γ ij = u T j S i u j ,其中 u j 是 S w 的第 j 个本征向量, S i 是第 i 类的协方差矩阵。用上式计算第
3
方差不同就可以分类, x ∈ [α 1 , α 2 ] 时则认为其为第一类, x ∈ ( −∞, α 1 ) ∪ (α 2 ,+∞) 时认为 其为第二类。 为了衡量包含二阶分类信息的多少,可以用总体熵 H P = −E[log p(x)] 。空间坐标系的产 为了计算总体熵, 先对方差进行归 生矩阵采用 Fisher 线性判别中的总类内离散度矩阵 S w 。
T
2
中 c 是常数,为分类器的阈值。这样得到一个大的弱分类器集合。使用 Adaboost 算法从这 个弱分类器集合中找出一个小子集, 这个子集中的弱分类器可以联合构成一个强分类器用来 解决性别分类问题。首先以各个本征向量为权向量,初始化弱分类器的阈值 c 。然后将 Adaboost 算法作用于这些弱分类器,最终的强分类器可以表示为一系列弱分类器的加权和
2.
性别分类算法
性别分类是一个典型的二分类问题, 按照抽取特征的不同和分类方法的不同有多种解决 方案。本文考虑的抽取特征有:象素特征本身、PCA 特征、LDA 特征、最佳特征提取,分类 方法有 Adaboost 算法、支持向量机(SVM)(以高斯径向基函数为核函数)。将其中用到的 典型的 5 种组合介绍如下。 ( 1 ) 基于 象素特征 的 支持向量 机 方法 以人脸区域的象素展开矢量为特征,用以高斯径向基为核函数的 SVM 方法进行性别分 类,这是 Moghaddam 等在论文[6]中使用的方法。假设共有 M 个训练样本(xi,yi),其中 xi∈ RN,yi 是 xi 对应的指标,yi∈{0,1},则支持向量机分类器的形式为如下分类超平面:
FLD 方法和 CSCIE 方法都利用了样本的类别信息。但对于二分类问题,FLD 只能找到一 个投影方向,这对于线性不可分问题是不够的。可以将 FLD 和 CSCIE 结合起来,如果要提取
1.
引言
人脸是人类最重要的生物特征之一, 反映了很多重要的信息, 如身份、 年龄和性别等等。 性别分类就是根据输入的人脸图象判断性别的过程。 虽然对人来说识别男女并没有什么神秘 的地方,但用计算机进行自动的性别分类并不是一个简单的问题。 有关性别分类的研究可大致划分为两个阶段, 一个阶段主要源于心理学研究的需要或纯 粹作为一个实验问题来看待,主要采用人工神经网络方法,包括 Gollomb 等[1]的两层神经 元网络 SEXNET 方法,用来识别 30×30 的人脸样本的性别;Cottrell 等[2]先对样本进行主 分量分析,然后训练 BP 神经元网络用于识别人脸的表情和性别;Edelman 等[3]采用线性神 经元网络进行分类,用人脸的三个不同部分(整个人脸、人脸上半部分和下半部分)分别训 练, 对这三种情况下的分类器性能加以比较分析; Alice 等[4]系统地研究了人脸女性化程度、 男性化程度、可识别程度和漂亮程度之间的关系,并用 PCA 模型对人脸中所含信息的统计 结构进行了定量计算;他们还用 PCA 方法从人脸的三维模型(结构和纹理)中提取特征, 并用于训练性别分类的感知机[5]。近年来随着人脸检测研究的进展和对智能视觉监视的需 求日益高涨,自动性别分类受到关注,Moghaddam 等[6]采用了基于象素特征的支持向量机 (SVM)方法,并与一些经典的方法(RBF 网络、Fisher 线性鉴别分析(FLD) )做了系统的 比较,在 FERET 人脸库上得到了比较理想的效果(错误率只有 3.4%) ,Shakhnarovich 等[7] 将基于积分图象特征的 Adaboost 方法应用于性别分类问题,并且完成了一个自动性别分类 系统,使用普通网络图片测试正确率达 78%。 为了深入探讨性别分类的应用前景,考虑基本正面的人脸(平面内旋转小于±15°,平面 外旋转小于±30°) , 我们通过实验系统地分析了几种解决方案, 包括基于象素特征的 SVM 方 法、PCA+SVM 方法、PCA+Adaboost 方法、PCA+Adaboost+SVM 方法和最佳特征提取即 FLD+CSCIE(Centralized Sample’s Classification Information Extracting [8])+SVM 方法,并 比较了这 5 种方法之间的优劣。 实验结果表明采用主分量分析进行特征抽取后的本征向量作 为分类器的输入和直接采用原始象素作为分类器输入,最终的分类正确率并没有很大差别。 这就说明由主要的本征向量张成的特征子空间已经包含了人脸中的大部分性别信息, 在分类 前进行特征提取起到了压缩样本,减少计算量的作用,而且不会明显降低分类正确率。本文 还考察了 SVM 分类器在各种输入尺度(16×16,24×24,32×32,40×40)下的性能。得到
~ log γ ~ 。为了从坐 J (u j ) = −∑ γ ij ij
i =1
2
图 2. 9 姿态人脸库
标轴中选取具有最大二阶判别信息 的 d 个坐标轴,将坐标轴按照总体熵准则 J (u j ) 从小到大排列
J (u1 ) ≤ " ≤ J (u d ) ≤ " ≤ J (u n ) ,取前 d 个坐标轴即可。
i 类第 j 个分量的方差时的一个假设是, S w 的本征向量可以使 S1 和 S 2 同时对角化。这个假
设通常在各类的协方差矩阵都相同 的情况下才可能满足。这个假设使 得方差的计算得到的只是一个近似 值,如果这两类中心化后的分布差 别很大,那方差的值与真实值会相 差很大。对于两类问题,第 j 个坐 标轴 u j 的总体熵准则函数定义为
wT S b w n ,其中 w ∈ R 。 T 使得
J F ( w) 达到最大值。该 w ∗ 是满足
S b w ∗ = λS w w ∗ 的广义本征向量。对于
c 类问题而言这样的 w∗ 最多只有 c − 1
个。
图 1. 中心化样本向量中的类判别信息
虽然 FLD 方法考虑了类别信息,但 它只利用了包含在类均值向量中的类别 信息。而中心化后的样本向量仍然对分类很有帮助。如图 1 所示,均值相同的两类只要条件