图像识别技术综述

图像识别技术综述
图像识别技术综述

图像处理与识别技术综述

摘要:本文简要介绍了图像处理与识别技术的相关知识,介绍了图像识别过程中的判别函数和判别规则,特征提取和选择的方法。设计一个基于16位处理器MC9S12XS128的图像识别系统在实际中的具体硬件实现。

关键词:图像识别特征提取MC9S12XS128 数字摄像头

An Overview of Image Recognition And Identifying Technology

Abstract:This paper introduces some knowledge of image recognition and identifying technology,introduces the discriminant function discriminant rule in the image identifying progress, feature extraction and selection method. Designed an image identifying system based on 16-bit controller MC9S12XS128,and it has specific hardware implementation in fact.

Key words: image identifying discriminaut rule MC9S12XS128 digital cameral

1 引言

图像是与视觉相关的最贴近生活的信息,它是客观世界的物体直接或间接作用于人眼而产生视知觉的实体。传统的图像处理技术就是对图像进行保存、处理、压缩、传输和重现。随着信息时代的到来,用于计算机处理的各种信息的需求越来越多,多媒体信息处理技术已经成为日常生活各个领域的迫切需要。人们更希望利用计算机技术处理人类视觉问题,如:人脸、指纹识别技术实现处理与个人有关的一切事物,利用视觉自动监视系统监视环境中发生的非常事件,利用字符识别技术实现文档图像的自动录入与处理。因此把传统的图像处理技术与模式识别处理技术相结合是图像处理的新趋势。

2 传统的图像处理技术

图像处理技术始于20世纪50年代,1964年美国喷射推进实验室(JPL )使用计算机对太空船送回的大批月球照片处理后得到了清晰逼真的图像,这是这门技术发展的里程碑,此后这门技术得到了广泛的发展。

传统图像处理技术包含图像的获取、变换、增强、编码、分割等方面的内容。

2.1 图像获取

图像可以根据其形式或产生方法来分类。 照片图画

光图像连续函数

离散函数

(数字图像)不可见的

物理图像

物体图像

可见的图像图片数学函数

图1 图像的分类

图像的获取[4]是指将其变为计算机可识别的信息。通常是数字化的过程,及扫描、采样、量化三个步骤。经过数字化过程后就得到了一幅图的数字表示,即数字图像。一般这个过程由摄像头等设备完成。反过来还可将数字图像进行显示。

2.2 图像变换

图像变换[6]广泛应用于图像滤波[2]、统计滤波[5]、图像数据压缩以及图像描述等。图像变换是将N ×N 维空间图像数据变换成另外一组基向量(通常是正交向量空间)的坐标参数,我们希望这些离散图像信号坐标参数更集中代表了图像中的有效信息,或者是更便于达到某种处理目的。

通常采用的方法有:傅里叶变换、相关分析、小波变换[7]、离散余弦变换(DCT )、正弦变

换、沃尔什-哈达玛变换、K-L 变换[13][14][15](主成分分析法)等。

着重介绍K-L 变换在实际中的应用算法SIMCA 。SIMCA (Soft Independentt Modeling of Class Analog )方法是一种有监督模式识别方法。该方法是对训练集中每一类样本的量测数据矩阵分别进行主成分分析[10][11][12] (PCA ) ,建立每一类的主成分分析数学模型,然后在此基础上对未知样本进行分类,即分别试探将该未知样本与各类样本数学模型进行拟合,以确定其属于哪一类或不属于任何一类。基本的SIMCA 方法有两个主要步骤,第一步先建立每一类的主成分分析模型,第二步以未知样本逐一去拟合各类的主成分模型,从而进行判别归类。主成分提取的原理是对高维的原变量空间进行降维,以消除众多化学信息中相互重叠的信息部分,使数目较少的主成分 (新变量) 成为原变量的线性组合,而且新变量应最大限度地表征原变量的数据结构特征而不丢失信息。其方法是将光谱数据向均方差最大方向投影。通过对主成分个数的合理选取,去掉代表干扰组分和干扰因素的主成分,新变量最大限度地反映了被测样品的组成和结构信息,而最小限度地包含噪音。另外,主成分之间相互正交,能够克服原变量多重相关性造成的信息重叠。这样有助于从样品的测量光谱中最大限度地提取有用的化学信息,建立优秀的数学模型。

PCA 方法是把光谱矩阵分解为两个维数较小的矩阵的乘积:

E P T A p f f m p m +?=???

其中 错误!未找到引用源。为光谱矩阵, 错误!未找到引用源。为得分矩阵,错误!未找到引用源。 为载荷矩阵,E 为光谱残差,维数与错误!未找到引用源。 相同。 m 为样品数目,p 为波长数目,f 为 PCA 主成分个数。主成分与原变量之间的相关系数称为载荷 (Loading ) 。载荷表征原始变量与新变量之间的相关性。样本在新变量下的坐标值称为得分 (score ) 。

经过主成分分析后,常用聚类分析[8]来分析图像。

2.3 图像增强

图像增强[9]就是增强图像中的有用信息,其目的主要有两个:一是改善图像的视觉效果,提高图像成分的清晰度;二是使图像变得更有利于计算机处理。图像增强的方法一般分为空间域和变换域两大类。空间域方法直接对图像像素的灰度进行处理。变换域方法在图像的某个变换域中对变换系数进行处理,然后通过逆变换获得增强图像。

常用的图像增强方法包括:空间域单点增强(灰度级修正)、图像平滑、图像锐化、图像滤波与彩色增强等。

2.4 图像编码

图像信息已经成为通信和计算机系统中的重要处理对象。与文字信息不同的是,图像信息占据大量的存储容量,所用传输信道也较宽。因此对图像数据的压缩成了迫切需求。由于图像本身固有的冗余性和相关性,使得将一个大的图像数据文件转换成较小的图像数据文件成为可能。

图像压缩[17]不能丢失原始图像的重要信息,衡量压缩性能的指标是客观保真度和主观保

真度。常用的客观保真度可以采用图像的均方根误差e ms 、信噪比SNR 与峰值信噪比PSNR 表示。在相同的压缩比下,均方误差e ms 越小,性能越好。在相同均方根误差e ms 下,压缩比越大,性能越好。

常用的数据编码方法有:统计编码、预测编码、变换编码、轮廓编码等。

2.5 图像分割[16]

在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣。这些部分常称为目标或前景(其他部分称为背景),它们一般对应图像中特定的、具有独特性质的区域。为了辨识和分析目标,需要将这些有关区域分离或提取出来,在此基础上才有可能对目标进一步利用,如进行特征提取和测量。图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。这些特征可以是灰度、颜色、纹理或几何性质等,目标可以对应单个区域,也可以对应多个区域。分割出的区域应同时满足:

(1)分割出的图像区域的均匀性和连通性。均匀性是指该区域中所有像素点都满足基于灰度、纹理、色彩等特征的某种相似性准则,连通性是指该区域内存在连接任意两点的路径。

(2)相邻分割区域之间针对选定的某种差异显著性。

(3)分割区域边界应规整,同时保证边缘的空间定位准确。

基本的分割算法,首先对灰度图像的分割可基于像素灰度值的2个性质:不连续性和相似性。区域内的像素一般具有灰度相似性,而区域之间的边界上一般具有灰度不连续性。所以分割算法可据此分为利用区域间灰度不连续性的基于边界的算法和利用区域内灰度相似性的基于区域的算法。其次,根据分割过程中处理策略的不同,分割算法又可分为并行算法和串行算法。在并行算法中,所有判断和决策都可独立地和同时地做出,而在串行算法中早期处理的结果可被其后的处理过程所利用。一般串行算法所需计算时间常比并行算法长,但抗噪声能力也较强。这2个准则互不重合又互为补充,所以分割算法根据这2个准则分成四类:(1)并行边界类;(2)串行边界类;(3)并行区域类;(4)串行区域类。

3 图像识别

图像识别,可分为是图像的模式识别,它是模式识别技术在图像领域中的具体运用。传统图像处理是对输入图像的某种有效的改善,其输出仍是一幅完整的图像,而识别是可认为是认识它而且能从一堆物件中间把它与其他事物区别开来。

3.1 判别函数和判决规则

模式识别系统的基本功能是能判别各模式所归属的类型,完成这一功能的重要方法之一是采用判别函数。判别函数[18]有线性和非线性之分。

3.1.1 线性判别函数

线性判别函数是应用较广的一种判别函数。所谓线性判别函数,是指判别函数是图像所有N 个特征量的线性组合。设它的组合系数为

i ω,则对于M 类问题,其任一类i 的线性识别函数为01)(i k N k ik i X X D ωω

+=∑= M i ,,2,1 = (1) 式中:)(X D i 代表第i 个判别函数,ik ω是系数或权,0i ω为常数或称为阈值。在i ω和j

ω

两类之间的判决分界处有)()(X D X D j i =,所以边界方程为

0)()(=-X D X D j i (2)

该方程在二维空间是直线,在三维空间是平面,在N 维空间是超平面。)()(X D X D j i -可以写成如下形式:

)()()()(001j i k N k jk ik j i X X D X D ωωωω-+-=-∑= (3)

相应的判决规则为:如果0)()(D )()(>->X D X X D X D j i j i 或,则i X ω∈;如果0)()(D )()(<-

用线性判决函数构造的分类器是线性分类器。任何m 类问题都可以分解为(m-1)个两类识别问题。方法是先把模式空间分为某一类和其他类的组合,即两两对比,如此进行下去即可实现最终分类。因此,两类线性分类器是最简单和最基本的。

x 2

x N -1W 1W 2W N

W 0∑>0<0

x 1

1W x ∈2W x ∈

图2 两类的线性分类器

在线性分类器中要找到合适的权值,才能使分类尽可能不出差错,有效地方法就是实验法。

3.1.2 最小距离判别函数

在图像识别中,线性分类器一种很重要的方法就是将未知类别的图像和特征空间中作为模板的点(标准样点的中心)之间的距离作为分类的准则。对于M 类模板,未知类别图像与哪一类距离最近就属于哪一类。这就是最小距离判别函数[8]。

3.1.3 非线性判别函数

线性判别函数很简单,但也有缺点,它对于较复杂的分类往往不能胜任。在较复杂的分类问题中,往往需要提高判别函数的次数,这就有了非线性判别函数。非线性判别函数可以写成一下形式:

(4)

式(4)是一个二次型判别函数,通常二次型判别函数的决策边界是一个超二次曲面。

3.2 特征的提取和选择

在图像识别中,对获得的图像直接进行分类是不现实的。首先,图像数据占用很大的存储空间,直接进行识别费时费力,其计算量无法接受;其次,图像中含有许多与识别无关的信息,i

k N k N i ki k N k k k N k kk N N N N

N x x x x x x x x x x x x x x x x x D ∑∑∑∑====+++=++++++++++++=111310222222111113113211222110)(ωωωωωωωωωωωωωω

如图像的背景等,因此必须进行特征的提取和选择,这样的就能对被识别的图像数据进行大量压缩,有利于图像识别。再次,由于测量上可实现性的限制或经济上的考虑,所获得的测量值为数不多。

在图像识别中良好的特征应具有4个特点:

(1)可区别性。对于属于不同类别的图像,它们的特征值应具有明显的差异。

(2)可靠性。对于同类的图像,它们的特征值应比较相近。

(3)独立性。所使用的各特征值之间应彼此不相关。

(4)数量少。

特征选择和提取的总原则是:应尽量减少整个识别系统的处理时间和错误识别概率。当两者无法兼得时,需要人们做出相应的平衡。要么缩小错误识别的概率。以提高识别的精度,但会增加系统的运行时间;要么提高整个系统速度以适应实时需要,但会增加错误识别概率。这个就要根据系统所使用的场合合理选择,做出最佳平衡效果。

随着科技理论的发展,识别方法有模糊识别方法以及人工神经网络识别方法[19]。

4 图像识别系统实例

4.1 硬件平台

控制器:飞思卡尔公司16位单片机MC9S12XS128

摄像头:数字CMOS 摄像头OV7620

4.2 整体设计框图 OV7620摄像头采

集图像信息

16位单片机MC9s12xs128

12864液晶显

示机械手

图3 图像识别系统整体框图 4.3 图像识别算法

本系统使用物体的外形特征来区分物体。

本系统微处理器选择飞思卡尔公司的16位单片机MC9s12xs128,最高总线频率40MHz ,这就决定了图像处理算法要尽量避免浮点型的乘加运算。本系统图像处理采用两种算法实现。一种是“轮廓”算法[1],一种是“面积”算法[3]。

本设计中图像传感器采用数字摄像头OV7620,它能输出彩色和灰度两种信号,由于彩色信号数据量很大,所以本设计只对它输出的8位灰度信号进行采集。“轮廓”算法就在行场中断到来时,采集摄像头输出的灰度信号,将数据送入单片机的存储单元,然后每一行把第一个灰度信号值和本行下一个亮度信号值作差,取这个差的绝对值。当这个差在一定范围内时,认为没有灰度差异,即没有看到物体。然后再和下一个灰度数据作差,当这个差超过给定的范围时,做一个标记,然后进行软件滤波,消除瞬间采集的数据错误的可能,找出待识别物体开始

的位置点。按这种方法再找出结束的点。软件中设置的这个差值是60。每一行都这样找到开始和结束的位置点后,再整体判断物体的轮廓。我采用的是将每一行最开始记下的位置点(即每一行做标记的点)再和最后一行的最开始记下的点(即做标记的点)作差,绝对值大于一定的值就认为是有斜率的,软件中设置的是大于10就认为有斜率。软件流程图如图4所示。 采集亮度信号

cha=fabs (Init_data1[i][j]-

init_data1[i][j+1]),cha>60?cha=fabs (Init_data1[i][j]-

init_data1[i][j+1]),cha>60?j++

cha=fabs (Init_data1[i][j]-

init_data1[i][j+1]),cha>60?j++

locationx[m]=i,

Locationy[m]=j

hang++

图4 “轮廓”算法软件流程图

“面积”算法是对“轮廓”算法的一种简化改进,主要不同于“轮廓”算法的是对灰度信号不做差,而是和固定阈值比较,若小于此阈值,面积变量加1,一直扫描完所有采集回的灰度数据。然后根据之前所测的数据,算出所要识别物体的面积大约是多少,确定近似面积的范围。在软件中,计算出面积的大小后,再与之前算出的近似面积范围比较,计算面积落在近似

面积的哪个范围就说明待识别物体大体是什么。这种算法简单可靠,但是适用性不广泛。软件流程图如图5所示。 采集亮度信号

Init_data1[i][j]<100?

(area<600)&&(area>300)?

area++

物体1是

(area<300)&&(area>80)?

物体2

i=Row_Max?j=Line_Max?

未识别

图5 “面积”算法软件流程图

这两种算法都是很简单的,但是能够满足从外形上将物体按外形特征区分开来。 5 结束语

本文主要是在综述的角度上对图像处理和图像识别的过程和方法的一个概述。参考的文章主要有两个特点。一是对图像数据的降维处理,以期在最大限度保存信息的情况下最多的减少数据量,降低运算复旦,避免“维数灾难”。另一个特点是通过多种算法,在特征提取和选择上尽可能做到最优的区分性。

图像识别现有的方法都或多或少地带有一定的局限性,而且由于数据量庞大,硬件实现的

处理速度成为图像识别的瓶颈问题,因此图像识别识别面临着巨大的困难。然而,随着神经网络、模糊理论、分形理论、小波分析、遗传算法的继续发展以及各种方法在模式识别领域及其在具体领域中的应用的互相融合、取长补短,相信模式识别技术以及模式识别技术在各个领域的应用将会得有更大的发展。

参考文献

[1] 陈希章,陈华斌,陈善本等.基于改进C-V方法的焊接图像识别[J].焊接学报,2007,28(9):9-12,107.

[2] 谢敬辉,王旦福,张浩. 应用综合鉴别函数实现畸变不变图像识别[J].北京理工大学学报,2007,27(10):915-918.

[3] 张红涛,毛罕平,邱道尹. 储粮害虫图像识别中的特征提取[J].农业工程学报,2009,25(2):126-130.

[4] 王荣本,王超,初秀民. 路面破损图像识别研究进展[J]. 吉林大学学报(工学版),2002,32(4):91-96.

[5] 俞建荣,曹建树等. 基于Matlab的流化床气泡运动的图像识别与处理[J].仪器仪表学报,2006,27(6):2306-2307.

[6] 宋诗哲,王守琰,高志明等. 图像识别技术研究有色金属大气腐蚀早期行为[J].金属学报,2002,38(8):896-896.

[7] 葛森,黄大贵. 基于最大互信息方法的机械零件图像识别[J].电子科技大学学报,2007,36(4):801-804.

[8] 缑水平,焦李成,田小林. 基于免疫克隆聚类协同神经网络的图像识别[J].电子与信息学报,2008,30(2):263-266.

[9] 李士林,尹成群,尚秋峰等. 基于图像识别理论的混沌特性判别方法[J].中国电机工程学报,2003,23(10):47-50.

[10] 李庆波,杨丽敏,吴谨光等. SIMCA法在中红外癌症检测技术中的应用[J].光谱学与光谱分析,2004,24(4):414-417.

[11] 杨忠,江泽慧,费本华等. SIMCA法判别分析木材生物腐朽的研究[J].光谱学与光谱分析,2007,27(4):686-690.

[12] 王家俊,汪帆,马玲. SIMCA分类法与PLS算法结合近红外光谱应用于卷烟纸的质量控制[J].光谱学与光谱分析,2006,26(10):1858-1862.

[13] 周群,孙素琴,梁曦云. 枸杞产地的红外指纹图谱与聚类分析法研究[J].光谱学与光谱分析,2003,23(3):509-511.

[14] 张宁,张德权,李淑荣. 近红外光谱结合SIMCA法溯源羊肉产地的初步研究[J].农业工程学报,2008,24(12):309-312.

[15] 瞿海斌,杨海雷,程冀宇. 近红外漫反射光谱法快速无损鉴别阿胶真伪[J].光谱学与光谱分析,2006,26(1):60-62.

[16] 张洪刚,陈光,郭军. 图像处理与识别[M]. 北京邮电大学出版社,2006.

[17] P. W. Cox,G. C. Paul,C. R. Thomas.Image analysis of the morphology of filamentous micro-organisms.Microbiology,1998,144:1.

[18] S. Venkatraman,M. J. Doktycz,H. Qi.Automated Analysis of Fluorescence Microscopy Images to Identify Protein-Protein Interactions.International Journal of Biomedical Imaging,2006,(6):10. [19] George Xu,Casey Chiu,Elsa D. Angelini.An Incremental and Optimized Learning Method for the Automatic Classification of Protein Crystal Images.Proceedings of the 28th IEEE EMBS Annual International Conference,2006,8.

图像识别技术的研究现状论文

图像识别技术研究现状综述 简介: 图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。 图像识别的发展大致经历了三个阶段:文字识别、图像处理和识别及物体识别:文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,并从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。图像处理和识别的研究,是从1965年开始的。过去人们主要是对照相技术、光学技术的研究,而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途之广,不胜枚举。物体识别也就是对三维世界的认识,它是和机器人研究有着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天,尽管机器人的研究非常盛行,还只限于视觉能够观察到的场景。进入80年代,随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成为新的动向 图像识别与图像处理的关系: 在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等,以提供一个满足要求的图像。图像处理包括图像编码,图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说,输入是图像,输出(即经过处理后的结果)也是图像。图像处理主要用来解决两个问题:一是判断图像中有无需要的信息;二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类,确定类别名称,它可以在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,然后根据测量结果做出分类。为了更好地识别图像,还要对整个图像做结构上的分析,对图像进行描述,以便对图像的主要信息做一个好的解释,并通过许多对象相互间的结构关系对图像加深理解,以便更好帮助和识别。故图像识别是在上述分割后的每个部分中,找出它的形状及纹理特征,以便对图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像(经过上述处理后的图像),输出是类别和图像的结构分析,而结构分析的结果则

手势识别技术综述

手势识别技术综述 作者单位:河北工业大学计算机科学与软件学院 内容摘要: 手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。

但是这其中手势占大多数。本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。 Abstract: Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future. 1.定义 说到手势识别,首先要对手势识别中的手势有一个清晰的认知。手势在不同的学科中有不同含义,而在交互设计方面,手势与依赖鼠标、键盘等进行操控的区别是显而易见的,那就是手势是人们更乐意接受的、舒适而受交互设备限制小的方式,而且手势可供挖掘的信息远比依赖键盘鼠标的交互模式多。在学术界,人们试图对手势定义一个抽象、明确而简洁的概念以为手势及其应用的研究提供依据。1990年Eric Hulteen和Gord Kurtenbach曾发表的题为“Gestures in Human-Computer Communication”中定义:“手势为身体运动的一部分,它包括一部分信息,而且是一种能被观察到的有意义的运动。挥手道别是一种手势,而敲击键盘不是一种手势,因为手指的运动没有被观察,也不重要,它只表示键盘

人脸表情识别

图像处理与模式识别 ------人脸表情识别介绍摘要:人脸表情是我们进行交往和表达情绪的一种重要手段,不经过特殊训练,人类对其面部表情往往很难掩饰,所以,通过对人脸表情进行分析,可以获得重要的信息。人脸表情识别是人机交互的智能化实现的一个重要组成部分,也是模式识别、图像处理领域的一个重要研究课题,近几年来,受到了越来越多的科研人员的关注。 本文综述了国内外近年来人脸表情识别技术的最新发展状况,对人脸表情识别系统所涉及到的关键技术: 人脸表情特征提取,做了详细分析和归纳。 关键词:人脸定位;积分投影;人脸表情识别;流形学习;局部切空间排列Abstract:Facial expression is a kind of important means that we communicate and express the special training, People often difficult to conceal their facial , by the analyzing facial expression, we can obtain important information. Facial expression recognition is an important component that the implementation of human-computer interaction, and an important research topic in the field of pattern recognition, image processing, in recent years, more and more researchers focus on this topic. In this paper,we present the latest development of this area,and give a detailed analysisand summary for facial

关于人脸识别技术的发展研究

人脸识别技术优势 863计划、国家科技支撑计划、自然科学基金都拨出专款资助人脸识别的相关研究。国家“十一五”科技发展规划中也将人脸识别技术的研究与发展列入其中[4],明确指出:“要在生物特征识别技术领域缩小与世界先进水平的差距,开展生物特征识别应用技术研究,人脸识别具有高安全性、低误报率的出入口控制新产品。”在这种环境下,国内一些科研院所和院校在人脸识别技术方面取得了很大进展。如中科院自动化所,清华大学,中科院计算所自主开发的人脸识别技术已经达到了国际先进的水平。人脸识别作为一种新兴的生物特征识别技术(Biometrics),与虹膜识别、指纹扫描、掌形扫描等技术相比,人脸识别技术在应用方面具有独到的优势: 1.人脸识别使用方便,用户接受度高。人脸识别技术使用通用的摄像机作为识别信息获取装置,以非接触的方式在识别对象未察觉的情况下完成识别过程。 2.直观性突出。人脸识别技术所使用的依据是人的面部图像,而人脸无疑是肉眼能够判别的最直观的信息源,方便人工确认、审计,“以貌取人”符合人的认知规律。 3.识别精确度高,速度快。与其它生物识别技术相比,人脸识别技术的识别精度处于较高的水平,误识率、拒认率较低。 4.不易仿冒。在安全性要求高的应用场合,人脸识别技术要求识别对象必须亲临识别现场,他人难以仿冒。人脸识别技术所独具的活性判别能力保证了他人无法以非活性的照片、木偶、蜡像来欺骗识别系统。这是指纹等生物特征识别技术所很难做到的。举例来说,用合法用户的断指即可仿冒合法用户的身份而使识别系统无从觉察。 5.使用通用性设备。人脸识别技术所使用的设备为一般的PC、摄像机等常规设备,由于目前计算机、闭路电视监控系统等已经得到了广泛的应用,因此对于多数用户而言使用人脸识别技术无需添置大量专用设备,从而既保护了用户的原有投资又扩展了用户已有设备的功能,满足了用户安全防范的需求。 6.基础资料易于获得。人脸识别技术所采用的依据是人脸照片或实时摄取的人脸图像,因而无疑是最容易获得的。 7.成本较低,易于推广使用。由于人脸识别技术所使用的是常规通用设备,价格均在一般用户可接受的范围之内,与其它生物识别技术相比,人脸识别产品具有很高的性能价格比。 概括地说,人脸识别技术是一种高精度、易于使用、稳定性高、难仿冒、性价比高的生物特征识别技术,具有极其广阔的市场应用前景。 我将人脸识别的一些应用列举出来,希望抛转引玉,大家不断完善,开拓更多的应用领域。 1)监控布控

基于matlab的图像预处理技术研究文献综述

毕业设计文献综述 题目:基于matlab的图像预处理技术研究 专业:电子信息工程 1前言部分 众所周知,MATLAB在数值计算、数据处理、自动控制、图像、信号处理、神经网络、优化计算、模糊逻辑、小波分析等众多领域有着广泛的用途,特别是MATLAB的图像处理和分析工具箱支持索引图像、RGB 图像、灰度图像、二进制图像,并能操作*.bmp、*.jpg、*.tif等多种图像格式文件如。果能灵活地运用MATLAB提供的图像处理分析函数及工具箱,会大大简化具体的编程工作,充分体现在图像处理和分析中的优越性。 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。 图像处理它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在 1964 年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动

基于手势识别的智能电视交互专利技术综述

基于手势识别的智能电视交互专利技术综述 智能电视具有操作系统,支持第三方应用资源实现功能扩展,支持多网络接入功能,具备人机交互、与其他智能设备进行交互等。随着计算机视觉的发展和人机交互的需要,手势识别研究取得了蓬勃的发展,通过手势识别对智能电视进行控制和操作,能够更轻松、高效地使用电视设备。文章利用专利数据库对智能电视手势识别技术进行了数据统计和分析,对该领域的专利申请趋势等情况做了归纳总结。 标签:智能电视;手势识别;发展状况;专利 Abstract:Intelligent TV has the operating system,which supports the third party application resources to realize the function expansion,supports the multi-network access function,has the man-machine interaction,and carries on the interaction with other intelligent devices. With the development of computer vision and the need of human-computer interaction,the research of gesture recognition has made great progress. By controlling and operating intelligent TV through gesture recognition,one can more easily and more efficiently use TV equipment. This paper makes use of patent database to analyze the data of intelligent TV gesture recognition technology,and summarizes the trend of patent application in this field. Keywords:intelligent TV;gesture recognition;development status;patent 引言 电视是家庭娱乐休闲必不可少的家用电器。如今,电视依然是最为普及的信息传播载体,用户在观看普通节目的同时,还可以上网、娱乐等。从用户的角度出发,通过自然简单、人性化的方式完成交互,无疑是用户完成电视操作的最佳方式。而手势具有直观、自然、丰富的特点,是一种符合人们日常习惯的交互手段,是表達信息和特定意图的良好载体,由于手势具有上述特性,因此在对智能电视进行操控中得到了良好的运用,实现了对智能电视自然灵活地操作。 1 基于手势识别的智能电视控制技术发展状态分析 1.1 技术分解 本文通过检索获得的专利申请进行统计分析,对基于手势识别的智能电视控制所涉及的具体技术和应用领域进行分解。 根据手势采集设备可以将手势识别系统大致分为基于数据手套和基于视觉的两种手势识别系统。其中,数据手套通过多个传感器反馈各关节的数据,并通过位置跟踪器返回人手所在的三维坐标,从而获取手势在三维空间中的位置信息和手指的运动信息。通过数据手套可以直接获取人手在三维空间中的位置和运动

自发表情识别方法综述

收稿日期:2015-04-03;修回日期:2015-05-26 基金项目:国家自然科学基金资助项目(61463034) 作者简介:何俊(1969-),男,江西东乡人,副教授,硕导,博士,主要研究方向为人机交互技术、模式识别等(boxhejun@tom.com);何忠文(1986-),男,江西九江人,硕士研究生,主要研究方向为人机交互技术、模式识别等;蔡建峰(1990-),男,河北人,硕士研究生,主要研究方向为人机交互;房灵芝(1988-),女,山东人,硕士研究生,主要研究方向为人机交互. 自发表情识别方法综述* 何 俊,何忠文,蔡建峰,房灵芝 (南昌大学信息工程学院,南昌330031) 摘 要:介绍了目前自发表情识别研究的现状与发展水平,详细阐述了自发表情识别研究的内容和方法,以及自发表情识别研究的关键技术,旨在引起研究者对此新兴研究方向的关注与兴趣,从而积极参与对自发表情识别问题的研究,并推动与此相关问题的进展。关键词:表情识别;自发表情;特征提取 中图分类号:TP391.41 文献标志码:A 文章编号:1001-3695(2016)01-0012-05doi:10.3969/j.issn.1001-3695.2016.01.003 Surveyofspontaneousfacialexpressionrecognition HeJun,HeZhongwen,CaiJianfeng,FangLingzhi (Information&EngineeringCollege,NanchangUniversity,Nanchang330031,China) Abstract:Thispaperintroducedtheactualityandthedevelopinglevelofspontaneousfacialexpressionrecognitionatthe presenttime,andpaidparticularattentiontothekeytechnologyontheresearchofspontaneousfacialexpressionrecognition.Thispaperaimedtoarouseresearchers’attentionandinterestsintothisnewfield,toparticipateinthestudyofthespontane-ousfacialexpressionrecognitionproblemsactively,andtoachievemoresuccessescorrelatedtothisproblem.Keywords:facialexpressionrecognition;spontaneousfacialexpression;featureextraction 表情识别被视为未来情感人机交互的重要技术[1] ,吸引了国内众多高校和科研机构的参与和研究[2~6]。但目前国内 外研究中比较常用的表情数据库中的人脸表情大都固定为正面,任务仅限于识别Ekma提出的六种基本表情(愤怒、高兴、悲伤、惊讶、厌恶和恐惧)。这不仅与实际表情不相符,而且忽视了真实表情中特有的脸部肌肉形变与头部运动之间的时空相关性。谷歌申请的新一代表情识别专利,挤眉弄眼方可解锁手机;荷兰开发的诺达斯(Noldus)面部表情分析系统是世界上第一个商业化开发的面部表情自动分析工具,用户使用该系统能够客观地评估个人的情绪变化,可以跟踪人的表情变化。但二者均要求测试者的头姿基本保持不动,实时连续头姿估计阻碍了其在手机等智能终端领域的应用。因此,面向实际应用的 非正面表情识别研究在国内外日益受到重视[7,8] 。 近十几年来,开展自发表情识别研究的机构主要有美国的加利福尼亚大学、卡耐基梅隆大学机器人研究所、匹兹堡大学心理学系,伊利诺伊大学、沃森研究中心、贝克曼研究所、伦斯勒理工学院、麻省理工大学媒体实验室、丹佛大学、德克萨斯大学计算机视觉研究中心、新泽西技术学院、芬兰的奥卢大学计算机科学与工程系机器视觉组、荷兰的阿姆斯特丹大学信息学院、澳大利亚的昆士兰科技大学科学与工程学院、加拿大的麦吉尔大学、日本的庆应义塾大学、爱尔兰的爱尔兰国立大学计算机视觉和成像实验室,中国的清华大学和中国科学技术大学等已经有人做了大量工作。目前该领域比较重要的国际会议包括计算机视觉与模式识别会议(InternationalConferenceonComputerVisionandPatternRecognition,CVPR)、模式识别会议 (InternationalConferenceonPatternRecognition,ICPR)、人脸与姿态自动识别会议(InternationalConferenceonAutomaticFaceGestureRecognition,FGR)。关于非正面表情识别的研究文章 逐年增多,但国内还只是刚开始涉足该领域的研究[9] ,一些非 正面表情识别中的关键技术尚有待突破。但总的来说,对目前自发表情识别的研究和探索还处于初级阶段,对自发表情识别的研究还需要研究人员共同的努力。本文介绍了常用的自发表情数据库以及自发表情识别关键技术研究进展。 1 自发表情数据库 1)USTC-NVIE数据库 USTC-NVIE(naturalvisibleandinfraredfacialexpressions) 数据库[10] 是由中国科学技术大学安徽省计算与通讯软件重点 实验室建立的一个大规模的视频诱发的集自发表情和人为表情的可见光和红外自发表情数据库。其中自发表情库由自发的表情序列和夸张帧组成,人为表情库仅由中性帧和夸张帧组成。该表情数据库包含年龄在17~31周岁的215名被试者的自发和人为的六种表情。 2)VAM数据库 VAM数据库[11] 采用的是以参加电视访谈节目(TVtalk show)的方式诱发的自发表情数据库,记录了节目中年龄在16~69周岁的6位男嘉宾和14位女嘉宾总共20位嘉宾的面部表情和语音信息。该数据集由834名评估者使用两种方式进行评估:a)采用Ekman的六种基本表情类别进行标注;b) 第33卷第1期2016年1月 计算机应用研究 ApplicationResearchofComputersVol.33No.1Jan.2016

浅析人工智能中的图像识别技术

浅析人工智能中的图像识别技术 本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意! 图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。文章简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。 1 图像识别技术的引入 图像识别是人工智能科技的一个重要领域。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的

目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。虽然人类的识别能力很强大,但是对于高速发展的社会,人类自身识别能力已经满足不了我们的需求,于是就产生了基于计算机的图像识别技术。这就像人类研究生物细胞,完全靠肉眼观察细胞是不现实的,这样自然就产生了显微镜等用于精确观测的仪器。通常一个领域有固有技术无法解决的需求时,就会产生相应的新技术。图像识别技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。 图像识别技术原理 其实,图像识别技术背后的原理并不是很难,只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的,它都是学者们从生活实践中得到启发而利用程序将其模拟实现的。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,只是机器缺少人类在感觉与视觉差上的影响罢了。人类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的,我们识别图像都是依靠图像所具有

三种简单手势识别

简单手势识别

一、背景 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加易‘引。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

二、手势识别概述 2.1、手势识别的概念 手势是姿势的一个子集,姿势这个概念没有精确的定义。一般认为,手势概念经过人的手转化为的手势动作,观察者看到的是手势动作的图像。手势的产生过程如图2-1所示。 图2-1 手势的产生过程 手势识别的过程则找一个从图像V到概念动作G的变换而,如图2-2所示。

2.2、手势识别流程 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加容易。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

图像处理技术的研究现状和发展趋势

图像处理技术的研究现状和发展趋势 庄振帅 数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理都发挥了巨大的作用。数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT 装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学过程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向

表情识别技术综述

表情识别技术综述 摘要:表情识别作为一种人机交互的方式,成为研究的热点。基于对表情识别的基本分析,文章重点介绍了面部表情识别的国内外研究情况和面部表情特征的提取方法。 关键词:表情识别;特征提取;表情分类。 前言:进入21世纪,随着计算机技术和人工智能技术及其相关学科的迅猛发展,整个社会的自动化程度不断提高,人们对类似于人和人交流方式的人机交互的需求日益强烈。计算机和机器人如果能够像人类那样具有理解和表达情感的能力,将从根本上改变人与计算机之间的关系,使计算机能够更好地为人类服务。表情识别是情感理解的基础,是计算机理解人们情感的前提,也是人们探索和理解智能的有效途径。如果实现计算机对人脸表情的理解与识别将从根本上改变人与计算机的关系,这将对未来人机交互领域产生重大的意义。 正文:一、面部表情识别的国内外研究情况 面部表情识别技术是近几十年来才逐渐发展起来的,由于面部表情的多样性和复杂性,并且涉及生理学及心理学,表情识别具有较大的难度,因此,与其它生物识别技术如指纹识别、虹膜识别、人脸识别等相比,发展相对较慢,应用还不广泛。但是表情识别对于人机交互却有重要的价值,因此国内外很多研究机构及学者致力于这方面的研究,并己经取得了一定的成果。 进入90年代,对面部表情识别的研究变得非常活跃,吸引了大量的研究人员和基金支持。美国、日本、英国、德国、荷兰、法国等经济发达国家和印度、新加坡都有专门的研究组进行这方面的研究。其中MIT的多媒体实验室的感知计算组、CMu、Ma州大学的计算机视觉实验室、Standford大学、日本城蹊大学、大阪大学、ArR研究所的贡献尤为突出。 国内的清华大学、哈尔滨工业大学、中科院、中国科技大学、南京理工大学、北方交通大学等都有专业人员从事人脸表情识别的研究,并取得了一定的成绩。在1999年的国家自然科学基金中的“和谐人机环境中情感计算理论研究”被列为了重点项目。同时中国科学院自动化所、心理所以及国内众多高校也在这方面取得了一定的进展。2003年,在北京举行了第一届中国情感计算与智能交互学术会议,会议期间集中展示了国内各研究机构近几年来从认知、心理、模式识别、系统集成等多种角度在情感计算领域取得的研究成果,一定程度上弥补了我国这方面的空白。国家“863”计划、“973”项目、国家自然科学基金等也都对人脸表情识别技术的研究提供了项目资助。 二、面部表情特征的提取方法 表情特征提取是表情识别系统中最重要的部分,有效的表情特征提取工作将使识别的性能大大提高,当前的研究工作也大部分是针对表情特征的提取。 目前为止的人脸面部表情特征提取方法大都是从人脸识别的特征提取方法别演变而来,所用到的识别特征主要有:灰度特征、运动特征和频率特征三种阎。灰度特征是从表情图像的灰度值上来处理,利用不同表情有不同灰度值来得到识别的依据。运动特征利用了不同表情情况下人脸的主要表情点的运动信息来进行识别。频域特征主要是利用了表情图像在不同的频率分解下的差别,速度快是其显著特点。在具体的表情识别方法上,分类方向主要有三个:整体识别法和局部识别法、形变提取法和运动提取法、几何特征法和容貌特征法。 整体识别法中,无论是从脸部的变形出发还是从脸部的运动出发,都是将表情人脸作为一个整体来分析,找出各种表情下的图像差别。其中典型的方法有:基于特征脸的主成分分析(prineipalComponentAnalysis,pCA)法、独立分量分析法(Indendent ComPonent Analysis,ICA)、Fisher线性判别法(Fisher’s Linear Discriminants,FLD)、局部特征分析(LoealFeatureAnalysis,LFA)、Fishe诞动法(Fisher^ctions)、隐马尔科夫模型法(HideMarkovModel,HMM)和聚类分析法。

图像识别技术发展状况及前景

医学图像配准技术 罗述谦综述 首都医科大学生物医学工程系(100054) 吕维雪审 浙江大学生物医学工程研究所(310027) 摘要医学图像配准是医学图像分析的基本课题,具有重要理论研究和临床应用价 值。本文较全面地介绍了医学图像配准的概念、分类、配准原理、主要的配准技术及评 估方法。 关键词医学图像配准多模 1 医学图像配准的概念 在做医学图像分析时,经常要将同一患者的几幅图像放在一起分析,从而得到该患者的多方面的综合信息,提高医学诊断和治疗的水平。对几幅不同的图像作定量分析,首先要解决这几幅图像的严格对齐问题,这就是我们所说的图像的配准。 医学图像配准是指对于一幅医学图像寻求一种(或一系列)空间变换,使它与另一幅医学图像上的对应点达到空间上的一致。这种一致是指人体上的同一解剖点在两张匹配图像上有相的空间位置。配准的结果应使两幅图像上所有的解剖点,或至少是所有具有诊断意义的点及手术感兴趣的点都达到匹配。 医学图像配准技术是90年代才发展起来的医学图像处理的一个重要分支。涉及“配准”的技术名词除registration外,mapping、matching、co-registration、integration、align-ment和fusion 等说法也经常使用。从多数文章的内容看,mapping偏重于空间映射;fu-sion指图像融合,即不仅包括配准,而且包括数据集成后的图像显示。虽然在成像过程之前也可以采取一些措施减小由身体移动等因素引起的空间位置误差,提高配准精度(称作数据获取前的配准preacquisition),但医学图像配准技术主要讨论的是数据获取后的(post-acquisition)配准,也称作回顾式配准(retrospective registration)。当前,国际上关于医学图像配准的研究集中在断层扫描图像( tomographic images,例如CT、MRI、SPECT、PET等)及时序图像(time seriesimages,例如fMRI及4D心动图像)的配准问题。 2 医学图像基本变换 对于在不同时间或/和不同条件下获取的两幅图像I1(x1,y1,z1)和I2(x2,y2,z2)配准,就是寻找一个映射关系P:(x1,y1,z1) (x2,y2,z2),使I1的每一个点在I2上都有唯一的点与之相对应。并且这两点应对应同一解剖位置。映射关系P表现为一组连续的空间变换。常用的空间几何变换有刚体变换(Rigid body transformation)、仿射变换(Affine transformation)、投影变换(Projec-tive transformation)和非线性变换(Nonlin-ear transformation)。 (1)刚体变换: 所谓刚体,是指物体内部任意两点间的距离保持不变。例如,可将人脑看作是一个刚体。 处理人脑图像,对不同方向成像的图像配准常使用刚体变换。刚体变换可以分解为旋转和平移:P(x)=Ax+b(1) x=(x,y,z)是像素的空间位置;A是3×3的旋转矩阵,b是3×1的平移向量。

基于摄像头的手势识别技术初步版本

基于摄像头的手势识别技术 1、手势识别的概念 手势是姿势的一个子集,姿势这个概念没有精确的定义。一般认为,手势概念经过人的于转化为的于势动作,观察者看到的是于势动作的图像雎1。手势的产生过程如图1-1所示。 图1-1 手势识别的过程则找一个从图像V到概念动作G的变换而,如图下所示。 2、手势识别流程 手势识别流程包手势图像获取、手势分割、手势特征提取、手势识别四大部分,如图2-1所示。 图2-1

3. 手势建模 在手势识别框架中,手势模型是一个最基本的部分。根据不同的应用背景,于势识别采用的模型会有不同,而对于不同的手势模型,采用的手势检测与跟踪算法、特征提取、识别技术也会有差别。手势建模主要分为基于表观的手势模型与基于三维的于势模型。 基于表观的手势建模是一种二维建模,从二维平面观察得到的平面图像信息描述于的特征。 基于表观的手势模型主要包括基于颜色的模型与基于轮廓的模型两种。 基于颜色的手势模型是把手势图像看作像素颜色的集合,通过提取手部的颜色的特征来描述手势。 基于颜色的手势模型的常用特征是颜色直方图。基于轮廓的手势模型是把手看作一个轮廓,通过提取手部图像中手的轮廓的几何特征来描述手势。 4. 手势检测与跟踪 手势检测与跟踪是手势识别处理流程中最前端的处理部分,它处理从摄像头获取到手势图像(序列),从中检测和分割手势对象。如果是动态手势识别,还要对手进行跟踪。 基于运动信息的方法: 基于运动信息的方法是假设在视频中只有手是运动物体。 其中一种方法是背景减法。 它要求背景静止不变,把视频中的每帧与背景相减,背景相同的部分变为零,不同的部分就认为是运动的物体,即手。

关于计算机视觉的手势识别综述

关于计算机视觉的手势识别综述 蒋指挥 (江苏科技大学江苏镇江 213022) 摘要:计算机技术的高速发展也产生了许多新领域,在此对以计算机视觉为基础的手势检测识别技术展开综述。主要阐述该技术的发展历程、实现方法、研究现状以及其存在的不足之处和发展方向。结果表明简单的可穿戴设备的手势识别和深度视觉传感器的手势识别和多方法交叉融合的手势识别是未来该领域的发展方向。 关键词:计算机视觉;手势识别;人机交互 A survey of gesture recognition in computer vision//Jiang Zhi Hui Abstract;With the rapid development of computer technology, a lot of new fields have been developed. In this paper, the technology of gesture detection and recognition based on computer vision is reviewed. This paper describes the development of the technology, the realization method, the research status and its shortcomings and development direction. The results show that the simple wearable device for hand gesture recognition and depth vision sensor for hand gesture recognition and multi method cross fusion for gesture recognition is the future direction of the development of the field. Key words:Computer vision; gesture recognition; human-computer interaction 计算机在我们的生活中越来越不可或缺,我们同时也对计算机提出了更高的要求,计算机视觉的手势识别正是对计算机应用拓展的重要途径,例如现在的VR技术,就是应用了手势识别才实现的。ABIResearch公司高级分析师约书亚·弗拉德(JoshuaFlood)指出:“免提操作或手势识别很快将成为高端旗舰智能手机、媒体平板电脑和智能眼镜区别于其他同类产品的一个关键因素。三星电子最新推出银河S4已经将这项技术用于其手机中,并以其全新的用户体验获得用户交口称赞。此外,在一系列新型智能眼镜产品即将发布之时,不难想象这类技术将被采用。”其实手势识别技术涵盖了许多领域,比如物理学、生物学等,实现手势识别的方式有很多种从一开始的二维手型识别、二维手势识别到后来的三维手势识别,正是计算机视觉技术的发展使得手势识别的实现方式更加多样。但目前的技术仍然很繁琐,冗杂的可穿戴设备就直接影响了使用者的舒适感,其还有很大的发展空间。 1、手势识别的发展历程及其实现方法

人脸表情识别综述

人脸表情识别综述 一、人脸表情识别技术目前主要的应用领域包括人机交互、安全、机器人制造、医疗、通信和汽车领域等 二、1971年,心理学家Ekman与Friesen的研究最早提出人类有六种主要情感,每种情感以唯一的表情来反映人的一种独特的心理活动。这六种情感被称为基本情感,由愤怒(anger)、高兴(happiness)、悲伤(sadness)、惊讶(surprise)、厌恶(disgust)和恐惧(fear)组成 人脸面部表情运动的描述方法---人脸运动编码系统FACS (Facial Action Coding System),根据面部肌肉的类型和运动特征定义了基本形变单元AU(Action Unit),人脸面部的各种表情最终能分解对应到各个AU上来,分析表情特征信息,就是分析面部AU的变化情况 FACS有两个主要弱点:1.运动单元是纯粹的局部化的空间模板;2.没有时间描述信息,只是一个启发式信息 三、人脸表情识别的过程和方法 1、表情库的建立:目前,研究中比较常用的表情库主要有:美国CMU机器人研究所和心理学系共同建立的 Cohn-Kanade AU-Coded Facial Expression Image Database(简称CKACFEID)人脸表情数据库;日本ATR 建立的日本女性表情数据库(JAFFE),它是研究亚洲人表情的重要测试库 2、表情识别: (1)图像获取:通过摄像头等图像捕捉工具获取静态图像或动态图像序列。 (2)图像预处理:图像的大小和灰度的归一化,头部姿态的矫正,图像分割等。 →目的:改善图像质量,消除噪声,统一图像灰度值及尺寸,为后序特征提取和分类识别打好基础 主要工作→人脸表情识别子区域的分割以及表情图像的归一化处理(尺度归一和灰度归一) (3)特征提取:将点阵转化成更高级别图像表述—如形状、运动、颜色、纹理、空间结构等,在尽可能保证稳定性和识别率的前提下,对庞大的图像数据进行降维处理。 →特征提取的主要方法有:提取几何特征、统计特征、频率域特征和运动特征等 1)采用几何特征进行特征提取主要是对人脸表情的显著特征,如眼睛、眉毛、嘴巴等的位置变化进行定位、测量,确定其大小、距离、形状及相互比例等特征,进行表情识别 优点:减少了输入数据量 缺点:丢失了一些重要的识别和分类信息,结果的精确性不高

相关文档
最新文档