基于手势识别的人机交互综述

基于手势识别的人机交互综述
基于手势识别的人机交互综述

基于手势识别的人机交互综述

摘要:近年来,得益于虚拟现实、人机界面技术、计算机视觉等领域的发展,基于手势识别的人机交互技术得到大力的推动。本文就基于手势识别的人机交互技术展开综述。首先概括手势交互的涉及领域,回顾其发展史和国内外研究现状。接着阐明它的基本界定和分类,并在此基础上分析其热点关键技术。然后实例讨论了几种类型手势交互的典型应用。最后给出了结论。

关键词:虚拟现实;手势交互;计算机视觉;手势识别;特征跟踪

1.引言

人机交互技术通过输入、输出设备,以有效的方式实现交互主体与交互客体的对话。当前的人机交互技术已经从过去交互主体适应交互客体,发展为交互客体不断地适应交互主体的习惯和以交互主体为中心的新阶段[1,2,3,4]。以用户为中心的,新型、自然的人机交互技术逐渐成为开发者和科研工作者的关注重点。这类交互方式要求输入与输出能够最大限度地符合交互主体的行为习惯,并能够在交互主体的脑中顺利构建交互环路。由于手势具有极强的信息表述功能,加之人手操作行为本身就是人与世界相互作用的主要方式,因此,基于手识别的人机交互技术相关研究有着重要的理论价值和应用价值。基于手势识别的人机交互技术涉及计算机科学、认知心理学、行为学等诸多方面的知识。本文不能面面俱到,仅就手势交互的基本问题:手势语义的分类,以及当前发展概况、研究热点技术和典型系统应用等相关问题进行综述。

2.研究现状

目前,基于视觉的手势交互已被广泛的研究,由于手势本身的多义性及时空差异性,加之手形变的高维度及视觉问题本身的不适定性,基于视觉的手势识别一直是一项极富挑战性的究课题[5]。需要解决的核心问题是对手形的识别,对手势的跟踪等。传统的方法主要分为两大类:(1)基于模型(model-base)的方法;(2)基于表征(appearance-based)的方法[6]。这些方法及其衍生算法极大程度地依赖于计算机科学中虚拟现实、机器视觉、模式识别、人机交互等多个领域的交流与合作。相关的国际会议:CHI、ICCV、CVPR、ICAT、IEEE VR 为研究者提供了一个能充分交流的空间,并吸引了越来越多的研究人员共同参与合作。此外,学科之间的交流也吸引了心理学研究人员的共同参与。他们以从用户为中心出发,为基于手势交互研究和开发提出了宝贵意见[7]。纵观手势交互的发展历程,其研究重点也从早期简单的系统框架、低层特征提取[8]、手形模板匹配[8]等问题转变到关节式物体跟踪[9,10, 11]、跟踪性能评价[12]、操作型手势解析[14]等问题上。我国在基于手势识别的人机交互领域的研究近年来得到了长足的发展。研究机构集中在国内的研究所和高校的科研单位。目前国内手势交互的研究成果主要有:中国科学院软件研究所[15]的研究中,对二阶自回归过程动力学模型(Auto-Regressive Process, ARP)进行训练和学习,进而建立基于ARP 的预测模型,实现了人手运动的鲁棒性跟踪,在出现跟踪丢失的情况下在后续序列中可以自动恢复正确跟踪。中国科学院自动化研究所模式识别实验室提出一种基于区域的多连接体(手指)的三维运动跟踪算法[13],用多约束融合的方法以及手指的运动特性,建立多刚体的三维运动描述,通过三类基本约束条件,把跟踪问题归结为一个约束误差优化问题。清华大学的崔锦实博士,提出一种基于回归-优化方法的关节式物体的姿态估计方法[16]。该方法把回归分析与全局优化搜索相结合,保证了估计的精度和连续性;针对现有滤波器在高维非线性多峰

跟踪问题上的困难,将粒子滤波器与全局搜索算法的演化粒子滤波器方法相结合,提高了高维跟踪的精确度。其他高校与科研单位也做出了不少优秀的工作与关键的贡献。

3. 关键技术

首先区分手势识别中的两个重要概念:手形(hand posture)与手势(hand gesture)[17]。手形,是以手的一个特定姿势表示一个语义。而狭义的手势,则是以手在时间轴上的连续位置构成的轨迹代表一个语义。简单来说,我们可以理解手势为一段时间轴上连续的手形。有的研究者也使用广义的手势涵盖这两个概念,即静态手势和动态手势,在这种理解下,手形也是一种特殊的手势。对静态的手形进行识别,与对连续的手势进行跟踪,是手势识别中的关键问题。

3.1 手势交互的分类

对手势的交互语义进行分类和界定,是手势交互的重要问题,是深入手势交互研究的基础工作,界定工作涉及人机界面、行为学、认知心理学等多个领域。对于手势交互语义的分类,Pavlocvic.等人发表在1997 年PAMI 的文献[18]有着指导意义。他们从行为学角度出发,将手的动作分为两类:无意识动作与手势;进而从认知心理学的角度,对实际生活中包含交互语义的手势再进行细分。首先,将手势分为通信型手势与操作型手势。通信型手势如手语,是一种天生的交互工具,具有强大的信息表述功能,借用到人机交互领域的此类手势交互正被广泛地研究。而操作型手势,如在真实环境中对物体的操作,则作为人的一种自然行为,并不专为人机交互的应用而生,然而随着以用户为中心的人机交互研究的进一步深入,这类更贴近自然行为的交互方式具有深远的理论与应用价值,在虚拟现实和增强现实中具有极高的应用潜力。接着,通信型手势又被分为符号与动作。符号表示事先约定的语义,进一步被分类为指代型符号和模式型符号,指代型符号如“V 手形”字表示胜利,“W 手形”表示OK 等,通常是一种静态手势;模式型符号,如耸肩,摊手,挥手等,常用来表示某种情绪。动作则通过连续的手形表达语义,包括模仿型动作和指示型动作,模仿型动作如手握方向盘驾驶的交互操作;指示型动作如手指指示方向等交互操作等。具体分类方法见图1。纵观整个问题领域,我们发现针对通信型手势的研究,发展地比较成熟。其原因在于,一方面通信型手势天然的信息表达与交互优势,另一方面也在于这类方法实现起来的相对简单。而操作型手势作为更加自然的手势交互模式,由于涉及到的识别问题与跟踪问题更加复杂,所以发展相对滞后。目前尚处于亟待开发的状态。

3.2 手形的识别

对手形的识别,基于表征的方法分为两个层次:(1)图像特征的提取,(2)语义特征

的提取。基于模型的方法则通过搜索匹配模型,获得手形的语义。

3.2.1 基于表征的方法

基于表征的方法直接从观察到的图像推算出手势,需要计算的参数包括图像的几何信息、手掌和手指的位置信息、轮廓边界信息等。目前来看,较之基于模型的方法,此类方法缺乏通用性,但优点在于速度快,能够满足实时应用的需求,具有较强的实用性。这类问题主要涉及图像处理的系列操作,属于对手势低层次特征的提取。在低层次特征被提取之后,可以由此分析得到包含手形语义的高层次信息,从而实现手形识别。与手势识别相关的图像处理算法中,实时目标分割算法主要有肤色检测和背景减法(BGS)。肤色检测算法优点是速度快,在运动摄像机的情况下也可以分割出人手前景,缺点是易受环境影响,应用领域单一。操作型手势交互并不排除手持简单物体(小棒,笔等)对虚拟目标进行交互,在此情况下

肤色检测方法失效。BGS 算法不存在对目标颜色的限制,但计算量相对于肤色检测明显增大,并且尚未研究出运动视点下实时分割的优质结果。手形的自然变化具有高维度的特征,加之手指间存在无法预测的遮挡,使得手特征提取以及基于特征提取的手细节结构的实时重建非常困难。[19,20]将动态的手细节忽略,将之视为一个整体进行交互。然而,在精细的交互应用中必须区分手的细节。这就对基于手势识别的人机交互提出两个挑战:(1)如何有效提取细节特征;(2)如何有效获得交互信息。提取细节特征时,传统研究认为,指尖点[21]、边界[22]和轮廓[23]是几种有效的基本信息。基于表征的特征提取后,获取高层语义的方法可分为两类:(1)直接重建三维人手结构[21];(2)匹配手形模板[24]。第一类方法常结合多视几何的技术实现;而第二类方法则常用独立主元分析(PCA)的方法实现。

3.2.2 基于模型的方法

基于模型的方法需要比较三维模型与当前图像来获得手的状态,然后对手和手臂的运动和姿势建模,最后通过它们模型的参数如关节角度、手掌位置等来推算手形。这种方法计算输入手形与模板手形的距离,寻找最优的匹配结果[8]。虽然精确度高、效果好,但由于手的形态变化维度极高,所以这是一个高维搜索的问题,目前来看计算代价过大,尚不能达到实时要求[25,26,27],应用范围受到一定局限。因此,各种手戴标记被广泛应用。[14]使用打印了特定图案的棉质手套的实时投影图案,重建三维人手模型,取得了实时的结果,可用来进行操作型手势交互的应用。

3.3 手势的跟踪

3.3.1 基于表征的特征跟踪

实时鲁棒的跟踪到无标记的人手自然位置,可以用来协助手势识别并通过手的运动轨迹获得模仿型动作,从而实现使用模仿动作的通信型手势交互。对图像特征的跟踪是机器视觉领域的传统问题,已发展的相对成熟。然而随着手势交互领域相关应用的发展,对特征跟踪又提出了新的需求。由于刚体的跟踪已经有了比较稳定的算法[28,29],而手是一个高度灵活的非刚体物体,所以一般的特征匹配与跟踪算法无法达到较高的成功率。[30]总结了人机交互系统中,手势跟踪算法应满足的三个要求:(1)实时性好,避免高维度特征矢量的计算和复杂的搜索过程。(2)足够的鲁棒性,不受跟踪对象旋转、平移和比例改变以及摄像头视角改变的影响。(3)跟踪的连续性和自动初始化,能够在跟踪失败后自动恢复跟踪,尽量减少人为干预。鉴于手自身的高度灵活性,跟踪背景的复杂性,以及相机运动的不确定性,如果直接使用基于普通的肤色查找表的算法,背景减法,或自适应背景模型[31]等算法,不能满足应用的鲁棒性需求。[32]提出了多线索特征流的概念,通过跟踪一系列特征点来对人手自然的整体进行定位。但是[32]使用头戴,假设手与摄像设备距离相对固定,并且假设背景中没有较大肤色物体,而这对于一般面向用户的交互应用并不具有适用性。[20]基于多线索特征流的思想,结合速度模型与贝叶斯肤色模型,采用基于速度权值的特征点流与肤色模型多模式的方法。对于手的跟踪,可以满足上述的三个要求。

3.3.2 关节式物体跟踪

作为蒙特卡罗( Monte Carlo)方法的一种实现形式,粒子滤波方法已经成为处理非高斯、非线性问题的有力工具而在关节式物体的跟踪领域得到了广泛的关注。但是,粒子滤波方法需要大量样本来表示后验分布,对于以高维为特征的关节式物体来说,即使采用10 维变量,每个变量取20 个离散值,也至少需要320,000,000 个样本才能较好地表示后验分布的典型集[33],这使得实时性跟踪变得遥不可及。因此,很多研究者对如何降低状态空间的维数行

了比较广泛的研究,除了利用人手的动态约束条件和静态约束条件所决定的变量之间的关联性和变量的变化范围,从而在一定程度上降低状态维数之外,人们采用了多种方法研究高维状态的处理方法。第一种方法是将状态空间分割为若干子空间[35];第二种方法是通过机器学习[36]的方法来获取高维特征集与手势之间的关系,是解决高维特征空间搜索问题的一个有效途径;第三种方法是采用分析-合成(Analysis-by-Synthesis)[37]技术处理高维问题。在文献[38]中,为了识别多物体(每个物体代表一个不同的手势)把一组瀑布模型分类器组织成树状结构。对于给定的参数化三维模型,以便宜的时间代价取得样本图像的训练数据。针对在复杂背景下图像特征容易发生误配的问题,Akihiro Imai 等人把误配概率引入到跟踪算法中[39]。Tangli Liu 等人[40]结合图像模型、人手模型、CAMSHIFT 算法以及NBP 算法,再利用两个校正相机获取三维深度线索,实现人手的鲁棒性跟踪。在文献[41]中,融合尺度估计和目标模型的更新,提出一种基于核的跟踪方法。首先用固定尺度的基于核的方法估计物体中心位置,然后对尺度进行优化,再用基于核密度估计策略刷新目标模型。Raskin, L 等人通过结合基于高斯动态模型和退火粒子滤波器[42],达到降低状态向量维数的目的。该方法可以改善跟踪器的性能,增加其稳定性,且易于在丢帧情况下进行恢复。Sunita Nayak 等人从手势方向、颜色等低层特征的统计分布出发,建立运动帧变化的分布函数[43],从而将高维问题转换为低维空间进行处理。文献[44,45]结合对操作者的认知行为模式的研究,提出微观状态变量的概念(MSV)并以此减少随机采样的粒子数,从而大大提高跟踪效率和精确度。

3.4 操作型手势交互

为实现手势的自然交互,操作型手势交互的研究格外值得重视。自然人手的操作型手势交互需要达到以下两方面要求:(1)人手不必装备任何附加装置或标记;(2)交互行为符合人手的交互行为习惯,即操作型手势的交互语义集合是自然人手操作物体时的交互语义集合的子集。手势的识别与跟踪问题在面对操作型手势交互需求时更加困难,原因在于自然人手进行操作物体的交互语义集合更加庞大和复杂。

4.典型应用

基于手势识别的典型交互应用通常特定支持某一类型的交互语义。因此按照交互语义的类型分类可分为(1)通信型手势应用;(2)操作型手势应用。

4.1 通信型手势交互应用

通信型手势的交互采用通信型手势作为交互工具,在这类系统应用中,特定的手势作为信号传送给计算机,从而驱动交互。这里又可以细分为(1)动作型交互系统;(2)符号型交互系统。

4.1.1 动作型手势交互应用

动作型交互使用连续的手形动作表达交互语义,包括模仿型动作和指示型动作。这种交互典型的应用领域是虚拟现实的虚拟漫游交互。如利用双手驾驶飞机或汽车,控制方向从而漫游虚拟现实环。此时采用的是模仿型动作的交互方式。

4.1.2 符号型手势交互应用

符号型交互采用手势符号表达交互语义,包括指代型符号和模式型符号。这类手势交互典型应用是文字或图像软件编辑型交互。如Gesture-Based Editing 系统[34]将手势分为两类,一类是图元手势,如圆、三角形、矩形、水平线等和编辑命令,如移动、拷贝、取消、关闭

等。另一类是数字和字母。

4.2 操作型手势交互应用

操作型手势的应用采用操作型手势作为交互工具,在这类系统里,人手操作物体的自然行为成为系统的交互方式。然而由于实时交互对速度的要求很高,使得基于模型的手势别技术很难达到实时的要求,因而研究者做出了折中,借助辅助标记的帮助,快速地识别三维手势。如文献[14]的系统中,使用打印了特定图案的棉质手套作为标记实现操作型手势交互。5.结束语

本文就基于手势识别的人机交互技术展开综述。首先概括了手势交互的涉及领域,回顾了它的发展史和国内外研究现状。接着阐明了手势交互的分类,并在此基础上分析了它的热点关键技术。最后实例讨论了典型的应用。虽然基于手势识别的人机交互研究已经取得令人振奋的成果,但它仍旧是一门新兴的研究领域,许多基本技术还有待完善和改进。以下几个方面将是今后研究的热点和难点问题,值得研究者的关注:(1)手状态向量降维理论(2)处理手自遮挡问题(3)状态预测方法(4)操作型手势交互应用(5)动态视点下的人手鲁棒分割问题(6)人手运动特征的认知心理学分析等几个方面。

参考文献

[1] Rekimoto, J. SmartSkin: An Infrastructure for Freehand Manipulation on Interactive Surfaces. In Proceedings

of ACM CHI Conference. pp. 113-120, 2002

[2] Ringel, M., Berg, H., Jin, Y., and Winograd, T.. Barehands: Implement-Free Interaction with a Wall-Mounted

Display. In Proceedings of ACM CHI Conference Extended Abstracts. pp. 367-368, 2001

[3] Segen, J., & Kumar, S. GestureVR: Vision-based 3D Hand Interface for Spatial Interaction. In Proceedings of

the Sixth ACM International Conference on Multimedia. pp. 455-464, 1998

[4] 石教英虚拟现实基础及实用算法.科学出版社, 2002

[5] 任海兵, 祝远新,徐光佑.基于视觉手势识别的研究-综述,电子学报. 28(2):118-122, 2000

[6] 王亮, 胡卫明, 谭铁牛. 人运动的视觉分析综述.计算机学报,25(3):225-237, 2002

[7] Edward, S.J. and Gabbard, J.L. Survey of User-based Experimentation in Augmented Reality. In Proc. of 1st

International Conference on Virtual Reality (ICVR'05), 2005

[8] Joseph J. and LaViola Jr.: A Survey of Hand Posture and Gesture Recognition Techniques and Technology.

Department of Comuter Science. Brown Universty: CS: 99-111, 1995

[9] Akihiro Imai, Nobutaka Shimada, Yoshiaki Shirai. Hand Posture Estimation in Complex Backgrounds by

Considering Mis-match of Model. Lecture Notes in Computer Science, Springer Berlin / Heidelberg, 4843:

596-607, 2007

[10] Tangli Liu, Wei Wu, Xinxiao Chen. Tracking Articulated Hand Underlying Graphical Model with

Depth Cue. Image and Signal Processing, 2008. CISP '08. Congress on. Sanya, China, 4: 249-253, 2008

[11] 冯志全,杨波,陈月辉,李毅,郑艳伟. 一种人手粒子滤波跟踪器的设计[J]. 软件学报, Supplement,

19: 87-95, 2008

[12] 冯志全, 杨波, 李毅, 王中华, 郑艳伟. 以改善精度为目标的人手跟踪方法研究. 计算机研究与发展.

45(7):1239-1248, 2008.

[13] 潘春洪,马颂德. 基于区域的手指三维运动跟踪[J]. 中国图像图形学报. 8(10): 1205-1210, 2003

[14] Y. Robert, Wang, Jovan Popovic, Real-Time Hand-Tracking with A Color Glove, (SIGGRAPH’09):63-71,

2009

[15] 陈坚,王文成,吴恩华.单目视频中无标记的人体运动跟踪[J]. 计算机辅助设计与图形学学报. 17(9):

2033-2039, 2005

[16] 崔锦实. 基于三维模型的关节式物体姿态估计与跟踪方法研究[D]. 博士论文, 北京: 清华大学, 2004

[17] Clerk J. Maxwell, “Gesture Recognition:A Survey,”3rd ed., vol. 2. Oxford: Clarendon, 68-73, 1892

[18] Pavlocvic, I. Shama, R. and Huang, T. S.: Visual Interpretation of Hand Gesture for Human-Computer

Interaction: A Review. IEEE Trans on PAMI, 19(7), 1997

[19] Kolsch M., Turk M., Fast 2D Hand Tracking with Flocks of Features and Multi-Cue Integration, Computer

Vision and Pattern Recognition Workshop, 158-168, 2004

[20] Zhigeng Pan,Yang Li,Mingmin Zhang, Chao Sun, Kangde Guo, Xing Tang.A Real-time Multi-cue Hand

Tracking Algorithm Based on Computer Vision.In:.IEEE VR 2010.Waltham,USA:IEEE Computer Society.219-223, 2010

[21] 郭康德张明敏孙超李扬汤兴, 基于视觉技术的三维指尖跟踪算法, 计算机研究与发展, 12, 2009

[22] Segen. J. Controlling Computers with Gloveless Gesture. Proc. of Virtual Reality Systems Conf. pp:2-6,

1993

[23 ] Brock U., Real-time 3-D Interaction with up to 16 Degrees of Freedom from Monocular Image Flows, Proc.

of IWAFGR’95. pp:172-178, 1995

[24] Martin J. and Crowley J., An appearance-based Approach to Gesture Recognition. Proc. of 9 th Int. Conf. on

Image Analysis and Processing. pp: 340-347, 1997

[25] Stenger B., Thayananthan A., P. Torr, and R. Cipolla.Model-based hand tracking using a hierarchical

bayesian filter[J]. IEEE transactions on pattern analysis and machine intelligence, 28(9):1372–1384, 2006

[26] Sudderth, E. and Mandel, M. and Freeman, W. and Willsky, A. Distributed occlusion

reasoning for tracking

with nonparametric belief propagation[J], Advances in Neural Information Processing Systems,17: 1369–1376, 2004

[27] Dewaele, G. and Devernay, F. and Horaud, R. and Forbes, F. The alignment between 3-d data and articulated

shapes with bending Surfaces[C].//Proceedings of the 9th European Conference on Computer Vision,

Graz578–591, 2006

[28] Robert T. Collins, Mean-shift Blob Tracking through Scale Space[C].//IEEE Computer Society Conference

on Computer Vision and Pattern Recognition (CVPR '03), Madison, 234-240, 2003

[29] Isard M, Blake A. A mixed-state CONDENSATION tracker with automatic model-switching[C].//

Proceedings of the Sixth International Conference on Computer Vision, Bombay ,107–112, 1998 [30] 王西颖, 张习文, 戴国忠. 一种面向实时交互的变形手势跟踪方法.软件学报, 18(10):2423-2433, 2007

[31] Erol A , Bebis G. , Nicolescu M,Boyle, R.D. ,Twombly, X. Vision-based hand pose estimation:

A review[J],

Computer Vision and Image Understanding, 108(1-2):52-73, 2007

[32] Kolsch M., Turk M., Fast 2D Hand Tracking with Flocks of Features and Multi-Cue Integration, Computer

Vision and Pattern Recognition Workshop, 158-168, 2004

[33] 陈睿,刘国翌,赵国英,张俊,李华. 基于序列蒙特卡罗方法的3D 人体运动跟踪[J].计算机辅助设计与图

形学学报. 17(1):85-92, 2005

[34] Ho-sub Y; Byung. Min,. Jung S., Young, B., Hyun, S.Y. Human Computer Interface for Gesture-Based

Editing System. Proc. of Image Analysis and Processing. :969-974, 1999

[35] MacCormick J, Isard M. Partitioned Sampling, Aarticulated Objects, and Interface-Quality Hand Tracking.

In Proc. ECCV, Dublin, 2: 13-19, 2000

[36] JP Wachs, H. Stem, Y. Edan, Real-Time Hand Gesture Telerobotic System Using the Fuzzy C-Means

Clustering Algorithm[C].World Automation Congress(WAC), Orlando, Florida, USA .403-410, 2002

[37] Rómer Rosales.The Specialized Mappings Architecture with Applications to Vision-Based Estimation of

Articulated Body Pose[D]. Ph.D. Thesis.Boston University Graduate School of Arts and And Sciences,2002

[38] B. Stenger, A. Thayananthan, P.H.S. Torr, R. Cipolla. Estimating 3D hand pose using hierarchical multi-label

classification. Image and Vision Computing, 25(2):1885-1894, 2007

[39] Akihiro Imai, Nobutaka Shimada, Yoshiaki Shirai. Hand Posture Estimation in Complex Backgrounds by

Considering Mis-match of Model. Lecture Notes in Computer Science, Springer Berlin / Heidelberg, 4843:

596-607, 2007

[40] Tangli Liu, Wei Wu, Xinxiao Chen. Tracking Articulated Hand Underlying Graphical Model with

Depth Cue. Image and Signal Processing, 08. Congress on. Sanya, China, 4: 249-253, 2008 [41] Anbang Yao, Guijin Wang, Xinggang Lin, Hao Wang. Kernel based articulated object tracking with scale

adaptation and model update. Acoustics, Speech and Signal Processing, 08. IEEE International Conference

on. Las Vegas, NV,:945-948, 2008

[42] Raskin, L. Rivlin, E. Rudzsky, M. Dimensionality Reduction for Articulated Body Tracking. 3DTV

Conference 07, Kos Island, 1-4, 2007

[43] Sunita Nayak, Sudeep Sarkar, Barbara Loeding. Distribution-Based Dimensionality Reduction Applied to

Articulated Motion Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, (99):1 –

6, 2008

[44] Zhiquan Feng, Minming Zhang, Zhigen Pan, Bo Yang, Tao Xu, Haokui Tang, Yi Li. 3D-Freehand-Pose

Initialization Based on Operator’s Cognitive Behavior Models. The Visual Computer. (26): 6-8, 607-617,

2010

[45] Zhiquan Feng, Bo Yang, Yuehui Chen , Yanwei Zheng , Yi Li , and Zhonghua Wang. Research on Sampling

Methods in Particle Filtering Based upon Microstructure of State Variable. Lecture Notes in Computer

Science, (5226): 251-257, 2008

手势识别技术综述

手势识别技术综述 作者单位:河北工业大学计算机科学与软件学院 内容摘要: 手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。

但是这其中手势占大多数。本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。 Abstract: Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future. 1.定义 说到手势识别,首先要对手势识别中的手势有一个清晰的认知。手势在不同的学科中有不同含义,而在交互设计方面,手势与依赖鼠标、键盘等进行操控的区别是显而易见的,那就是手势是人们更乐意接受的、舒适而受交互设备限制小的方式,而且手势可供挖掘的信息远比依赖键盘鼠标的交互模式多。在学术界,人们试图对手势定义一个抽象、明确而简洁的概念以为手势及其应用的研究提供依据。1990年Eric Hulteen和Gord Kurtenbach曾发表的题为“Gestures in Human-Computer Communication”中定义:“手势为身体运动的一部分,它包括一部分信息,而且是一种能被观察到的有意义的运动。挥手道别是一种手势,而敲击键盘不是一种手势,因为手指的运动没有被观察,也不重要,它只表示键盘

基于手势识别的智能电视交互专利技术综述

基于手势识别的智能电视交互专利技术综述 智能电视具有操作系统,支持第三方应用资源实现功能扩展,支持多网络接入功能,具备人机交互、与其他智能设备进行交互等。随着计算机视觉的发展和人机交互的需要,手势识别研究取得了蓬勃的发展,通过手势识别对智能电视进行控制和操作,能够更轻松、高效地使用电视设备。文章利用专利数据库对智能电视手势识别技术进行了数据统计和分析,对该领域的专利申请趋势等情况做了归纳总结。 标签:智能电视;手势识别;发展状况;专利 Abstract:Intelligent TV has the operating system,which supports the third party application resources to realize the function expansion,supports the multi-network access function,has the man-machine interaction,and carries on the interaction with other intelligent devices. With the development of computer vision and the need of human-computer interaction,the research of gesture recognition has made great progress. By controlling and operating intelligent TV through gesture recognition,one can more easily and more efficiently use TV equipment. This paper makes use of patent database to analyze the data of intelligent TV gesture recognition technology,and summarizes the trend of patent application in this field. Keywords:intelligent TV;gesture recognition;development status;patent 引言 电视是家庭娱乐休闲必不可少的家用电器。如今,电视依然是最为普及的信息传播载体,用户在观看普通节目的同时,还可以上网、娱乐等。从用户的角度出发,通过自然简单、人性化的方式完成交互,无疑是用户完成电视操作的最佳方式。而手势具有直观、自然、丰富的特点,是一种符合人们日常习惯的交互手段,是表達信息和特定意图的良好载体,由于手势具有上述特性,因此在对智能电视进行操控中得到了良好的运用,实现了对智能电视自然灵活地操作。 1 基于手势识别的智能电视控制技术发展状态分析 1.1 技术分解 本文通过检索获得的专利申请进行统计分析,对基于手势识别的智能电视控制所涉及的具体技术和应用领域进行分解。 根据手势采集设备可以将手势识别系统大致分为基于数据手套和基于视觉的两种手势识别系统。其中,数据手套通过多个传感器反馈各关节的数据,并通过位置跟踪器返回人手所在的三维坐标,从而获取手势在三维空间中的位置信息和手指的运动信息。通过数据手套可以直接获取人手在三维空间中的位置和运动

三种简单手势识别

简单手势识别

一、背景 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加易‘引。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

二、手势识别概述 2.1、手势识别的概念 手势是姿势的一个子集,姿势这个概念没有精确的定义。一般认为,手势概念经过人的手转化为的手势动作,观察者看到的是手势动作的图像。手势的产生过程如图2-1所示。 图2-1 手势的产生过程 手势识别的过程则找一个从图像V到概念动作G的变换而,如图2-2所示。

2.2、手势识别流程 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加容易。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

关于计算机视觉的手势识别综述

关于计算机视觉的手势识别综述 蒋指挥 (江苏科技大学江苏镇江 213022) 摘要:计算机技术的高速发展也产生了许多新领域,在此对以计算机视觉为基础的手势检测识别技术展开综述。主要阐述该技术的发展历程、实现方法、研究现状以及其存在的不足之处和发展方向。结果表明简单的可穿戴设备的手势识别和深度视觉传感器的手势识别和多方法交叉融合的手势识别是未来该领域的发展方向。 关键词:计算机视觉;手势识别;人机交互 A survey of gesture recognition in computer vision//Jiang Zhi Hui Abstract;With the rapid development of computer technology, a lot of new fields have been developed. In this paper, the technology of gesture detection and recognition based on computer vision is reviewed. This paper describes the development of the technology, the realization method, the research status and its shortcomings and development direction. The results show that the simple wearable device for hand gesture recognition and depth vision sensor for hand gesture recognition and multi method cross fusion for gesture recognition is the future direction of the development of the field. Key words:Computer vision; gesture recognition; human-computer interaction 计算机在我们的生活中越来越不可或缺,我们同时也对计算机提出了更高的要求,计算机视觉的手势识别正是对计算机应用拓展的重要途径,例如现在的VR技术,就是应用了手势识别才实现的。ABIResearch公司高级分析师约书亚·弗拉德(JoshuaFlood)指出:“免提操作或手势识别很快将成为高端旗舰智能手机、媒体平板电脑和智能眼镜区别于其他同类产品的一个关键因素。三星电子最新推出银河S4已经将这项技术用于其手机中,并以其全新的用户体验获得用户交口称赞。此外,在一系列新型智能眼镜产品即将发布之时,不难想象这类技术将被采用。”其实手势识别技术涵盖了许多领域,比如物理学、生物学等,实现手势识别的方式有很多种从一开始的二维手型识别、二维手势识别到后来的三维手势识别,正是计算机视觉技术的发展使得手势识别的实现方式更加多样。但目前的技术仍然很繁琐,冗杂的可穿戴设备就直接影响了使用者的舒适感,其还有很大的发展空间。 1、手势识别的发展历程及其实现方法

基于3D 体感技术的动态手势识别

第27卷第4期2012年8月 光电技术应用 ELECTRO-OPTIC TECHNOLOGY APPLICATION Vol.27,No.4August ,2012 随着机器智能领域的迅猛发展,手作为人身体上最灵活的一个部位及人机交互的一个媒介,得到越来越多的应用。因此基于手势识别的各种应用也是层出不穷。手势是一种自然而直观的人际交流模式。手势识别也理所当然地成为了实现新一代人机交互不可缺少的一项关键技术。然而,由于手势本身具有的多样性(包括肤色、形态的差异性)、多义性(不同手势具有不同的意义)、以及时间和空间上的差异性(会受到光照等因素的影响)等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性并具有很大应用空间的研究方向[1] 。 1手势识别技术的发展 手势识别分为两种,一种是静态的手势识别,即在 摄像头下检测到某个手势时就给出命令。另一种是动态手势识别,即能够识别手做的一些动作。随着3D 体感技术的出现,手势识别进入一个全新的领域。1.1静态手势识别 静态手势识别的常用方法主要有:基于模版匹配的,用边缘特征像素点作为识别特征,并利用Hausdorff 距离模板匹配完成静态手势识别[2];基于SVM 支持向量机,通过皮肤颜色模型进行手势分割, 并用傅里叶描述子描述轮廓,采用针对小样本特别有效且范化误差有界的最小二乘支持向量机(LS -SVM )作为分类器进行手势识别[3]以及集合模版匹配和机器学习理论的手势识别方法[4]等。但由于静态手势识别技术应用的局限性较大,不够灵活,使用人数在减少。 收稿日期:2012-06-24 作者简介:淦创(1990-),男,辽宁锦州人,大学本科,研究方向为计算机图像处理. ·信号与信息处理· 基于3D 体感技术的动态手势识别 淦 创 (北京航空航天大学,北京100191) 摘要:提出了一种基于3D 体感机Kinect 的图像处理手势识别算法,通过深度图像和骨骼图像的方法实现动态手势识别。首先在Kinect 提供的骨骼图像中20个骨点中,选取2个离手部最近的骨骼点,通过追踪这两个骨骼点的位置来实现对手部的追踪,再通过判断手部的深度(即其相对于摄像头的距离)的变化来实现动态手势识别。 关键词:深度图像;骨骼图像;手部追踪;动态手势识别中图分类号:TN94 文献标识码:A 文章编号:1673-1255(2012)04-0055-04 Dynamic Gesture Recognition Based on 3D Kinect GAN Chuang (Beijing University of aeronautics and astronautics,Beijing 100191,China ) Abstract :A kind of gesture recognition algorithm of image processing based on 3D Kinect is proposed.The dynamic gesture recognition algorithm is performed by skeleton images and depth images.At first,two skeleton points which are nearest to hands are choosen from 20skeleton points in a skeleton image.The process of tracking hands is performed by tracking the positions of the two skeleton points.Then the dynamic gesture recognition pro?cess is realized by the change of depths of hands (the distance between a hand and a camera). Key words :depth image;skeleton image;hands tracking;dynamic gesture recognition

手势识别---人工神经网络

手势识别---人工神经网络 一.手势识别综述 随着计算机性能的逐步提高和各领域对计算机使用的不断深入,人与计算机的交互活动越来越成为人们日常生活中的一个重要组成部分。鼠标和键盘等传统的的人机交互方式越来越显示出它们的局限性,尤其在虚拟现实、增强现实和可穿戴计算等新兴的应用中变得更为明显。近年来,手势交互作为一种新的人机交互方式被越来越多地采用,特别是基于视觉的手势交互,由于其简单、自然、直观和非侵犯性等特性已成为手势交互的重要方式之一。 手势是一种自然、直观、易于学习的人机交互手段。以人手直接作为计算机的输入设备,人机间的通讯将不再需要中间的媒体,用户可以简单地定义一种适当的手势来对周围的机器进行控制。手势研究分为手势合成和手势识别,前者属于计算机图形学的问题,后者属于模式识别的问题。手势识别技术分为基于数据手套和基于计算机视觉两大类。 1.1 手势识别的发展 最初的研究主要集中在做一种专用硬件设备来进行输入。例如数据手套,即人可以戴上一个类似于手套的传感器,计算机通过它可以获:取手的位置、手指的伸展状况等丰富信息。如l993年B.Thamas等人做的自由手遥控目标的系统是凭借数据手套作为输入的媒介,但这需要实验者呆上一个专用设备。之后人们又致力于标记手势的研究,即通过在手上作标记,例如在手腕和手指处贴上或画上特殊颜色的圆点,用来识别手势。这虽然给识别带来了方便,但同样给实验者带来麻烦。最后人们终于把注意力集中到自然手上,通过专用加速硬件和脱机训练,一些研究者成功地研制了手势系统,但其识别的手势仅限几种。例如Freeman 和Roth等人提出的基于方向直方图的手势识别系统。l994年,作

基于手势识别的人机交互综述

基于手势识别的人机交互综述 摘要:近年来,得益于虚拟现实、人机界面技术、计算机视觉等领域的发展,基于手势识别的人机交互技术得到大力的推动。本文就基于手势识别的人机交互技术展开综述。首先概括手势交互的涉及领域,回顾其发展史和国内外研究现状。接着阐明它的基本界定和分类,并在此基础上分析其热点关键技术。然后实例讨论了几种类型手势交互的典型应用。最后给出了结论。 关键词:虚拟现实;手势交互;计算机视觉;手势识别;特征跟踪 1.引言 人机交互技术通过输入、输出设备,以有效的方式实现交互主体与交互客体的对话。当前的人机交互技术已经从过去交互主体适应交互客体,发展为交互客体不断地适应交互主体的习惯和以交互主体为中心的新阶段[1,2,3,4]。以用户为中心的,新型、自然的人机交互技术逐渐成为开发者和科研工作者的关注重点。这类交互方式要求输入与输出能够最大限度地符合交互主体的行为习惯,并能够在交互主体的脑中顺利构建交互环路。由于手势具有极强的信息表述功能,加之人手操作行为本身就是人与世界相互作用的主要方式,因此,基于手识别的人机交互技术相关研究有着重要的理论价值和应用价值。基于手势识别的人机交互技术涉及计算机科学、认知心理学、行为学等诸多方面的知识。本文不能面面俱到,仅就手势交互的基本问题:手势语义的分类,以及当前发展概况、研究热点技术和典型系统应用等相关问题进行综述。 2.研究现状 目前,基于视觉的手势交互已被广泛的研究,由于手势本身的多义性及时空差异性,加之手形变的高维度及视觉问题本身的不适定性,基于视觉的手势识别一直是一项极富挑战性的究课题[5]。需要解决的核心问题是对手形的识别,对手势的跟踪等。传统的方法主要分为两大类:(1)基于模型(model-base)的方法;(2)基于表征(appearance-based)的方法[6]。这些方法及其衍生算法极大程度地依赖于计算机科学中虚拟现实、机器视觉、模式识别、人机交互等多个领域的交流与合作。相关的国际会议:CHI、ICCV、CVPR、ICAT、IEEE VR 为研究者提供了一个能充分交流的空间,并吸引了越来越多的研究人员共同参与合作。此外,学科之间的交流也吸引了心理学研究人员的共同参与。他们以从用户为中心出发,为基于手势交互研究和开发提出了宝贵意见[7]。纵观手势交互的发展历程,其研究重点也从早期简单的系统框架、低层特征提取[8]、手形模板匹配[8]等问题转变到关节式物体跟踪[9,10, 11]、跟踪性能评价[12]、操作型手势解析[14]等问题上。我国在基于手势识别的人机交互领域的研究近年来得到了长足的发展。研究机构集中在国内的研究所和高校的科研单位。目前国内手势交互的研究成果主要有:中国科学院软件研究所[15]的研究中,对二阶自回归过程动力学模型(Auto-Regressive Process, ARP)进行训练和学习,进而建立基于ARP 的预测模型,实现了人手运动的鲁棒性跟踪,在出现跟踪丢失的情况下在后续序列中可以自动恢复正确跟踪。中国科学院自动化研究所模式识别实验室提出一种基于区域的多连接体(手指)的三维运动跟踪算法[13],用多约束融合的方法以及手指的运动特性,建立多刚体的三维运动描述,通过三类基本约束条件,把跟踪问题归结为一个约束误差优化问题。清华大学的崔锦实博士,提出一种基于回归-优化方法的关节式物体的姿态估计方法[16]。该方法把回归分析与全局优化搜索相结合,保证了估计的精度和连续性;针对现有滤波器在高维非线性多峰

表情识别技术综述

表情识别技术综述 摘要:表情识别作为一种人机交互的方式,成为研究的热点。基于对表情识别的基本分析,文章重点介绍了面部表情识别的国内外研究情况和面部表情特征的提取方法。 关键词:表情识别;特征提取;表情分类。 前言:进入21世纪,随着计算机技术和人工智能技术及其相关学科的迅猛发展,整个社会的自动化程度不断提高,人们对类似于人和人交流方式的人机交互的需求日益强烈。计算机和机器人如果能够像人类那样具有理解和表达情感的能力,将从根本上改变人与计算机之间的关系,使计算机能够更好地为人类服务。表情识别是情感理解的基础,是计算机理解人们情感的前提,也是人们探索和理解智能的有效途径。如果实现计算机对人脸表情的理解与识别将从根本上改变人与计算机的关系,这将对未来人机交互领域产生重大的意义。 正文:一、面部表情识别的国内外研究情况 面部表情识别技术是近几十年来才逐渐发展起来的,由于面部表情的多样性和复杂性,并且涉及生理学及心理学,表情识别具有较大的难度,因此,与其它生物识别技术如指纹识别、虹膜识别、人脸识别等相比,发展相对较慢,应用还不广泛。但是表情识别对于人机交互却有重要的价值,因此国内外很多研究机构及学者致力于这方面的研究,并己经取得了一定的成果。 进入90年代,对面部表情识别的研究变得非常活跃,吸引了大量的研究人员和基金支持。美国、日本、英国、德国、荷兰、法国等经济发达国家和印度、新加坡都有专门的研究组进行这方面的研究。其中MIT的多媒体实验室的感知计算组、CMu、Ma州大学的计算机视觉实验室、Standford大学、日本城蹊大学、大阪大学、ArR研究所的贡献尤为突出。 国内的清华大学、哈尔滨工业大学、中科院、中国科技大学、南京理工大学、北方交通大学等都有专业人员从事人脸表情识别的研究,并取得了一定的成绩。在1999年的国家自然科学基金中的“和谐人机环境中情感计算理论研究”被列为了重点项目。同时中国科学院自动化所、心理所以及国内众多高校也在这方面取得了一定的进展。2003年,在北京举行了第一届中国情感计算与智能交互学术会议,会议期间集中展示了国内各研究机构近几年来从认知、心理、模式识别、系统集成等多种角度在情感计算领域取得的研究成果,一定程度上弥补了我国这方面的空白。国家“863”计划、“973”项目、国家自然科学基金等也都对人脸表情识别技术的研究提供了项目资助。 二、面部表情特征的提取方法 表情特征提取是表情识别系统中最重要的部分,有效的表情特征提取工作将使识别的性能大大提高,当前的研究工作也大部分是针对表情特征的提取。 目前为止的人脸面部表情特征提取方法大都是从人脸识别的特征提取方法别演变而来,所用到的识别特征主要有:灰度特征、运动特征和频率特征三种阎。灰度特征是从表情图像的灰度值上来处理,利用不同表情有不同灰度值来得到识别的依据。运动特征利用了不同表情情况下人脸的主要表情点的运动信息来进行识别。频域特征主要是利用了表情图像在不同的频率分解下的差别,速度快是其显著特点。在具体的表情识别方法上,分类方向主要有三个:整体识别法和局部识别法、形变提取法和运动提取法、几何特征法和容貌特征法。 整体识别法中,无论是从脸部的变形出发还是从脸部的运动出发,都是将表情人脸作为一个整体来分析,找出各种表情下的图像差别。其中典型的方法有:基于特征脸的主成分分析(prineipalComponentAnalysis,pCA)法、独立分量分析法(Indendent ComPonent Analysis,ICA)、Fisher线性判别法(Fisher’s Linear Discriminants,FLD)、局部特征分析(LoealFeatureAnalysis,LFA)、Fishe诞动法(Fisher^ctions)、隐马尔科夫模型法(HideMarkovModel,HMM)和聚类分析法。

基于卷积神经网络的简单背景手势识别方法概述

基于卷积神经网络的简单背景手势识别方法概述 摘要在手勢识别研究方法日益成熟的今天,研究人员把主要精力放在新算法的研究以及旧方法的改进上,均取得了很好的成果。本文利用时下流行的卷积神经网络训练方法,避开大量的算法研究工作,把主要工作放在手势数据的获取以及处理上,在一定的数据范围内取得了很好的结果。在一定程度上给手势识别工作提供了新的思路。 关键词手势识别;手势数据;卷积神经网络 Abstract Today,as gesture recognition research methods become more and more mature,researchers have made great efforts to focus on the research of new algorithms and the improvement of old methods. In this paper,we use the popular Convolutional Neural Network (CNN)training method to avoid a lot of algorithm research work. The main work is on the acquisition and processing of gesture data,and it has achieved good results in a certain data range. To a certain extent,it provides a new idea for gesture recognition. Keywords Gesture recognition;Gesture data;Convolutional neural network 前言 以输入数据来区分,手势识别可以分为静态手势识别和动态手势识别。动态手势识别是基于视频流数据,实现手势动作捕捉,本质上是把视频流分为每一帧图像数据,处理每一帧图像之间的关系,从而识别出动态手势的含义。静态手势识别也称为手型识别,其输入数据是一副静态的手势图像,计算机系统通过前期对大量手势图像的训练学习,熟知手势图像的特征,从而识别出这一副静态手势图像的含义。本文的主要工作是通过卷积神经网络方法对简单背景的手势图像进行训练,得到训练模型,利用该训练模型对新采集的手势图像数据进行识别,达到预期的识别率。 1 研究方法 手势识别的研究方法有很多种,例如利用SIFT特征提取配合SVM训练的方法[1],利用HOG特征提取的研究方法[2]等。但这些研究方法对于图像质量太多依赖,如SIFT方法太过依赖局部梯度主方向,而获取局部梯度主方向往往都会有偏差,因此图像质量不佳容易导致特征提取的错误。且SIFT是一种只利用到灰度性质的算法,忽略了色彩信息,对于彩色图像的识别无能为力。 而本文采用的卷积神经网络方法则不存在该问题,卷积神经网络对于图像的容错性较强,可以不考虑图像质量、色彩等影响,关键是训练的样本量足够大,就可以得到相对理想的结果。且卷积神经网络的算法通用性强,对于识别任何类型的静态图像,都可以用几乎相同的训练模型进行,区别仅仅在于某些参数的调

手势识别综述

手势识别综述 【摘要】介绍了手势识别的定义、分类,手势识别的过程,动态手势识别的过程。 【关键词】手势建模;傅里叶描述子;动态手势 1手势定义和分类 通常在人机交互领域手势定义为:人类通过手掌和手指的不同姿势组合形成的具有特定含义的信息的集合体称为手势。 手势通常可以分为操作性手势和交流性手势:如钢琴伴奏家在弹奏钢琴时的手指动作属于操作性手势,通过十个手指的不同组合,在键盘上发出不同声音形成乐曲的弹奏,只有操作的含义,不含有视觉上信息。马路上交警指挥路况时手上的动作属于交流性手势,通过司机观察交通警察手上不同动作理解警察的意思,含有视觉上的信息。 按照手势在表达的信息中所处的地位分为自主性手势和非自主性手势:哑语演示时表演者手上的手势动作完全表达了哑语表演者的思想,手势在语义交流中占主导地位,属于自主性手势,演员表演节目时有时为了更好的表达情感会用手势加深语义表达,但是手势只是为了更好表达意思,起到对演员表达思想的补充,这种手势动作这属于非自主性手势,在语义表达中不占主导地位。按照手势在交流活动中手势的作用对象分为离心手势和向心手势:比如说话人在下命令时手指向受命人这种手势属于离心手势,例如交通警察在交通管制中的手势属于离心手势,当听到某消息时听者会有相应的情感反应这时的手势属于向心手势,例如小朋友表示不同意时摇手即为向心手势。当操作者利用手势表达思想的时候有两种方式,一种是手臂不动完全通过手指和手掌的运动来表达操作者的意思,还有一种是忽略手指的运动,通过手的运动轨迹来表达思想。当我们做研究时会遇到手和手指同时运动的情况这时为了分类方便,需要做相应约束,当手是动的应忽略手指的动作,反之如果手指在动这时应忽略手的运动轨迹。因为基于表观的手势识别最终面临的是手的2D图像如果手和手指的运动同时考虑的话会给分类造成不必要的麻烦。 2手势识别的分类 按照对手势数据采集的方式分为数据手套型和摄像头型。 2.1数据手套 虚拟现实中重要组成部分,是一种通用的人机接口他可以将手指的复杂动作通过传感器反应到虚拟环境中去,在虚拟环境中真实再现手部动作。数据手套使用的效果关键是手套能不能将手指、手掌、手腕的弯曲真实的以数据形势反演到系统数据库中,让系统根据模型对手势进行有效识别,由于手部软组织和计算复杂性,数据手套的计算速度总是存在延时,同时从人机交互的角度手套佩戴也十分不方便,如果多人使用还存在卫生等问题,因此数据手套目前来说只是应用在试验阶段,真正推广到社会应用还有很多问题要解决。例如由海军某课题组开发的某型飞机训练仿真系统采用了数据手套,将人的动作如拉升飞机操纵杆通过数据手套反应到系统中,但是不足之处是手套存在一定的延时,通常第二个动作都准备做了,第一个动作系统往往还没执行,这和真实的飞机操作存在很大的差别,但是要想系统及时接受数据手套传感来的数据,往往对系统的中央处理器要求很高,需要大量投入经费和人力,存在一定的矛盾。因此数据手套在虚拟仿真中往

相关文档
最新文档