手势分割方法研究综述

合集下载

一种复杂背景下的手势分割新方法

一种复杂背景下的手势分割新方法

一种复杂背景下的手势分割新方法
刘俊梅;阮秋琦
【期刊名称】《北京电子科技学院学报》
【年(卷),期】2006(014)002
【摘要】从复杂的彩色图像中快速划分出手势,是手势识别的识别的效果.本文在分析现有方法的基础上,提出了一种基于复杂背景下的手势分割新方法.首先,在RGB 模式空间里利用1.0<R/G<1.3建立第一个肤色模型,然后将HSV空间改进为更适合于肤色特征的模式空间HSV,在对H特征进行简化的基础上,建立第二个肤色模型,最后将这两种肤色模型相结合,得到复杂背景下的手势分割新方法.实验结果表明,这种方法的算法简单,易于实现,分割效果较好,并可用于实时图像处理.
【总页数】5页(P23-27)
【作者】刘俊梅;阮秋琦
【作者单位】北京交通大学,信息科学研究所,北京,100044;北京交通大学,信息科学研究所,北京,100044
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.复杂背景下的实时手势分割算法及其硬件实现 [J], 郑俊波;苏成悦;林剑冰;何榕礼
2.复杂背景下的手势分割及掌心检测 [J], 潘丹丹;柳灿雄;聂建华
3.复杂背景下的手势分割与识别 [J], 任海兵;祝远新;徐光祐;张晓平;林学誾
4.复杂背景下基于肤色检测的动态手势分割与识别 [J], 唐文权; 徐武; 文聪; 郭兴
5.一种复杂背景下的电力设备红外图像分割方法 [J], 王小芳; 毛华敏
因版权原因,仅展示原文概要,查看原文内容请购买。

手势识别综述

手势识别综述
套能不能将手指 、 手掌 、 手腕 的弯 曲真实的以数据形势反演 到 系统数据库中 , 让系统根据模型对手 势进行有效识别 , 由于手 部软组织和计算复杂性 , 数据手套的计算速度 总是存在延时 , 同时从人机交互 的角度手套佩戴也十分不方便 ,如果 多人使
手 势通 常可 以分 为操作性手势 和交 流性手势 : 如钢琴伴
基 于摄 像头数据采 集方式 的手势识别 系统从 数据采 集 的角度来说要 比数据手套方便 , 摄像头采集到 的手部数据 后
比较麻烦 的是要从背景 中将手分割 出来 , 通常会用肤色分 割 的方法 基于皮肤 的色调将不 同于周 围背景手 的区域分离 出 来, 但是会 受到光线等 因素干扰 。 分离 出手后需要 用合适 的
动作理解警察 的意思 . 含有视觉上的信息 。
按 照手势在表达 的信息中所处 的地位分为 自主性手势和 非 自主. 性手势 :哑语演示时表演者手上的手势动作完全表达
了哑语表演者的思想 . 手势在语义交流中占主导地位 。 属于 自
主 性手势 .演员表演节 目时有时 为了更好的表达情感会用手 势加深语义表达 , 但是手势只是为了更好表达意思 , 到对演 起
奏家在 弹奏钢琴时的手指动作属于操作性手势,通过十个手
指 的不 同组合 ,在键盘上发 出不 同声音形成 乐曲的弹奏 , 只
有操作 的含义, 不含有视觉上信 息。 马路上交警 指挥路况时手 上的动作属于交流性手势 , 通过 司机观察交通警 察手上不同
用还存在卫生等问题 ,ቤተ መጻሕፍቲ ባይዱ此数据手套 目前来说只是应用在试
验阶段 . 真正推广到社会应用还有很多问题要解决 。 例如由海 军某 课题 组开发的某型飞机训练仿真系统采用 了数据手套 , 将人的动作如拉升飞机操纵杆通过数据手套反应 到系统中 , 但是不足之处 是手套存在一 定的延时 ,通常第二个动作都准 备做了 . 第一个动作系统往往还没执行 , 这和真实的飞机操作 存在很大 的差别 ,但是要想 系统及时接受数据手套传感来 的 数据 , 往往对系统的中央处理器要求很高 , 需要大量投入经 费

手势识别研究概述

手势识别研究概述

第9卷第2期2006年4月西安文理学院学报:自然科学版Journal of Xi ’an University of Arts &Science (Nat Sci Ed )Vol.9 No.2Apr.2006文章编号:100825564(2006)022*******收稿日期:2005-8-24作者简介:路凯(1980— ),男,山西大同人,北方工业大学机电工程学院硕士研究生.手势识别研究概述路 凯,李小坚(北方工业大学机电工程学院,北京100041)摘 要:手势是一种自然而直观的人际交流模式.介绍了手势识别的发展过程以及手势的建模方法.当前人们采用不同的手势识别手段和技术来识别手势.同时介绍了当今比较先进的计算机手势输入技术,提出了一种新的手势识别方法,并举出已经实现的手势识别系统.关键词:手势;建模;虚拟现实;计算机视觉中图分类号:TP242.6 文献标识码:A当今科技的飞速发展离不开计算机的广泛应用.计算机已经渗透于生产和生活的各个方面,已经成为人们日常生活的一部分,人们与计算机的交互也日益成为科研领域的热点.近年来虚拟现实技术的迅猛发展,大大促进了人们在人脸识别、表情解释、口形(唇读)识别、头部方位检测、视线跟踪、三维定位、手势解释和人体姿势解释等方面研究工作的积极性.不论在日常交际活动中,还是在人机交互活动中,手势都理应具有十分重要的作用.遗憾的是,传统用户界面只利用了手势中极少的信息.例如用户使用二维鼠标器时,计算机仅能获得二个维度的移动信息和少数手指的点击.除此之外,计算机不能识别任何别的动作,不但缺少按键的力度,甚至连第三维空间信息都不能提供,将人的手和眼局限在狭小的桌面上.从手势以及更多的输入通道获得用户更丰富的交互意图是当前人机交互技术发展的新动向、新课题.手势识别在当前是比较热门的研究课题,由于人们的研究目的需求不同,在具体的处理方面就产生了不同的处理技术.手势是一种自然而直观的人际交流模式.基于视觉的手势识别是实现新一代人机交互所不可缺少的一项关键技术.然而,由于手势本身具有的多样性、多义性以及时间和空间上的差异性等特点,加之人手是复杂变形体以及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性的多学科交叉研究课题.1 手势识别方法的发展最初的研究主要集中在做一种专用硬件设备来进行输入.例如数据手套,即人可以戴上一个类似于手套的传感器,计算机通过它可以获取手的位置、手指的伸展状况等丰富信息.如1993年B.Thamas 等人做的自由手控制目标的系统就是凭借数据手套作为输入的媒介,但这需要实验者带上一个专用设备.之后人们又致力于标记手势的研究,即通过在手上作标记,例如在手腕和手指处贴上或画上特殊颜色的圆点,用来识别手势.这虽然给识别带来方便,但同样给实验者带来麻烦.最后人们终于把注意力集中到自然手上,通过专用的加速硬件和脱机训练,一些研究者成功地研制了手势识别系统,但其识别的手势仅限于几种.例如,Freeman 和Roth 等人提出的基于方向直方图的手势识别系统.1994年,高文等人提出了一种静态复杂背景手势目标的捕获与识别,1995年又提出了动态复杂背景中实施目标的捕获与识别方法.1999年常红等人提出了基于计算机视觉技术的手形手位跟踪方法.2002年邹伟提出了一种基于双信息源的人手空间跟踪方法(利用视觉输入提取手的平面位置信息,借助于安装于肘部的弯曲传感器获取手臂的弯曲角度,根据所建模型由二者通过模糊计算确定手的深度信息).2 手势的定义、分类和表示2.1 手势的定义人体语言包括对肢体的状态和动作的运用,其中我们有必要进行手势(gesture)和姿势(posture)的区别.表1 手的运动分类手的初始位置手指弯曲度省略静止状态下的手指移动中的手指省略X手指的位置例如:握拳手指的姿势静态的手的位置初始位置例如:拇指向下初始状态下的姿势例如:再见,挑衅,来这里动态的手势移动中的位置例如:重击或者敬礼移动中的手势例如:快来这里手势当然只能由手产生,而姿势则既可由手产生,也可由整个身体产生.两者的区别似乎在于手势更为强调手的运动,而姿势则更为强调手或身体的形状和状态.不过,只有当我们说明问题需要时才作这种区分,在多数情况下我们笼统地定义为:手势是人的上肢(包括手臂、手和手指)的运动状态.2.2 手势的分类手势一般可以分为以下几类:①交互性手势与操作性手势.前者手的运动表示特定的信息(如乐队指挥),靠视觉来感知;后者不表达任何信息(如弹琴).②自主性手势和非自主性手势.后者与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息).③离心手势和向心手势.前者直接针对说话人,有明确的交流意图,后者只是反应说话人的情绪和内心的愿望.手势的另一种分类方法是将手的运动分解为两个可测量分量:①手掌位置和方向;②手势弯曲度,并根据这两个分量的不同组合对手势做了表1所示的完备的分类.可见手势的各种组合相当复杂,因此,在实际的手势识别系统中通常需要对手势做适当的分割、假设和约束.例如,可以给出如下的约束:①如果整个手处于运动状态,那么手指的运动和状态就不重要;②如果手势主要由各手指之间的相对运动构成,那么手就应该处于静止状态.2.3 手势的表示根据不同的应用需要,手势可以分为:交谈手势、控制手势、操作手势和沟通手势.3 手势识别的建模现有的手势模型可以归为两大类:基于3D手(臂)模型的手势模型和基于表观的手势模型.原理上,基于3D手(臂)模型的手势模型适合于给所有手势建模,而基于表观的手势模型通常只适用于给交流性手势.然而,基于3D手(臂)模型的手势模型不仅参数多,计算复杂性高,而且为抽取模型参数而使用的许多近似过程导致模型参数的估计很不可靠.而基于表观的手势模型的计算复杂性低,易于达29西安文理学院学报:自然科学版第9卷到实时.因此,目前绝大部分手势识别系统都采用了基于表观的手势模型.不过,随着计算机性能的不断提高,已经有人开始把经过简化的3D 几何模型用于识别一定数量的交流性手势.成功的手势识别策略应该考虑手势的时间2空间上下文,即考虑手势的语法规则.语法规则既要反映手势的语言学特征,又要反映手势的空间特征.然而,到目前为止只有很少数量的系统使用语法规则.基于单摄像机在复杂背景下实时识别多种手势是手势识别的发展方向.4 计算机手势输入技术利用计算机识别和解释手势输入是将手势应用于人机交互的关键前提.目前人们采用了不同手段来识别手势[1]:①基于鼠标器和笔,缺点是只能识别手的整体运动而不能识别手指的动作;优点是仅利用软件算法来实现,从而适合于一般桌面系统.需要说明,仅当用鼠标光标或笔尖的运动或方向变化来传达信匹配,通过测量两者之间的相似度来完成识别任务.②神经网络技术,是一种较新的模式识别技术,具有自组织和自学习能力,具有分布性特点,能有效抗噪声和处理不完整的模式以及具有模式推广能力.③统计分析技术,通过统计样本特征向量来确定分类器的一种基于概率的分类方法.在模式识别中一般采用贝叶斯极大似然理论确定分类函数.其缺点是要求人们从原始数据中提取特定的特征向量,而不能直接对原始数据进行识别.5 手势识别的实现系统随着计算机硬件的发展,计算机视觉的方法已经逐渐地应用在人手的定位、跟踪以及手势识别等方面.其中,首先需要解决的问题是环境因素,特别是背景,对人手的分割、定位造成的影响.在单目视觉系统中,最简单而常用的方法是外加种种限制,如黑色或白色的墙壁、深色的服装等简化背景,或要求人手戴特殊颜色的手套或者标记物等强调前景,这样可以直接从背景中划分出手区域[3].又有如G ary [4],应用人体皮肤颜色在HSV 空间的聚集特性,将彩色视频图像转换为皮肤概率分布图像,通过CAMSHIF T 算法,寻找3个最大的皮肤区域块,利用位置和面积等约束条件分割出人手.而Weng [5]的系统采用预测和确认的分割方法,先建立手势形状数据库,保存手势过程中各个时刻不同位置不同比例的手势图像,分割时以此为模板计算相似度,进行复杂背景下的手势分割.Charles 使用Markov 模型对人手的轮廓建模,以从背景中分割出手轮廓,然而一个模型只能适用于一个特定的手形轮廓.当然,也有系统采用双目立体视觉原理,由区域匹配计算图像各点视差,由视差分割人手区域,如Joshua [6].人手模型在手势识别中占有更加重要的地位.手的模型多种多样,相应的特征也多种多样.而在以运动参数为特征的手势识别中,几乎都是将人手建模成一点或者一块,直接计算整体的运动参数.Lee 与Peng 都将手看成一个点,以其运动轨迹作为手势特征,所不同的是,Lee 应用HMM 模型判断手势的开始和结束,以进行手势识别,而Peng 采用的是有限状态机的方法进行识别.Starner 以椭圆为人手建模,以椭圆中心位置、椭圆长短半轴长以及椭圆长半轴与坐标系x 轴夹角这些参数的变化轨迹作为手势特征.然而,这些方法只研究手的整体运动,并不考虑手形的细微变化,因而不能检测出由于局部运动而导致的微小变化,大大地限制了手势识别的种类,是一种粗略的手势运动参数识别算法.39 第2期路凯,等:手势识别研究概述49西安文理学院学报:自然科学版第9卷6 一种手势识别的新方法处理静态手势数字图象是用基于单目视觉的边缘特征象素点作为识别特征并且通过对皮肤的肤色区域提取来实现的,其中对手的边界跟踪采取的算法是Freeman链法则.由于采用的是单目立体视觉,因此,笔者先证明了用一台摄像头进行距离测试的可行性,然后分析了摄像头在对水平和倾斜两种情况中在计算机图象处理距离的的模拟测量.因此,笔者在用VC进行编写程序的时候,设计了两个类COri2 ent,CHand.由于采用的是大恒公司的CG300图像采集卡加NA TURE公司的CCD彩色摄像头的视觉系统处理,因此在编写程序的时候先要对一些设备、变量和函数进行初始化,而设计的类COrient主要就是完成初始化的工作,类CHand则是处理手势的函数,利用了OpenCV函数库的一些数据结构和函数进行一些低层的图像处理,然后通过设计的处理手势的算法进行手势的理解和应用.[参 考 文 献][1] Imagawa K,Taniguchi R,Arita D,et al.Appearance2Based recognition of hand shapes for sign language in low resolu2tionimage[C].In:Proceedings of the4th AsianConference on Computer Vision,IEEE,2000.943-948.[2] Heap T,Hogg D.Wormholes in shape space:tracking through discontinuous changes in shape[C].In:Proceedings ofthe IEEEComputer S ociety Conference on Computer Vision and Pattern Recognition,1998.344-349.[3] Starner T,Weaver,J,Pentland A.Real2Time American sign language recognition using desk and wearable computerbased video[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(12):1371-1375.[4] Bradski G,Y eo B L,Y eung M M.G esture for video content navigation[C].In:Proceedings of the Storage and Re2trieval for Imageand Video Databases V II,1999.230-242.[5] K ervrann,C.A hierarchical Markov modeling approach for the segmentation and tracking of deformable shapes[J].Graphical Modelsand Image Processing,1998,60(3):173-195.[6] G luckman J,Nayar S K.Planar catadioptric stereo:geometry and calibration[J].In:Proceedings of the Computer Visionand Pattern Recognition.1999.22-28.[责任编辑 马云彤]A Survey of G esture R ecognitionL U Kai,L I Xiao2jian(Institute of Electromechanical Engineering,North China University of Technology,Beijing100041,China)Abstract:Computer has been widely used in all parts of people’s daily life.The study of the mutual rela2 tionship between people and computer has also become the focus of the scientific research.G esture is a type of natural and direct interpersonal communication.The development and modeling of gesture recognition was introduced.Nowadays,different means and techniques were adopted.Moreover,an advanced technol2 ogy of computer gesture inputs was introduced;a new method of gesture recognition was put forward.A system,which has already been realized,was also illustrated.K ey w ords:gesture recognition;modeling;virtual reality;computer vision。

基于多点特征提取的手势识别的研究

基于多点特征提取的手势识别的研究

基于多点特征提取的手势识别的研究手势识别系统是指人类用语言中枢建立起来的一套用手掌和手指位置、形状构成的特定语言系统。

为了解决传统手势识别计算量大的问题,在已有的手势识别基础上,提出一种重心距离的手势识别方法。

通过肤色检测方法进行手势分割,计算手的重心,将手的边缘的点与重心点的距离按顺时针方向或者逆时针方向遍历,就会出现五个峰值,分别是五个手指。

实验结果表明,与现有方法相比,此方法在識别速度方面有了明显的提高。

标签:手势识别;肤色检测;手势分割;指尖检测Abstract:Gesture recognition system (GRS)is a special language system composed of palm and finger position and shape,which is established by human language center. In order to solve the problem of heavy computation in traditional gesture recognition,a new gesture recognition method based on barycentric distance is proposed. The skin color detection method is used to segment the hand gesture,calculate the center of gravity of the hand,and traverse the distance between the edge of the hand and the center of gravity clockwise or counterclockwise,and there will be five peaks,five fingers respectively. The experimental results show that the recognition speed of the proposed method is much higher than that of the existing methods.Keywords:gesture recognition;skin color detection;gesture segmentation;fingertip detection1 概述手势作为一种人类日常普遍使用的交互方式,因其形象生动而成为了人机交互中的非常重要的一部分。

动态手势识别技术综述

动态手势识别技术综述

动态手势识别技术综述作者:郭雷来源:《软件导刊》2015年第07期摘要:分析比较了现有动态手势识别技术的思路和特点,介绍了基于视觉的动态手势识别基本步骤,分析了该技术路线中存在的若干难点。

在此基础上介绍了深度学习方法的基本思路和优点,展望了动态手势识别技术今后的研究方向。

关键词:手势;动态手势识别;机器学习DOIDOI:10.11907/rjdk.151343中图分类号:TP301 文献标识码:A 文章编号文章编号:1672-7800(2015)007-0008-020 引言作为一种不需要中间媒介、非常人性化的人机交互方式,手势是一种理想的自然用户界面(Natural user interface,NUI),它使人们可以用一种更自由的方式与计算机进行交流。

手势是人手或者手和手臂结合产生的各种姿势或动作,广义上手势还可以包含人的表情、步态等,甚至全身任何部分动作。

手势可以分为静态手势和动态手势。

静态手势识别考虑某个时间点上手势的外形特征,动态手势关注一段时间内人的一系列动作,增加了时间信息和动作特征。

本文首先介绍基于视觉的动态手势识别基本步骤,然后分析该技术路线中存在的若干挑战性难点。

接着分析比较现有动态手势识别技术的思路和特点,最后总结动态手势识别技术的研究方向。

1 手势识别基本流程一般来说,基于视觉的手势识别基本流程如图 1 所示。

设计手势特征和手势模型,并利用手势样本提取特征,对手势模型进行训练,最终建立手势模型。

在此基础上,通过视频采集设备获取新的手势视频并进行预处理,接着对手势图像进行手势分割,从而比较准确地提取图像中的人手部分,然后进行手势特征提取;最后,利用前面建立好的手势模型对输入的手势进行分类识别。

图1 手势识别基本流程2 手势识别技术难点手势识别是一个非常具有挑战性的研究课题。

自然手势存在多样性、多义性等特点,复杂的动态手势必须关注手势时间序列上的变化、手的运动轨迹、手的外形特征等多个方面,这使得基于视觉的手势识别技术面临许多关键问题,手势识别的研究仍然有一些技术难题需要突破。

手势识别技术综述

手势识别技术综述

手势识别技术综述作者单位:河北工业大学计算机科学与软件学院内容摘要:手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。

一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。

但是这其中手势占大多数。

本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。

Abstract:Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future.1.定义说到手势识别,首先要对手势识别中的手势有一个清晰的认知。

《基于深度学习的手势识别算法研究》范文

《基于深度学习的手势识别算法研究》范文

《基于深度学习的手势识别算法研究》篇一一、引言手势识别技术是一种利用计算机视觉技术分析、解读和解析人手和手臂的动态或静态行为的技术。

近年来,随着深度学习技术的发展和广泛应用,基于深度学习的手势识别算法在各个领域取得了显著的成果。

本文将针对基于深度学习的手势识别算法进行深入研究,并探讨其应用和未来发展。

二、手势识别技术概述手势识别技术主要包括基于传统计算机视觉方法和基于深度学习的方法。

传统方法通常依赖于复杂的特征提取和手动设计的算法。

而深度学习方法则能够自动学习和提取有效的特征,具有更高的准确性和鲁棒性。

目前,基于深度学习的手势识别算法已经成为研究的热点。

三、深度学习在手势识别中的应用深度学习在手势识别中的应用主要体现在卷积神经网络(CNN)上。

CNN是一种具有深层结构的神经网络,具有良好的特征提取能力。

在手势识别中,CNN能够自动学习和提取手势的形状、位置和动态变化等特征,从而实现高精度的手势识别。

此外,循环神经网络(RNN)也在手势序列识别中发挥了重要作用。

四、基于深度学习的手势识别算法研究(一)数据集与预处理在基于深度学习的手势识别算法研究中,首先需要准备一个合适的数据集。

数据集应包含多种不同的手势,以及不同背景、光照和角度下的手势图像。

在数据预处理阶段,需要对图像进行归一化、去噪和增强等操作,以提高算法的鲁棒性。

(二)模型设计与优化在模型设计方面,可以采用卷积神经网络(CNN)或循环神经网络(RNN)等深度学习模型。

针对不同的手势识别任务,可以设计不同的网络结构和参数。

在模型优化方面,可以采用梯度下降、反向传播等算法进行模型训练和优化。

同时,还可以使用一些优化技术,如批归一化、dropout等来提高模型的泛化能力和鲁棒性。

(三)算法实现与测试在算法实现阶段,需要使用深度学习框架(如TensorFlow、PyTorch等)来实现算法。

在测试阶段,需要使用测试数据集对算法进行评估和验证。

评估指标包括准确率、召回率、F1值等。

手势分割方法研究综述

手势分割方法研究综述

手势分割方法研究综述摘要:手势以其自然直观的特点成为人机交互的媒介。

手势识别系统中至关重要的一个环节是手势分割,使用何种方法能够较好的获取目标手势,成为计算机视觉中的研究重点和研究难点,本文总结了手势分割技术的主要方法,并针对所需要获得的目标图像提供合适的分割方法。

关键词:手势分割;轮廓模型;运动分析;肤色提取中图分类号:tp391.41随着计算机技术的发展,出现了物联网、信息物理系统(cps)等新概念、新技术,人机交互技术的重要性更加凸显并成为当前信息产业竞争中的一个焦点。

与传统的交互方式相比,手势以其独有的简洁、直观、人性化、信息量丰富的特点成为与计算机交互的媒介。

手势分割是整个手势识别系统中的起点和关键技术之一,其分割质量的好坏直接影响到后续操作如特征提取、目标识别的最终效果。

手势分割[1]可以理解为从包含手势的图像中提取出有意义地手势区域的过程,其主要特点是选取如颜色,灰度等与无意义区域有明显差异的特征,将手势区域与无意义区域分离,致使二者之间存在更为明显差异。

因此对于基于内容的图像检索,对象分析等提取有用信息,必须采用分割效果较好的分割方法。

作为计算机视觉中的一个重要研究内容,手势分割技术在图像处理领域有着至关重要的地位。

1 基于活动轮廓模型的分割技术活动轮廓模型的提出给传统的图像分割和边界提取技术带来了重大突破。

活动轮廓模型是指在图像域上的曲线(曲面),在图像力(内力)和外部约束力共同作用下向物体边缘靠近的模型,外部约束力是由图像数据定义的。

活动轮廓模型主要由模型的描述,模型的能量函数和模型的最小化组成。

基于活动轮廓模型的分割方法是一种半自动的基于先验知识和用户交互的图像分割。

根据使用方式、应用曲线的类型和图像能量项的选择等,将其划分为基于变分法的活动轮廓模型和几何活动轮廓模型的分割方法。

1.1 基于变分法的活动轮廓模型分割方法在1987年kass,witkin和terzopoulos提出了snake模型[2] ,即基于变分法的活动轮廓模型,又称为参数活动轮廓模型。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

special focus本期关注
生了许多不同的颜色空间,例如用于电视工业的 YUV , YIQ,YCbCr,色度学的CIE-RGB真实三原色系统和CIEXYZ虚拟三原色系统,面向色调的HIS,HSL,HSV等HS 系列和TSL。静态肤色模型中,目前常用的主要为非参数 化的直方图统计、阈值化的规定肤色范围。直方图统计肤 色模型是一种非参数模型,理论上因为与肤色分布形态无 关,所以速度快。但是不足之处就是需要大量的统计样本 和存储空间,更适用于大规模训练和测试的图像数据。由 于受到某些颜色空间的色域没有规则的边界的影响,阈值 化的规定肤色范围主要考虑何种颜色空间适合以及如何确 定规则的参数。目前主要包括能够适应成像条件随时间的 变化的图像和将肤色模型参数调节到适应具体的某幅静态 图像的两大类动态肤色建模方法。但是一般情况这些自适 应的方法所建立的模型通用性较差,只有规定在具体特定 条件下才能得到较高的检测率。 基于物理的方法从皮肤的光学特性出发,引入照明和 皮肤间的相互作用,估计肤色可能的分布范围,尽可能实 现肤色的光照不变性。在复杂光照条件,基于统计的肤色 检测技术不能有效分割感兴趣区域时,就需要此方法对肤 色区域进行检测和纠正。总之基于物理的肤色检测和基于 统计的肤色检测所使用的数学工具基本相同,主要差异在 于是否利用解释皮肤辐射特性的物理模型。 目前肤色检测技术仍然存在一些问题:( 1 )环境因 素:复杂照明或复杂背景下的肤色检测效果欠佳,单一手 段不能获取理想的分割效果。( 2 )因为目前还没有建立 起统一的肤色数据库,运用定量的手段对各种肤色检测技 术的性能进行比较是难以实现的。因此为了能够客观地比 较各种肤色的性能,应该着手建立一个统一的系统测评方 法和规范。( 3 )颜色空间的选择和量化级数与肤色建模 和分类方法有关,肤色不是很独特,会出现类肤色与肤色 范围重叠,因此应该采用均匀的颜色空间,而不要只局限 于比较不同颜色空间的肤色分布形态和交叠情况。 4 总结 随着手势识别技术的广泛应用,手势图像质量要求 越来越高,出现了多种手势分割的算法。这些算法各有其 优缺点,目前涉及到的大部分算法都是针对较为简单环境 下,理想和清晰的目标图像。但是在实际处理过程中,特 别是在复杂多变的环境中,想使用单一的分割方法分割出 较好的手势图像还存在明显不足。比如复杂环境下出现与 手势肤色重叠的情况下,会造成干扰以及运动目标识别困 难,使得分割的手势图像存在偏差。另外在获取手势视频 序列过程中,往往受光照角度和亮度,背景复杂度以及光 源的颜色的影响,也无法得到理想的手势分割图像。那么 如何在复杂多变的情况下将人手高效地分离出来,同时提 高获取图像的实时性,将成为后续的研究重点。
98
两化融合
整机效率@1000W输出 93% 4 结论 本论文采用性能优良的 NBDD 脉宽调制方式以及控 制结构简单、稳定性好的 VFC2 反馈控制结构,并结合 高效率的 H 桥放大器设计和合理的滤波器设计,完成了 一款性能指标优良的数字音频功率放大器的开发。技术 指标达到了中档模拟功放的水平,与国外同类产品指标
special focus本期关注
相当。 数字功放技术在不断的向前快速发展,数字功放的 技术水平在不断提高,我公司紧跟技术发展动向,今年正 在开发、应用更高指标的数字功放技术,主要采用自振荡 NPWM 调制,目前已开发出初样,其失真度为 0.005% , 信噪比为 120 dB ,频响为 20Hz-40kHz ,最大输出功率达 3000W,效率达92%。

的边缘时,活动轮廓线有可能收敛到局部极值点,甚至发 散;其拓扑结构不易改变。 1.2 几何活动轮廓模型分割方法。几何活动轮廓模型 分割方法主要是基于曲线进化的思想和水平集方法共同描 述曲线进化的过程,因为采用了水平集方法而隐含有拓扑 变化的能力,使得更为复杂结构的图像分割成为可能。 其原理是把平面闭合曲线隐性地表示为具有相同函数值的 点集,然后根据曲面的进化过程来隐性求解曲线的进化过 程,嵌入的曲面总是其零水平集,因此只要确定零水平集 就能够确定移动界面演化的结果。由于几何活动轮廓模型 的初始轮廓线与参数特性无关,无需对曲线重新进行参数 化,它是在轮廓曲线(如曲率)的几何特性的推动下运动 到目标边缘,这就弥补了基于变分法的活动轮廓模型的某 些缺陷,比如因为水平集方法的引入,从而可以自然的处 理拓扑结构的变化。对初始位置不敏感,避免了参数活动 轮廓模型必须重复地参数化曲线,提供了稳定的数值算法 等优点,基于上述优点,研究学者们把几何活动轮廓模型 越来越广泛的应用到计算机视觉和图像处理领域。但该模 型的不足之处是仅仅利用了图像区域的灰度信息,致使图 像边缘定位的精确度不高。因此目前几何活动轮廓模型分 割方法研究的重点和难点是如何求解出不同的轮廓曲线能 量函数,获取所需的图像分割结果。 2 基于运动分析的分割技术 视频序列中的手势图像作为一种运动目标实体是手势 识别系统的研究重点和难点。视频中的运动目标分割的是 指在二维连续图像序列中,将感兴趣的运动目标实体从场 景中提取的过程。但是由于视频场景的复杂性,如受到光 照、阴影等因素的影响,使得运动目标的分割变得困难。 针对不同运动视频场景而言,目前常用于视频图像序列中 的手势分割方法主要有以下几种:基于背景减法的分割方 法、基于帧间差阈值的方法、基于光流场的分割方法。 2.1 基于背景减法的分割方法。基于背景减法的分割 方法原理是先选取多幅图像的平均构建一个背景图像,利 用当前帧图像与背景帧图像相减,进行背景消去来获得差 分图像,最后通过设定阈值进行目标提取的一种检测运动 区域算法。这种方法的优点在于原理和算法都比较简单, 根据它较为完整的特征数据,更好的解决帧间差分法中目 标区域偏大,目标内部出现孔洞等问题。但是由于受光照 变化和外部条件的影响,场景的动态变化致使目标阴影的
参考文献: [1]Christopher N.Hemmings.Improving Class D Audio Power Amplifiers.University of Queensland,St Lucia,Department of Computer Science and Electrical Engineering,1999. [2]Design Consideration for Class-DAudio Power Amplifiers.Texas Instruments Inc,1999,8. [3]Class d tutorial.IR公司,2004,2. [4]System Design Considerations for True Digital Audio Power Amplifiers.Texas Instruments Inc..Novenber 2001.Publication number SLAA117A 作者简介:凌智(1981.1-),男,湖南常德武陵区人,助教。 作者单位:常德职业技术学院现代教育技术中心,湖南常德 415000
本期关注 special focus
莫舒, 杨小东 / 顺德职业技术学院
两化融合
手势分割方法研究综述
摘 要:手势以其自然直观的特点成为人机交互的媒介。手势识别系统中至关重要的一个环节是手势分割,使用何种方法 能够较好的获取目标手势,成为计算机视觉中的研究重点和研究难点,本文总结了手势分割技术的主要方法,并针对所 需要获得的目标图像提供合适的分割方法。 关键词:手势分割;轮廓模型;运动分析;肤色提取
着计算机技术的发展,出现了物联网、信息 物理系统( CPS )等新概念、新技术,人机 交互技术的重要性更加凸显并成为当前信息 产业竞争中的一ቤተ መጻሕፍቲ ባይዱ焦点。与传统的交互方式相比,手势以 其独有的简洁、直观、人性化、信息量丰富的特点成为与 计算机交互的媒介。手势分割是整个手势识别系统中的起 点和关键技术之一,其分割质量的好坏直接影响到后续操 作如特征提取、目标识别的最终效果。手势分割[1]可以理 解为从包含手势的图像中提取出有意义地手势区域的过 程,其主要特点是选取如颜色,灰度等与无意义区域有明 显差异的特征,将手势区域与无意义区域分离,致使二者 之间存在更为明显差异。因此对于基于内容的图像检索, 对象分析等提取有用信息,必须采用分割效果较好的分割 方法。作为计算机视觉中的一个重要研究内容,手势分割 技术在图像处理领域有着至关重要的地位。 1 基于活动轮廓模型的分割技术 活动轮廓模型的提出给传统的图像分割和边界提取技 术带来了重大突破。活动轮廓模型是指在图像域上的曲线 (曲面),在图像力(内力)和外部约束力共同作用下向物 体边缘靠近的模型,外部约束力是由图像数据定义的。活动 轮廓模型主要由模型的描述,模型的能量函数和模型的最小 化组成。基于活动轮廓模型的分割方法是一种半自动的基于 先验知识和用户交互的图像分割。根据使用方式、应用曲线 的类型和图像能量项的选择等,将其划分为基于变分法的活 动轮廓模型和几何活动轮廓模型的分割方法。 1.1 基于变分法的活动轮廓模型分割方法。在1987年 Kass,Witkin和Terzopoulos提出了Snake模型[2],即基于变 分法的活动轮廓模型,又称为参数活动轮廓模型。它是直 接以不规则排列的不连续点构成曲线或基函数构成的曲面 的参数形式显式地表达曲线 / 曲面的演化。其工作机制是 首先为给定的模型构造所需的能量函数,其次利用变分法 对该能量函数极小化,最后根据获得模型演化的偏微分方 程,当轮廓线到达目标边界时,能量函数达到最小值而自 动停止。该模型的优点是把图像分割问题转化成泛函数求 极值问题,通过合适地初始化后轮廓线能够自主地收敛于 能量极小值状态,从而获得正确的边界,同时保持了边界 的光滑性,降低计算复杂度。但是Snakes模型的缺点是分 割的最终效果与活动轮廓的初始位置有关,需要依赖其他 方式将 Snake 放置在感兴趣图像特征周围;当靠近曲率高
参考文献: [1]王辉.基于视觉的实时手势跟踪与识别及其在人机交互中的应用[D].杭州:浙江大学,2008. [2]李培华,张田文.主动轮廓线模型综述[J].软件学报,2000,11(6):751-757.
》 》 》 》 》 下转第 96页 》
相关文档
最新文档