ROBOT2016_200-207+216_基于关键点序列的人体动作识别_尹建芹

ROBOT2016_200-207+216_基于关键点序列的人体动作识别_尹建芹
ROBOT2016_200-207+216_基于关键点序列的人体动作识别_尹建芹

第38卷第2期2016年3月机器人ROBOT V ol.38,No.2

Mar.,2016

DOI:10.13973/https://www.360docs.net/doc/6c8850098.html,ki.robot.2016.0200

基于关键点序列的人体动作识别

尹建芹1,2,刘小丽1,田国会3,魏军1,张玲1,徐涛1(1.济南大学信息科学与工程学院山东省网络环境智能计算技术重点实验室,山东济南250022;

2.山东大学计算机科学与技术学院,山东济南250061;

3.山东大学控制科学与工程学院,山东济南250061)

摘要:在不同的光照及视角下,为了实现人体日常生活动作的高识别率,提出了一种基于Kinect的识别方法.首先,受到人类进行动作识别时往往关注局部细节动作的启发,层次化地处理了采集到的人体关节点数据:通过判断躯干关节点位置变化的缓慢程度,将动作粗分类为上肢动作和躯干动作;之后对于上肢动作,关注手部关节轨迹变化,而对于躯干动作,关注中心关节点轨迹.然后,通过C均值聚类法从这两类轨迹中提取关键点,并将动作的轨迹映射到相应的关键点,得到每组粗分类动作的关键点序列.并提出了时序直方图的概念用以建模关键点序列.再通过比较轨迹间关键点序列的相似性,完成动作识别任务.最后,将该算法应用于采集的数据集合,得到了99%的识别正确率,表明算法能够有效地完成人体动作识别任务.

关键词:人体动作识别;人体关节点;C均值;k近邻;时序直方图

中图分类号:TP391文献标识码:A文章编号:1002-0446(2016)-02-0200-08 Human Action Recognition Based on the Sequence of Key Points

YIN Jianqin1,2,LIU Xiaoli1,TIAN Guohui3,WEI Jun1,ZHANG Ling1,XU Tao1

(1.Shandong Provincial Key Laboratory of Network Based Intelligent Computing,School of Information Science and Engineering,University of Jinan,

Ji’nan250022,China; 2.School of Computer Science and Technology,Shandong University,Ji’nan250061,China;

3.School of Control Science and Engineering,Shandong University,Ji’nan250061,China)

Abstract:To obtain high recognition accuracy of human actions in daily life under different illumination conditions and angles of view,a recognition method based on Kinect is proposed.Inspired by the fact that the human’s attention focuses on the detailed partial action in most cases of action recognitions,the proposed recognition method processes the sensed joints data hierarchically.Roughly,actions are classi?ed into the upper limb action and the trunk action by judging the change speed of the position of the trunk joint.Particularly,the hand joints trajectories in the upper limb action and the trunk joint trajectory in the trunk action are focused on.Then,key points are extracted from the two rough categories of trajectories by C-means clustering algorithm for each category separately.And the trajectory of the action is mapped to the corresponding key points.By this means,the sequence of key points in each category is obtained.And the sequences of key points are modeled based on the concept of the proposed temporal order histogram.Nextly,the action recognition is accomplished by comparing the similarities of the sequences of the key points among the trajectories.Finally,the recognition rate of99%is realized on the collected datasets.The results show that the method is effective for human action recognition task.

Keywords:human action recognition;human joint point;C-means;k nearest neighbor;temporal order histogram

1引言(Introduction)

人体动作识别涉及到视频捕获、图像处理、模式识别等相关技术[1],其在智能家居、人机交互、服务机器人等领域获得了广泛的应用.人体动作识别问题实际是一个分类问题,它主要包括关节点追踪、特征提取以及动作识别.近年来这方面的研究取得了重大突破[2-6].

目前的人体动作识别还面临着诸多的困难与挑战,主要体现在这3个方面[2]:首先,基于传统摄像头采集的视频数据进行的动作识别研究,难以摆脱光照及背景变化所带来的噪声影响,使得后续的识别方案设计异常困难,且难以取得令人满意的效果;其次,对不同动作的认知,关注点会有所差异,譬如,对于喝水、打电话等细致动作,关注点应该是其手部这一小尺度上相关动作的变化;而对于起立、坐下等全局类的动作,则更应该关注其大尺度

基金项目:国家自然科学基金(61203341,61573216);山东省自然科学基金(ZR2015FM007).通信作者:尹建芹,ise yinjq@https://www.360docs.net/doc/6c8850098.html,收稿/录用/修回:2015-09-07/2015-12-21/2016-01-31

第38卷第2期尹建芹,等:基于关键点序列的人体动作识别201

的变化,即全身的动作趋势;最后,由于人体动作具有复杂性、多样性与随意性,譬如,同样的动作不同的人会按照不同的方式完成,同一种动作同一个人在每次完成时也会有所差异.

针对上述问题,由于Kinect传感器能够自动捕捉人体深度图像和彩色图像[7-8],因此,能够有效地解决光照不稳定及姿态等因素所带来的影响.本文将采用Kinect传感器获取人体动作关节点数据,其能有效克服光照不稳定等环境因素的干扰,从而有利于动作的分割以及识别.另一方面,通过引入层次性的动作识别方法以达到针对不同动作采用不同关注点的效果,通过粗分类,将具有相同关注点的动作放在同样的子类中,在具有同样关注点的动作子类基础上进行特征抽取以完成动作建模,可以得到更符合动作特点的特征集合.最后,为了提高算法对动作的复杂性和随意性的适应,借鉴尹建芹等[9]基于时序直方图的人体行为表示方法,提出了基于关键点的时序直方图的动作建模方法,通过结合关键点和直方图的方法,达到对随意性及复杂性具有较好识别能力的动作识别效果.

2相关工作(Related works)

Wang等[3]提出了一种基于密度轨迹和运动边界直方图描述子的有效的视频描述方法,有效地完成了人体动作识别的任务,并在9种动作分类的数据集中进行评估.实验结果表明,该方法取得了优于当时最先进方法的识别效果.但是,这种算法容易受到光流获取的质量的限制,不能很好地处理大规模实时视频的数据集.Hoai等[4]提出了学习不变分类器和用最小二乘支持向量机(least-squares support vector machine,LSSVM)替代SVM(支持向量机)等技术,有效地提升了基于3种具有挑战性的基准数据集的最先进算法的人体动作识别效果,但是,文中仅仅通过对整个视频的剪辑来训练分类器,没有考虑在提升之后更新基分类器的问题.Simonyan等[6]提出了一种基于双流卷积网络并且结合分离空间和时间识别数据流的深度视频分类器模型,进行视频中的人体动作识别,达到了良好的识别效果.并且在2种标准视频行为基准数据集UCF-101和HMDB-51上进行训练和评估,有效地验证了该算法的性能.李红波等[7]利用Kinect 传感器获取人体深度图像的特征,采用综合点特征和梯度特征相结合的局域梯度特征方式对人体各部位进行判定,实现人体部位和人体姿态的区分.结合Kinect本身的特点,该研究能够克服光照、姿

态、遮挡等外界因素,但是,对于细微动作的识别仍然需要进行改进.Warade等[8]利用Kinect传感器实现实时的跟踪以及侦测,能够及时地反映生活场景的真实情况,巡逻人员只要及时地观看传回来的视频信息即可完成日常的巡逻任务,从而减轻他们的日常工作负担.田国会等[10]利用Kinect获取人体的关节点数据,构造人体结构的3维向量,采用动态时间规整(dynamic time warping,DTW)算法实现人体行为的识别.实验结果表明,该算法具有旋转平移不变性,并取得了良好的识别效果.但是,该研究针对的行为识别是已经分割好的数据,如何从数据流中完成动作分割与识别,还有待于完善.陈曦等[11]利用骨架关节点的3维坐标信息作为特征向量,结合隐马尔可夫模型进行人体行为识别,也取得了较高的精度.其缺点是使用自建的数据集,不能充分地证明算法的完备性.而且,隐马尔可夫模型的参数设置还有待于优化.尹建芹等[12]对家庭环境进行背景建模,提出了基于高熵变化量的时空特征方法,并结合人体环境信息对人体动作进行识别,取得了较好的识别精度.纪晓飞等[13]结合局部时空特征和兴趣点的全局位置信息分布(positional distribution information,PDI)提出了一种视频描述符完成人体动作的识别,充分考虑了兴趣点所包含的丰富的运动信息,结合了3维尺度不变特征变换(3-dimensional scale-invariant feature transform,3D SIFT)和PDI,其动作识别效果远远超越了传统3D SIFT描述符.但是,这种算法对于更复杂的数据集以及更广泛的应用仍需要进一步改进.Yao等[14]提出了一种计算高效的、基于模糊逻辑系统的方法用于人体动作识别,在同等条件下,取得了优于隐马尔可夫模型等传统非模糊系统的人体动作识别效果.朱岩等[15]在稀疏编码的框架下,对局部3维时空梯度特征进行编码,结合迁移学习的思想,改进了Bag-of-Words模型对人体动作进行识别,分别在KTH数据集以及UCF体育数据集上取得了较好的识别效果.姬晓飞等[16]提出了一种具有一定视角鲁棒性的动作识别方法,充分考虑了时间维度上视频的动态特性,将有利于人体动作识别的兴趣点描述算子的局部特征和运动的光流特征结合起来,忽略多余信息,大大提高了算法的有效性以及适应性.但是,该算法并不能解决多视角问题,因此,其应用具有一定的局限性.叶喜勇等[17]提出了基于稀疏表示的层次化动作识别模型,通过查找测试样本和训练样本之间的最小残差实现人体动作的识别,并且取得了良好的成果.由于该算法

202机器人2016年3月

不受场景信息的影响,因此具有灵活性高、实时性

好等特点.其缺点是采用已经分割好的数据,不能

动态地进行人体动作识别.

综上所述,近几年在人体动作识别的研究取得

了显著的科研成果,但同时也存在着一系列引言中

涉及的潜在问题需要解决.

本文利用Kinect获取的关节点数据作为动作识

别的输入,克服了以往动作识别研究中受光照影响

显著的缺点;另外,采用层次性分类算法框架对不

同类型的动作提取不同特征,有效地模拟人在动作

认知过程中体现的选择性关注的特点;最后,引入

时序直方图建模具有丰富时序信息的人体动作,以

达到较好的动作识别效果.

3系统整体设计(Overall system design)

3.1实验平台的搭建

系统的硬件环境为:PC机1台,CPU为

Core TM2、主频2.40GHz、内存4.00GB,微软

Kinect体感设备.软件开发环境为:Windows7操

作系统、VS2010软件开发平台、C++软件开发语

言、OpenCV开发平台.系统的整体框架如图1所

示,将实验系统划分为4个模块,分别为数据采

集模块、信息显示模块、数据存储模块以及动作识

别模块.所涉及的动作主要包括5类:打电话、喝

水、使用遥控器、起立和坐下.基于这个实验系统,

各模块独立实现相应的功能,互不干扰.

傼??

僂??

??? ?? ?

??

??仁

? ?

?

??

? ??

? 图1系统的整体框架

Fig.1

The overall framework of the system

3.2系统功能模块的实现

根据各部分功能的特点可将上述4个功能模块大致分为以下3个部分.

3.2.1数据采集以及信息显示模块

数据的采集模块是系统的核心部分,原始数据采集调用系统封装好的Kinect功能接口即可实现.采集到的数据以及彩色图像均通过窗口进行显示.3.2.2数据存储模块

将采集到的数据按帧进行存储,便于数据的重复利用.本文采用文件流的方式对数据进行存储.人体关节点数据的存储如图2所示.

图2人体关节点数据

Fig.2Data of human joint point

为了便于数据的处理以及重复利用,本文将采用连续存储的方式对数据进行存储,将不断获得的信息流依次输出并存入文档,如图2所示,每帧数据之间采用空行分开.

3.2.3动作识别模块

该部分的功能是通过算法的设计以及实现,对数据进行加工处理,完成人体动作的识别.该部分是本文讨论的重点内容,本文后续部分给出了详细的算法,其主要思想是采用层次化的基于关键点序列的动作识别方法:第1层次,利用中心关节点进行动作粗分类,将动作分为上肢动作和躯干动作.第2层次,分别对这两类动作,构建基于关键点序列的动作识别方法.

4基于中心关节点的动作粗分类(The rough classi?cation of the actions based on the central joint)

?? 学

?? 学

к?

к? ?

?

??

?? ≤

≤ ?

? ??

?? л

л

图3人体动作层次化结构框图

Fig.3Hierarchical structure diagram of human action

根据动作的特征,将动作粗分类成2大类,即上肢动作和躯干动作,人体动作层次化结构框图如图3所示.打电话(call)、喝水(drink)、拿遥控器

第38卷第2期尹建芹,等:基于关键点序列的人体动作识别203

(remote)这些上肢动作,在一般情况之下是与下肢无关的,主要是与右手的关节点相关,同理,起立(up)、坐下(down)这些躯干动作一般情况下与上肢无关,主要的区分在于躯干位置的变化.但是,在现实场景下,人体的动作是很复杂的,比如有些人喝水的时候,同时做着行走或者坐下等动作,存在动作的耦合现象.为了简化问题,本文不考虑动作的耦合问题(但本算法稍作调整后即可用于存在耦合动作的情况).

一般情况下,对于中心关节点(即模块中返回的HIP CENTER,称之为中心关节点)来说,躯干动作的变化程度远大于上肢动作的变化程度.因此,能够根据中心关节点变化的缓慢程度对动作进行粗分类.由于方差能够反映数据波动情况,因此,可以通过计算中心关节点的速度向量求得其方差,利用方差来判断中心关节点变化的缓慢程度.首先,根据已知标签的训练样本进行学习,得到阈值d,并将其作为中心关节点变化缓慢程度的判断依据,学习阈值d的流程如下:

Step1:对所有躯干动作的训练样本,首先抽取中心关节点的轨迹数据,并求得该轨迹的速度向量,计算相应的方差δ:

δ=[δ1,δ2,···,δN](1)其中,N表示所有躯干动作的训练样本数.

Step2:求δ1,δ2,···,δN的最小值,并将其作为阈值d的初始值,即d=min{δ1,δ2,···,δN}.Step3:设定需要期望正确分类的准确率,例如0.95.初始化实际的精度p=0.

Step4:对所有训练样本,分别抽取中心关节点的轨迹数据,并求得该轨迹的速度向量,计算相应的方差δ′.若δ′

Step5:分别统计上肢动作、躯干动作以及总体动作的准确率,分别设为p1、p2、p.

Step6:若p>0.95,则停止循环,阈值d训练完成;否则,需要调整阈值d的值,继续训练.具体调整方案如下:若p1>p2,说明阈值d设置得过大,导致判错,则d=d?0.1;否则,d=d+0.1.Step7:继续执行Step4,直到满足p>0.95的循环停止条件.

基于上文的研究,阈值d学习完成之后,接着能够对动作进行粗分类,具体的算法过程如下.首先,提取中心关节点的数据:

T=[t1,t2,···,t m](2)其中,m表示该样本的帧数,该轨迹设为T,t i(i= 1,2,···,m)代表该样本轨迹的一帧.

然后,计算轨迹T的速度向量V:

V=[t2?t1,t3?t2,···,t m?t m?1](3)最后,计算速度向量V的方差δ′′,结合上文学习得到的阈值d,若δ′′ d,则提取中心关节点数据作为该动作的特征向量;否则,提取右手的关节点数据作为特征向量.流程见图4.

??

? ??

??? ?V

??

???

??

? ? d

? ? ??

?? ?

? ? ??

?? ?

??

?? ?

??

?? ?

δ′′

δ′′?d?

图4特征提取流程图

Fig.4The?ow chart of the feature extraction

5关键点生成(Generation of the key points)

粗分类完成后,需要对每一类中的动作进行细分类.由于获取的轨迹点是一系列的关节点在空间中的坐标值,而具体的坐标值对于行为的认知来说,增大了分析的难度,因此,首先提取轨迹的关键点,并基于关键点序列构建反映轨迹时序关系的时序直方图,进行人体动作识别.C均值是典型的基于欧氏距离的聚类算法,采用欧氏距离的大小作为相似度的指标,挨得越近的对象,其相似度也越大,C均值的结果是把紧凑且独立的对象作为最终的目标.设数据集为X={x i}n i=1,随机初始化n1个

类心,即C={c1,···,c n

1

}.将集合X和集合C的数据作为输入.采用距离最近原则将数据集X进行分类,并更新类心,得到新的类心.将新的类心作为初始类心C.不断地重复此过程,直到新的类心不再发生变化.将这新的类心作为输出,即输出

C′={c′

1

,c′

2

,···,c′

n1

}.则称点集C′为数据集X的关键点.

将动作粗分类为2大类,提取了相应的动作特征向量.分别将上肢动作和躯干动作的轨迹点数据

204机器人2016年3月

作为输入,最后分别输出上肢动作和躯干动作的n 个关键点,并随机地对这些关键点用数字1~n 进行编号,便于以下实验的研究.对于上肢动作,由于上肢动作的鉴别信息较多地存在于动作的终止阶段,而起始阶段区分信息不明显,因此,起始阶段取1个关键点,进行阶段和终止阶段各取2个关键点描述,共5个关键点,因此取n 1=5,其关键点如图5所示;对于躯干动作,起始阶段和终止阶段各取1个关键点,进行阶段取2个关键点,取n 1=4,聚成4个关键点,如图6所示.

y

图5

上肢动作的关键点

Fig.5

Key points of the upper limb action

y

图6躯干动作的关键点

Fig.6Key points of the body action

6

时序直方图(Temporal order histo-gram )

在定义了关键点之后,关键点在动作片断中出现的频数一定程度上可以反映动作信息,但会忽略动作过程中体现的时序信息.由于某些动作只在时序上有区别,例如起立和坐下这两个动作的关键点频数基本一致,而在时序上是个逆转,因此,这些动作与时序息息相关.图7给出了起立和坐下两个动作的关键点频率(只是单纯地统计每个关键点在动作片段中出现的次数,并进行了归一化).由图7

可见,这样处理出来的数据丢失了时序的信息,很可能是很多不同排列的轨迹点序列(只要每个轨迹点出现的次数相同)统计出来的结果对应着同一个直方图.因此,在不考虑时序信息的情况下,这两个动作是分不开的.为了引入时序信息,给出时序

直方图的定义.

??

仁?

(a)起立

??

仁?

(b)坐下

图7

关键点频率

Fig.7

The frequencies of key points

6.1时序直方图

定义:时序直方图.将n 个按次序出现的关键点作为横坐标,将其出现的频数进行归一化之后作为纵坐标,如此构成的直方图称为n ?1阶时序直方图.n ?1阶时序直方图建模的是n ?1阶时序关系.

这里的时序直方图与文[9]中定义的时序直方图不同,文[9]中提出的时序直方图中,不管在当前状态停留的时间多长,只触发1次传感器.而在本文当中,由于采用的是Kinect 传感器,在当前状态的所有时间内,一直触发传感器.

图8给出了起立和坐下1阶时序直方图,加入了一定的时间信息,统计的是轨迹中相邻两个关键点的信息.其中,图(b)和图(d)横轴为[12,13,14,21,23,24,31,32,34,41,42,43],由不同的关键点按次序出现得到.虽然图(a)和图(c)中统计的这两个动作的单一关键点组成的时序信息基本相同,但是,由图(b)和图(d)所示,这两个动作不同关键点组成的时序信息是不一样的.因此,图(b)和图(d)的信息对于区分这两个动作非常关键.像这样的时序直方图,虽然不能完全地消除歧义,但能够大大减小动作歧义.

6.2时序直方图的归一化

由于所用传感器不同于文[9]中的传感器,从而导致单一关键点组成的时序信息远远超过不同关键点组成的时序信息,如果将单一关键点组成的时

第38卷第2期尹建芹,等:基于关键点序列的人体动作识别205

序信息和不同关键点组成的时序信息直接联结在一起进行归一化的话,将会淡化不同关键点组成的时序信息.然而,这些不同关键点组成的时序信息对于分类问题非常重要.因此,必须将单一关键点组成的时序信息和不同关键点组成的时序信息分别进行归一化处理.然后将归一化之后的时序信息进行联结得到最终的时序直方图.

а ??

仁?

н ??

(a) 起立单一关键点时序(b) 起立不同关键点 1 阶时序仁?

а ??

н ??

(c) 坐下单一关键点时序(d) 坐下不同关键点 1 阶时序

图81阶时序直方图

Fig.8First order temporal histogram

7

动作基准向量的提取(Extracting the baseline vector of action )

7.1

上肢动作基准向量的提取

得到上肢动作的关键点后,将每个轨迹点映射到关键点上,用关键点序列表示轨迹.

具体的识别过程如下:

设C 均值聚类分析得到5个关键点,并随机地给这些关键点进行编号,写入集合C 1={x 1,x 2,x 3,x 4,x 5}.设测试样本集为{z i }n i =1,其中每一个测试样本都是一系列轨迹点的组合,即z i =[x ′1,x ′2,···,x ′n ],其中每一个x ′i (i =1,2,···,n )代表的是一个点,n 表示的是该测试样本的长度,即帧数.

分别计算该测试样本的每一个轨迹点到C 1中5个关键点的距离:

d i j (x i ,x ′

j )=√(x i ?x ′j )T (x i ?x ′j ),(4)

i =1,2,···,5;j =1,2,···,n

根据k 近邻的原则将x ′i (i =1,2,···,n )映射到

相应的关键点上.因此,最终得到的轨迹将会是用相应关键点序列表示的轨迹.分别统计不同动作的所有训练样本关键点序列相邻两点的信息,将这些信息分为单一关键点组成的时序信息和不同关键点组成的时序信息,单一关键点时序信息如[11,22,33,44,55],不同关键点1阶时序信息如[12,13,14,15,21,23,24,25,31,32,34,35,41,42,43,45,51,52,53,54].

单一关键点时序信息向量:

x 11=[x ′11,x ′22,x ′33,x

′44,x ′

55]

(5)

а ??

仁?图9“打电话”单一关键点时序直方图

Fig.9Temporal histogram of single key points of action “call”

н ??

仁?图10“打电话”不同关键点1阶时序直方图

Fig.10First order temporal histogram of multiple key points of

action “call”

其1阶时序直方图如图9所示.不同关键点1阶时序信息向量:

x 12=[x ′12

,x ′

13,x ′14,x ′15,x ′21,···,x ′53,x ′54](6)

206机器人2016年3月

其1阶时序直方图如图10所示.将向量x 11、x 12连接起来即可得到动作call 的基准向量y 1,即y 1=[x 11,x 12].

同理,可以分别得到动作drink 和remote 的基准向量y 2和y 3.

7.2躯干动作基准向量的提取

第5节得到了躯干动作的4个关键点以及所对应的关键点序列.同理,采用7.1节的方法分析躯干的关键点序列,图11、12分别为down 这一动作单一关键点时序信息直方图和不同关键点1阶时序信息直方图.横轴分别为{11,22,33,44}和{12,13,14,21,23,24,31,32,34,41,42,43}.将单一关键点时序信息向量和不同关键点1阶时序信息向量串起来得到动作down 和up 的基准向量y 4和y 5.

а ??

仁?图11“坐下”单一关键点时序直方图

Fig.11

Temporal order histogram of single key points of action

“down”

н ??

仁?图12“坐下”不同关键点1阶时序直方图

Fig.12First order temporal histogram of multiple key points of

action “down”

8动作的识别(Recognition of the actions )

由上文的介绍可知,得到的5个动作的基准向量为y 1,y 2,y 3,y 4,y 5,对每一个测试样本,根据粗分类提取的特征向量,若提取的是躯干的关节点,则

认为是躯干动作,则将轨迹映射到躯干的关键点上,分别统计该轨迹的单一关键点时序信息和不同关键点1阶时序信息,然后分别将这些单一关键点时序信息和不同关键点1阶时序信息进行归一化,并把得到的相应向量串起来得到代表该测试样本的一个16维的向量.最后,采用k 近邻原则进行动作的识别.否则,认为该动作属于上肢动作,采用相同的方法对动作的轨迹进行处理,得到代表该测试样本的一个25维的模板向量.然后采用k 近邻原则实现人体动作的识别.

9

实验的结果与分析(Experimental results and analysis )

参考文[10]的设置,对每种动作采集了50组,共计250组动作序列.其中,每种动作采用30组样本建立标准模板库,即获取动作基准向量.对其余样本进行测试,得到粗分类和最终分类的混淆矩阵结果分别如表1和表2所示.其中,单样本的平均识别时间是2.584ms ,基本上能够满足人体动作识别的实时性要求.

表1粗分类结果

Tab.1Rough classi?cation results

上肢动作躯干动作

pre /%ca 200100dr 19195re 200100up 020100dn

20

100

表2识别的结果Tab.2Identi?cation results ca dr re up dn pre /%ca 200000100dr 01900195re 002000100up 000200100dn

20

100

在表1、表2中,为简化起见,对5种动作进行了缩写,如打电话(call )→ca 、喝水(drink )→dr 、拿遥控器(remote )→re 、起立(up )→up 、坐下(down )→dn .同时,准确率(precision )→pre .由表2可见,本文提出的算法针对相似性比较大的动作,如喝水和打电话,取得了较好的识别效果;同时,对于只在时序上存在逆反的动作,如起立和坐下,同样取得了较好的动作识别效果.粗分

第38卷第2期尹建芹,等:基于关键点序列的人体动作识别207

类的结果如表1所示,结合表1、表2,能够分别分析动作粗分类以及细分类的识别性能.例如,对于喝水这一动作,有一个样本被错误地识别成了坐下.由于粗分类是已经完成了上肢动作以及躯干动作分类的,细分类在其基础上进行,因此,造成该错误识别的原因是粗分类的时候出错.

? ? ?3? ?

图13识别结果分析

Fig.13The analysis of the identi?cation result

另外,对每种动作的accuracy、recall及preci-sion进行了评价,结果如图13所示.由图13识别结果分析可知,每一个动作的accuracy、recall以及precision均达到95%以上,再一次证明了该动作识别方法取得了较好的识别效果.

10结论及展望(Conclusion and outlook)本文主要目的在于克服光照、视角及不同动作的不同实现等对人体动作识别的影响,通过利用Kinect获得的关节点数据,模拟人在进行动作认知过程中的层次化认知过程,进行人体动作识别.贡献主要集中于2个方面:一方面,提出了层次化的动作分类方法,从而可以在粗分类得到的结果下,针对不同类的动作选择不同的关注点进行人体动作识别;另一方面,引入时序直方图的概念灵活地建模复杂性的动作,可以取得较好的动作识别结果.相关实验结果表明,该方法对于相似性比较大而且与时序密切相关的动作区分性比较好,取得了较好的识别效果.尽管文中的算法是针对于不存在耦合现象的简单动作提出的,但在存在耦合的情况下,可以对文中算法作简单的修改以适应耦合动作发生的情况.另外,由于算法采用的是关键点序列,因此,对轨迹的长度不敏感,具有使用灵活的优点.但是,本文的数据涉及的范围有限,视角及尺度变化较小,同时,对于一些复杂问题没有过多考虑,如习惯使用左手操作物品的人.对于这些更为复杂的数据,该算法的有效性以及适用性还需要进一步论证.如何解决这些潜在的问题,以及提高该算法的有效性以及适用性将会是我们下一步研究的目标.

参考文献(References)

[1]魏莱.基于关节点的人体动作识别及姿态分析研究[D].北

京:北京邮电大学,2014.

Wei L.The study of human action recognition and pose analysis

based on joint points[D].Beijing:Beijing University of Posts

and Telecommunications,2014.

[2]胡琼,秦磊,黄庆明.基于视觉的人体动作识别综述[J].

计算机学报,2013,36(12):2512-2524.

Hu J,Qin L,Huang Q M.Overview of human action recogni-

tion based on vision[J].Chinese Journal of Computers,2013,

36(12):2512-2524.

[3]Wang H,Kl¨a ser A,Schmid C.Dense trajectories and mo-

tion boundary descriptors for action recognition[J].Internation-

al Journal of Computer Vision,2013,103(1):60-79.

[4]Hoai M,Zisserman A.Improving human action recognition us-

ing score distribution and ranking[M]//Lecture Notes in Com-

puter Science,vol.9003.Berlin,Germany:Springer-Verlag,

2015:3-20.

[5]顾颖媛.稀疏表示在基于视频的人体动作识别中的应用研

究[D].北京:清华大学,2013.

Gu Y Y.Application of sparse representation in human motion

recognition based on video[D].Beijing:Tsinghua University,

2013.

[6]Simonyan K,Zisserman A.Two-stream convolutional networks

for action recognition in videos[C]//Advances in Neural Infor-

mation Processing Systems.Montreal,Canada:Morgan Kauf-

mann,2014:568-576.

[7]李红波,丁林建,冉光勇.基于Kinect深度图像的人体识

别分析[J].数字通信,2012(4):21-26.

Li H B,Ding L J,Ran G Y.Analysis of human body recogni-

tion based on Kinect depth image[J].Digital Communication,

2012(4):21-26.

[8]Warade S,Aghav J,Claude P,et al.Real-time detection and

tracking with Kinect[C]//12th IEEE International Conference

on Computer and Information Technology.Piscataway,USA:

IEEE,2012:86-89.

[9]尹建芹,田国会,周风余.智能空间下基于时序直方图的

人体行为表示与理解[J].计算机学报,2014,37(2):470-

479.

Yin J Q,Tian G H,Zhou F Y.Human behavior representa-

tion and understanding based on temporal histogram in smart

space[J].Chinese Journal of Computers,2014,37(2):470-479.

[10]田国会,尹建芹,韩旭,等.一种基于关节点信息的人体

行为识别新方法[J].机器人,2014,36(3):285-292.

Tian G H,Yin J Q,Han X,et al.A new method of human be-

havior recognition based on joint point information[J].Robot,

2014,36(3):285-292.

(下转第216页)

216机器人2016年3月

[19]Cardou P,Bouchard S,Gosselin C.Kinematic-sensitivity in-

dices for dimensionally nonhomogeneous Jacobian matrices[J].

IEEE Transactions on Robotics,2010,26(1):166-173. [20]Gosselin C,Angeles J.A global performance index for the kine-

matic optimization of robotic manipulators[J].Journal of Me-chanical Design,1991,113(3):220-226.

[21]Wang W,Wang W D,Dong W,et al.Dimensional optimiza-

tion of a minimally invasive surgical robot system based on NSGA-II algorithm[J].Advances in Mechanical Engineering, 2015,7(2):No.1687814014568541.作者简介:

王伟(1984–),男,博士生.研究领域:医疗机器人,术前规划.

王伟东(1978–),男,博士,副教授.研究领域:医疗机器人,移动机器人,特种机器人.

董为(1978–),男,博士,副教授.研究领域:机器人技术与智能机电系统.

(上接第207页)

[11]陈曦,孟庆虎.骨架关节点跟踪的人体行为识别方法[J].

河南科技大学学报:自然科学版,2015,36(2):43-48.

Chen X,Meng Q H.Human behavior recognition method for skeleton joint tracking[J].Journal of Henan University of Sci-ence and Technology:Natural Science Edition,2015,36(2): 43-48.

[12]尹建芹,田国会,姜海涛,等.面向家庭服务的人体动作

识别[J].四川大学学报:工程科学版,2011,43(4):101-107.

Yin J Q,Tian G H,Jiang H T,et al.Human action recognition for family services[J].Journal of Sichuan University:Engineer-ing Science Edition,2011,43(4):101-107.

[13]Ji X F,Wu Q Q,Ju Z J,et al.Study of human action recogni-

tion based on improved spatiotemporal features[J].International Journal of Automation&Computing,2014,15(5):500-509. [14]Yao B,Hagras H,Alhaddad M J,et al.A fuzzy logic-based

system for the automation of human behavior recognition using machine vision in intelligent environments[J].Soft Computing, 2015(19):499-506.

[15]朱岩,赵旭,刘允才.基于稀疏编码和局部时空特征的人

体动作识别[C]//第十五届全国图象图形学学术会议论文集.北京:清华大学出版社,2010:237-241.

Zhu Y,Zhao X,Liu Y C.Human action recognition based on sparse encoding and local temporal and spatial features[C]//Pro-ceedings of the15th National Symposium on Image and Graph-ics.Beijing:Tsinghua University Press,2010:237-241. [16]姬晓飞,王策,李一波.基于一种视角鲁棒性特征的人

体动作识别方法研究[C]//中国自动化学会控制理论专业委

员会、中国系统工程学会第三十二届中国控制会议论文集(C卷).北京:北京航空航天大学出版社,2013:3877-3881.

Ji X F,Wang C,Li Y B.Research on human action recogni-tion method based on the robust feature of a visual angle[C]// Chinese Society of Automation Control Theory,the Chinese System Engineering Society.The32nd Chinese Control Confer-ence:V ol.C.Beijing:Beihang University Press,2013:3877-3881.

[17]叶喜勇,陶霖密,王国建,等.视角无关的人体躯干动

作识别[C]//第六届和谐人机环境联合学术会议(HHME 2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集.2010.

Ye X Y,Tao L M,Wang G J,et al.A novel view invariant algo-rithm for human main body action recognition[C]//HHME2010, NCMT2010;CHCI2010;PCC2010V ol.2010.

作者简介:

尹建芹(1978–),女,博士,副教授.研究领域:图像处理,模式识别与机器学习.

刘小丽(1993–),女,硕士生.研究领域:模式识别与机器学习.

田国会(1969–),男,博士,教授.研究领域:智能空间与服务机器人.

基于MATLAB的人体姿态的检测课程设计

基于视频的人体姿态检测 一、设计目的和要求 1.根据已知要求分析视频监控中行人站立和躺卧姿态检测的处理流程,确定视频监中行人的检测设计的方法,画出流程图,编写实现程序,并进行调试,录制实验视频,验证检测方法的有效性,完成系统软件设计。 2.基本教学要求:每人一台计算机,计算安装matlab、visio等软件。 二、设计原理 图像分割中运动的运用(运动目标检测) 首先利用统计的方法得到背景模型,并实时地对背景模型进行更新以适应光线变化和场景本身的变化,用形态学方法和检测连通域面积进行后处理,消除噪声和背景扰动带来的影响,在HSV色度空间下检测阴影,得到准确的运动目标。 噪声的影响,会使检测结果中出现一些本身背景的区域像素点被检测成运动区域,也可能是运动目标内的部分区域被漏检。另外,背景的扰动,如树枝、树叶的轻微摇动,会使这部分也被误判断为运动目标,为了消除这些影响,首先对上一步的检测结果用形态学的方法进行处理,在找出经过形态学处理的后的连通域,计算每个连通域中的面积,对于面积小于一定值的区域,将其抛弃,不看做是前景运动目标。 2.2bwlabel函数 用法:L = bwlabel(BW,n) [L,num] = bwlabel(BW,n),这里num返回的就是BW中连通区域的个数。 返回一个和BW大小相同的L矩阵,包含了标记了BW中每个连通区域的类别标签,这些标签的值为1、2、num(连通区域的个数)。n的值为4或8,表示是按4连通寻找区域,还是8连通寻找,默认为8。 四连通或八连通是图像处理里的基本感念:8连通,是说一个像素,如果和其他像素在上、下、左、右、左上角、左下角、右上角或右下角连接着,则认为他们是联通的;4连通是指,如果像素的位置在其他像素相邻的上、下、左或右,则认为他们是连接着的,连通的,在左上角、左下角、右上角或右下角连接,则不认为他们连通。

人体运动规律

教学内容 1、人的运动规律 (1)人的骨骼:在动画片中,表现最多的是人物动作及拟人化角色的动作(见图1) (2)人的关节:人的主要关节位于腰部,肩部,肘部,腕部,股部,膝部,踝骨,颈部(见图1) (图1)运动中人的骨骼和关节 (3)人体的重心:人体重量的集中作用点(平衡点)是人体的重心(见图2) (图2)人体重心

(4)动作的表情:动作和表情是重要的动画语言。(见图3) (图3)人物动作与表情 2、人的基本规律性动作 (1)人的走路动作:用脚掌着地,左右两脚交替向前,带动躯干朝前运动(见图4) a.人走路动作的基本规律 b.头部的上下波动 c.手臂的摆动:钟摆定理 (图4)人走路的动态分析 (2)人的奔跑动作: 身体前倾,手臂略呈弯曲状以较大的幅度配合双脚的交替跨步向前摆动,跨步的幅度大于走路时的幅度,膝关节的弯曲度大于走路时的弯曲度,脚抬得较高。(见图5)

(图5)人跑步的动态分析 3、人的头部运动 (1)头部的转动: 以鼻子作为脸部中心点画一直线,当头转动时,由于透视原因,接近正面的一半距离大,远离正面距离小;(见图 6 (图6)头部的转动分析 (2)表情:要具有表演的创作意图(见图7) (图7)人的表情

(3)对白中的口型:欧美的常用口型是A,B,C,D,E,F,偶尔会有G,H日本的常用口型是A,B,C 。(见图8) (图8)角色口型 4、走路画法 走路的基本规律是:左右脚交替向前,带动人的身体向前运动,为了保持身体的平衡,配合双脚的屈伸、跨步、双臂前后摆动。(见图9) (图9)走路示范 5、跑步的画法

(1)奔跑动作的基本规律:身体重心前倾,手臂成弯曲状,奔跑时手臂配合双脚的跨步作前后摆动,双脚跨步的动作幅度较大,膝关节弯曲的角度较大,脚抬得较高,因此头高低的波形运动也比走路明显,在奔跑时,双脚几乎没有同时着地的时间,而是依靠单脚支撑身体的重量,有些快跑动作中间可以有1到2格是双脚同时离地的腾空过程。(见图10) (图10)跑步正面 (2)注意事项:人物前倾的动态应前后保持一致,原画张与动画中割张上半身身体保持一个前倾的姿态。(见图11)

动作识别与行为理解综述

_________________________ 基金项目: 国家自然科学基金资助项目(60673189) 收稿日期: 2008-11-28 改回日期:2008-12-03 第一作者简介: 1940.现为普适计算教育部重点实验室,清华大学计算机系人机交互与媒体集成研究所教授,博士生导师。 目前他的主要研究领域为计算机视觉,人机交互,普适计算计算技术。IEEE 高级会员,CCF 会员。 动作识别与行为理解综述 徐光祐 曹媛媛 普适计算教育部重点实验室 清华大学计算机科学与技术系 北京,100084) 摘 要 随着“以人为中心计算”的兴起和生活中不断涌现的新应用,动作识别和行为理解逐渐成为计算机视觉领域的研究热点。本文主要从视觉处理的角度分析了动作识别和行为理解的研究现状,从行为的定义和表示、运动特征的提取和动作表示以及行为理解的推理方法三个方面对目前的工作做了分析和比较。并且指出了目前这些工作面临的难题和今后的研究方向。 关键词 以人为中心 动作识别 行为理解 中图法分类号:TP391 文献标识码:A Action Recognition and Activity Understanding: A Review XU Guangyou, CAO Yuanyuan (Key Lab of Pervasive Computing, Ministry of Education, Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China) Abstract As the “Human-centered computing ” is getting more and more popular and novel applications are coming up, action recognition and activity understanding are attracting researcher s’ attention in the field of computer vision. In this paper, we give a review of the state in art of work on action and activity analysis, but focus on three parts: Definition of activity, low-level motion features extraction and action representation, and reasoning method for activity understanding. Furthermore, open problems for future research and potential directions are discussed. Keywords human-centered computing, action recognition, activity understanding 引言 计算正渗透和影响到人们生活的各个方面,根据传感器数据来识别和理解人的动作和行为就成为未来”以人为中心的计算”(Human-centered computing)中的关键[1]。其中基于视觉的动作识别和行为理解尤为重要。因为在人之间的人际(interpersonal )交互过程中,视觉是最重要的信息。视觉可以帮助人们迅速获得一些关键特征和事实,如对方的表情、手势、体态和关注点等,这些视觉线索综合起来反映了对方的态度,潜在意图和情绪等信息。未来人机交互和监控中,机器要感知人的 意图很大程度上就需要依靠视觉系统。此外,视觉传感器体积小、被动性和非接触式的特点,使得视觉传感器和视觉信息系统具备了无所不在的前提。近年来,在对计算机视觉提出的层出不穷的新要求中,行为理解是一个具有挑战性的新课题,在诸如智能家居,老年人看护,智能会议室等应用中都起着至关重要的作用。它要解决的问题是根据来自传感器(摄像机)的原始图像(包括图像序列)数据,通过视觉信息的处理和分析,识别人体的动作,并在上下镜(context)信息的指导下,理解人体动作的目的、所传递的语义信息。行为理解作为近几年开始兴起的研究,正在逐渐获得越来越多的关注。 人体检测、定位以及人体的重要部分(头部,

基于骨骼数据的人体行为识别分析

基于骨骼数据的人体行为识别 摘要 人体动作姿态识别是计算机视觉研究领域中最具挑战的研究方向,是当前的研究热点。对人体动作姿态进行自动识别将带来一种全新的交互方式,通过身体语言即人体的姿态和动作来传达用户的意思,如在机场、工厂等喧闹的环境下,采用手势、动作姿态识别等人机交互技术能够提供比语音识别更加准确的信息输入。总之,在智能监控、虚拟现实、感知用户接口以及基于内容的视频检索等领域,人体动作姿态的识别均具有广泛的应用前景。该文首先简单介绍了人体动作姿态序列的分割,然后对人体动作姿态识别的方法进行了分类介绍,并对一些典型的算法的研究进展情况及其优缺点进行了重点介绍。 关键词:人体动作姿态识别; 人工智能; 隐马尔可夫模型; 动态贝叶斯网络; 模板匹配前言 人体姿态识别是计算机视觉的一个重要研究方向,它最终目的是输出人的整体或者局部肢体的结构参数,如人体轮廓、头部的位置与朝向、人体关节点的位置或者部位类别。姿态识别的研究方法应该说,几乎涵盖了计算机视觉领域所有理论与技术,像模式识别、机器学习、人工智能、图像图形、统计学等。到目前为止,已经有众多识别方法被提出,并且也取得了许多重要的阶段性的研究成果,但是以往的方法都是基于普通光学图像,比如常见的RGB 图像,这类图像容易受光照、阴影等外界变化的影响,尤其在环境黑暗的情况下无法来识别人体姿态,并且由于人体关节自由度大,及人的体型、着装较大差异性,常导致姿态识别系统识别率低。尽管有研究者利用多个摄像机获取采集的图像来获取人体深度信息以克服以上问题[1],但是该类方法恢复的深度信息不是唯一的,而且计算量非常大,尤其是这种方法要求事先用人工对传感设备进行标定,而在选取场景中的标定物时,往往又会遇到实际环境操作困难的问题。 随着光电技术的快速发展,深度传感设备的成本逐渐降低,人们获取深图像的途径及方法也越来越多。该方向的研究也逐渐成为计算机视觉领域的研究趋势。具体原因包括:一方面,深度传感设备不仅操作简单,并且极大简化了普通摄像机的标定过程;另一方面,得到的深度图像由于直接包含了人体的深度信息,能够有效的克服普通光学图像遇到的上述问题。到目前为止,较有影响力的基于该类图像的人体姿态识别算法,应该是 Shotton 等人利用一种深度传感器 Kinect 来实时捕捉人体运动的算法,该算法虽然能够满足人们对识别系统实时性的要求,但其对硬件要求特别高,并且不适合低分辨率图像中的人体关节点提取,容易导致人体骨架扭曲。下文将具体陈述人体运动分析的主要用途和前人在不同时期对这些难题的处理办法。 主题 基于计算机视觉的人体运动分析不仅在智能监控、人机交互、虚拟现实和基于内容的视频检索等方面有着广泛的应用前景,更是成为了未来研究的前瞻性方向之一。Gavrila 总结了它的一些主要应用领域[2,3,4],下面据此对其典型应用做出进一步的介绍。 智能监控(Smart Surveillance) 所谓“智能监控”是指监控系统能够监视一定场景中人的活动,并对其行为行分析和识别,跟踪其中的可疑行为(例如在一些重要地点经常徘徊或者人流密集的场合下突发的人群拥挤等状况)从而采取相应的报警措施。智能监控系统应用最多的场合来自于那些对安全

固定场景下的人体姿态识别

2018.11收稿日期:2018-08-15 当前人工智能技术的热点,固定情景下对于人体姿态识别具有十分重要的研究意义,对于我国实现现代化建设具有一定的推动作用,因此加强技术分析研判就显得十分重要。早在上世纪70年代,我国已经开始了对人体行为分析方面的研究,这些研究对于我国人工智能的发展有了较强的推动作用,在特定情景下或者说在比较标准的场景中分析较为简单的姿态和动作已经成为了可能,但这些工作的开展大多停留在理论的层次,并没有付诸实践,要想将这些分析技术真正应用到实际场景中仍然需要大量的实验进行探索。 1人体姿态识别 人体姿态识别主要在于研究描述人体姿态以及预测人体行为,其识别过程是指,在指定图像或视屏中,根据人体中关节点位置的变化,识别人体动作的过程。人体姿态识别的算法主要分为两类,一是基于深度图的算法,另一类直接基于RGB图像的算法。深度图是指由相机拍摄的图片,其每个像素值代表的是物体到相机XY平面的距离。这种算法的应用容易因采集设备的要求而受限,但基于RGB图像的算法直接通过对红、绿、蓝3个颜色通道的变化以及它们相互之间的叠加来得到的颜色进行识别,不会受到其他因素的干扰限制,因此更具有发展前景,同时也取得了不少成果。目前,即使是在较为复杂的、某种固定的场景中,基于RGB图像的人体姿态估计算法相较于基于深度图的人体姿态估计算法也能达到很好的识别效果。无论是深度图技术还是RGB图像技术,都是通过计算机强大的运算能力进行人体姿态的动作预算,通过这样的方式能够一定程度地实现人工图像的监测,并且能够为人工智能的普及奠定良好的基础。随着我国社会水平的不断提升,人们对于社会生活的质量要求也在不断增加,因此在实际的生活过程中视频监控已经成为人们不可或缺的一种安全措施,基于视频分析的技术要求也越来越高。例如在智能家装,医疗领域及运动分析等行业中都得到了较为广泛的应用,固态场景下的人体姿态识别在各领域起到的作用显而易见。特别是近年来,我国安保工作的加强,对于大城市人口密集流动以及犯罪分子的甄别等都有较强需求。 2人体姿态识别的实现 人体姿态是被主要分为基于计算机视角的识别和基于运动捕获技术的识别。基于计算机视觉的识别主要通过各种特征信息来对人体姿态动作进行识别,比如视频图像序列、人体轮廓、多视角等。基于计算机视觉的识别可以比较容易获取人体运动的轨迹、轮廓等信息,但没有办法具体实现表达人体的运动细节,以及容易存在因遮挡而识别错误等问题。基于运动捕获技术的人体姿态识别,则是通过定位人体的关节点、储存关节点运动数据信息来识别人体运动轨道。相较于计算机视角的人体姿态识别,基于运动捕获技术的人体姿态识别可以更好地反应人体姿态信息,也可以更好地处理和记录运动细节,不会因为物体颜色或被遮挡而影响运动轨道的识别。技术的革新对人体姿态的分析捕捉有较强的辅助作用,并且能够更好地展现动作的细节,对于专业人士进行动作分析的痕迹管理有较高的参考价值。通过良好的运动前景预算能够,在各种计算方法中做出合理的预测,并且在各种环境中的适应能力也能够得到一定程度的加强。由于未来的监控实现的方向是在全领域的视频监控,因此对于用户的特定化要求也应该及时进行技术革新,用户对于技术的需求就是技术革新的发展方向, 固定场景下的人体姿态识别 赵一秾 (辽宁科技大学,辽宁鞍山114000) 摘要:近年来,随着信息技术的发展和智能科技的普及,全球科技变革正在进一步推进,云计算、物联网、大数据和人工智能等技术也在飞速发展,其中,人体姿态识别技术已开始在计算机视觉相关领域中广泛应用。就固定场景下的人体姿态识别做出研究分析。 关键词:人体姿态识别;云计算;人工智能 150

基于视频序列的人体动作识别

密级:学校代码:10075 分类号:学号:20081194 工学硕士学位论文 基于视频序列的人体动作识别 学位申请人:刘涛 指导教师:张欣教授 学位类别:工学硕士 学科专业:电路与系统 授予单位:河北大学 答辩日期:二○一三年六月

Classified Index: CODE: 10075 U.D.C.: NO: 20081194 A Dissertation for the Degree of Master Human Action Recognition Based on Video Sequences Candidate:Liu Tao Supervisor:Prof. Zhang Xin Academic Degree Applied for:Master of Engineering Specialty:Circuits and Systems University:Hebei University Date of Oral Examination:June, 2013

河北大学 学位论文独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得河北大学或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了致谢。 作者签名:日期:年月日 学位论文使用授权声明 本人完全了解河北大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 本学位论文属于 1、保密□,在年月日解密后适用本授权声明。 2、不保密□。 (请在以上相应方格内打“√”)

人体行为识别技术

人体行为识别技术 在计算机视觉领域中,人体运动行为识别是一个被广泛关注的热点问题,在智能监控、机器人、人机交互、虚拟现实,智能家居,智能安防,运动员辅助训练等方面有巨大应用价值。行为识别问题一般遵从如下基本过程:数据图像预处理,运动人体检测、运动特征提取、特征训练与分类、行为识别。着重从这几方面逐一回顾了近年来人体行为识别的发展现状和常有方法。并对当前该研究方向上待解决的问题和未来趋势做了分析。行为理解可以简单地认为是时变数据的分类问题,即将测试序列与预先标定的代表典型行为的参考序列进行匹配。通过对大量行为理解研究文献的整理发现:人行为理解研究一般遵从特征提取与运动表征、行为识别、高层行为与场景理解等几个基本过程。 特征提取与运动表征是在对目标检测、分类和跟踪等底层和中层处理的基础上,从目标的运动信息中提取目标图像特征并用来表征目标运动状态;行为识别则是将输入序列中提取的运动特征与参考序列进行匹配,判断当前的动作处于哪种行为模型;高层行为与场景理解是结合行为发生的场景信息和相关领域知识,识别复杂行为,实现对事件和场景的理解。【2】 1、行为识别的应用 从应用领域的分类来讲,可以将人体运动分析的应用分成如下几个领域: ①智能监控 这里所指的“智能”包含两个方面的含义。一种“智能”是指系统能够在一定的场景中检测是否有人的出现(如通过检测人脸的方法)防止只是简单的通过运动目标检测所造成的错误报警(例如因为动物活动或者刮风摇动树枝等等而造成误报)。另外一种“智能”是指系统能够监视一定场所中人的活动,并对其行为进行分析和识别,跟踪可疑行为(如经常在重要地点徘徊等等行为)从而采取相应的报警措施。通常把报警系统设置于银行、机场、车站、码头、超市、办公大楼、住宅小区等地,以实现对这些场所的智能监控。 ②虚拟现实 跟踪现实世界人的姿态,从而创建一个虚拟的仿真场景,实现人与这个虚拟世界的交互。该领域的具体应用涉及视频游戏、虚拟摄影棚、计算机动画等方面。 ③高级用户接口 指可以通过对用户手势的识别来代替传统的鼠标和键盘输入,从而实现人与计算机之间的智能交互。此外,通过对手势语言的理解,还可以进行聋人与计算机之间的手语交流。 ④运动分析 人体运动分析可以运用于基于内容的视频检索领域。例如可以检索在运动会上单杠比赛中运动员的杠上动作。这样可以节省用户大量的查询视频资料的时间和精力。另外一种应用是用于各种体育项目中,提取运动员的各项技术参数(如关节位置、角度和角速度,等等),通过分析这些信息,可以为运动员的训练提

人体姿态捕捉方法综述

人体姿态捕捉方法综述 XXX (大连理工大学软件学院,辽宁大连116600) 摘要:人体姿态捕捉技术在人机交互和虚拟现实等领域的重要性日益突出,为了满足人们对于高精确度、高效率的动作捕捉技术的需求,科学家从各个方面进行了创新性的尝试。文章介绍了动作捕捉技术发展历史,并给出了其概念和基本组成;并阐述了目前国内外发展现状;其次详细地对主流方案进行优缺点分析;然后结合现实,给出了常见应用领域;最后对动作捕捉技术面临难题进行总结并介绍了发展趋势。 关键词:动作捕捉;虚拟技术;人机交互;算法 Overview of Human gesture capture XXX (Dalian university of technology College of Software,Liaoning Dalian 116600)Abstract:The human body gesture capture technology in human-computer interaction and virtual reality and other areas of importance is day by day prominent, in order to meet people for high accuracy, high efficiency of motion capture technology needs, scientists from all aspects of innovative attempt. This paper introduces the motion capture technology development history, and gives the concept and basic composition; And expounds the current situation of the development at home and abroad; Secondly detail schemes to mainstream advantages and disadvantages analysis; And then combining with reality, gives the common application fields; Finally, the motion capture technology difficulties was summarized and introduced the development trend. Key words: Motion capture ;Virtual technology;Human-computer interaction;Algorithm

自然的人体动作识别

自然的人体动作识别 黄飞跃徐光祐 清华大学计算机科学与技术系,普适计算教育部重点实验室,北京,100084 摘 要:人体动作识别是计算机视觉的一个重要研究课题。目前大多数动作识别的研究都 假设是在特定受限的场景下,即特定的视角、位置、对象、背景和光照条件下工作。其中, 尤以要求特定的视角和位置对实际应用的限制最为严重。本文致力于研究能处理视角和位 置变化并可用于非特定对象的人体动作识别方法。我们把它称为自然的人体动作识别方法。 为此我们提出了"包容形状"的人体表示,这种表示不受视角、位置的变化影响,充分利用了 两个正交摄像机拍摄的轮廓信息以去除由人的身体旋转引起的影响。利用包容形状,我们 取得了非特定人、任意视角下的自然人体动作识别较好的实验结果。同时我们也介绍了该 识别方法在实际智能家居——老人看护系统中的应用。 关键词:自然动作识别;包容形状 1.引言 人体动作识别是计算机视觉里一个活跃的研究方向,有不少综述,力图把以前的相关研究方法进行总结和分类,比如[1], [2], [3], [4]。至今为止,关于动作识别的大多数研究工作都是在特定受限的场景下展开,比如特定的视角、动作人、背景和光照。在这之中,尤以视角和位置的限制最为突出。我们认为要实现自然场景下的动作识别,就必须消除应用条件中的这些限制。为此,我们在这篇论文中,重点研究了动作识别中与视角和位置无关的体态表示,以实现非特定人、任意视角下的自然人体动作识别。 现阶段已经开展了不少视角无关的动作识别研究工作,比如Cen Rao [5],Vasu Parameswaran[6]。但是还有很多问题亟待解决,大多数的方法依赖鲁棒的语义特征点检测或者是点对应,而这些是比较难实现的。 在本文中,我们提出使用了一种“包容形状”的体态表示。在仿射摄像机投影模型的假设下,这种表示对于视角和位置的变化具有不敏感性,同时不需要依靠任何较难提取并且对误差很敏感的语义点检测和点对应。利用这种表示,我们开发了自己的动作识别系统并且把它部署到实际应用:智能家居—老人看护系统中。实验结果表明我们的系统对于非特定人、任意视角和位置下的自然动作有着很理想的识别能力。 资助项目:国家自然科学基金资助项目(60673189,60433030) 联系作者:黄飞跃, Email:hfy01@https://www.360docs.net/doc/6c8850098.html,

学生身体机能变化分析

学生身体机能变化分析 (2015—2016学年度) 学校通过体操练习提高小学生的身体素质身体素质是体质的重要组成部分,是人体在运动中所表现出来的力量、速度、耐力等身体基本状态和功能能力。身体素质的好坏直接反映了人们在日常生活中承受能力的强弱。以2000年国民体质监测数据为依据,分析中国国民身体素质的年龄、性别、生活区域(限南北方)和城乡的现状和变化规律,从而得出中国人身体素质特征。耐力素质是指人体长时间进行肌肉活动时抗疲劳的能力。耐力素质是人体各器官系统机能和心理素质的综合表现,也是人的体质强弱的重要标志。发展耐力素质可以有效地提高人体呼吸系统和心血管系统的功能,改善新陈代谢水平,增强抗疲劳的能力,还可以培养坚毅、顽强等优良的心理品质。12分钟跑是国际上流行的一种运动方式,对于发展有氧耐力,提高心血管功能的效果较好。跑完12分钟,根据自己跑的距离,再查一下评分表,就可以知道自己的有氧代谢能力水平。耐力锻炼可分为有氧耐力和无氧耐力。有氧耐力运动包括长跑、游泳、登山、健美操等;无氧耐力运动包括爆发运动,如短跑、跳高、跳远等。爆发力较差的人应注意缩短运动距离。以长跑为例,可以从每天500米开始,逐渐过渡到800米、1000米等。指人体完成某一动作的快速能力。提高动作速度的锻炼方法有: (1)减小练习难度,加助力法。如牵引助力跑步或游泳、顺风跑、下坡跑、顺水游、推掷较轻的器等。(2)加大练习难度,发挥后效

作用法。如负重跳或推掷超重器械练习后,紧接着做跳跃或推掷标准器械的练习。(3)时限法。按预定的音响节拍频率完成动作,以改变练习者的动作频率和速度。是指在作周期性动作中,单位时间内人体快速移动的能力。提高动作速度是提高位移速度的基础,并与四肢肌肉的爆发力密切相关。通常采用下列方法: (1)快速跑。如短距离用最快速度重复跑、让距离追逐游戏、短距离游泳、速滑等。 (2)加速动作频率的练习,如快频率小步跑、快速摆臂练习等。(3)发展下肢的爆发力。如负重跳、单脚跳、跨步跳等。通过慢跑锻炼身体素质柔韧素质是指关节活动的幅度及相关肌肉、韧带等软组织的伸展性和弹性。发展柔韧素质,有利于正确地掌握各项运动技术,在突然用力的情况下,避免损伤肌肉、韧带等软组织。发展柔韧素质的方法:主要是采用加大动作幅度,即拉长肌肉、肌腱、韧带和皮肤的练习。所有的柔韧练习至少连续做5~10次,动作幅度应逐步加大,身体各部位的柔韧性要交替进行,并需持之以恒。当软组织被拉长之后,肌体感到酸、胀、痛时应坚持8~10秒,这样需重复练习8~10次,可以收到良好的效果。在每次锻炼过程中,动力拉长练习一般控制在15~25个之间,每个练习以7~30次之间为宜,注意柔韧练习总的时间不宜过长。

运动技术分析与诊断复习题全解

运动技术分析与诊断复习题 一、填空题 1根据转动运动中角量与线量的关系,要增加排球运动中扣球的速度,主要应增加运动员上肢的和角速度。 2通过拍摄运动技术录像资料,然后在录像资料上获取运动技术数据的方法称之为。 3在研究人体运动时,为了突出主要矛盾,需要把人体和器械近似地看成质点或。 4在运动技术诊断过程中,最后需要通过工作对前面所做的工作进行检查。 5人体的越大,则惯性越大。 6掷铅球的最佳抛射角一般小于45度,它取值的大小与和空气阻力两个因素有关。 7测力台测得的“F-t曲线”与t轴所包络的面积值表示的大小。 8根据斜抛运动公式,影响投掷成绩的主要因素是和出手角度 9物体产生运动状态改变的基本原因是由于力的作用,但是当物体进行转动运动时,除了有力的作用存在以外,还需要有的存在。 10如果运动员采用的运动技术动作符合他的个人特点,就能帮助他更好的扬长避短,那么该项技术动作对于他而言称之为。 11跳高用的海绵垫主要用途是延长,以减少冲力。 12在人体运动的平衡动作中,人体的支撑面大就意味着。 13跳远当人体处于腾空状态时,若忽略空气阻力,其水平方向的不变。

14曲线运动属于的基本运动。此时,我们将人体运动看做是。 15滑雪运动员从斜坡上滑下时,他受到的作用力有重力、地面支撑支作用力和。 16当物体所受合外力为零,而合外力矩不为零时,物体将发生运动。17力的效应有内效应和外效应两种,力作用的效应表现为使物体形状发生变化。 18利用运动技术录像资料可以确定完成动作的时间,主要是与有关19物体运动是指物体间的发生了变化。 20滑雪运动员从斜坡上滑下时,他受到的作用力有重力、地面支撑支作用力和。 21人体不发生倾倒的基本条件是_______________。 22是影响物体转动量变化大小的根本原因。 23研究力在一定时间内的累积效应采用的是。 24在体育运动中,人体重心位置可随的变化而变化。 25人体转动时,其惯性大小的影响因素有质量和。 26省力杠杆在人体关节中分布较少,比较典型的是踝关节在做提踵动作时表现为 27人体运动系统主要由骨杠杆组成,在三类杠杆中在人体运动系统中比较少见。 28挺身式跳远的空中动作中,腿、手臂和躯干的运动应遵循原理。 29是描述转动运动规律的基本原理。

浅谈运动动作的解剖学分析

浅谈运动动作的解剖学分析 石建东 (河南大学体育学院) 摘要:作育动作的解剖学分析是体育科研人员必须熟练掌握的基本技能之一,也是高校体育专业学生学习运动解剖学的重点和难点。其目的是从人体结构的角度分析运动动作的规律性,为学习和提高动作质量提供理论依据。 关键词:运动动作;解剖学分析 引言:运动动作虽然有多种多样,但从人体结构角度分析,它具有一定的规律性。任何动作都是以肌肉收缩为动力,牵引骨骼,围绕关节而运动的。骨与关节是运动的被动部分,肌肉则是主动部分。肌肉在人体运动中处于重要位置。分析运动动作时,其重点为肌肉。因此,在进行动作分析之前,必须先了解肌肉的功能。 1.运动中肌肉状态的描述 肌肉由许多肌纤维构成。在做动作时,肌纤维可以缩短,也可以被动地伸长,还可以处于既不缩短也不伸长的状态。肌纤维处于缩短状态时所做的工作叫做克制工作,这是运动动作中较常见者,如三角肌纤维收缩就可使两臂侧平举。肌纤维处于伸长状态时所做的工作叫退让工作,在负重的情况下缓慢地屈肘关节,使上臂后面之肱三头肌纤维被拉长时所做的工作,就属此类。做克制工作和退让工作时,肢体是处于运动的状态,所以这种产生运动的工作又称为动力工作。与此相反的另一种工作为静力工作,即肌纤维长度不变,既不缩短也不伸长,可是肌肉的紧张程度(张力)增加,如两臂保持侧平举时,三角肌纤维长度不变,但其张力增加,以克服两臂下垂的重力,就属此类。 每个关节的运动,都不是单纯地由一块肌肉来完成,而是由一群肌肉完成的。而在这一肌群中各个肌肉所起的作用又不完全一样,其中直接完成动作的肌肉叫原动肌,与其作用相反的肌肉叫对抗肌。例如屈肘时,上臂前面的肱二头肌、肱肌和前臂外侧的肱桡肌是屈肘的原动肌,而上臂后面的肱三头肌是屈肘的对抗肌,其肌纤维被拉长,但保持一定的紧张度,使屈肘时的原动肌在收缩过程中免于因动作过猛而受伤。有时在做某个动作时,只需一个关节运动,要求邻近的关节固定不动。以便使活动这个关节的肌肉能充分发挥力量。这种使邻近关节固定不动的肌肉,叫固定肌。如用力屈肘时要求肩关节固定,所以肩关节周围的肌肉则称为固定肌。 在分析运动动作时除了要注意肌肉收缩力以外,还要注意重力和摩擦力等。这些力产生于身体外部,因而称为外力。肌肉收缩力产生于身体内部,所以称为内力或肌力。内力和外力往往同时作用于人体,其作用的方向可以相同,也可以相反。 如果在肢体上两种力的方向相反,肌力大于外力时,肢体则朝着与外力相反的方向运动。例如作高抬腿跑时,大腿于髋关节处做向上屈的动作,其原动肌就是与重力相反的一侧的髂腰肌、股直肌等若负重蹲起时,身体需由蹲位伸直向上,这时为了克服杠铃和身体各部分向下运动,则蹲起的原动肌主要为臀大肌、股四头肌和小腿三头肌如果作用于肢体的两种力的方向一致,肢体运动速度则快,其原动肌则是位于肢体运动方向同一侧的肌群。例如,排球运动员在跳起正面扣球时,上肢在肩关节处作伸与内收动作,其重力也有使上肢向下的作用,所以上肢内收和伸的速度要超过重力向下的速度。这时扣球动作的原动肌,就是使上臂在肩关节处伸和内收的肌群,即胸大肌、背阔肌和三角肌等。如果作用于肢体时两种力的方向相同,而肢体运动速度慢于重力,则原动肌是位于肢体运动方向相反的一侧的肌群。例如在双

相关文档
最新文档