基于骨骼数据的人体行为识别分析

合集下载

基于人体骨架的动作识别算法研究与实现

基于人体骨架的动作识别算法研究与实现

基于人体骨架的动作识别算法研究与实现基于人体骨架的动作识别算法研究与实现摘要:随着人工智能技术的发展,人体动作识别在许多领域得到广泛应用。

本文研究了一种基于人体骨架的动作识别算法,并实现了相应的系统。

通过利用深度学习框架和传感器数据,我们从人体骨架图像中提取特征,并构建模型进行动作分类。

实验结果表明,该算法能够高效准确地识别不同的人体动作,具有广泛的应用前景。

1. 引言人体动作识别作为一种基础的计算机视觉任务,广泛应用于人机交互、运动分析、虚拟现实等领域。

传统的基于图像或视频的方法在提取特征时存在一定的局限性,而基于人体骨架的动作识别算法能够更准确地捕捉人体动作的细微变化。

2.研究内容与方法本文基于深度学习框架,通过利用传感器数据采集人体的关键骨骼节点坐标,构建人体骨架图像,并提取其特征进行动作分类。

具体步骤包括:(1)传感器数据采集:通过采集传感器数据,获取人体关键骨骼节点的三维坐标。

我们选取高精度的传感器设备,如Kinect等,以确保数据的准确性和可靠性。

(2)数据预处理:对采集到的传感器数据进行预处理,包括去除噪声、滤波、对齐等操作,以提高数据的可用性和准确性。

(3)人体骨架图像构建:通过将传感器数据进行可视化处理,构建人体骨架图像。

我们利用OpenGL等图形处理工具绘制骨架图像,以便进行后续特征提取操作。

(4)特征提取:从人体骨架图像中提取关键特征。

我们采用了一种基于深度学习的卷积神经网络(CNN)模型,通过多次卷积和池化操作,将图像特征提取为一个固定长度的向量。

(5)动作分类:利用经过训练的分类器对提取到的特征进行动作分类。

我们选择了一种常用的分类器,如支持向量机(SVM)等,来实现不同动作的识别。

3.实验与结果分析我们搜集了大量的人体动作数据进行实验验证。

在实验中,我们选取了一些常见的动作,如走、举手、跳跃等,并通过传感器设备采集数据。

经过数据预处理和特征提取,我们得到了每个动作对应的特征向量。

基于人体骨架信息的动作分析研究

基于人体骨架信息的动作分析研究

基于人体骨架信息的动作分析研究基于人体骨架信息的动作分析研究摘要:人体动作分析研究已经成为计算机视觉和图像处理领域的热门研究方向。

近年来,由于深度学习算法的发展和深度神经网络的应用,基于人体骨架信息的动作分析技术得到了迅猛发展。

本文旨在系统综述基于人体骨架信息的动作分析研究的现状及其进展,分析不同方法在数据集、精度和效率方面的优缺点,并对未来的发展趋势进行展望。

文章从传统方法、深度学习方法、多模态方法等角度,梳理了基于人体骨架信息的动作分析的研究进展。

具体来说,本文归纳了光流法、形状模型、骨架投影等传统方法,并对其进行了分析和比较。

此外,本文还论述了卷积神经网络、长短时记忆网络、残差网络等深度学习方法的应用情况,并探讨了其优缺点。

最后,融合多模态信息的方法和未来发展趋势也被讨论。

关键词:人体骨架信息;动作分析;深度学习;卷积神经网络;多模态信息人体骨架作为一种能够刻画人体运动的数字表示方法在动作分析领域得到了广泛应用。

骨架信息能够通过cut-net、re-id等复杂的神经网络算法以及多种优化方法实现精确的人体关节点检测。

同时,基于骨架信息的动作识别和姿态估计在物体跟踪、医学诊断、虚拟健身及人机交互等领域也被广泛应用。

传统的基于骨架信息的动作识别方法大致分为两类:基于光流法和基于形状模型。

光流法基于计算出相邻两帧图像的运动向量,能够检测并跟踪人体的每个关节和身体部位。

形状模型方法通过建立3D网格特征描述对骨架关键点进行姿态估计。

同时,骨架投影方法在多视角动作识别中被广泛应用,能够实现运动跟踪和姿态估计。

近年来,深度学习算法的发展已经推动了基于人体骨架信息的动作分析技术迅速发展。

卷积神经网络、循环神经网络和残差神经网络等深度学习方法在该领域广泛应用。

此外,多模态学习方法也被用于结合骨架信息和图像信息,进一步提高了动作识别的精度和效率。

未来,基于人体骨架信息的动作分析技术将会继续得到广泛的关注和研究。

基于深度学习的骨骼动作识别与运动分析技术研究

基于深度学习的骨骼动作识别与运动分析技术研究

基于深度学习的骨骼动作识别与运动分析技术研究随着科技的发展和人工智能技术的不断成熟,基于深度学习的骨骼动作识别与运动分析技术逐渐引起了人们的关注。

这项技术可以应用于众多领域,如健康管理、运动训练、虚拟现实等。

本文将探讨基于深度学习的骨骼动作识别与运动分析技术的研究和应用现状,并展望其未来的发展前景。

在过去的几年里,基于深度学习的骨骼动作识别与运动分析技术取得了显著的进展。

传统的图像处理方法通常需要手动设计特征和规则,而深度学习技术则可以从大量数据中自动学习特征和规律,从而提高识别和分析的准确性。

基于深度学习的方法可以将骨骼动作识别和运动分析任务视为一个特征学习和分类问题,通过神经网络模型对输入的骨骼数据进行分析和预测。

骨骼动作识别技术的核心是从深度摄像头或传感器中获取人体骨骼信息。

最常用的方法是使用RGB-D(红外与可见光)摄像头或者深度传感器,通过获取人体姿态的三维坐标数据来进行识别和分析。

这些数据可以被转化为骨骼连接关系图,用于表示人体的姿态和动作。

深度学习模型可以通过学习骨骼数据的空间和时间特征,实现对不同骨骼动作的准确识别。

在骨骼动作识别领域,目前最常用的深度学习模型是卷积神经网络(Convolutional Neural Network, CNN)和循环神经网络(Recurrent Neural Network, RNN)。

CNN适合处理静态的骨骼图像数据,可以学习局部和全局特征,从而实现准确的骨骼动作分类和识别。

而RNN则适用于处理时间序列的骨骼数据,可以考虑动作的时序信息,实现对骨骼动作的连续预测和分析。

除了识别骨骼动作外,基于深度学习的技术还可以进行骨骼动作的运动分析。

运动分析包括对骨骼动作的姿态跟踪、运动轨迹预测、动作重构等任务。

通过深度学习技术,可以从骨骼数据中提取丰富的运动特征,实现对骨骼动作的精准分析和预测。

基于深度学习的骨骼动作识别与运动分析技术已经在多个领域得到了广泛应用。

基于深度学习的人体骨骼关键点检测与姿势识别研究

基于深度学习的人体骨骼关键点检测与姿势识别研究

基于深度学习的人体骨骼关键点检测与姿势识别研究人体姿势识别在计算机视觉领域具有广泛的应用前景,例如人机交互、运动分析、动作捕捉等。

而人体骨骼关键点检测是实现姿势识别的重要组成部分。

传统的骨骼关键点检测方法面临着复杂背景、遮挡、光照变化等问题的挑战,因此基于深度学习的人体骨骼关键点检测与姿势识别研究成为了近年来的热点之一。

深度学习通过构建深层神经网络模型,能够自动学习特征表示,从而显著提高人体骨骼关键点检测与姿势识别的性能。

首先,深度学习方法能够从大量的标注数据中学习到骨骼关键点的空间位置特征和姿势的上下文信息。

其次,深度学习具备对图像进行端到端的特征提取和预测的能力,避免了传统方法中特征工程的手工设计过程。

目前,基于深度学习的人体骨骼关键点检测与姿势识别研究主要分为两个方向:一是基于单幅图像的方法,二是基于视频序列的方法。

基于单幅图像的方法主要通过一张静态图片来识别人体骨骼关键点和姿势。

其中,最具代表性的方法是基于卷积神经网络(Convolutional Neural Network,简称CNN)的方法。

这些方法通过将输入图像作为网络的输入,经过多层卷积和池化操作后,得到骨骼关键点的预测结果。

为了提高模型在复杂场景下的鲁棒性,研究者们还提出了一些改进方案,如在网络结构中引入残差连接、使用多尺度网络等。

此外,为了解决遮挡和光照变化等问题,研究者还通过引入上下文信息、使用空间注意力机制等方式改进了模型的性能。

基于视频序列的方法则利用连续的图像序列来进行人体骨骼关键点检测与姿势识别。

这种方法能够充分利用时间维度上的信息,提高关键点检测和姿势识别的准确率。

其中,最常用的方法是基于循环神经网络(Recurrent Neural Network,简称RNN)和注意力机制的方法。

这些方法通过RNN网络对每一帧图像的特征进行建模,利用时间上的关联性来改善关键点的检测和姿势的识别。

同时,为了减小对完整视频的依赖,研究者们还提出了一些基于局部信息的视频姿势识别方法,将视频切分为多个局部片段进行处理,再进行局部特征的融合。

基于骨架的人体异常行为识别与检测

基于骨架的人体异常行为识别与检测
输入特征的优化
为了提高模型的训练效率,可以对输入的特征进行优化,例如使用骨架图像的形状、运动 和光学流等特征。
ቤተ መጻሕፍቲ ባይዱ
异常行为检测算法设计
异常行为检测算法概述
基于深度学习的异常行为检测算法通常采用监督学习的方 式,利用标注的正常行为和异常行为的样本训练模型,使 其能够自动识别异常行为。
多特征融合
将多个特征进行融合,例如骨架图像的形状、运动和光学 流等特征,以提高模型的检测精度和鲁棒性。
目前的研究主要集中在单个或多个人的异常行为识别上,如何扩展到大规模人群 的异常行为识别和分析仍是一个挑战。
下一步工作计划
针对动态特征的提取和分类问题,计 划深入研究并尝试引入新的技术手段
,提高算法的性能和准确性。
在复杂背景和多变光照等条件下,计 划开展更为深入的研究,尝试采用更 有效的特征提取和分类算法,提高算
04
跨摄像头跟踪与异常行为 识别
跨摄像头跟踪与异常行为识别
• 请输入您的内容
05
总结与展望
研究成果与贡献
基于骨架的人体异常行为识别与检测技术,为监控视频中人体行为分析 提供了有效的解决方案,对于公共安全、健康监测等领域具有重要意义 。
提出了多种基于骨架的人体异常行为识别算法,包括基于形状特征的识 别、基于时序特征的识别和基于深度学习的识别等,提高了异常行为识
别的准确率和鲁棒性。
针对实时性要求高的应用场景,研究并实现了一些高效、实时的异常行 为检测算法,保证了算法的实时性和可用性。
研究不足与展望
现有的基于骨架的人体异常行为识别算法主要集中在静态特征的提取和分类上, 对于动态特征的提取和分类还有待进一步研究。
在实际应用中,常常面临着复杂背景、多变光照、遮挡等问题,如何提高算法的 适应性和鲁棒性仍需进一步探索和研究。

基于深度学习的人体骨骼识别技术研究

基于深度学习的人体骨骼识别技术研究

基于深度学习的人体骨骼识别技术研究人体骨骼识别技术是一种通过计算机算法对人体骨骼进行分析和识别的技术。

随着计算机科学的发展和深度学习技术的成熟,人体骨骼识别技术得到了广泛的应用和发展,已经成为图像处理和计算机视觉领域中的热门研究方向。

本文将介绍基于深度学习的人体骨骼识别技术研究,探讨其应用场景和前景。

一、人体骨骼识别技术的研究历程人体骨骼识别技术的研究可以追溯至上世纪80年代,当时学者们主要采用传统的计算机视觉算法,如边缘检测、形状分析等方法来提取人体特征,并进一步进行人体姿态识别和运动分析。

然而这些方法的识别精度受到照明、遮挡、尺度变化等因素的干扰,误差较大,难以满足实际需求。

随着深度学习技术的崛起,人体骨骼识别技术得到了彻底的改变。

深度学习是一种基于神经网络的机器学习方法,具有自动化、智能化等优势。

通过学习大量的图像和视频数据,深度学习模型可以自动提取复杂的特征,并准确地识别人体骨骼位置和姿态。

二、基于深度学习的人体骨骼识别技术原理基于深度学习的人体骨骼识别技术主要分为两个阶段:姿态估计和骨骼跟踪。

其中姿态估计是指在输入的人体图像或视频中预测人体的关节点位置和各个关节之间的姿态,骨骼跟踪则是在已经获得姿态的基础上,利用关节点之间的连线信息来得到人体骨骼的三维点云或骨架。

以下将具体介绍这两个阶段的原理。

1. 姿态估计姿态估计是基于深度学习的人体骨骼识别技术的第一步。

在深度学习模型中,常采用卷积神经网络(CNN)对人体图像或视频进行特征提取,然后将提取的特征输入到全连接层中进行分类和回归。

具体地,CNN将输入的图像或视频分别进行卷积、池化、激活等操作,得到一系列的特征图。

这些特征图具有不同的语义含义和特征贡献度,其中包括了人体各个部位的信息以及其运动特征。

通过对这些特征图进行引入关键点回归算法进行姿态估计。

2. 骨骼跟踪骨骼跟踪是在已经进行姿态估计的基础上进行的。

一般采用的方法是基于关节点中的连线信息来构建骨骼模型。

基于骨骼关节点数据的人体行为识别方法[发明专利]

基于骨骼关节点数据的人体行为识别方法[发明专利]

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202010824525.2(22)申请日 2020.08.17(71)申请人 四川大学地址 610065 四川省成都市武侯区一环路南一段24号(72)发明人 冯子亮 丁健伟 杨斌 王洋 司马铭骏 贺思睿 郭照康 李东璐 单强达 何旭东 (51)Int.Cl.G06K 9/00(2006.01)G06K 9/62(2006.01)(54)发明名称基于骨骼关节点数据的人体行为识别方法(57)摘要本发明提供一种基于骨骼关节点数据的人体行为识别方法,通过从骨骼关节点数据序列中提取描述人体行为运动信息的运动轨迹特征、运动偏移特征,以及描述人体行为静态信息的静态姿势特征;通过建立基于骨骼关节点数据的运动量模型,实现了对时间段的自适应划分;上述自适应时间段划分以及段内的特征表征方法,可达到表达动作顺序的目的,同时也增强特征表达能力,从而可提升人体行为的识别效果。

权利要求书2页 说明书5页 附图3页CN 111914798 A 2020.11.10C N 111914798A1.基于骨骼关节点数据的人体行为识别方法,其特征在于,包括以下步骤:步骤1,获取单个行为的骨骼关节点数据序列;步骤2,对骨骼关节点数据序列中的每一帧,计算运动变化量和运动量;步骤3,将运动量归一化到[0,1]区间,构建该动作的人体行为运动量模型;步骤4,根据人体行为的运动量模型来对时间进行自适应划分;步骤5,对自适应划分时间段内的数据,计算骨骼关节点特征;步骤6,使用特征编码方法,对各时间段内的特征进行特征编码,然后对全部时间段的特征进行拼接,得到该动作的特征向量;步骤7,使用分类算法对各动作特征向量进行训练,最终实现人体行为识别。

2.根据权利要求1所述的方法,其特征在于,所述步骤1,包括:所述骨骼关节点数据序列包含人体骨骼关节点的三维坐标信息;为提高运算速度,可只选择部分骨骼关节点、骨骼向量、关节夹角参与计算。

基于骨架的人体行为识别方法综述

基于骨架的人体行为识别方法综述

基于骨架的人体行为识别方法综述摘要:人体行为识别技术在智能监控、人机交互、虚拟现实、智能康复、运动训练等领域都具有重要的应用价值和广阔的应用前景。

人体骨架关节点的时序变化为人体行为识别提供了强有力的信息,而且相比于RGB图像,人体骨架数据能够很好的克服复杂背景、光照变化及人体外观变化等无关因素的影响,所以基于骨架的人体行为识别受到了越来越多的关注。

本文系统的综述了基于骨架人体行为识别领域的研究进展,文章首先对骨架数据的获取方法以及常用的骨架行为数据集进行了介绍;其次介绍了目前基于骨架的人体行为识别主要方法;最后对该领域未来的研究进行了总结与展望。

本文旨在为希望从事基于骨架的人体行为识别的研究人员提供一个起点,加快该领域的研究及应用。

关键词:深度学习;人体行为识别;骨架数据;0引言近年来,随着智能设备的不断普及,视频的数量呈现爆炸式的增长,此外为了安防起见,在各大公共场所都安置了监控设备,视频资源变得越来越丰富多样,如何让计算机从视频中自动地识别出人体的行为成为越来越多研究者的研究方向。

人体行为识别技术在智能监控、无人驾驶和运动训练等领域都有着非常重要的应用价值。

与传统的RGB 视频相比,骨架数据可以给人体行为识别研究带来诸多的便利。

RGB视频受到复杂背景、关照变化和人体外观变化的影响,而骨架数据能够很好的克服这些无关因素的影响且骨架数据特征明确简单,网络参数数量比较少,更易于训练与测试。

本文的主要贡献:本文对基于骨架的人体行为识别方法进行了全面的综述;介绍了目前存在的骨架行为识别主要模型,其中包括LSTM框架、CNN框架、GCN框架;对国际上目前骨架数据的获取方法和骨架人体行为识别常用数据集进行了介绍;最后对未来的相关研究进行了总结和展望。

通过阅读本文,可以熟悉该领域的发展现状,未来的发展方向以及该领域面临的挑战,便于研究者参照对比,加快该领域的研究及应用。

1 骨架数据的介绍与获取骨架数据是将人体表示成若干个预先定义好的关节点在相机坐标系中的坐标来表示的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于骨骼数据的人体行为识别摘要人体动作姿态识别是计算机视觉研究领域中最具挑战的研究方向,是当前的研究热点。

对人体动作姿态进行自动识别将带来一种全新的交互方式,通过身体语言即人体的姿态和动作来传达用户的意思,如在机场、工厂等喧闹的环境下,采用手势、动作姿态识别等人机交互技术能够提供比语音识别更加准确的信息输入。

总之,在智能监控、虚拟现实、感知用户接口以及基于内容的视频检索等领域,人体动作姿态的识别均具有广泛的应用前景。

该文首先简单介绍了人体动作姿态序列的分割,然后对人体动作姿态识别的方法进行了分类介绍,并对一些典型的算法的研究进展情况及其优缺点进行了重点介绍。

关键词:人体动作姿态识别; 人工智能; 隐马尔可夫模型; 动态贝叶斯网络; 模板匹配前言人体姿态识别是计算机视觉的一个重要研究方向,它最终目的是输出人的整体或者局部肢体的结构参数,如人体轮廓、头部的位置与朝向、人体关节点的位置或者部位类别。

姿态识别的研究方法应该说,几乎涵盖了计算机视觉领域所有理论与技术,像模式识别、机器学习、人工智能、图像图形、统计学等。

到目前为止,已经有众多识别方法被提出,并且也取得了许多重要的阶段性的研究成果,但是以往的方法都是基于普通光学图像,比如常见的RGB 图像,这类图像容易受光照、阴影等外界变化的影响,尤其在环境黑暗的情况下无法来识别人体姿态,并且由于人体关节自由度大,及人的体型、着装较大差异性,常导致姿态识别系统识别率低。

尽管有研究者利用多个摄像机获取采集的图像来获取人体深度信息以克服以上问题[1],但是该类方法恢复的深度信息不是唯一的,而且计算量非常大,尤其是这种方法要求事先用人工对传感设备进行标定,而在选取场景中的标定物时,往往又会遇到实际环境操作困难的问题。

随着光电技术的快速发展,深度传感设备的成本逐渐降低,人们获取深图像的途径及方法也越来越多。

该方向的研究也逐渐成为计算机视觉领域的研究趋势。

具体原因包括:一方面,深度传感设备不仅操作简单,并且极大简化了普通摄像机的标定过程;另一方面,得到的深度图像由于直接包含了人体的深度信息,能够有效的克服普通光学图像遇到的上述问题。

到目前为止,较有影响力的基于该类图像的人体姿态识别算法,应该是 Shotton 等人利用一种深度传感器 Kinect 来实时捕捉人体运动的算法,该算法虽然能够满足人们对识别系统实时性的要求,但其对硬件要求特别高,并且不适合低分辨率图像中的人体关节点提取,容易导致人体骨架扭曲。

下文将具体陈述人体运动分析的主要用途和前人在不同时期对这些难题的处理办法。

主题基于计算机视觉的人体运动分析不仅在智能监控、人机交互、虚拟现实和基于内容的视频检索等方面有着广泛的应用前景,更是成为了未来研究的前瞻性方向之一。

Gavrila 总结了它的一些主要应用领域[2,3,4],下面据此对其典型应用做出进一步的介绍。

智能监控(Smart Surveillance)所谓“智能监控”是指监控系统能够监视一定场景中人的活动,并对其行为行分析和识别,跟踪其中的可疑行为(例如在一些重要地点经常徘徊或者人流密集的场合下突发的人群拥挤等状况)从而采取相应的报警措施。

智能监控系统应用最多的场合来自于那些对安全要求较为敏感的场合,常见于银行、机场、车站、码头、超市、办公大楼、住宅小区、军事基地等,以实现对这些场所的智能监控。

高级人机交互(Advanced Human-Computer Interaction)人体的行为分析常被用来提供控制和指令。

通常来说,人们之间的信息交流主要靠语言,并结合适当的手势和面部表情等,因此视觉信息可以作为语音和自然语言理解的有效补充来完成更加智能的人机交互。

更进一步的人机交互是进行人的识别和行为理解,结合面部表情、身体姿势和手势等[5-8]的分析来与人进行相应的交流。

运动分析(Motion Analysis)基于计算机视觉的人体运动分析可以大量地应用在用于各种体育项目中,通过提取运动员的各项技术参数(如肢体的关节位置、摆动的速度和角速度等等),对这些参数信息进行分析,可以为运动员的训练提供较为全面的指导和建议,有助于提高运动员的水平,这对于体育运动的发展是极为有用的。

同时,它也被广泛地应用在医疗诊断方面:目前的医学步态分析[9-11]就是通过为人体正常步态建模,开发生物反馈系统用来分析病人的步态,从而可以将其应用于临床矫形术等领域,用来诊断病人的腿部受伤情况或者畸形程度,而做出恰当的治疗;虚拟现实(Virtual Reality)基于计算机视觉的人体运动分析在虚拟现实方面也应用的相当广泛:目前电脑游戏的开发相当成熟,游戏中各种人物的形体、运动及它们之间行为交互设计的逼真性得益于对物理空间中人的运动分析,它包括人体模型的建立和运动姿势的恢复等一系列相关理论及技术的成熟应用;基于互联网交互式空间的虚拟网络聊天室的开发才刚刚起步,它通过文本交流同时可以使用二维图标来导航用户。

此外,人体运动识别在视频会议、人物动画、虚拟工作室等其他虚拟现实场合也有着相当广泛的应用。

在基于内容的视频检索方面,人体运动识别也有着重要的应用价值:由于人往往是视频记录的主要对象,在基于内容的视频检索中,如何检索在大段视频中的特定的人体运动,也需要这方面技术的发展。

总之,对人体运动识别的研究及到计算机视觉、模式识别、视频图像处理等方面的理论和实际应用问题。

对人体的跟踪与运动分析将会促进这些领域在理论上产生新的方法,并且在诸多应用领域将会产生潜在的影响和价值。

综上所述,姿态识别具有重要的理论价值与广泛的应用前景,因此,它受到国内外许多学校重点实验室、研究所的关注[13、14],除此之外,国际上一些著名会议和权威期刊也将其作为研究的主题之一,例如 ICCV(International Conferenceon Computer Vision)、CVPR (Computer Vision and Pattern Recognition)等国际会议,PAMI(IEEE Transactions on PatternAnalysis and Machine Intelligence)、CVIU(Computer Vision and Image Understanding)等国际期刊。

为了进行人体运动识别,需要解决运动数据的、特征表示与提取(人体运动建模)、人体运动序列分割、动作分类等问题,主要的流程如图1所示图1基于运动捕获数据的人体运动识别框架特征提取与表示到目前为止,已经有很多方法被设计用来表示人体运动或人体运动特征,按照特征的表示范围大致可以分为三大类:基于底层运动捕获信息的时空特征,基于变换域的表示,以及描述性特征。

时空特征时空特征主要为基于运动捕获系统捕获数据的直接或间接表示,例如直接釆用关节点的三维坐标,关节角度相对变化值等运动捕获信息,以及在这些底层信息之上的简单处理后的信息比如关节点的速度,角速度,朝向信息,骨豁夹角等。

关于几何特征的设计与描述主要有文献[15][16]的工作。

在他们的基础上,文献[17][18]加入时间信息,提出了基于三维时空特征的运动描述。

基于变换域的表示首先将运动捕获的底层信息进行数学变换,然后在变换域中进行运动的特征分析与描述。

在信号处理过程中,在变换域中能更好地体现在时域中不能体现的信号特性。

样条函数基、多项式函数基、傅立叶基、小波基等均可以用于运动描述子[19]。

文献[20]首先基于傅立叶基描述人体行走步态,然后分析人体行走步态提取人体行走运动的关键帧,进而用于运动匹配与识别。

文献[21]提出了一种基于加权主成分分析(WPCA, Weighted Primary Component Analysis)的方法用于实现运动捕捉数据的检索,通过计算姿态与姿态之间的距离作为相似度实现稳定高效的检索,并且分别使用合成数据和运动捕捉数据验证了该方法。

除了PCA方法之后,研究人员提出了许多子空间的方法,如ICA(Independent Component Analysis), FLA(Fisher Linear Analysis)等,这些方法都属于线性子空间降维方法。

描述性特征基于时空特征、数学变换域特征等描述方法通常通过底层数值特征进行计算,动作序列中丰富的语义信息并没有得到充分的利用。

因此,研究者提出利用运动描述语言(motion description language) [22], 李等[23]提出的字库模型标记每一个运动姿态等来描述用户设计的运动特征。

序列分割人体运动序列分割是指将连续的视频序列V分割n个独立的行为段,每个行为段中有且仅有一种有意义的行为式。

行为段之间的分割边界及行为段的数目n是该问题需要求解的变量。

现有的人体运动序列分割算法可分为有监督方法和无监督方法两类。

有监督方法采用手动方法分割视频序列,分割过程非常烦琐、耗时,且由于手动分割受到人的主观影响,分割结果往往不够准确。

无监督方法则能自动或半自动地分割行为序列,包括按照等长、有重叠的时间窗口进行分割。

前者比较简单,但准确率较低,其分割结果可能是一个不完整的行为模式或是多个行为模式的组合,这些误分割会导致后续的行为误识别。

为提高分割准确率,吴晓婕等人提出了由粗到细的分割思想图,在采用等长、有重叠的时间窗口进行粗分割的基础上,再结合segmental-DTW (dynamic time warping)和图聚类方法进行细分割,此方法运算量较大,且精度较低。

为了进一步提高分割准确率,周峰等人[24]结合核函数化的k均值聚类与DTAK( Dynamic Time Alignment Kernel)[25]对运动序列进行分割,这种方法不仅有较高的分割精度,而且还能分割出每个运动包含的周期子运动。

动作识别方法运动识别可以简单看成时变数据的分类问题,即将测试序列与预先标定的代表典型运动的参考序列进行匹配,且能够处理在相似的运动模式类别中空间和时间尺度上轻微的特征变化。

运动检索方法也可用于进行运动识别。

一般的思路是在已有的数据集中査找一个与未知类型的运动序列相似的运动序列,然后根据数据集中已知运动序列的类别标签来判断未知运动序列的类别标签。

但是直接基于数值计算相似度的方式难以对逻辑上相似的动作进行识别,比如,两次跳跃运动的高度、跨度可能会差别较大,如果直接从运动捕获的数值上进行计算则难以匹配,因此可以根据两个动作的逻辑上是否相似来进行匹配和判断分类。

基于概率统计的方法基于运动分类建立概率模型,对待识别的动作序列进行概率估计,然后基于概率值进行分类和识别。

在基于运动分类建立的概率模型中,将运动的一个姿势或者几个姿势定义为状态,状态与状态之间采用概率表示状态转移的可能性,这样,整个动作序列可以建模为一个状态转移的时间序列过程描述。

相关文档
最新文档