基于多层运动历史图像的飞行时间相机人体运动识别_张旭东

合集下载

基于深度信息的人体运动识别方法

基于深度信息的人体运动识别方法
收稿日期:2015-01-26;修回日期:2015-04-26
近年来,基于时空兴趣点的动作表征和识别[2]取得了一些突破性的进展。其中应用比较广泛的是 Laptev[3], 将二维图像中的 Harris 角点检测技术扩展到三维时空领域,可以从视频序列中提取出丰富的时空兴趣点。Dollar[4] 提出了基于 Gabor 滤波器的时空兴趣点检测算法,这些算法可以从视频中快速有效地检测出丰富的兴趣点。本文 在 同 一 实 验 环 境 中 对 目 前 常 用 的 兴 趣 点 提 取 算 法 进 行 性 能 评 估 ,围 绕 着 时 空 兴 趣 点 的 周 围 定 义 了 深 度 立 方 体 相 似 特征描述符(DCSF)来提取特征数据[5]。最后利用所提取到的特征集合构建了分类器,完成动作的分类。
Key words : motion analysis ; motion recognition ; spatio-temporal interest points ; motion characterization;Support Vector Machine classification
人 体 运 动 识 别 是 计 算 机 视 觉 领 域 一 个 非 常 活 跃 的 研 究 方 向 。运 动 识 别 的 主 要 研 究 方 法 是 通 过 适 当 的 预 处 理 将 目 标 从 嘈 杂 的 背 景 中 提 取 出 来 ,在 检 测 出 的 目 标 图 像 中 选 择 恰 当 的 表 征 方 法 来 提 取 相 应 的 信 息 表 征 目 标 的 运 动 状 态,最后通过模板匹配识别出目标运动模型[1]。本文在深度信息的基础上研究了有关人体运动识别的方法。
基于深度信息的人体运动识别方法
陈 力,王俊凯,张玉玺

空时相关多分辨运动估计算法

空时相关多分辨运动估计算法

空时相关多分辨运动估计算法
张旭东;王德生
【期刊名称】《电子科学学刊》
【年(卷),期】1998(020)003
【摘要】本文提出了一个新的序列图象运动矢量估计算法:空时相关多分辨运动估计算法,充分利用运动矢量场在空域相邻块,时域物体运动和分层父子块之间的相关性降低运动搜索范围。

达到比三步法还要少的搜索次数,运动补偿增益和运动矢量熵均比三步法有明显改善。

【总页数】6页(P315-320)
【作者】张旭东;王德生
【作者单位】清华大学电子工程系;清华大学电子工程系
【正文语种】中文
【中图分类】TN919.8
【相关文献】
1.基于冗余小波域的快速多分辨率运动估计算法 [J], 苗艳华;李建娜
2.基于空时相关阵联合对角化的高分辨方位估计 [J], 蒋飚;朱埜;孙长瑜
3.应用空时相关性的单视频超分辨率算法 [J], 陈诚;常侃;莫彩网;李天亦;覃团发
4.一种基于空时相关的MIMO OFDM系统信道估计算法 [J], 耿欣;胡捍英;敦亚南
5.全局运动多分辨率光流估计算法的改进与实现 [J], 韩军;张东
因版权原因,仅展示原文概要,查看原文内容请购买。

基于深度学习的人体动作识别方法

基于深度学习的人体动作识别方法
在视频数据源下的人体动作识别是将视频切分成时间
帧图像,然后对随时间变化的图像进行分类,所以在图片 识别领域的深度学习方法,也被应用在视频序列中人体动 作识别的研究中5。但人体动作识别的动作识别模式具有 不可预测性和多样性,所以在进行识别研究时需要结合多 方面综合技术,随着实际应用中并发数据量的增多,给识 别带来了一定的难度为了提高人体动作识别的识别 率,本文构建一种基于卷积神经网络模型和递归神经网络 模型的改进模型,并利用稠密光流函数提取视频前后帧图 像的光流数据,对特定场景下视频中的人体动作进 行识别。
0引言
在基于计算机视觉领域的人体动作识别研究中,Karpathy等也利用深度卷积神经网络以视频中连续的RGB视 频帧为直接输入对人体动作进行识别;Shuwang Ji等⑶提 出利用视频数据中时间维度信息,利用3D卷积神经网络对 人体动作进行识别;Jeff等⑷利用融合卷积层和长时递归 层的长时递归卷积网络(long-term recurrent convolutional, LRCN)提出了用于人体动作识别的网络模型。
Human motion reJognition method based on deep learning
SHEN Xi-ting12, YU Sheng12, DONG Yao12+ , DONG Yong-feng1& , ZHANG Ze-wti12
(1. School of Artificial Intelligence, Hebei University of Technology , Tianjin 300401, China; 2. Hebei Provincial Key Laboratory of Big Data Computing , Hebei University of Technology , Tianjin 300401 , China)

基于WSN的人体姿态辨识系统设计

基于WSN的人体姿态辨识系统设计

基于WSN的人体姿态辨识系统设计陈庆章;张海洋;陈辰;魏东东;王鹏;吴龙栋【期刊名称】《浙江工业大学学报》【年(卷),期】2014(042)006【摘要】针对老年人摔倒时可能因无法得到及时救助而发生危险的情况,设计了基于WSN的人体姿态辨识系统,包括人体姿态感知节点、数据采集节点和实时监控管理平台等三部分,能对多目标人体姿态进行实时辨识,一旦人体姿态存在异常能立刻进行报警,从而保证了目标的人身安全.实验检测结果表明,系统能在不影响使用者日常生活的前提下,同时对多个目标的人体姿态进行正确辨识,当监测到目标处于跌倒姿态时,可以及时进行报警,满足了对老年人活动状态进行实时监控的需求,【总页数】5页(P591-595)【作者】陈庆章;张海洋;陈辰;魏东东;王鹏;吴龙栋【作者单位】浙江工业大学计算机科学与技术学院,浙江杭州310023;浙江工业大学计算机科学与技术学院,浙江杭州310023;浙江工业大学计算机科学与技术学院,浙江杭州310023;浙江工业大学计算机科学与技术学院,浙江杭州310023;浙江工业大学计算机科学与技术学院,浙江杭州310023;浙江工业大学计算机科学与技术学院,浙江杭州310023【正文语种】中文【中图分类】TP301【相关文献】1.基于MPU9250和MS5611的人体姿态检测系统设计 [J], 王莉;张紫烨;牛群峰;赵艳阳;石磊2.基于智能手机终端的远程人体姿态监测系统设计 [J], 惠鸿飞;彭于滨;诸海渝;陈浩天;何纵横;廖俊霖;3.基于FPGA的人体姿态及心电数据复接系统设计与仿真 [J], 谢从晋;杨柳4.基于OpenPose的人体姿态检测系统设计与实现 [J], 陈汝峰;谢鹏飞;彭成;谭玉林5.基于人体姿态感知的运动相似度计算系统设计与实现 [J], 葛亚坤因版权原因,仅展示原文概要,查看原文内容请购买。

人体姿态估计与动作识别技术研究

人体姿态估计与动作识别技术研究

人体姿态估计与动作识别技术研究人体姿态估计与动作识别技术是计算机视觉领域的重要研究方向,其在人机交互、虚拟现实、运动分析、智能监控等众多领域具有广泛的应用前景。

本文将探讨人体姿态估计与动作识别技术的研究进展及其在不同应用场景中的实际应用。

人体姿态估计技术旨在从图像或视频中恢复人体的三维姿态信息,包括身体的关节角度、关节位置等。

该技术的研究挑战在于图像中的遮挡、姿势多样性和动态变化等因素。

近年来,深度学习方法在人体姿态估计技术中取得了重要突破。

基于深度学习的方法可以通过训练大规模的姿态数据集,学习到人体的骨骼结构和属性,并通过反向传播算法优化模型参数,从而实现精确的姿态估计。

例如,卷积神经网络(CNN)被广泛应用于人体姿态估计,而递归神经网络(RNN)则可以对时间序列图像进行建模,进一步提高估计精度。

人体动作识别技术旨在识别和分类人体运动的不同行为,例如行走、跑步、拳击等。

该技术在健身、体育竞技、运动训练等方面具有广泛的应用潜力。

动作识别的关键在于提取有效的动作特征表示,并利用分类算法进行动作分类。

传统的方法主要基于手工设计的特征提取器,例如形状特征、运动轨迹特征等。

然而,这些方法在复杂场景下的性能受限。

近年来,深度学习方法的兴起为动作识别技术带来了革命性的突破。

卷积神经网络(CNN)和循环神经网络(RNN)等结构在动作识别中得到了广泛应用,这些网络能够自动学习动作的抽象特征表示,并从大规模的动作数据集中进行训练,极大地提高了动作识别的准确性和鲁棒性。

人体姿态估计与动作识别技术在许多领域中得到了实际应用。

在人机交互领域,人体姿态估计技术可以用于手势识别、姿势控制等,实现更自然、便捷的人机交互方式。

例如,通过识别手势,用户可以简单而直观地与计算机进行交互,实现手势控制的虚拟键盘、手势驱动的游戏等。

在虚拟现实领域,人体姿态估计技术能够追踪用户在虚拟环境中的姿态变化,实现沉浸式的用户体验。

在运动分析领域,人体姿态估计和动作识别技术可以用于智能运动捕捉、动作评估等,帮助运动员改善和优化运动技能。

基于连续运动模式识别的人体行为识别与分析

基于连续运动模式识别的人体行为识别与分析

基于连续运动模式识别的人体行为识别与分析人体行为识别与分析是一个热门的研究领域,它涉及到从视频数据中自动识别和分析人类行为,对于智能监控、活动识别和医疗诊断等领域具有广泛的应用前景。

连续运动模式识别是人体行为识别领域的一项重要技术,它可以通过分析连续的动作序列来识别和理解人体行为。

连续运动模式识别技术的关键是提取有效的特征,并通过机器学习和模式识别算法进行分类。

在人体行为识别与分析中,特征提取是最关键的一步。

常用的特征包括空间特征、时间特征和姿态特征等。

空间特征表示物体的位置、形状和大小,时间特征表示运动的速度、加速度和持续时间,姿态特征表示人体的角度、旋转和关节运动等。

这些特征需要经过数学模型和计算方法的处理,以便提取出对行为鉴别有用的信息。

连续运动模式识别所需的数据通常来自于视频数据,它可以通过摄像机、传感器或虚拟仿真技术获取。

在获取视频数据之后,需要进行预处理和后期处理。

预处理包括视频的去噪、分割和姿态估计等,后期处理包括特征提取、特征选择和分类器设计等。

预处理和后期处理的目的是提高模式识别的准确性和效率。

在人体行为识别与分析中,连续运动模式识别的关键挑战之一是多样性。

同一种行为在不同的时间、环境和个体之间可能呈现出差异。

因此,如何在大量的训练数据中找到行为的共同特征,并忽略个体差异,是一个难题。

另一个挑战是复杂性。

许多人类行为涉及到多个物体的交互作用和协调运动,因此如何从复杂的运动序列中提取有用的信息,是一个挑战。

为了解决上述挑战,研究者们提出了许多方法和技术。

一种常用的方法是基于机器学习的人体行为识别与分析。

机器学习是通过对大量的训练数据进行学习,并建立模型来推断未知数据的方法。

常用的机器学习算法包括支持向量机、随机森林和深度学习等。

这些算法可以从特征中学习到不同的行为模式,并用于分类和识别。

另一种常用的方法是基于模式识别的人体行为识别与分析。

模式识别是一种从数据中发现模式和规律的方法,它包括特征提取、特征选择和分类器设计等步骤。

基于多图表达的人体动作学习方法[发明专利]

基于多图表达的人体动作学习方法[发明专利]

专利名称:基于多图表达的人体动作学习方法专利类型:发明专利
发明人:邵岭,西蒙·琼斯,龙洋
申请号:CN201410267729.5
申请日:20140617
公开号:CN104166981A
公开日:
20141126
专利内容由知识产权出版社提供
摘要:本发明提供了一种基于多图表达的人体动作学习方法,包括:将特征空间分成几个相互独立的子空间,并通过多个图来表示所述子空间;从每个子空间产生不同的关联矩阵,并且在每个子空间进行谱嵌入;将这些嵌入缩放连结在一起,为每个信息点得到一个单一表示,以生成特征集合谱多重图FGSM,所述FGSM能从原始的特征空间得到最少的数据丢失;将FGSM应用于聚类、信息检索和识别算法,以进行人体动作学习。

本发明提供的基于多图表达的人体动作学习方法方便产品防伪验证操作,提高验证效率,适于实用。

申请人:南京信息工程大学
地址:215101 江苏省苏州市吴中区木渎镇中山东路70号吴中科技创业园2号楼2310室
国籍:CN
代理机构:南京经纬专利商标代理有限公司
更多信息请下载全文后查看。

基于多变量相空间重构与近似熵的飞行动作识别方法

基于多变量相空间重构与近似熵的飞行动作识别方法

信息技术与应用China Science & Technology Overview0引言飞机飞行过程可被看作是一系列飞行动作的组合,而特定机动动作(斤斗、盘旋、转弯等)完成水平是飞行员操纵品质评估的主要内容。

因此,从飞行记录数据中快速、准确地识别各种特定机动动作是客观正确评估飞行员操纵品质的前提和关键。

飞行数据是典型多元非线性时间序列数据,特定机动动作则是整个时间序列上的具体片段,因此飞行动作识别本质上为非线性时间序列模式识别。

其核心是特征量构建和分类器设计,即如何在各维度复杂关系基础上选择或提取适当特征量准确描述不同飞行动作变化规律,以及如何选取和设计分类器以达到较好识别效果。

目前该领域的主要研究成果有很多。

(1)飞行动作识别知识库:倪世宏[1]等利用多年的领域研究经验建立飞行动作识别库,采用产生规则描述从而实现动作识别,该方法目前在工程上得到广泛应用。

(2)模糊支持向量机:杨俊[2]、谢川[3]根据经验提取每帧飞行数据中相关特征量作为模糊支持向量机输入,达到了较好的分类效果。

(3)遗传算法规则优化[4-5]:利用遗传算法自学习优化特性在原数据基础上生成简洁有效的产生式规则,提高识别效率。

(4)时间序列匹配:周超[6]、张玉叶[7]、李鸿利[8]将飞行动作识别问题转化为时间序列匹配问题,采用不同算法将待识别动作序列与各动作模板序列进行相似性匹配,进而识别相应机动动作。

(5)贝叶斯网络推理[9-10]:采用适当方法得到节点描述特征,利用贝叶斯网络强大的推理能力得到识别结果。

上述方法均采用正向推理思想,首先选择相关维度构建不同特征量组合,用以描述各机动动作识别规律,而后选取适当识别方法,利用样本数据训练,以期达到较好的分类效果。

上述方法客观合理地构建了特征量,在训练集选择充足准确情况下均能达到较好识别效果。

然而,一方面飞行数据非线性特征决定了从表征维度变化特征直接描述其内部复杂变化规律会较为繁琐和片面,使得特征量表述复杂、泛化性较差;另一方面,不同识别方法均需要大量准确的训练样本,其获取代价高昂。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

究课题,在视频监控、虚拟现实、人机交互等方面 有广阔的应用前景。基于视频的人体运动识别的关 键是如何从视频中提取可靠的特征表征人体动作。 利用 2D 相机获取运动人体信息是过去几十年的研 究重点。然而,2D 相机自身的局限性使已有的 2D 相机运动识别方法[1]仅适用于运动平行于相机的情 况,由于人体运动从本质上来说是 3D 的,距离信 息的丢失使 2D 相机的运动表征方法识别能力大大
图1 基于距离图像的运动人体检测
3.1 传统运动历史图像 运动历史图像[14]是一种人体运动的全局描述方 法,其每个像素值是此像素点上运动时间的方程。 记 B (x , y, t ) 为运动人体的二值轮廓图像序列,则运 动历史图像 t (x , y, t ) 的计算方法如式(2)所示。 ìt, B (x , y, t ) - B (x , y, t - 1) ¹ 0 ï ï t (x , y, t ) = í (2) ï max (0, t (x , y, t - 1) - 1), 其它 ï ï î 式中 t 为时间窗口长度,即一个运动视频序列的帧 数,表示运动的持续时间。由式(2)可知,运动历史 图像是一个标量灰度图,亮度大的区域表示了最新 发生运动的区域。随着时间推进,MHI 中旧信息的 灰度值变小,成为较暗的像素。 3.2 多层运动历史图像 由式(2)可知, MHI 是在二值轮廓图像的基础上 得到的,只记录平行于图像平面的运动所产生的运 动历史,丢失了垂直于图像平面即距离方向上的运 动信息。利用距离信息,MLMHI 根据距离的变化 量,将所有时空距离信息压缩到运动能量图 (Motion-Energy Image, MEI),前向多层运动历史 图像 (forward-MLMHI, fMLMHI) 和后向多层运动 历史图像 (backward-MLMHI, bMLMHI) 这几个平 行的层面上。运动能量图表征运动发生的区域。 fMLMHI 表 征 前 向 运 动 历 史 , 即 距 离 的 增 加 。 bMLMHI 表征后向运动历史,即距离的减少。根据 人体结构特征及人体运动的自遮挡特征,选择适当 的阈值,用运动能量图加上前后各两层运动历史图 像表征人体运动,记为 ML = {E t , ft1, ft2 , bt1, bt2 } 。 前向第 1 层与后向第 1 层运动历史图像 ft1 和 bt1 的 计算公式如式(4)和式(5)所示。 ìt, D (x , y, t ) ¹ 0 ï E t (x , y, t ) = ï (3) í ï max 0, E x , y , t 1 1 , 其它 ( ) ( ) ï t ï î ìt, D (x , y, t ) - D (x , y, t - 1) ï ï ï ï Î [ 0.1, 0.4) ft1 (x , y, t ) = ï (4) í ï ï ï max (0, ft1 (x , y, t - 1) - 1), 其它 ï ï î ì t, D (x , y, t ) - D (x , y, t - 1) ï ï ï ï b1 Î (-0.4, -0.1] t (x , y, t ) = ï (5) í ï ï b1 ï max (0, t (x , y, t - 1) - 1), 其它 ï ï î 式(3)-式(5)中, E t (x , y, t ) 为运动能量图,可以看作 人体运动的整体运动信息。 ft1 和 bt1 分别表示前向 和后向距离变化在 0.1 到 0.4 之间的运动历史, 即距 离变化较小的局部运动信息。 ft2 和 bt2 的距离阈值 分别为 [0.4, +¥) , (-¥, -0.4 ] ,表征距离变化较大的
第5期
张旭东等: 基于多层运动历史图像的飞行时间相机人体运动识别
1141
局部运动信息。 由于 TOF 相机获取的距离值会有小 幅度的波动,因此,未将距离变化量在 [0, 0.1) 之间 的信息列入多层运动历史图像中。同传统 MHI 一 样,MLMHI 中亮度大的区域表示了最新发生运动 的区域。 3.3 R 变换 传统 MHI 运动识别多选用 Hu 不变矩作为形状 描述符。然而,Hu 矩对具有噪声的形状或不连接的 因此, 本文采用 R 变换对 MLMHI 形状较为敏感[15], 进行特征提取。R 变换是定义在 Radon 变换的基础 上的一种新的形状特征描述符,计算代价低,且能 够有效描述不连接或有空洞的形状。将一幅图像记 为 f (x , ) ,图像上每个点都投影到一个 Radon 矩阵 中,则其 Radon 变换定义如式(6):
要:该文利用飞行时间(Time-Of-Fligh, TOF)相机提供的距离图像,在运动历史图像的基础上提出一种基于多
层运动历史图像的人体运动识别方法。计算距离轮廓序列的运动能量图作为整体运动信息,同时根据距离变化量, 计算前向、后向的多层运动历史图像作为局部运动信息,共同组成多层运动历史图像。为了解决 Hu 矩对不连续或 具有噪声的形状较为敏感的问题, 引入 R 变换对每层运动历史图像进行特征提取, 串联形成特征向量送入 SVM 进 行分类识别。实验结果表明,该识别方法可以有效识别人体运动。 关键词:人体运动识别;距离图像;多层运动历史图像;R 变换 中图分类号:TP391 DOI: 10.3724/SP.J.1146.2013.01003 文献标识码:A 文章编号: 1009-5896(2014)05-1139-06
Human Activity Recognition Using Multi-layered Motion History Images with Time-Of-Fligh (TOF) Camera
Zhang Xu-dong Yang Jing Hu Liang-mei Duan Lin-lin
(School of Computer and Information, Hefei University of Technology, Hefei 230009, China) Abstract: A new method extended from motion history image called Multi-Layered Mmotion History Images (MLMHI) is proposed to the representation and recognition of human activity using depth images provided by Time-Of-Fligh (TOF) camera. Firstly, the motion-energy image of the depth silhouettes is computed as the global motion information. Then, the forward-MLMHI and backward-MLMHI is computed as the local motion information based on the variable of depth. The global and local motion information constitute the MLMHI lastly. Since the Hu moments are sensitive to disjoint shapes and noise, R transform is employed to extract features from every layered-MHI and concatenated to form a feature vector. The feature vector is used as the input of Support Vector Machine (SVM) for recognition. Experimental results demonstrate the effectiveness of the proposed method. Key words: Human activity recognition; Depth image; Multi-Layered Motion History Images (MLMHI); R transform
3
多层运动历史图像及 R 变换
2
运动人体检测
运动人体检测是人体运动识别的基础。 受光照、 阴影等影响,利用 2D 相机进行运动人体检测仍然 是具有挑战性的工作。本文利用距离信息,结合背 景差分法[13]进行运动人体检测,以克服上述缺点。 具体表达式如式(1)所示: ì ï ïD' (x , y ), D' (x , y ) - Dbk (x , y ) > sth D (x , y ) = ï (1) í ï 0, 其它 ï ï î 式 中 D (x , y ) 为 检 测 到 的 运 动 人 体 的 距 离 图 像 ; D' (x , y ) 为当前帧的距离图像; sth 为预先设定的距 离阈值; Dbk (x , y ) 为背景帧的距离图像。为了构造 背景模型,假设背景是静止的,采用平均背景法。 记录没有运动人体时的背景距离图像序列,计算多 幅背景距离图像的平均值作为背景距离图像 Dbk (x , y ) 。图 1 所示为提取出的运动人体的距离轮 廓图像,这里 sth 取 1.2。
2013-07-10 收到,2013-09-29 改回 国家自然科学基金 (61273237, 61271121) 和安徽省自然科学基金 (11040606M149)资助课题 *通信作者:张旭东 xudong@
1140
电 子 与 信 息 学 报
第 36 卷
方法利用距离图像中的所有点提取有意义的时空描 述子。 Li 等人[9]和 Yang 等人[10]都将距离图像投影到 3 个正交的笛卡尔平面上,然后对投影进行特征提 取。然而,由于距离图像分辨率的限制,xz 和 yz 平 面上的投影非常粗糙,往往需要插值。Ni 等人[11]提 出利用距离信息将运动历史图像 (Motion History Image, MHI)扩展为 3DMHI,能够有效地表征运动 人体的整体信息, 但不能突出体现运动的局部信息; 第 3 种方法将骨架模型和距离图像结合起来。 Wang [12] 等人 基于距离数据和 3D 关节点位置的估测,提 取局部占有信息(LOP) 和傅里叶时序金字塔(FTP) 的特征描述方法。 本文方法归属上述 3 种方法中的第 2 种。利用 TOF 相机的距离信息,结合传统 MHI 和文献[11] 的 3DMHI,提出多层运动历史图像(Multi-Layered Motion History Images, MLMHI)的人体运动描述 方法。MLMHI 由运动能量图和前向、后向多层运 动历史图像组成,包含了沿着距离方向变化的运动 历史,能够体现运动的整体信息和局部信息,从而 更加精确地描述人体运动。然后引入 R 变换对每层 运动历史图像进行特征提取,串联形成特征向量送 入 SVM 分类器中进行分类。
相关文档
最新文档