视频行为识别综述

合集下载

弱监督与少样本学习场景下视频行为识别综述

弱监督与少样本学习场景下视频行为识别综述

弱监督与少样本学习场景下视频行为识别综述弱监督与少样本学习场景下视频行为识别综述导言:随着计算机视觉领域的快速发展和智能视频监控系统的广泛应用,视频行为识别成为了一个备受关注的研究领域。

然而,仍然存在着一些挑战,例如弱监督和少样本学习。

一、弱监督视频行为识别在现实生活中,获取带有标注的大规模训练数据集是非常困难和昂贵的。

弱监督学习旨在利用只有部分标注信息的数据来进行模型训练。

在应用于视频行为识别中,主要存在以下两种弱监督学习的方式。

1.1 弱标注弱标注指的是只有视频级别标签或部分帧级别标签的情况。

这种情况下,模型需要从每个视频中学习到行为的特征。

1.2 不完整标注不完整标注是指只有一部分视频帧被正确标注,而剩余的帧则没有标注。

这意味着模型需要根据已有标签来理解整个行为。

二、少样本视频行为识别另一个挑战是少样本学习,即在较少标注样本的情况下进行视频行为识别。

由于缺乏足够的样本进行模型训练,少样本学习需要从有限的样本中进行学习并进行准确的行为分类。

2.1 迁移学习迁移学习是一种常用的解决少样本学习问题的方法。

通过从源领域中学习到的知识来帮助新的目标领域学习。

2.2 生成对抗网络生成对抗网络(GAN)是另一个在少样本学习中广泛使用的方法。

GAN可以通过生成更多的数据样本来解决数据稀缺的问题。

三、弱监督与少样本学习的融合方法在实际应用中,往往需要同时解决弱监督和少样本学习问题。

以下是一些常用的融合方法。

3.1 弱监督主动学习弱监督主动学习结合了弱标注和主动学习的思想,通过主动地选择最有用的样本来进行模型训练,从而提高行为识别的准确性。

3.2 生成对抗网络与迁移学习的融合生成对抗网络与迁移学习的融合可以在少样本学习的同时,将生成对抗网络应用于弱监督学习,从而提高模型的泛化能力和准确性。

3.3 多任务学习多任务学习是将弱监督和少样本学习问题视为并行任务进行解决。

通过同时学习多个任务,可以利用任务之间的相关性提高模型的泛化能力和准确性。

视频群体行为识别综述

视频群体行为识别综述

视频群体行为识别综述视频群体行为识别综述随着计算机视觉和机器学习技术的快速发展,视频群体行为识别成为了一个备受关注的研究领域。

视频群体行为识别旨在通过分析视频中的多个个体之间的相互关系和协作行为,从而理解其所具有的群体行为模式。

视频群体行为识别具有广泛的应用领域,包括安全监控、交通管理、无人驾驶等。

视频群体行为识别的关键问题是如何提取和表示群体行为的特征。

传统方法主要依赖于手工设计的特征,如颜色直方图、光流特征等。

然而,这些手工设计的特征受限于视觉表达的能力和表征能力,往往无法很好地捕捉到群体行为中的细粒度信息。

因此,近年来,基于深度学习的方法逐渐成为了视频群体行为识别的主流。

基于深度学习的视频群体行为识别方法主要包括两个方面:特征提取和行为识别。

特征提取是指从视频中提取出有用的特征表示,常见的方法有卷积神经网络(CNN)和循环神经网络(RNN)。

卷积神经网络可以通过多个卷积层和池化层来提取图像的局部和全局特征,而循环神经网络则可以捕捉到视频序列中的时序信息。

行为识别是指通过特征提取得到的特征,对群体行为进行分类和识别。

常见的方法有支持向量机(SVM)和循环神经网络等。

近年来,随着深度学习的不断发展,越来越多的方法被提出来解决视频群体行为识别的问题。

其中,一种重要的方法是时空注意力网络(STAN)。

时空注意力网络可以根据不同的特征区域和时序信息赋予不同的权重,从而更好地捕捉到群体行为中重要的特征和时序信息。

另一种重要的方法是图卷积网络(GCN)。

图卷积网络可以将视频中的个体之间的关系建模为图结构,从而更好地挖掘群体行为中的社交关系和协作行为。

除了特征提取和行为识别,视频群体行为识别还面临以下挑战。

首先,视频群体行为往往具有多样性和复杂性,不同的场景和行为模式可能导致难以捕捉和表示。

其次,视频中的个体之间存在相互遮挡和部分遮挡的情况,这使得群体行为的识别更加困难。

此外,视频数据量庞大,如何高效地处理和分析大规模的视频数据也是一个需要解决的问题。

基于视频的人体异常行为识别与检测方法综述

基于视频的人体异常行为识别与检测方法综述

基于视频的人体异常行为识别与检测方法综述一、本文概述随着视频监控技术的广泛应用和技术的快速发展,基于视频的人体异常行为识别与检测已成为当前研究的热点和难点问题。

该技术旨在通过分析监控视频,自动检测并识别出人体的异常行为,如暴力行为、跌倒、异常行走姿势等,从而为安全监控、智能监控等领域提供有效的技术支持。

本文旨在综述基于视频的人体异常行为识别与检测技术的研究现状、发展趋势以及面临的挑战,以期为后续研究提供参考和借鉴。

本文首先介绍了基于视频的人体异常行为识别与检测的基本概念和研究意义,阐述了该技术在安全监控、智能交通、医疗护理等领域的应用价值。

接着,本文综述了近年来国内外在该领域的研究进展,包括基于传统图像处理的方法、基于机器学习的方法以及基于深度学习的方法等。

在此基础上,本文分析了各种方法的优缺点,并指出了当前研究中存在的问题和挑战。

本文展望了基于视频的人体异常行为识别与检测技术的发展趋势和未来研究方向,以期为相关领域的研究人员提供有益的参考和启示。

二、人体异常行为识别与检测的基本理论人体异常行为识别与检测是计算机视觉和领域的重要研究方向,其基本理论涉及多个学科的知识。

本部分将介绍人体异常行为识别与检测的基本理论,包括人体行为的表示、特征提取、行为分类与识别以及异常检测的基本原理。

人体行为的表示是实现异常行为识别与检测的基础。

人体行为可以通过多种方式表示,如时空轨迹、姿态序列、骨骼点运动等。

这些表示方法旨在捕捉人体行为的时空特性和动态变化,为后续的特征提取和分类提供基础。

特征提取是行为识别与检测的关键步骤。

通过对人体行为的表示进行特征提取,可以提取出行为的关键信息,如运动模式、姿态变化、行为速度等。

这些特征对于区分正常行为和异常行为至关重要。

常见的特征提取方法包括时域分析、频域分析、运动轨迹分析、姿态分析等。

接下来,行为分类与识别是异常行为检测的核心环节。

通过利用机器学习、深度学习等分类算法,将提取出的特征输入到分类器中,实现对人体行为的分类与识别。

视频监控系统算法的使用技巧与行为识别分析

视频监控系统算法的使用技巧与行为识别分析

视频监控系统算法的使用技巧与行为识别分析随着科技的发展,视频监控系统在各个领域得到了广泛的应用,它不仅可以提高安全性和管理效率,还能提供大量的数据用于行为分析和决策支持。

然而,视频监控系统的操作并不简单,需要掌握一定的技巧和算法知识,特别是在行为识别分析方面。

本文将介绍一些视频监控系统算法的使用技巧以及行为识别分析的方法和应用。

首先,我们要了解视频监控系统中常用的算法。

在视频监控系统中,常见的算法包括运动检测、目标跟踪、行为分析等。

运动检测算法可以通过比较相邻帧之间的像素差异来检测到物体的运动,从而触发报警或者执行其他操作。

目标跟踪算法是基于运动检测结果的基础上,对运动目标进行跟踪和识别,可以用于追踪特定人物或物体的运动轨迹。

行为分析算法则是通过分析目标的运动轨迹和动作特征来判断其行为是否可疑或危险。

在使用视频监控系统算法时,我们需要注意以下几点技巧。

首先,合理设置算法的参数。

不同的场景和需要会有不同的要求,我们可以根据实际需求调整算法的参数,如灵敏度、阈值等,以达到更好的效果。

其次,选择适合的算法。

不同的算法适用于不同的应用场景,我们需要根据实际情况选择适合的算法,以提高算法的准确性和效率。

此外,对于大规模的视频监控系统,我们可以考虑使用分布式算法和GPU加速等技术,以提高系统的并行处理能力和效率。

行为识别分析是视频监控系统中非常重要的应用之一,它可以通过对目标的运动和动作进行分析,来判断其行为是否可疑或危险。

在行为识别分析中,我们需要掌握一些常见的方法和技巧。

首先是基于规则的方法,通过定义一系列的规则来判断目标的行为是否符合预期,如禁止进入某个区域、禁止停留等。

这种方法简单直观,但需要手动设置规则,不适用于复杂场景。

其次是基于机器学习的方法,可以通过训练一个分类器来判断目标的行为类别,如奔跑、打架、偷窃等。

这种方法需要大量的训练数据和复杂的特征工程,但可以适应更复杂的场景。

最后是基于深度学习的方法,可以通过深度神经网络来学习目标的行为模式,如异常行为检测、人物识别等。

基于模式识别的视频内容分析技术综述

基于模式识别的视频内容分析技术综述

基于模式识别的视频内容分析技术综述随着互联网和数码媒体的快速发展,视频资源的数量和规模不断增长。

然而,由于视频数据本身的多样性和复杂性,直接利用人力进行视频内容分析变得困难且低效。

因此,基于模式识别的视频内容分析技术应运而生,其通过利用计算机视觉、模式识别和机器学习等相关领域的方法与技术,实现对视频内容的自动分析与理解。

本文将对基于模式识别的视频内容分析技术进行综述,探讨其应用领域、关键技术以及挑战与未来发展方向。

一、视频内容分析的应用领域基于模式识别的视频内容分析技术已广泛应用于各个领域,包括视频监控、视频搜索与检索、视频目标识别与跟踪、视频内容理解与解释等。

其中,视频监控是最早应用该技术的领域之一。

通过使用模式识别算法,可以实现对监控视频中的异常情况、目标物体和行为的检测与分析。

视频搜索与检索则是基于视频内容的相关性进行检索,利用模式识别技术将视频内容与用户查询进行匹配,提供相关的搜索结果。

视频目标识别与跟踪则是利用模式识别技术对视频中的目标物体进行检测、识别与跟踪,常用于智能交通、视频安防等领域。

此外,视频内容理解与解释是基于模式识别的视频分析的一个重要研究方向,旨在实现对视频内容的高层次理解与解释,如视频语义理解、情感分析等。

二、视频内容分析的关键技术基于模式识别的视频内容分析技术的核心是计算机视觉、模式识别和机器学习等相关领域的技术,下面将介绍其中的一些关键技术。

1. 视频特征提取与表示视频特征提取是视频内容分析的首要任务,通过将视频的低层次视觉特征转换为高层次的语义特征,实现对视频内容的理解。

常用的视频特征包括颜色特征、纹理特征、形状特征等。

视频特征的表示方式有多种,如Bag of Visual Words模型、时空金字塔模型等。

2. 视频目标检测与识别视频目标检测与识别是视频内容分析的重要任务,其目标是检测和识别视频中的目标物体。

常用的方法包括基于深度学习的目标检测方法,如Faster R-CNN、SSD等。

视频监控中的行为识别与分析

视频监控中的行为识别与分析

视频监控中的行为识别与分析随着科技的发展和社会的进步,视频监控系统在我们日常生活中扮演了越来越重要的角色。

与传统的监控相比,视频监控系统不仅可以提供更清晰、更广角度的画面,还能通过先进的图像处理技术进行行为识别与分析,从而提高监控的智能化水平。

本文将重点讨论视频监控中的行为识别与分析技术以及其在不同领域中的应用。

行为识别与分析是指通过对视频监控中的行为进行自动识别和分析,从而实现对异常行为的判断和预警。

视频监控中的行为可以分为人体行为和非人体行为两大类。

在人体行为方面,传统的行为识别主要基于目标检测和跟踪技术,通过对视频中的人体目标进行分析来实现行为识别。

例如,对于监控场景中发生的各类人体动作,如走路、奔跑、摔倒等,可以基于目标检测和运动轨迹分析来自动识别并进行报警。

随着深度学习技术的发展,基于卷积神经网络的行为识别方法也逐渐成为主流,该方法通过网络自动学习行为特征,实现对复杂行为的准确识别和分类。

在非人体行为方面,主要包括车辆行为和物品行为的识别与分析。

对于车辆行为识别,智能视频监控系统可以通过车牌识别、车辆轨迹分析等手段,实现对车辆的实时追踪和异常行为的监测,如超速、占道等。

对于物品行为识别,系统可以通过对监控场景中的物体进行跟踪和分析,实现对物品的移动、出现、消失等行为进行监测和报警。

视频监控中的行为识别与分析技术在安防领域中有着广泛的应用。

首先,它可以帮助安防人员提高监控效率和工作质量。

传统的监控需要人工对大量监控画面进行观察和判断,工作量大且容易出现疏漏,而行为识别与分析技术可以实现对异常行为的自动识别和报警,极大地减轻了安防人员的工作负担。

其次,行为识别与分析技术可以帮助安防人员提前发现潜在的安全隐患。

例如,在人群密集的公共场所中,如果有人突然奔跑或摔倒,系统可以即时识别并发出报警,便于及时采取措施防止事态扩大。

此外,行为识别与分析技术还可以辅助犯罪侦查工作,通过对案发现场的监控画面进行分析,帮助警方获取犯罪嫌疑人的特征信息和行动轨迹。

视频监控中的人员行为分析与识别

视频监控中的人员行为分析与识别

视频监控中的人员行为分析与识别视频监控技术的广泛应用已经成为了现代社会中不可或缺的一部分,为了提高监控效率和准确性,人员行为分析与识别技术逐渐被引入到视频监控系统中。

本文将从视频监控中的人员行为分析、人员行为识别及其应用方面进行探讨。

视频监控中的人员行为分析是指通过对视频中人员的行为、动作、姿态等进行分析,挖掘出其中蕴含的信息并进行处理。

人员行为分析主要包括目标检测、行人跟踪、行人计数、姿态识别等多个方面的内容。

通过这些分析,可以对视频中的人员行为进行全面、准确的了解,从而帮助监控人员更好地掌握场景中的情况。

人员行为识别是指通过对视频中的人员特征进行分析,进行人员身份的识别和辨别。

常见的人员行为识别技术包括人脸识别、行人重识别、人员属性分析等。

人脸识别技术通过分析人脸的特征点和纹理等信息,对目标进行身份识别。

行人重识别技术则通过对行人行走的姿态和外貌进行分析,判断是否为同一人。

人员属性分析则是通过对人员的服装、性别、年龄等进行分析,对目标进行进一步的区分和识别。

人员行为分析与识别技术在各个领域都有着广泛的应用。

在交通领域中,人员行为识别可以用于交通监管,通过识别交通违法行为,提高交通管理效率。

在安防领域中,人员行为分析与识别可以用于对可疑人员的识别和跟踪,提高安全防范能力。

在商业领域中,人员行为分析与识别可以用于对顾客行为的分析,帮助商家更好地了解消费者需求,提高销售额。

在智慧城市建设中,人员行为分析与识别可以用于人流分析、交通疏导等方面,提升城市管理水平。

然而,人员行为分析与识别技术也面临着一些挑战和难点。

首先是复杂场景下的误检问题。

复杂场景中,光线、阴影、遮挡等因素会影响人员行为的准确分析和识别。

其次是大数据处理问题。

视频监控在实时采集视频数据时会产生大量的数据,如何快速、准确地对数据进行分析和识别,是当前亟需解决的问题。

此外,隐私问题也是人员行为分析与识别技术面临的一大挑战。

在利用这些技术的过程中,如何保护个人隐私,合理使用这些数据,是一个需要深思熟虑的问题。

视频监控中的行为识别与异常检测

视频监控中的行为识别与异常检测

视频监控中的行为识别与异常检测随着科技的不断进步和应用领域的拓展,视频监控系统在日常生活和工作中扮演着越来越重要的角色。

在各种场景下,通过视频监控可以及时发现并记录各种行为活动,从而为安全管理和事后调查提供有力的支持。

然而,对于人工来说,对大量视频数据进行连续监控和分析是一项巨大的挑战。

因此,行为识别与异常检测技术的应用逐渐受到人们的关注和重视。

行为识别是指通过对视频数据进行分析,从中识别出特定行为或动作,并将其与已知的模式进行比对。

这种技术可以应用于各种领域,如公共安全、交通管理、智能建筑等。

基于视频监控的行为识别系统可以有效地检测和识别各种人类行为,如行走、跑步、站立等,甚至可以识别特定的运动或动作,如拿取物品、打开门窗等。

为了实现行为识别,一种常用的方法是利用计算机视觉和图像处理技术。

首先,需要使用摄像机收集视频数据,并将其转换为数字信号。

然后,利用图像处理算法,提取视频数据中的特征。

特征可以是视频中的物体、动作、轮廓等。

接下来,利用机器学习算法,对特征进行分类和识别,以确定视频中是否存在特定的行为。

为了改善行为识别的准确性和鲁棒性,研究者们还提出了一些改进方法。

例如,使用多个摄像机进行视频采集,可以提供更多的视角和信息,从而提高识别精度。

此外,还可以利用深度学习技术,如卷积神经网络,自动学习和提取视频数据中的特征。

这种方法基于大量的视频数据进行训练,可以识别复杂的行为模式,并具有较高的准确性。

除了行为识别外,异常检测也是视频监控中重要的应用之一。

异常检测是指从视频数据中识别出与正常模式相悖的行为或活动。

在监控摄像头无法实时观察的场景下,异常检测可以帮助安保人员及时发现和响应异常事件,提高安全性。

异常检测通常采用基于统计学的方法。

首先,收集一段时间内的正常视频数据,通过统计分析建立正常行为的模型。

然后,将新的视频数据与模型进行比对,如果发现某些行为或活动不符合模型的规律,就可以判定为异常。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2018年6月Journal on Communications June 2018 第39卷第6期通信学报V ol.39No.6视频行为识别综述罗会兰,王婵娟,卢飞(江西理工大学信息工程学院,江西赣州 341000)摘 要:目前行为识别发展迅速,许多基于深度网络自动学习特征的行为识别算法被提出。

深度学习方法需要大量数据来训练,对电脑存储、运算能力要求较高。

在回顾了当下流行的基于深度网络的行为识别方法的基础上,着重综述了基于手动提取特征的传统行为识别方法。

传统行为识别方法通常遵循对视频提取特征并进行建模和预测分类的流程,并将识别流程细分为以下几个步骤进行综述:特征采样、特征描述符选取、特征预/后处理、描述符聚类、向量编码。

同时,还对评价算法性能的基准数据集进行了归纳总结。

关键词:行为识别;手动提取;深度网络;数据集中图分类号:TP391文献标识码:Adoi: 10.11959/j.issn.1000-436x.2018107Survey of video behavior recognitionLUO Huilan, WANG Chanjuan, LU FeiSchool of Information Engineering, Jiangxi University of Science and Technology, Ganzhou 341000, China Abstract: Behavior recognition is developing rapidly, and a number of behavior recognition algorithms based on deep network automatic learning features have been proposed. The deep learning method requires a large number of data to train, and requires higher computer storage and computing power. After a brief review of the current popular behavior recognition method based on deep network, it focused on the traditional behavior recognition methods. Traditional be-havior recognition methods usually followed the processes of video feature extraction, modeling of features and classifi-cation. Following the basic process, the recognition process was overviewed according to the following steps, feature sampling, feature descriptors, feature processing, descriptor aggregation and vector coding. At the same time, the bench-mark data set commonly used for evaluating the algorithm performance was also summarized.Key words: behavior recognition, handcrafted, deep network, data set1引言人体行为识别是指利用模式识别、机器学习等方法,从一段未知的视频中自动分析识别人体执行的行为。

最简单的行为识别也称为行为分类,它可以将未知视频中的人体行为分类到预先定义的几种行为类别中。

较为复杂的行为识别是指识别视频中多个人体正在交互进行的群体活动。

行为识别的最终目标是自动分析视频中有什么人,在什么时刻、什么地方做了什么事情。

人体行为识别在安防、交通管理、智能看护、娱乐休闲等现实生活中应用广泛。

目前,行为识别的研究方法主要有2种:一种是基于手动提取特征的方法,另一种是基于深度网络学习特征的方法。

2种方法各有长短,基于手动提取特征的方法能够根据需要提取相应的特征,实现简单,但行为的表示能力也受所提取特征的限制;基于深度网络学习特征的方法能够自动学习特征,但需要大量数据支撑,不适于小型数据集处理,收稿日期:2018-01-29;修回日期:2018-05-16基金项目:国家自然科学基金资助项目(No.61105042, No.61462035);江西省自然科学基金资助项目(No.20171BAB202014)Foundation Items: The National Natural Science Foundation of China (No.61105042, No.61462035), The Natural Science Founda-tion of Jiangxi Province (No.20171BAB202014)·170· 通 信 学 报 第39卷且整个过程是端到端的,像个黑盒子,不适于计算视觉领域的研究初学者熟悉图像、视频处理的基本技术和基本步骤。

Moeslund 等[1]按照行为的复杂程度将人体行为分为3个层级:基本动作、行为和活动。

基本动作指的是能在肢体层次上描述的基本运动;行为指的是由基本动作构成,描述一个可能是周期性的全身运动;活动包含许多后续动作,并对正在执行的动作进行解释。

例如,左腿向前是一个基本动作,跑步是一个行为,跨栏就是一个包括开始、跳跃和跑步动作的一个活动。

与此类似,文献[2]认为行为识别可以分为2类:一类是低层动作的识别,另一类是高层行为的识别,其还认为前者是后者的基础,并依此将行为识别方法分为2类进行综述。

Ji 等[3]按行为识别的步骤将其分成3个子问题:人体检测、与视觉无关的姿势表示和估计、行为理解,并对其进行了综述。

而Dhamsania 等[4]按照视频场景中的目标人物数对识别方法进行了分类,将其区分为单人行为识别、双人或人与物互动的行为识别以及多人行为识别。

Candamo 等[5]则讨论了交通监管视频场景中的行为识别问题:单人游荡识别、多人打架识别以及人与物体互动识别(如偷车、毁坏公共设施等)。

Poppe 等[6]将视频行为识别的问题转化为图像序列的识别分类问题,并讨论了图像的各种表示及分类方法。

有些综述着眼于讨论某一特定动作类识别问题。

Weinland 等[7]着眼于解决全身运动(如踢打、拳击等)识别问题的方法,并对这些方法按照如何表示动作的时空结构、如何对视频进行分割以及如何学习获得行为表示进行分类。

Chaudhary 等[8]着眼于解决手势识别问题的方法,比较分析了当前一些流行方法的实验结果。

为了让初学者更好地理解传统视频行为识别方法的基本流程及其与最新深度网络模型方法的区别,本文分别综述了传统手动提取特征方法和深度网络学习方法,并重点论述了基于手动提取特征表示的行为识别方法,按照流程就每个相对独立的步骤进行了总结归纳,然后在此基础上综述了当前流行的用于行为识别的深度学习模型。

主要贡献如下。

1) 对基于手动提取特征表示的行为识别方法进行了较为系统、全面的研究和分类,并对每类方法中的典型算法进行了阐述和分析。

2) 对2012年以来以卷积神经网络为代表的深度网络学习技术在行为识别中的应用进行了研究和阐述。

3) 对行为识别算法常用的基准数据集、算法性能评价指标进行了研究和介绍。

4) 讨论了行为识别中目前存在的、亟待解决的主要问题以及未来发展的趋势。

2 基于手动特征的行为识别方法基于手动提取特征的行为识别方法一般包含如图1所示的处理流程,即首先对视频进行采样,然后对样本提取特征,接着对特征进行编码,再对编码得到的向量进行规范化,最后训练分类。

2.1 特征采样方法一般而言,提取特征之前需要先对视频进行兴趣点采样,然后对采样兴趣点进行特征信息的提取。

采样方式有基于兴趣区域的采样、基于轨迹的采样和基于身体部分的采样等。

2.1.1 基于兴趣区域的采样基于兴趣区域的采样方法是指利用探测器检测视频的兴趣区域,从而提取特征描述的方法。

这类方法不需要对行为视频进行前景背景分割,也不需要对发生行为的人体进行精确的定位跟踪。

Laptev 等[9]提出对Harris 角点检测方法[10]进行时空扩展,在行为视频中进行Harris3D 兴趣点检测。

Harris3D 检测空间维与时间维上都具有显著变化的点区域,并自适应地选择兴趣点的时间尺度与空间尺度。

图2示例了对UCF101[11]数据库中画眼妆这个动作的兴趣点采样截图。

Oikonomopoulos 等[12]提出了一种基于时空显著点的行为表征方法:首先图1 基于手动提取特征的行为识别流程第6期罗会兰等:视频行为识别综述·171·计算行为视频中每个像素点对应的时空邻域的信号直方图的熵,然后将取得Shannon熵的局部极大值的位置点视为时空显著点。

以上2种方法检测到的采样点在空间尺度与时间尺度上都具有显著变化,但是视频中满足条件的采样点较少,这就导致采样得到的时空兴趣点比较稀疏,对后续的行为识别有一定的影响。

针对这种问题,Dollar等[13]提出了一种基于空间维上的高斯平滑滤波器与时间维上的Gabor滤波器的Cuboid检测方法,该方法检测出的时空兴趣点较为密集。

Rapantzikos等[14]提出使用离散小波变换,通过低通、高通滤波器的响应值来检测时空兴趣点。

后来Rapantzikos等[15]又提出引入运动信息与颜色信息进行时空显著点检测。

这些时空兴趣点检测方法均检测到了密集的时空兴趣点。

Willems等[16]提出将二维图像中的Hessian 显著点检测方法扩展到三维视频中,这种方法被命名为Hessian时空兴趣点检测方法,它使用3D Hessian矩阵的行列式来评估视频中各位置点的显著性。

Hessian时空兴趣点检测方法以一种非迭代的方式,自动选择兴趣点的时空位置与尺度。

这种方法能够检测到更为密集,且尺度不变的时空兴趣点。

(a) 原视频(b) Harris3D兴趣点采样图2 原视频与兴趣点采样对比2.1.2基于轨迹的采样伴随着人体运动的发生,会产生一条运动轨迹。

Wang等[17]提出沿着运动轨迹将轨迹邻域划分成细小的子空间,然后对每个子空间提取特征描述信息。

相关文档
最新文档