视频序列中的行为识别研究进展_徐勤军
视频流处理中的动作识别技术研究

视频流处理中的动作识别技术研究一、绪论随着人工智能和物联网技术的不断发展,视频流处理技术日益成熟,应用范围也越来越广泛。
在工业自动化、智能家居、智能交通、智能安防等领域,视频流处理技术的应用已经成为一种趋势,其中动作识别技术的应用也越来越广泛。
本文主要研究视频流处理中的动作识别技术,探讨其研究现状和未来发展方向。
二、动作识别技术的研究现状动作识别技术是指对人体在视频中的动作进行自动化的识别和分析。
目前,主要有以下几种方法:1.基于深度学习的动作识别方法深度学习是一种基于神经网络的机器学习方法,已经在动作识别中得到了广泛应用。
在这种方法中,首先需要采集一定数量和种类的人体动作数据,并对其进行标注,然后利用深度学习算法对其进行训练,最终得到一个能够对人体动作进行自动分类和识别的神经网络模型。
2.基于部件检测的动作识别方法在这种方法中,需要对人体的身体结构进行建模,并对其上的各个部位进行检测和识别。
通过对各个身体部位的运动轨迹进行分析和比较,可以对人体的动作进行识别。
3.基于时空动作描述的动作识别方法在这种方法中,需要将人体在视频中的运动轨迹进行时空建模,提取其时空特征,并进行分类识别。
这种方法可以对连续的动作进行识别,具有较高的识别准确度。
三、动作识别技术的应用场景动作识别技术的应用场景非常广泛,以下是几个常见的应用场景:1.工业自动化在工业生产中,动作识别技术可以通过对工人的动作进行识别和分析,提高工作效率、降低安全风险,并优化生产流程。
2.智能交通在公路交通中,动作识别技术可以通过对司机的动作进行识别和分析,了解其驾驶习惯和状态,预防交通事故的发生。
3.智能家居在智能家居系统中,动作识别技术可以通过对人体的动作进行识别和分析,自动调节房间的温度、照明和音响等设备,提高生活品质。
4.智能安防在安防监控系统中,动作识别技术可以通过对人体的动作进行识别和分析,提高实时监控的精度和准确性,避免误报和漏报。
视频分析中的动作识别与行为分析研究

视频分析中的动作识别与行为分析研究第一章:引言在当今信息化的时代,视频分析技术成为了计算机视觉领域的研究热点之一。
视频中的动作识别与行为分析作为视频分析的重要内容,对于人类行为理解、安防监控、智能交通等领域都具有重要的应用价值。
本文将着重研究视频分析中的动作识别与行为分析,探讨其研究现状、方法和应用。
第二章:动作识别算法动作识别是指通过对视频中人体或物体进行特征提取和分类,进而识别出不同的动作行为。
目前,常用的动作识别算法包括基于像素的方法、基于特征的方法和基于深度学习的方法。
1. 基于像素的方法:该方法主要通过像素级别的运动信息来识别动作。
典型的方法有基于差分图像的方法和基于光流场的方法。
2. 基于特征的方法:该方法通过提取视频中的特征来描述动作,并将其输入分类器进行分类。
常用的特征包括形状特征、统计特征和时空特征等。
3. 基于深度学习的方法:该方法利用深度神经网络对视频进行学习和分类,具有较好的性能。
常用的方法包括2D卷积神经网络、3D卷积神经网络和循环神经网络等。
第三章:行为分析方法行为分析是指通过对视频中的人体或物体进行轨迹分析、行为模式推断等手段,对行为进行分析和理解。
常用的行为分析方法包括轨迹分析、时间序列建模等。
1. 轨迹分析:该方法主要通过对视频中目标的轨迹进行分析和建模来推断行为。
可以通过目标的速度、加速度等信息来进行行为分类。
2. 时间序列建模:该方法将视频序列映射为一系列时间序列数据,并采用时间序列分析的方法进行行为推断和分类。
常用的方法包括隐藏马尔可夫模型和条件随机场等。
第四章:应用领域动作识别与行为分析技术在各个领域都有广泛的应用。
以下列举几个典型的应用领域:1. 人类行为理解:动作识别与行为分析技术可以应用于人类行为理解领域,如行为识别、事件检测等。
通过对人类行为进行分析,可以更好地理解人类行为规律和心理状态。
2. 安防监控:动作识别与行为分析对于安防监控领域尤为重要。
视频分析中的动作识别与行为分析算法研究

视频分析中的动作识别与行为分析算法研究近年来,随着计算机视觉和机器学习的快速发展,视频分析已经成为一个重要的研究领域。
而在视频分析中,动作识别和行为分析算法是其中的重要组成部分。
本文将探讨动作识别与行为分析算法的研究现状和挑战,并讨论未来的发展方向。
动作识别是指从视频中识别出特定的人体动作或物体动作。
在视频分析中,动作识别对于解决目标跟踪、人机交互、运动分析等问题具有重要意义。
目前,动作识别算法主要分为基于传统计算机视觉方法和基于深度学习的方法。
基于传统计算机视觉方法的动作识别算法通常依赖于人工提取的特征和手工设计的分类器。
例如,常用的特征包括方向梯度直方图(Histogram of Oriented Gradients, HOG)、光流向量(Optical Flow)等。
这些方法在一些简单的场景下表现良好,但对于复杂的动作识别问题,这些方法的性能较差。
随着深度学习的兴起,基于深度学习的动作识别算法取得了巨大的进步。
深度学习的优势在于可以从大量数据中自动学习到特征和表示。
常用的深度学习模型包括卷积神经网络(Convolutional Neural Networks, CNN)和循环神经网络(Recurrent Neural Networks, RNN)。
通过在大规模的视频数据集上进行训练,这些模型可以从视频中学习到动作的复杂特征,并且取得了较好的识别性能。
然而,动作识别仍然存在一些困难。
首先,由于视频数据具有高维度和时序性的特点,构建一个既能处理静态图像又能处理时序信息的模型非常具有挑战性。
其次,由于动作类别的多样性和丰富性,不同动作之间的边界模糊,因此如何有效地表示和编码动作仍待解决。
另外,动作识别在实时性和鲁棒性上也面临一定的挑战。
行为分析是指从视频中分析出人类或其他事物的行为模式和性质,如行走、交互等。
行为分析算法在视频监控、智能交通等领域具有重要应用。
与动作识别类似,行为分析算法也可以分为基于传统计算机视觉方法和基于深度学习的方法。
基于视频内容分析的行为识别与行为分析研究

基于视频内容分析的行为识别与行为分析研究行为识别与分析在计算机视觉领域中扮演着重要角色,它对于视频监控、智能交通系统、行为操纵识别等应用具有广泛的应用价值。
随着计算机视觉技术的不断发展,基于视频内容分析的行为识别与分析引起了越来越多研究者的关注。
本文将重点围绕该任务展开讨论,并介绍一些与之相关的研究进展、方法和应用。
行为识别与分析旨在通过对视频内容的分析,识别和理解视频中人体或物体的行为,从而实现对行为目标的判别和分析。
其中,行为识别是指将输入的视频序列与预先定义的行为模式进行比对,判断视频中是否包含某种既定的行为或动作。
而行为分析则是通过对视频序列中的行为特征进行提取和分析,研究行为的方式、规律以及与其他因素的关联。
在行为识别与分析任务中,视频内容分析是关键的一步。
视频内容分析包括图像预处理、特征提取、特征选择、场景建模和分类器构建等步骤。
首先,图像预处理对输入的视频序列进行去噪、图像增强和帧同步等处理,为后续的特征提取提供干净的图像数据。
接着,特征提取是提取出图像中有关行为信息的关键步骤,常用的特征包括外形特征、运动特征和时空特征等。
然后,基于特征的选择和重要性排名可以降低计算复杂度,并筛选出最具代表性的特征,提高行为识别的准确性。
场景建模则是通过建立背景模型、移动目标检测等方法来进一步对视频进行处理,为行为特征的提取提供更准确的场景信息。
最后,通过构建分类器对提取的特征进行分类,并进行行为识别与分析。
近年来,随着深度学习技术的快速发展,基于视频内容分析的行为识别与分析也取得了可喜的进展。
深度学习的主要优势在于可以自动学习特征,并从大规模数据集中获取更为抽象和语义化的特征表示。
例如,基于卷积神经网络(CNN)的方法可以从原始的像素级数据中学习到更具代表性的图像特征,提高行为识别的准确性。
而基于循环神经网络(RNN)的方法则可以对时空序列数据进行建模,更好地捕捉行为的时序特征。
此外,由于神经网络的深度结构,深度学习方法可以应对复杂场景、多人行为等挑战,推动了行为识别与分析的研究和应用。
基于视频数据分析的人体行为识别研究

基于视频数据分析的人体行为识别研究随着社会的快速发展和科技的不断进步,人工智能技术不断地被应用到各个领域中,其中视频数据分析技术在人体行为识别方面有着广泛的应用。
人体行为识别是指通过监控视频数据中的行为动作,识别出人体运动的类别和状态。
这项技术可以在多个领域中得到应用,比如安防监控、智能家居、运动检测等。
视频数据分析技术通过图像处理和模式识别技术,能够对从视频监控中获取的数据进行智能分析。
主要包括视频目标检测、目标跟踪、动作识别、行为分析等多个领域。
其中,人体行为识别作为其中的一个重要应用方向,可以通过视频监控识别出行人的动作和行为特征,精准的判断行踪路线和动作状态,为相关应用提供有力支持。
在智能家居应用领域,人体行为识别技术可以被用来检测家庭成员的行为状态,比如和电器交互、睡觉、起床等。
基于这些信息,智能家居系统实现能够自动调节电器的开关状态、智能管控房间温度等功能。
在安防监控领域,人体行为识别技术能够对各种异常行为进行实时监测和警报,能够提高监控系统的预测能力,使安全监控工作更加快速和高效。
此外,在交通管控领域,人体行为识别技术可以被用来监测驾驶员的疲劳状态,及时发出警报,切实保障道路交通安全。
为了实现人体行为的识别,需要将视频数据拆分成图像序列,提取每个图像帧中的主体运动特征,再通过强化学习或深度学习等技术分析数据。
在目标跟踪领域,重要任务之一是将每个 actor 跟踪到场景中的目标位置。
为了更有效的实现目标跟踪,可以采用多种算法,比如,mean shift、卡尔曼滤波、粒子滤波等跟踪算法。
该技术实现跟踪准确率,大幅度提高时空性能。
在动作行为识别方面,基于深度学习技术已经成为研究的主流方法。
常见的模型有卷积神经网络(CNN)、3D卷积神经网络(3D-CNN)、循环神经网络(RNN)、时序卷积神经网络(TCN) 等。
这些模型都是通过输入数据,对特征进行学习,较好地实现了实时识别。
总的来说,基于视频数据分析的人体行为识别技术为我们日常生活的安防监控、智能家居和交通管控等方面带来了不少变化。
基于深度学习的视频行为分析与识别技术研究

基于深度学习的视频行为分析与识别技术研究近年来,随着深度学习技术的快速发展,视频行为分析与识别技术已经成为计算机视觉领域一个重要的研究方向。
视频行为分析与识别技术的发展,具有广泛的应用价值,包括视频监控、智能交通、人机交互等领域。
本文将从深度学习的角度出发,探讨基于深度学习的视频行为分析与识别技术的研究进展和挑战。
深度学习是一种以人工神经网络为基础的机器学习方法,它模仿人脑的神经网络结构,通过多层次的网络结构和大规模数据集的训练,能够实现复杂的模式识别和特征提取。
在视频行为分析与识别中,深度学习的应用主要集中在两个方面:动作识别和行为分析。
首先,动作识别是指对视频中的特定动作进行准确的识别和分类。
传统的方法主要基于手工设计的特征提取算法,即从视频中提取人工设计的特征,然后利用机器学习方法进行分类。
然而,传统的方法往往需要人工设计特征,并且对于复杂的视频行为识别效果有限。
而基于深度学习的动作识别方法,能够从原始视频数据中自动学习到更有表征力的特征,从而提高动作识别的准确性。
常用的深度学习模型包括卷积神经网络(CNN)和循环神经网络(RNN)。
CNN主要用于提取空间特征,而RNN则用于对动态行为进行建模。
通过将CNN和RNN结合起来,可以有效地对复杂的视频动作进行准确的识别。
其次,行为分析是指对连续视频中的行为进行建模和识别。
行为分析通常需要对视频序列进行时间建模,并进行行为的识别和分类。
基于深度学习的行为分析方法主要是通过对整个视频序列进行建模,将序列中的时空信息进行联合学习。
为此,一种常用的方法是长短期记忆网络(LSTM),它能够有效地捕捉视频序列中的时序信息,并对行为进行分类。
此外,为了提高行为识别的准确性,还可以引入时空注意力机制,对重要的时空信息进行关注。
然而,基于深度学习的视频行为分析与识别技术仍然面临一些挑战。
首先,深度学习方法需要大量的标注数据进行训练,而对于视频行为分析这样的任务,标注数据的获取相对困难,人工标注的成本较高。
如何进行视频编码的人物行为识别与分析(一)

在当今数字化的时代,视频编码技术得到了广泛的应用。
视频编码技术使得我们能够将大量的视频数据进行压缩和传输,为人们带来了更加流畅的观看体验。
然而,单纯的视频编码只能实现对画面的压缩,无法对视频中的人物行为进行识别和分析。
因此,如何进行视频编码的人物行为识别与分析成为了一个重要的研究方向。
一、了解视频编码的基本原理在探讨人物行为识别与分析之前,我们先来了解一下视频编码的基本原理。
视频编码是将连续的图像序列压缩为数字数据的过程。
常见的视频编码标准有和等。
在视频编码中,关键帧和非关键帧起着重要的作用。
关键帧是视频序列中的一个完整的图像,而非关键帧则是对前一帧或者前几帧进行差异编码得到的。
了解这些基本原理对于后续的人物行为识别与分析非常重要。
二、人物行为识别与分析的挑战人物行为识别与分析是一个具有挑战性的任务。
首先,视频中的人物行为是多样的,涉及到人体姿势、表情、动作等多个方面。
其次,视频编码后的数据存在信息损失,导致人物行为的细节被模糊化。
此外,视频中可能还存在一些干扰因素,如光照条件的变化、背景噪声等。
因此,如何从编码后的视频数据中准确地分析和识别人物行为成为了一个具有挑战性的问题。
三、人物行为识别与分析的方法为了准确地进行人物行为识别与分析,研究人员提出了各种各样的方法。
其中一种常见的方法是使用计算机视觉和机器学习的技术。
通过对视频序列中的每个帧进行图像处理和特征提取,然后使用机器学习算法进行分类和识别。
这种方法可以充分利用视频编码后的数据,提取出人物行为的特征,并进行准确的识别。
除了计算机视觉和机器学习的方法,还有一些其他的技术可以用于人物行为的识别与分析。
例如,深度学习技术在人物行为识别与分析中也取得了一定的进展。
深度学习可以通过多层次的神经网络来学习和提取视频中人物行为的特征,从而实现准确的识别和分析。
四、应用前景与挑战人物行为识别与分析在很多领域都有着重要的应用前景。
首先,人物行为识别与分析可以应用于视频监控系统中。
视频中人体行为识别研究

视频中人体行为识别研究视频中人体行为识别研究近年来,随着计算机视觉和深度学习技术的快速发展,对于视频中人体行为的识别与分析成为了一个备受关注的研究领域。
人体行为识别的研究不仅具有学术价值,而且在很多实际应用中具有重要的意义。
人体行为识别是指通过分析视频中人体的姿势和动作,来推断人类在不同环境下的行为和意图。
这项研究具有广泛的应用领域,包括智能监控、人机交互、虚拟现实、医疗健康等。
例如,在智能监控中,通过对视频中人体行为的识别,可以实时监测异常行为或者危险行为,从而提高安全性。
在人机交互领域,通过识别用户的手势和动作,可以实现自然而直观的交互方式,提高用户体验。
视频中人体行为识别的研究主要分为两个方向:姿势识别和动作识别。
姿势识别是指从图像或视频中提取出人体的姿势信息,例如人体的关节点、角度等。
动作识别则是在姿势的基础上,进一步推断出人体的具体行为,例如走路、跑步、打电话等。
对于姿势识别的研究,目前主流的方法是基于深度学习的姿势估计算法。
这些算法先通过深度卷积神经网络(CNN)对图像进行特征提取,然后通过回归或分类网络来估计人体的关节点位置。
其中,最经典的方法是使用卷积神经网络作为特征提取器,再将提取到的特征输入到全连接层进行回归或分类。
此外,还有一些基于图像配准或图像变形的方法,通过对图像进行变换,提取出人体的姿势信息。
而对于动作识别的研究,主要是通过深度学习的时序模型来对视频序列进行建模。
最典型的方法是使用循环神经网络(RNN)或卷积神经网络(CNN)来建模视频序列,通过学习视频序列的时空信息,来推测出人体的具体行为。
此外,还有一些基于3D卷积神经网络的方法,可以直接对视频中的时空信息进行建模,提高动作识别的准确性。
然而,视频中人体行为识别仍然存在一些挑战。
首先,视频中的人体行为往往是多模态的,包括姿势、动作、表情等多个方面的信息。
如何有效地将这些多模态信息融合起来,并提高识别的准确性,是一个困扰研究者的难题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Research progress on activity recognition in video
Xu Qinjun Wu Zhenyang
( School of Information Science and Engineering,Southeast University,Nanjing,210096)
3 ) Stanford university 2010 年 发 布 Olympic sports dataset UCF sports action dataset[10],包含了运 动员的各类运动视频。视频都是从 YouTube 上下 载的,包含有 16 个运动类别的 50 个视频,标记信 息为运动类别。
第 28 卷 第 4 期 2014 年 4 月
电子测量与仪器学报 JOURNAL OF ELECTRONIC MEASUREMENT AND INSTRUMENTATION
DOI: 10. 13382 / j. jemi. 2014. 04. 001
Vol. 28 No. 4 · 343 ·
视频序列中的行为识别研究进展*
总体而言,数据库的动作类别越来越多,样本 越来越多,数据库也更庞大,视频场景越来越复杂。 较早的数据库,比如 KTH,视频背景较简单,动作 类别不多,相机固定,这使得现有的算法很容易达 到饱和,不好区分算法的优劣。最近几年发布的数 据库有如下几个趋势: 背景嘈杂,视角不固定,甚至 相机是运动的; 样本涉及到人人交互,人物交互; 行 为类别数较最早发布的数据库多了很多,总之是更 接近于不受控的自然状态下的情景,这对于算法的 鲁棒性提出了很大的挑战。
另外,2011 年由以色列 Weizmann institute 和 Open University of Israel 共同发布了动作相似度数 据库( action similarity labeling,ASLAN) [14],数据库 包含了从互联网上收集的许多视频,涵盖了 400 多 个复杂动作类别,样本数达到 3 697 个。提出这个 数据库的目的是理解是什么使得动作不同或者相 似。从更广的角度看,动作识别和动作探测,都与 动作之间是否相似有关,两个动作如果相似度高就 归为一类,一个动作如果与所有模型都不相似,即 可认定是一个异常的行为发生。因此,研究动作之 间是否相似,因何相似,是很有意义的。
Abstract: Human activity recognition in video sequences is a very active research field of computer vision with broad application prospects in visual surveillance,human-computer interaction,medical care,video retrieval and etc. In this paper a comprehensive analysis of recent developments of activity recognition is given. Firstly,the different characteristics of current mainstream databases are analysed. Then the methods of the feature representation and the latest progress of the recognition algorithms are summarized. Especially,as the real applications require algorithm capable of fast,atomatic and real-time processing,and it is difficult to label a lot of videos manualy,unsupervised learning earns more and more attention. Finally,some detailed discussions on research challenges and future directions in activity recognition are also provided. Keywords: activity recognition; computer vision; pattern recognition; video semantic information ; machine learning
2005 年,以色列 Weizmann institute 又发布了 新 的 Weizmann actions as space-time shapes dataset[7],简 称 Weizmann 数 据 库。数 据 库 包 含 了 10 个动作,每个动作有 9 个不同的样本。视频的视角 是固定的,背景相对简单,每一帧中只有 1 个人做
徐勤军 吴镇扬
( 东南大学信息科学与工程学院 南京 210096)
摘 要: 视频序列中的行为识别是计算机视觉领域非常活跃的研究方向,在视频监控、人机交互、医疗看护、视频检索等领 域有着广阔的应用前景。综合分析了行为识别的研究进展,首先分析了目前主流的行为识别数据库的不同特点; 然后总结 了行为的特征表示方法以及识别方法的最新进展,由于实际应用要求算法具有快速、自动和实时性,且人工标定大量视频 存在困难,无监督的学习方法受到越来越多的关注; 在此基础上,讨论了行为识别面临的挑战,以及今后的研究发展方向。 关键词: 行为识别; 计算机视觉; 模式识别; 视频语义信息; 机器学习 中图分类号: TN911; TP391 文献标识码: A 国家标准学科分类代码: 520. 2040
· 344 ·
电子测量与仪器学报
第 28 卷
献。谷军霞等[1]将行为的识别算法分为两类: 一类 是基于模板匹配的算法,一类是基于状态空间的算 法。Weinland 等[2]根据如何表示动作的空间结构 和时间结构,如何从输入的视频数据中分割动作以 及如何学习动作的与视角无关的表示方法等角度 对算法做了分类总结。Ryoo 等[3]将行为识别方法 分为单层方法和多层方法,其中单层方法对应于简 单动作的 识 别,多 层 方 法 用 于 复 杂 的 人-物,人-人 交互的行为识 别。 文 献[4]针 对 行 为 的 自 动 监 控 从社会信号处理( social signal process) 的角度综述 了在监控领域的最新研究进展,以及面临的挑战, 并指出计算机技术和社会学理论的交叉可能会提 供有效的研究策略。与上述文献不同,主要从数据 库、特征表示以及识别方法 3 个方面对行为识别的 最新进展进行了综合分析,并提出了今后可能的发 展方向,以期对进一步的研究有所帮助。
2) 美 国 University of central Florida ( UCF) 自 2007 年以来发布的一系列数据库[5-9]: UCF sports action dataset,UCF Youtube action database,UCF50, UCF101 ,引起 了 广 泛 关 注。 这 些 数 据 库 样 本 来 自 从 BBC / ESPN 的广播电视频道收集的各类运动样 本、以及从互联网尤其是视频网站 YouTube 上下载 而来的样本。其中 UCF101 是目前动作类别数、样 本数最多的数据库之一,样本为 13 320 段视频,类 别数为 101 类。
动作。数据库中标定数据除了类别标记外还包括: 前景的行为人剪影和用于背景抽取的背景序列。
KTH 和 Weizmann 数据库是行为识别领域引 用率最高的数据库,对行为识别的研究起了较大的 促进作用。当然,这两个数据库的局限性也是很明 显的,由于背景比较简单,没有包含相机运动,动作 种类也较少,并且每段视频只有 1 个人在做单一的 运动,这与真实的场景差别很大。此后,许多更复 杂的,贴近真实环境的视频数据库发布了出来,这 推动了研究人员在真实场景下的行为识别的研究。 比较具有代表性的有:
2 视频数据库
自 2001 年以色列 Weizmann institute 发布基于 事件的分析数据库以来,尤其是 2005 年以后,许多 行为和动作视频数据库陆续公开发布,使得研究者 可以在相同的条件下对比算法的性能,这对于计算 机视觉研究的发展起了很大的推动作用[5]。各个 数据库在拍摄场景、相机是否固定、行为数目以及 样本个数等方面差异很大,根据视频数据的复杂程 度可把数据库分为两类: 受控环境下的数据库,以 及真实场景下的数据库。
处理,从中挖掘有用的信息,甚至从大规模的视频 数据中发现关联的信息,检测和识别出感兴趣的目 标和行为,已成为当前图像处理和计算机视觉研究 领域的一个热门课题。视频序列的行为识别在诸 如视频监控、人机交互、医疗看护、视频检索等领域 有着广泛的应用前景,这进一步促进了对行为识别 的研究。
目前,已 有 一 些 关 于 行 为 识 别 方 面 的 综 述 文
1) 法国 IRISA 研究院发布的 Hollywood、Hollywood-2[8]数据库。 早 先 发 布 的 数 据 库 基 本 上 都 是 在受控 的 环 境 下 拍 摄 的,所 拍 摄 视 频 样 本 有 限。 2009 年发布的 Hollywood-2[8]是 Hollywood 数据库 的 1 个拓展,包含了 12 个动作类别和 10 个场景共 3 669 个样本,所有样本均是从 69 部 Hollywood 电 影中抽 取 出 来 的。 视 频 样 本 中 行 为 人 的 表 情、姿 态、穿着,以及相机运动、光照变化、遮挡、背景等变 化很大,接近于真实场景下的情况,因而对于行为 的分析识别极具挑战性。