运动目标跟踪技术综述
目标跟踪方法综述

目标跟踪方法综述目标跟踪是计算机视觉领域一项重要的任务,它能够检测与跟踪目标,研究者们积极地探索并利用计算机视觉技术来解决该问题。
近年来,随着深度学习取得的成功,使得目标跟踪技术有了新的突破,并受到众多研究者的关注。
首先,根据背景抑制算法和模板匹配算法的思想,目标跟踪技术发展出基于跟踪器的传统视觉跟踪技术,其中包括基于随机样本极点算法、距离变换特征跟踪算法和基于加权和表示的跟踪算法,如Sparse Representation-based Tracking (SRT)等,并将它们用于实时的目标跟踪,大大提高了跟踪的准确度。
其次,基于深度学习的目标跟踪技术不仅提高了跟踪的准确性,同时也使得更多任务的实时性得到改善,从而取得良好的实验结果。
目前,已经有大量研究人员借助深度学习思想探索目标跟踪技术,其中有一些使用深度卷积神经网络(DCNN)、多种有效的目标匹配策略、透视反置变换等,以优化底层跟踪器,有效地提升了跟踪的性能。
另一方面,研究者也采用了空间序列学习技术来解决追踪结果的鲁棒性问题,并使用辨认技术来跟踪目标,以获得最佳的跟踪和识别结果。
最后,在无监督的情况下,研究者们也开发了一些目标跟踪技术。
他们利用Bellman,Kalman和Particle滤波技术等先进的数学方法来深入分析图像序列,有效地提升了目标跟踪的性能。
总之,采用传统技术和深度学习技术不仅提高了目标跟踪的准确度,同时也实现了实时的目标跟踪,为计算机视觉的发展提供了重要的技术支持。
至今,计算机视觉技术仍受到众多研究人员的关注,希望未来能改进系统的准确性以及运行的鲁棒性,使其能在实际的应用中发挥最佳的效果。
运动目标检测与跟踪

背景差方法
背景差分法假定背景是静止不 变的,因此背景不随帧数而变。
相减
二值化
后处理
结果
背景估计法
• 背景估计法适用于背景静止情况下的视频分割,其主要基 于以下两个假设:
假设1:在背景静止的情况下,若外界光照条件不变,且在不考虑噪 声的情况下,视频序列图像中的背景保持不变。 假设2:在目标可视的情况下,目标与背景的灰度之间存在着一定的 对比度。 • 根据假设1,在静态场景的条件下视频序列图像中不包含目标的完整 背景在每一帧都相同,由于运动目标会遮挡住一部分背景,所以每一 帧中的背景并不等于完整背景,关键技术就是根据一定的准则从连续 k帧图像中估计出该视频序列图像的完整背景。
根据假设2,运动目标与背景之间的灰度存在着一定的对比度,因此 在不考虑噪声的情况下,在差分图像中属于背景区域的像素的灰度值 为零,从而检测出了运动目标。
运动目标检测方法存在的实际应 用上的困难
1
运动阴影的 干扰
2
动态背景的 影响
3
场景光照的 变化
运动阴影的干扰
• 原因:由于阴影和目标都与背景的差别很大,并 且二者常有着相同的运动,阴影常被错划为运动 目标。
Contents
1
现状和应用
2
目标检测的相关技术
3
目标跟踪的常用方法
4
结语
现状
• 运动目标检测与跟踪是在基于动态图像分析的基 础上结合图像模式识别和图像跟踪方法对图像序 列中的目标进行检测—识别—跟踪的过程,它是 图像处理与计算机视觉领域中的一个非常活跃的 分支,在最近二十几年间,随着计算机技术、 CLSI技术与高分辨率传感技术,图像处理技术的 迅速更新,它在国名经济和军事领域的许多方面 有着广泛的应用。
常用运动目标跟踪方法介绍

2.6.常用运动目标跟踪方法介绍2.6.1基于区域匹配的跟踪方法如绪论中所介绍,基于区域匹配的跟踪方法14 6J的基本思想是将检测阶段经过目标分割后获得的含有运动目标的区域提取出来,并作为跟踪匹配的模板,同时定义目标的匹配度量方法。
在后续序列的待搜索图像帧中,通过匹配度量全图搜索与模板达到最佳匹配的区域,找到的使得匹配度量值最小的位置即可确定为目标在当前帧的位置,从而达到运动目标跟踪的目的。
可以看出,基于区域匹配的跟踪算法的关键在于搜索方法以及匹配度量方法的定义,选取合适的搜索算法和匹配距离的度量方法成为这类算法中不断改进的突破点。
目前常用的搜索算法一般被归为全局搜索和局部搜索这两大类。
全局搜索主要是针对整幅图像进行全图搜索,这种搜索算法可以保证搜索的准确性,匹配的准确率高。
但其对于大幅图像来讲,搜索全图十分耗时,难以应用到实际的跟踪系统中;局部搜索相比于全局搜索的逐点扫描,需要预先检测当前帧中的运动目标,然后只针对运动目标所存在的区域进行匹配,从而实现了运动目标的跟踪。
局部搜索省去了全图搜索所耗费的大部分时间,因此实时性很好,但其对于目标检测的精确度要求较高。
局部搜索还有一个难点问题在于,其抗遮挡性能低,如果运动目标在检测过程中互相遮挡或是被背景等遮挡,则易导致跟踪精度大大降低,严重时甚至会出现目标丢失的情况。
因此采用局部搜索方法时一般还需研究专门的遮挡消除算法。
该方法的另一个关键点在于如何定义匹配度量方法。
目前常用的匹配度量方法有亮度匹配法、形态距离匹配法以及外部轮廓匹配法等等。
亮度匹配主要是利用与颜色相关的特征如灰度、颜色值等,进行匹配度量;外部轮廓匹配主要是以目标的纹理、大致形状等为基准进行匹配度量。
基于区域匹配的跟踪方法由于提取了比较完整的目标模板,获得了更多的目标信息,因此其相比于其他跟踪算法,其更多的被用来对较小的或对比度较低的运动目标进行跟踪,尤其在军事领域有比较广泛的应用。
但其缺点也不容忽视:全局搜索的运算量大,局部搜索的遮挡问题等等,因此人们将运动预测方法结合到基于区域匹配的方法中,如Kalman预测,通过预测运动动目标在下一帧中可能出现的运动范围,进行局部搜索,从而提高了搜索的效率;而对于遮挡和阴影问题,则提出了利用彩色以及纹理等来解决。
第二章 运动目标监测和跟踪

第二章运动目标监测和跟踪2.1运动目标检测运动目标检测(Motion Detection)是指在输入视频图像中判断与背景图像相比是否存在相对运动的前景目标和物体,并根据灰度、边缘、纹理等二维图像特征将运动前景进一步分割为若干独立目标。
在实际应用中,一个好的运动目标检测算法,通常应该具有以下几个特征【12】:◆不受环境的变化(如天气和光照变化等)而影响结果;◆不受背景中个别物体的运动(如水波、风吹树动等)而影响结果;◆不受目标及背景中的阴影而影响结果;◆对复杂背景和复杂目标仍然有效;◆检测的结果应满足后续处理(跟踪分析)的精度要求;图2-1描述了检测算法的一般流程图。
常见的运动目标检测算法有:帧间差分法、背景差分法及光流法等,以下将分别进行介绍。
Fig.2—1Flow chart of detection algorithm2.1.1帧间差分法帧间差分法[23-241就是将视频序列中相邻的两帧或几帧做象素域上的减法运算,以得到帧间的不同图像的信息。
在摄像头固定的情况下,对连续的图像序列中的相邻两帧图像采用基于像素的帧差法来提取图像中的运动区域,设k 帧和第k+l 帧(或者看做21t t 和时刻)采集到同一背景下的两幅运动图像的灰度值为1),(+k k f y x f 和,则差分图像的定义为:),(),(),(11y x f y x f y x D k k k -=++ (2.1)对上式的差分结果进行阈值处理,就可以提取出运动物体。
对差分图像),(y x f d 二值化,当某一像素的灰度值大于给定阈值T 时,认为该像素为目标像素,即该像素属于运动目标;反之,则属于背景。
这一步的目的就是为了区分背景像素和目标像素,得到:T y x D T y x D k k k y x R >≤+++=),(),(10111{),( (2.2)其中,l 表示前景像素值,0表示背景像素值。
然后再对),(1y x R k +进行连通性分析,就可以得到连通区域的面积。
基于深度学习的RGB-T目标跟踪技术综述

基于深度学习的RGB-T目标跟踪技术综述基于深度学习的RGB-T目标跟踪技术综述一、引言随着计算机视觉和深度学习技术的快速发展,目标跟踪技术在各个领域的应用日益广泛。
在一些特殊环境下,如低光、强光、复杂背景等情况下,单一传感器的RGB目标跟踪技术往往无法满足需求。
因此,基于多传感器的RGB-T目标跟踪技术逐渐受到研究者的关注。
本文将综述基于深度学习的RGB-T目标跟踪技术的研究进展和应用情况,探讨其方法、挑战和发展方向。
二、多传感器的RGB-T目标跟踪技术1. RGB-T目标跟踪的定义和特点RGB-T目标跟踪是指通过同时利用RGB传感器和热红外(Thermal-IR)传感器的信息来实现目标的准确跟踪。
由于热红外传感器能够提供目标的热能信息,因此在特殊环境下,通过融合RGB和热红外传感器的信息,能够提高目标跟踪的鲁棒性和准确度。
2. RGB-T目标跟踪的挑战与传统的RGB目标跟踪技术相比,RGB-T目标跟踪面临着更大的挑战。
首先,由于RGB和热红外传感器之间存在信息差异,如颜色、纹理等特征的差异,导致传感器融合时的异构性问题。
其次,由于特殊环境下的光照、背景等干扰因素,导致目标在不同传感器下呈现出不同的外观。
因此,如何有效地融合不同传感器的信息,提高目标跟踪的鲁棒性和准确度,是RGB-T目标跟踪技术面临的关键问题。
三、基于深度学习的RGB-T目标跟踪技术1. 基础模型:卷积神经网络(Convolutional NeuralNetwork,CNN)CNN是深度学习中最重要的模型之一,其能够自动学习图像的高层特征。
在RGB-T目标跟踪中,通过将RGB和热红外图像输入CNN,可以得到更具有鲁棒性和准确度的特征表示。
2. 融合模型:多模态融合为了解决RGB和热红外传感器间的异构性问题,研究者们提出了多种多模态融合的方法。
其中,基于特征融合的方法通过将RGB和热红外图像的特征进行融合,得到更丰富的特征表示。
体育行业智能运动追踪

体育行业智能运动追踪智能技术的快速发展不仅仅影响了我们的日常生活,同时也对体育行业产生了巨大的影响。
体育行业智能运动追踪技术的引入,为运动员和教练员提供了全新的训练和竞技方式,帮助他们更好地实现个人和团队目标。
本文将深入探讨体育行业智能运动追踪技术的应用和影响。
一、智能运动追踪技术的概述智能运动追踪技术是指通过传感器、摄像头等设备对运动员的动作和身体数据进行实时跟踪和分析,并通过云端平台将数据反馈给用户。
这项技术的出现,极大地提高了运动员和教练员的数据收集和分析效率,有效帮助他们发现和解决技术问题,提高训练效果。
二、智能运动追踪技术在训练中的应用1. 动作分析:智能运动追踪技术可以通过对运动员动作的实时跟踪,对比运动员和技术要求的标准动作,提供准确的反馈和建议。
运动员能够更加直观地了解自己的动作问题,并通过针对性的训练来改善。
2. 数据统计:智能运动追踪技术可以实时收集运动员的身体数据,如心率、运动强度、速度等,帮助教练员全面了解运动员的身体状况和训练效果。
通过对数据的分析,教练员可以做出更加科学的训练计划,提高运动员的竞技水平。
3. 即时反馈:智能运动追踪技术可以实时将数据反馈给运动员和教练员,尽可能地减少信息传递的时间延迟。
运动员能够及时调整动作和训练方式,提高技术水平。
教练员能够根据即时反馈做出及时的指导和调整,提高团队整体表现。
三、智能运动追踪技术在竞技中的影响1. 提高比赛公平性:智能运动追踪技术可以对比赛中的运动员动作和规则进行全程监测,确保比赛的公平性和公正性。
对于存在争议的情况,技术可以提供准确的参考数据,帮助裁判做出公正的判决。
2. 增加观赏性:智能运动追踪技术可以实时显示运动员的数据和动作,让观众更好地理解比赛过程,增加观赏性和娱乐性。
观众可以通过智能设备获取实时数据,与运动员一起参与到比赛中,增加互动性。
3. 促进训练方法的改进:智能运动追踪技术不断积累和分析大量的运动数据,为科学研究和训练方法的改进提供了宝贵的资源。
运动目标的监测与跟踪论文
运动目标的监测与跟踪摘要: 对所要求的场景提出了一种检测运动物体,跟踪运动物体的方法。
用背景差分得到运动人体的区域, 通过卡尔曼滤波对人体进行跟踪,并给出实例关键词: 运动检测;运动跟踪;卡尔曼滤波1.概论视频图像分析主要是对运动图像序列进行分析处理,它通常涉及到运动检测、目标分类、目标跟踪及行为理解与描述几个过程。
其中,运动目标检测与跟踪处于整个视觉监视系统的最底层,是视频图像分析中最基本的方法,是各种后续高级处理如目标分类、行为理解等的基础。
视频图像指动态图像(moving-image),可以认为是随时间变化的静态图像序列(Still-frame-image/picture-Sequence)。
在静态图像中,信息密度随空间分布,且相对于时间为常量;而动态图像的空间信息密度特征随时间分布。
所以,在视频图像的目标识别中,既有静态图像处理的特点,可以借用静态图像处理的一些方法;同时还有动态图像自身的特点,即动态图像连续帧之间的相关性。
根据视频图像中摄像机和场景之间是否运动将物体的运动划分为四种模式:1摄像机静止一目标静止,这实际上就是静态场景,对其处理方法就是静态图像中的处理方法。
2.摄像机静止一目标运动,这是一类非常重要的动态场景,对其处理一般包括运动目标检测、目标特性估计等,主要用于预警、监视、目标跟踪等场合。
3.摄像机运动一目标静止,这主要用于机器人视觉导航、电子地图的自动生成以及三维场景理解等。
4.摄像机运动一目标运动,这是运动物体的检测和跟踪最复杂的一种情况,但也是最普通的情况,目前关于这方面的研究还较少,理论还不够成熟。
本试验中采用的物体运动模式为摄像机静止一目标运动模式[1] 一个运动物体跟踪系统的基本过程如下:1.在图像序列中检测出运动物体及运动区域2.对检测到的运动物体提取特征建立目标匹配模板3.计算目标的形心4.预测目标在下一时刻可能运动到的位置,确定目标在下一时刻的搜索范围5.在预测的搜索范围内,用前一时刻的模板进行匹配搜索,寻找最佳匹配位置,当在预测范围内未找到目标时需进行例外处理。
《智能监控系统中运动目标的检测与跟踪》范文
《智能监控系统中运动目标的检测与跟踪》篇一一、引言随着科技的快速发展,智能监控系统在各个领域得到了广泛应用。
其中,运动目标的检测与跟踪是智能监控系统的核心技术之一。
本文将详细探讨智能监控系统中运动目标的检测与跟踪技术,包括其基本原理、应用场景、算法实现以及面临的挑战和未来发展方向。
二、运动目标检测与跟踪的基本原理运动目标检测与跟踪是利用计算机视觉和图像处理技术,从监控视频中提取出运动目标,并对其进行连续跟踪的过程。
其基本原理包括运动目标检测、特征提取、目标匹配与跟踪等步骤。
1. 运动目标检测:通过分析视频序列中的像素变化,检测出运动目标。
常用的方法包括背景减除法、光流法、帧间差分法等。
2. 特征提取:从检测到的运动目标中提取出有用的特征信息,如形状、颜色、纹理等。
这些特征信息将用于后续的目标匹配与跟踪。
3. 目标匹配与跟踪:利用提取的特征信息,在连续的视频帧中对运动目标进行匹配与跟踪。
常用的算法包括基于滤波的方法、基于模型的方法、基于深度学习的方法等。
三、运动目标检测与跟踪的应用场景运动目标检测与跟踪技术在智能监控系统中有着广泛的应用场景。
以下是几个典型的应用场景:1. 交通监控:通过检测与跟踪道路上的车辆和行人,实现交通流量统计、违章行为识别等功能。
2. 公共安全:在公共场所安装监控系统,实时检测与跟踪可疑人员,提高安全防范能力。
3. 智能安防:通过检测与跟踪家庭或企业的出入人员,实现智能安防报警功能。
4. 体育赛事:在体育赛事中,通过检测与跟踪运动员的轨迹,为教练员提供实时数据分析,帮助制定更科学的训练计划。
四、算法实现运动目标检测与跟踪的算法实现主要包括以下几个步骤:1. 预处理:对原始视频进行去噪、增强等预处理操作,提高后续处理的准确性。
2. 运动目标检测:采用背景减除法、光流法或帧间差分法等方法,从视频中检测出运动目标。
3. 特征提取:从检测到的运动目标中提取出有用的特征信息,如形状、颜色、纹理等。
运动目标识别与跟踪算法研究
运动目标识别与跟踪算法研究摘要:目标识别与跟踪算法在计算机视觉和机器学习领域中扮演着重要的角色。
本文对运动目标识别与跟踪算法的研究进行了概述,并介绍了几种常见的算法。
通过分析这些算法的优缺点和应用场景,我们可以帮助读者选择适合自己的需求的算法。
1. 引言随着物体检测和跟踪技术的发展,越来越多的应用场景需要准确地识别和跟踪运动目标。
运动目标识别与跟踪算法是计算机视觉和人工智能领域的重要研究方向。
本文将介绍目标识别与跟踪算法的基本原理、常见方法以及其在实际应用中的意义。
2. 目标识别算法目标识别算法是对图像或视频中的物体进行检测和分类的过程。
常见的目标识别算法有传统的基于特征提取的方法和基于深度学习的方法。
2.1 基于特征提取的方法基于特征提取的方法主要包括颜色特征、纹理特征、边缘特征等。
这些特征能够描述目标的视觉特性,通过设置适当的阈值来检测目标并进行分类。
然而,基于特征提取的方法往往对环境的复杂性和目标的变化性较为敏感,效果较差。
2.2 基于深度学习的方法基于深度学习的方法在目标识别领域取得了显著的进展。
通过使用神经网络模型,深度学习算法可以自动学习图像中的特征,并分析目标的语义信息。
这种算法通常与卷积神经网络(CNN)和循环神经网络(RNN)等结构相结合,以提高目标识别的准确性和鲁棒性。
3. 目标跟踪算法目标跟踪算法是在目标检测的基础上,对目标在连续帧中的位置进行预测和跟踪。
常见的目标跟踪算法包括基于传统特征的方法和基于深度学习的方法。
3.1 基于传统特征的方法基于传统特征的目标跟踪方法使用目标检测的结果,对目标在连续帧中的位置进行预测和更新。
这些方法基于颜色、纹理、边缘等特征进行目标匹配和运动模型的更新。
然而,这些方法在处理复杂的场景和目标变化时,往往难以取得令人满意的结果。
3.2 基于深度学习的方法基于深度学习的目标跟踪算法通过端到端的学习方式,将目标的时空特征进行建模。
这些方法通过使用循环神经网络(RNN)和卷积神经网络(CNN)等结构,从连续帧中提取时序信息,并预测目标在未来帧中的位置。
3d目标跟踪综述
3d目标跟踪综述全文共四篇示例,供读者参考第一篇示例:3D目标跟踪是计算机视觉领域的一个重要研究方向,它旨在追踪三维空间中的目标,并实现对目标在空间中的位置动态跟踪。
目标跟踪在现实生活中有着广泛的应用,如自动驾驶、智能监控、增强现实等领域。
随着深度学习、传感技术和计算能力的不断进步,3D目标跟踪技术也取得了长足的发展,并在各个领域展现出了巨大的潜力。
在3D目标跟踪的研究中,一个关键问题是如何从视频序列或传感器数据中提取目标的位置、姿态和运动信息。
传统的2D目标跟踪技术通常只能提取目标在图像平面上的位置信息,而3D目标跟踪则要求获取目标在空间中的三维坐标信息。
为了实现这一目标,研究者们提出了各种不同的算法和方法,包括基于几何信息的方法、基于深度学习的方法、基于传感器融合的方法等。
在基于几何信息的方法中,研究者通常会利用单目或双目摄像头、激光雷达等传感器获取目标的深度信息,并使用几何学原理推断目标的位置和运动状态。
这类方法通常需要较为复杂的计算和较高的传感器精度,但在一些场景下能够取得很好的效果。
基于深度学习的方法则通过训练神经网络模型来学习目标的特征表示,并从中推断目标的位置和运动状态。
这类方法通常能够在大数据集上取得较好的效果,并且具有较强的泛化能力。
除了上述两种方法外,还有一些基于传感器融合的方法,如结合摄像头、激光雷达、GPS等传感器的数据来实现目标跟踪。
这类方法通常能够利用不同传感器的优势,提高跟踪的准确性和稳定性。
还有一些基于滤波器的方法,如卡尔曼滤波、粒子滤波等,用于融合传感器数据、估计目标状态和预测目标位置。
这些方法在实时性和鲁棒性方面有着较高的性能。
3D目标跟踪是一个积极发展的研究领域,涉及到多个学科领域的知识和技术,如计算机视觉、机器学习、传感技术等。
随着技术的不断进步和应用场景的扩大,我们相信3D目标跟踪技术将在未来发挥出更大的作用,并为人类社会的发展做出更大的贡献。
希望未来能够有更多的研究者参与到这一领域的研究中,共同推动3D目标跟踪技术的发展和应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
绪论 运动目标跟踪是一门多学科交叉的技术, 是计算机视觉领域的 一个重要课题, 它综合应用了图像处理 、 模式识别 、 自动控制 、 人工 智能等学科的理论知识。 运动目标跟踪, 是指给定一段视频序列, 在 该视频序列的每帧图像中实时地找到感兴趣的运动目标, 并评估其 运动轨迹。一般来说, 典型的目标跟踪系统一般包含的四个过程[1]: 目标初始化, 特征模版表示, 相似性度量和运动估计, 进行目标定 位。运动目标跟踪问题的难点如: 目标本身特征的多样性和不稳定 性、 外部环境的复杂多变性、 目标之间的遮挡等。 解决跟踪问题的关 键点在于: 完整地分割目标、 有效地表示目标和准确识别目标。 通过对于大量目标跟踪领域文献的阅读, 可以分析出之前较多 的目标跟踪综述文献[1][2][3]主要是从特征模版表示或不同跟踪算法等 角度对跟踪进行分类,但是对于读者对整个跟踪系统框架把握不 清。文章根据目标跟踪系统中实现过程, 从一种新颖角度总结出一 般的目标跟踪方法体系结构分为以下三个部分: (1 ) 运动目标的特 征选取和表示; (2 ) 运动目标跟踪常用算法框架; (3 ) 运动目标预测 算法。 目标跟踪算法一般的都不会超出这三个部分。 分别从这三个部 分进行跟踪算法的分析研究, 第一考虑选取不同的目标特征, 如颜 色、 纹理、 形状等; 根据选择目标特征, 运用合理的目标表示方法, 如 颜色直方图, 纹理直方图 、 轮廓特征模板等; 第二, 选择一种或几种 适合的跟踪算法框架。第三, 采用目标跟踪预测的方法更加合理准 确的找到目标。我们结合目标跟踪领域提出的许多方法, 论述了三 个部分如何有机组合实现有效的运动目标跟踪。此外, 文中所列举 的大量跟踪方法实例都可以从以上三个部分进行归类, 这将有助于 相关领域的研究人员清晰的把握目标跟踪技术脉络, 让研究人员尽 快的从以上三个方面进行深入研È É A B C D Å Â Æ Á Â Ã Ä E F G H Ç ! " # $ % & ' ( ) 0 1 ! 2 3 4 ! 5 6 7 8 9 @
2014 年第 18 期
科技创新
运动目标跟踪技术综述
仝晓龙 窦腾飞 刘艳红
- 18 -
科技创新
但是为了减少搜索特征 匹配或训练分类器分类方法进行目标跟踪。 匹配的区域, 提高实时性, 我们常常对目标运动轨迹预测选取最可 能的目标区域。状态评估公式: xt=f 和 zt=h 其中 xt 是 (xt-1, vt-1 ) (xt, w) t , f 是状态方程, vt-1 是过程噪声, zt 是当前观测值, h 是测量 当前状态, 方程, wt 是测量噪声。 一般常用预测方法有如,固定搜索窗半径 r (r 为大于 0 的实 数 ) , r 的大小是根据跟踪目标的不同设定的。我们以上一帧目标所 在位置为中心 r 为半径, 产生多个检测窗口进行当前帧搜索计算找 到最大可能的位置作为本帧目标位置。还可以统计之前 N (N=2, 3, … ) 帧跟踪的目标位置信息, 计算出目标运动的大致方向和速度, 预 判下一帧中可能的目标位置, 从而减少计算量。比较经典的预测方 法如: Ellis 等 2010 年提出线性回归预测算法, 、 Kalman 在 1960 年提 出的 Kalman 滤波器预测算法、 Isard 和 Blake 等 1998 年提出的粒子 滤波器预测算法, 选取最可能的目标区域。文章主要的任务是让读 者有一个关于跟踪目标算法清晰的思路, 快速的了解目标跟踪技术 关键要点。在这里不再具体的详述具体预测算法。 4 经典跟踪算法 一般的运动目标跟踪的实现, 必然是采用具体某种跟踪算法作 为依托 。首先, 文章将介绍的四种经典的运动目标跟踪算法: 基于 Mean Shift 目标跟踪; 基于卡尔曼滤波目标跟踪; 基于粒子滤波目标 跟踪; 基于支持向量机 SVM 分类学习目标跟踪。 人们目前常用的跟 踪方法一般都会采用这四种经典的跟踪算法一种或几种, 去实现运 动目标的高效、 稳定的跟踪。 然后, 文章列举的大量的实例依据文章 所提出的跟踪算法体系结构的组成部分进行分析分解, 这样做有助 于相关领域的研究人员,清晰的把握实例中采用的跟踪算法结构 。 最后, 介绍了近年来提出一些受到研究人员越来越多关注的新的跟 踪算法。 4.1 基于 Mean Shift 目标跟踪 Mean Shift (均值移动) 算法由 Fukunaga 于 1975 年在一篇关于 概率密度梯度函数的估计的文章中首次提出, 其含义为移动的均值 向量, 该算法计算简单, 实时性强, 对目标的形状变化 、 尺度变化不 敏感, 但是对颜色相近的干扰情况, 跟踪效果不够理想。Mean Shift 算法是一个迭代收敛的过程, 即计算当前点的偏移均值, 移动该点 到其偏移均值, 然后以此为新的起始点继续移动, 直到满足一定阈 值条件或迭代次数限制条件的约束 。Comaniciu 最早将 Mean Shift 算法应用于图像滤波、分割和目标跟踪领域。Camshift 算法是一种 基于均值漂移 (Mean Shift ) 的算法, 在连续帧上使用 Mean Shift 算 法就是 Camshift 跟踪算法。Camshift 同经典的均值移动跟踪算法的 基本思想是相同的, 所不同的是, Camshift 是建立在颜色概率分布图 和矩的基础之上, Camshift 算法对室内环境下的目标跟踪具有较高 的鲁棒性。 陈建军 [4] 等人提出了一种基于核共生矩阵的均值移动跟踪算 法, 使用目标的纹理特征作为跟踪线索, 将灰度共生矩阵改进成核 共生矩阵作为特征模板, 采用 Bhattacharyya 系数度量核共生矩阵的 相似度, 在 Mean Shift 跟踪算法基础上实现了人脸的跟踪; 田纲[5]等 人使用目标的颜色和运动特征,将目标的运动矢量作为特征模板, 在 Mean Shift 跟踪算法基础上实现了跟踪; 袁广林 [6]等人使用目标 的颜色特征, 通过多颜色直方图自适应组合作为特征模板, 利用目 标区域对每一颜色直方图的概率图的均值和方差的比值, 自适应计 算权值, 在 Mean Shift 跟踪算法基础上实现稳定跟踪, 该方法对目 标外观变化具有较强的鲁棒性。 4.2 基于卡尔曼滤波目标跟踪 卡尔曼滤波算法是一种经典的预测估计算法, 如果已知目标运 动是线性的, 且图像噪声服从高斯分布, 便可应用卡尔曼滤波预测 目标下一帧位置, 从而实现目标跟踪。卡尔曼滤波器是一个最优化 自回归数据处理算法, 对动态系统的状态序列进行线性最小方差估 计, 利用状态方程和观测方程描述动态系统, 根据之前的状态序列 对下一个状态作最优估计, 预测时具有无偏、 稳定的特点, 在存在部 分短暂遮挡的目标跟踪中有很好的跟踪效果。其计算量小, 实时性 强, 可以准确预测目标的位置和速度, 但是它只适合于线性高斯系 统。 提出一种交互多模型作为 徐哈宁[7]等人使用目标的运动特征, 目标特征模板, 交互多模型包括匀速模型、 加速度模型、 转弯模型以 及 “当前” 统计模型等, 并将传统的卡尔曼滤波跟踪算法基础上进行 改进, 即在去偏转换测量卡尔曼滤波器 (CMKF-D ) 框架下完成了体 育视频中球类目标的跟踪; 齐美彬 [8]等人提出一种基于自适应权值 的区域马尔科夫随机场 (MRF ) 分割与跟踪方法, 利用相邻像素的空 间相关性, 自适应更新系统能量函数中的参数, 使用目标的灰度直
(中国传媒大学 信息工程学院, 北京 100024 )
摘 要: 运动目标跟踪是一个颇具挑战性的问题, 文章对当前运动目标跟踪问题的相关方法进行分析研究。 首先从一个崭新的角 度提出了一套分析运动目标跟踪技术的体系结构方法。然后采用这种体系结构对列举的每种跟踪算法方案进行阐述和归类, 指 出了每种方案适用范围及其局限性。最后针对研究过程中所面临的难题, 展望了运动目标跟踪技术新的发展趋势。 关键词 : 运动目标跟踪; 特征模板提取; 跟踪算法框架; 运动目标预测
科技创新与应用
目标稍大, 可以是矩形或椭圆形 ) , 然后采用目标的某些特征来有效 地表示该运动目标。实际中的运动目标往往具有很多特征, 如果将 其所有特征都记录下来, 就需要计算机花大量时间计算, 从而满足 不了要求实时性的跟踪。 所以, 不需要考虑运动目标的全部特征, 而 只需要利用一些显著特征即可,所提取的特征应尽量做到计算简 单, 以便快速识别。另外, 选用的特征应尽量具有相对稳定性, 即对 图像的旋转 、 平移 、 尺度变化 、 光照条件变化等不敏感, 从而减轻外 部环境对跟踪效果的影响。 在处理跟踪问题时, 跟踪系统将要跟踪的运动目标用其显著特 征表示, 计算机处理这个 “表示” 的过程是将目标的显著特征数据从 高维的原始特征空间, 通过映射变换到低维空间, 形成简化计算量 的可供计算机理解的数据, 同时计算机认为该特征数据即为运动目 标的特征模板, 即计算机 “认识” 了要跟踪的目标。计算机将运动目 标用其模板表示的目的是为后续的跟踪工作做准备。 常用的目标模 板包括: 颜色直方图、 灰度共生矩阵、 纹理直方图等 (图 1a ) 。在实际 应用中, 上述这些模板可以进行适当的改进以提高跟踪的鲁棒性。 2 跟踪算法框架 2.1 目标特征模版更新 我们可以比较容易的提取一般图像的特征, 然而是否这些特征 可以有效表达要跟踪的目标, 经常需要根据特定的环境采用不同的 特征还可能采用多特征联生成有效的目标模板。 上一节在介绍目标 特征提取时候, 可以将提取特征模板直接作为生成的目标的特征模 板直接使用,还可以选用这些特征模板来生成新的目标特征模板, 往往这样做会更有效的表达表达目标。 目标特征模板生成后常常不是唯一不变, 在目标运动的过程中 由于目标的形变和光照的变化会影响目标的有效表达, 因此需要对 目标模板运动跟踪过程中进行更新。 目标特征模版更新问题在跟踪 领域关注度越来越高, 主流的研究方法是在线特征选择, 需要用特 征模版和当前图像的目标数据进行比对来决定是否进模版更新。 还 有一种模版的更新策略, 根据跟踪到的目标实时的更新目标的模版 而不进行比对。模版更新问题较为困难, 首先如果在目标存在遮挡 情况下, 模版更新较快很容易造成错误的模版更新。 其次, 模版更新 较慢不能适用目标快速变化的情况。一般来说, 感兴趣目标在一段 视频序列中不会发生特别大的改变, 鲁棒的模版更新机制也就没有 必要了。 当然, 在要求严格的自动化商业系统中, 一般是需要通过有 图 1 运动目标跟踪算法体系结构 监督的方法辅助进行模版更新。 1 运动目标特征提取 2.2 模板匹配 1.1 目标特征 跟踪系统在将运动目标用其特征模板表示之后, 跟踪过程也进 特征是一个物体具有可靠性、 独立性 、 且可区别于其他物体的 入了计算相似性度量阶段。在视频图像的后续帧中, 采用一定的相 属性, 一个运动目标一般具有很多特征, 充分的了解这些特征将有 似性度量方法, 通过计算目标模板与后续帧中所有候选目标区域的 助于提高解决运动目标跟踪问题的效率和准确性。一般来讲, 常见 相似性函数值, 选择函数值最大的候选目标区域 (也即与目标特征 的运动目标的特征包括: 颜色、 纹理 、 边缘 、 运动等如何根据特定的 模板最相似的区域 ) 作为运动目标在新一帧图像中的位置。用这样 就可以实现运动目标 场景选择合适的目标特征, 成为影响跟踪效果好坏的重要因素 。希 的方式在每一帧图像中进行计算相似性度量, 望通过有效特征选取, 来区分感兴趣运动目标和场景中其他运动目 的连续跟踪。在图像处理与分析理论中, 常用的相似性度量方法有 标。例如, 在足球比赛中, 对特定某个运动员跟踪, 而选择了不恰当 欧式距离、 加权距离、 Bhattacharyya 系数等。 的特征, 例如形状, 接下来在运动员遮挡的时候, 就很难正确跟踪 2.3 分类学习 了。 对于特定场景的应用, 特征的选择十分重要, 因而作为跟踪方法 利用分类器将跟踪目标从背景中分割出来是以模式分类的方 结构的第一部分, 文章所举出的是基本的视觉目标特征, 研究人员 法解决视频跟踪问题。我们把跟踪看作分类问题, 通过训练分类器 也可以采用或设计一些新的视觉特征来更好实习目标的跟踪。 来区分背景和目标。 通过在参考图像中提取每一像素的一个特征向 1.2 目标特征提取 量,经过训练得到一个分类器来识别一个像素是属于目标还是背 目标特征提取,是指使用运动目标的某些显著特征表示目标。 景。给定新的一帧图像, 我们使用训练好的分类器测试侦查区域里 也可将其分解为两个部分视觉表征和统计模型。 视觉表征目标是采 的像素并得到置信图, 我们认为图中的峰值点就是物体移动到的地 用各种不同的视觉特征构建鲁棒的目标描述。 统计模型是采用统计 方。 学习的方法建立有效的分辨目标的数学模型。 3 运动预测 在运动目标跟踪过程的开始阶段, 首先要选择感兴趣的跟踪目 运动预测, 相当于是一个动态的状态评估的问题, 在跟踪上一 标, 通过图像分割或人为框选得到覆盖整个目标的区域 (该区域比 帧的运动个目标后, 提出目标特征, 然后在下一帧图像中采用特征