视频目标检测与跟踪算法综述

1、引言

运动目标的检测与跟踪是机器视觉领域的核心课题之一，目前被广泛应用在视频编码、智能交通、监控、图像检测等众多领域中。本文针对视频监控图像的运动目标检测与跟踪方法，分析了近些年来国内外的研究工作及最新进展。

2、视频监控图像的运动目标检测方法

运动目标检测的目的是把运动目标从背景图像中分割出来。运动目标的有效分割对于目标分类、跟踪和行为理解等后期处理非常重要。目前运动目标检测算法的难点主要体现在背景的复杂性和目标的复杂性两方面。背景的复杂性主要体现在背景中一些噪声对目标的干扰，目标的复杂性主要体现在目标的运动性、突变性以及所提取目标的非单一性等等。所有这些特点使得运动目标的检测成为一项相当困难的事情。目前常用的运动目标检测算法主要有光流法、帧差法、背景相减法，其中背景减除法是目前最常用的方法。

2.1 帧差法

帧差法主要是利用视频序列中连续两帧间的变化来检测静态场景下的运动目标，假设(,)k f x y 和(1)(,)k f x y +分别为图像序列中的第k 帧和第k+1帧中象素点(x ，y)的象素值,则这两帧图像的差值图像就如公式2-1 所示：

1(1)(,)(,)k k k Diff f x y f x y ++=- (2-1)

2-1式中差值不为0的图像区域代表了由运动目标的运动所经过的区域（背景象素值不变），又因为相邻视频帧间时间间隔很小，目标位置变化也很小，所以运动目标的运动所经过的区域也就代表了当前帧中运动目标所在的区域。利用此原理便可以提取出目标。下图给出了帧差法的基本流程：1、首先利用2-1 式得到第k 帧和第k+1帧的差值图像1k Diff +；2、对所得到的差值图像1k Diff +二值化（如式子2-2 示）得到Qk+1；3、为消除微小噪声的干扰，使得到的运动目标更准确，对1k Q +进行必要的滤波和去噪处理，后处理结果为1k M +。

111255,,(,)0,,(,)k k k if Diff x y T Q if Diff x y T

+++>?=?≤? （T 为阈值）（2-2）

帧差流程图

从结果看在简单背景下帧差法基本可检测到运动目标所在的位置，而且计算简单，复杂度低。当图像采样间隔较小时，帧差法对图像场景变化不敏感，这是帧差法的优点，但同时目标部分漏检的可能性增大了，容易使检测到的目标出现空洞。在实际应用中，由于帧差法的简易性，帧差法经常作为某些改进算法的基础。

2.2 光流法

光流的概念[30,31]是由Gibson 在1950 年首先提出的，光流理论在计算机视觉，三维运动分析中有着非常广泛的作用。外界物体由于运动在人的视网膜上产生一系列连续变化的信息，这些信息就如同是光的流一样不断从眼中流过，故此称之为光流。1981 年Horn 和Schunck 创造性的将二维速度场和我们通常所说的图像的灰度联系在一起，提出了光流约束方程，从而使得光流的计算有了最基本的方法。随后光流法不断发展，按照理论基础分为：微分法，快匹配法，基于能量的方法，基于相位的方法，其中尤以微分法最为常用，该方法主要是基于下面两种假设：

1、强度不变假设，即在一组连续的二维图像序列中，某个目标的运动轨迹在各帧中对应的像素点具有相同的灰度值。

2、全局平滑假设，即物体的运动矢量是局部平滑的或只有缓慢变化。特别是刚体运动，各相邻像素点具有相同的运动速度，即速度平滑。这时，光流矢量梯度的模值的平方应该最小，用x 和y 分量的拉普拉斯算子的平方和来表征光流场的平滑程度。

假如给定一个图像上m 点坐标为(x ，y),且它在t 时刻的象素值为(,,)I x y t 在t t d +时刻该点运动到(,)x y x d y d ++，象素值为：(,,)x y t I x d y d t d +++则在强度不变的假设下：

(,,)(,,)x y t I x d y d t d I x y t +++= （2-3）

公式2-3即为光流约束方程，将式2-3泰勒展开，并令t d 趋于0，我们可以得到：

0x y t I u I v I ++= （2-4）

其中x I I x =??，y I I y =??，t I I t =??，x t u d d =，y t v d d =，(,)u v 即为像素点在图像平面运动产生的瞬时速度场也即光流场。光流法的主要任务就是通过求解光流约束方程求出u 、v ，但是由于只有一个方程，并不能唯一确定u 和v ，这就用到了第二个假设，在该假设下就是要使得：

222222(()(()()()()))min u u v v x y t x y x y x y

E I u I v I a d d ????=++++++=?????? （2-5）其中α 是个权重系数，一般取0.5,这样联合(2-4)式和(2-5)式即可得到：

12221222[][][][]

n n n n t x x y x y n n n n t y x y x y u u I I u I v I a I I v v I I u I v I a I I +---+---?=-++++??=-++++?? （3-6）从推导的过程看，光流法的计算非常复杂，难于满足实时性的要求，且在目标提取时对噪声很敏感，所以此算法还难以直接在实际中推广使用。

2.3 背景减除法

背景减除法是将视频帧与背景模型进行比较，通过判定灰度等特征的变化，或用直方图等统计信息的变化来判断异常情况的发生和分割出运动目标。

基于背景差的方法，概念非常清晰。该方法与帧差法相比，可以检测出短时间静止的目标，如短时间静止的车辆(长时间静止的车辆可以归为背景)，且不受车速快慢的限制；与光流法相比，背景差法可以通过简化算法，降低计算量，满足视频检测的实时性要求。但随着研究的不断深人，算法的复杂性也在不断提高，特别是对较复杂场景下的前景（运动目标）检测，如针对光照变化场景下的目标检测(室外的环境光、室内的灯光等)，针对含有高噪声场景区域的目标检测(场景中含有树木、水面、旗帜等物体的反复运动)，针对场景频繁发生改变(车辆停止、背景中物体搬动等)情况下的目标检测等问题，使得算法的复杂性大大提高。

用背景减除法进行运动目标检测的主要过程包括预处理、背景建模、前景检测和运动区域后处理等。背景建模是背景减除法的核心环节，目前主要方法有：基于背景的时间差分法、中值滤波法、W4方法、线性预测法、非参数模型法(又称内核密度估计法)、混合Gauss 法、隐马尔科夫模型法(HMM)、本征法、基于

均值替换的背景估计法、码本方法等。

目前用无参的核密度估计方法对复杂场景的背景建模正成为背景差方法研究的热点，该方法特别针对具有微小重复运动的场合，如含有摇动的树叶、晃动的灌木丛、旋转的风扇、海面波涛、雨雪天气、光线反射等运动的场合。由于基于无参的核密度估计的背景建模是对一段视频的统计分析，在对视频图像中的背景进行建模时，计算量很大，这势必会影响算法的实时性，因此需要在提高背景建模的速度与准确率上做大量的研究工作，同时改进模型的适应性。另外，背景更新策略方面，如何判断是否需要更新背景模型，如何及时的更新背景模型都是现阶段困扰研究人员的问题。基于无参方法的背景差法主要分为四个步骤：1、利用无参法对背景进行建模，2、核函数带宽选择，3.对背景模型进行更新，4、运动目标的提取。

对于以上三种运动目标的检测方法，帧差法实现最为简单，但目标提取效果较差，该方法通常可以作为某种改进算法的基础。光流法相对准确，但计算复杂，实时性很差，且对多目标提取困难。背景差法可以较好的提取目标轮廓，但该方法涉及对背景的建模，建模过程比较复杂。

这些早期提出的移动目标检测方法大都单独地处理各个像素的灰度值或颜色而没有考虑较大尺度上的特征，故可称它们为基于像素的方法。典型的方法包括均值-阈限方法、高斯混合模型、非参数模型等。由于这些方法没有充分利用局部像素之间的关系信息，很多有效的图像特征无法得到表示，从而导致移动目标检测精度及效度都受到影响。后期大量的检测方法都不同程度地利用了局部区域层次的信息，称为基于区域的方法。典型的基于区域的方法包括纹理方法直方图方法等。

针对移动目标检测的各种像素级、区域级特征不断被提出，它们各有各的优缺点。如何能够设计一种特征将这些特征统一地结合在一起，从而充分利用各自的优势显得非常有意义。一种简单的思路是用几种特征组成特征向量，并利用该向量作为各个像素的特征：

[,,(,),(,),(,),......]k x y f x y LBP x y I x y I x y

3、视频目标跟踪算法

运动目标跟踪是在目标检测的基础上，对检测到的目标进行有效跟踪。目前，

在视频监控、人机交互及某些高级的视频系统中，对感兴趣目标的跟踪是其中必不可少的重要环节，它为后面更高级的视觉应用提供有价值的信息。

通常影响跟踪的因素主要有四个：目标模板的表示，候选目标的表示，相似度的衡量和搜索的策略。

衡量跟踪算法优劣的条件有两个，即实时性和鲁棒性，所以一个好的跟踪算法应满足：

1. 实时性好：算法要费时少，至少要比视频采集系统的采集速率快，否则将无法实现对目标的正常跟踪。如果跟踪系统还涉及到其他的图像处理环节，那么就要预留较多的时间给图像处理部分，所以实时性至关重要。

2. 鲁棒性强：实际的观测环境，图像的背景可能很复杂。光照、图像噪音及随时可能出现的目标遮挡，均使目标的跟踪变得非常困难。因此算法的鲁棒性对跟踪效果的好坏起着重要的作用。

以上提到的两条很难在系统中同时得以满足，往往需要某种折中，以期得到较好的综合性能。通常运动目标的跟踪可以分为运动目标检测、运动目标的特征选取和目标的后续跟踪三个阶段。由此可见跟踪算法远比单纯的目标检测算法复杂的多。

根据被跟踪目标信息使用情况的不同，可将视觉跟踪算法分为：基于对比度分析的目标跟踪、基于匹配的目标跟踪和基于运动检测的目标跟踪。基于对比度分析的跟踪算法主要利用目标和背景的对比度差异，实现目标的检测和跟踪。基于匹配的跟踪主要通过前后帧之间的特征匹配实现目标的定位。基于运动检测的跟踪主要根据目标运动和背景运动之间的差异实现目标的检测和跟踪。前两类方法都是对单帧图像进行处理。基于匹配的跟踪方法需要在帧与帧之间传递目标信息。对比度跟踪不需要在帧与帧之间传递目标信息。基于运动检测的跟踪需要对多帧图像进行处理。除此之外，还有一些算法不易归类到以上3类，如多目标跟踪算法或其他一些综合算法。

3.1 基于对比度分析的目标跟踪算法

基于对比度分析的目标跟踪算法利用目标与背景在对比度上的差异来提取、识别和跟踪目标。这类算法按照跟踪参考点的不同可以分为边缘跟踪、形心跟踪和质心跟踪等。这类算法不适合复杂背景中的目标跟踪，但在空中背景下的目标

跟踪中非常有效。边缘跟踪的优点是脱靶量计算简单、响应快，在某些场合(如要求跟踪目标的左上角或右下角等)有其独到之处。缺点是跟踪点易受干扰，跟踪随机误差大。重心跟踪算法计算简便，精度较高，但容易受到目标的剧烈运动或目标被遮挡的影响。重心的计算不需要清楚的轮廓．在均匀背景下可以对整个跟踪窗口进行计算，不影响测量精度。重心跟踪特别适合背景均匀、对比度小的弱小目标跟踪等一些特殊场合。图像二值化后，按重心公式计算出的是目标图像的形心。一般来说形心与重心略有差别。

3.2 基于匹配的目标跟踪算法

3.2.1 特征匹配

特征是目标可区别与其他事物的属性，具有可区分性、可靠性、独立性和稀疏性。基于匹配的目标跟踪算法需要提取目标的特征，并在每一帧中寻找该特征。寻找的过程就是特征匹配过程。

特征提取是一种变换或者编码，将数据从高维的原始特征空间通过映射，变换到低维空间的表示根据Marr的特征分析理论，有4种典型的特征计算理论：神经还原论、结构分解理论、特征空间论和特征空间的近似。神经还原论直接源于神经学和解剖学的特征计算理论，它与生物视觉的特征提取过程最接近，其主要技术是Gabor滤波器、小波滤波器等。结构分解理论是到目前为止唯一能够为新样本进行增量学习提供原则的计算理论，目前从事该理论研究的有麻省理T 学院实验组的视觉机器项目组等。特征空间论主要采用主分量分析(PCA)、独立分量分析(ICA)、稀疏分量分析(SCA)和非负矩阵分解(NMF)等技术抽取目标的子空间特征。特征空间的近似属于非线性方法，适合于解决高维空间上复杂的分类问题，主要采用流形、李代数、微分几何等技术。

目标跟踪中用到的特征主要有几何形状、子空间特征、外形轮廓和特征点等。其中，特征点是匹配算法中常用的特征。特征点的提取算法很多，如Kanade LucasTomasi(KLT)算法、Harris算法、SIFT算法以及SURF算法等。特征点一般是稀疏的，携带的信息较少，可以通过集成前几帧的信息进行补偿。目标在运动过程中，其特征(如姿态、几何形状、灰度或颜色分布等)也随之变化。目标特征的变化具有随机性，这种随机变化可以采用统计数学的方法来描述。直方图是图像处理中天然的统计量，因此彩色和边缘方向直方图在跟踪算法中被广泛采用。

3.2.2 贝叶斯跟踪

目标的运动往往是随机的。这样的运动过程可以采用随机过程来描述。很多跟踪算法往往建立在随机过程的基础之上，如随机游走过程、马尔科夫过程、自回归(AR)过程等。随机过程的处理在信号分析领域较成熟，其理论和技术(如贝叶斯滤波)可以借鉴到目标跟踪中。

贝叶斯滤波中，最有名的是Kalman滤波(KF)。KF可以比较准确地预测平稳运动目标在下一时刻的位置，在弹道目标跟踪中具有非常成功的应用。一般而言，KF可以用作跟踪方法的框架，用于估计目标的位置，减少特征匹配中的区域搜索范围，提高跟踪算法的运行速度KF只能处理线性高斯模型，KF算法的两种变形EKF和UKF可以处理非线性高斯模型。两种变形扩展了KF的应用范围，但是不能处理非高斯非线性模型，这个时候就需要用粒子滤波(PF)。由于运动变化，目标的形变、非刚体、缩放等问题，定义一个可靠的分布函数是非常困难的，所以在PF中存在例子退化问题，于是引进了重采样技术。事实上，贝叶斯框架下视觉跟踪的很多工作都是在PF框架下寻找更为有效的采样方法和建议概率分布。这些工作得到了许多不同的算法。如马尔可夫链蒙特卡洛(MCMC)方法、Unscented粒子滤波器(UPF)、Rao—Blackwellised粒子滤波器(RBPF)等等文献【5】引入了一种新的自适应采样方法——序贯粒子生成方法．在该方法中粒子通过重要性建议概率密度分布的动态调整顺序产生。文献【6】根据率失真理论推导了确定粒子分配最优数目的方法，该方法可以最小化视觉跟踪中粒子滤波的整体失真。文献【7】计算最优重要性采样密度分布和一些重要密度分布之间的KL距离，分析了这些重要密度分布的性能。文献【8】在粒子滤波框架下，采用概率分类器对目标观测量进行分类，确定观测量的可靠性，通过加强相关观测量和抑制不相关观测量的方法提高跟踪性能。

除了KF和PF之外，隐马尔科夫模型(HMMs)和动态贝叶斯模型(DBNs) 也是贝叶斯框架下重要的视觉跟踪方法。HMMs和DBNs将运动目标的内部状态和观测量用状态变量(向量)表示，DBNs使用状态随机变量(向量)集，并在它们之间建立概率关联。HMMs将系统建模为马尔科夫过程。这些算法的主要区别如表1所示。

表1 贝叶斯跟踪算法

表1中每个简单的算法都可以看成是下一行复杂算法的特例。反之，每个复杂算法都可以看成是简单算法的扩展。其中．DBNs具有最佳的灵活性，可以处理不同的运动模型和不同的状态变量组合。

DBNs又可以看作概率图模型(PGMs)的一个例子。PGMs的基本思想是用图形的方式将多变量概率分布分解．统计变量用图的节点表示，变量间的条件关系用图的连接或边表示。PGMs可以分为有向图(DAGs)和无向图(Ugs)。前者能够处理时间模式，适合目标跟踪和场景理解等任务。后者能很好地描述图像像素之间的空间依赖性．适合图像分割和图像分析等任务。

通过组合图理论和概率理论，PGMs可以用来处理问题描述中的不确定性。不确定性恰好符合人类视觉系统中天然的概率性和视觉模糊性(如遮挡从3D到2D投影的信息损失)。通过规定概率模型元素之间的关系，PGMs可以有效地表示、学习和计算复杂的概率模型。PGMs能够有效地组合目标的动态信息和外观信息，有效解决目标的运动估计问题，为目标跟踪提供了很好的理论框架。表1中算法都可以看成是PGMs的特殊形式。

3.2.3 核方法

核方法的基本思想是对相似度概率密度函数或者后验概率密度函数采用直接的连续估计。这样处理一方面可以简化采样，另一方面可以采用估计的函数梯度有效定位采样粒子。采用连续概率密度函数可以减少高维状态空间引起的计算量问题，还可以保证例子接近分布模式，避免粒子退化问题。核方法一般都采用彩色直方图作为匹配特征。

Mean ShiftI 是核方法中最有代表性的算法，其含义正如其名。是“偏移的均值向量”。直观上看，如果样本点从一个概率密度函数中采样得到，由于非零的概率密度梯度指向概率密度增加最大的方向，从平均上来说，采样区域内的样本点更多的落在沿着概率密度梯度增加的方向。因此，对应的Mean Shift向量应该指向概率密度梯度的负方向。

Mean Shift跟踪算法反复不断地把数据点朝向MeanShift矢量方向进行移动，最终收敛到某个概率密度函数的极值点。在Mean Shift跟踪算法中。相似度函数用于刻画目标模板和候选区域所对应的两个核函数直方图的相似性，采用的是Bhattacharyya系数。因此。这种方法将跟踪问题转化为Mean Shift模式匹配问题。核函数是Mean Shift 算法的核心，可以通过尺度空间差的局部最大化来选择核尺度，若采用高斯差分计算尺度空间差，则得到高斯差分Mean Shift算法。

Mean Shift算法假设特征直方图足够确定目标的位置，并且足够稳健，对其他运动不敏感。该方法可以避免目标形状、外观或运动的复杂建模，建立相似度的统计测量和连续优化之间的联系。但是，Mean Shift算法不能用于旋转和尺度运动的估计。为克服以上问题，人们提出了许多改进算法，如多核跟踪算法、多核协作跟踪算法和有效的最优核平移算法等。文献[11]则针对可以获得目标多视角信息的情况，提出了一种从目标不同视角获得多个参考直方图，增强Mean Shift 跟踪性能的算法。

3.3 基于运动检测的目标跟踪算法

基于运动检测的目标跟踪算法通过检测序列图像中目标和背景的不同运动来发现目标存在的区域。实现跟踪。这类算法不需要帧之间的模式匹配，不需要在帧间传递目标的运动参数，只需要突出目标和非目标在时域或者空域的区别即可。这类算法具有检测多个目标的能力，可用于多目标检测和跟踪。这类运动目标检测方法主要有帧间图像差分法、背景估计法、能量积累法、运动场估计法等。

光流算法是基于运动检测的目标跟踪的代表性算法。光流是空间运动物体在成像面上的像素运动的瞬时速度，光流矢量是图像平面坐标点上的灰度瞬时变化率。光流的计算利用图像序列中的像素灰度分布的时域变化和相关性来确定各自像素位置的运动，研究图像灰度在时间上的变化与景象中物体结构及其运动的关系。将二维速度场与灰度相联系，引入光流约束方程，得到光流计算的基本算法。根据计算方法的不同，可以将光流算法分为基于梯度的方法、基于匹配的方法、基于能量的方法、基于相位的方法和基于神经动力学的方法。文献【12】提出了一种基于摄像机光流反向相关的无标记跟踪算法，该算法利用反向摄像机消除光流中的相同成分，得到有效的跟踪效果。文献【13】将光流算法的亮度约束转化为上下文约束．把上下文信息集成到目标跟踪的运动估计里，仿照光流算法，提

出了上下文流算法。文献【14】引入了几何流的概念，用于同时描述目标在空间上和时间上的运动，并基于李代数推导了它的矢量空间表示。几何流在几何约束条件下，将复杂运动建模为多个流的组合，形成一个随机流模型。该算法在运动估计中集成了点对和帧差信息。文献【15】介绍了使用互相关的对光照稳健的可变光流算法。文献【l6】提出了基于三角化高阶相似度函数的光流算法――三角流算法。该算法采用高阶条件随机场进行光流建模，使之包含标准的光流约束条件和仿射运动先验信息，对运动估计参数和配准则进行联合推理。局部仿射形变的相似度能量函数可以直接计算，形成高阶相似度函数，用三角形网格求解，形成三角流算法。

3.4 其它跟踪方法

视觉跟踪从不同的角度和应用场合出发，会遇到很多不同的问题，比如多模跟踪、多特征跟踪、上下文跟踪、多目标跟踪、多摄像机跟踪、3D跟踪和特定应用的跟踪等。

3.5 研究热点及趋势

目前，目标跟踪领域的研究非常活跃，研究的热点主要体现在以下几个方面：1，无参数跟踪系统。即无论是目标及背景建模、模型更新，还是跟踪算法的定位输出，均不依靠或者少依靠输入参数。现在许多基于无参的跟踪系统都是在特定环境中具有良好的性能，因此对此类系统的环境自适应性进行研究具有很大的现实意义。

2，有效组合各种数据的跟踪系统。组合各种图像数据，如基于颜色分割的图像数据，基于帧间变化的运动数据，基于减背景的轮廓数据等，可有效提高跟踪系统的健壮性。文献[16,19,20]将目标的图像信息和目标的运动信息相结合，能有效跟踪低速条件下运动状态多变的目标。

3，基于机器学习理论和统计理论的跟踪系统。跟踪涉及到很多学科，如模式识别，神经网络等，机器学习理论和统计理论在这些学科中均具有广泛的应用空间,由此通过这些理论对目标跟踪进行研究也成为一个热点。

4，基于三维特征的跟踪系统。三维特征(“深度数据”或者“体素表示”)不像图像特征那样容易受环境影响，因此基于该特征的研究正成为一个热点。目前，许多基于三维特征的跟踪倾向于从多摄像机图像数据获取三维数据，如体素表

示、Visual Hull 等，然后基于三维数据对目标进行跟踪。

目标跟踪相关研究综述

Artificial Intelligence and Robotics Research 人工智能与机器人研究, 2015, 4(3), 17-22 Published Online August 2015 in Hans. https://www.360docs.net/doc/ad11597685.html,/journal/airr https://www.360docs.net/doc/ad11597685.html,/10.12677/airr.2015.43003 A Survey on Object Tracking Jialong Xu Aviation Military Affairs Deputy Office of PLA Navy in Nanjing Zone, Nanjing Jiangsu Email: pugongying_0532@https://www.360docs.net/doc/ad11597685.html, Received: Aug. 1st, 2015; accepted: Aug. 17th, 2015; published: Aug. 20th, 2015 Copyright ? 2015 by author and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.360docs.net/doc/ad11597685.html,/licenses/by/4.0/ Abstract Object tracking is a process to locate an interested object in a series of image, so as to reconstruct the moving object’s track. This paper presents a summary of related works and analyzes the cha-racteristics of the algorithm. At last, some future directions are suggested. Keywords Object Tracking, Track Alignment, Object Detection 目标跟踪相关研究综述徐佳龙海军驻南京地区航空军事代表室，江苏南京 Email: pugongying_0532@https://www.360docs.net/doc/ad11597685.html, 收稿日期：2015年8月1日；录用日期：2015年8月17日；发布日期：2015年8月20日摘要目标跟踪就是在视频序列的每幅图像中找到所感兴趣的运动目标的位置，建立起运动目标在各幅图像中的联系。本文分类总结了目标跟踪的相关工作，并进行了分析和展望。

【CN109919979A】一种视频实时目标跟踪的方法【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910174796.5 (22)申请日 2019.03.08 (71)申请人广州二元科技有限公司地址 510000 广东省广州市南沙区银锋一街1号银锋广场1栋1608房 (72)发明人容李庆　关毅　袁亚荣　 (74)专利代理机构广州凯东知识产权代理有限公司 44259 代理人罗丹 (51)Int.Cl. G06T 7/246(2017.01) G06K 9/00(2006.01) G06K 9/32(2006.01) (54)发明名称一种视频实时目标跟踪的方法 (57)摘要本发明涉及一种视频实时目标跟踪的方法，采用目标检测与目标跟踪相结合的技术，极大地降低视频实时目标检测的计算量，由于无需对每一帧视频图像进行遍历检测，因此极大地提高了视频实时目标检测的计算效率，可以达到实时视频的帧率。本发明提供的视频实时目标跟踪的方法使用神经网络对目标检测器检测出来的目标框在下一帧图像中的位置进行跟踪回归，极大地降低了视频实时目标检测的计算量，无需对每一帧图像都采用检测器检测目标，采用检测与跟踪相结合的技术应用于视频实时目标检测中，无需对输入图像进行复杂的降噪等处理，对目标检测器也无特殊需求，可以大大提升检测的速率，本发明适用性广，可以在低端的嵌入式设备中保证足够的计算效率。权利要求书1页说明书2页附图1页CN 109919979 A 2019.06.21 C N 109919979 A

权　利　要　求　书1/1页CN 109919979 A 1.一种视频实时目标跟踪的方法，其特征在于包括以下步骤： 1)、通过硬件设备摄像头采集实时的视频作为输入，或者直接输入包含多帧的视频文件； 2)、分解视频，以单帧为单位对视频进行分解； 3)、将不同的数字图像矩阵格式转化为目标检测器支持的数字图像矩阵格式； 4)、输入1帧数字图像矩阵到目标检测器中，检测器通过计算后返回的检测结果以数组的方式进行保存，数组的长度是检测到的目标数量大小； 5)、根据当前输入帧获得的目标检测框作为下一帧图像的目标基础框，采用神经网络对当前帧目标框在下一帧图像的位置进行回归计算，得到下一帧图像的目标检测框信息，如果下一帧检测框信息不为空，则在接下来的帧图像中循环执行当前步骤；若下一帧目标框信息为空，则跳转到步骤4对接下来的帧图像重新调用目标检测器进行目标检测直到视频帧处理结束。 2.根据权利要求1所述的一种视频实时目标跟踪的方法，其特征在于：所述步骤3)在步骤1)输入视频的时候进行统一的转换。 2

动态视频目标检测和跟踪技术(入门)

动态视频目标检测和跟踪技术传统电视监控技术只能达到“千里眼”的作用，把远程的目标图像（原始数据）传送到监控中心，由监控人员根据目视到的视频图像对现场情况做出判断。智能化视频监控的目的是将视频原始数据转化为足够量的可供监控人员决策的“有用信息”，让监控人员及时全面地了解所发生的事件：“什么地方”，“什么时间”，“什么人”，“在做什么”。将“原始数据”转化为“有用信息”的技术中，目标检测与跟踪技术的目的是要解决“什么地方”和“什么时间”的问题。目标识别主要解决“什么人”或“什么东西”的问题。行为模式分析主要解决“在做什么”的问题。动态视频目标检测技术是智能化视频分析的基础。本文将目前几种常用的动态视频目标检测方法简介如下：背景减除背景减除（Background Subtraction）方法是目前运动检测中最常用的一种方法，它是利用当前图像与背景图像的差分来检测出运动目标的一种技术。它一般能够提供相对来说比较全面的运动目标的特征数据，但对于动态场景的变化，如光线照射情况和外来无关事件的干扰等也特别敏感。实际上，背景的建模是背景减除方法的技术关键。最简单的背景模型是时间平均图像，即利用同一场景在一个时段的平均图像作为该场景的背景模型。由于该模型是固定的，一旦建立之后，对于该场景图像所发生的任何变化都比较敏感，比如阳光照射方向，影子，树叶随风摇动等。大部分的研究人员目前都致力于开发更加实用的背景模型，以期减少动态场景变化对于运动目标检测效果的影响。时间差分时间差分（Temporal Difference 又称相邻帧差）方法充分利用了视频图像的特征，从连续得到的视频流中提取所需要的动态目标信息。在一般情况下采集的视频图像，若仔细对比相邻两帧，可以发现其中大部分的背景像素均保持不变。只有在有前景移动目标的部分相邻帧的像素差异比较大。时间差分方法就是利用相邻帧图像的相减来提取出前景移动目标的信息的。让我们来考虑安装固定摄像头所获取的视频。我们介绍利用连续的图像序列中两个或三个相邻帧之间的时间差分，并且用阈值来提取出视频图像中的运动目标的方法。我们采用三帧差分的方法，即当某一个像素在连续三帧视频图像上均有相

多个目标的实时视频跟踪的先进的算法

2008 10th Intl. Conf. on Control, Automation, Robotics and Vision Hanoi, Vietnam, 17–20 December 2008 多个目标的实时视频跟踪的先进的算法 1110200210俞赛艳 Artur Loza Department of Electrical and ElectronicEngineering University of Bristol Bristol BS8 1UB, United Kingdom artur.loza@https://www.360docs.net/doc/ad11597685.html, Miguel A. Patricio, Jes′us Garc′?a, and Jos′e M. Molina Applied Artificial Intelligence Group (GIAA) Universidad Carlos III de Madrid 28270-Colmenarejo, Spain mpatrici,jgherrer@inf.uc3m.es, molina@ia.uc3m.es 摘要——本文调查了用组合和概率的方法来实现实时的视频目标跟踪。特殊兴趣是真实世界的场景,在这场景里.多目标和复杂背景构成对非平凡的自动追踪者的挑战。在一个规范的监控视频序列里，对象跟踪是以组合数据协会和粒子过滤器为基础，通过选择完成视觉跟踪技术实现的。以详细的分析性能的追踪器测试的优点为基础，已经确定了互补的失效模式和每种方法的计算要求。考虑到获得的结果,改善跟踪性能的混合策略被建议了,为不同追踪方法带来了最好的互补特性。关键字--概率、组合、粒子过滤器、跟踪、监视、实时、多个目标. 1、介绍最近人们对通过单个摄像机或一个网络摄像头提供来跟踪视频序列增加了兴趣。在许多监测系统中，可靠的跟踪方法至关重要的。因为它们使运营商在远程监控感兴趣的领域,增加对形势感知能力和帮助监测分析与决策过程。跟踪系统可以应用在一个广泛的环境如:交通系统、公共空间(银行、购物)购物中心、停车场等)、工业环境、政府或军事机构。跟踪的对象通常是移动的环境中的一个高可变性。这需要复杂的算法对视频采集,相机校正、噪声过滤、运动检测，能力学习和适应环境。因为它的情况往往现实场景,系统也应该能够处理多个目标出现在现场。为了实现强大的和可靠的多个跟踪目标,，各种各样的问题，具体到这种场景，都必须加以解决。不仅要解决状态估计问题，而且还必须使执行数据联合运行得准确,特别是当多目标交互存在时。早期多个对象跟踪的工作，关注于一个固定的数字的目标,但是人们已经认识到,很有必要解释新出现的目标以及消失的目标造成的变量数量及多个轨道数量，具有相当良好的间隔。这是典型的用扩展状态估计框架联合跟踪所有检测目标[4]。联合跟踪目标[6],避免使用几个独

视频目标跟踪算法综述_蔡荣太

1引言目标跟踪可分为主动跟踪和被动跟踪。视频目标跟踪属于被动跟踪。与无线电跟踪测量相比，视频目标跟踪测量具有精度高、隐蔽性好和直观性强的优点。这些优点使得视频目标跟踪测量在靶场光电测量、天文观测设备、武器控制系统、激光通信系统、交通监控、场景分析、人群分析、行人计数、步态识别、动作识别等领域得到了广泛的应用[1-2]。根据被跟踪目标信息使用情况的不同，可将视觉跟踪算法分为基于对比度分析的目标跟踪、基于匹配的目标跟踪和基于运动检测的目标跟踪。基于对比度分析的跟踪算法主要利用目标和背景的对比度差异，实现目标的检测和跟踪。基于匹配的跟踪主要通过前后帧之间的特征匹配实现目标的定位。基于运动检测的跟踪主要根据目标运动和背景运动之间的差异实现目标的检测和跟踪。前两类方法都是对单帧图像进行处理，基于匹配的跟踪方法需要在帧与帧之间传递目标信息，对比度跟踪不需要在帧与帧之间传递目标信息。基于运动检测的跟踪需要对多帧图像进行处理。除此之外，还有一些算法不易归类到以上3类，如工程中的弹转机跟踪算法、多目标跟踪算法或其他一些综合算法。2基于对比度分析的目标跟踪算法基于对比度分析的目标跟踪算法利用目标与背景在对比度上的差异来提取、识别和跟踪目标。这类算法按照跟踪参考点的不同可以分为边缘跟踪、形心跟踪和质心跟踪等。这类算法不适合复杂背景中的目标跟踪，但在空中背景下的目标跟踪中非常有效。边缘跟踪的优点是脱靶量计算简单、响应快，在某些场合（如要求跟踪目标的左上角或右下角等）有其独到之处。缺点是跟踪点易受干扰，跟踪随机误差大。重心跟踪算法计算简便，精度较高，但容易受到目标的剧烈运动或目标被遮挡的影响。重心的计算不需要清楚的轮廓，在均匀背景下可以对整个跟踪窗口进行计算，不影响测量精度。重心跟踪特别适合背景均匀、对比度小的弱小目标跟踪等一些特殊场合。图像二值化之后，按重心公式计算出的是目标图像的形心。一般来说形心与重心略有差别[1-2]。 3基于匹配的目标跟踪算法 3.1特征匹配特征是目标可区别与其他事物的属性，具有可区分性、可靠性、独立性和稀疏性。基于匹配的目标跟踪算法需要提取目标的特征，并在每一帧中寻找该特征。寻找的文章编号：1002－8692（2010）12-0135-04 视频目标跟踪算法综述* 蔡荣太1，吴元昊2，王明佳2，吴庆祥1 （1.福建师范大学物理与光电信息科技学院，福建福州350108； 2.中国科学院长春光学精密机械与物理研究所，吉林长春130033）【摘要】介绍了视频目标跟踪算法及其研究进展，包括基于对比度分析的目标跟踪算法、基于匹配的目标跟踪算法和基于运动检测的目标跟踪算法。重点分析了目标跟踪中特征匹配、贝叶斯滤波、概率图模型和核方法的主要内容及最新进展。此外，还介绍了多特征跟踪、利用上下文信息的目标跟踪和多目标跟踪算法及其进展。【关键词】目标跟踪；特征匹配；贝叶斯滤波；概率图模型；均值漂移；粒子滤波【中图分类号】TP391.41；TN911.73【文献标识码】A Survey of Visual Object Tracking Algorithms CAI Rong-tai1,WU Yuan-hao2,WANG Ming-jia2,WU Qing-xiang1 （1.School of Physics,Optics,Electronic Science and Technology,Fujian Normal University,Fuzhou350108,China; 2.Changchun Institute of Optics,Fine Mechanics and Physics,Chinese Academy of Science,Changchun130033,China）【Abstract】The field of visual object tracking algorithms are introduced,including visual tracking based on contrast analysis,visual tracking based on feature matching and visual tracking based on moving detection.Feature matching,Bayesian filtering,probabilistic graphical models,kernel tracking and their recent developments are analyzed.The development of multiple cues based tracking,contexts based tracking and multi-target tracking are also discussed．【Key words】visual tracking;feature matching;Bayesian filtering;probabilistic graphical models;mean shift;particle filter ·论文·*国家“863”计划项目（2006AA703405F）；福建省自然科学基金项目（2009J05141）；福建省教育厅科技计划项目（JA09040）

视频目标检测与跟踪算法综述

视频目标检测与跟踪算法综述 1、引言运动目标的检测与跟踪是机器视觉领域的核心课题之一，目前被广泛应用在视频编码、智能交通、监控、图像检测等众多领域中。本文针对视频监控图像的运动目标检测与跟踪方法，分析了近些年来国内外的研究工作及最新进展。 2、视频监控图像的运动目标检测方法运动目标检测的目的是把运动目标从背景图像中分割出来。运动目标的有效分割对于目标分类、跟踪和行为理解等后期处理非常重要。目前运动目标检测算法的难点主要体现在背景的复杂性和目标的复杂性两方面。背景的复杂性主要体现在背景中一些噪声对目标的干扰，目标的复杂性主要体现在目标的运动性、突变性以及所提取目标的非单一性等等。所有这些特点使得运动目标的检测成为一项相当困难的事情。目前常用的运动目标检测算法主要有光流法、帧差法、背景相减法，其中背景减除法是目前最常用的方法。 2.1 帧差法帧差法主要是利用视频序列中连续两帧间的变化来检测静态场景下的运动目标，假设(,)k f x y 和(1)(,)k f x y +分别为图像序列中的第k 帧和第k+1帧中象素点(x ，y)的象素值,则这两帧图像的差值图像就如公式2-1 所示： 1(1)(,)(,)k k k Diff f x y f x y ++=- (2-1) 2-1式中差值不为0的图像区域代表了由运动目标的运动所经过的区域（背景象素值不变），又因为相邻视频帧间时间间隔很小，目标位置变化也很小，所以运动目标的运动所经过的区域也就代表了当前帧中运动目标所在的区域。利用此原理便可以提取出目标。下图给出了帧差法的基本流程：1、首先利用2-1 式得到第k 帧和第k+1帧的差值图像1k Diff +；2、对所得到的差值图像1k Diff +二值化（如式子2-2 示）得到Qk+1；3、为消除微小噪声的干扰，使得到的运动目标更准确，对1k Q +进行必要的滤波和去噪处理，后处理结果为1k M +。 111255,,(,)0,,(,)k k k if Diff x y T Q if Diff x y T +++>?=?≤? （T 为阈值）（2-2）

人体目标检测与跟踪算法研究

人体目标检测与跟踪算法研究摘要：近些年以来，基于视频中人体目标的检测与跟踪技术研究越来越被重视。然而，由于受到目标自身特征多样性和目标所处环境的复杂性和不确定性的影响，现存算法的性能受到很大的限制。本文对目前所存在的问题进行了分析，并提出了三帧差分法和改进阈值分割法相结合的运动目标检测算法和多特征融合的改进运动目标跟踪算法。这两种算法不仅可以准确有效的检测出运动目标而且能够满足实时性的要求，有效的解决了因光照变化和目标遮挡等情况造成的运动目标跟踪准确度下降或跟踪目标丢失等问题。关键词：三帧差分，Camshift，阈值分割 Research Based on Human Target Detectionand Tracking Algorithm Abstract: In recent years, human object detection and tracking become more and more important. However the complexity, uncertainty environment and the target’s own diversity limit the performance of existing algorithms. The main works of this paper is to study and analysis the main algorithm of the human object detection and tracking, and proposes a new moving target detection method based on three-frame difference method and threshold segmentation and improved Camshift tracking algorithm based on multi-feature fusion. These algorithm can satisfy the real-time, while accurately and efficiently detect moving targets, and also effectively solves the problem of tracking object lost or misplaced under illumination change or target occlusion. Keywords: three-frame difference, Camshift, threshold segmentation 一、绪论（一）选题的背景和意义人类和动物主要通过眼睛来感受和认知外部世界。人类通过视觉所获取的信息占了60%[1]，因此，在开发和完善人工智能的过程中，赋予机器视觉的功能这一操作极不可缺少。完善上述功能需要以许多技术为基础，特别是运动目标的检测与跟踪技术。近些年以来，此技术受到了越来越多的关注[2]。目前，此技术也在各领域得到了充分的应用，涵盖的领域有智能交通、导航、智能视频监控、精确制导、人机交互和多媒体视频编码压缩技术等。

目标检测与跟踪实验报告3 王进

《图像探测、跟踪与识别技术》实验报告专业：探测制导与控制技术学号：11151201 姓名：王进 2014 年11月

实验三复杂场景下目标的检测与跟踪一、实验目的 1. 学习不同目标跟踪算法，对比不同算法对于复杂场景的效果； 2. 学习OpenCV与VS2010的联合编程，提高编程能力。二、实验要求 1. 要求学生至少使用一种目标跟踪算法对视频中出现的目标进行跟踪； 2. 检验所选算法在复杂场景下的效果； 3. 使用VS2010/2012和OpenCV进行编程； 4. 本实验不要求目标检测，所以目标可以手动标出。三、实验步骤 1. 想办法找到目标（可手动框出）。 2. 编写目标跟踪函数代码；四、实验报告 1、CAMSHIFT算法原理 CAMSHIFT算法是利用目标的颜色直方图模型将图像转换为颜色概率分布图，初始化一个搜索窗的大小和位置，并根据上一帧得到的结果自适应调整搜索窗口的位置和大小，从而定位出当前图像中目标的中心位置。这个算法可以分为三个部分： 1、色彩投影图（反向投影）： (1).RGB颜色空间对光照亮度变化较为敏感，为了减少此变化对跟踪效果的影响，首先将图像从RGB空间转换到HSV空间。(2).然后对其中的H分量作直方图，在直方图中代表了不同H分量值出现的概率或者像素个数，就是说可以查找出H分量大小为h的概率或者像素个数，即得到了颜色概率查找表。(3).将图像中每个像素的值用其颜色出现的概率对替换，就得到了颜色概率分布图。这个过程就叫反向投影，颜色概率分布图是一个灰度图像。 2、MEANSHIFT MEANSHIFT算法是一种密度函数梯度估计的非参数方法，通过迭代寻优找到概率分布的极值来定位目标。算法过程为： (1).在颜色概率分布图中选取搜索窗W (2).计算零阶距：计算一阶距：

多目标跟踪方法研究综述

经过近４０多年的深入研究和发展，多目标跟踪技术在许多方面都有着广泛应用和发展前景，如军事视觉制导、机器人视觉导航、交通管制、医疗诊断等［１－２］。目前，虽然基于视频的多运动目标跟踪技术已取得了很大的成就，但由于视频中图像的变化和物体运动的复杂性，使得对多运动目标的检测与跟踪变得异常困难，如多目标在运动过程中互遮挡、监控场景的复杂性等问题，解决上述难题一直是该领域所面临的一个巨大挑战，因此，对视频中多目标跟踪技术研究仍然是近年来一个热门的研究课题［３－５］。１、多目标跟踪的一般步骤基于视频的多目标跟踪技术融合了图像处理、模式识别、人工智能、自动控制以及计算机视觉等众多领域中的先进技术和核心思想。不同的多目标跟踪方法其实现步骤有一定的差异，但多目标跟踪的主要流程是相同的，如图１所示，其主要包括图像预处理、运动目标检测、多目标标记与分离、多目标跟踪四个步骤。图１多目标跟踪基本流程图２、多目标跟踪方法多目标跟踪方法可以根据处理图像或视频获取视点的多少分为两大类，一类是单视点的多目标跟踪，另一类就是多视点的多目标跟踪。２．１单视点的方法单视点方法是针对单一相机获取的图像进行多目标的检测和跟踪。该方法好处在于简单且易于开发，但由于有限的视觉信息的获取，很难处理几个目标被遮挡的情况。块跟踪（Ｂｌｏｂ－ｔｒａｃｋｉｎｇ）是一种流行的低成本的跟踪方法［６－７］。这种方法需要首先在每一帧中提取块，然后逐帧寻找相关联的块，从而实现跟踪。例如ＢｒａＭＢＬｅ系统［８］就是一个基于已知的背景模型和被跟踪的人的外表模型计算出块的似然性的多块跟踪器。这种方法最大的不足之处在于：当由于相似性或者遮挡，多个目标合并在一起时，跟踪将导致失败。因此，可以取而代之的方法是通过位置、外观和形状保留清晰目标的状态。文献［９］利用组合椭圆模拟人的形状，用颜色直方图模拟不同人的外观，用一个增强高斯分布模拟背景以便分割目标，一旦场景中发现对应于运动头部的像素，一个ＭＣＭＣ方法就被用于获取多个人的轮廓的最大后验概率，在单相机的多人跟踪应用中取得了非常有意义的结果。Ｏｋｕｍａ等人提出了一种将Ａｄａｂｏｏｓｔ算法和粒子滤波相结合的方法［１０］。该方法由于充分利用了两种方法的优点，相比于单独使用这两种方法本身，大大降低了跟踪失败的情形，同时也解决了在同一框架下检测和一致跟踪的问题。Ｂｒｏｓｔｏｗ等人提出了一个用于在人群中检测单个行人的特征点轨迹聚类的概率框架［１１］。这个框架有一个基本假设是一起运动的点对可能是同一个个体的一部分，并且把它用于检测和最终的跟踪。对于完全和部分遮挡目标以及外观变化，这些方法和另外一些相似的方法都有很大的局限性。为了解决遮挡问题，一系列单视点跟踪技术应运而生。典型的方法是利用块合并来检测遮挡的发生［１２］。当被跟踪的点消失，跟踪特征点的方法就简单的将其作为一个被遮挡特征点。近年来，基于目标轮廓和外观的跟踪技术利用隐含的目标到相机的深度变化来表示和估计目标间的遮挡关系。但大多数方法都只能解决部分遮挡，不能解决完全被遮挡的情况。另外，小的一致运动被假设为是可以从遮挡视点中可以预测运动模式的，这些给没有预测运动的较长时间的遮挡的处理带来问题。尽管这些单视点的方法有较长的研究历史，但这些方法由于不能明锐的观察目标的隐藏部分，因此不能很好地解决有２或３个目标的遮挡问题。２．２多视点的方法随着复杂环境中对检测和跟踪多个被遮挡的人和计算他们的精确位置的需要，多视点的方法成为研究的热点。多视点跟踪技术的目的就是利用不同视点的冗余信息，减少被遮挡的区域，并提供目标和场景的３Ｄ信息。尽管通过相机不能很好地解决目标跟踪问题，但却提出了一些很好的想法，如选择最佳视点，但这些方法都以实际环境模型和相机校正为特征。９０年代后半期，在很多文献中给出了多视点相关的多目标跟踪方法。比如利用一个或多个相机与观察区域相连的状态变化映射，同时给出一系列的行为规则去整合不同相机间的信息。利用颜色在多个视点中进行多目标的跟踪的方法，该方法模拟了从基于颜色直方图技术的背景提取中获得的连接块并应用其去匹配和跟踪目标。除此之外，也有在原来的单视点跟踪系统进行扩展的多视点跟踪方法。该方法主要是通过一个预测，当预测当前的相机不在有一个好的视点时，跟踪就从原来凯斯的那个单相机视点的跟踪转换到另外一个相机，从而实现多视点的跟踪。基于点与它对应的极线的欧氏距离的空间匹配方法、贝叶斯网络和立体相对合并的方法都是多目标多视点跟踪的常见方法。尽管这些方法都试图去解决遮挡问题，但由于遮挡的存在，基于特征的方法都不能根本解决，其次，这些方法中的遮挡关系的推理一般都是根据运动模型，卡尔曼滤波或者更普遍的马尔科夫模型的时间一致性来进行的。因此，当这个过程开始发散，这些方法也不能恢复遮挡关系。最近一种基于几何结构融合多个视点信息的Ｈｏｍｅｇｒａｐｈｉｃｏｃｃｕｐａｎｃｙｃｏｎｓｒｒａｉｎｔ（ＨＯＣ）［１２］方法，可以通过在多场景平台对人的定位来解决遮挡问题。仅采用随时间变化的外表信息用于从背景中检测前景，这使得在拥挤人流的场景中的外表遮挡的解决更健壮。利用多视点中的前景信息，主要是试图找到被人遮挡的场景点的图像位置，然后这些被遮挡的信息用于解决场景中多个人的的遮挡和跟踪问题。在这种思想指导下，Ｍｉｔｔａｌ，Ｌｅｉｂｅ，Ｆｒａｎｃｏ等的研究工作和机器人导航中基于遮挡网格的距离传感器的并行工作是相似的，这些方法在融合３Ｄ空间信息的时候需要进行校正相机。但ＨＯＣ方法是完全基于图像的，仅需要２Ｄ结构信息进行图像平面的融合。当然也有另外一些不需要进行相机校正的算法被提出，但需要学习一个与相机最小相关的信息。在目标跟踪过程中，由于这些方法依赖于单个相机的场景，对于拥挤场景中目标分布密度增加九无能为力了。在ＨＯＣ的多视点的目标跟踪中，对于任何单一相机的场景，或者相机对的场景，都不需要进行定位和跟踪目标，而是从所有相机的场景中收集证据，形成一个统一的框架，由于该方法能够从多个时间帧的场景中进行场景被遮挡概率的全局轨迹优化，因此可以同时进行检测和跟踪。３、总结动态目标检测与跟踪是智能监控系统的重要组成部分，它融合了图像处理、模式识别、自动控制及计算机应用等相关领域的先进技术和研究成果，是计算机视觉和图像编码研究领域的一个重要课题，在军事武器、工业监控、交通管理等领域都有广泛的应用。尤其是对于多目标检测与跟踪中的遮挡与被遮挡的处理，对提高智能监控中目标的行为分析有着重要的意义。随着监控设备的发展和设施的铺设，多视点的场景图像是很容易得到的，因此借助信息融合的思想，充分利用不同角度对目标的描述信息，可以很大地改进目前基于单视点的多目标检测和跟踪的精度，能够很好地解决单视点方法中不能很好解决的遮挡问题。参考文献［１］胡斌，何克忠．计算机视觉在室外移动机器人中的应用．自动化学报，２００６，３２（５）：７７４－７８４．［２］Ａ．Ｏｔｔｌｉｋ，Ｈ．－Ｈ．Ｎａｇｅｌ．ＩｎｉｔｉａｌｉｚａｔｉｏｎｏｆＭｏｄｅｌ－ＢａｓｅｄＶｅｈｉｃｌｅＴｒａｃｋｉｎｇｉｎＶｉｄｅｏＳｅｑｕｅｎｃｅｓｏｆＩｎｎｅｒ－ＣｉｔｙＩｎｔｅｒｓｅｃｔｉｏｎｓ．ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，２００８，８０（２）：２１１－２２５．多目标跟踪方法研究综述苏州联讯图创软件有限责任公司陈宁强［摘要］文章对目前现有的多目标跟踪方法从信息获取的不同角度进行了综述。主要分析比较了目前单视点和多视点目标跟踪方法对于目标遮挡问题的处理性能，并指出多视点的基于多源信息融合的思想，可以较好地解决场景中目标的遮挡问题。［关键词］单视点多视点目标跟踪信息融合基金项目：本文系江苏省自然科学基金（ＢＫ２００９５９３）。作者简介：陈宁强（１９７３－），男，江苏苏州人，工程师，主要研究方向：ＧＩＳ、模式识别和图像处理与分析。目标跟踪多目标标记与分离匹配目标模型运动检测当前帧图像背景提取去噪ＲＯＩ预处理视频序列（下转第２６页）

目标检测、跟踪与识别技术与现代战争

目标检测、跟踪与识别技术与现代战争【摘要】本文讨论目标检测、跟踪与识别技术在现代战争各个领域中的应用，总结目标识别技术的发展方向，提出目标识别技术工程化实现方法，同时本文介绍了国外目标识别的现状及发展趋势，提出了现代战争应采用综合识别系统解决目标识别问题的建议。关键词目标检测；目标跟踪；目标识别；雷达；人工神经网络；精确制导 1．引言随着现代科学技术的飞速发展及其在军事领域内日益广泛的应用，传统的作战思想、作战方式已发生根本性的变化。从第一次海湾战争到科索沃战争，特别是刚刚结束的海湾战争，空中精确打击和空地一体化作战已经成为最重要的作战形式。集指挥、控制、通信、计算机、情报、监视侦察于一体的C ISR 已成为取得战场主动权，赢得最后胜利的关键因素。目标识别技术是雷达智能化、信息化的重要技术支撑手段。在现代化战争中，目标识别技术在预警探测、精确制导、战场指挥和侦察、敌我识别等军事领域都有广泛的应用前景，已受到了世界各国的关注。现代战争中取得战场制信息权的关键之一是目标属性识别。现代战争的作战环境十分复杂，作战双方都在采用相应的伪装、隐蔽、欺骗和干扰等手段和技术，进行识别和反识别斗争。因此仅仅依靠一种或少数几种识别手段很难准确地进行目标识别，必须利用多个和多类传感器所收集到的多种目标属性信息，综合出准确的目标属性，进行目标检测，跟踪后进行识别。 2．目标检测、跟踪与识别技术在现代战争中的应用 2．1 目标检测、跟踪与识别技术在预警探测上的应用目标检测、跟踪与识别技术对于弹道导弹的预警工作有重要的作用。弹道导弹一般携带多个弹头，其中可能包含核弹头或大规模杀伤的弹头以及常规弹头，预警雷达必须具备对目标进行分类和识别真假弹头的能力，将核弹头或大规模杀伤的弹头分离出来，为弹道导弹防御(BMD)系统进行目标攻击和火力分配提供依据。早期的BMD系统假设只有一个核弹头，多弹头分导技术的出现，使问题转化为雷达的多目标识别问题，加上电子对抗技术的广泛使用，给目标识别技术带来很大困难。另外，预警雷达还要对空中目标或低空目标进行探测，对来袭目标群进行分类识别。利用星载雷达以及远程光学望远镜等观测设备，可以对外空目标进行探测，对外空来袭目标进行分类和识别，达到早期预警的工作。

目标跟踪算法综述

。目标跟踪算法综述大连理工大学卢湖川一、引言目标跟踪是计算机视觉领域的一个重要问题，在运动分析、视频压缩、行为识别、视频监控、智能交通和机器人导航等很多研究方向上都有着广泛的应用。目标跟踪的主要任务是给定目标物体在第一帧视频图像中的位置，通过外观模型和运动模型估计目标在接下来的视频图像中的状态。如图1所示。目标跟踪主要可以分为5 部分，分别是运动模型、特征提取、外观模型、目标定位和模型更新。运动模型可以依据上一帧目标的位置来预测在当前帧目标可能出现的区域，现在大部分算法采用的是粒子滤波或相关滤波的方法来建模目标运动。随后，提取粒子图像块特征，利用外观模型来验证运动模型预测的区域是被跟踪目标的可能性，进行目标定位。由于跟踪物体先验信息的缺乏，需要在跟踪过程中实时进行模型更新，使得跟踪器能够适应目标外观和环境的变化。尽管在线目标跟踪的研究在过去几十年里有很大进展，但是由被跟踪目标外观及周围环境变化带来的困难使得设计一个鲁棒的在线跟踪算法仍然是一个富有挑战性的课题。本文将对最近几年本领域相关算法进行综述。二、目标跟踪研究现状 1. 基于相关滤波的目标跟踪算法在相关滤波目标跟踪算法出现之前，大部分目标跟踪算法采用粒子滤波框架来进行目标跟踪，粒子数量往往成为限制算法速度的一个重要原因。相关滤波提出了一种新颖的循环采样方法，并利用循环样本构建循环矩阵。利用循环矩阵时域频域转换的特殊性质，将运算转换到频域内进行计算，大大加快的分类器的训练。同时，在目标检测阶段，分类器可以同时得到所有循环样本得分组成的响应图像，根据最大值位置进行目标定位。相关滤波用于目标跟踪最早是在MOSSE算法[1]中提出的。发展至今，很多基于相关滤波的改进工作在目标跟踪领域已经取得很多可喜的成果。 1.1. 特征部分改进 MOSSE[1] 算法及在此基础上引入循环矩阵快速计算的CSK[2]算法均采用简单灰度特征，这种特征很容易受到外界环境的干扰，导致跟踪不准确。为了提升算法性能，CN算法[3]对特征部分进行了优化，提出CN（Color Name）空间，该空间通道数为11（包括黑、蓝、棕、灰、绿、橙、粉、紫、红、白和黄），颜色空间的引入大大提升了算法的精度。与此类似，KCF算法[4]采用方向梯度直方图（HOG）特征与相关滤波算法结合，同时提出一种将多通道特征融入相关滤波的方法。这种特征对于可以提取物体的边缘信息，对于光照和颜色变化等比较鲁棒。方向梯度直方图（HOG）特征对于运动模糊、光照变化及颜色变化等鲁棒性良好，但对于形变的鲁棒性较差；颜色特征对于形变鲁棒性较好，但对于光照变化不够鲁棒。STAPLE算法[5]将两种特征进行有效地结合，使用方向直方图特征得到相关滤波的响应图，使用颜色直方图得到的统计得分，两者融合得到最后的响应图像并估计目标位置，提高了跟踪算法的准确度，但也使得计算稍微复杂了一些。图1 目标跟踪算法流程图

目标检测与跟踪

第九章图像目标探测与跟踪技术主讲人：赵丹培宇航学院图像处理中心 zhaodanpei@https://www.360docs.net/doc/ad11597685.html, 电话：82339972

目录 9.1 概论 9.2 目标检测与跟踪技术的发展现状9.3 目标检测与跟踪技术的典型应用9.4 图像的特征与描述 9.5 目标检测方法的基本概念与原理9.6 目标跟踪方法涉及的基本问题

9.1 概论 1、课程的学习目的学习和掌握目标探测、跟踪与识别的基本概念和术语，了解一个完整信息处理系统的工作流程，了解目标探测、跟踪与识别在武器系统、航空航天、军事领域的典型应用。了解目标检测、跟踪与识别涉及的关键技术的发展现状，为今后从事相关的研究工作奠定基础。 2、主要参考书：《目标探测与识别》，周立伟等编著，北京理工大学出版社；《成像自动目标识别》，张天序著，湖北科学技术出版社；《动态图像分析》，李智勇沈振康等著，国防工业出版社；

引言：学习目标检测与跟踪技术的意义 ?现代军事理论认为，掌握高科技将成为现代战争取胜的重要因素。以侦察监视技术、通信技术、成像跟踪技术、精确制导技术等为代表的军用高科技技术是夺取胜利的重要武器。 ?成像跟踪技术是为了在战争中更精确、及时地识别敌方目标，有效地跟踪目标，是高科技武器系统中的至关重要的核心技术。 ?例如：一个完整的军事战斗任务大致包括侦察、搜索、监视以及攻击目标和毁伤目标。那么快速的信息获取和处理能力就是战争胜利的关键，因此，目标的实时探测、跟踪与识别也成为必要的前提条件。

?随着现代高新技术的不断发展及其在军事应用领域中的日益推广，传统的作战形态正在发生着深刻的变化。 1973年的第四次中东战争，1982年的英阿马岛之战，1991年的海湾战争及1999年的科索沃战争，伊拉克战争等都说明了这一点。西方各军事强国都在积极探索对抗武器，特别是美国更是投入了巨大的物力、人力和财力积极研制弹道导弹防御系统。而图像检测、跟踪和识别算法作为现代战场信息环境作战成败的关键，具备抗遮挡、抗丢失和抗机动鲁棒性的智能跟踪器，将是现代战场作战必备品，具有广泛的应用前景。

人形目标检测与跟踪

——人形目标检测与跟踪

一、本组研究方案，算法系统框图二、检测算法、原理、程序实现方法、调试过程【视频处理】老师提供的两端视频两段视频并不能直接用来输入OpenCV 所编程序处理，需要将其转化为无压缩的avi 格式。利用软件WinAVI Video Converter ，转换为ZJMedia uncompressed RGB24格式。【背景建模】我们小组利用N 帧图像的平均来求取背景，并实时对背景进行更新。由于考虑到ExhibitionHall.avi 视频中运动物体所占场景比例少，运动轨迹为直线，为了处理的简单，所以在这不刻意区分物体和背景像素点。即(1)(1)()()A A A B k B k I k αα+=-+ ，这里的α 很小（0.003）。【前景提取】灰度图像的处理比彩色图像的处理过程简单。我们小组将读入的彩色图像变成灰度图像，并二值化；同样，背景也进行二值化。两者做差值，得到一些离散的黑白点块。也就

是要识别的目标。但是，这样得到的块是分散开的，程序整的人形被分块识别成多个目标。为此，我们做了一些简单的后处理。先腐蚀元素，去除不必要的杂点，然后进行膨胀块处理，自定义块的大小，使其膨胀成能被识别成一个人形的目标。另外，我们还做个简单的高斯低通滤波，是得到的结果光滑些。其流程图如右。【目标检测】根据前景处理的结果，得到一些连续的块目标。利用帧间差，可以提取出目标的轮廓。根据轮廓的位置分布，计算出检测目标的形心和大小。并予以标记。【目标跟踪】根据目标帧间的位移差值，可以计算出运动目标在x，y方向上的运动速度。可以利用这个关系判断下一帧目标的位置。设置一个合适的阈值，就可以实现目标的跟踪。在此，我们还引入了重叠判断机制。如果目标重叠，即通过遍历，发现块重叠大于一定阈值后，根据前面得到的位置预测判断当前物块位置；如果不重叠，则遍历这幅图像中的所有物块，寻找临近最优物块，以保持编号连续性。在目标跟踪过程中，还进行了Kalman滤波，对目标轨迹进行滤波处理。

目标检测与跟踪方法在自动跟踪装置中的应用

第33卷增刊2007年11月光学技术OPTICAL TECHN IQU E Vol.33Suppl. Nov.　2007 文章编号:100221582(2007)S 20069203 目标检测与跟踪方法在自动跟踪装置中的应用 Ξ 伍翔,霍炬,杨明,董红红 (哈尔滨工业大学控制与仿真中心,哈尔滨　150082) 摘　要:介绍了一种应用于自动跟踪装置上的运动背景下目标检测与跟踪的方法,采用仿射模型作背景运动估计进行检测以及mean 2shift 算法跟踪目标,并将该方法应用到一套自动跟踪系统实验平台上。关键词:仿射模型;mean 2shift 算法;自动跟踪装置中图分类号:TP751 文献标识码:A Application of a moving target detecting and tracking method in the automatic 2tracking equipment WU X iang ,H UO J u ,Y ANG Ming ,DONG H ong 2hong (Control and Simulation Center ,Harbin Institute of Technology ,Harbin 150082,China ) Abstract :This paper presents a moving target detecting and tracking method in moving background for the automatic 2tracking equipment.It uses affine model to estimate the moving character of the background for detecting ,and uses mean 2shift algorithm for tracking.An automatic 2tracking experimental system is realized by using this method. K ey w ords :affine model ;mean 2shift algorithm ;automatic 2tracking equipment 0　引　言基于图像处理的运动目标检测与跟踪,作为图像处理技术的一个分支,由于其在民用和军用上的广泛应用 [1,2] ,也逐渐成为研究的热点。本文主要针对自动跟踪装置,研究与设计一种图像处理的方法,实现运动背景下运动目标检测与跟踪,并应用到所搭建的自动跟踪仿真系统中。 1　自动跟踪系统实验平台利用图像处理的方法实现自动跟踪功能的跟踪系统一般由摄像机、图像采集卡、计算机、伺服系统几部分组成。摄像机、图像采集卡以及计算机都装载在伺服系统上,当摄像机的视野中出现运动目标时,计算机对图像采集卡采集到的图像进行处理分析,得出运动目标的位置等信息,传递给伺服系统,伺服系统带动相机跟踪目标,使得目标始终保持在视野的中心。图1　自动跟踪系统实验平台结构框图图1即为所搭建的自动跟踪系统实验平台的结构框图, 该平台是专门根据自动跟踪装置的结构和特点设计的,对自动跟踪装置进行模拟。由图1可知,在计算机上实现的图像处理部分,是整个系统的关键。它所要完成的功能是从采集图2　图像处理部分基本流程到的每幅视频图像中找出运动目标的位置,即运动目标的检测与跟踪。它主要包括两方面:第一,运动目标的检测与提取;第二,目标跟踪。其处理流程图如图2所示。 2　运动目标检测 2.1　背景模型选取根据摄像机相对于场景的运动情况可以将运动目标检测分为静止背景下运动目标检测和运动背景下运动目标检测两种。由自动跟踪装置的特性可知,在跟踪目标的过程中,摄像机随着伺服系统一起运动,所以应该考虑的是运动背景下运动目标的检测。本文采用的是运用背景运动估计进行建模的思想,将两帧图像之间的背景运动关系用仿射变换表示,建立一个仿射运动参数模型。如 x k +1=a 1x k +a 2y k +d x y k +1=a 3x k +a 4y k +d y (1) 9 6Ξ收稿日期:2006212211 E 2m ail :wuxiang602@https://www.360docs.net/doc/ad11597685.html, 基金项目:国家自然科学基金资助(60434010) 作者简介:伍翔(19842),男,苗族,湖南省人,哈尔滨工业大学硕士研究生,从事图像处理研究。