基于Meanshift与Kalman的视频目标跟踪算法
一种解决遮挡问题的跟踪方法

Tracking method for solving occlusion problem
WU Shui-qin1,2,3,MAO Yao1,2* ,LIU Qiong1,2,LI Zhi-jun1,2
(1.Key Laboratory of Optical Engineering,Chinese Academy of Science,Chengdu610209,China; 2I.nstitute of Optics and Electronics,Chinese Academy of Science,Chengdu 610209,China;
吴水琴1,2,3,毛 耀1,2* ,刘 琼1,2,李志俊1,2
(1.中国科学院 光束控制重点实验室,四川 成都 610209; 2.中国科学院 光电技术研究所,四川 成都 610209; 3.中 国 科 学 院 大 学 ,北 京 101400)
摘要:针对图像跟踪领域中因遮挡产生的漂移问题,提出一种基于直方图比的 背 景 加 权 的 Mean Shift算 法 和 Kalman预 测滤波器融合的方法。本文方法通过改进目标模型来优化 Bhattacharyya系数值,增大目标正常 跟 踪 状 态 下 和 遮 挡 状 态 下 Bhattacharyya系数的差值,提高遮挡判定的有效性,进而提高遮挡时的跟踪性能。通过实 验 证 明,基 于 直 方 图 比 的 背 景加权的 Mean Shift算法和 Kalman预测滤波器融合的方法可有效解决遮挡跟踪问题。 关 键 词 :遮 挡 跟 踪 ;Mean Shift算 法 ;Kalman 预 测 ;背 景 加 权 中 图 分 类 号 :TP391.4 文 献 标 识 码 :A doi:10.3788/YJYXS20193402.0188
基于自适应卡尔曼滤波的多目标跟踪算法

基于自适应卡尔曼滤波的多目标跟踪算法
王广玉;窦磊;窦杰
【期刊名称】《计算机应用》
【年(卷),期】2022(42)S01
【摘要】在视频的多目标跟踪任务中,卡尔曼滤波器性能受硬件噪声以及光线等环境噪声干扰较大,导致滤波性能下降甚至发散,严重影响目标跟踪精度。
针对这一问题,在检测端不变的情况下,对跟踪算法中的卡尔曼滤波器进行改进。
首先,通过实时监测跟踪过程中滤波器观测值和估计值的动态变化,提取新息或残差;然后,利用新息协方差对观测噪声统计特性进行自适应估计,进而调整卡尔曼滤波增益;并通过数值仿真表明所提方法能有效降低噪声,获得更好跟踪效果。
最后,基于YOLOv3算法检测结果进行实验验证,结果表明在多目标跟踪(MOT16)数据集上,相较于传统卡尔曼滤波设计,所提自适应卡尔曼滤波在多目标跟踪任务中的精度、标号(ID)相关指标(IDF1,IDP)等指标均有所提升。
【总页数】5页(P271-275)
【作者】王广玉;窦磊;窦杰
【作者单位】瞬态物理国家重点实验室(南京理工大学)
【正文语种】中文
【中图分类】TP391.14
【相关文献】
1.一种基于卡尔曼滤波器的多目标跟踪算法研究
2.基于卡尔曼滤波和多种信息融合的在线多目标跟踪算法
3.基于边缘卡尔曼滤波的GM-PHD多目标被动跟踪算法
4.基于YOLOv3与卡尔曼滤波的多目标跟踪算法
5.基于自适应卡尔曼滤波的Meanshift跟踪算法
因版权原因,仅展示原文概要,查看原文内容请购买。
跟踪算法评测实验报告

一、实验背景随着计算机视觉技术的发展,目标跟踪技术在视频监控、人机交互、自动驾驶等领域发挥着越来越重要的作用。
跟踪算法旨在对视频序列中的目标进行实时检测和定位,从而实现对目标的持续跟踪。
为了评估不同跟踪算法的性能,本实验选取了多种常见的跟踪算法,在相同条件下进行评测,并对实验结果进行分析。
二、实验目的1. 了解不同跟踪算法的基本原理和特点。
2. 评估不同跟踪算法在真实场景下的性能。
3. 分析影响跟踪算法性能的因素。
三、实验方法1. 数据集:本实验选取了公开数据集OTB-2013、VOT2015和VOT2016进行评测。
2. 算法:本实验选取了以下几种常见的跟踪算法进行评测:- 基于颜色特征的跟踪算法:MeanShift、CamShift- 基于模型特征的跟踪算法:SiamFC、SiamMask- 基于深度学习的跟踪算法:ByteTrack、Sort3. 评价指标:本实验采用以下评价指标对跟踪算法进行评估:- 平均精度(AP):计算跟踪算法在数据集中所有测试序列上的平均精度。
- 跟踪成功率(Success Rate):计算跟踪算法在数据集中所有测试序列上的跟踪成功率。
- 平均定位误差(Average Error):计算跟踪算法在数据集中所有测试序列上的平均定位误差。
四、实验结果与分析1. MeanShift和CamShift算法:这两种算法基于颜色特征进行跟踪,具有简单易实现的特点。
然而,在复杂场景下,颜色特征容易受到光照变化和遮挡等因素的影响,导致跟踪效果不佳。
2. SiamFC和SiamMask算法:这两种算法基于模型特征进行跟踪,能够有效地应对光照变化和遮挡等问题。
在OTB-2013数据集上,SiamFC算法的AP值达到0.9以上,SiamMask算法的AP值达到0.85以上。
然而,SiamFC算法在处理运动模糊和快速运动目标时效果较差,而SiamMask算法在处理部分遮挡和尺度变化时效果不佳。
基于目标质心的Meanshift跟踪算法

( . , eo o ue, n n nvr t o ot adT l o 1c) f mp t Naj gU iesy f s n e cmmu i t n , aj g20 0 - hn ; g C r i i P s e nc i sN ni 0 3 C ia ao n 1
Absr c : o i g tr e r c i g i i h y c o s i i l a y。 ih i v l e n ed s c s c mp tr i g r c si g, i e t a t M v n a g tta k n s a h g l r s —d s p i r wh c n o v s ma y f l s, u h a o c n i u e ma e p o e sn v d o i g r c s i g, t r e o n t n, ri c a n el e c n O o Th r f r t e r s ac fr a —t ma e p o e sn pat n r c g i o a t ili t l g n e a d S n. e e o e,h e e r h o e e i i f i l i d r b sn s s si r a me a o u t e s i tl a g e t n l
ta k n An ag r h c mb n d c n e fg a i t e s ita g rt m s p p s d i h sp p r At f s , s e c n r i s i iil rc ig l o i m o t ie e t ro r v t wi M a h f l o i y h n h i r o e n t i a o e . rt u e t e to d a n ta i h
基于Mean Shift视频运动目标跟踪

基于Mean Shift视频运动目标跟踪作者:魏保华来源:《计算机光盘软件与应用》2014年第01期摘要:视频监控是安全防范系统的重要组成部分,而视频运动目标检测和跟踪技术则是智能视频监控的关键技术。
Mean Shift算法是一种在一组数据的密度分布中寻找局部极值的稳定的方法,并因其它计算量小,简单易实现而广泛应用于实时跟踪场合。
在离散的数据集上,Mean Shift能很快的找到数据分布最密集的点,本文介绍了使用OpenCV实现Mean Shift的方法,分析其在跟踪方向的优势与不足。
关键词:目标跟踪;OpenCV;Mean;Shift;颜色直方图中图分类号:TP391.41视觉是人类从外界获取信息的主要途径。
运用摄影机和电脑代替人眼对目标进行识别、跟踪和测量,将三维环境信息储存为二维信息,并进一步做图像处理,合成为更适合人眼观察或传送给仪器检测的图像。
计算机视觉试图建立能够从图像或者多维数据中获取…信息‟的人工智能系统。
在这些应用领域中,如何利用计算机把运动目标从有干扰的背景中检测出来并对其进行识别、跟踪、管理等处理是需要研究的关键技术。
1 视频运动目标跟踪20世纪60年代后期,蒙特卡罗方法被引入自动控制领域。
1975年,Fukmaga等人在一篇关于概率密度梯度函数的估计中提出Mean shift。
1995年,Yizong Cheng在“Mean shift mode seeking and clustering”中定义了一族核函数,设定了一个权重系数,扩充了基本Mean Shift算法,扩大了其适用范围。
1999年,Intel公司在均值偏移理论的基础上建立了CAMSHIb'T算法,以及基于此算法的人脸跟踪系统,将均值偏移算法扩展到运动目标跟踪领域中。
基于Mean shift的研究有许多成果发表[1-3]。
2000年,Comaniciu[4-5]等人将Mean Shift作用于非刚性物体的实施跟踪。
基于检测的多目标跟踪算法综述

基于检测的多目标跟踪算法综述一、本文概述随着计算机视觉技术的快速发展,多目标跟踪(Multi-Object Tracking,MOT)算法在视频监控、自动驾驶、人机交互等领域的应用日益广泛。
多目标跟踪算法旨在从视频序列中准确地识别并持续跟踪多个目标对象,为上层应用提供稳定、连续的目标状态信息。
本文旨在对基于检测的多目标跟踪算法进行全面的综述,分析各类算法的优势与不足,并探讨未来的发展趋势。
本文将介绍多目标跟踪算法的研究背景与意义,阐述其在各个领域的应用价值。
本文将对基于检测的多目标跟踪算法进行详细的分类和介绍,包括基于滤波的方法、基于数据关联的方法、基于深度学习的方法等。
对于每类算法,本文将分析其基本原理、实现步骤以及优缺点,并通过实验数据对其性能进行评估。
本文还将讨论多目标跟踪算法面临的挑战,如目标遮挡、目标丢失、场景变化等问题,并探讨相应的解决方案。
本文将展望多目标跟踪算法的未来发展趋势,提出可能的研究方向和应用前景。
通过本文的综述,读者可以全面了解基于检测的多目标跟踪算法的研究现状和发展趋势,为相关领域的研究和应用提供有益的参考。
二、基于检测的多目标跟踪算法的基本原理基于检测的多目标跟踪算法(Detection-Based Multi-Object Tracking,DBT)是计算机视觉领域的一个重要研究方向。
其主要原理是将目标检测和目标跟踪两个任务结合起来,通过利用目标检测算法提供的目标位置信息,实现多目标在连续视频帧中的持续跟踪。
目标检测:通过目标检测算法(如Faster R-CNN、YOLO等)在每一帧图像中检测出所有感兴趣的目标,并获取它们的位置信息(如边界框)。
特征提取:对于每个检测到的目标,提取其视觉特征(如颜色、纹理、形状等)或运动特征(如速度、加速度等),以便在后续的跟踪过程中进行匹配和识别。
数据关联:在连续的视频帧中,通过数据关联算法(如匈牙利算法、Joint Probabilistic Data Association等)将当前帧中的目标与前一帧中的目标进行匹配,形成目标的轨迹。
跟踪算法
Meanshift,Kalman,扩展Kalman,基于粒子滤波基于区域的跟踪:目标区域整体特征基于特征的跟踪:目标区域整体特征基于模型的跟踪:目标运动模型参数基于轮廓的跟踪:目标轮廓算法的评价:精确度;实时性;通用性;鲁棒性Meanshift:均值偏移算法,统计迭代算法均值偏移算法:1、直方图法:直观简单。
需要的空间随着维数的增加呈指数增加2、最近邻域法:局部噪音的影响3、核密度估计法:渐进无偏的密度估计,有良好的概率统计性质目标跟踪不是一个新的问题,目前在计算机视觉领域内有不少人在研究。
所谓跟踪,就是通过已知的图像帧中的目标位置找到目标在下一帧中的位置。
在完成运动目标的特性提取之后,需要采用一定的相似性度量算法与下一帧图像进行相似性匹配,从而实现目标跟踪。
基于meanshift算法的活动目标的跟踪,可以认为是基于特征跟踪的方法的一种。
因为它选择目标模板以及待匹配区域中像素灰度的统计直方图,作为相似性匹配与跟踪的主要特征。
跟踪算法的具体过程:1、跟踪开始时,先在前一帧已经检测出的目标周围,确定一个包含被跟踪目标的的椭圆或矩形,作为目标模板区域,该取悦的大小就是目标函数的带宽。
2、用meanshift算法估计该区域中所有像素灰度的加权统计直方图(核密度函数),作为跟踪用模板3、在当前帧搜索一个候选区域(为加快匹配速度,可以使用kalman 滤波或其他预测技术)再次使用meanshift算法,以估计该区域中所有的像素的加权统计直方图4、利用bhattacharyya系数相似性测度,比较模板和候选区统计特征的相似性,从而找到相似性函数最大的关于目标的meanshift矢量这个矢量即是目标从初始位置向正确位置转移的矢量,由于meanshift算法的收敛性,不断迭代计算meanshift矢量,最终一定会收敛到目标的真实位置,从而实现对目标的跟踪。
后续帧的跟踪过程,除了对初始跟踪模板需要根据新得到的目标区域进行更新以外,其余与上述过程相同。
meanshift-目标跟踪算法1ppt课件
其中g (x )= -k '(x)
精选PPT课件
15
❖ 整个算法流程
①在当前帧以y0为起点,计算候选目标的特征
{p (y )} u
; 0 u=1,2…..m
②计算候选目标与目标的相似度:
③计算权值{w }i i=1,2…..m
④利用Mean-Shift算法,计算目标新位置
精选PPT课件
16
⑤更新{pu(y1)}u=1,2…..m,计算
8
❖ 选择核估计的原因 1.客服了直方图估计对高维数据的失效
性。 2.能够比较好的抑制噪声的影响 3.增强数据的有效性
精选PPT课件
9
❖ 均值漂移具体步骤
1.目标模型的计算
定义函数b(xi*)是像素xi*在量化的特征 空间的索引号。则特征u=1,…,m在目标模 式中出现的概率可表示为:
其中k(·)为核函数,即加权函数,δ(·)为 Kronecker函数,定义为:
精选PPT课件
22
2.目标计算 ⑴直方图的计算 对目标区域内做H分量的直方图计算。 (2)计算直方图的反向投影 (3)利用此反向投影计算整幅图,得到整
幅图的反向投影。 (4)以y0作为初始中心计算当前帧中窗口
的重心坐标。 (5)如果||y0-y1||<k,则停止,否则y0=y1转(4)
精选PPT课件
精选PPT课件
26
❖ Camshift计算窗宽 1.当前帧中用的窗比上次计算出来的窗
长和宽大20个像素。 2.在此窗中计算外界椭圆的各个参数 3.重新计算重心坐标 4.标记目标
精选PPT课件
27
外接椭圆各个参数的计算
长轴与x轴夹角
l为长轴 w为短轴
精选PPT课件
一种基于GMM和MeanShift的目标跟踪算法
第43卷第1期2020年1月现 代 测 绘Modern Surveying and MappingVol.43,Jan.,2020 项目来源:江苏省测绘地理信息科研项目(JSCHKY201924) 第一作者简介:陈超,工程师,研究方向为数字图像处理与计算机视觉。
一种基于GMM和MeanShift的目标跟踪算法陈 超1,赫春晓2(1.江苏省基础地理信息中心,江苏南京210013;2.江苏省测绘研究所,江苏南京210013)摘 要 经典MeanShift算法仅使用了影像的颜色直方图信息表示目标特征,并不包含目标的空间位置、纹理特征等其它信息,因此当目标被遮挡或目标和背景颜色相似时,容易跟踪失败。
针对此种情况,结合了颜色直方图与空间位置信息对经典算法进行改进。
在获取目标和背景区域的样本数据后,利用高斯混合模型获取每个颜色单元的质心位置,并利用颜色直方图与空间信息计算得到新的候选区域中心位置,进而完成目标跟踪。
实验表明,改进后的算法使用了目标区域颜色分布的空间信息,改善了传统MeanShift算法中丢失像素点空间信息的不足,在背景复杂时依然能够成功跟踪;避免了迭代计算,提高了跟踪效率。
关键词 目标跟踪;均值漂移;高斯混合模型;空间位置中图分类号:TP391 文献标识码:A 文章编号:1672-4097(2020)01-0040-040 引 言目标跟踪是计算机视觉和图像处理领域的重要研究方向之一,在许多领域有着广泛应用。
Co-maniciu等人[1-2]将MeanShift引入到目标跟踪算法中,MeanShift算法原理简单,易于实现,实时性好,有较好的跟踪性能。
但是经典MeanShift算法只使用了目标颜色直方图,并不包含目标的空间位置、纹理特征等其它信息。
因此当目标被遮挡、或目标和背景颜色相似时,容易跟踪失败。
江山等[3]利用Sobel算子求出灰度图像的梯度特征,将梯度特征与灰度特征融合得到新特征,利用改进Mean-Shift算法对新特征进行跟踪。
视频监控中的目标检测及自动跟踪技术
视频监控中的目标检测及自动跟踪技术董云云;鲍海燕;王溢琴【摘要】目标跟踪是计算机视觉和图像处理领域的重要研究课题.本文提出了一种目标跟踪方法,包括检测和跟踪两个模块.检测模块完成识别目标,生成具有最佳学习的、可靠性的目标信息;跟踪模块使用特征点提取的目标信息跟踪感兴趣区域,该模块使用Camshift和光流估计来测算目标位置.实验结果表明,所提出的方法可以用来自动跟踪视频中移动的目标.【期刊名称】《山西师范大学学报(自然科学版)》【年(卷),期】2017(031)001【总页数】5页(P65-69)【关键词】目标跟踪;SURF;Camshift【作者】董云云;鲍海燕;王溢琴【作者单位】晋中学院信息技术与工程学院,山西晋中030619;晋中学院信息技术与工程学院,山西晋中030619;晋中学院信息技术与工程学院,山西晋中030619【正文语种】中文【中图分类】TP18;TP393.030 引言随着视频监控和图像处理技术的发展,目标跟踪已经成为计算机视觉和图像处理领域内的重要研究课题.如何快速和实时的跟踪目标是课题研究中遇到的主要问题.目前各个领域监控数目呈指数式增长,但是大部分监控并没有发挥其应有的作用.如果可以将目标跟踪应用于金融机构的视频监控,就可以有效地防止不法分子的入侵,避免不必要的损失;如果可以将目标跟踪应用于交通监控中,就可以有效地避免交通违法逃逸事件的发生;如果可以将目标跟踪应用于企业生产中,对企业的安全生产也会起到监督指导作用.由于不同领域的安全问题日益突出,因此开发实时的目标检测和跟踪系统至关重要.对监控的视频进行分析的主要步骤有目标检测和目标跟踪.目标检测之前首先进行目标识别,识别该区域中哪些对象为目标.目标检测是定位和分割视频中的感兴趣目标,逐帧地跟踪和分析目标.目前大部分目标检测及跟踪采用背景减除法,它是静态场景中运动目标分割的常用技术.通过减去对时间段内的图像进行平均而创建的当前图像,尝试检测移动目标区域.但是背景减除模型计算复杂,时空开销较大,并且受到较多的延迟,影响实时监视的性能.许多研究者提供了各种应用场景中的目标跟踪算法,包括自动监控、视频索引、人机交互、机器人指导和流量监控等.当前研究目标跟踪算法的使用主要是粒子滤波算法和Camshift算法[1,2].粒子滤波算法可以很好地跟踪物体,但因为其计算复杂,不能满足实时性的要求[3].与粒子滤波算法相比,基于颜色特征的Camshift算法更简单,也可以实现更好的跟踪效果[4].Avidan将支持向量机集成到基于光流的跟踪器中,但是在这样的特征空间下学习分类器计算起来比较复杂[5].本文提出了一种目标跟踪方法,包括检测和跟踪两个模块.目标检测模块使用基于构造的数据库的位置敏感散列快速识别目标,初始化和更新目标的信息以便跟踪它,该模块能够学习目标信息,当目标跟踪失败时基于当前帧重新学习目标信息,重新检测目标.目标跟踪模块通过使用特征点和直方图跟踪目标,在评估目标信息之后重新学习目标信息.1 目标检测及跟踪方法1.1 目标检测对视频监控进行目标检测,首先要进行的是特征提取.目标的每个关键点由某些维向量描述,这些称为特征描述符.一个好的描述符必须具备以下特征:处理亮度变换、旋转变换、尺寸变换、规模变化、照射角度变化.其功能很明显,目标跟踪必须不受尺度缩放和旋转变换的影响,不受视觉点变化的影响,不受照明和遮挡条件的影响,且特征提取的时空开销不应该太大,要满足实时跟踪的要求.通常用于特征提取的方法是目标识别中的SIFT (Scale invariant feature transform ,SIFT)和SURF(Speeded- up robust features,SURF )[6].SIFT旨在解决底层特征提取中的实际应用问题,一般用于图像匹配中.SIFT包括两个阶段:特征提取和描述.描述阶段主要解决特征匹配中的底层特征的应用.SIFT方法中的底层特征提取,根据图像尺度不变、旋转不变、照明条件不变来选择显著性特征.但是SIFT方法随着图像尺寸的增大,因为其高维特征,数据量大量增加,匹配时间较长,因此计算时间也随之增加[7].SURF算法中,使用对Hessian矩阵的行列式来定位特征,Hessian矩阵由理想滤波器构成,它将输入图像与给定尺度的高斯二阶导数进行卷积.SURF使用积分图像概念,积分图是从输入图像快速计算得来的,可以加速任何直立矩形区域的计算.给定输入图像点(x,y),通过点(x,y)和原点之间的值的和来计算积分图像.SURF具有快速特征提取的特性,减少在SIFT方法中特征提取和匹配步骤中操作的复杂性[8],可以减少处理时间,使用特征提取方法和特征描述符得到较好的处理结果.要获取有关初始目标的信息,使用提前学习的数据库.基于SURF提取当前帧中的特征点和描述符,在数据库中高速搜索目标信息,使用位置敏感哈希(locality Sensitive Hashing, LSH)来匹配当前帧的特征信息.1.1.1 SURF(Speeded- up robust features, SURF )SURF通过快速Hessian来自动检测和定位图像中的兴趣点.理论上,兴趣点检测是基于尺度空间理论的,文中的目标检测基于Hessian矩阵,给定图像中的一个点X=(x,y),在点X,尺度为σ的Hessian 矩阵H=(X,σ)定义如下(1)其中,Lxx(X,σ)为图像I中点X处的高斯二阶导数的卷积为图像I中点X处的高斯二阶导数的卷积(X,σ)则表示一阶偏导在x方向上,二阶偏导在y方向上,g(σ)的定义(2)在SURF中,使用箱式滤波器估计二阶高斯导数,并使用积分图像快速评估图像.在原始图像中,通过扩展箱的大小来制定不同尺度的图像金字塔.箱式滤波器是高斯二阶导数的近似值.卷积结果的近似由Dxx、Dxy和Dyy表示,Hessian的行列式Det(H)=Dxx·Dyy-(0.9×Dyy)2(3)不同尺度的图像金字塔,图像被重复平滑以达到更高级别的金字塔.由于使用积分图像和箱式滤波器,不需要对先前的滤波器层的输出运用相同的滤波器.将图像分成八度,每个度包含不同尺寸的图像模板,图像的尺寸s=1.2*N/9,箱式滤波器的尺寸为N*N.1.1.2 位置敏感哈希 (locality Sensitive Hashing,LSH)在N维空间,从海量的点中高效求出距某点最近的点即为NN问题,解决NN问题的一个重要技术是位置敏感哈希(locality Sensitive Hashing, LSH).LSH观点为:原始空间中的两个相邻数据点,点p和点q在同一个桶中连续碰撞的可能性.如果点p和点q彼此接近,那么它们碰撞的可能性就越大;如果p和q之间的距离越远,它们碰撞的概率就较小.对原始的数据经过一系列hash之后,原本相邻的两个数据点变换到了新的数据空间中,它们还是在同一个桶中,相邻的概率还是很大,但是原先不相邻的数据点经过一系列hash之后被映射到同一个桶的概率很小. LSH系列需要满足以下两个条件如果d(q,p)<=d1,概率h(q)=h(p)的概率至少为p1;如果d(q,p)>=d2,概率h(q)=h(p)的概率至少为p2;d(q,p)表示q和p之间的距离,d1<d2, h(q)和h(p)分别表示对q和p进行hash 变换.如果散列函数同时满足上述两个条件,可以称它为(d1,d2,p1,p2)敏感,当通过(d1)敏感性的一个或多个散列函数对数据进行散列时,可以获得一个或者多个哈希表.这个过程称为位置敏感哈希.创建和查询LSH过程为:(1)输入参数;(2) 创建LSH函数;(3) 插入点;(4) 计算每个hash表的hash值;(5) hash值唯一化;(6) hash值相同的归入一类; (7) 计算所有创建的LSH.1.2 目标跟踪目标跟踪方法通常使用MeanShift和CamShift.MeanShift是一种基于外部特征的跟踪算法,利用它可以实现非严格的目标跟踪[9],该算法是一种由直方图定义的跟踪目标的有效方法.CamShift也是目标跟踪的重要算法之一[10],它是计算机视觉中平均偏移算法的改写.MeanShift和CamShift算法的主要区别是:MeanShift是基于静态分布的;CamShift基于连续自适应概率分布.文中目标跟踪模块使用Camshift和光流估计来测算目标位置和目标信息.每个目标的位置,通过目标信息进行评估和确认.目标信息由特征点、描述符、包含目标的窗口、期望目标的位置和其直方图组成.跟踪目标被用于学习目标信息的可信度方面的评估.为了评估目标的可信性,将跟踪的目标信息与标准信息进行比较:最可靠的目标信息定义为级别1,级别1是检测模块中的初始化目标信息.所使用的目标信息主要分为两部分:直方图信息和特征点信息.直方图信息对目标建模是最重要的.使用直方图信息进行以下的工作:(1)定义子窗口;(2)定义和分析目标的形态;(3)标记特征点.定义子窗口:通过将直方图与标准目标直方图进行比较,基于光流的期望目标窗口和CamShift之间选择子窗口.根据直方图的最高速率将每个子窗口划分为正和负子窗口.由包括匹配关键点的正子窗口更新目标的直方图信息.目标的形态定义和分析:分析正直方图和负直方图的分布以定义目标的形状.正子窗口由目标直方图的最大频率定义,可以通过在正子窗口的地图中的负分布来提取目标的形态特征和形状.特征点属于正子窗口,被标记为与正子窗口相同.因此,子窗口包含关于目标的直方图的信息和特征.使用特征点是一种通过匹配特征点来识别目标的简单方法.使用ORB特征点,可以进行以下工作:重新检测目标、预期目标窗口、评估目标的可信性.重新检测目标:当目标跟踪失败时,使用特征点和描述符来检测期望目标窗口,匹配当前训练特征点.期望目标窗口:可以通过使用光流计算单应性来预测目标位置的改变.可信度水平通过确定可信目标的信息来评估.评估可信度水平时,考虑包含正面子窗口的目标信息,目标的形态形状,标签的匹配分布以及基于光流和CamShift的预期窗口.如果决定可信度,则可以通过其他信息来学习提取的目标信息.当目标无法跟踪时,检测模块使用学习目标信息再次检测目标,学习到的目标信息被初始化,具有最高可信度级别的目标信息被更新为标准信息(级别1),再次学习检测到的目标信息.重新检测模块通过匹配子窗口和特征点来识别对象.2 实验及结果实验处理真实的视频监控场景.第一个视频序列如图1所示,是交通视频监控中路况比较简单的视频.第二个视频序列如图2所示,是商务区商场门口的视频监控.将所提方法在视频中进行测试,运行在台式电脑上,处理器为Intel(R) Core(TM)i5- ***************和8 GB的内存,使用opencv实现所提出的对象的检测和自动跟踪.图1 交通监控目标跟踪Fig.1 Object tracking in traffic monitoring图1为交通视频中目标跟踪的部分结果图,从视频出现运动的目标开始跟踪,图1a视频120帧时,检测到路边出现的行人,矩形框出运动的行人;图1b为视频220帧时,黄色的吉普车出现,算法可以检测出现的多个目标,汽车和行人都被检测到(矩形框框出)并且跟踪;图1c为视频320帧,检测到运动的目标(黑色越野车和行人),并且分别跟踪;图1d视频的420帧出现多辆汽车,视频中依然有运动的行人,但是红色和黑色车辆出现遮挡的情况并且运行速度基本一致,检测为同一个运动目标,加上白色车辆和行人,共三个运动的目标.图2为商务区行人目标跟踪的部分程序运行结果.图2a为视频80帧时,此时视频中只有年轻女子一个运动目标,程序检测出运动目标,将目标用矩形框框出来,图2b为视频的110帧时,此时监控画面中进入一对夫妻,但是距离较近,并且运动速度一致,所以将此认为一个运动目标.图2c为视频210帧时的监控画面,年轻女子在170帧离开监控,此后一直到210帧,夫妻离开监控视频;图2d为280帧时,拿手机的男士进入视频画面,其作为新的运动目标对其进行跟踪.由实验结果可以看出,所提方法可以检测并且跟踪运动的目标.但是此跟踪算法不能区分开遮挡、运动速度一致并且距离较近的运动目标.图2 商务区行人目标跟踪Fig.2 Object tracking in business district3 结论视频监控系统需要处理越来越多的数据来识别和跟踪目标.这样的系统需要能够处理大量数据的技术,以便通过提取目标的特征来识别和跟踪目标.因此,为了有效地跟踪视频序列内的移动目标,提出使用先进的特征匹配和Camshift的目标识别和跟踪方法,用于实时环境中的目标跟踪.所提出的算法使用不变的特征来提取目标,减少特征描述符的维度.将所提出的方法用于真实的视频场景中进行实验,结果表明,该方法可以在各种环境中自动地跟踪目标.【相关文献】[1] Bi H, Ma J, Wang F. An improved particle filter algorithm based on ensemble Kalman filter and Markov chain Monte Carlo method[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(2): 447~459.[2] Kulkarni M, Wadekar P, Dagale H. Block division based CAMShift algorithm for real- time object tracking using distributed smart cameras[C].//Multimedia (ISM) 2013 IEEE International Symposium on IEEE,2013.292~296.[3] Mei X, Ling H. Robust visual tracking and vehicle classification via sparse representation[J]. IEEE Transactions on Pattern Analysis and MachineIntelligence,2011,33(11):2259~2272.[4] Cong D, Shi P, Zhou D. An improved camshift algorithm based on RGB histogram equalization[C].//Image and Signal Processing (CISP) 2014 7th International Congress on IEEE, 2014.426~430.[5] Avidan S.Ensemble tracking[J].IEEE transactions on pattern analysis and machine intelligence, 2007, 29(2): 261~271.[6] Stommel M.Binarising SIFT- descriptors to reduce the curse of dimensionality in histogram-based object recognition[J]. International Journal of Signal Processing Image Processing and Pattern Recognition,2010,3(1):25~36.[7] Du M, Wang J, Li J, et al.Robot robust object recognition based on fast SURF feature matching[C].//Chinese Automation Congress (CAC) 2013.IEEE,2013.581~586.[8] Wang J, He F, Zhang X, et al. Tracking objects through occlusions using improved Kalman filter[C].//Advanced Computer Control (ICACC) 2010 2nd International Conference on IEEE, 2010,(5):223~228.[9] Leichter I, Lindenbaum M, Rivlin E. Mean shift tracking with multiple reference color histograms[J].Computer Vision and Image Understanding,2010,114(3):400~408.[10] Wang Z, Yang X, Xu Y, et al.CamShift guided particle filter for visual tracking[J].Pattern Recognition Letters, 2009,30(4):407~413.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
率密度的局部极大的非参数估计算法,具有实时 性好,易于与其他算法集成,对目标的旋转、变形, 以及边缘遮挡不敏感等优点。DORIN[6 - 7]将其应 用于图像滤波、分割和目标跟踪领域,通过对目标 模型和后续帧候选区的颜色直方图进行相似性度 量而 进 行 跟 踪。 通 过 BRADSKI 改 进 的 CAMSHIFT( continuously apative meanShift) [8]能较好地 处理颜色概率分布不断变化的视频序列,但是当 场景中运动速度过快或目标间出现遮挡时,物体 的特征会因为遮挡无法识别而产生错误的跟踪。 这就要求跟踪器必须具有预测功能。针对以上问 题,笔者提出 了 基 于 Kalman 滤 波 器 和 Meanshift 的视频目标跟踪算法。利用 Kalman 滤波器的预 测估计能力对 Meanshift 的跟踪结果进行处理,解 决了目标跟踪丢失的问题。其改进的算法框图如 图 1 所示。
图 2 Meanshift 算法的跟踪结果
图 3 改进后算法的跟踪结果
参考文献:
[1] HU W M,TAN T N,WANG L,et al. A survey on visual surveillance of object motion and behaviors[J]. IEEE Transactions on Systems,Man and Cybernetics,Part C:
实位置。笔者将 Kalman 滤波器融合进 Meanshift 跟踪的方法是: 当 Kalman 滤波器作为辅助跟踪
时,Meanshift 的 跟 踪 结 果 作 为 它 的 测 量 值,对
Meanshift 跟踪器产生的跟踪结果具有平滑作用;
当 Kalman 滤波器作为预测器时,当前帧的预测状 ^
个 Meanshift 跟踪器的跟踪输出得分来开启 Kalman 预测,完成了对各个目标的跟踪。所示的方 框为每一帧目标的跟踪结果。实验结果表明,融 合 Meanshift 与 Kalman 滤波器预测的方法能对目 标进行准确跟踪。
5 结论
针对复杂背景下,可能出现的跟踪效果差的问 题,提出了一种融合 Meanshift 跟踪与 Kalman 滤波 器预测的方法用于运动目标跟踪,判断 Meanshift 的跟踪效果,当跟踪效果良好时,Kalman 滤波起到 平滑作用; 当跟踪效果差时,启动 Kalman 的预测功 能。实验结果表明,所提出的算法能对目标进行准 确跟踪,具有良好的抗干扰能力。
中图分类号: TP37
DOI: 10. 3963 / j. issn. 1007 - 144X. 2012. 02. 005
对运动目标进行跟踪不仅可以提供目标的运 动状态和轨迹,也为运动分析、场景理解等提供可 靠的数据来源,在智能监控、突发事件检测等方面 有着重要的应用。而图像噪声、天气突变、光照变 化、目标运动随机性等复杂的场景,都会给运动目 标的跟踪带来困难。近年来,所提出的跟踪方法 通常有基于模型的跟踪、基于区域的跟踪、基于活 动轮廓的跟 踪 和 基 于 特 征 的 跟 踪 等[1]。 基 于 模 型的跟踪方法通过对运动目标进行建模,利用视 频图像序列确定模型的参数,从而精确分析出目 标的运动轨迹[2]。该方法在遮挡或干扰下,性能 较好,但几何模型的建立非常困难,计算量大、运 行时间长,难以实现实时跟踪; 基于区域的跟踪是 基于对连续帧中分割出的目标区域建立联系而提 出的[3],对多 目 标 跟 踪 效 果 较 好,但 由 于 只 能 获 得区域级的跟踪,当目标发生形变或存在遮挡时, 就会导致目标跟踪丢失,且费时,无法做到实时跟 踪; 基于活动轮廓的跟踪则利用目标边界信息来 实现跟踪[4],该方法能有效克服干扰或部分遮挡 问题,但其对跟踪的初始化特别敏感; 基于特征的 跟踪是利用目标的某个或局部特征进行匹配[5], 在目标部分遮挡时,利用部分特征仍能跟踪,常用 的特征有目标质心、颜色特征、角点等局部特征。 最典型的基于特征的方法是利用颜色特征的 Meanshift 算法,该方法是一种基于迭代收敛到概
间没有重叠,运动目标可能会收敛于背景中与目 标颜色相近的物体,而不是运动目标; 或是目标间
存在遮挡,利用颜色直方图对运动目标特征进行 描述也会导致跟踪效果欠佳。导致跟踪效果不好
的原因还可能在于在某些帧中目标的起始位置不
理想,若能通过目标以前的运动信息预测到当前
帧目标可能位置,然后将这一目标点作为目标的 起始位置,就可以在这一邻域内寻找到目标的真
1 Meanshift 跟踪
Meanshift 算法利用目标的颜色特征 概 率 密 度描述运动目标区域中心位于 x 的目标模型,在 目标中心邻域搜索窗口内以相似性度量最大为原 则,寻找最优的位于 y 的目标模型,使得两次移动 距离小于某一阈值,以达到目标的真实位置。笔 者采用 Bhattacharyya 系数度量目标模型 q^ u 和候 选模型 q^ u( y) 的相似程度。模型根据目标区域颜
( 4)
状态向量更新方程为:
^^
^
Xi = Xi i-1 + Ki( Zi - HXi i-1 )
( 5)
状态向量协方差更新方程为:
Pi = ( I - KiH) Pi i-1
( 6)
Kalman 加权矩阵或增益矩阵为:
Ki = Pi i-1 HT( HPi i-1 H + R) -1
( 7)
^
^
其 中,Xi i - 1 为 预 测 状 态; Xi 为 状 态 估 计;
4 实验结果及分析
实验硬件平台为 Intel P 3. 0 G,512 M 内存计 算机,软件采用 Matlab 编程环境。选用交通路口 场景,大小为 160 × 120,共 300 帧,帧率为 15 帧 / s。 图 2 是 Meanshift 算法的跟踪结果[10]。在第 62 帧 以前,Meanshift 可以较好地跟踪车和人等运动目 标,在 62 帧以后由于新进来的人车连在一起相互 遮挡,存在较多的颜色特征相似的目标,Meanshift 无法准确跟踪。图 3 是利用笔者所提出的算法处 理同一段视频序列,加入 Kalman 作为辅助跟踪 器,在第 62 帧以后,当人车连在一起时,依据对各
∑ I( x,y) / A( R2 )
x,y∈R2
其中,I( x,y) 为目标点( x,y) 的像素值; R1 、R2
为前后两帧跟踪目标对应区域; A( R1 ) 、A( R2 ) 分
别为 R1 和 R2 的面积。设一个门限值 T,若Score >
T,表 示 当 前 目 标 和 背 景 分 布 情 况 改 变 不 大,
Pi i -1为预测误差协方差; Pi 为估计误差协方差。
3 改进的 Meanshift 与 Kalman 滤波器跟踪
由于 Meanshift 跟踪关注的是目标模型和候 选模型颜色分布的相似性,当目标重叠过多或背
景与目标颜色相近时,Meanshift 将不能保证跟踪
准确无误。若目标运动速度过快,目标在相邻帧
且更正当前帧的目标区域。令状态向量 X = ( xc, yc) T 为目标在 x 轴和 y 轴的位置,测量矢量 Z = [xc,yc]T 为观测目标的位置。首先初始化状态 Xi,再以该目标位置作为 Kalman 滤波器的观测值 来进行下一帧的运算。
Kalman 滤波器的状态方程和测量方程为:
Xi+1 = AXi + Wi
m
ρ^ ( y) = ρ[p^ ( y) ,q^] = ∑ 槡p^ uq^ u ( 1) u =1
其中: u 为目标的特征值,取值为[1,m]; y 为 最优候选区域中心。ρ^ ( y) 越大,表示两模型越相 似。为定位下一帧目标,应使 ρ^ ( y) 最大化。
将当前帧的候选目标的中心初始为前一帧目 标中心 y0 ,然后在其领域内搜索匹配目标,不断 地从目标的当前位置 y0 移动到新目标位置 y1 ,若 Meanshift 向量 y1 - y0 ,‖ y1 - y0 ‖ < ε 则停止迭 代,使得 ρ^ ( y) 最大,直到候选区域与目标区域足 够相似,此时目标区域中心位置会由 y0 移动到新 的位置 y1。
若 T 取值过大,Meanshift 产生的结果不可信,Kal-man 滤波器的测功能容易失效,达不到预测跟踪
的目的; 若 T 取值过小,发挥不了 Meanshift 跟踪器
第 34 卷 第 2 期
杨红霞,等: 基于 Meanshift 与 Kalman 的视频目标跟踪算法
149
图像匹配跟踪功能,因此,笔者采取了一种折衷方 法,取 T = 0. 5,跟踪效果基本满足要求。
Meanshift 跟踪效果较好,其结果可输出到 Kalman
滤波器中,Kalman 滤波器在状态更新和测量更新 后,输 出 结 果 重 新 回 到 Meanshift 跟 踪 器 中。若
Score≤T,Meanshift 算法失效,则启动 Kalman 滤波
器的预测功能,不再利用 Meanshift 跟踪器结果。
Applications and Reviews,2004,34( 3) : 334 - 352. [2] HAAG M,NAGEL H H. Combination of edge element
and optical flow estimates for 3D - model - based vehicle tracking in traffic image sequences[J]. Inter J Comp Vision,1999,35( 3) : 295 - 319. [3] JORGE B,JOSE M S,FILIBERTO P. Motion based seg-
文献标志码: A
基于 Meanshift 与 Kalman 的视频目标跟踪算法
杨红霞1 ,杭亦文2 ,刘 旭1
( 1. 武汉理工大学 自动化学院,湖北 武汉 430070; 2. 武汉大学 电气工程学院,湖北 武汉 430072)