多视频运动对象实时分割及跟踪技术

多视频运动对象实时分割及跟踪技术
多视频运动对象实时分割及跟踪技术

第42卷第9期2008年9月

浙 江 大 学 学 报(工学版)

Journal of Zhejiang University (Engineering Science )

Vol.42No.9

Sep.2008

收稿日期:2007204227.

浙江大学学报(工学版)网址:https://www.360docs.net/doc/dc14016922.html,/eng

作者简介:孙志海(1981-),男,福建漳州人,博士生,主要从事视频运动对象分割的研究.E 2mail :eeszh @https://www.360docs.net/doc/dc14016922.html,

通讯联系人:朱善安,男,教授,博导.E 2mail :zsa @https://www.360docs.net/doc/dc14016922.html,

DOI :10.3785/j.issn.10082973X.2008.09.030

多视频运动对象实时分割及跟踪技术

孙志海,朱善安

(浙江大学电气工程学院,浙江杭州310027)

摘 要:利用帧间差异积累信息进行自适应背景建模,采用背景差的方法检测视频运动对象区域.设计了一种变系数的空域滤波器,有效地对背景差图像进行了增强,使获得的视频运动对象区域更具有空域连通特性.给出了一种改进的基于Otsu 法的自适应阈值化方法,能更准确地对背景差图像进行阈值化.采用形态学边界提取技术对视频运动对象轮廓进行提取.在获得视频运动对象轮廓的基础上,用区域生长法对视频运动对象进行定位,将矩形中心坐标视为视频运动对象的质心坐标.用基于空间欧氏距离最短的方法对每个视频运动对象质心进行关联跟踪并绘制轨迹.试验结果表明,该方法实时有效.

关键词:运动对象分割;运动对象跟踪;差异积累;空域滤波;背景更新

中图分类号:TP391.41 文献标识码:A 文章编号:10082973X (2008)0921631205

R eal 2time segmentation and tracking technique of multiple

moving objects in video sequence

SU N Zhi 2hai ,ZHU Shan 2an

(College of Elect rical Engineering ,Zhej iang Universit y ,H angz hou 310027,China )

Abstract :Effective background was modeled by accumulative f rame 2to 2frame differences ,and foregro und could be ext racted using background subtraction operation.A variable coefficient spatial filter was presen 2ted ,which could effectively enhance t he background subt raction image and make t he foreground region has much more spatial connectivity.An imp roved Ot su 2based segmentation met hod was presented to accurately t hreshold t he background difference image.Morp hological operation was used in extracting contours of moving object s.After getting t he contours of moving object s ,region growing segmentation met hod was applied to locate t he foreground region ,and t he rectangle cent re was seen as t he mass cent re of t he moving object s.Moving object s were t racked using minimal Euclidean distance and t he motion trajectories were also painted.Experimental result s showed t hat p roposed algorit hm was effective and efficient.

K ey w ords :moving object segmentation ;moving o bject tracking ;difference accumulation ;spatial filte 2ring ;background up date

视频运动对象分割及跟踪处于整个视觉监视系统的最底层,是各种后续高级处理如视频分析[1]、视频编码[2]、视频检索[3]以及视频监控[4]等的基础.运动对象分割是指从视频流中实时提取出运动对象,而运动对象跟踪则是指对目标进行连续的跟踪以确定其运动轨迹.尽管文献[5~7]报道了有关视

频运动对象分割的算法,但视频运动对象自动分割的问题还没完全解决.实时自动分割视频语义对象的难点有:对复杂场景快速准确的背景建模;环境变化及噪声影响算法的鲁棒性;算法通用性差,复杂的分割算法满足不了应用的实时性要求;多运动对象的分割及跟踪[627]对分割算法提出了更高的要求.

Bailo等人[8]从算法实时性角度出发,利用高斯分布特性构建自适应背景更新模型,实现了对视频运动对象的分割,此类算法需要估计镜头噪声或静止背景中由噪声所引起的方差,算法自适应程度较不理想.Yang等人[9]利用视频像素水平及帧水平特性有选择地更新背景模型,然后采用形态学后处理方法对视频运动对象进行分割,该算法对图像R G B颜色空间的三维数据均进行了处理,当视频窗口变大时,算法处理速度成倍下降,影响实时性.Chen等人[10]提出了一种采用背景记录技术恢复背景区域,结合背景差和邻帧差信息分割视频运动对象的算法,该算法如果没有准确的前景物体分割,背景记录技术得到的背景信息则不可靠,反而影响了下一帧运动对象分割的准确性.

本文结合实际视频运动对象的特点,针对实际拍摄的交通视频系列,给出了一种多视频运动对象实时分割及跟踪技术.

1 分割及跟踪技术框架

多视频运动对象实时分割及跟踪的技术框架如图1所示.主要有5部分:自适应背景建模;空域滤波、轮廓提取;目标定位、质心标记;运动对象质心关联;轨迹绘制.

利用每隔一段时间内每个像素的帧间积累差异信息自适应建立背景模型,利用背景差技术检测出运动物体区域;根据背景差图像的特点,设计了一种变系数的空域滤波器,结合形态学处理的方法对背景差图像进行空域滤波并提取出视频运动对象轮廓;采用区域生长法对视频运动对象进行定位和质心标记;在视频运动对象分割的基础上,利用运动对象质心建立视频运动对象帧间向量,并比较运动对象的帧间向量模值,对视频运动对象质心进行关联跟踪及轨迹绘制.

2 视频运动对象分割

2.1 自适应背景建模

设有M帧视频序列f(x,y,t1),f(x,y,t2),…,f(x,y,t M),取f(x,y,t1)为基准图像,则一幅差异积累图像是由将基准图像和视频序列后续图像进行对比得到的[11].当基准图像和序列中图像之间在某个像素位置上出现一次较小差异就令计数器计数一次,这种计数器在差异积累图像每个像素的位置上都有一个.当第k

帧图像与基准图像相比较

图1 多视频运动对象实时分割及跟踪技术框架Fig.1 Frame of real2time segmentation and tracking tech2 nique of multiple moving objects in video sequence

时,差异积累图像中一个给定像素的输入项给出在此位置上对应的像素与基准图像中同一位置的像素间灰度级变化的次数.随着时间的更新,差异积累图像可视为一个像素值在动态更新的矩阵D(x,y, t k),差异大小是根据某阈值T f设定好的.如取第k-r帧图像f(x,y,t k-r)为求取差异积累图像的参考帧,则当前帧f(x,y,t k)与参考帧f(x,y,t k-r)之间的差异图像F(x,y,t kγ)以及差异积累动态矩阵D(x,y,t k)分别如式(1)、(2)所示,通过分析差异积累动态矩阵来决定某像素属于前景或背景:

F(x,y,t kγ)=

1;|f(x,y,t k)-f(x,y,t k-r)|>T f,

0,其他,

(1) D(x,y,t k)=

D(x,y,t k-1)+1,F(x,y,t kγ)=

 0,D(x,y,t k-1)<λ,

0,其他.

(2)式(2)表示当某位置像素的帧间差异较小时,使D(x,y,t k)加1,否则D(x,y,t k)赋值为0,表示该像素的帧间差异比较大,λ记录每个像素差异积累

2361浙 江 大 学 学 报(工学版) 第42卷 

的深度.设当前背景的更新模型为B (x ,y ,t k ),则当D (x ,y ,t k )积累至λ值时(其中λ>0),相应位置的背景像素值可根据式(3)进行自适应更新,对D (x ,y ,t k )为0的点则不更新背景像素值,保持原背景像素值不变.

B (x ,y ,t k )=α?f (x ,y ,t k )+(1-α)?B (x ,y ,t k -1)

(3)

式中:系数α影响着背景缓存平滑滤波的程度及更新的速度,α取值区间为[0,1].根据经验,取值在[0.05,0.1]区间时背景更新效果较好.一般以获取的第一帧图像作为初始背景.2.2 变系数空域滤波根据背景差技术可以快速地区分前景(视频运动对象)和背景区域的特点,将当前帧f (x ,y ,t k )与更新所得背景B (x ,y ,t k )相减得背景差图,记为

B d (x ,y ,t k )=|f (x ,y ,t k )-B (x ,y ,t k )|.(4)从试验结果来看,如果直接对B d (x ,y ,t k )进行二值化操作,所获得的视频对象平面大多具有空域不完整特性,所以需对背景差图像进行空域滤波,使视频对象平面保持空域连通性.常见空域滤波器有均值滤波器、中值滤波器及拉普拉斯滤波器等,但这些滤波器均有其各自的适用场合,直接采用某种滤波器对背景差图像进行滤波并不一定能获得理想的效果.建立在对以上这几种滤波器滤波效果分析的基础上,本文给出了一种新型的变系数空域滤波器(variable coefficient spatial filter ,VCSF )掩模.考虑有意义掩模的最小尺寸为3×3,图2显示了变系数空域滤波器掩模的两种形式,其中w 为待整定的系数,取值为w ≥1,当w =1时,该滤波器即还原为常规的均值滤波器

.

图2 3×3变系数空域滤波器掩模

Fig.2 Mask of 3×3variable coefficient spatial filter

给出的这种变系数空域滤波器,建立在均值滤

波器滤波原理的基础上,调整掩模系数,以适应对不同图像的增强.该滤波器可以理解为均值滤波器和变斜率灰度线性算子先后联合操作的过程,即经过变系数空域滤波器增强的图像,不但带有均值滤波器的平滑效果,而且还具有局部区域的灰度增强特性.从试验的效果来看,给出的这种滤波器掩模

形式很适用于对背景差图像的滤波.

在使用滤波器之前需先整定w 值,这里w 的

整定可采用两种方法:一是直接观察对应系数滤波图像阈值化后的效果;二是根据最大类间方差的原理,比较不同w 系数下滤波图像在特定阈值下的类间方差[12],从而整定w 值.

图3为对MA TL AB 提供的Viptraffic 视频测试序列(160×120,15帧/s )的第68帧图像采用不同空域滤波器及阈值化后的效果示意图.为了更有效地进行比较,所选择的视频帧里含有一辆黑色的车辆,其与背景的对比度明显不如视窗里的白色车辆.从图3(d )可以看出,直接对第68帧的背景差图像进行阈值化,其运动对象平面内部存在比较多的空洞,特别是黑色车辆,这将直接影响视频运动对象下一步的分割定位;在图3(e )中,由于均值滤波器的平滑效果,视频运动对象即三辆小车的内部空洞面积相比图3(d )有所减小;从图3(f )可看出复合拉普拉斯滤波操作不但没有减少空洞区域,反而增加了背景差图像的高频分量;图3(g )则为采用VCSF 滤波器的效果,其视频运动对象的空域连通性对进一步分割定位非常有利.

图4给出了对Vipt raffic 视频测试序列第68帧背景差图像采用变系数空域滤波器时,不同系数值及其对应的最大类间方差比值曲线.图4中

3

361第9期孙志海,等:多视频运动对象实时分割及跟踪技术

w /9=0.21时的滤波效果如图3(g )所示,但当w/9>0.22时,会造成过分割问题,即分割结果出

现大面积的前景区域而造成误分割.

2.3 自适应阈值化及轮廓提取

对经过空域滤波后的背景差图像采用自适应阈值算法,即可快速地分割出视频运动对象.基于Ot su 阈值化算法的原理[12],在分析常规Ot su 法当分割目标与背景灰度差异不明显时,会造成误分割的基础上,提出了一种增强的Ot su 法,常规Ot su 法的原理可参阅文献[12].

设由常规Ot su 法求得的当前滤波后背景差帧的最优二值化阈值为T O k ,定义增强的Ot su 法最优二值化阈值为T k ,则T k 可表示为

T k =

T OA ,T O k <ε?T OA ;

T O k ,其他.

(5)式中:

T O k =arg max i ∈[1,n]

(

σ2(T ki )),T OA =

∑β

k =1

T k

/β;β=

k -1,β≥1,

即T OA 为前k -1个T k 值的非零最优二值化阈值的

均值,当β=0时,T OA 需设为适当的初始阈值;ε为一个权系数,经验值区间为[0.5,1].图3(d )~(g )所示的二值图均为采用该阈值化方法的效果.对阈值化后的图像采用适当的形态学腐蚀及膨胀操作,可以使视频运动对象平面更具有空域连通性.再结合形态学边界提取的方法,即可提取出视频运动对象的轮廓.轮廓提取算法描述如下:

设阈值化后的二值图像可表示为集合F ,集合F 运动对象的轮廓表示为β(F ),则β(F )可先由B 对F 腐蚀,然后用F 减去腐蚀得到,见式(6):

β(F )=F -(F ΘB ),(6)式中:B 是一个适当的结构元素,Θ为腐蚀算子.

2.4 目标定位及质心标记有点类似分水岭思想的区域生长法是一种图像分割算法,其基本原理是将有相似性质的像素集合起来构成区域.具体地讲,是先对每个需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素有相同或相似性质的像素合并到种子像素所在的区域中.运动对象定位就是用包含运动对象的最小矩形框将对象框起来.确定对象的位置,即将一幅图像分割成为有意义的区域,并确定区域间的坐标关系及位置.基于区域生长法的原理,采用两步区域生长法的迭代思想,实现了视频运动对象的准确分割定位.

设第i 个运动对象外接矩形框4个顶点的坐标

点分别表示为(x i 0,y i 0)、

(x i 0,y i 1)、(x i 1,y i 0)、(x i 1,y i 1),记第i 个运动对象的质心为(x i ,y i ).为保证

算法的实时性,直接将运动对象外接矩形的中心标记为运动对象的质心,运动对象外接矩形坐标示意图和质心表达式分别如图5和式(7)所示

.

x i =(x i 0+x i 1)/2,

y i =(y i 0+y i 1)/2.

.

(7)图5 运动对象外接矩形坐标示意图

Fig.5 C oordinates of enclosing rectangle of moving objects

3 视频运动对象跟踪

目标跟踪算法常常用卡尔曼滤波器作为目标状

态估计器,粒子滤波器、Mean Shift 及基于Snake 的跟踪算法等逐步被用于运动对象跟踪.然而,这几种跟踪方法需要大量的运算,特别是在应用于多目标跟踪时,不利于实时处理;受制于算法的数学特性,这些算法也较难移植或应用到嵌入式领域.建立在分割的基础上,根据待测试视频序列的特点,从算法实时性角度出发,采用空间欧氏距离最短的方法,判断邻帧运动对象是否为同一对象,进而完成时域视频运动对象的关联跟踪.跟踪算法描述如下:

在多数情况下,视频序列第k 帧与第k -1帧中同一视频运动对象质心的欧氏距离最短,根据该特点实现对视频运动对象的跟踪.设当前视频帧为第k 帧,并含有N k 个视频运动对象,记Z i (k )=(z ix ,z iy )为第k 帧第i 个运动对象的质心坐标向量,其中i =1,2,…,N k .如果第k -1帧中含有N k -1个视频运动对象,则第k 帧中的某个视频运动对象质心Z i (k )与第k -1帧中N k -1个视频运动对象质心间最短的欧氏距离d ij min 可表示为式(8),其中j =1,2,…,N :

d ij min =arg min j

‖Z i (k )-Z j (k -1)‖,

(8)则d ij min 所对应的第k -1帧N k -1个视频运动对象中的第j 个运动对象质心向量Z j (k -1)与Z i (k )关联,实现了对第k 帧视频运动对象i 质心坐标的跟踪关联.当Z i (k )中的i 从1变化到N k 时,即可在第k -1帧的N k -1个视频运动对象中找到相应的关

4

361浙 江 大 学 学 报(工学版) 第42卷 

联,从而实现对两帧之间同一视频运动对象的跟踪.这里还需要考虑当N k 大于、小于和等于N k -1的情况.如果假设每帧只有一个视频运动对象进入或离开视频窗口,则当N k 等于(N k -1+1)时,说明第k 帧有新对象进入;当N k 等于(N k -1-1)时,说明第k 帧有老对象离开;当N k 等于N k -1时,说明第k 帧没有运动对象进入或离开.这3种情况在算法实现时需分别进行考虑,以自动地创建、释放及保持跟踪器资源,保证每个视频运动对象均有对应的跟踪器,从而实现自适应地对每个视频运动对象进行跟踪

.

图6 多视频运动对象实时分割及跟踪效果示意图 Fig.6 Real 2time segmentation and tracking technique of

multiple moving objects in video sequence

4 实验结果及分析

为测试算法的实际分割及跟踪效果,采用VC ++6.0开发环境,在Windows XP SP2、CPU 为Celeron 2.4GHz ,内存为512MB 的PC 机上对Highway (320×240,15帧/s )的500帧视频测试序

列进行了分割及跟踪试验,视频序列来源于ht 2tp ://https://www.360docs.net/doc/dc14016922.html,/aton/shadow ,每帧处理的平

均耗时为46.6ms ,即每秒可以处理24.5帧,完全可以满足实时处理的要求,图6是对视频运动对象

即车辆的分割及跟踪效果.图6(c )、

(d )为提取出来的视频运动对象轮廓,图6(e )、

(f )为对视频运动对象的定位、跟踪及轨迹绘制的效果.图6(e )有8个

视频运动对象,分别标记为A 、B 、C 、D 、E 、F 、G 、H ,实际运动对象的运动轨迹是一系列点,为了更直

观,程序里面设计了两点之间的线连接;图6(f )即第81帧里面的A 、B 、C 、D 、E 为第68帧的相应视频运动对象,I 、J 则为新进入窗口的运动对象,而第68帧里的H 和F 已在第81帧之前离开了视频窗口.图7示意了Highway 第110~160帧之间视频对象的运

动轨迹

.

图7 Highw ay 第110~160帧之间视频对象运动轨迹

Fig.7 Trochoid of video moving objects between

f rame110and f rame 160in Highway sequence

5 结 语

给出了一种多视频运动对象实时分割及跟踪方案.该方案在背景建模方面采用的是差异积累的方

法,建立的背景模型自适应程度高,且算法易于实现.该方案中给出的变系数空域滤波器,在调整好合适系数的条件下,可以较好地对背景差图像进行增强,以获得空域连通特性更好的视频运动对象平面.在阈值化问题上,考虑到当分割目标与背景灰度差异不明显时,会造成误分割的情况,提出了一种增强的阈值化方法.建立在分割的基础上,利用空间欧氏距离最短的方法对视频运动对象质心进行关联跟踪及轨迹绘制,该跟踪方法不适用于运动对象质心距离很近的情况.在整个方案中没有对阴影存在的情况进行考虑,故该方案比较适用于阴影影响较小的场合.可用于如车辆的运动跟踪、车流统计及交通控制等方面的应用.总之,该算法实现容易、具有良好的实时性,特别适用于大小适中的刚性视频运动对象的检测和跟踪.

参考文献(R eferences):

[1]FORESTI G L.Object recognition and tracking for

remote video surveillance [J ].IEEE T ransactions on Circuits and Systems ,1999,9(7):104521062.

(下转第1660页)

5

361第9期孙志海,等:多视频运动对象实时分割及跟踪技术

Oligonucleotide Array Data:Background,Normaliza2 tion and Summarization[D].Berkeley:University of California,2004.

[32]ROCKE D M,DU RBIN B.A model for measurement

error for gene expression arrays[J].Journal of Com2 putational Biology,2001,8(6):5572569.

[33]HUB ER W,H EY DEBREC K A V,SU EL TMANN

H,et al.Parameter estimation for the calibration and variance stabilization of microarray data[J].Statistical Applications in G enetics and Molecular Biology,2003,2

(1):Article3.

[34]FREUDENB ER GJ https://www.360docs.net/doc/dc14016922.html,parison of background cor2

rection and normalization procedures for high2density oligonucleotide microarrays[R].Leipzig,G ermany: Interdisciplinary Centre for Bioinformatics,2005. [35]COPE L M,IRIZARR Y R A,J A FFEE H A,et al.A

benchmark for affymetrix genechip expression meas2

ures[J].Bioinform atics,2004,20(3):323–331. [36]IRIZARR Y R A,WU Z J,J A FFEE H https://www.360docs.net/doc/dc14016922.html,parison

of Affymetrix GeneChip expression measures[J].

Bioinform atics,2006,22(7):7892794.

[37]IRIZARR Y R A,BOL STAD B M,COLL IN F,et al.

Summaries of Affymetrix GeneChip probe level data [J].Nucleic Acids R es,2005,31(4):e15.

[38]STEFFEN D,YV ES M,AREK K,et al.BioMart and

Bioconductor:a powerf ul link between biological data2 bases and microarray data analysis[J].Bioinform atics, 2005,21(16):343923440.

[39]Textual description of affydata.Vignette[EB/OL].

[2007208208].http:∥https://www.360docs.net/doc/dc14016922.html,/reposi2 tory/devel/vignette/affydata.pdf

[40]IHA KA R,GEN TL EMAN R R.A language for data

analysis and graphics[J].J Comput G raph Stat,1996, 5(3):2992314.

(上接第1635页)

[2]PORIK L I F.Real2time video object segmentation for

MPEG encoded video sequences[C]∥SPIE Conference on R eal2Time Im aging VIII.San Jose:[s.n.],2004, 5297:1952203.

[3]KIM C,HWAN G J N.Fast and automatic video object

segmentation and tracking for content2based applications [J].IEEE T ransactions on Circuits and Systems,2002, 12(2):1222129.

[4]NASCIM EN TO J C,MARQU ES J S.Performance

evaluation of object detection algorithms for video sur2 veillance[J].IEEE T ransactions on Multimedia,2006,8

(4):7612774.

[5]PORIK L I F,WAN G Y.Automatic video object seg2

mentation using volume growing and hierarchical cluste2 ring[J].EURASIP Journal on Applied Signal Process2 ing,2004(1):8142832.

[6]COLOMBARI A,FUSIELLO A,MURINO V.Seg2

mentation and tracking of multiple video objects[J].

P attern R ecognition,2007,40(4):130721317.

[7]L IN Shin2ping,CHEN Yuan2hsin,WU Bing2fei.A real

time multiple2vehicle detection and tracking system with pri2 or occlusion detection and resolution,and prior queue detec2 tion and resolution[C]∥P roceedings of the18th I nterna2 tional Conference on P attern R ecognition.Hongkong:IEEE

C omputer S ociety,2006,1:8282831.

[8]BA ILO G,BARIAN I M,I J AS P,et al.Background

estimation with gaussian distribution for image segmen2 tation,a fast approach[C]∥Proceedings of the2005 IEEE I nternational Workshop on Measurement Systems for H omeland Security.Orlando:Contraband Detection and Personal Safety Workshop,2005:225.

[9]YAN G Tao,L I S Z,PAN Quan,et al.Real2time and

accurate segmentation of moving objects in dynamic scene[C]∥Proceedings of the ACM2nd international Workshop on Video Surveillance&Sensor N etw orks.

New Y ork:ACM,2004:1362143.

[10]CH EN Shao2yi,HUAN G Yu2wen,HSIEH Bing2yu,

et al.Fast video segmentation algorithm with shadow cancellation,global motion compensation,and adaptive threshold techniques[J].IEEE T ransactions on Multi2 media,2004,6(5):7322748.

[11]GONZAL EZ R C,WOODS R E.Digital im age process2

ing(sencond edition)[M].Beijing:Publishing House of Electronics Industry,2002.

[12]OSTU N.A threshold selection method f rom gray2level

histograms[J].IEEE T ransactions on System Manage2 ment and Cybemetic,1979,9(1):62266.

0661浙 江 大 学 学 报(工学版) 第42卷 

基于速度特征矢量提取运动目标的图像分割方法

第20卷 第3期2000年6月北京理工大学学报 J o urnal of Beijing Institute o f Technolog y V o 20 No.3Jun.2000 文章编号:1001-0645(2000)03-0347-05 基于速度特征矢量提取运动目标的 图像分割方法 李冬霞, 曾禹村 (北京理工大学电子工程系,北京 100081) 摘 要:研究基于速度特征矢量提取运动目标的图像分割方法.根据目标图像像素移动的一致性,在序列图像中利用块匹配法进行帧间图像配准,得到目标图像块的速度估计,将具有相同速度矢量的目标图像块聚类,即可分割出运动目标.仿真实验结果表明,该方法能有效地对复杂背景下的运动目标图像进行分割,并具有较好的抗噪能力.关键词:运动目标检测;图像分割;块匹配;速度特征矢量中图分类号: TN 957.53 文献标识码:A 收稿日期:19991005 作者简介:李冬霞,女,1971年生,博士生. 理想情况下,具有运动目标的图像序列相邻图像帧间背景几乎不动,目标像素是作为一个整体相对于背景平移运动的,因此可以利用目标的速度特征将其从背景中提取出来.一般以二维位移偏移量(d x ,d y )作为目标运动速度的描述,常用的运动估计算法有像素递归法 (recursive algo rithm )和块匹配算法(block -ma tching alg orithm )[1,2].像素递归法计算量大,计算过程复杂,不易达到实时分割的要求.作者采纳块匹配算法,证实了该算法的有效性. 1 运动目标的速度估计 块匹配方法是一种相关分析方法,它是把一帧实时图像分为若干个大小相等的子图像块,将每一子图像块作为模板在相邻参考帧图像中一定搜索范围内进行相关计算,根据匹配准则,找出最优匹配位置.该位置对应的二维位移偏移量(d x ,d y )即可作为模板子图像块运动速度矢量的估计值 [3] . 1.1 匹配准则 匹配准则是衡量帧与帧之间两个子图像块相似程度的准则函数.可以用子图像块之间的二维互相关函数N (D )作为准则函数,其定义为 N (D )=R S K S K -1(D ) R S K S K (0)R S K S K -1(D ), (1) 其中 R S K S K -1(D )=E [S K (x ,y )S K -1(x -d x ,y -d y )]. 为减少计算量而又保持一定的匹配精度,也可采用子图像块间对应像素绝对差值即均值

目标跟踪算法的分类

目标跟踪算法的分类

主要基于两种思路: a)不依赖于先验知识,直接从图像序列中检测到运动目标,并进行目标识别,最终跟踪感兴趣的运动目标; b)依赖于目标的先验知识,首先为运动目标建模,然后在图像序列中实时找到相匹配的运动目标。 一.运动目标检测 对于不依赖先验知识的目标跟踪来讲,运动检测是实现跟踪的第一步。运动检测即为从序列图像中将变化区域从背景图像中提取出来。运动目标检测的算法依照目标与摄像机之间的关系可以分为静态背景下运动检测和动态背景下运动检测 (一)静态背景 1.背景差 2.帧差 3.GMM 4.光流 背景减算法可以对背景的光照变化、噪声干扰以及周期性运动等进行建模,在各种不同情况下它都可以准确地检测出运动目标。因此对于固定

个关键技术: a)匹配法则,如最大相关、最小误差等 b)搜索方法,如三步搜索法、交叉搜索法等。 c) 块大小的确定,如分级、自适应等。 光流法 光流估计的方法都是基于以下假设:图像灰度分布的变化完全是目标或者场景的运动引起的,也就是说,目标与场景的灰度不随时间变化。这使得光流方法抗噪声能力较差,其应用范围一般局限于目标与场景的灰度保持不变这个假设条件下。另外,大多数的光流计算方法相当复杂,如果没有特别的硬件装置,其处理速度相当慢,达不到实时处理的要求。 二.目标跟踪 运动目标的跟踪,即通过目标的有效表达,在图像序列中寻找与目标模板最相似候选目标区位置的过程。简单说,就是在序列图像中为目标定位。运动目标的有效表达除了对运动目标建模外,目标跟踪中常用到的目标特性表达主要包括视觉特征 (图像边缘、轮廓、形状、纹理、区域)、统计特征 (直方图、各种矩特征)、变换系数特

视频运动跟踪技术

视频运动目标跟踪算法研究 摘要:视频图像中的运动物体跟踪技术是计算机视觉、计算机科学、视频监控等学术领域的一个重要课题。该技术将数字图像处理领域中对静态图像的分析扩展到动态图像中。运动物体识别和跟踪技术的研究成果不仅在社会日常生活和工作中有着广泛的应用前景,而且在军事、交通、医学和科研等领域发挥着日益重要的作用。运动物体识别与跟踪算法的设计将直接影响识别和跟踪效果的准确性及稳定性,对于精确度高、鲁棒性好的算法研究一直是计算机视觉和数字图像处理等领域的热点问题。 关键词:目标跟踪,Mean shift算法,目标检测,粒子滤波 1 研究现状 视频目标跟踪技术已经得到了广泛的应用,主要应用有以下几个方面:智能视频监控、人机交互、机器人视觉、自动驾驶。其背后存在的学术价值和蕴藏的经济价值更是得到了很多人员的青睐,很多学术机构、大型公司以及一些科研人员正在投入大量的人力和财力进行各种开发和科研。 Fukunaga等人早期就提出了Mean shift跟踪算法,他们提出了一种概率密度函数的估计方法。不过在后来相当长的时间里并未受到大家的关注,直到1995年,随着Cheng对其进行近一步的研究并成功将其推广到计算机视觉领域中,这才得到了许多专业人士和科研人员的重视。目前存在很多经改进的Mean shift 算法。另外,在算法融合方面,有许多学者也做了相应的研究,K. NuInmiaro提出了将Mean shift算法和粒子滤波算法相融合,从而提高了目标跟踪的鲁棒性和准确性。 标准卡尔曼算法是在线性系统下滤波的,对于非线性、非高斯的系统没有效果。为此,人们开发出各种非线性滤波算法。一种是扩展卡尔曼算法进行滤波与估算,只适用于滤波误差和预测误差很小的情况;另一种是粒子滤波器[1],它是近些年出现的解决非线性问题的有效算法。粒子滤波技术通过非参数化的蒙特卡罗模拟方法来实现递推贝叶斯滤波,适用于任何能用状态空间模型以及传统的卡尔曼滤波表示的非线性系统,精度可以逼近最优估计。 在目标模型选取上,也有一些专家进行了探索。1)通过对粒子滤波的研究,将颜色作为目标模型并用粒子滤波跟踪,结果表明该方法可以增加遮挡情况下的鲁棒性。但是这种方法有些欠缺,即如果目标和背景有一定的相似度,则跟踪精度容易下降。2)将目标的边缘特征提取出来来代表目标进行跟踪,结果显示这种方法直观地增强了跟踪的鲁棒性。鉴于颜色描述目标色彩信息,边缘代表目标的轮廓,因此将这两种互补信息结合来代表目标可以改善跟踪效果。3)用局部线性嵌入流形(LLE)将问题降为二维空间,然后进行解决。4)利用一定的判别准则来有效分离目标和背景,并建立有明显区别的目标模板,最后成功用于跟踪中。5)通过Adaboost方法练习得到若干弱分类器,然后用系统集成的方法将其形成强分类器,然后用它们来区别目标和背景,以此用特定的方法获得目标的状态,并跟踪出目标运动的轨迹。 视频目标跟踪的难点主要包括以下几个方面[2]:1)目标外观变化。目标运动过程中发生形状的变化,加上相对于摄像机的视角、尺寸变化,造成目标在图像平面上复杂的外观变化,增加了目标建模的难度。2)复杂背景。变化的光照、与目标颜色相似的背景以及杂乱的变化环境使得较难将目标从背景中区分开来。3)遮挡问题。遮挡包括背景的遮挡和目标之间的遮挡。部分遮挡造成目标部分外观特征检测不到,而且引入了遮挡物的干扰;完全遮挡需要跟踪算法要有重新恢复的机制,当目标再次出现时能重新定位。4)目标的复杂运动。非线性的目标运动使得跟踪算法难以预测目标的运动状态,增加了跟踪算法的搜索计算量。 2 视频运动跟踪概述 视频目标跟踪系统的基本框架如下图,

智能机器人运动控制和目标跟踪

XXXX大学 《智能机器人》结课论文 移动机器人对运动目标的检测跟踪方法 学院(系): 专业班级: 学生学号: 学生姓名: 成绩:

目录 摘要 (1) 0、引言 (1) 1、运动目标检测方法 (1) 1.1 运动目标图像HSI差值模型 (1) 1.2 运动目标的自适应分割与提取 (2) 2 运动目标的预测跟踪控制 (3) 2.1 运动目标的定位 (3) 2.2 运动目标的运动轨迹估计 (4) 2.3 移动机器人运动控制策略 (6) 3 结束语 (6) 参考文献 (7)

一种移动机器人对运动目标的检测跟踪方法 摘要:从序列图像中有效地自动提取运动目标区域和跟踪运动目标是自主机器人运动控制的研究热点之一。给出了连续图像帧差分和二次帧差分改进的图像HIS 差分模型,采用自适应运动目标区域检测、自适应阴影部分分割和噪声消除算法,对无背景图像条件下自动提取运动目标区域。定义了一些运动目标的特征分析和计算 ,通过特征匹配识别所需跟踪目标的区域。采用 Kalrnan 预报器对运动目标状态的一步预测估计和两步增量式跟踪算法,能快速平滑地实现移动机器人对运动目标的跟踪驱动控制。实验结果表明该方法有效。 关键词:改进的HIS 差分模型;Kahnan 滤波器;增量式跟踪控制策略。 0、引言 运动目标检测和跟踪是机器人研究应用及智能视频监控中的重要关键技术 ,一直是备受关注的研究热点之一。在运动目标检测算法中常用方法有光流场法和图像差分法。由于光流场法的计算量大,不适合于实时性的要求。对背景图像的帧问差分法对环境变化有较强的适应性和运算简单方便的特点,但帧问差分不能提出完整的运动目标,且场景中会出现大量噪声,如光线的强弱、运动目标的阴影等。 为此文中对移动机器人的运动目标检测和跟踪中的一些关键技术进行了研究,通过对传统帧间差分的改进,引入 HSI 差值模型、图像序列的连续差分运算、自适应分割算法、自适应阴影部分分割算法和图像形态学方法消除噪声斑点,在无背景图像条件下自动提取运动 目标区域。采用 Kalman 滤波器对跟踪目标的运动轨迹进行预测,建立移动机器人跟踪运动 目标的两步增量式跟踪控制策略,实现对目标的准确检测和平滑跟踪控制。实验结果表明该算法有效。 1、运动目标检测方法 接近人跟对颜色感知的色调、饱和度和亮度属性 (H ,S ,I )模型更适合于图像识别处理。因此,文中引入改进 型 HSI 帧差模型。 1.1 运动目标图像HSI 差值模型 设移动机器人在某一位置采得的连续三帧图像序列 ()y x k ,f 1-,()y x f k ,,()y x f k ,1+

数字视频中文字分割算法的研究

万罡周洞汝崔永毅傅华胜 (武汉大学计算机信息学院,武汉<#""=!) 摘要文章对三种文字分割算法,包括基于阈值的二值化算法、基于分裂/ 合并的算法和基于纹理的算法,进行了分析、实验与评价,最后提出一种边缘检测— —投影— —局部区域二值化的文字分割算法,并给出与前面一些算法的比较。关键词文字分割阈值分裂/ 合并边缘检测 文章编号0""!6>##06(!""#)"!6"0"#6"#文献标识码? 中图分类号@A#B0 !"#$%&’"()*+,&-."(/&0 1)2"!),/)’"3".&’.’4.,."3+5.$)& 63’73’,8(&’,-#9#. :&’,%.;#<#3=()’, (C)D’:,&)+,.E F.&D G,):*H-)+H),I G8’+J+-K):;-,L,I G8’+<#""=!) *>="-3?":%+,8-;,8);-;,,8:))M-EE):)+,’5(.:-,8&.E,)N,;)(&)+,’,-.+,-+H5G M-+(,8:);8.5M6O’;)M’5(.:-,8&,;D5-,,-+(/ &):(-+(O’;)M’5(.:-,8&’+M,)N,G:)O’;)M’5(.:-,8&,’:)’+’5L P)M’+M)K’5G)M,,8)+,,8)’G,8.:;O:-+(’+)EE-H-)+,,)N, ;)(&)+,’,-.+’5(.:-,8&’;E.55.Q,E-:;,,’+)M()M),)H,-.+ R D:.S)H,-.+O’;)M&),8.M-;G;)M,.(),,)N,:)(-.+;,;)H.+M,,)N,:)(-.+;’:);)(&)+,)M OL ,8:);8.5M6O’;)M&),8.M$ @)%A&-$=:@)N,;)(&)+,’,-.+,@8:);8.5M,*D5-,,-+(/ &):(-+(,T M()M),)H,-.+ 文字分割的本质是图像分割(%&’()*)(&)+,’,-.+)。图像分割是计算机视觉领域中极为重要的内容之一,是实现自动图像分析时首先需要完成的操作。它是根据图像的某些特征或特征集合的相似性准则,对图像像素进行分组聚类,把图像平面划分为一系列“有意义”的区域,使其后的图像分析、识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。尽管对图像分割算法的研究已有几十年的历史,依据各种理论,至今已提出了上千种类型的分割算法,但是它们大都是针对具体问题的,目前还没有通用的分割理论和算法。下面将对三种文字分割算法,包括基于阈值的二值化算法、基于分裂/ 合并的算法和基于纹理的算法,进行分析、实验与评价,并提出一种边缘检测— —投影— —局部区域二值化的文字分割算法。有关,则所得的阈值是与坐标相关的(即动态阈值,前两种阈值对应可称为固定阈值)。 以上对阈值分割方法的分类思想是通用的。近年来,许多取阈值分割方法借用了神经网络、模糊数学、遗传算法、信息论等工具,但这些方法仍可归纳到以上三种方法类型中。 0$0阈值的灰度图像二值化 在利用单阈值方法来分割灰度图像时一般都对图像有一定的假设。最常用的模型可描述如下:假设图像由具有单峰灰度分布的目标和背景组成,且目标和背景象素在灰度值上有很大的差别。对于这类图像,它们的灰度直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合而成,可以把双峰之间的谷点作为阈值!,对图象作以下二值化处理: ’(#,$)3!0 若%(#,$)!!(! " 若%(#,$)"! 0 基于阈值的二值化算法 在基于阈值的灰度图像分割算法中,确定阈值是关键。阈值一般可写成如下形式: 对于某些新闻视频中的标题新闻、影视片名或演员表等它们的背景一般比较简单,可以采用单阈值分割方法。但是,大多数视频中的文字都有较复杂的背景,反映在其灰度直方图上 !"!1#,$,%(#,$),&(#,$)2(0)将出现多个峰谷,此时若采用单阈值的分割方法则无法将文字 其中%(#,$)是在象素点(#,$)对处的灰度值,&(#,$)是该点邻域的某种局部性质。换句话说,!在一般情况下可以是(#,$),%(#,$)和&(#,$)的函数。借助式(0),可以将阈值分割方法分成如下三类: (0)如果仅根据%(#,$)来选取阈值,所得的阈值仅与各个图像象素的本身性质相关(即全局阈值); (!)如果阈值是根据%(#,$)和&(#,$)来选取的,所得的阈值就是与(局部)区域性质相关的(即局部阈值)。 (#)如果阈值除根据%(#,$)和&(#,$)来选取外,还与(#,$)从背景中分离出来。为此,作者尝试采用多阈值方法将所有的峰都分离出来,如果灰度图像中的文字所占的象素的灰度值相近且与图像中其他目标的灰度值不同,则必然有一个被分离出来的峰对应于图像中的文字目标。 基于局部阈值的二值化算法 0$! 基于局部阈值的方法通过定义考察点的领域,并由邻域计算模板来实现考察点灰度与邻域点的比较,较全局阈值方法有更广泛的应用。其中典型的局部比较方法有4’&)5678’.算法和9):+;)+算法等。与4’&)5678’.算法相比,9):+;)+算法的 作者简介:万罡,男,0B=U年生,湖北荆州人,硕士研究生,主要研究方向:图形图像处理及多媒体技术。周洞汝,0B#B年生,教授,博士生导师,主要研究方向:图形图象视频压缩,V%*应用技术等。

静止背景运动目标识别

Moving Object Detection in Stationary Scene 摘要:随着计算机技术的不断提高,智能视频监控技术得到了很好的发展, 过去依靠人力监控视频中出现的人或汽车等既浪费人力物力,又不够准确,很容易发生遗漏,而智能监控就不存在这种问题,只需在程序中设定报警条件即可,能够准确地达到实时监控的目的。现在智能视频监控逐渐应用于城市道路、小区、银行等重要场所及对场景中的异常事件或人的异常行为的监控中, 应用前景广泛,正在逐步取代靠人力来观察视频信息。智能视频监控相比过去常用的靠人来监测的最重要的不同就是识别出需要监控的对象,通常是运动目标的提取。在本文中利用matlab视频处理功能,通过matlab程序来获取视频,使用背景减差法来检测出运动目标提取静止背景中的运动目标,并将结果显示出来,以进行进一步的分析处理。 关键字:视频监控;目标提取;静止背景;matlab;目标识别;背景减差法

基于视频的运动目标主要提取方法 目标检测是计算机视觉的一个重要组成部分,在军事及工业等领域有着重要的应用前景。运动目标的检测方法主要有光流法,差值法。光流法的计算量很大,实时性和应用性较差。而图像差值法比较简单,实时性较好,是目前应用最广泛,最成功的运动目标检测的方法。图像差值法可分为两类,一类是用序列图像的每一帧与一个固定的静止的参考帧做图像差分,但自然场景不是静止不变的,因而必须不断的更新背景。另一类是用序列图像的两帧进行差分,这种方法无法检测出两帧图像中重合的部分,只能检测出目标的一部分信息。在绝大多数视频监控图像应用中,每一个像素都可以用一个或多个高斯模型近似,因此,高斯背景模型是绝大多数目标检测方法常用的基本模型。许多学者对基于高斯混合背景模型的背景消除法作了改进并取得了较好的效果。Stauffer 等人提出了采用自适应混合高斯模型,作为背景统计模型的算法;Power 等人详细的讨论了混合高斯模型,并对模型中的参数选择及更新提出了很好的建议。Monnet 等人在文献[3]中对摆动的树叶,水纹的波动等动态纹理干扰作了深入研究,提出了在线的自动聚类模型来获得并预测场景中的这些变化以减少干扰。然而,由于光照条件的影响,大多数图像都存在阴影,阴影的存在干扰了目标的检测,使检测到的目标与真实的目标形状相差很大,这对后续处理如目标识别、行为判断等会产生很大的影响。混合高斯模型无法消除阴影的干扰,因此找到阴影消除的方法变得非常重要。近年来,提出了很多阴影消除方法,毛晓波提出了基于最大色度差分的阴影检测方法,A. Leone提出了基于纹理分析的阴影消除方法,通过分析纹理信息获取前景目标并消除阴影,取得了较好的效果。 运动目标检测常用的方法一般分为两大类,一种是基于特征的方法,另一种是基于灰度的方法。基于特征的方法是依据图像的特征来检测运动目标,它多用于目标较大、特征容易提取的场合。基于灰度的方法一般是依据图像中灰度的变化来检测运动目标。目前基于视频的检测方法主要有: 基于帧间差分的方法、基于光流场的方法、基于背景差的方法等。帧间差分法是基于运动图像序列中相邻两帧图像间具有强相关性而提出的检测方法, 具有很强的自适应性。但如果物体内部灰度分布均匀这种方法会造成目标重叠部分形成较大空洞,严重时造成目标分割不连通,从而检测不到目标。 光流场法是基于对光流的估算进行检测分割的方法。光流中既包括被观察物体的运动信息, 也包括有关的结构信息。光流场的不连续性可以用来将图像分割

运动目标图像的识别与跟踪

运动目标图像的识别与跟踪 本文主要目的是将视频摄像头中的运动目标从背景中提取出来,并加以跟踪。首先考虑的是常见的目标检测的算法,其次考虑对于噪声的滤除,最后是对运动目标的跟踪。 一、基本目标检测算法 我们主要考虑的目标检测的算法主要有三种,光流场法、背景模型法以及时域差分法。 1.1光流场法 光流主要是图像亮度模式的表现运动。而光流场则是指灰度模式的表面运动。一般条件下,我们可以根据图像的运动,进行估算相对运动。 光流场法的基本理论是光流场基本方程: 0=++t y x I vI uI (1.1) 式中我们根据亮度守恒,利用泰勒公式展开,忽略高阶项与二次项。其中x I 、y I 和t I 是图像在对数轴x 、y 两个方向和t 的的导数,()v u ,就是这个点的光流坐标。 光流场法的目标检测,在摄像机运动时候也可以做出判断,但是图像的噪声太过明显,使得计算数据庞杂,计算的公式更加复杂,这样并不适合我们的对于目标跟踪的高精度的摄像系统。 1.2背景模型法 背景模型法,也被称为背景差法,主要利用当前的图像和背景的图像的二值化做差,然后取阈值,分割运动目标。 首先根据: ()()()y x b y x f y x D t t t ,,,-= (1.2) 我们可以得到当前的图像帧数()y x f t ,和背景图像的帧数),(y x b t 做差,然后以公式对图像进行二值化的处理。 ???≤>=)(,0)(,1),(BackGround T D ForeGround T D y x P t t t (1.3) 上面),(y x P t 是二值化模板图。假设某一区域大于一个给定的面积的时候,该区域就是我们要找的目标区域。 背景模型法的算法简单,可以快速反应,并且可以提供运动目标的大略特征等数据。但是对于复杂背景下,比如人流较大的公共场所,或者有光照等干扰时,就需以其他的算法以不断更新背景信息来进行弥补。

数字视频处理__课程报告-视频分割技术发展及其应用

视频分割技术 课程报告题目:视频分割技术发展及其应用

数字视频处理中运动估计的方法及应用 1 引言 科学技术的飞速发展的今天,带来了电子设备的普及和海量的视频数据。视频在我们的日常生活中充当着越来越重要的角色,我们可以随时利用身边的电子设备比如掏出手机,拍一段视频,或者从社交媒体软件微博、QQ、微信等空间浏览朋友上传的视频。这些各种各样的媒体视频软件的出现不仅丰富了我们的生活,也给我们的生活带来其他便利,比他,在医学影像、智能交通管理、视频监控、医学影像这些领域也离不开视频的使用。这些丰富的视频软件的产生,离不开那些有关视频方面的处理技术。比如涉及那些视频分割核心技术的发展推进了那些手机端、PC端等软件迅速崛起。视频相比与图片,能传达更全面和丰富的信息,它由一系列图片组成,并结合音频。高速发展的网络也带了处理视频的一些挑战,庞大的视频信息如何能保证有效的传输以及使用是一个问题,因此就需要一种对视频进行分割的技术。MPEG是针对视频压缩相关编码的规范,并在MPEG-4规范标准中明确地给出一种基于视频内容的编码方案,它指出视频是由一系列具有语义实体的视频对象组成。视频对象说白了无非就是在组成视频的那一系列的图像中那些具有相同或者相似的像素特征的全体。例如像物体的运动就能作为反应这些具有相似性的特征,其它诸如物体的形态或者说是物体的色调也能用来作为衡量这种相似性。而视频分割技术它其实就是从含有这些复杂的多个对象的视频当中抽离出那些我们要的实体对象。我们接下来首先先介绍一些关于图像方面的知识作为开头,因为它是视频处理的前提基础,然后介绍一些传统的视频分割方法、介绍目前流行的视频分割方法主要有哪些。接着,我们谈谈视频分割技术可以具体应用在哪些领域。最后是一些涉及视频分割技术的总结展望。 2 图像分割技术 因为视频是由一系列的特定的图像组成的。所以对视频进行分割归结来说还是对这些图像进行分割。图像分割的经典方法是由图论中的Graph Cut提出的,它需要用户的交互来切割图像,需要用户手动的标记出图像的前景和背景。之后的图像分割算法大多都是基于此基础上进行改进。关于图像分割的方法目前还是很丰富的,不可能一一地列举出来,因此,我们按照其所属不同的类别进行阐述。第一类是利用不同阈值的方式进行切割,切割的思想就是对图像在其特征空间上进行划分,形成多个划分类。图像的灰度是比较经常作为特征选取方案的。或者也可以对原始特征进行处理得到效果更好的特征。通常这类算法运行效率低,而且当图像中存在噪声时对其结果影响较大。第二类是从图像的区域出发:思想大致类似于聚类算法,首先构造相似度函数,然后把相似的象素聚成一类,聚类过程中聚类的顺序的不同也诞生了不同的方法。例如我们在初始时刻可以把整张图像看着单独的一个类,然后在接下来不断的对上一轮的类别分裂划分,直到达到稳定状态结束。也可以将操作的过程反过来即:初始时刻先将图像设定几个不同的给定类别,然后不断地判断哪些类是可以兼并在一起的直到稳定状态结束。最后一类是直接提取出图像对象的边缘,其思想比较直观。提取方式也可以分为多种,比较常用的先提取出局部可能的边缘点,然后慢慢的扩展得到整体的轮廓。最后就能把各个对象的外部边界检测出来,从而达到分割的目的。

视频序列中运动对象分割方法的设计与实现

视频序列中运动对象分割方法的设计与实现[1][repaste] 2009-03-23 09:36 转自:https://www.360docs.net/doc/dc14016922.html,/2008/07/video-sequence.html The technology of multimedia correspondence developed quickly. After the standard MPEG-1 and MPEG-2, a new standard named MPEG-4 was put forward by the MPEG committee. The key technical of the standard is the standard is the Video Object Segmented from the video frame. The results of object segmentation will affect subsequent applications directly. At the present time, there is no current method, which can segment object models from the background efficiently, though a great deal of research work has been done for video coding. Most algorithms aim at particular image sequences. The video segmentation has been widely applied in many fields, especially in low bite-rate ratio multimedia fields, so it is more and more becoming the hot point in the video research field. This paper discusses the basic theory of digital image segmentation, and then analyzes the exist method for the segmentation of moving objects in video sequences. At last an effective moving object segmentation algorithm is used. First, the moving regions are obtained by the intersections of two neighbor difference images, and then small regions that are not accurate are removed. Finally, the moving regions are filled using the method of mathematical morphology. This arithmetic makes use of the functions of the library effectively, improves precision and efficiency of computation, and has a good property for the application to multi-platform. Experimental result shows that the algorithm can get satisfactory result. Key words: Image segmentation, Frame difference, video sequence, moving object, mathematical morphology 目录 摘要 I ABSTRACT II 第一章绪论 1 1.1 研究背景与意义 1 1.2 国内外研究状况 3 1.3论文内容与结构安排 4 第二章典型的图像分割方法 6 2.1阈值法与边缘检测法 6 2.1.1阈值法 6 2.1.2边缘检测法 7

最新视频分割算法研究

是不允许操作的。用户管理功能可以让用户建立一组帐号和密码,分配给允许使用本系统的人员,并且对于不同的人员,按照需要再赋予不同的访问和使用的权限;对于外来人员没有帐号和密码,就无法进入本系统。如此一来就提高了系统的安全性,也使系统更加稳定、有效地运行。 在用户登录、退出登录、修改密码和用户安全区配置四个按钮的弹起事件中分别输入相应的命令语言,就可以实现相应的作用。四个命令语言分别为: LogO n() LogO ff() ChangePass W o rd()、Ed it U sers() 4)运行和调试 在完成了图形界面的设计,构造好实时数据库,并建立起动画连接后,在组态王工程浏览器的工具条上直接点击 V IE W 快捷键或点击某一画面的文件下拉菜单中的 切换到V I E W 即可进入该运行系统。建立与下位机的连接,与现场的I/O设备直接进行通讯。即可通过组态软件显示现场的实际工况,以及当对象结构参数变化时对对象特性的影响。 3 总结 本实验系统是在组态王6.53版本上的基础上开发的,它利用W indo w s的图形功能完备、界面一致性好、易学易用的特点,具有强有力的安全管理系统、强大的通讯能力、先进的报警和事件管理、快速便捷的应用设计,该系统不仅提高了实验教学效率,改善实验效果,而且方便易行。 基于金山电厂的水源监测系统设计的结果也表明,组态王软件用于自动控制系统的监测与控制设计降低了工作人员劳动强度、提高了劳动生产率,还提高了计算精度,同时功能更加完善,只需要通过画面切换就可以监视到不同的运转情况,以及根据需要查询不同时间的数据记录,甚至发生事故时可以即时将事故前的记录和事故后的记录取出分析,同时对于实现远距离及时了解现场的工作状况和从经济效益方面出发也有十分重大的意义。 参考文献 [1]周美兰,周封,王岳宇.PLC电气控制与组态设计[M].科学 出版社,2003. [2]潘炼.PLC在配煤控制系统中的应用[M].武汉科技大学出 版社,2006. [3]方来华,吴爱国,何熠.组态软件核心技术研究[J].化工自动 化及仪表,2004,31(1):33-35. [4]adm i n.M CGS组态软件在煤矿安全监控系统集成中的应用 [J].机电设备,2006,(04):16. [5]王亚民,陈青,刘畅生,等.组态软件的设计与开发[M].西 安:西安电子科技大学出版社,2003. [6]欧金城,欧世乐,林德杰,等.组态软件的现状与发展[J].工 业控制计算机,2002,(15) [7]周敬东,陈幼平,周祖德,等.组态软件硬件接口的设计与实 现[J].机械与电子,2004(6):44-47. 作者简介:赵国材(1952-),男,教授,硕士生导师,主要研究领域为自动控制技术、机器人控制;蔡志达(1979-),男,在读硕士研究生,主要研究方向为自动控制技术;张艳(1986-),女,在读硕士研究生,主要研究方向为自动控制技术。 收稿日期:2009-10-28 do:i10.3969/.j issn.1671-1041.2010.02.034 最新视频分割算法研究 高泽林,陈为龙,王正勇 (四川大学电子信息学院图像信息研究所,成都610064)摘要:视频分割在视频编码、智能监控和信息检索等领域有着广泛应 用,分割质量的好坏直接影响视频的后续处理,所以,基于运动目标的视频分割技术是重要而又富有挑战性的。本文在现有方法的基础上,研究了最近的国内外文献,介绍和分析了其中的算法,并对未来的发展进行了展望。 关键词:运动目标;视频分割算法;帧间差分;马尔科夫随机场 中图分类号:TP391 文献标识码:B The latest algorith m research of video seg m entation GAO Z e-li n,CH EN W e-i l on g,W ANG Z hen g-yong (I m age Infor ma tion Institute,C ollege of Electronics and Infor ma tion Eng i neering,Si chuan Un i versity, Chengdu610064,Chi na) Abstrac:t Video seg ment ation is w ide l y used i n video coding,intell-i gentmonit or and inf or m ation r e trieva.l The qua lit y of seg ment ati o n dir ec tly aff ects video s f o llo w ing process,so v i d eo seg ment ati o n t echnique based on m ov ing ob j e ct is m i portant and chall e nging.O n t he bas is of exis ting method,t h i s paper intr oduced and ana l y zed t he algorit h m accord i n g to the l a tes t lit erat ures at ho me and abroad,and look int o t he f ut ure. Key words:mov ing objec;t v ideo segmentation algorith m;fra me diff erenc i n g;MRF 0 引言 随着信息技术的快速发展,人们对多媒体信息的关注和需求也不断增长,尤其是视觉信息。据统计,人类从外界获得的信息70%以上都是视觉信息,针对视觉信息中视频的处理技术[1]也就成了一个热门而富有挑战的研究领域。但同时,视觉信息巨大的数据量给存储、传输带来了诸多不便,为了更有效的利用视频数据,必须对视频进行压缩。M PEG组织提出了M PE G-4视频压缩标准,与之前的M PEG标准相比,最显著的特征就是基于对象的编码方式,要实现这种视频编码,首要任务就是分割出视频中的运动目标。然而,现实生活中的视频场景复杂多变,给研究者带来了不小的困难。鉴于视频分割广阔的应用前景,本文在前人[2,3]的基础上,研究了近几年的最新文献,介绍和分析了其中的算法。 1 视频分割算法 1.1 视频分割的实际应用举例 视频分割是计算机视觉和图像处理领域的热点,在多媒体通信、视频检索与交互处理、智能监控系统中得到了广泛的应用。但是,视频分割往往不是独立应用的,他通常是为了方便视频的进一步分析处理而做的前期准备。以我们实验室的研究项目 视频超分辨率重建为例,由于要处理存在局部运动的视频,以现有的方法进行运动配准误差较大,才考虑先 仪器仪表用户 经验交流 欢迎订阅欢迎撰稿欢迎发布产品广告信息65

视频目标跟踪算法综述_蔡荣太

1引言 目标跟踪可分为主动跟踪和被动跟踪。视频目标跟踪属于被动跟踪。与无线电跟踪测量相比,视频目标跟踪测量具有精度高、隐蔽性好和直观性强的优点。这些优点使得视频目标跟踪测量在靶场光电测量、天文观测设备、武器控制系统、激光通信系统、交通监控、场景分析、人群分析、行人计数、步态识别、动作识别等领域得到了广泛的应用[1-2]。 根据被跟踪目标信息使用情况的不同,可将视觉跟踪算法分为基于对比度分析的目标跟踪、基于匹配的目标跟踪和基于运动检测的目标跟踪。基于对比度分析的跟踪算法主要利用目标和背景的对比度差异,实现目标的检测和跟踪。基于匹配的跟踪主要通过前后帧之间的特征匹配实现目标的定位。基于运动检测的跟踪主要根据目标运动和背景运动之间的差异实现目标的检测和跟踪。前两类方法都是对单帧图像进行处理,基于匹配的跟踪方法需要在帧与帧之间传递目标信息,对比度跟踪不需要在帧与帧之间传递目标信息。基于运动检测的跟踪需要对多帧图像进行处理。除此之外,还有一些算法不易归类到以上3类,如工程中的弹转机跟踪算法、多目标跟踪算法或其他一些综合算法。2基于对比度分析的目标跟踪算法基于对比度分析的目标跟踪算法利用目标与背景在对比度上的差异来提取、识别和跟踪目标。这类算法按照跟踪参考点的不同可以分为边缘跟踪、形心跟踪和质心跟踪等。这类算法不适合复杂背景中的目标跟踪,但在空中背景下的目标跟踪中非常有效。边缘跟踪的优点是脱靶量计算简单、响应快,在某些场合(如要求跟踪目标的左上角或右下角等)有其独到之处。缺点是跟踪点易受干扰,跟踪随机误差大。重心跟踪算法计算简便,精度较高,但容易受到目标的剧烈运动或目标被遮挡的影响。重心的计算不需要清楚的轮廓,在均匀背景下可以对整个跟踪窗口进行计算,不影响测量精度。重心跟踪特别适合背景均匀、对比度小的弱小目标跟踪等一些特殊场合。图像二值化之后,按重心公式计算出的是目标图像的形心。一般来说形心与重心略有差别[1-2]。 3基于匹配的目标跟踪算法 3.1特征匹配 特征是目标可区别与其他事物的属性,具有可区分性、可靠性、独立性和稀疏性。基于匹配的目标跟踪算法需要提取目标的特征,并在每一帧中寻找该特征。寻找的 文章编号:1002-8692(2010)12-0135-04 视频目标跟踪算法综述* 蔡荣太1,吴元昊2,王明佳2,吴庆祥1 (1.福建师范大学物理与光电信息科技学院,福建福州350108; 2.中国科学院长春光学精密机械与物理研究所,吉林长春130033) 【摘要】介绍了视频目标跟踪算法及其研究进展,包括基于对比度分析的目标跟踪算法、基于匹配的目标跟踪算法和基于运动检测的目标跟踪算法。重点分析了目标跟踪中特征匹配、贝叶斯滤波、概率图模型和核方法的主要内容及最新进展。此外,还介绍了多特征跟踪、利用上下文信息的目标跟踪和多目标跟踪算法及其进展。 【关键词】目标跟踪;特征匹配;贝叶斯滤波;概率图模型;均值漂移;粒子滤波 【中图分类号】TP391.41;TN911.73【文献标识码】A Survey of Visual Object Tracking Algorithms CAI Rong-tai1,WU Yuan-hao2,WANG Ming-jia2,WU Qing-xiang1 (1.School of Physics,Optics,Electronic Science and Technology,Fujian Normal University,Fuzhou350108,China; 2.Changchun Institute of Optics,Fine Mechanics and Physics,Chinese Academy of Science,Changchun130033,China)【Abstract】The field of visual object tracking algorithms are introduced,including visual tracking based on contrast analysis,visual tracking based on feature matching and visual tracking based on moving detection.Feature matching,Bayesian filtering,probabilistic graphical models,kernel tracking and their recent developments are analyzed.The development of multiple cues based tracking,contexts based tracking and multi-target tracking are also discussed. 【Key words】visual tracking;feature matching;Bayesian filtering;probabilistic graphical models;mean shift;particle filter ·论文·*国家“863”计划项目(2006AA703405F);福建省自然科学基金项目(2009J05141);福建省教育厅科技计划项目(JA09040)

本科毕业设计__基于视频的目标跟踪及人群密度估计方法研究开题报告

上海交通大学 2012 级硕士学位论文开题报告登记表 学号姓名导师李建勋学科控制科学与工程学院(系、所) 电子信息与电气工程学院 学位论文题目稳健对地目标跟踪方法研究 研究课题来源国家自然科学基金、航天创新基金、中航613横向项目 课题的意义以及研究的主要内容 运动目标跟踪是视觉图像处理中的一个非常热门的话题,在多个领域有着广泛的应用。运动目标跟踪的应用领域和环境主要有:对大型公共场所进行智能化视频监控、基于视频的人机交互、交通流量监测、医疗诊断等。 本文从计算机视觉角度研究对地目标跟踪方法。由于视觉跟踪系统能在比较复杂的背景下,提取与分离市场内的目标、确定目标位置、估计目标运动趋势、实现对目标的实时跟踪,且具有跟踪精度高、跟踪状态平稳、抗干扰能力强、分辨率高和成本低等特点,在军事上很受重视。在民用领域,对地目标跟踪也有着广泛的应用:对大型公共场所进行智能化视频监控。例如在机场、商场、地铁站等场所进行智能化监控,其主要目的都是为了保障公众财产和信息安全。在人群监测、交通管理上实现智能化有非比寻常的意义。 以以上应用为背景,本文的对地目标跟踪技术包含以下几个主要技术模块:单目标跟踪技术、多目标跟踪技术、密集目标跟踪技术。分出这几个模块是为了应对不同的应用场景,或是在同一场景需要各模块的协同合作。例如地铁站的人群流量具有明显时段特征,早晚上下班高峰人流极大,而其他时段人流量明显减少,这就需要对不同时段采用不同的跟踪方法以达到最好的效果。在上下班高峰期,采用密集目标跟踪技术,而在其他时段,采用多目标跟踪技术,而在有特殊需要的时候,例如跟踪特定犯罪嫌疑人时,可采用单目标跟踪技术。 本文研究的主要内容具体有: ①粒子滤波基本方法研究,这是单目标跟踪方法的框架。在图像跟踪应用中,目标状态的后验概率分布往往是非线性非高斯多模态的,粒子滤波方法对于系统模型没有特殊要求,且能够保持状态的多模态分布,在跟踪领域得到了很大的发展。但常规粒子滤波跟踪算法存在计算量大、采样效率低等问题。 ②粒子群最优化思想研究,改进常规粒子滤波采样效率低的问题,提高采样效率。针对常规粒子滤波跟踪算法存在计算量大、采样效率低等问题,引入粒子群优化思想对目标状态后验分布进行最优搜索,找到后验分布的高似然区,并依据此高似然区来进行重采样。 ③变结构多模型的设计,以更好的表征目标的运动模型。几乎所有的方法对目标的运动状态都假定为平滑的,或者将运动限制在恒速或恒加速运动状态。而实际情况并非如此,例如机动目标的运动状态就很难用单一模型来表征。本文引入变结构多模型方法为目标建立变结构多运动模型。变结构多模型方法能够很好的表征目标的运动模型却又不增加过多的计算量,因此相比单一运动模型能够更好的估计目标的运动。

相关文档
最新文档