通信视频 第2章二维运动估计
运动估计——精选推荐

运动估计一、概述运动估计的基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有象素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。
视频压缩的时候,只需保存运动矢量和残差数据就可以完全恢复出当前块。
这段来源于百度:第一句,说把一帧分成许多不重叠的宏块,涉及到几个概念,一个是分隔,一个是不重叠,一个是宏块,H.264的宏块,都是16*16的像素块,其中又有一个隐含的概念,就是一个宏块包含亮度,色度U和色度V,其中.二比一的关系。
第二句,认为宏块内所有像素的位移量都相同。
当然,实际情况可能是一个宏块内的像素属于两个运动物体,比如属于两只小鸟,分别飞往两个方向,这样的话,这分属于两个小鸟的像素的位移,包括移动距离和方向,都是不一样的,但这样太复杂了,而且,H.264里,用到这个位移,它并不是要真的研究位移,只是为了压缩样本像素的网络传输,所以,在高度复杂的问题面前,没必要纠结对与错。
而是把宏块作为一个整体来看的。
它只是要在参考帧中找到一个类似的块来求差,而参考帧的这个块,也许和当前的块根本就没任何关系。
我是这样猜出想的,比如这个帧里,有一块纯黑的区域,在同一个帧里,还有另一块纯黑的区域,如下图:假定这个图从左向右移动,它就成了一段连续的,相似的动画,或者叫一个序列算了。
这样的话,在上面的那个黑色区域里的某一个宏块,可以用前一帧对应位置附近的一个黑色宏块作参考,也可以用前一帧里,下面这个黑色区域里的一个宏块作参考,在小范围里来说,压缩效果是一样的。
看H.264里,有个最优匹配的概念,对于这个纯色的图来说,没什么太大的感觉,如果对于那些花花绿绿的真彩色图来说,很少存在这样的纯色块,那个最优匹配应该就有优势了。
在真彩色的每一个宏块,它并不见的能找到一个和它一样样的宏块来作参考,一般也就找个比较接近的,那这个最优匹配,就是找最近似的了吧,如何认为是最近似的,好像是H.264里的SAE什么的,不管是不是它,肯定有一个判断的标准。
第三章二维运动估计之一PPT课件

运动参数,但是投影会造成信息丢失(不可逆),导致估计误差。
.
3
特征对应:运动物体上的特征与其在二维平面上的投影坐标的对应关系。 见下图示:
设t1→t2时,物体由P运动至P’,即: 空 间:P(X,Y,Z) → P’(X’,Y’,Z’) 像平面: p(x,y) → p’(x’,y’) 二维位移(△x, △y )称为二维运动矢量,
❖ 映射函数: w(x, a) = x + d(x, a) , x
❖ 运动参数矢量: a 存在问. 题:遮挡
14
.
15
2.2 运动估计的一般方法
❖ 两种主要的方法:
– 基于特征(常用在物体跟踪上,从2D构建出3D) – 基于亮度(基于恒定亮度假设或光流方程,常用在
运动补偿预测,视频编码和插值方面) -> 重点
v vnen vtet
vn ||
||
t
0
.
13
2.2 运动估计的一般方法
后向运动估计
Time t
Time t +t
Time t - t x
d(x, t - t) 当前帧
x 参考帧
d(x, t + t) x
当前帧 前向运动估计
❖ 参考帧: 1(x, t1) ❖ 当前帧: 2(x, t2)
❖ 前向运动估计 /后向运动估计: t2 > t1 / t2 < t1 ❖ 运动场: d(x, a), x
一致。如计算机视觉、目标跟踪、工业监视。
非真实运动估计:在不被察觉的情况下允许有估计误差,
从而最大限度降低信息量和传输带宽。如广播电视中的视
视频编码中的运动估计算法探索

视频编码中的运动估计算法探索视频编码是指将连续的视频信号转换为数字形式,以便于存储、传输和处理的过程。
视频编码的核心任务之一是压缩视频数据,以减小文件大小或减少带宽需求。
其中,运动估计是视频编码中一个关键的环节,它能够找到连续视频帧之间的运动信息,并将其利用于压缩算法中。
本文将探索视频编码中常用的运动估计算法及其原理、优缺点以及应用。
一、运动估计的原理及作用运动估计是基于视频序列中的帧间差异进行的。
它通过比较当前帧与参考帧之间的差异来计算运动矢量(Motion Vector,MV)。
运动矢量表示了目标在时域上的运动特征。
在编码时,只需保留运动矢量和差异帧,从而实现视频压缩。
运动估计的作用是找到当前帧与参考帧之间的最佳匹配,以便能够准确描述目标的运动状态。
通过将运动估计的信息传递给解码器,解码器能够使用这些信息来还原出原始视频帧,从而实现视频的连续播放。
二、全局运动估计算法1. 块匹配算法(Block Matching Algorithm,BMA)块匹配算法是最常用的全局运动估计算法之一。
其基本思想是将当前帧划分为若干个块,并在参考帧中寻找与之最佳匹配的块,从而得到对应的运动矢量。
BMA算法简单有效,但在处理快速运动和复杂运动时存在一定的局限性。
2. 平方和差分算法(Sum of Absolute Difference,SAD)平方和差分算法是BMA算法的一种改进。
它通过计算块中像素值的差的平方和来度量差异,从而找到最小差异的块作为最佳匹配。
SAD算法在提高运动估计的精度方面有所帮助,但在速度上相对较慢。
三、局部运动估计算法1. 区域匹配算法(Region Matching Algorithm,RMA)区域匹配算法是一种基于像素的非全局运动估计算法。
它将当前帧的图像划分为不同的区域,并寻找参考帧的区域进行匹配。
RMA算法能够更好地处理复杂运动情况,但计算量和时间复杂度较高。
2. 梯度法梯度法是一种基于局部像素间梯度变化的运动估计方法。
视频运动估计算法

题目:视频运动估计算法的实现2013年5 月摘要随着计算机视觉、数字视频信号处理和通信技术的发展,多媒体技术得到了广泛的应用。
其中,数字视频信号处理是关键技术。
为了克服视频信号数据量大的问题,必须提高视频信号的压缩编码效率。
运动估计是视频压缩编码中的核心技术之一。
为了使多媒体产品能得到更加广泛的应用,国际上提出了一些视频压缩标准。
但这些标准并没有规定具体采用哪种运动估计算法。
因此,具有高压缩性的快速运动估计算法的开发成为近年来和今后的研究热点。
本文通过MATLAB仿真平台,实现了经典的全搜索算法(FS)和二维三步搜索算法(TSS),并对更加高效的ETSS算法进行编程仿真,性能比较也显示ETSS 比TSS、FS更加具有实时性。
关键词:运动估计;视频压缩;全搜索算法;三步搜索算法AbstractWith the development of computer vision, digital video signal processing and communication technology, multimedia technology has been widely used. Among them, the digital video signal processing is the key technology. In order to overcome the problem of large amount of video data signal, video signal compression coding efficiency must be raised. Motion estimation is one of the core technology of videocompression coding. In order to make the multimedia products can be used more widely, people put forward some international video compression standard. But these standards are not provided specific use what kind of motion estimation algorithms. Therefore, the development of the fast motion estimation algorithm with high compressibility is becoming a hot spot in recent years and the future research.In this article, through the MATLAB simulation platform, has realized the full search algorithm (FS) and the classic 2d three-step search algorithm (TSS),and simulated the more efficient algorithm--ETSS, performance comparisons also show ETSS is more real-time than TSS and FS .Keywords: m otion estimation,video compression,FS, TSS目录第一章绪论 (5)1.1运动估计技术的地位与作用 (5)1.2运动估计技术的发展趋势 (5)1.3视频压缩系统的组成 (5)第二章运动估计 (7)2.1基于块的运动估计 (7)2.2基于光流方程的运动估计 (8)2.3基于像素的运动估计 (8)2.4全局运动估计 (9)2.5基于区域的运动估计 (9)2.6多分辨率的运动估计 (10)2.7小结 (10)2.7.1穷尽搜索算法 (10)2.7.2快速搜索算法 (11)第三章运动估计算法的仿真 (14)3.1仿真全搜索算法 (14)3.1.1 搜索过程 (15)3.1.2 仿真结果 (16)3.2仿真三步搜索算法 (20)3.2.1 搜索过程 (20)3.2.2 仿真结果 (21)3.3性能比较 (25)3.3.1 计算复杂度 (25)3.3.2 峰值信噪比 (26)第四章改进算法 (28)4.1提出改进算法 (28)4.2仿真算法 (29)4.3性能比较 (32)第五章结论 (34)参考文献 (35)致谢 (36)附录 (37)第一章绪论1.1运动估计技术的地位与作用视频信号通常每秒包括十几帧以上的静态图像。
运动估计

LOGO
Contents
1 2 3 4
运动估计概念
运动估计算法
结果展示
存在的问题
XMU
LOGO
图像的冗余
视频序列图像在时间上存在很强的相关性, 视频序列图像在时间上存在很强的相关性,采用运动估 计和运动补偿技术可以消除时间冗余以提高编码效率, 计和运动补偿技术可以消除时间冗余以提高编码效率, 这种技术广泛用于视频压缩的一些国际标准中, 这种技术广泛用于视频压缩的一些国际标准中,如 H.261/263/264、MPEG-1/2/4。 、 。
Partition the frame using rectangular blocks. For each block, find its matching region in the reference frame. (motion estimation) Current block – reference block = residual block. (motion compensation) Encode motion vectors and residuals.
XMU
LOGO
Temporal model– motion estimation
运动搜索
LOGO
匹配准则
由于MAD没有乘除 没有乘除 由于 操作, 操作,不需做乘法 运算, 运算,实现简单方 所以使用较多。 便,所以使用较多。 通常使用求和绝对 误差( 误差(SAD)代替 ) MAD 。
XMU
LOGO
四步法
梯度下降法
全搜索法
XMU
LOGO
存在的问题
由于自然物体运动的连续性,相邻两帧之间的 块的运动矢量不是以整像素为基本单位的,可 能真正的运动位移量是以 1/4 像素或者甚至 1/8 像素等亚像素作为为单位的。如果去掉半 像素搜索模块,编码得到的视频质量很差。在 加上了半像素搜索模块之后菱形,梯度下降, 四步法运动估计的编码视频质量相差很小,只 是在编码速度上菱形搜索略快。
第二章+二维运动估计

2 2 误差函数: E ( v ) = ∫ x∈Α (eof (v) + ws eds (v))dx
2 1 1 2 2 当F=0, δ = 1 时, e ( v) = ( ∇vx + ∇v y ) = es ( v) 2 2 2 ds
∂ψ ∂t ∂ψ ∂t
对 E (v )求关于 v x 和 v y 的偏微 分,并令其为0,可得:
v 表示对像素邻域(不包括当
前像素)求平均。 表示迭代次数,初始光流矢 量 v ( 0 )可设为零。
( v xl +1)
l
v (yl +1)
∂ψ (l ) ∂ψ (l ) ∂ψ vx + vy + ∂ψ ∂x ∂y ∂t = vx(l ) − 2 2 ∂x ∂ψ ∂ψ ws + + ∂y ∂x ∂ψ (l ) ∂ψ (l ) ∂ψ v + vy + ∂ψ ∂x x ∂y ∂t = v y(l ) − 2 2 ∂y ∂ψ ∂ψ ws + + ∂x ∂y
∂ψ ∂ψ ∂ψ dx + dy + dt = 0 ∂x ∂y ∂t ∂ψ ∂ψ ∂ψ ∂ψ vx + vy + = 0 或 ∇ψ T v + =0 ∂x ∂y ∂t ∂t
T
∂x
∂y
∂t
∂ψ ∂ψ , ∇ψ = 其中 为空间梯度向量,v = (v x , v y ) 为光流场。 ∂x ∂y
提纲
概述 基于光流的运动估计 基于像素的运动估计 基于块的运动估计 基于网格的运动估计 基于区域的运动估计 全局运动估计 多分辨率运动估计
视频信号的运动估计和运动补偿算法

数字视频实验报告班级:电信科0801班学号:姓名:实验报告二一、实验名称:视频信号的运动估计和运动补偿算法二、实验目的在视频编码和处理系统中,运动估计和运动补偿技术对降低视频序列时间冗余度、提高编码效率起着非常关键的作用。
运动估计的准确程度将直接决定视频编码器的编码效率。
它极大地消除了视频序列的帧间相关性。
运动估计算法的复杂性将直接决定视频压缩编码系统的复杂性,如何提高运动估计的效率,使运动估计算法的搜索过程更快速、更高效一直是人们研究的热点。
掌握运动估计的块匹配算法,以及快速运动估计算法。
三、实验内容:1、分析基于块匹配的全搜索运动估计算法程序,画出motionEstAnalysis.m 和 motionEstES.m文件流程图2、编程补充完成costFuncMAD.m 文件中最小绝对误差计算函数costFuncMAD()和imgPSNR.m文件中峰值信噪比PSNR计算函数imgPSNR()的程序,最终输出运动矢量场;3、掌握运动补偿算法,编程实现motionComp.m文件中对目标帧的运动补偿重构函数 motionComp();4、了解多种快速运动估计算法,例如三步法搜索法、二维对数法、菱形搜索法等。
5、总结实验结果,比较各种搜索算法的性能和所需时间。
四、实验原理在帧间预测编码中,由于活动图像邻近帧中的景物存在着一定的相关性。
因此,可将活动图像分成若干块或宏块,并设法搜索出每个块或宏块在邻近帧图像中的位置,并得出两者之间的空间位置的相对偏移量,得到的相对偏移量就是通常所指的运动矢量,得到运动矢量的过程被称为运动估计。
运动矢量和经过运动匹配后得到的预测误差共同发送到解码端,在解码端按照运动矢量指明的位置,从已经解码的邻近参考帧图像中找到相应的块或宏块,和预测误差相加后就得到了块或宏块在当前帧中的位置。
运动估计的准确程度往往用补偿图像与原图像比较的PSNR来衡量表示。
五、实验程序1、motionEstAnalysis.m文件流程图读取*.AVI文件并播放文件开始设定块大小和搜索步长取帧的范围1<i<44取第i帧,取P帧为i帧后两帧读第i、p帧的数据,分别存入imgI、imgP计算i帧的大小分别调用自定义函数计算运动矢量利用运动估计参数重构P帧图像计算峰值信噪比PSNR计算代价i<30?分别显示i帧、p帧和p帧重构帧画运动矢量图结束noyse no yes2、 motionEstES.m 文件流程图3、计算最小绝对误差程序(补充costFuncMAD.m 文件程序)sum=0; for i=1:n for j=1:nDifference=abs(currentBlk(i,j)-refBlk(i,j)); sum=Difference+sum; end ; end ;cost=sum/(n.^2);4、计算峰值信噪比PSNR 程序(补充imgPSNR.m 文件程序)[row col] = size(imgP); sum2=0; for i3=1:row for j3=1:colsum2=sum2+(imgComp(i3,j3)-imgP(i3,j3)).^2;%累加求和 end ends=sum2/(row*col); psnr=10*log10((n*n)/s);5、对目标帧的运动补偿重构程序(补充motionComp.m 文件程序)开始初始化:定义块中心,矢量及代价计算运动矢量比较得到代价最小的运动矢量,作为块的运动矢量计算块中心点最后分别计算I 帧各个块的块中心,运动矢量及代价结束[row col] = size(imgI);img=zeros(row,col);mbCount=0;for i = 1 : mbSize : row-mbSize+1 for j = 1 : mbSize : col-mbSize+1mbCount=mbCount+1;k1=motionVect(1,mbCount);k2=motionVect(2,mbCount) ;img(i:i+mbSize-1,j:j+mbSize-1)=imgI(i+k1:i+mbSize-1+k1,j+k2:j+mbSize-1+k2);end;end;imgComp=img;六、实验结果1、运动矢量场图像2、对目标帧的运动补偿重构程序第I 帧视频原始图像第P 帧视频原始图像第P 帧视频运动补偿重构图像3、视频重构视频峰值信噪比PSNR Psnr=29.349。
视频编码中的运动估计算法研究

视频编码中的运动估计算法研究随着数字媒体技术的飞速发展,视频的应用范围变得越来越广泛,比如在线教育、远程办公、游戏直播等。
在视频传输和存储过程中,编码技术是一项必须掌握的技能,而其中最重要的环节之一就是运动估计算法。
一、什么是运动估计算法运动估计算法是视频编码中的一项重要技术,在视频编码中的作用是通过对视频序列中的运动进行建模,并对不同质量图片进行编码压缩。
这个过程中,运动估计算法主要的任务就是识别出视频帧间的运动信息,包括目标物体的位移、速度等等,以获得更好的编码质量。
运动估计大致分为全搜索(Full Search)算法和快递搜索(Fast Search)算法两类。
二、全搜索算法全搜索算法是一种最常见、最基础的运动估计算法,其核心思想是在编码过程中,通过遍历所有可能的搜索位置计算最佳匹配块,从而获得最优的运动矢量。
具体地说,全搜索算法会对每一个帧中的像素点进行搜索,找到在参考帧中对应的最佳匹配块,并计算出匹配块与当前块之间的运动矢量。
因为全搜索需要遍历所有可能的搜索点,因此其时间复杂度、计算量都比较大,不适用于实时应用场景。
三、快递搜索算法为了解决全搜索算法的计算量大、速度慢的问题,人们逐渐提出了很多更加高效的运动估计算法,快递搜索算法便是其中之一。
快递搜索算法可以在运动估计的时候减少搜索点的数量,从而提高搜索的速度。
具体的实现过程是首先确定一个中心点,然后将搜索点放置在这个中心点附近特定的位置,从而得到一个搜索区域。
之后,根据之前算法找到的最好的匹配块进行迭代搜索,找到最优的匹配块和运动矢量。
快递搜索算法具有较快的速度和较好的效率,因此被广泛应用于实时视频传输和储存中。
四、总结运动估计算法是视频编码过程中的一项重要技术,其主要作用是在编码过程中寻找帧间的运动信息,以便于实现更高效的视频数据传输和储存。
全搜索算法和快递搜索算法是两种常见的运动估计算法,它们的实现原理各不相同、应用场景不同,但它们对于现代视频编码技术发展却是不可或缺的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 2.1.2二维运动估计
设估计点x=(x,y)从t1到t2的位移为d(x,t1;t2),当前帧为f(x,y,t1) ,
参考帧为f(x,y,t2) ,简写为f1(x)和f2(x) ,由亮度守恒假设有: f1(x)= f2[x+d(x,t1;t2) ] 前向运动估计:t1<t2; 后向运动估计:t1>t2 ; 存在问题:遮挡
少运动信息,但块内像素可能属于不同物体,从而导致运动估计精度降低。 2.匹配准则与匹配函数 运动搜索的目的就是在搜索窗内寻找与当前块最匹配的数据块,搜索策略选择适 当与否对运动估计的准确性及其速度有很大的影响,这样就存在着如何判断两个块是 否匹配的问题,即如何定义一个匹配准则。而匹配准则的定义与运算复杂度和编码效 率直接相关,常用的匹配标准有均方差(MSE)、平均绝对误差(MAE或MAD)、绝对差
投影运动和仿射运动实际上是三维刚体运动在图像平面上的投射投影和正交投影,双线性运 动没有对应的具体物理运动。仿射运动和双线性运动可以写成多项式的形式,因此又称 为多项式运动模型。
2.2.2相位相关法
假定两帧图像f1(x)和f2(x)做平移运动,有:
f1(x) = f2[x+d(x,t1;t2) ]
d(xi,t1;t2),i=1,2,…。
运动估计的基本问题 是估计运动前后相邻 两帧图像上对应点的 坐标pi(xi,yi)和pi’ (xi’,yi’),i=1,2,3…。 即像平面上对应的二 维运动矢量di(xi,t1;t2)。
4.运动分析方法:主要有两种 ①.根据时间相邻的两幅或多幅图像求解物体的运动参数和三维结构信息。 ②图像序列的光流分析法。 运动信息包括:物体的一阶(位移)、二阶(速度)、三阶(加速度)等。 研究内容包括:运动目标检测与分割、运动参数估计等。 光流:指视觉观察到的图像中产生的光强变化。它一般对应物体的运动,但也 有不一致的情况。 换句话说,在视频图像序列运动估计中,观察到的二维运动叫光流。 或定义:视频序列空间坐标关于时间的变化率称为光流,即(vx,vy)T=(dx/dt,dy/dt)T, 其对应于像素的瞬时速度矢量。
我们能观察到的二维运动是“视在运动”,是由像素的亮度随时间变化体现
出来的。因此会存在的问题:
1 ) 由于缺乏足够的图像亮度变化,造成有真实的运动存在却觉察不到。
上述这个运动没有产生任何亮度变化,因而是不可观测的。
2 ) 由于外部光照的变化,造成静止物体相同位置的像素亮度随着时间
发生变化,从而在图像上观测到了运动。
值和(SAD),定义如下:
1 MSE 2 N
参考区域的左上像素。
(C ij Rij ) 2 i Nhomakorabea j 0
N 1 N 1
这里Cij是当前块的一个像素,Rij是参考区域的像素,C00,R00分别是当前区域和
平均绝对误差可以较好地衡量残余能量。
SAD Cij Rij
i 0 j 0
仿射运动为:
[
d x x, y a a x a2 y ][ 0 1 ] d y x, y b0 b1 x b2 y
双线性运动为:
[
d x x, y a a x a2 y a3 xy ][ 0 1 ] d y x, y b0 b1 x b2 y b3 xy
主要内容
• 本章有两个目的:介绍二维运动估算问题的基本概念,重 点讨论基于块的运动估计。
• 二维运动估算问题被确定为不适定问题。二维运动估算除
了作为运动补偿滤波和压缩的主要部分,它还常常是迈向 三维运动分析的第一步。
2.1概述
• 2.1.1几个基本概念 1.时间序列图像:随时间而变化的一系列图像称为时间序列图像或运动图像。 2.运动物体特征:指物体形状或表面特征,如尖锐点、边缘线等。 可以通过运动物体的特征来观察分析物体的运动。 3.运动估计的基本问题 运动估计研究的是视频序列图像中投影坐标在像平面上的变化,获取运动参数, 但是投影会造成信息丢失(不可逆),导致估计误差。
1 fx , f y 2 fx , f y ~ C1, 2 f x , f y 1 fx , f y 2 fx , f y
若f1(x)和f2(x)为纯平移关系,则得:
C~1,2(fx, fy)= exp{j2(dxfx+dyfy)}
再对上式求逆傅里叶变换,可得相位相关函数为: c~1,2(x, y)= (x+dx, y+dy) 可见平移关系图像的相位相关函数为一个冲激函数,冲激所在位置就是两 幅图像的全局平移矢量。
内有时会包含多个不同的运动物体,单一平移矢量无法确保准确性。
2.可变形块运动模型 可变形块运动模型可以实现对物体旋转、缩放和变形等运动建模,常用的可变形
运动模型有投影运动、仿射运动、双线性运动等。
投影运动为:
a0 a1 x a2 y x d x x, y 1 c1 x c2 y [ ][ ] b0 b1 x b2 y d y x, y y 1 c1 x c2 y
特征对应:运动物体上的特征与其在二维平面上的投影坐标的对
应关系。见下图示:
设t1→t2时,物体由P运动至P’,即: 空 间:P(X,Y,Z) → P’(X’,Y’,Z’)
像平面: p(x,y) → p’(x’,y’) 二维位移(△x, △y )称为二维运动 矢量,标记为d(x,t1;t2)。
对于一组点,二维空间位移记为
N 1 N 1
3.搜索算法 最简单也是最精确的搜索算法思路是进行全搜索,称为全搜索块匹配算法
(EMBA)。假设f1(x)中当前块大小为N1×N2 ,f2(x)中搜索窗中心与当前块位置相同,
搜索窗大小为(N1+2s)×(N2+2s),窗内候选块个数为(2s+1)2,位移矢量范围为dx[-s,s], dy[-s,s]。 相邻两个候选快之间的距离称为步长,全搜索的步长为一个像素,称为整数像素
• •
•
• •
具体的算法步骤如下: (1)分别对搜索窗口中心周围步长为2的8个点、步长为4的8个点和起始点 进行检测,如果最小匹配误差出现在起始点,则停止搜索;如果最小匹配误 差在起始点周围步长为2的8个点上,则向下执行(2);如果最小匹配误差在 最外层的8个点上则直接执行第(3)步。 (2)以上一步中得到的最佳匹配点为中心继续检测其周围步长为1的8个点组 成的3×3搜索窗口,以此类推向下搜索。由于存在需要重复搜索的点,因此 实际需要检测的点数不都为8个,一般为3~5个。直到最匹配的点出现在 3×3搜索窗的中心,则可以确定此点所在的块为最匹配的块。 (3)此步的搜索过程与原三步搜索算法的搜索过程相同,不再介绍。 对于缓慢变化的序列它的运动矢量也相对小了很多,那么拥有中心偏置特性 的新三步搜索算法NTSS的平均信噪比将明显高于原三步搜索法TSS的,即搜 索质量高。但是对于变化相对较快特别是运动平均的序列NTSS的优势就不明 显了。如果把新三步法中心的小正方形分别换成十字形、菱形、六边形等, 会在不同性能方面有所提高。
精度搜索。
全搜索一个像块需要计算减法、绝对值和加法各N1×N2(2s+1)2次。计算量大, 为此需要降低计算量的快速匹配算法。 4.分数精度
物体的位移未必是整像素,为此需要使用分数像素精度进行搜索,即搜索步长为
分数值。 处于分数像素位置的数据采用内插进行估计。 不足:以增加计算量为代价。如使用1/2像素精度搜索时,计算量是整数精度的4 倍,且内插也需要一定的计算量。
第二章 二维运动估计
信息工程学院
运动估计涉及: 图像平面运动(二维运动) 和空间物体运动(三维运动),运动分
析与估计是数字视频处理的基本问题之一, 也是数字视频处理的难点和热点。
运动分析与估计广泛应用于计算机视觉、目标跟踪、工业监视和视频压缩 等场合
不同应用场合对运动估计要求不同,有如下区分:
真实运动估计:要求估计获得的物体运动和实际运动基本一致。 如计算机视觉、目标跟踪、工业监视。 非真实运动估计:在不被察觉的情况下允许有估计误差,从而 最大限度降低信息量和传输带宽。如广播电视中的视频压缩。
2.2.4降低复杂度的方法
常用的方法有①在不降低估计进度的前提下减少计算量②使用快速搜索算法 1.不降低估计精度的搜索算法 (1)部分失真算法 部分失真算法也称为提前退出法,假设已计算了m个块,当前最小匹配函数值为D,对应 运动矢量为dbest ,计算第m+1个候选块方法如下: Dpartial=0 for x B
像的各种特证,可以实现很好的编码性能,主要有:自适应十字搜索
算法(ARPS)、非对称十字型多层次六边形个点搜索算法 (UMHexagonS)和增强预测区域搜索算法(PEZS)。下面就这些 算法进行一一的介绍。
(1).三步搜索法(TSS,Three Step Search )
三步搜索法是由T.Koga等人在1981年提出的在搜索范围中限制搜索点的一种搜索算法,顾名 思义,三步搜索算法只进行三步搜索,其搜索步骤如图所示。三步搜索法在搜索过程中逐渐减小搜 索步长,下一步的搜索中心是上一步搜索的结果,搜索精度为整像素。对于全搜索法(FS)要完成 搜索15×15=225个点的计算量,采用TSS搜索法只需计算25个搜索点便可完成。 图中搜索窗口为 (N1+2s)×(N2+2s),s=7。 • 具体的算法步骤如下: (1)首先,以搜索窗口的中心点为起始搜索点,以4为步长,对搜索中心周围的8个点以及中心点 进行检测,如果最小匹配误差出现在起始点,则认为静止;否则,比较其他8个点的匹配误差找出 最匹配点; (2)以上一步中得到的最匹配点为中心,将搜索步长缩短到第一步的一半,即以2为步长,对其周 围的8个点进行检测,然后通过9个点的比较找出最佳匹配的点; (3)类似上一步,将搜索步长再次缩短一半,对上一步中最佳匹配点周围的8点进行检测,比较它 们的匹配误差,匹配误差最小的点所在的块即为所要得的最佳匹配快。 三步搜索法的数据读取比较规则,也易于硬件实现,所以被许多标准推荐使用。但是三步搜索算法 对视频序列的中心偏置特性欠缺考虑,使得算法第一步过于粗糙,在搜索范围较大(或更大)时,对 于运动矢量较小的块来说初始步长就显得太大了,跳出了可能性比较大的区域,从而导致搜索方向 的不确定性,很容易陷入局部最优。