自适应六边形_菱形运动估计算法及其在H_264中应用

合集下载

H264优化方案调研总结(博)

H264优化方案调研总结(博)

H264优化方案调研总结(博)-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN编码分析及优化研究一.编码标准,同时也是MPEG-4第十部分,是由ITU-T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的高度压缩数字视频编解码器标准。

它和以前的视频编码标准一样,也是传统的混合编码模式,其编码器原理图如下图(朱总,配那个论文软件部分的图2-2)采用了大量的新技术,所以其编码性能大大优于其他标准,具体表现如下:1、和或MPEG-4相比,在相同编码质量下,最多可节省50%的比特率。

2、高质量的重建图像。

在各种比特率条件下,包括低比特率时,都可以提供满意的图像质量。

3、适应不同的延时要求。

可以在低延时的模式下适应通信的应用(如视频会议),可以应用在无延时的模式下(如视频图像的存储),甚至还可以在高延时的模式下工作并取得最佳的压缩效果。

4、稳健性。

在设计时,针对分组交换网如Internet中的分组丢失和无线网络中比特误码都提供了相应的工具,使得在这些网络中传播时具有更强的抗误码能力。

5、网络友好性。

增加了NAL层,负责将编码器的输出码流适配到各种类型的网络中,从而提供了友好的网络接口。

视频编码标准主要关键技术:1、帧内预测编码:为了进一步利用空间相关性,引入了帧内预测以提高压缩效率。

它利用邻近块已解码重构的像素在空域中按照不同的方向对当前块进行预测。

在帧内预测过程中,只有预测块和实际块的残差才被编码传输。

因此对于变化平坦、存在大量空间冗余的视频对象,利用帧内预测可以大大减少编码所需的比特数,取得较高的编码效率。

2、帧间预测编码:对于视频图像来说,前一帧图像和后一帧图像之间有很多的相同(相似)部分,存在大量的时间冗余信息。

帧间预测编码就是基于连续图像序列之间的时域相关性,利用前一帧图像和当前帧图像中的相同(相似)部分来预测当前帧,然后对预测图像与实际图像的差值进行编码,从而实现大幅度地压缩。

H.264运动估计编码的FPGA实现

H.264运动估计编码的FPGA实现

也 比较困难 。对 H.6 24协 议 各 个 算 法 模 块 进 行 分 析可 以看出 , 动估计是 H.6 协 议 中运 算 量最 大 运 2 4 的模块 。因此 , 对整 个编码 器进 行优化 , 若 运动 估计 模块应作 为首选 。考虑 到计算 的复杂度 和实时 实现 的要求 , 匹配 法 ( MME,Bok—Ma h gMoo 块 B lc t i tn cn i Et ai ) 为 目前 最 为 广 泛 应 用 的 运 动 估 计 方 sm tn 成 i o 法, 是基 于运 动 补偿/ C D T混 合 编码 标 准 的 重 要 组 成部分 , 动估计 与 补偿 技 术 可 以有 效 地 去除 视 频 运 序列相邻 帧间存在 的时 间冗 余 , 大 地 提 高 了编码 极
p sd hsag rh b sd o p r n — U P A ad ae ac i cu e ae i lme td o a n oe .T i lo tm ae n S at i a F G h r w r rht tr r mpe ne .C mp r g e i

Ⅱ系列 F G 的硬 件 结构实 现。通 过 与全 搜 索法 相 比 的仿真 试验 证 实 该方 案 达 到预 期 的效果 , PA
并且提高 了数据吞吐率, 简化 了硬件结构, 极大地节省 了资源。 关 键词 : 运动估 计 ;P A; F G 菱形搜 索算 法 ; .6 H 24
中图分类 号 :P9 T31 文献标识 码 : A 文章编号 :02— 29 2 0 )5— 0 0— 2 10 27 (07 0 0 8 0
维普资讯
N . o5
Oc ., 0 7 t 20

ቤተ መጻሕፍቲ ባይዱ

h.264标准的特点及应用

h.264标准的特点及应用

H.264标准的特点及应用随着人类精神需求和空间需求的提升,人们不再满足面对面的语言交流,空间距离的增加导致人们面对面的语言交流变得越来越少,人们更需要在时空中交流与交往。

当传统的交流方式难以实现时,更需要视觉、感观以及信息交流。

正因为如此,促进了卫星通信、微波通信、有线/无线传输技术的发展,也推动信息压缩技术和宽带传输技术,同时推动了安防业的迅猛发展。

视频信息传输和视频通讯的猛增,给视频压缩技术带来了很大挑战。

无论是互联网还是无线网络,都需要一种新型的压缩算法,新算法要求高压缩比,且能适应不同的网络环境。

以较小的失真、较高的压缩比、更小的花费、较低的码率在信道中传递视频,进行多媒体通信是今后视频压缩技术研究的一个方向。

H.264,又称MPEG-4part10,也称AVC(AdvancedVideoCoding),是一个数字视频压缩标准,由VCEG(ITU-TVideoCodingExpertsGroup)和MPEG(ISO/IECMovingPictureExpertsGroup)联合组成的JVT(JointVideoTeam)于2003年3月正式发布[1,2]。

H.264标准的主要目标就是在同等保真条件下,提高编码效率。

这是一对矛盾,既然要求图像不失真,则图像传输的比特数就大,在网络带宽一定的情况下,图像信号传输的速度就快,因此,只有提高编码效率才能实现。

H.264的源起在以往众多的视频编码算法中,被广泛认可并应用于实际的是ISO/IEC制定的MPEG-X和ITU-T制定的H.26x两大系列视频编码国际标准。

H.261是早期的编码标准,主要是规范ISDN网上的会议电视和可视对讲。

它采用的是可减少时间冗余的帧间预测和减少空间冗余的DCT变换的混合编码方法,以及ISDN信道匹配,其输出码率是P×64kbit/s。

P较小时,传输清晰度不太高的图像;P较大时,可以传输清晰度较好的会议电视图像。

H.264中运动估计算法研究与对比

H.264中运动估计算法研究与对比

文章编号 100426410(2007)S120010204H 1264中运动估计算法研究与对比贺克军,梁 齐(合肥工业大学理学院,合肥)摘 要:自从视频编解码标准H 1264发布以来,国内外学者专家提出了大量的基于此标准的运动估计算法。

本文将介绍一些典型的算法,对其性能进行分析比较。

关 键 词:H 1264标准;运动估计;块匹配;UM Hexag onS 算法中图分类号:TN91 文献标识码:A收稿日期2525作者简介贺克军(8),男,合肥工业大学理学院,硕士研究生。

0 引言视频编码标准H 1264自发布以来一直就是研究的热点,和H 1261、H 1263一样,H 1264也是采用DC T 变换编码加DPCM 的差分编码,即混合编码结构。

同时,H 1264在混合编码的框架下引入了新的编码方式,提高了编码效率。

H 1264提供16×16,16×18,8×16,8×8以及8×8以下的多种分块的运动补偿单元[1]。

对于8×8以下的分块,也还有4种小块的划分。

提供如此多的分块单元的选择,使得编码效率大大提高,但代价是增加了大量的运动估计时间。

所以如何在保证一定图象质量的条件下,尽量减少对运动估计的计算量,成为当今的一个主要研究点。

因此,许多针对此问题的快速搜索算法被相继提了出来。

1 匹配准则在熟知的视频编码标准中(H 1261、H 1236、MP EG 21、MPEG 22、MPEG 24),运动估计和运动补偿在当前帧的8×8或者16×16块上进行。

整个块的运动估计也被称为块匹配[2]。

在一个典型的块匹配算法中,一帧图像被分割为M ×N 或者是更为常用的N ×N 像素大小的块。

在(N +2w )×(N +2w )大小的匹配窗中,当前块与前一帧中对应的块相比较。

基于匹配标准,找出最佳匹配,得到当前块的替代位置。

H.264中多模式运动估计算法优化

H.264中多模式运动估计算法优化
中 图分 类 号 : P3 14 T 9 . 1 文献标 识码 : A 文 章 编 号 : 0 15 6 ( 0 8 0 .1 00 10 .9 5 2 0 ) 20 4 .4
Op i z t n o l- d t n e t t mia i fmut mo e mo i s i t lo i m n H. 6 o i o ma i ag r h i 2 4 on t
维普资讯
20 0 8年 2月
北 京 航 空 航 天 大 学 学 报 Jun l fB in nv ri fAeo a t sa d As o a t s o ra o ej g U iest o rn ui n t n ui i y c r c
r l l kn i n - i nins m o b oue df rn e( AD)w r e in d to t z dtefr ra- u e i igw t o e dme s u fa s lt iee c S n h o f eed s e .I pi e h ome l g mi
0 0 B、 速率 增加 不超过 1 5 的前提 下 , 码速 率提 高 2 % ~3 % , 明 了该 算 法在 恢 复 . 3d 码 .% 编 0 0 表
质 量 略有下 降 的情 况 下明显提 高 了编码 速度. 关 键 词 :H 2 4 运 动估计 ;模 式选择 ;绝对 差值 和 .6 ;
F br a e u ̄
2 8 00
第3 4卷 第 2 期
Vo. 4 No 2 13 .
H. 6 2 4中多模 式运 动估 计 算 法 优 化
张 嘉毅 罗喜 伶 黄 智 刚
( 京 航 空 航 天 大 学 电 子 信 息 工 程学 院 ,北 京 10 8 ) 北 00 3

基于H.264视频编码的运动估计算法研究

基于H.264视频编码的运动估计算法研究
( 如图 2b所示)进行最终匹配定位。 () ,
x 6 ME 2 4
~ —
U H算法各个模板如图2 M 所示。
3 x 6 ME U 2 4 MO 算 法
一 —
31 非对称小菱形搜 索的加入 .
由于在 x6 U H xgn 算法中。已经考虑到了 24的 M eaoS 物体运动的方向性, 但是 , 宏块分割模式依然能够反映物 体的运动情况[ 1x 和 84的宏块模式 , S 68 l , x 水平运动的可 能性更大 ,x6和 4 8 81 x 宏块模式对应的垂直运动可能性
步骤 1先以上述 的X 为中心进行如图 2a所示的 : 0 ()
小菱形搜索, 计算 S D值及找出最小误 ̄(i u l k A mn mb c m o d ttn M D点。 ioi , B ) 若宏块为 4 4 sr o x 宏块时, 直接进行六边形
细化( 如图 2b所示 )因为其预测矢量的精度较高, () , 可以 跳过十字形搜索和多级六边形搜索。否则, 如果 bo = cs = t uo2bo 为整像素的精度代价, o 2 cs (c t t s u s 为获得 1 像素 ct / 4
用求出的左、 左上的编码宏块(b的运动向量( 得到 上、 m) 舢) 当前 m b的m y的预测值 mp v .以预测向量 m p的矢量终 v 点为初始点( 代号为 X )进行整像素搜索。 0, 初始点搜索流 程 如 图 1所示 。是 否进 行 分数 精 度 搜索 是 由变量
s 6 e r n 决定的,通过该变量去查表示运算次数的常 u pl e e i f
骤 4 。

x6 24中的 U H xgn 算法(24M — M 设置了 M eaoS x6一 EU H)

H.264中运动矢量特征分类的快速运动估计算法

H.264中运动矢量特征分类的快速运动估计算法
维普资讯
第3 2卷 第 1 9期
V 13 o.2






20 0 6年 1 0月
Oc o e 0 6 t b r2 0

l 9
Co put rEng ne r ng m e i ei
多媒体 技 术及应 用 ・
文章编号: o 32( o) 一l _ lo一 48 o6 2 - 3 2 l 3 0
块运 动估计 和模 式判定 的运 用。为 了提高准确度 ,H2 4在 .6
分 或者亚宏块 的方法 ,又可称之为树结构的运动估计 。然后 通过率失真优化准则 R O( a iot nOpi zd( 1) D R t D s ro t e )式() e t i mi
确定最优匹配模式 , 得到的结果 即为该宏块最终的编码模式 。
, m, ( ) A scm)十 … ・ m— =S D(,( ) R( ) () 1
运 动估计 中提供 7种不 同大小的块 ,可以节省 多达 1%的比 5
特率。但 同时也使得处理 时间线性上升 ,计算复杂度大大增 加。在 J T参考软件 J . ,采用 了由 Z io h n eg V M90中 hb e ,P n C
关奠 词 :H 2 ;运动矢量特征 分类 ;方向性菱形模 板 . 4 6
Fa t o i n Esi a i n o e t r a y i s to t M m t f x u eAn l ss o T f rM o i n Ve t ri .6 0 to c o H 2 4 n
中等运 动块 和小运 动块 。对每类 宏块 自适应地选择一种 或者几种编码模式进行预测 ,有效地减少 了由 7种宏块( 亚宏块) 模式 所引起 的计算 量;同时选 用精确 而且快速 的方向性菱形模板 ,对不 同的模式采用不 同的搜索策略 。实验分析表明 ,该算法搜索精度接 近于 全搜索算法 , 而搜索时间只为全搜索算法的 5 %~1 .%。 . 4 05

一种基于H.264的快速运动估计算法

一种基于H.264的快速运动估计算法

一种基于H.264的快速运动估计算法
吴小敏;徐伟掌
【期刊名称】《中国传媒大学学报(自然科学版)》
【年(卷),期】2009(016)003
【摘要】在视频编码中,运动估计发挥着相当重要的作用,在很大程度上影响图像精度和压缩比例;同时运动估计也是编码器中复杂度高、运算量特别大的一部分,因此影响了H.264视频编码的实时应用.为了降低计算复杂度并保持图像质量,本文提出了一种整像素运动估计算法.结合UMHexagonS(非对称十字型多层次六边形格点搜索)算法和EPZS(增强的区域搜索)算法的特性,本文算法根据图像的运动类型不同采用不同的模板,同时加入了提前终止技术.实验结果证明该算法与FS(全搜索)、UMHexagonS和EFZS算法相比,在峰值信噪比(PSNR)基本相同的情况下减少了运动估计的时间.
【总页数】5页(P41-44,36)
【作者】吴小敏;徐伟掌
【作者单位】中国传媒大学广播电视数字化教育部工程研究中心,北京,100024;中国传媒大学广播电视数字化教育部工程研究中心,北京,100024
【正文语种】中文
【中图分类】TP37
【相关文献】
1.一种基于H.264的快速运动估计算法 [J], 刘玉娜;樊丰;朱维乐
2.一种基于H.264/AVC的快速运动估计算法 [J], 江禹生;丁兰欣;邵巍
3.一种新的基于H.264的快速运动估计算法 [J], 李丽;宋刚
4.一种新的基于H.264/AVC的快速块运动估计算法 [J], 陈高冰;杨立波
5.基于H.264/AVC的一种快速运动估计算法 [J], 张志刚;季翠丽
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2006年 工 程 图 学 学 报2006第6期 JOURNAL OF ENGINEERING GRAPHICS No.6自适应六边形-菱形运动估计算法及其在H.264中应用李小红(合肥工业大学计算机与信息学院,安徽合肥 230009)摘要:运动估计是视频图像编码中运算量很大的部分,也是影响系统实时性能的瓶颈。

为了减少图像编码的运算量,文章介绍和分析了用于视频编码标准H.264的基于六边形的搜索算法(HS),在此基础上根据H.264多模式的运动估计提出自适应六边形-菱形整像素算法,它体现了粗定位和准确定位的并行处理思想,仿真结果表明在获得与HS快速算法相当的图像质量和信噪比的情况下,可提高H.264视频编码的速度和效率。

关键词:计算机应用;计算机图像处理;自适应六边形-菱形搜索;运动估计;六边形搜索;H.264标准中图分类号:TP 391.41文献标识码:A 文章编号:1003-0158(2006)06-0082-05An Adaptable Hexagon-Diamond Motion Estimation Algorithm for H.264LI Xiao-hong( School of Computer Science and Information Engineering, Hefei University of Technology, Hefei Anhui 230009, China )Abstract: The computation in video codec mainly concentrates on motion estimation, which is the bottleneck of realization of real time video codec. In order to reduce the computation in the motion estimation of H.264 encoding, this paper introduces and discusses the hexagon search (HS) algorithm used in H.264 video coding standard. Meanwhile, an adaptable hexagon-diamond integer pixel motion estimation algorithm based on multiple motion estimation modes is also presented, which adopted parallel processing idea of coarse location and accurate orientation determined by its structure. Experimental results show that the proposed technique can significantly reduce the computational complexity, and provide competitive performance with similar image quality compared with the HS fast algorithm.Key words: computer application; computer image processing; adaptable hexagon-diamond search; motion estimation; hexagon search; H.264收稿日期:2006-01-11基金项目:安徽省“十五”科技攻关计划资助项目(040020382);安徽省教育厅高校青年教师科研计划资助项目(2005jq1009)在视频编码中,帧间预测是减少运动图像时间冗余度的关键技术。

H.261、MPEG2、H.263、MPEG4等国际标准均采用了运动估计算法,其主要任务是按照一定的匹配准则,在前一重建的图像帧中相应搜索窗口内寻找当前编码宏块的最佳匹配宏块,并求出其运动矢量。

因此,低码率视频编码要求运动估计搜索算法尽可能精确地寻找最佳匹配快,以使预测图像更加准确,满足低码率的要求;另一方面,降低其运算量对实现实时视频编码器具有决定性的意义。

在所有的运动估计搜索算法中,全搜索(FS)算法性能最好,精度最高,但其计算精度是以巨大的运算量为代价的,运动估计要占到整个编码运算量的70%~90%,实际应用中为了减少运算量,提出许多快速算法,如三步法(TSS)、共轭方向搜索法(CDS)和二维对数下降法(TDS),这些快速算法虽然降低了运算量,但却以牺牲图像质量为代价。

有关实验表明,这几种快速算法相对全搜索算法,在预测的精度上明显降低,因而码率增加。

近年来提出的菱形搜索算法(DS)是一种在时间性能和精度指标上都比较理想的快速算法,作者将它和六边形搜索结合起来,根据视频图像编码标准H.264[1]特有的7种运动估计模式提出自适应六边形-菱形整像素运动估计搜索算法,最后给出实验结果和结论。

1 六边形搜索算法现有的各种运动估计快速算法都是根据视频图像运动矢量的中心偏置分布特性和矢量间的高度相关性,根据块的不同运动内容来确定其搜索起点、搜索范围和搜索策略,从而实现块运动矢量的快速估计,大量的统计实验表明,一般物体在水平和垂直方向上运动的概率比较大,图像的频谱多呈类似菱形的分布,所以菱形搜索算法(DS)是一种在时间性能上和精度指标上比较好的快速算法。

另一方面可以证明,能全面覆盖一个搜索平面的正多边形有正三角形、正方形、正六边形3种,其中,在圆的内接多边形中正六边形的中心间隔最大,覆盖面积也最大。

由于菱形搜索和六边形搜索各有长处,视频图像编码标准H.264的JM82校验模型综合采用了这两种模式。

基于六边形的搜索模式如图1(a)中所示,它包含了7个检查点(阴影点),在六边形的6个端点中,两个水平方向的点到中心的距离为2,剩下的4个点分别到中心的距离为5。

在6个端点中,任何一对相邻端点之间的距离或者为2,或者为5。

从图中可以发现6个端点都大约一致的分布在中心附近,这正是所非常期望得到的环状结构。

注意到六边形搜索模式要比九点菱形搜索法少两个检查点。

在搜索过程中,基于六边形搜索模式一直保持由中心向6个端点中的任何一个推进的趋势。

无论搜索模式中心向哪个端点移动,总是会涌现出3个新端点,而另外的3个端点是重叠的。

图1(b)说明了运动区域内的一个包含4个检查点的较小的收缩六边形搜索模式,或者就称之为菱形搜索模式。

(a) 六边形搜索模式 (b) 菱形搜索模式图1 搜索模式在上述思想的基础上,JM82校验模型采用基于六边形的整像素搜索算法,该算法采用了动态的搜索步长和搜索范围,设立多个门限以及退出标志位使得整个程序包含了很多出口,进而增加了其流向的灵活性。

算法的基本思想如下:(1)根据函数的入口参数动态的确定各种情况下的门限值;(2)进行中心预测值的检测,即将所传入的当前块位置坐标与运动矢量预测器所得到的运动矢量相加获得所要的最佳预测位置,以该点为中心,进行4点的小菱形搜索,进而得到当前最佳匹配点;(3)在水平方向和垂直方向分别在搜索窗的范围内以动态搜索步长进行左右、上下交替搜索,然后以得到的最佳匹配点进行24点的螺旋搜索,从而求得当前最佳匹配点;(4)以当前最佳匹配点为中心,在1/4搜索窗长度的范围内进行16点的大六边形搜索,求得第6期 李小红:自适应六边形-菱形运动估计算法及其在H.264中应用 ·83·最佳匹配点,并且大六边形的大小是随着循环次数的变化而动态的变化的;(5)再以当前的最佳匹配点为中心,采用固定大小的6点六边形进行搜索,搜索范围是整个搜索窗;得到当前最佳匹配点后,再以该点为中心,采用固定大小的4点菱形进行搜索,搜索范围仍然是整个搜索窗,从而得到最终的最佳匹配点,进而获得当前块的运动矢量。

分析JM82校验模型采用的整像素运动估计算法发现,它是基于串行处理思想的,即为了保证算法的效率和收敛性,搜索模板和搜索步长只能由大到小,先进行粗定位,然后再准确定位,搜索次数过多,不能根据图像的内容灵活处理,这对小运动是种浪费,而且当第一步的步长较大时还会误导搜索方向,影响搜索的速度和准确性。

而在低码率的视频应用场合如可视电话、会议电视,由于物体作缓慢运动,运动矢量很小的宏块必然占主导地位,所以有必要寻找更加高速的整像素运动估计算法。

2 自适应六边形-菱形搜索算法及在H.264中应用2.1 适用于H.264的并行搜索模式Zhang Jianning在文献[3]针对H.264的多模式运动估计分别设计了正六边形搜索、水平六边形搜索、垂直六边形搜索和菱形搜索。

正如文献[2]提到的那样,采用环形搜索模式可以获得以最少的搜索点数而得到最快的搜索速度的效果,那么对于4个角均为90°正方形分块模式,正六边形就已经足够接近环状结构了;对于像16×8和8×4分块模式,采用水平六边形搜索模式使得搜索区域更接近环状。

而对8×16和4×8分块模式,采用垂直六边形搜索模式。

随着不同的块尺寸的变化,搜索模式的尺寸也在自适应的发生着变化,这样就增加了匹配的灵活性。

针对并行处理的思想,可定义3种大小模板并行处理的六边形-菱形搜索模式,如图2所示。

用数组定义如下:int Hexagon_x[6] = {2, 1, -1, -2, -1, 1}; //六边形 int Hexagon_y[6] = {0, -2, -2, 0, 2, 2}; //六边形int Horizontal_hexagon_x[6]={2, 1, -1, -2, -1, 1}; //水平六边形int Horizontal_hexagon_y[6]={0, -1, -1, 0, 1, 1}; //水平六边形int Vertical_hexagon_x[6]={1, 0, -1, -1, 0, 1}; //垂直六边形int Vertical_hexagon_y[6]={-1, -2, -1, 1, 2, 1}; //垂直六边形int Diamond_x[4] = {-1, 0, 1, 0}; //菱形int Diamond_y[4] = {0, 1, 0, -1}; //菱形如果采用六边形搜索得到的SAD最小点位于六边形中心,则采用菱形搜索模式进行精细搜索,得到最小SAD点。

(a)(b)(c)图2 3种并行搜索模式2.2 适用H.264的自适应六边形-菱形搜索算法(AHDS)采用图2的并行搜索模式后,根据运动估计的多模式选择可采取自适应搜索算法,即可以对这7种模式分别采用不同的搜索模式,称为基于自适应六边形-菱形搜索的运动估计算法(AHDS),其整像素运动估计算法主要思想如下:(1)考虑到相邻块之间的高度空间相关性,将所传入的当前块位置坐标与运动矢量预测器所得到的运动矢量相加获得所要的最佳预测位置,获得当前块的预测运动矢量(MV x,MV y)。

相关文档
最新文档