线性回归模型论文回归模型论文

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

线性回归模型论文回归模型论文

一种基于线性回归模型的运动矢量重估算法

摘要:针对H.264/AVC空间分辨率缩减的视频转码,提出一种基于线

性回归模型的运动矢量重估计算法。它利用原始视频流的运动矢量与下采样视频流的运动矢量之间的相关性,运用线性回归模型建模,得

到下采样视频的运动矢量。仿真实验结果表明:在保持率失真性能的

同时,计算复杂度明显降低。

关键词:视频转码;H.264;线形回归模型;运动矢量重估计

A Motion Vector Re-estimation Algorithm based on Linear Regression Model

YANG Gao-bo1, XIA Zhong-chao1, ZHANG Zhao-yang2, WANG Hui-qian1

(1.College of Computer and Communication, Hunan Univ, Changsha, Hunan410082, China;

2.Key Lab of Advanced Display and System Applications, Ministry of Education, Shanghai Univ, Shanghai 200072, China) Abstract: For the spatial resolution reduction of

H.264/AVC stream, a motion re-estimation algorithm based on linear regression model is proposed in this paper. It exploits the correlation between the motion vectors of original video stream and those of down-sampled video, which is modelled by

linear regression model to obtain the estimated motion vectors. Experimental results demonstrate that the proposed approach can significantly reduce the computational complexity of the transcoder with only slight sacrifice of visual quality.

Key words: video transcoding;H.264/AVC;linear regression model;motion vector re-estimation

随着网络和多媒体通信的发展,不同网络上各种视频信息的交流需求在不断增加。由于网络和终端设备的多样性,编码得到的视频流不一定是最优的。当在具有不同的信道特征的网络上,向具有不同的计算和显示能力的用户终端传输视频流时,必须根据用户环境动态地调整视频流。视频转码通过改变视频的码率和空间分辨率等格式,使经过处理后的视频流满足传输信道和解码器的特殊要求[1-2]。目前,空间分辨率缩减的转码技术研究已经较多,但大多数是针对MPEG-x

视频流。H.264/AVC是最新的视频编码标准,它采用了可变分块大小运动估计,多种帧内预测模式以及多参考帧等新特征,具有编码效率

高和网络适应性强等优点,正在得到广泛地应用。因此,研究适合于H.264/AVC视频流的空间分辨率缩减转码技术具有重要的意义。Zhang 等[3]提出一种下采样后快速模式匹配的算法,能节省转码的时间,但没有处理8×4,4×8,4×4帧间模式,转码质量不高。Shen等[4] 提出了一种新的R-D模式优化选择算法,能加快转码的速度,却不能保

证视频的质量。Cock[5]等提出一种基于开环转码结构的低复杂度漂移误差补偿技术,但是计算复杂度高。

运动矢量重估计是H.264/AVC视频空间分辨率缩减转码的关键

因素之一。文献已有少量同类的研究,但并不成熟。Shen等[6]提出通过对原始视频流的运动矢量进行加权,但没有对运动矢量的误差进行补偿,将可能产生块效应的积累,严重影响视频的质量。Shanableh 等[7]提出直接利用原始视频流运动矢量的中值或平均值,代替下采

样视频流的运动矢量。它具有计算量小的优点,但是当某个块的运动矢量明显不同于周围的块时,将产生较大的误差。

视频转换编码的关键在于充分利用部分解码输入码流过程中易

于得到的运动矢量等信息,以降低转码过程的计算量[2]。考虑到原始视频流的运动矢量与空间分辨率缩减后视频流的运动矢量具有较强

的相关性,本文提出了一种基于线性回归模型的运动矢量重估计算法,根据原始视频流的运动矢量得到下采样视频的运动矢量,适合于

H.264空间分辨率缩减的视频转码。

1. 转码器的体系结构

转码器的结构可以分为两类:级联像素域转码结构(CPDT)和DCT 域转码结构(DDT)。相对DDT结构,CPDT具有结构灵活,漂移误差小等特点[8]。本文采用CPDT实现H.264视频流的空间分辨率转码,原理框图如图1所示。转码器由一个解码器和一个编码器级联而成,即先

对编码码流进行解码,然后对重建视频帧进行下采样,再重新编码。其中,基于线性回归模型的运动矢量重估计是本文的核心。

对于H.264编码器,运动估计占用了整个编码过程约70%的运算量。因此,加快重编码过程的运动估计成为提高转码速度的关键。原始视频流的运动矢量与下采样视频流的运动矢量之间具有很强的相关性,为利用原始视频流的运动矢量加快重编码过程的运动估计提供了可能。此外,大量研究表明:解码得到的宏块编码模式与率失真优化(RDO)算法得到的宏块编码模式的相关性不强,通过原始数据流运动信息确定宏块编码模式计算速度提高较小,而视频质量影响较大[9]。本文主要针对运动矢量重估计展开研究,宏块编码模式的确定则使用标准的RDO方法。

图1 空间分辨率转码结构

Fig.1 Framework of spatial resolution transcoding

视频下采样后的每个块都对应原始视频的一块区域。图2反应了下采样前后视频流的运动矢量之间的映射关系。其中,B表示下采样图像的某个分块,R表示该块在原始视频图像对应的区域,该区域由多个具有独立运动矢量的分块组成。H.264支持7种帧间预测模式,每种预测模式i都对应从块Bi到区域Ri的映射。假设原始视频数据流得到区域Ri的所有块的运动矢量为vi=(x1,x2,…,xM),其中M代表Ri中块的个数。假设通过RD优化算法得到块Bi的运动矢量为yi,