几种视频压缩技术概述

几种视频压缩技术概述
几种视频压缩技术概述

几种视频压缩技术概述

(返回)

(一)、JPEG——静止图像压缩标准

1、JPEG

国际标准化组织(ID)和国际电报电话咨询委员会(CCITT)联合成立的专家组织JPEG

(Joint Photographic experts group 经过五年艰苦细致地工作后,于是1991 年 3 月

提出了ISO CDIO918 号建议草案:多灰度静止图像的数字压缩编码(简称JPEG标准)。

这是一个适用于彩色和单多多灰度或连续色调静止数字图像的压缩标准。它包括基于DPCM (差分脉冲编码调制)、DCT(离散余弦变换)和Huffman 编码的有损压缩算法两个部

分。前者不会产生失真,但压缩比很小;后一种算法进行图像压缩住处虽有损失但压缩比可以很大,压缩20 倍左右时,人眼基本上看不出失真。JPEG标准有三个范畴:

A、基本顺序过程Baseline sequential processes 实现有损图像压缩。重建图像质量达到人眼

难以实现图像质量达到人眼难以观察出损失的要求。采用8*8 像素自适应DCT算法、量化及H uffman 型的熵编码器。

B、基于DCT的扩展过程(Extended DCT Based Process )使用累进行工作方式,采用自

适应算术的编码过程。

C、无失真过程(Lossless Process )采用预测编码及Huffman (或算术编码),可保证

重建图像数据与原始图像数据完全相同。

基中的基本顺序过程是JPEG最基本的压缩过程:符合JPEG标准的硬软件编码/ 解码器

都必须支持和实现这个过程。另两个过程是可选扩展,对一些特定的应用项目有很大实用

价值。

(1)、JPEG算法

基本JPEG算法操作可分成以下三个步骤:通过离散余弦变换(D CT)去除数据冗余;使

用量化表对DCT系数进行量化,量化表是根据人类礼堂系统和压缩图像类型的特点进行优化的量化系数矩阵;对量化后的DCT系数时行编码使其熵达到最小,熵编码采用Huffman

可变字长编码

(2)、离散余弦变换

JPEG采用8*8 子块的二维离散余弦变换算法。在编者按码器的输入端,把原始图像(对彩色图像是每个颜色成分)顺序地分割成一系列8*8 的子块,在8*8 图像块中,像素什一般

变化较平缓,因此具有较低的空间频率。实施三维8*8 离散余弦变换可以将图像块的能量集中在极少数儿个系数上,其它系数的值与这些系数相比,绝对值要小得多。与Fourier 变换类似,对于高度相关的图像数据进行这样变换的效果使能量高度集中,便于后续的压缩处理。

(3)、量化

为了达到压缩数据的目的,对DCT系数需作量化处理,量化的作用是在保持一定质量前提下,丢弃图像中对视觉效果影响不大的信息。量化是多对一映射,是造成DCT编码信

息损失的根源。JPEG标准中采用线性均匀量化器,量化过程为对岸64个DCT系数除以量化步长并四舍五入取整,量化步长由量化表决定。量化表元素因DCT系数位旰和彩色

分量的不同而取不同值。量化表为8*8 矩阵,与DCT变化系数——对应。量化表一般由用户规定,JPEG标准中给出了参考值,并作为编码器的一个输入。量化表中元素为 1 到

达255 之间的任意整数,其值规定了其所对应DCT系数的量化步长。

(4)、游程编码

64个变换数经量化后,左上角系数是直流分量(DC系数),即空间域中64 个图像采样

值的均值。相邻8*8 块之间的DC系数一般有很强的相关性,JPEG标准对DC系数采用DPCM 编码(差分编码)方法,即对相邻像素块之间的L系数的差值进行编码。其

余63 个交流分量(AC 系数)使用游程编码,从左上角开始沿对角线方向,以Z 字形(Z

Ig-Zag )进行扫描直至结束。

量化后的AC系数通常会有许多零值,以Z 字形路径进行游程编码有效地增加了连续出现的零值个数。

2、PEG/MJPEG在DVR系统中应用

极少数DVR厂商采用JPEG压缩技术,大多采用MJPEG(Motion JPED )压缩技术,它主要特点是基本不考虑视频流中不同帧之间的变化,只单独对某一帧进行压缩。目前的基于该技术的视频卡也主要是完成数字视频捕获(Capture )功能,在后台由CPU或专门

的JPEG 芯片完成压缩工作。

JPEG/MJPEG压缩技术可以获取清晰度很高的视频图像、而且可以灵活设置每路视频清晰度、压缩帧数,但付出的代价是在保证每路都高清晰度的情况下,受处理速度限制,无法完成实压缩,有很强的丢帧现象,同时由于没有考虑到帧间变化,造成大量冗余信息

被重复存储,因此单帧视频的占用窨较大,目前流行的MJPEG技术最好的也只能做到

3K/ 帧,通常要8?20K!简单计算可以发现即使是丢帧录像,也将耗费大量的硬盘空间,尤其在保安监控领域,由于监控摄像机较多(16 路通常),同时进行高清晰度录像,保证一个月的录像存储量是十分惊人的,甚至远远超过条用MPEG1实的录像技术产品,想念

使用过该技术产品的用户对此有深刻印象。

(二)、MPEG——运动图像压缩标准

1、MPEG

MPEG是Movyig pictures experts group(运动图像专家组)的英文缩写,这个专家组始建于1988 年,专门负责为CD建立视频和音频标准,其成员均为视频、音频及系统领域的技术专家。MPEG是ISO/IEC/JTC/SC2/WG11 的一个小组。它的工作兼顾了JPEG标准和CCITT专家组的H261标准,于1990 年形成了一个标准草案。

MPEG标准分成两个阶段:第一阶段(MPEG—1)是针对传输速度为1MP/s到 1.5Mb的普通电视质量的视频信号的压缩;第二个阶段(MPEG-2)目标则是对每秒30 帧的720*576分辨率的视频信号进行压缩,在扩展模式下,MPEG-2可以对分辨率达成1440*1152 高清

晰度电视(HDTV)的信号进行压缩。总体来说,MPEG在三方面优于其他压缩/ 解压缩方案。首先,在一开始它就是作为一个国际化的标准来研究制定,所以MPEG具有很好的兼容性;其次,MPEG能够比其他算法提供更好的压缩比,最高可达200 :1;更重要的是,

MPEG在提供高压缩比的同时,对数据的损失很小。

MPEG-1制定于1992 年,为工业级标准的设计,可适合于不同带宽的设备,如CD-ROM、Video-CD、CD-I 。它可针对SIF标准分辨(对于NTSC制为325*240;对于PAL制为

325*288)的图像进行压缩,传输速率为 1.5Mbits/sec, 每秒播放30(25)帧, 具有CD(指激光唱盘)音质, 图像质量级别基本与VHS相当。MPEG的编码速率最高可达4-

5Mbits/sec ,但随着速率的提高,其解码后的图像质量有所降低。MPEG-1也被用于数字电话网络上的视频传

输,如非对称数字用户线路(ADSL),视频点播(VOD),以及教育网络等。同时,MPEG-1 也可被用做记录媒体或是在INTERNET上传输音频。

MPEG-2制定于1994 年,设计目标是高级工业标准的图像质量以及更高的传输率。

MPEG-2所能提供的传输率在3-10Mbits/sec 间,其在NTSC制式下的分辨率可达720*480 ,MPEG-

2 也可以提供广播级的视像和CD级的音质。MPEG-2R的音频编可提供左右中及两个环绕声道,以及一个加重低音声道,和多达个伴音声道。由于MPEG-2在设计时的巧妙处理,使

得大多数MPEG-2解码器也播放MPEG-1格式的数据,如VCD。同时,由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。

(MPEG-3要求速率在20Mbits/sec-40Mbits/sec 间,但这将使画面有轻度扭曲),除了作为DVD的指定标准外,MPEG-2还可以用于为广播,有线电视网,电缆网络以及卫星直播(Direvt broadcast satellite )提供广播级的数字视频。MPEG-2的另一特点是,可提供一个较广的范围改变压缩比,以适应不同画面质量,存储容量,以及带宽的要求。对于最终用户来说,由于现存电视机分辨率限MPEG-2所带来的高清晰度画面质量(如DVD两面)在电视上效果并不明显,倒是其音频特性(如加重低音,多伴音声道等)更引人注目。

MPEG算法除了对单幅图像进行编码外,还利用图像序列的相关特性去除帧间图像冗余,大大提高了视频图像的压缩比,在保持较好的图像视觉效果的前提下,压缩比可以达到

60-100 倍左右。MPEG压缩算法复杂、计算量大,其实现一般要专门的硬件支持。MPEG 标准有三个组成部分:MPEG视频;MPEG音频;视频与音频的同步。MPEG视频是NPEG 标准的核心。为满足高压缩比和随时机访问两方面的要求,MPEG采用预测和插补两种帧间编码技术。MPEG视频压缩算法中包含两种基本技术:一种是基于16*16 子块的运动补

偿,用来减少帧序列的空域冗余,在帧内压缩及帧间预测中均使用了DCT变换。运动补偿算法是当前视频图像压缩技术中使用最普遍的方法之一。

(1)、运动补偿预测帧序列的相邻画面之间的运动部分具有连续性,即当前画面上的图像可以乍成是前面某时刻的图像对当前画面图像进行预测的方法,称为前向预测。反之,根据某时刻的图与位移住处预测刻时之前的图像,称为后向预测。

MPEG的运动补偿将画面分成若干16*16 的子图像块(称为补偿单元或宏块),并根据一

定的条件分别进行帆内预测、前后预测、后向预测及平均预测。

(2)运动补偿插值以插补方法裣运动住处是提高视频压缩比的最有效措施之一。在时域中插补运动补偿是一种多分辨率压缩技术。例如1/15 秒或1/10 秒时间隔选取参考子图,对时域较低分辨率子图反映运动趋势的附加校正信息(运动夭量)进行插值,可得到满分

辨率(帧率1/30 秒)的视频信号。插值运动补偿也称为双向预测,因为它既利用了前面帧的信息用了后面帧的信息。

2、MPEG在DVR系统中应用

MPEG1实时视频压缩技术是目前市场DVR产品主流。较MJPEG技术,MPEG1在实时压缩、

每帧数据量、处理速度上有显著的提高。例如在国内PAL制式下,NPDG1可以满足多路25 帧/ 秒的压缩( >16 路)速度,在500kbit/sec 压缩码流( 352*288 )下,每帧大小仅为2k 简单计算可以表明,MPEG1产品的录像容量是目前硬盘容量可以妨受的 (16 路以下)。目前国内DVR厂商MPEG1产品基本都采用以色列Zapex 或台湾Winbond公司的压缩芯片,通过硬件压缩技术可以有效降低计算机负担,解决多路视频同时录像计算机资源有限的问题。MPEG1也有较多不利地方,其一是存储量,通常需要8个80 硬盘,或更多,硬盘

投资大,而由此引起的硬盘故障和维护更是叫人头疼;其二是清晰度不够高,由于MPEG1 最大清晰度仅次352*288 ,考虑到容量、模拟/数字量化损失等其他因素,回放清晰度不高,这也是市场反应的主要问题;其三是不够灵活,只能25帧/ 秒,不能够丢帧录像,从目前广泛采用的压缩芯片来看,也缺乏有效的调控手段,例如关键帧设计、取样区域设定等等,造成在保安监控领域应用不适合,造价也高。基四MPEG1由于数据量大,不

适合网络传输,尤其是在常用的低带宽网络上无法实现过程视频传输。其实单从民用市场上来看就知道,尽管MPEG1曾经是VCD的主要压缩标准,但目前MPEG等先进的压缩标准大有取而代之的趋势。

总体看来MPEG1与MJPEG压缩技术由于技术成熟,所以DVR开发厂家的压缩板卡也较多,是目前DVR市场的主流技术,但两者的致命弱点就是硬盘耗费量大,且不能同时满足保安与实时录像场合的需要。尤其在硬盘造价已经接近DVR整机成本50%情况下,容量与

清晰度矛盾更为突出。MPEG4技术的出现,可以有效解决以上诸多问题。MPEG-2由于要更多的消耗硬盘资源或者网络带宽虽然清晰度可以达到DVD画质一般主流

厂家未见采用。目前有一种方案将四路视频信号首先采用原有图象四分割的模拟方式复合为一路视频信号经MPEG-2的压缩来实现视频的A/D 的转换,其实是一种比较落后的技术,而且实测也未见图象质量改善,反而在四幅画整合为幅画面后增加了图象管理和处理的难度,一些原本很轻易能实现的功能如图象放大,检索单幅图象的调用等等变得很难操作。

(三)H261——视频通信编标准

电视电话/会议电视的建议标准H——261常称为P*64K标准,其中P是取值为1到30的可变参数;P=1 或 2 时支持四分之一中间格式 ( QCIF:Quarter cmmoni ntermedia fornat ) 帧率较低的视频电话传输;P>=6时支持通用中间格式( CIF :Common Intermedi-ate Format)的帧率较高的电视会议数据传输。P*64K 视频压缩算法也是一种混合编码方案,即基于DCT的变换编码方法的混合。在低传输速率时(P=1 或2,即刻4bit/s 或者

128Kbit/s ), 除QCIF 外还可使用亚帧(sub-frame )技术,即每间隔一帧(或数帧)处

理一帧,压缩比可高达50:1 左右。

(四),MPEG—4 —压缩技术的革命

1、MPEG4

MPEG—— 4 与MPEG、1 MPEG2不同。MPEG4于1998 年11 月公布,原预计1999年1 月投入使用的国际标准,MPEG4不仅是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。MPEG专家组的专家们正在为MPEEG—— 4 的制定努力工作。

MPEG—— 4 标准主要应用于视像电话(Videophone ), 视像电子邮件(VideoEmail )和电子新闻(ElectronicNews )等,其传输速率要求较低,在4800—64000bits/sec 之间,分辨率为176*144 。MPEG—4 利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少的数据获得最佳的图像质量。

与MPEG—1 和MPEG—2 相比,MPEG—4 的特点是其更适于交互AV服务以及远程监控。

MPEG—4 是第一个使使用者由被动变为主动(不再只是观看,允许你加入其中,即有交互性)的态图象标准;它的另一个特点是其综合性;从根源上说,MPEG—4 试图将自然物体与人造物体相溶合(视沉效果意义上的)。MPEG— 4 的设计目标还有更广的适应性

和可扩展性。NPEG4试图达到两个目标:A、低比特率下的多媒体通信;B、是多工业的多媒体通信的综合。据此目标,MPEG4引入AV对象(Audio/visual objects ), 使得更

多的交互操作成为可能。

可见MPEG4压缩技术原本是一种适用在低带宽下进行住处交换的音视频处理技术,它的特点是可以动态的侦测图像各个区域变化,基于对象的变化而高速压缩方法可以获得比MPEG1更大的压缩比,压缩码流更低。尽管MPEG4并不是专为视频监控压缩领域而设计,

但同样也适合CIF(352*288)或者更高清晰度(768*576 )情况下的视频压缩,无论从清晰度还是从存储量上都比MPEG1具有更大的优势。

(1)、DMIF(The Dellivery Multimedia Integration Framework )

DMIF即多媒体传送整体框架,它主要解决交互网络中,广播环境下以及磁盘应用中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端交互和传输。通过DMIF,MPEG4可以建立起具有特殊品质服务(QOS)的信道和面向每个基本流的带宽。(2)、数据平面

数据平面可以分为两部分:传输关系部分和媒体关系部分。

为了使基本流和AV对象在同一场景中出现,MPEG4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT (Channel Assosiation Tag )相连,CAT可实现该流的顺利传输。

(3)、缓冲区管理和实进识别

MPEG4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句汉语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效的管理,可以更好地利用有限的缓冲区空间。

(4)、音频编码

MPEG4的优越之处在于一它不仅支持自然声音,而且支持合成声音。MPEG4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

(5)、视频编码

与音频编码类似,M PEG4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D 动画和人面部表情动画等。

(6)、场景描述

MPEG4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就成了场景描述,这些场景描述以二进制格式Binary Format for Scene description)表示,BIFS 与AV 对象一同传输、编码。场景描述主要用于描述各A V 对象一同传输、编码。

场景描述主要于描述各AV 对象在一具体 A V 场景坐标下,如何组织与同步等问题,同时

还有AV 对象与AV场景的知识产权保护等问题。MPEG4为我们提供了丰富的AV场景。

2、MPEG4在DVR系统中应用

MPEG4在压缩方法上远远优于MPEG,1 更是MJPEG不能比拟的。MPEG4基于场景描述

相关主题
相关文档
最新文档