第五讲 数据压缩技术基础

第五讲 数据压缩技术基础
第五讲 数据压缩技术基础

第五讲数据压缩技术基础

5.1数据压缩的技术指标是什么?

1.数据压缩的目的

通过压缩手段把数据量压下来以压缩形式存储和传输,这样既节约了空间,又提高了传输速率,同时也使计算机可实时处理音频视频信息,以保证播放出高质量的音频、视频节目称为可能。

对图像的压缩编码有多种方法。如亚采样编码思想:一组像素可用一个像素表示以达到压缩图像存储容量。

又如游程编码思想:对黑白图像的编码,可将每行的像素分为白段、黑段、白段、黑段、白段…后,每段像素采用其长度(计数)表示:计数1,计数2,计数3,计数4,计数5,计数6…。实际上,一个好的编码系统都是采用多种算法、多次处理而成的。

2.数据压缩的基本理论

数据压缩是通过去除多媒体中冗余数据可大大减少原始数据量,从而使数据量得到压缩。信息论认为:若信源编码的熵(entropy)大于信源的实际熵,则该信源一定存在冗余。去除冗余不会减少信息量,仍可原样恢复数据;但若减少了熵,则数据不能完全恢复。不过在允许的范围内损失一定的熵,数据可得到近似的恢复。

所谓“熵”,原指热能除以温度所得的商,即热量转化为功的程度。这里是指信源发

出任意一个随机变量的平均信息量。所谓“信息量”是指从N个相等可能事件中选出一

个事件所需的信息度量。

3.原始数据的冗余类型

(1)空间冗余:同一帧画面中,规则景物和规则背景的表面各采样点的颜色之间存在

空间连贯性。

(2)时间冗余:在图像序列中,相邻帧图像之间同一场景所包含背景和移动物体具有

共同性。

(3)结构冗余:图像的像素值存在明显的分布模式结构产生的数据冗余。

(4)知识冗余:某些规律性结构可通过先验知识和背景知识得到的冗余。

(5)视觉冗余:人眼的视觉系统对图像场视觉的敏感和不敏感同等对待而产生了更多

数据冗余。

(6)区域相似性冗余:图像中的两个或多个区域所对应的像素值具有相似性使产生的

数据重复存储

(7)纹理的统计冗余:图像纹理在统计上服从某一分布规律的冗余。

4.压缩比

压缩比(%)=压缩后的图像数据量/ 压缩前的图像数据量

若原数字文件数据容量为100MB,经压缩后的数据容量为50MB,则图像压缩比为50%。

显然,压缩比越小,压缩后的图像文件数据量也越小,图像的质量有可能损失越多。实际

上,图像的压缩效果不但与压缩前的图像效果有关,也与采用的压缩方法有关。

5.数据压缩的技术指标

(1)压缩比:压缩前、后所需的信息存储量之比要大。

(2)压缩和解压速度:实现数据压缩的算法要简单,压缩解压的速度要快。

(3)恢复效果:解压后的恢复效果要好,要尽可能地恢复原始数据。

5.2数据压缩编码方法如何分类?

1.根据熵有无损失分类

(1)无损压缩

无损压缩也称为不失真压缩,是去掉或减少数据的冗余进行压缩。这些冗余值可重新插入数据中来实现原始数据的完全恢复而不失真。但这种压缩方法的压缩比受到统计冗余度的理论限制,一般为2:1-5:1。该压缩方法适用于文本、数据、程序和应用场合的图像数据的压缩。常用无损压缩的编码方案有:游程编码、Huffman编码、算术编码及LZW 编码等。

(2)有损压缩

有损压缩也称为有失真压缩,是减少信息量(压缩熵)来进行压缩。这些损失是不能再恢复的,因此这种压缩是不可逆的。一般利用人的视觉和听觉对图像或声音中的不敏感性进行压缩,虽损失一息且不能完全恢复原始数据,但换取了高的压缩比。该压缩方法适用于语音数据、图像数据和视频数据的压缩。常用有损压缩的编码方案有:PCM、预测编码、变换编码、插值及外推法编码等。

2.根据数据压缩算法分类

(1)统计编码

统计编码也称信息熵编码,是根据信源所含有的平均信息量(熵)即无失真编码的极限的无失真编码定理进行编码。统计编码常用的是Huffman编码(利用信源概率分布)、游程编码(利用相关性)和算术编码(利用信源概率分布)等。

(2)预测编码

预测编码是根据某一数据模型利用以往样本值对新样本值进行预测,再将样本实际值与预测值的差进行编码。若模型足够好,且样本序列的时间相关性较强,则误差信号幅度将远小于原始信号,即可用较少的值对其差值进行量化,得到较大压缩的效果。预测编码常用的是差分脉冲编码调制(DPCM)和自适应的差分脉冲编码调制(ADPCM)。

(3)变换编码

变换编码将通常在空间域描写的图像信号变换到另外一些正交矢量空间(即变化域)中进行描写。选择合适的变换关系使变换域中描写的各信息分量之间的相关性很小或互不相关,从而达到数据压缩的目的。

(4)分析合成编码

分析合成编码是通过对原始数据的分析,将其分解为一系列更适合表示的基元或从中提取若干具有更本质意义的参数,编码仅针对这些基本单元或特征参数进行。解压时则借助一定的规则或模型按一定的算法将这些基元或参数再合成逼近原始数据的数据。常用的编码有子带编码、小波变换编码以及分析图形编码等。

5.3统计编码的基本原理是什么?

1.统计编码基本理论(P120~129)

2.统计编码基本思想

统计编码也称熵编码,是根据消息出现概率的分布特性进行的压缩编码。其编码基本思想是:识别一个给定的数据流中出现概率最高的比特或字节模式,用比原始比特更少的比特数来对其进行编码,即出现概率越低的模式编码位数就越多;而出现概率越高的模式编码位数就越少。若码流中所有模式出现的概率相等,平均信息量最大,则信源没有冗余。

统计编码的基本方法是:在消息和码字之间找到明确的一一对应关系,以便在恢复时能准确无误地再现出来,或相似地找到相当对应关系,并把这种失真或不对应概率限制在可容忍的范围(如运动图像的数据压缩)。

变长码是最常使用的方法,该编码的原始思想起源于Morse电报码及速记法。例如Morse码中e是最常出现的,编码为“.”;而q最少出现,则编码为“..—”。其信源符号与码字一一对应,因此可准确无误地再现。且在编译码过程中不损失任何信息,属于冗余压缩法。

变长码的最佳编码定理:在变长码中,对出现概率大的信息符号以短字长编码,对出现概率小的信息符号以长字长编码。若码字长度严格按符号概率大小的相反顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式得到的码字长度。

3.常用的编码方案

(1)游程编码

将数据流中连续出现的字符(即游程)用单一的记号来表示。如字符串abacccbbaaaa,可压缩为aba3c2b4a。该编码的压缩效果不太好,但编码解码的速度快,因此仍得到广泛应用。许多图像视频文件(BMP、TIF及A VI等)采样该压缩。

(2)哈夫曼编码

将信源符号按概率的大小排序,概率大的为短码,概率小的为长码。其编码过程如下:

a.将信源符号按概率递减顺序排列;

b.把两个最小的概率相加,作为新符号的概率;

c.重复A、B,直到概率和达到1为止;

e.在每次合并消息时,将被合并的消息赋予1和0或0和1;

f.寻找从每一信源符号到概率为1的路径,记录下路径上的0和1;

g.对每个符号写出从码树的根到终结点1、0序列。

例:

信息符号概率

x1 0.35 0 00

x2 0.20 00.60 0 10

x3 0.15 00.25 1 1.00 根010

x4 0.10 10.40 1 011

x5 0.10 0 1 110

x6 0.06 00.10 0.20 1110

x7 0.04 1 1 1111

(3)算术编码

将一个信源集合表示为实线上的0到1之间的一个区间。这个集合中的每个元素都要用来缩短这个区间。信息集合的元素越多,所得区间则越小。当区间变小时,就需要更多的数位来表示这个区间。算术编码初级阶段预设一个大概率为Pe,小概率为Qe。其编码过程如下:

a.设编码初始化子区间为[0,1],Qe从0算起,则Pe=1-Qe。随着被编码数据量符号

的输入,子区间逐渐缩小;

b.新子区间的起始位置= 前子区间的起始位置+当前符号的区间左端*前子区间长度;

新子区间的长度= 前子区间的长度*当前符号的概率(即范围长度);

c.最后得到的子区间的长度决定了该区域内的某一个数所需位置。

△已知符号串(信源)符号由0,1组成,0出现的概率为1/4,1出现的概率为3/4。按以上算术编码规则对符号串1011进行编码:

这里,Qe=1/4,Pe=3/4,初始子区间为[0,1]

序号 符号 子区间起始位置 子区间长度

1 1 1/4 3/4

2 0 1/4 3/16

3 1 19/6

4 9/64

4 1 85/256 27/256

最后的子区间起始位置=85/256=0.01010101B ,子区间长度=27/256=0.00011011B ,子区间尾=85/256+27/256=0.01010101B+0.00011011B=0.0111。因此编码输出应落在子区间的头尾之间[0.0101~0.0111]。可在此范围内选取一个码字较短的作为输出,如0.011。传送时只传送011即可,该码字即为符号串1011的编码输出。

在算术编码中,出现概率相同的串区间长度相同;出现概率大的串码长较短。

5.4预测编码的基本原理是什么?

1.预测编码基本理论

基于现代统计学和现代控制论,是数据压缩理论的一个重要分支。它指出离散信号之间存在着一定相关性,即数据在时间和空间上具有相关性的特点。

2.预测编码基本思想

预测编码是利用相邻像素的相关性预测当前像素的值进行的编码。其编码思路是:利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差(预测误差)进行量化编码。如果预测比较准确,那么误差信号就会很小。因此,在同等精度要求的条件下,可用较少的数码表示差值,从而达到了压缩数据的目的。

预测编码常用的是差分脉冲编码调制(DPCM )和自适应的差分脉冲编码调制(ADPCM )。由于声音和图像数据均由采样得到,且相邻值之间的差不会很大,可以用较少的位数来表示差值,因此适用于声音和图像数据的压缩。

3.常用的编码方案

(1)DPCM 编码

PCM (脉冲调制)编码是将原始信号先经过时间采样,然后对每一个样值进行量化后作为数字信号的输出;而在DPCM (差分脉冲调制)编码中,为了压缩传输的数码,可不对每一个样值都进行量化,而是预测下一样值,并量化实际值与预测值之间的差。解压缩时使用同样的预测器,将这一预测值与存储的已量化的差值相加,产生出近似的原始信号,从而基本恢复原始数据。一般该编码每样值可压缩到2~4bit 。其编码过程如下: a.测出像素(i ,j )及相邻像素的样值;

b.由以往3个相邻像素的样值相加得到当前像素的预测值:

),1()1,1()1,(),(321j i f a j i f a j i f a j i f -+--+-=∧

其中,1a 2a 3a 为预测系数,为待定值。若系数为常量,则为线性预测。 c.求出预测误差,并进行量化:

)],1()1,1()1,([),(),(),(),(321j i f a j i f a j i f a j i f j i f j i f j i e -+--+--=-=∧ d.由均方误差函数求出预测系数1a 2a 3a ,以得到最佳线性预测系数:

23212

2)],1()1,1()1,([),([)],(),([(j i f a j i f a j i f a j i f E j i f j i f E e -+--+--=-=∧

其中,E 是数学期望,e 2对1a 2a 3a 求偏导并令其为0,解方程得预测系数。

(2)ADPCM 编码

ADPCM (自适应差分脉冲调制)编码是根据信号分布不均匀的特点,系统具有随输入信号的变化而自动改变量化区间的大小并选择预测参数。任何一种采用自适应方法都称为ADPCM 。系统对输入信号的变化采用不同的量化区间(自适应量化):对于能量分布较大的系数分配较多的比特数,采用较小的量化步长;反之分配较小的比特数,采用较大的量化步长,从而达到压缩的目的。

(3)帧间预测编码

利用帧间的时间相关性进一步消除图像的冗余度,基于预测技术来提高动态图像的压缩比。常用的方法有运动补赏法和条件补充法。

a.运动补赏预测法:动态图像画面上运动部分在帧与帧之间必然有连续性。预测法根据这一特性,将当前的图像画面看作是前面某时刻图像的位移,位移的幅度和方向在画面上各处可不同。因此,可利用反映运动的位移信息和前面某时刻的图像来预测当前的图像。

b.运动补偿插值法:在时域中利用插值的方法进行运动的补偿是一个多分辨率技术。先以1/10s 或1/15s 时间间隔获取参考子图,然后对这两个参考子图之间的图像,按照运动的规律获得1/30s 时间间隔的各个插补子图。只要对参考子图及反映运动规律的信息进行编码,就可以得到帧频为30帧/s 的全运动视频图像。由于视频信号时域冗余度高,需要传送的附加运动校正信息非常少,因此插补运动补偿可大幅度压缩数据。

5.5变换编码的基本原理是什么?

1.变换编码基本思想

先将信号进行变换(正交矢量空间),再进行编码。如将时域信号变换到频域信号,只需振幅和频率两个参数,数据相关性减少(样值更具独立);此外,因声音、图像的大部分信号都是低频信号,在频域中信号的能量较集中,因此再对这些变换参数进行采样、量化、编码处理即可以压缩数据。

可以看出,预测编码主要是在时域进行,而变换编码则主要是在变换域上进行。变换编码只最典型的例子就是傅立叶变换,它将时域函数变换成频谱函数。变换编码常用的变换有:傅立叶变换、余弦变换、离散余弦变换(DCT )、K-L 变换、沃尔什变换等。

2.变换编码的基本过程

(1)变换:将时域信号映射到另一个变换域。

(2)变换域采样:变换后的样值具有有序性和独立性。

(3)量化编码:使数据量尽可能减少、量化失真也最小。

3.常用的编码方案

(1)K-Z 变换编码

K-Z 变换编码也称最佳变换编码。K-Z 变换是在已知输入信号矩阵的条件下,根据其协方差矩阵去寻找另一种正交变换,使变换后的协方差矩阵满足或接近为一个对角矩阵。

(2)离散余弦变换编码

离散余弦变换(DCT )编码是从快速傅立叶变换(FFT )中取实部,再利用余弦正交变换算法对不同的信号进行压缩。离散余弦变换广泛地应用在图像压缩中。

5.6分析合成编码的基本原理是什么?

1.分析合成编码基本思想

分析合成编码是通过对原始数据的分析,将其分解为一系列更适合表示的基元或从中提取若干具有更本质意义的参数,编码仅针对这些基本单元或特征参数进行。解压时则借助一定的规则或模型按一定的算法将这些基元或参数再合成逼近原始数据的数据。常用的编码量化编码、有子带编码、小波变换编码以及分析图形编码等。

2.常用的编码方案

(1)量化编码

所谓量化是把一个变量的取值范围分成有限个不重叠的、大小不一定相等的区间,并给每个区间指定一个属于该区间内的值。量化编码的基本思路是:对经过PCM数字化后的数据的多比特数表示的样本值,用较小的比特数再进行量化的过程。量化的目的是减少比特数,压缩数据量。量化处理是一个多对一的处理过程,是不可逆的过程。在量化过程中会引起量化误差(信息)的丢失。量化的方法有标量量化和矢量量化。

a.标量量化:在随机变量出现概率较高的间隔内,选取较小的间区,而在其他区域选取较大的间区,这样可以以较小的量化均方误差进行量化。量化还可根据人眼视觉特性进行,对较敏感信号分量采用较多的量化级数进行细量化,而对较迟钝的信号分量采用粗量化,这样既保证了重建图像的质量,又可大大降低压缩后的信息码率。JPEG、MPEG以及H.261中采用的都是基于视觉特性的标量量化。

b.矢量量化:是基于语意的编码。其基本思想是采用非线性量化器,对空间频率及能

量分布较大的系数分配较多的比特数,即采用较小的量化步长;反之,分配较少的比特数,即采用较大的步长,从而达到压缩的目的。

(2)子带编码

子带编码是利用带通滤波器组把信号频带分割成若干子频带,然后通过调制将各个子带搬移到零频率近似得到低通表示后,再以奈奎斯特速率分别对各子带输出采样,并将采样值进行数字编码。恢复时将各子带信号解码并重新调制回原始位置,再将所有子带输出相加就可得到接近于原始信号的波形。子带编码最早应用于音频的压缩,后来应用于图像的压缩编码。

5.7图像和视频压缩标准是什么?

1. 静态图像压缩标准

(1)JPEG标准

JPEG是联合图像专家小组(Joint Photographic Experts Group)简称,是一个面向连续色调、多级灰度、彩色或单色静态图像的国际通用压缩标准。其中,它定义了两种基本的压缩算法:一种是基于差分脉冲码调制(DPCM)的无损压缩算法;另一种是基于离散余弦(DCT)的有损算法。前者不会产生失真,但压缩比小;后者信息虽有损失,但压缩比大。该标准适用于静态图像和电视图像序列的帧内图像的压缩编码。

(2)JPE G的基本要求:

a.达到或接近当前压缩比与图像保真度的技术水平,能覆盖一个较宽的图像质量等级范围,达到“很好”到“极好”的评估。与原始图像相比,人的视觉难以区分;

b.适用于任何种类的连续色调的图像,长宽比步受限制,也不受限于景物内容、图

像复杂长度和统计特征;

c.算法的复杂程度是可控制的,其软件可在各种CPU完成,也可由硬件实现。

(3)J PEG的基本算法

a.无损压缩处理过程:采用DPCM算法

压缩后图像数据

b.有损压缩处理过程:采用DCT算法

2.动态图像压缩编码标准

(1)MPEG标准

MPEG是运动图像专家小组(Moving Pictures Experts Group)简称。是一个面向MPEG 视频(1.5Mbps)、MPEG音频(64kbps、128kbps和192Mbps)MPEG系统的国际标准。该标

准包括:

a.MPEG-1标准(

b.MPEG-2标准

c.MPEG-4标准

d.MPEG-7标准

e.MPEG-21标准(多媒体框架)

(2)MPEG的基本算法

MPEG视频是MPEG压缩标准的核心。MPEG视频压缩算法包括两种基本技术:一种是基于16*16子块的运动补赏(利用运动位移信息与前某时刻的图像对当前图像进行预测的方

法),以减少帧序列的时域冗余;另一种是基于DCT空间变换压缩,以减少帧序列的空间

冗余。

(3)H.261标准

是一个面向视频通信(电视电话、会议电视))的国际标准。该标准常称为p*64K标准,p是一个可变参数,其取值为1~30。其中p=1或p=2只能支持桌面上的面对面直观

通信,p>6时支持每秒帧数较高的活动图像的电视会议。

该编码采用混合编码方案,即基于DCT的离散余弦编码算法和带有运动预测的DPCM算法。该标准的压缩算法与MPEG压缩算法有许多共同之处,其区别仅在于:前

者的目的是适应各种信道容量的传输;而后者的目的是在狭窄的频道上实现高质量的图像

和高保真声音的传输。

5.8常用的压缩软件有哪些?

1.文件压缩软件

(1)Winzip:知名度最高、使用率最高的压缩软件。该软件界面简洁友好,特别是鼠标

右键的直觉式压缩是一大特色。

(2)WinArj:方便实用,其压缩比高于Winzip。

(3)WinRAR:也与Winzip、WinArj齐名,3种软件中压缩比最高的一种文件压缩软件。

(4)Win Pack:集各家软件之大成的全方位的压缩软件。该软件可压缩出zip、Arj、RAR

等压缩文件格式,还可将这些文件格式进行互换。

2.声音压缩软件

(1)Windows系统附件中的“录音机”:可通过设定采样频率压缩出3种不同的PCM文件。文件量最小的适合压缩说话声音。

(2)MP3 Compressor:该软件界面友好,操作简便,压缩时间短,其最大的特色是将WAV文件压缩成MP3文件后可直接在附件的“录音机”中播放。

(3)Real Encoder:可将WAV或MP3等声音文件压缩成RA(Real Audio)网上即时传输文件,需要Real Player播放。

(4)超级解霸:将WAV、MPEG文件压缩为MP3文件。

3.图像压缩软件

(1)JPGE SmartSaver:可将其他格式的图像文件压缩成最佳化的文件量较小的JPEG 文件。

(2)GIF SmartSaver:可将其他格式的图像文件压缩成最佳化的文件量较小的GIF文件。

(3) Animation SmartSaver:可将动态的GIF格式的图像文件最佳化成文件量较小的同格式文件。

4.视频压缩软件

(1)Ulead Mediostudio:可将一个未压缩的AVI文件压缩成具有压缩格式的AVI文件。当其压缩比达到1/18时,画质没有太明显的差别。

(2) Ulead MPEG Converter:可将一个AVI文件压缩成MPEG文件。当其压缩比达到1/20时画质还相当不错,但压缩时间较长。

(3)XingMPEG Encoder:可将一个AVI文件压缩成MPEG文件。

(4) Real Encoder:可将AVI视频文件压缩成RM(Real Video)网上即时传输文件,需要Real Player播放。

(5)超级解霸:可将AVI文件压缩为MPEG文件。

数据压缩技术综述

龙源期刊网 https://www.360docs.net/doc/e615114446.html, 数据压缩技术综述 作者:汪见晗 来源:《科学与财富》2016年第04期 摘要:在现今的电子信息技术领域,正发生着一场有长远影响的数字化革命。由于数字 化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,如果不对其进行有效的压缩就难以得到实际的应用。因此,数据压缩技术已成为当今数字通信、广播、存储和多媒体娱乐中的一项关键的共性技术。本文从专利文献的视角对数据压缩技术的发展进行了全面的统计分析,总结了与数据压缩相关的专利申请趋势、主要申请人分布,介绍了数据压缩技术的重点技术分支及其发展历程,并分析了全球数据压缩技术演进特点,并绘制了国内重点申请人的技术发展路线图。 关键词:数据压缩;发展路线 1 数据压缩介绍 1.1 数据压缩的分类 目前,通用的主流压缩方法分为无损压缩和有损压缩。无损压缩利用数据的统计冗余进行压缩。数据统计冗余度的理论限制为2:1到5:1,所以无损压缩的压缩比一般比较低。这类方法广泛应用于文本数据、程序和特殊应用场合的图像数据等需要精确存储数据的压缩,通常的无损压缩编码方法有香农-范诺编码,霍夫曼(Huffman)编码,算术编码,字典压缩编码等。 有损压缩方法利用了人类视觉、听觉对图像、声音中的某些频率成分不敏感的特性,允许压缩的过程中损失一定的信息。虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响较小,却换来了比较大的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩,按照应用领域来分,有损压缩编码分为图像压缩编码,视频压缩编码,音频压缩编码。 2 数据压缩专利申请数据分析 本章主要对全球和国内数据压缩专利申请情况以及国内外专利重要申请人进行分析,从中得到技术发展趋势,以及各阶段专利申请人所属的国家分布和主要申请人。其中以每个同族中最早优先权日期视为该申请的申请日,一系列同族申请视为一件申请。 2.1 全球专利申请状况 2.1.1 全球数据压缩专利申请量

多媒体技术基础(数据压缩、标准、音频、图像)作业及答案

第二章作业 作业总体要求: 1.认真独立的完成 2.让文件名重新命名为自己的学号,然后通过http://10.66.4.241提交。 一.选择题 1.下列说法中不正确的是【B】。 A.有损压缩法会减少信息量 B.有损压缩法可以无失真地恢复原始数据 C.有损压缩法是有损压缩 D.有损压缩法的压缩比一般都比较大 2.下列属于无损压缩的是【B 】。 A.WA VE文件压缩成MP3文件 B.TXT文件压缩成RAR文件 C. BMP文件压缩成JPEG文件 D.A VI文件压缩成RM文件 3.图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关, 这是【 D 】。 A. 空间冗余 B.时间冗余 C.信息熵冗余 D.视觉冗余 4.衡量数据压缩技术性能好坏的主要指标是【C】。 (1)压缩比(2)算法复杂度(3)恢复效果(4)标准化 A. (1)(3) B. (1)(2)(3) C. (1)(3)(4) D.全部 5.MPEG标准不包括下列哪些部分【C 】。 A.MPEG视频 B.MPEG音频 C.MPEG系统 D.MPEG编码 6.下列属于静态图像编码和压缩标准的是【B 】。 A.JPEG B.MPEG-1 C.MPEG-2 D.MPEG-4 7.声音信号是声波振幅随时间变化的【A 】信号. A.模拟 B.数字

C.无规律 D.有规律 8.在数字视频信息获取与处理过程中,下述顺序正确的是【A 】。 A.采样、A/D变换、压缩、存储、解压缩、D/A变换 B.采样、D/A变换、压缩、存储、解压缩、A/D变换 C.采样、压缩、A/D变换、存储、解压缩、D/A变换 D.采样、压缩、D/A变换、存储、解压缩、A/D变换 9.一般来说,表示声音的质量越高,则【C 】 A.量化位数越多和采样频率越低 B.量化位数越少和采样频率越低 C.量化位数越多和采样频率越高 D.量化位数越少和采样频率越高 10.5分钟双声道、16位采样位数、44.1kHZ采样频率声音的不压缩数据量是 【 B 】。 A. 48.47MB B. 50.47MB C. 105.84MB D. 25.23MB 11.下列采集的波形声音【 D 】的质量最好。 A、单声道,8位量化,22.05kHz采样频率 B、双声道,8位量化,44.1kHz采样频率 C、单声道,16位量化,22.05kHz采样频率 D、双声道,16位量化,44.1kHz采样频率 12.频率在20HZ-20KHZ的被称为【 A 】 A. 可听声波 B. 次声波 C.超声波 D.超音波 13.MIDI是音乐与【 A 】结合的产物. A.计算机 B.通信 C.高科技 D.通讯 14.Windows中使用录音机录制的声音文本的格式是【B 】 A. MIDI B.WA V C.MP3 D.MOD

第4章 无损数据压缩

第4章无损数据压缩 数据压缩可分成两种类型,一种叫做无损压缩,另一种叫做有损压缩。 无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。一个很常见的例子是磁盘文件的压缩。根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的1/2~1/4。一些常用的无损压缩算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv & Welch)压缩算法。 有损压缩是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。例如,图像和声音的压缩就可以采用有损压缩,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。 本章主要介绍目前用得最多和技术最成熟的无损压缩编码技术,包括包含霍夫曼编码、算术编码、RLE编码和词典编码。对于不打算开发压缩技术和编写压缩程序的读者可不必深究编译码的详细过程。 4.1 香农-范诺与霍夫曼编码 香农-范诺编码算法需要用到下面两个基本概念: 1. Entropy(熵)的概念 1.熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越 小,数学上就是概率越小。 2.某个事件的信息量用表示,其中为第个事件的概率, 2. 信源S的熵的定义 按照仙农(Shannon)的理论,信源S的熵定义为 其中是符号在S中出现的概率;表示包含在中的信息量,也就是编码 所需要的位数。例如,一幅用256级灰度表示的图像,如果每一个象素点灰度的概率均为,编码每一个象素点就需要8位。

数据压缩,算法的综述

数据压缩算法的综述 S1******* 许申益 摘要:数据压缩技术在数据通讯和数据存储应用中都有十分显著的益处。随着数据传输技术和计算机网络通讯技术的普及应用,以及在计算机应用中,应用软件的规模和处理的数据量的急剧增加,尤其是多媒体技术在计算机通讯领域中的出现,使数据压缩技术的研究越来越引起人们的注意。本文综述了在数据压缩算法上一些已经取得的成果,其中包括算术编码、字典式压缩方法以及Huffman码及其改进。 关键字:数据压缩;数据存储;计算机通讯;多媒体技术 1.引言 数据压缩技术在数据通讯和数据存储应用中都有十分显著的益处。在数据的存储和表示中常常存在一定的冗余度,一些研究者提出了不同的理论模型和编码技术降低了数据的冗余度。Huffman 提出了一种基于统计模型的压缩方法,Ziv Jacob 提出了一种基于字典模型的压缩方法。随着数据传输技术和计算机网络通讯技术的普及应用,以及在计算机应用中,应用软件的规模和处理的数据量的急剧增加,尤其是多媒体技术在计算机和通讯两个领域中的出现,使数据压缩技术的研究越来越引起人们的注意。本文综述了在数据压缩算法上的一些已经取得的成果。 本文主要介绍了香农范诺编码以及哈弗曼算法的基本思想,运用其算法的基本思想设计了一个文件压缩器,用Java 语言内置的优先队列、对象序列化等功能实现了文件压缩器的压缩和解压功能。 2数据压缩算法的分类 一般可以将数据压缩算法划分为静态的和动态的两类。动态方法又是又叫做适应性(adaptive)方法,相应的,静态方法又叫做非适应性方法(non-adaptive)。 静态方法是压缩数据之前,对要压缩的数据经过预扫描,确定出信源数据的

数据压缩的基本原理和方法(pdf 87页)

第三章多媒体数据压缩

3.1 数据压缩的 基本原理和方法

3.1 数据压缩的基本原理和方法 ?压缩的必要性 音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行存取和交换。 例如,一幅具有中等分辨率(640×480)的真彩色图像(24b/像素),它的数据量约为7.37Mb/帧,一个 100MB(Byte)的硬盘只能存放约100帧图像。若要达到每秒25帧的全动态显示要求,每秒所需的数据量为 184Mb,而且要求系统的数据传输率必须达到184Mb/s。 对于声音也是如此,若采用16b样值的PCM编码,采样速 率选为44.1kH Z ,则双声道立体声声音每秒将有176KB的 数据量。

3.1 数据压缩的基本原理和方法 ?视频、图像、声音有很大的压缩潜力 信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。 原始信源的数据存在着很多冗余度:空间冗余、时间冗余、视觉冗余、听觉冗余等。

3.1.1 数据冗余的类型 ?空间冗余:在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。 –一幅图象中同一种颜色不止一个象素点,若相邻的象素点的值相同,象素点间(水平、垂直)有冗余。 –当图象的一部分包含占主要地位的垂直的源对象时,相邻 线间存在冗余。

3.1.1 数据冗余的类型 ?时间冗余:时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。 –音频的前后样值之间也同样有时间冗余。 –若图象稳定或只有轻微的改变,运动序列帧间存在冗余。

多媒体数据压缩技术综述

南昌大学研究生(工程硕士)2006~2007学年第二学期 期末考试试卷 课程名称:《多媒体技术》专业:软件工程 学生姓名:学号:C2007271 学院:信息工程学院得分: 任课教师签:洪春勇时间:2007.8 多媒体数据压缩技术综述 摘要:本文侧重介绍多媒体各种数据类型和数据描述,讨论数据

压缩技术在各种媒体数据上的应用及发展趋势。 关键词:多媒体数据、数据压缩、JPEG、MPEG-4、发展趋势、一、引言 多媒体在我国的定义是:能对多种载体(媒介)上的信息和多种存储体(媒介)上的信息进行处理的技术。多媒体传统关键技术主要集中在以下四类中:数据压缩技术、大规模集成电路(VLSI)制造技术、大容量的光盘存储器(CD-ROM)、实时多任务操作系统。因为这些技术取得了突破性的进展,多媒体技术才得以迅速的发展。网络技术的发展使多媒体技术的应用空间得到了快速拓展。但是网络现状的局限性也使得各种多媒体技术应用受到制约,因此对于多媒体数据的压缩技术显得非常重要和关键。 二、多媒体数据类型及其数据描述 (一)多媒体数据类型 1.文字 文字是人与计算机之间进行信息交换的主要媒体。在计算机发展的早期,比较实用的终端为一般文字终端,在屏幕上显示的都是文字信息。由于人们在现实生活中用语言进行交流,所以开始时文字终端比较流行,但是后来出现了图形、图像、声音等媒体,这样也就相应地出现了多种终端设备。在现实世界中,文字是人们进行通信的主要形式,文字包括西文与中文。在计算机中,文字用二进制编码表示,即使用不同的二进制编码来代表不同的文字。

2.音频 音频(Audio)指的是20HZ~20kHz的频率范围,但实际上“音频”常常被作为“音频信号”或“声音”的同义语,是属于听觉类媒体,主要分为波形声音、语音和音乐。 3.视觉媒体 能够利用视觉传递信息的媒体都是视觉媒体。位图图像、矢量图像、动态图像、符号等都是视觉媒体。 4.动画 动画是指运动的画面,动画在多媒体中是一种非常有用的信息交换工具。计算机动画的研究始于20世纪60年代初期。1963年Bell实验室制作了第一部计算机动画片。最初主要集中在二维动画的研制,作为示教和辅助制作传统动画片之用。三维计算机动画的研究始于20世纪70年代初,但真正进入实用化还是80年代中后期。随着具有实时处理能力的超级图形工作站的出现,以及三维造型技术、真实感图形生成技术的迅速发展,推出了一些可生成具有高逼真度视觉效果的实用化、商品化的三维动画系统。20世纪90年代初,计算机动画技术成功地应用于电影特技,取得了出色的成就,由此可见计算机动画技术的重要意义。(二)多媒体数据的描述 1.音频文件 在多媒体声音处理技术中,最常见的几种声音存储格式是:WAVE波形文件,MIDI音乐数字文件和目前非常流行的MP3

无损压缩算法的比较和分析

Adaptive-Huffman-Coding 自适应霍夫曼编码 压缩比:1.79 分析: 霍夫曼算法需要有关信息源的先验统计知识,而这样的信息通常很难获得,即使能够获得这些统计数字,符号表的传输仍然是一笔相当大的开销。 自适应压缩算法能够解决上述问题,统计数字是随着数据流的到达而动态地收集和更新的。概率再不是基于先验知识而是基于到目前为止实际收到的数据。随着接收到的符号的概率分布的改变,符号将会被赋予新的码字,这在统计数字快速变化的多媒体数据中尤为适用。 Lempel-Ziv-Welch 基于字典的编码 压缩比:1.86 分析: LZW算法利用了一种自适应的,基于字典的压缩技术。和变长编码方式不同,LZW使用定长的码字(本次实验使用12位定长码字)来表示通常会在一起出现的符号/字符的变长的字符串。 LZW编码器和解码器会在接受数据是动态的创建字典,编码器和解码器也会产生相同的字典。 编码器的动作有时会先于解码器发生。因为这是一个顺序过程,所以从某种意义上说,这是可以预见的。

算术编码(arithmetic coding) 压缩比:2 分析: 算术编码是一种更现代化的编码方法,在实际中不赫夫曼编码更有效。 算术编码把整个信息看作一个单元,在实际中,输入数据通常被分割成块以免错误传播。 算术编码将整个要编码的数据映射到一个位于[0,1)的实数区间中。并且输出一个小于1同时大于0的小数来表示全部数据。利用这种方法算术编码可以让压缩率无限的接近数据的熵值,从而获得理论上的最高压缩率。 比较分析: 一般来说,算术编码的性能优于赫夫曼编码,因为前者将整个消息看作一个单元,而后者受到了必须为每一个符号分配整数位的限制。 但是,算术编码要求进行无限精度的实数运算,这在仅能进行有限精度运算的计算机系统是无法进行的。随着研究的深入,有学者提出了一种基于整数运算的算术编码实现算法。在编码和解码的过程还需要不时的调整区间大小,以免精度不足,加大了实现的难度。 在3种无损压缩算法中,LZW算法相对来说,实现最为简单,但其压缩效果要在数据源足够大的时候,才能显现出来。

多媒体数据压缩实验报告

多媒体数据压缩实验报告 篇一:多媒体实验报告_文件压缩 课程设计报告 实验题目:文件压缩程序 姓名:指导教师:学院:计算机学院专业:计算机科学与技术学号: 提交报告时间:20年月日 四川大学 一,需求分析: 有两种形式的重复存在于计算机数据中,文件压缩程序就是对这两种重复进行了压 缩。 一种是短语形式的重复,即三个字节以上的重复,对于这种重复,压缩程序用两个数字:1.重复位置距当前压缩位置的距离;2.重复的长度,来表示这个重复,假设这两个数字各占一个字节,于是数据便得到了压缩。 第二种重复为单字节的重复,一个字节只有256种可能的取值,所以这种重复是必然的。给 256 种字节取值重新编码,使出现较多的字节使用较短的编码,出现较少的字节使用较长的编码,这样一来,变短的字节相对于变长的字节更多,文件的总长度就会减少,并且,字节使用比例越不均

匀,压缩比例就越大。 编码式压缩必须在短语式压缩之后进行,因为编码式压缩后,原先八位二进制值的字节就被破坏了,这样文件中短语式重复的倾向也会被破坏(除非先进行解码)。另外,短语式压缩后的结果:那些剩下的未被匹配的单、双字节和得到匹配的距离、长度值仍然具有取值分布不均匀性,因此,两种压缩方式的顺序不能变。 本程序设计只做了编码式压缩,采用Huffman编码进行压缩和解压缩。Huffman编码是一种可变长编码方式,是二叉树的一种特殊转化形式。编码的原理是:将使用次数多的代码转换成长度较短的代码,而使用次数少的可以使用较长的编码,并且保持编码的唯一可解性。根据 ascii 码文件中各 ascii 字符出现的频率情况创建 Huffman 树,再将各字符对应的哈夫曼编码写入文件中。同时,亦可根据对应的哈夫曼树,将哈夫曼编码文件解压成字符文件. 一、概要设计: 压缩过程的实现: 压缩过程的流程是清晰而简单的: 1. 创建 Huffman 树 2. 打开需压缩文件 3. 将需压缩文件中的每个 ascii 码对应的 huffman 编码按 bit 单位输出生成压缩文件压缩结束。

压缩技术

压缩技术Compression Techniques基本的压缩技术有: 空格压缩(Null Compression) 将一串空格用一个压缩码代替,压缩码后面的数值代表空格的个数。 游长压缩(Run-Length Compression)它是空格压缩技术的扩充,压缩任何4个或更多的重复字符的串。该字符串被一个压缩码、一个重复字符和一个代表重复字符个数的值所取代。关键字编码(Key-word encoding)创建一张由表示普通字符集的值所组成的表。频繁出现的单词如for、the或字符对如sh、th,被表示为一些标记(token),用来保存或传送这些字符。 哈夫曼统计方法(Huffman statistical method)这种压缩技术假定数据中的字符有一个变化分布,换句话说,有些字符的出现次数比其余的多。字符出现越频繁,用于编码的位数就越少。这种编码方案保存在一张表中,在数据传输时,它能被传送到接收方调制解调器使其知道如何译码字符。 因为压缩算法是基于软件的,所以实时环境中,存在着额外开销,会引起不少问题。而文件备份、归档过程中的压缩不会有什么问题。使用高性能的系统有助于消除大部分的额外开销和性能问题。另外,压缩消除了文件的可移植性,除非解压缩软件也与文件一起传送。 注意,有些文件已经被压缩,进一步的外部压缩不会有任何好处,一些图形文件格式,如标签映象文件格式(TIFF),就已经包含了压缩。 存储系统压缩Storage System Compression存储系统压缩 在讨论文件存储的压缩算法之前,应该明确文件压缩不同于磁盘编码。磁盘编码通常由磁盘驱动器把更多的数字1和0写到磁盘的物理表面上。文件压缩把文件中的字符和位串挤压到更小的尺寸。它在文件信息传送到硬盘驱动器的写头之前由软件完成。现代的使用编码的硬盘驱动器只是从CPU接收1和o的位流,并且把它们压挤到比没有使用编码小得多的空间中。磁盘编码简单讨论到这儿,下面将着重讨论文件压缩。 磁盘记录系统如硬盘驱动器通过改变磁盘表面的磁场来记录信息。两种可能状态间的磁场变化称为磁通翻转(flux transition)。简单地说,磁通翻转代表数字1,磁通不翻转代表数字0。编码提供了一种方法使每个磁通翻转代表更多数字信息。改进调频制 MFM(Modified frequency modulation)将一个磁通翻转表示多个1,将磁通不翻转表示多个0。编码技术包括下述几种。 游长受限码(Run Length limited(RLU))把位组合格式表示为代码,可以用较少的磁通翻转来存储。与MFM相比,存储容量提高了50%。 改进的游长受限码(Advanced run length limited(ARLL) 通过把位组合格式转换成能用四倍密度磁通翻转来存储的代码,从而把MFM的记录密度翻了一倍。 因为磁盘编码是由硬盘驱动器在硬件级自动处理的,这里没有必要进一步讨论。当你购买一个硬盘驱动器,它使用一种编码方案而获得一定的容量,但是只要驱动器的容量满足你的要求,购买后,就不必关心它的编码方案了。 文件压缩文件压缩的实现有几种方式,提供的各种工具使你能每次压缩一个文件,或压缩一组文件。一组文件能压缩成单个文件,更易于传送到其它用户,解压缩工具把文件解开。一个流行的共享文件压缩工具称为PKZIP(威斯康辛州Glendale的PKWARE公司),

数据压缩

数据压缩浅述 数据压缩是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存 储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织,减少数据的 冗余和存储的空间。数据压缩包括有损压缩和无损压缩。 例如,如果我们将“compression”编码为“comp”那么这篇文章可以用较少的数据 位表示。一种流行的压缩实例是许多计算机都在使用的ZIP 文件格式,它不仅仅提供 了压缩的功能,而且还作为归档工具(Archiver)使用,能够将许多文件存储到同一个文件中。 无损压缩算法通常利用了统计冗余,这样就能更加简练地、但仍然是完整地表示发送 方的数据。 如果允许一定程度的保真度损失,那么还可以实现进一步的压缩。例如,人们看图画 或者电视画面的时候可能并不会注意到一些细节并不完善。同样,两个音频录音采样 序列可能听起来一样,但实际上并不完全一样。有损压缩算法在带来微小差别的情况 下使用较少的位数表示图像、视频或者音频。 一些机制是可逆的,这样就可以恢复原始的数据,这种机制称为无损数据压缩;另外 一些机制为了实现更高的压缩率允许一定程度的数据损失,这种机制称为有损数据压缩。 事实上,多媒体信息存在许多数据冗余。例如,一幅图像中的静止建筑背景、蓝天和 绿地,其中许多像素是相同的如果逐点存储,就会浪费许多空间,这称为空间冗余。 又如,在电视和动画的相邻序列中,只有运动物体有少许变化,仅存储差异部分即可,这称为时间冗余。此外还有结构冗余、视觉冗余等,这就为数据压缩提供了条件。 总之,压缩的理论基础是信息论。从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本 质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。 许多无损数据压缩系统都可以看作是四步模型,有损数据压缩系统通常包含更多的步骤,例如它包括预测、频率变换以及量化。? 无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与 原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。一 个很常见的例子是磁盘文件的压缩。根据目前的技术水平,无损压缩算法一般可以把

《数据压缩技术》教学设计

数据压缩技术 一、课程标准中的相关内容 1.认识多媒体技术对人类生活、社会发展的影响 2.初步了解多媒体信息采集、加工原理 3.掌握应用多媒体技术促进交流并解决实际问题的思想与方法 二、教学目标 1.知识与技能 ①理解压缩的含义 ②理解实现数据压缩的条件 ③分别了解无损压缩和有损压缩 ④了解无损压缩的简单原理 ⑤初步掌握二叉树编码 2.过程与方法 ①通过阅读、观察、探索等方式理解数据压缩技术 ②设计一系列渐进式问题引导学生自主探究。 3.情感态度与价值观 ①理解和领悟交流的乐趣 ②培养分析能力和信息归纳能力 ③加深对本学科的技术分支认识 三、学生分析 本课的教学对象是高中一年级的学生。学生通过在初中阶段的系统学习,已经地掌握了一定信息处理能力,如文本处理,图像处理,压缩处理等,但大部分学生对此多局限于操作层面,与原理上的理解认知并不同步。特别是对于技术层面较高的知识,学生之间的差异就更大了。本课时对操作和理解原理能力同步性要求较高,为了让学生能够顺利的完成任务,获得成就感,任务的设计必须有一定的层次关系,且有充足的学习资源配套使用。 四、教材分析

本内容选自选修2《多媒体技术应用》第3.2.6节《数据压缩技术》(P46)。高中阶段的课程,尤其是选修模块,较初中阶段更强调理论与实践的结合——已不是单纯的熟练操作,还应从原理上去把握技术的实质,这也体现了课标中“原理性”的要求。 对于数据压缩技术,其实很多学生使用计算机的时候都在不知不觉中享受着它带来的便利,只是他们对此并没有足够的认识而已。课本对数据压缩技术的介绍概括性较强。如果仅仅照本宣科的话,学生的理解是有一定困难的,也容易让他们对原理性的知识产生抗拒感。经过对教材的多次梳理,我确定了教学的重点为数据压缩技术的概念、类型和实现条件;难点为二叉树编码的原理。 五、教学重点难点 1.教学重点: ①压缩的概念与实现条件 ②压缩的两种基本类型——无损压缩和有损压缩 2.教学难点: ①理解压缩实现的原理 ②初步掌握二叉树编码 六、教学策略 新课程标准中特别强调从问题解决出发,让学生亲历处理信息、开展交流、相互合作的过程。特别强调结合学生的生活和学习实际设计问题,让学生在活动过程中掌握应用信息技术解决问题的思想和方法,同时鼓励学生将所学的信息技术积极应用到生产、生活乃至技术革新等实践活动中。本节主要采用“问题解决”的教学模式。“问题解决”教学模式是指依据教学内容和要求,由教师创设问题情境,以问题的发现、探究和解决来激发学生求知欲和主体意识,培养学生的实践和创新能力的一种教学模式。其中,教师创设问题情境是教学设计的中心环节,即围绕某一“问题”进行渐进式的、全方位的设问。流程如下图所示

数据压缩原理

AIX 上总有一种压缩方式适合你 当今世界每天产生大量的数据,有些数据我们需要进行压缩,压缩数据的好处不言而喻:节省空间;方便传输;加密保护等等。很多压缩工具应运而出,每种工具都有自己的特点。对于AIX 平台上的压缩方法也很多compress、pack、gzip、pax、tar 等等。本文将首先简单介绍一下压缩的基本原理然后详细介绍AIX 平台的常用压缩工具并针对它们各自的特色进行比较,让读者对对AIX 平台的压缩有针对性的认识,从而能够根据不通的需要选择合适的压缩工具。 数据压缩的原理 数据压缩是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间。数据压缩包括有损压缩和无损压缩。无损压缩是可逆的;有损压缩是不可逆的。 计算机处理信息是以二进制数(0 和1)的形式表示的,压缩软件把二进制信息中相同的字符串以特殊字符标记起来,从而实现缩小文件大小来达到压缩的目的。压缩的理论基础是信息论。从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。 数据压缩的硬件和软件工具也非常多,本文将针对AIX 平台常见的几种数据压缩工具进行介绍和比较并提供常用的示例进行解说,希望您能从中选择合适的压缩工具进行压缩。 AIX 平台上,通常我们看到的 .Z .gz .z .ar .tar 后缀的文件都是压缩文件。通过compress 可以生 成 .Z 压缩文件,通过compress、uncompress、gzip 可以解压 .Z 格式的压缩文件;通过gzip 可以生成 .gz 压缩文件,通过gzip 可以解压 .gz 格式的压缩文件;通过pack 可以生成 .z 压缩文件,通过unpack、gzip 可以解压 .z 格式的压缩文件;通过pax 可以生成 .ar 压缩文件,通过pax 可以解压 .ar 格式的压缩文件;通过pax、tar 可以生成 .tar 压缩文件,通过pax、tar、untar、可以解压 .tar 格式的压缩文件。图 1 描述了各种类型文件的压缩及解压可以选择的AIX 工具。 图 1. 不同文件类型的压缩及解压

第五讲 数据压缩技术基础

第五讲数据压缩技术基础 5.1数据压缩的技术指标是什么? 1.数据压缩的目的 通过压缩手段把数据量压下来以压缩形式存储和传输,这样既节约了空间,又提高了传输速率,同时也使计算机可实时处理音频视频信息,以保证播放出高质量的音频、视频节目称为可能。 对图像的压缩编码有多种方法。如亚采样编码思想:一组像素可用一个像素表示以达到压缩图像存储容量。 又如游程编码思想:对黑白图像的编码,可将每行的像素分为白段、黑段、白段、黑段、白段…后,每段像素采用其长度(计数)表示:计数1,计数2,计数3,计数4,计数5,计数6…。实际上,一个好的编码系统都是采用多种算法、多次处理而成的。 2.数据压缩的基本理论 数据压缩是通过去除多媒体中冗余数据可大大减少原始数据量,从而使数据量得到压缩。信息论认为:若信源编码的熵(entropy)大于信源的实际熵,则该信源一定存在冗余。去除冗余不会减少信息量,仍可原样恢复数据;但若减少了熵,则数据不能完全恢复。不过在允许的范围内损失一定的熵,数据可得到近似的恢复。 所谓“熵”,原指热能除以温度所得的商,即热量转化为功的程度。这里是指信源发 出任意一个随机变量的平均信息量。所谓“信息量”是指从N个相等可能事件中选出一 个事件所需的信息度量。 3.原始数据的冗余类型 (1)空间冗余:同一帧画面中,规则景物和规则背景的表面各采样点的颜色之间存在 空间连贯性。 (2)时间冗余:在图像序列中,相邻帧图像之间同一场景所包含背景和移动物体具有 共同性。 (3)结构冗余:图像的像素值存在明显的分布模式结构产生的数据冗余。 (4)知识冗余:某些规律性结构可通过先验知识和背景知识得到的冗余。 (5)视觉冗余:人眼的视觉系统对图像场视觉的敏感和不敏感同等对待而产生了更多 数据冗余。 (6)区域相似性冗余:图像中的两个或多个区域所对应的像素值具有相似性使产生的 数据重复存储 (7)纹理的统计冗余:图像纹理在统计上服从某一分布规律的冗余。 4.压缩比 压缩比(%)=压缩后的图像数据量/ 压缩前的图像数据量 若原数字文件数据容量为100MB,经压缩后的数据容量为50MB,则图像压缩比为50%。 显然,压缩比越小,压缩后的图像文件数据量也越小,图像的质量有可能损失越多。实际 上,图像的压缩效果不但与压缩前的图像效果有关,也与采用的压缩方法有关。 5.数据压缩的技术指标 (1)压缩比:压缩前、后所需的信息存储量之比要大。

用C++实现数据无损压缩、解压(使用LZW算法)

用C++实现数据无损压缩、解压(使用LZW算法) 小俊发表于 2008-9-10 14:50:00 推荐 LZW压缩算法由Lemple-Ziv-Welch三人共同创造,用他们的名字命名。LZW就是通过建立一个字符串表,用较短的代码来表示较长的字符串来实现压缩。LZW压缩算法是Unisys的专利,有效期到2003年,所以对它的使用是有限制的。字符串和编码的对应关系是在压缩过程中动态生成的,并且隐含在压缩数据中,解压的时候根据表来进行恢复,算是一种无损压缩。 个人认为LZW很适用于嵌入式系统上。因为:1、压缩和解压速度比较快,尤其是解压速度;2、占用资源少;3、压缩比也比较理想;4、适用于文本和图像等出现连续重复字节串的数据流。 LZW算法有一点比较特别,就是压缩过程中产生的字符串对应表,不需要保存到压缩数据中,因为这个表在解压过程中能自动生成回来。 LZW算法比较简单,我是按照这本书上写的算法来编程的:

以下是源代码:

class LZWCoder { private: struct TStr { char *string; unsigned int len; }; TStr StrTable[4097]; unsigned int ItemPt; unsigned int BytePt; unsigned char BitPt; unsigned char Bit[8]; unsigned char Bits; unsigned int OutBytes; void InitStrTable(); void CopyStr(TStr *d, TStr s); void StrJoinChar(TStr *s, char c); unsigned int InStrTable(TStr s); void AddTableEntry(TStr s); void WriteCode(char *dest, unsigned int b); unsigned int GetNextCode(char *src); void StrFromCode(TStr *s, unsigned int c); void WriteString(char *dest, TStr s); public: unsigned int Encode(char *src, unsigned int len, char *dest); unsigned int Decode(char *src, unsigned int *len, char *dest); LZWCoder(); ~LZWCoder(); }; void LZWCoder::InitStrTable() { unsigned int i; for(i = 0; i < 256; i ++) { StrTable[i].string = (char *)realloc(StrTable[i].string, 1); StrTable[i].string[0] = i; StrTable[i].len = 1; } StrTable[256].string = NULL; StrTable[256].len = 0; StrTable[257].string = NULL; StrTable[257].len = 0;

数据压缩技术技术发展的现状及趋势

数据压缩技术技术发展的现状及趋势 摘要:由于数字化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,如果不对其进行有效的压缩就难以得到实际的应用。因此,数据压缩技术已成为当今数字通信、广播、存储和多媒体娱乐中的一项关键的共性技术。 关键字:数据压缩现状趋势 Abstract: As digital multimedia information, especially digital video, audio signals particularly large amount of data, if not its effective compression can hardly be practical application. Therefore, the data compression technology has become the digital communication, broadcasting, storage, and multimedia entertainment in a key common technologies. Keywords: data compression Status Trend 一.数据压缩的概念及现状 数据压缩,通俗地说,就是用最少的数码来表示信号,其作用是:能较快地传输各种信号。 对于数据压缩技术而言,最基本的要求就是要尽量降低数字化的在码事,同时仍保持一定的信号质量。不难想象,数据压缩的方法应该是很多的,但本质上不外乎上述完全可逆的冗余度压缩和实际上不可逆的嫡压缩两类。冗余度压缩常用于磁盘文件、数据通信和气象卫星云图等不允许在压缩过程中有丝毫损失的场合中,但它的压缩比通常只有几倍,远远不能满足数字视听应用的要求。在实际的数字视听设备中,差不多都采用压缩比更高但实际有损的媳压缩技术。 数据压缩主要分为2种: 1.数据中间常存在一些多余成分,既冗余度。如在一份计算机文件中,某些符号会重复出现、某些符号比其他符号出现得更频繁、某些字符总是在各数据块中可预见的位置上出现等,这些冗余部分便可在数据编码中除去或减少。冗余度压缩是一个可逆过程,因此叫做无失真压缩。 2.数据中间尤其是相邻的数据之间,常存在着相关性。如图片中常常有色彩均匀的背影,电视信号的相邻两帧之间可能只有少量的变化影物是不同的,声音信号有时具有一定的规律性和周期性等等。因此,有可能利用某些变换来尽可能地去掉这些相关性。但这种变换有时

多媒体数据压缩编码的国际标准

第四章多媒体数据压缩编码技术 考核目的: 考核学生对多媒体数据压缩编码的基本原理和算法、数据压缩编码的分类和方法、多媒体数据压缩编码的国际标准等内容的理解和掌握。 考核的知识点: 什么是多媒体数据压缩、为什么信息能被压缩、常用的压缩编码和算法(统计编码、预测编码、变换编码)、多媒体数据压缩编码的国际标准JPEG、MPEG-1等内容。 考核要求: 掌握:数据压缩编码的方法、常用的压缩编码和算法、JPEG的原理和实现技术。 理解:量化的原理和量化器的设计、MPEG-1的原理和实现技术。 了解:其它的国际标准等。 4.1 多媒体数据压缩编码的重要性和分类 一.多媒体数据压缩编码的重要性 多媒体信息传送面临的最大难题是海量数据存储与传送电视信号数字化后的数据量问题,数据压缩是解决问题的重要途径。 二.多媒体数据压缩的可能性 1.空间冗余 2.时间冗余 3.信息熵冗余 ●信息量:指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。 ●信息熵:指一团数据所带的信息量,平均信息量就是信息熵(entropy)。 4.结构冗余 图象有非常强的纹理结构。 5.知识冗余 图像的理解与某些基础知识有关。 6.视觉冗余 视觉冗余是非均匀、非线性的。 三.多媒体数据压缩方法的分类

1.按压缩方法分: (1). 有失真压缩 (2). 无失真压缩 2.编码算法原理分: (1)预测编码:PCM、DPCM、ADPCM等 (2)变换编码:傅里叶(DFT)、离散余弦(DCT)、离散正弦(DST)等 (3)统计编码:哈夫曼、算术等 (4)静图像编码:方块、逐渐浮现等 (5) 电视编码:幀内预测、幀间编码等 (6) 其他编码:矢量量化、子带编码等 4.2量化 一.量化原理 量化处理是使数据比特率下降的一个强有力的措施。 数据压缩编码中的量化处理,不是指A/D变换后的量化,而是指以PCM码作为输入,经正交变换、差分、或预测处理后,熵编码之前,对正交变换系数、差值或预测误差的量化处理。 量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,希望量化后的数值用较少的比特数便可表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。 量化处理总是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处理中有信息丢失,或者说,会引起量化误差(量化噪声)。 二.标量量化器的设计 1.量化器的设计要求 ●给定量化分层级数,满足量化误差最小。 ●限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。 三.量化方法: ●标量量化: 对于PCM数据,一个数一个数地进行量化叫标量量化。 分为:均匀量化、非均匀量化和自适应量化。 四.矢量量化

3、《压缩技术》选择题

《压缩技术》选择题 ()1.二进制数(1111001)2转换成十六进制数是 (A)F1H (B)79H (C)1FH (D)97H ()2、图像文件“风景.bmp”的属性窗口如图所示: 该图像的存储容量约为 (A)2MB (B)938KB (C)1.6MB (D)5MB ()3、一段图像分辨率为1024×768、32位色彩的视频影像,若该视频以25帧/秒的速度播放,则每秒钟播放的数据量约为 (A)24M字节(B)75M字节(C)600M字节(D)800M字节 ()4、在计算机内部,用来传送、存储、加工处理的数据或指令(命令)都是采用(A)ASCII码(B)GB2312码(C)二进制码(D)GBK码 ()5. 用UltraEdit软件观察字符内码,结果如下图所示, 则其中内码"31 30"表示的字符为 (A)2010 (B)20 (C)10 (D)暑 ()6.用UltraEdit软件观察字符内码,结果如图所示: 则字符"瞧瞧你"的内码为 (A)C7 C6 C7 C6 CE D2 (B)C7 C6 CE D2 C7 C6 (C)C7 C6 C7 C6 C4 E3 (D)C7 C6 C4 E3 C7 C6 ()7.小明和小张在讨论WAVE格式音频可以被压缩成MP3格式音频的原因,各自说出了很多理由: ①数据本身存在可被压缩的冗余因素②数据压缩的容量是无限制的 ③数据压缩是为了让数据文件更大④数据压缩允许有少量的失真 ⑤数据压缩是为了让音频文件音质更好 上述理由正确的是 (A)②⑤(B)①④(C)②③(D)③⑤ ()8.下列属于静态图像编码和压缩标准的是 (A)JPEG (B)MPEG-1 (C)MPEG-2 (D)MPEG-4

常用工具软件 多媒体数据压缩及编码技术

常用工具软件多媒体数据压缩及编码技术 在计算机获取原始的声音、图形图像以及视频影像时,其数据量是十分庞大的。如果数据不进行压缩处理,存放该数据文件时将十分困难,并且即使存储下来也是比较浪费存储介质的。例如,一张600MB的光盘也只能存储几十秒的真彩视频影像。 因此,用户需要对所获取的声音、图形图像以及视频影像数据进行压缩。其压缩主要包含下列两种方法。 ●无损压缩 多媒体原始信源数据存在大量的冗余,如动态视频图像帧内像素之间的空间相关性和帧与帧之间的时间相关性都很大,故而原始信源数据有很多的冗余,采用去掉冗余的压缩方法。 ●有损压缩 利用人的视觉对于边缘急剧变化不敏感和对图像的亮度信息敏感、对颜色分辨率弱的特点以及听觉只能听到20Hz~20KHz等特征实现数据压缩,舍弃一些非主要的细节,从而使由压缩数据恢复的图像、声音仍有令人满意的质量的方法。 数据压缩技术的研究已经有许多年了,从PCM编码理论开始,到现在的ADPCM、JPEG、MPEG-1、MPEG-2、H.261等,已经产生了多种针对不同用途的压缩算法、实现手段和相关的数字硬件及软件。目前,被国际社会广泛认可和应用的通用压缩编码标准大致有如下4种。 ●H.261编码 由CCITT(国际电报电话咨询委员会)通过的用于音频视频服务的视频编码解码器(也称Px64标准),它使用两种类型的压缩:一帧中的有损压缩(基于DCT)和用于帧间压缩的无损编码,并在此基础上使编码器采用带有运动估计的DCT和DPCM(差分脉冲编码调制)的混合方式。这种标准与JPEG及MPEG标准间有明显的相似性,但关键区别是它是为动态使用设计的,并提供完全包含的组织和高水平的交互控制。 ●JPEG编码 JPEG(全称是Joint Photogragh Coding Experts Group(联合照片专家组))是一种基于DCT 的静止图像压缩和解压缩算法,它由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同制定,并在1992年后被广泛采纳后成为国际标准。 它是把冗长的图像信号和其它类型的静止图像去掉,甚至可以减小到原图像的百分之一(压缩比100:1)。但是在这个级别上,图像的质量并不好;压缩比为20:1时,能看到图像稍微有点变化;当压缩比大于20:1时,一般来说图像质量开始变坏。 ●MPEG编码 MPEG是Moving Pictures Experts Group(动态图像专家组)的英文缩写,实际上是指一组由ITU和ISO制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,它提供的压缩比可以高达200:1,同时图像和音响的质量也非常高。现在通常有三个版本:MPEG-1、MPEG-2、MPEG-4以适用于不同带宽和数字影像质量的要求。它的三个最显著优点就是兼容性好、压缩比高(最高可达200:1)、数据失真小。 ●DVI编码 DVI视频图像的压缩算法的性能与MPEG-1相当,即图像质量可达到VHS的水平,压缩后的图像数据率约为1.5Mb/s。为了扩大DVI技术的应用,Intel公司最近又推出了DVI算法的软件解码算法,称为Indeo技术,它能将为压缩的数字视频文件压缩为五分之一到十分之一。

相关文档
最新文档