多媒体应用-多媒体数据压缩与编码技术

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§ 信源解码器仅包含两部分:一个符号解 码器和一个反向转换器。这些模块的运 行次序与编码器的符号编码器和转换模 块的操作次序相反。
n 如果输出图象与输入图象完全一致,系 统就是无误差或具有信息保持的编码系统。
信源编码器与信源解码器
信源编码器的任务是减少或消除图象中的 编码冗余、像素间冗余或心理视觉冗余。
n 常用的准则可分为两大类:客观保真度准则和主 观保真度准则。
客观保真度准则
¬ 最常用的客观保真度准则是原图像和解码图像 之间的均方根误差和均方根信噪比两种。
¬令f(x,y)代表原图像, 代表对f(x,y)先压缩又
解压缩后得到的f(x,y)的近似,对任意x和y, f(x,y)

之间的误差定义为:
若f(x,y)和
量化方法和量化特性
均匀量化
标量量化 非均匀量化
n 量化方法
自适应量化
矢量量化
n 标量量化:对PCM数据一个数一个数地 进行量化。
n 矢量量化:对这些数据先分组, 每组 K 个数构成一个 K 维矢量,然后以矢量为 单位,逐个矢量进行量化。可有效提高 压缩比。
编码器
n 编码器的输入为wi,若wi可取M个值w1,w2 ,…,wm 之一, 其输出码应该是二进制码字ci。
像素值相同或相近,从而产生的数据重复性存 储,这就是图像区域的相似性冗余。 n 7.纹理的统计冗余
有些图像纹理尽管不严格服从某—分布规 律,但是它在统计的意义上服从该规律。利用 这种性质也可以减少表示图像的数据量,所以 我们称之为纹理的统计冗余。
4.2 编码模型
n 4.2.1 信源编码器和信源解码器 n 4.2.2 信道编码器和解码器
4.4.1 哈夫曼(Huffman)编码
Ø 在一幅图像中,有些图像数据出现的频率高, 有些图像数据出现的频率低。
Ø 如果对那些出现频率高的数据用较少的位数来 表示,而出现频率低的数据用较多的位数来表 示,这样从总的效果来看还是节省了存储空间。
Ø 这种编码思想首先由香农(Shannon)提出, 哈夫曼后来对它提出了改进的编码方法,用这 种方法得到的编码称为Huffman编码。
这是静态图像存在的最主要的一种数据冗 余。一幅图像记录了画面上可见景物的颜色。 同一景物表面上各采样点的颜色之间往往存在 着空间连贯性,从而产生了空间冗余。
4.1.2 编码压缩的可能性
n 2.时间冗余 在视频的相邻帧间,往往包含相同的背景
和移动物体,因此,后一帧数据与前一帧数据 有许多共同的地方,即在时间上存在大量的冗 余。 n 3.结构冗余
n 编码器不会引入误差。 n 设计编码器应该使M个可能输入都能分配一个
唯一的二进制码字。 n 例如,用不等长码对w1,w2,w3 分别赋予一个
码字c1=0,c2=1,c3=01, 则对于比特流0011, 既可译为:c1c1c2c2,也可译为c1c3c2,不唯一。 n 若赋予一个码字c1 =0, c2 =10, c3=11, 则对 于比特流0011,可唯一译为c1c1c3 。
n 能实用的码都应该是唯一的。
百度文库
n 信源解码器包含两个部分:符号解码器 和反向映射器。
信道 符号解码
反向映射
4.2.2 信道编码器和解码器
Ø 当信道带有噪声或易于出现错误时,信道编码 器和解码器就在整个译码解码处理中扮演了重 要的角色。
Ø 最有用的—种信道编码技术是Hamming码。该 技术基于这样的思想,即向被编码数据中加入 足够的位数以确保可用的码字间变化的位数最 小。
事实表明,人类的视觉系统对图像场的敏 感性是非均匀的和非线性的。然而,在记录原 始图像数据时,通常假定视觉系统是线性的和 均匀的,对视觉敏感和不敏感的部分同等对待, 从而产生了比理想编码更多的数据,这就是视 觉冗余。 n 6.图像区域的相同性冗余 是指在图像中的两个或多个区域所对应的所有
4.1.2 编码压缩的可能性
4.2.1 信源编码器和信源解码器
从原理来看主要分为三个阶段: Ø 第一阶段将输入数据转换为可以减少输入图像
中像素间冗余的数据的集合。 Ø 第二阶段设法去除原图象信号的相关性,例如
对电视信号就可以去掉帧内各种相关,还可以 去除帧间相关。这样有利于编码压缩。 Ø 第三阶段就是找一种更近于熵,又利于计算机 处理的编码方式。
4.3 编码压缩方法分类
常用的一些有损压缩技术包括: n 预测编码 n 变换编码 n 基于模型编码 n 分形编码 n 其他编码
4.3 编码压缩方法分类
衡量一种数据压缩技术的好坏有三 个重要的指标。
一是压缩比要大
二是实现压缩的算法要简单,压缩、解 压速度快
三是恢复效果要好
图像保真度准则
n 在图像压缩编码中,解码图像与原始图像可能 会有差异,因此,需要评价压缩后图像的质量。 描述解码图像相对原始图像偏离程度的测度一般 称为保真度(逼真度)准则。
例如,利用Hamming码将3位冗余码加到4位字上, 使得任意两个有效码字间的距离为3,则所有 的一位错误都可以检测出来并得到纠止。与4 位二进制数b3b2b1b0相联系的7位Hamming(7,4) 码字。
4.2.2 信道编码器和解码器
h1h2…h5h6h7是:
这里表示异或运算。h1,h2和h4位分别是 位字段b3b2b0,b3b1b0和b2b1b0的偶校验位。
Ø 这种编码的宗旨在于,在消息和 码字之间找到明确的一一对应关 系,以便在恢复时能准确无误地 再现出来。
Ø 最常用的方法是变长码。
4.4.1 哈夫曼(Huffman)编码
Ø 统计编码中常用的编码有Huffman码、费 诺-香浓编码、算术编码等。
Ø 1952年 Huffman 提出了对统计独立信源 能达到最小平均码长的编码方法,也即 最佳码。这种码具有即时性和唯一可译性。
传输数据量,是提高通信速度的重要手段。因 此,更要求数据量压缩。
4.1.2 编码压缩的可能性
众所周知,视频由一帧一帧的图像组成, 而图像的各像素之间,无论是在行方向还是在 列方向,都存在着一定的相关性,即冗余度。 应用某种编码方法提取或减少这些冗余度,便 可以达到压缩数据的目的。 常见的静态图像数据冗余包括: n 1.空间冗余
n 若编码结果远大于H,表明这种编码效率很低, 占用的比特数太多。
n 若编码结果使R等于或接近于H,这种状态的编 码方法称为最佳编码。
n 若要求编码结果使R<H,则必然丢失信息而引 起图像失真。这就是在允许失真条件下的一些 失真编码方法。
Ø 统计编码是根据消息出现概率的 分布特性而进行的压缩编码。
在有些图像的纹理区,图像的像素值存在 着明显的分布模式。例如,方格状的地板图案 等。我们称这种冗余为结构冗余。 n 4.知识冗余
有些图像的理解与某些知识有相当大的相 关性。例如,人脸的图像有固定的结构。这类
4.1.2 编码压缩的可能性
规律性的结构可由先验知识和背景知识得到, 我们称此类冗余为知识冗余。 n 5.视觉冗余
均为MXN,则它们之间均
方根误差erms为:
如果将 看做原始图f(x,y)和噪声信号e(x,y) 的和,那么解压图象的均方信噪比SNRms为:
如果对上式求平方根,就得到均方根信噪比。
实际使用中,常将SNRms归一化并用分贝 (dB)表示、令:
如果令: 则可得到峰值信噪比:
4.4 统计编码
Ø 统计编码属无损编码,它是根据消息出现概率 的分布特性而进行的压缩编码。
或0和1; (5)寻找从每一信源符号到概率为1处的路径,记
录下路径上的1和0; (6)对每一符号写出“1”、“0”序列(从码树的根到终
节点)。
例2
4.4.1 哈夫曼(Huffman)编码
经霍夫曼编码后,平均码长为:
=0.4×1+0.30×2+ 0.1×4+0.06×5+0.04×5 =2.20(bit)
第4章 多媒体数据压缩与编码技术
本章重点:
编码模型 编码压缩方法分类 统计编码的基本原理 预测编码的基本原理 变换编码的基本原理 视频编码的基本原理
第4章 多媒体数据压缩与编码技术
4.1 编码压缩的必要性与可能性 4.2 编码模型 4.3 编码压缩方法分类 4.4 统计编码 4.5 预测编码 4.6 变换编码 4.7 其他编码 4.8 视频编码 4.9 本章小结
Ø Huffman编码是一种变长编码。
4.4.1 哈夫曼(Huffman)编码
设信源A的信源空间为:
其中
,现用r个码符号的码符号

对信源A中的每个符号 (i
=1,2,…,N)进行编码。
编码过程如下: (1)将信源符号按概率递减顺序排列; (2)把两个最小的概率加起来,作为新符号的概率; (3)重复步骤(1)、(2),直到概率和达到1为止; (4)在每次合并消息时,将被合并的消息赋以1和0
映射
n 映射的目的是使原信号经过映射后更有 利于编码,即映射后的数据可用较少的 比特来编码。
n 如DPCM中的差分。
量化器
n 把映射后的值进行量化。 n 可以有均匀量化和非均匀量化。
数据压缩编码中的量化处理
n 不是指 A/D 变换时的量化,而是指在熵 编码之前,对该值进行的量化处理。
n 量化处理把某个范围内的一批输入,量 化到一个输出级上,因此是多对一的映 射,过程不可逆,有信息丢失,会引起 量化误差(量化噪声)。
H=
n a取2时,H的单位为比特。 a取e时,H的 单位为奈特。图像编码中a取2。一幅图 像的信息熵就是这幅图像的平均信息量, 即表示图像中各个灰度级比特数的统计 平均值。
n 等概率事件的熵最大。
n 例:设8个随机变量具有同等概率1/8, 则信息H熵为3bits
n 结论:信息熵是进行无失真编码理论的 极限。低于此极限的无失真编码方法是 不存在的。
4.2 编码模型
Ø 一个压缩系统包括两个不同的结构块:一个编 码器和一个解码器。
Ø 图像f(x,y)输入到编码器中,编码器根据输
入数据生成一组符号。通过信道进行传输之后, 将经过编码的符号送入解码器,经过重构,生 成输出图像。
4.2.1 信源编码器和信源解码器
信源编码器的任务是减少或消除输入图像 中的冗余。编码的框图如下图:
Ø 统计编码又可分为定长码和变长码。 Ø 常用的统计编码有Huffman编码、行程编码和
算术编码三种。
统计编码原理 ── 信息量和信息熵
n 一个消息的可能性越小,其信息越多; 消息的可能性越大,则信息越少。
设从 N 个数中选定任一个数 x 的概率为 P(x),假
定选定任意一个数的概率都相等,则 P(x)=─1 ,定义信
N
息量为
I(x)
=
log2N
=
-
log2
─1=
N
-
log2P(x)
=
I
[P(x)]
如果将信源所有可能事件的信息的量进行平均,就 得到了信息的“熵”(entropy), 即信源的平均信息量。
n
n
熵 H(x) = i∑=1P(xi) I [P(xi)] = - ∑i=P1(xi) log2 P(xi)
n 图象熵: 设数字图像像素灰度级集合为(W1,W2,…,WM), 其对应的概率分别为P1,P2,…,PM,则数字图像的 信息熵H为:
4.2.2 信道编码器和解码器
为了将汉明(Hamming)编码结果进行解 码,信道解码器必须为先前设立的偶校验的各 个位字段进行奇校验并检查译码值。一位错误 由一个非零奇偶校验字c4c2c1给出,这里,
4.3 编码压缩方法分类
数据压缩的目标是去除各种冗余。根据压缩后 是否有信息丢失,多媒体数据压缩技术可分为 无损压缩技术和有损压缩技术两类。 常见的无损压缩技术有: n 霍夫曼编码 n 算术编码 n 行程编码 n 词典编码
4.1 编码压缩的必要性与可能性
4.1.1 编码压缩的必要性 4.1.2 编码压缩的可能性
4.1.1 编码压缩的必要性
n 众所周知,图像量化所需数据量大。图像和视 频的庞大数据对计算机的处理速度、存储容量 都提出过高的要求。因此必须进行数据量压缩。
n 从传送的角度来看,在信道带宽、通信链路容 量一定的前提下,采用编码压缩技术,减少
n 平均码字长度 n 设k为数字图像第k个码字Ck的长度(二
进制代码的位数),其相应出现的概率 为Pk,则该数字图像所赋予的码字平均 码长R为:
R=
n 编码效率 在一般情况下,编码效率往往用下列简单
公式表示: =H/R H为信息熵,R为平均码字长度。
n 根据信息熵编码理论,可以证明在RH条件下, 总可以设计出某种无失真编码方法。
相关文档
最新文档