《多媒体技术基础》第3版第02章_数据无损压缩

合集下载

《多媒体技术》 第二讲 多媒体数据压缩技术(第3—4节)课堂笔记及练习题

《多媒体技术》 第二讲 多媒体数据压缩技术(第3—4节)课堂笔记及练习题

多媒体技术第二讲多媒体数据压缩技术(第3—4节)课堂笔记及练习题主题:第二讲多媒体数据压缩技术(第3—4节)学习时间:2016年4月11日--4月17日内容:第三节运动图像压缩标准MPEG一、MPEG标准简介MPEG标准是面向运动图像压缩的一个系列标准。

分别在1.5Mbps,10Mbps,40Mbps传输速率下对图像编码,依次命名为MPEG-1,MPEG-2,MPEG-3(被取消)。

后来又增加了MPEG-4,随后还将增加MPEG-7标准。

一个典型的MPEG-l编、解码器原型几点说明:编码部分:①视频和音频编码器分别对MPEG标准的视频和音频进行编码,产生编码图像。

这些输出一般被称为基本码流(ES);②系统编码器和复接器产生多路复合流,它包含着基本码流以及系统层编码;③多路复合而成的码流以介质特定格式存储在数字存储介质(DSM)或网络上,标准不规定介质特定格式。

解码部分:①系统解码器执行两类操作:一类是作用在整个多路复合流上的操作,称为复合流操作;另一类是作用在单个基本流上的操作,称为特定流操作;②系统解码器从输入多路复合流中抽取定时信息,并对输入流进行分流处理,输出两个基本流分别给视频和音频解码器;③视频和音频解码器分别解码输出视频和声音信号;④系统、视频、音频和介质4个解码器之间用定时信息进行同步。

二、MPEG音频MPEG音频标准的特点:①音频信号采样率可以是32kHz,44.1kHz或48kHz。

②压缩后的比特流可以按4种模式之一(单声道模式、双—单声道模式、单音频通道模式、立体声模式、联合立体声模式)支持单声道或双声道;③压缩后的比特流具有预定义的比特率之一;④MPEG音频标准提供3个独立的压缩层次,用户可在复杂性和压缩质量之间权衡选择(层1最简单,使用比特率384kbps、层2的复杂度中等,使用比特率192kbps左右、层3最复杂,但音质最佳,使用比特率64kbps);⑤编码后的比特流支持循环冗余校验CRC(cyclic redundancy check);⑥MPEG音频标准还支持在比特流中载带附加信息。

《多媒体技术》 第二讲 多媒体数据压缩技术(第1—2节)课堂笔记及练习题

《多媒体技术》 第二讲 多媒体数据压缩技术(第1—2节)课堂笔记及练习题

多媒体技术第二讲多媒体数据压缩技术(第1—2节)课堂笔记及练习题主题:第二讲多媒体数据压缩技术(第1—2节)学习时间: 4月4日--4月10日内容:第二讲多媒体数据压缩技术第一节多媒体数据和信息转换一、多媒体间的信息转换为了便于交流信息,需要对不同的媒体信息进行转换。

下表是部分媒体之间说明:*易**较困难***很困难二、多媒体数据文件格式多媒体文件的格式很多,下表介绍常用文件格式的特点和应用场合。

三、多媒体数据的信息冗余多媒体计算机系统主要采用数字化方式,对声音、文字、图形、图像、视频等媒体进行处理。

数字化处理的主要问题是巨大的数据量。

一般来说,多媒体数据中存在以下种类的数据冗余:1)空间冗余:一些相关性的成像结构在数字化图像中就表现为空间冗余。

2)时间冗余:两幅相邻的图像之间有较大的相关性,这反映为时间冗余。

3)信息熵冗余(编码冗余):信息熵是指一组数据所携带的信息量。

如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。

4)结构冗余:有些图像从大域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。

5)知识冗余:有许多图像的理解与某些基础知识有较大的相关性。

这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。

6)视觉冗余:人类视觉系统对于图像场的任何变化,并不是都能感知的。

这类冗余我们称为视觉冗余。

7)其他冗余:例如由图像的空间非定常特性所带来的冗余。

以上所讲的是多媒体数据的信息冗余。

设法去掉信号数据中的冗余,就是数据压缩。

第二节常用的数据压缩技术一、数据压缩编码方法1)根据解码后数据与原始数据是否完全一致来进行分类:① 可逆编码(无失真编码),如Huffman编码、算术编码、行程长度编码等。

② 不可逆编码(有失真编码),常用的有变换编码和预测编码。

2)根据压缩的原理进行划分:① 预测编码:它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。

多媒体技术基础第3版第2章数据无损压缩

多媒体技术基础第3版第2章数据无损压缩
*
*
2.0 数据无损压缩概述(续2)
2章 数据无损压缩
The Father of Information Theory—— Claude Elwood Shannon Born: 30 April 1916 in Gaylord, Michigan, USA Died: 24 Feb 2001 in Medford, Massachusetts, USA
统计编码
编码特性
编码方法
香农-范诺编码 霍夫曼编码 算术编码
*
*
2.2.1 统计编码——香农-范诺编码 香农-范诺编码(Shannon–Fano coding) 在香农的源编码理论中,熵的大小表示非冗余的不可压缩的信息量 在计算熵时,如果对数的底数用2,熵的单位就用“香农(Sh)”,也称“位(bit)” 。“位”是1948年Shannon首次使用的术语。例如 最早阐述和实现“从上到下”的熵编码方法的人是Shannon(1948年)和Fano(1949年),因此称为香农-范诺(Shannon- Fano)编码法
2章 数据无损压缩
02
霍夫曼(D.A. Huffman)在1952年提出和描述的“从下到上”的熵编码方法
根据给定数据集中各元素所出现的频率来压缩数据的一种统计压缩编码方法。这些元素(如字母)出现的次数越多,其编码的位数就越少
广泛用在JPEG, MPEG, H.26X等各种信息编码标准中
*
*
2.2.2 霍夫曼编码— Case Study 1 现有一个由5个不同符号组成的30个符号的字符串:BABACACADADABBCBABEBEDDABEEEBB 计算 该字符串的霍夫曼码 该字符串的熵 该字符串的平均码长 编码前后的压缩比 霍夫曼编码举例1

多媒体技术基础无损压缩

多媒体技术基础无损压缩
xp (t) x(t) p(t)
x(t) (t nT ) n
x(nT ) (t nT )
n
采样分析
原连续时间信号:x(t) X ( j )
采样函数频谱:
P( j) 2 ( k 2 )
T k
T
已采样信号的频谱:
X
P
(
j
)
1
2
X
(
j )
P(
j )
1 T
X
k
(
j(
ks
)
采样
❖此外,对同一个连续时间信号,当采样间 隔不同时也会得到不同的样本序列。
结论:没有任何条件限制的情况下,从连续时间信号 采样所得到的样本序列,不能唯一地确定原来的连续 时间信号,即:一个连续时间信号必须在某一种条件 下才能由其样本来表示。
采样分析
采样函数: p(t) (t nT ) n 采样样本:
香农信息论
传输理论
保密理论
有失真信源编码 无失真信源编码
率失真理论
等长编码 变长编码
定理
定理
有噪声 信道编码理论
网络信道
保密系统的 信息理论
网络信息理论
压缩编码
最优码构成 码 码
码构成 纠错码
网络最佳码
保密码
代数编码 卷积码
信息论之父
❖ —— ❖ : 30 1916 , , ❖ : 24 2001 , ,
s M M s M M
采样分析
对连续时间信号在时域理想采样,就相当 于在频域以采样频率 s为周期延拓,幅值减 小1。要使频谱不混迭,就必须使信号带限, 且
s M M s 2M
上述即为时域采样的约束条件
从而我们得到怎样抽取样本,样本才能唯一地表征原信 号的取样条件,下面为上述分析的一个完整总结--采样 定理。

大学_多媒体技术基础第三版(林福宗著)课后答案下载

大学_多媒体技术基础第三版(林福宗著)课后答案下载

多媒体技术基础第三版(林福宗著)课后
答案下载
多媒体技术基础第三版(林福宗著)课后答案下载
第1章多媒体技术概要
1.1 多媒体的概念
1.1.1 多媒体是什么
1.1.2 超文本的概念
1.1.3 超媒体的概念
1.1.4 多媒体系统的结构
1.2 多媒体数据压缩与编码
1.2.1 为什么要压缩
1.2.2 两种类型的压缩
1.2.3 三种类型的编码
1.2.4 压缩与编码
1.3 多媒体与光盘
1.4 多媒体与网络
1.4.1 因特网是什么
1.4.2 万维网是什么
1.5 多媒体国际标准
1.5.1 国际电信联盟(ITU)标准
多媒体技术基础第三版(林福宗著):内容提要
点击此处下载多媒体技术基础第三版(林福宗著)课后答案
多媒体技术基础第三版(林福宗著):图书目录
在第2版的基础上,本版教材对部分章节的内容做了更新,增加了MPEG-4 AVI/H.264和多媒体传输方面的内容。

为保持多媒体技术基础课程内容的'完整性,《多媒体技术基础》仍由四个部分组成: 一是多媒体压缩和编码(第2~13章),主要介绍声音、图像和数字电视媒体的基本知识、压缩和编码方法;二是多媒体存储(第14~16章),主要介绍CD、DVD、HD?-DVD和Blu-ray Disc存储器的存储原理和存储格式;三是多媒体传输(第17~20章),主要介绍多媒体网络应用、服务质量(QoS)、因特网.。

多媒体技术基础.

多媒体技术基础.
多媒体技术基础
第二章 多媒体信息的表示与压缩 2.1 文字 一、西文(ASCII码) 二、汉字(数字编码、拼音码、 字型编码)
2.2 音频(Audio)
定义:20HZ~20KHZ的音频范围 分类:波形声音、语音、音乐 声音三要素:音调、音强、音色
一、数字音频
音频数字化:把模拟音频信号转换成 有限个数字表示的离散序列。 转换过程:选择采样频率,进行采样 选择分辨率,进行量化 形成声音文件
2、VOC文件 3、MIDI文件 用于音乐,与WAV文件不同
二、乐器数字接口(MIDI)
MIDI信息实际上是一段音乐的描述,只 记录产生某种声音的指令,指令中包括 了使用MIDI设备的音乐、音量和持续时 间长短信息。是数字化的乐谱,由音符 序列、定时及合成音色的乐器定义组成。
三、数字化声音和MIDI的比较
编码过程
(1)将信源符号按概率递减顺序排列; (2)把两个最小的概率加起来,作为新符 号的概率; (3)重复(1)和(2),直到概率和达到1 为止; (4)在每次合并消息时,将被合并的消息 赋予1和0或0和1; (5)寻找从每一信源符号到概率为1的路径, 记录下路径上的1和0 (6)对每一符号写出从码树的根到终结点1、 0序列
另外,MPEG中视频信号包含有静止画 面(帧内图)和运动信息(帧间预测图) 等不同的内容,量化器的设计比 JPEG 压缩算法的标准,除了解压 后的数据有无失真或失真程度之外,是看 压缩比的大小。压缩比常用的定义有两种: (1) 采样压缩比 (2) 比特压缩比
2、算术编码
定义:是一种二元码的编码方法, 在不考虑信源统计的情况下,只要监视 一小段时间内码出现的频率,不管统计 是平稳的或非平稳的,编码的码率总能 趋近于信源熵值,每次迭代时的编码算 法只处理一个数据符号,并且只有算术 运算。

《多媒体技术》电子教案:多媒体数据压缩编码技术

《多媒体技术》电子教案:多媒体数据压缩编码技术

多媒体技术电子教案:多媒体数据压缩编码技术一、多媒体数据压缩编码技术概述多媒体技术是指利用计算机技术将文字、图像、音频、视频等多种形式的信息进行集成,并能够对它进行处理、传输和存储,以提供更好的用户体验。

在多媒体技术中,数据压缩编码技术是非常重要的一个部分。

数据压缩编码技术可以将多媒体数据进行压缩,以便更有效地存储和传输。

该技术可以通过减少数据冗余、淘汰不必要的数据等方式来降低多媒体文件的大小。

数据压缩编码技术有很多种不同的方法,如无损压缩和有损压缩等。

二、无损压缩技术无损压缩技术是将多媒体数据进行无损压缩,即在不损失数据质量的情况下,将文件大小进行压缩。

常见的无损压缩技术包括:Run Length Encoding(RLE)、标志赋值编码、霍夫曼编码等。

1. Run Length Encoding(RLE)Run Length Encoding(RLE)是一种简单的数据压缩编码技术,它通过识别文件中连续出现的相同数据并进行编码来压缩多媒体数据。

例如,当一张图像中有大量相同的像素时,RLE可以将它们表示为一个像素值和一个重复次数的序列,从而达到压缩数据的目的。

2. 标志赋值编码标志赋值编码也是一种简单的无损压缩技术,它可以通过对多媒体数据中的不同符号/颜色赋予不同的标志来将其进行压缩。

例如,一种常见的标志赋值编码技术是算术编码。

3. 霍夫曼编码霍夫曼编码是一种无损压缩技术,它利用统计学原理来压缩多媒体数据。

该编码技术通过对多媒体数据中出现频率较高的符号/颜色分配短码,对出现频率较低的符号/颜色分配长码,从而达到对数据进行压缩的目的。

三、有损压缩技术有损压缩技术是将多媒体数据进行有损压缩,即在一定程度上损失数据质量的情况下,将文件大小进行压缩。

常见的有损压缩技术包括:数据降采样、量子化、离散余弦变换(DCT)、离散小波变换(DWT)等。

1. 数据降采样数据降采样也是一种简单的有损压缩技术,它通过减少音频和视频数据的采样率和比特率来达到压缩文件大小的目的。

多媒体技术基础第3版课后答案

多媒体技术基础第3版课后答案

(7)
cb
(8)
bab
(9)
baba
(10)
aa
(11)
aaa
(12)
aaa


输出码字
(1) (2) (4) (3) (5) (8) (1) (10) (11) …
2.7 LZ78 算法和LZ77 算法的差别在哪里? (1) LZ77 编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(2.4.2 LZ77 算
3.3 什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化? (1) 采样:在某些特定的时刻对模拟信号进行测量的过程。 (2) 量化:幅值连续的模拟信号转化成为幅值离散的数字信号的过程。 (3) 线性量化:在量化时,信号幅度的划分是等间隔的量化。 (4) 非线性量化:在量化时,信号幅度的划分是非等间隔的量化。
2.8 LZSS算法和LZ77 算法的核心思想是什么?它们之间有什么差别? (1) LZSS通过输出真实字符解决了在窗口中出现没有匹配串的问题,但这个解决方案包
含有冗余信息。(2.4.3 LZSS算法) (2) LZ77 编码算法的核心是查找从前向缓冲存储器开始的最长匹配串(2.4.2 LZ77 算法)
3.1 音频信号的频率范围大约多少?话音信号频率范围大约多少? (1) Audio: 20~20000 Hz (2) Speech: 300~3400 Hz
3.2 什么叫做模拟信号?什么叫做数字信号? (1) 模拟信号是幅度或频率发生连续变化的一种信号。 (2) 数字信号是以二进制代码形式表示有无或高低的一种信号。
1.2 超链接是什么? 超链接(hyper link)是两个对象或元素之间的定向逻辑链接,是一个对象指向另一个对象
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第2章 数据无损压缩
18 of 42
2.2.2 霍夫曼编码— Case Study 1

霍夫曼编码举例1

现有一个由5个不同符号组成的30个符号的 字符串:
BABACACADADABBCBABEBEDDABEEEBB

计算
(1) 该字符串的霍夫曼码 (2) 该字符串的熵 (3) 该字符串的平均码长 (4) 编码前后的压缩比

霍夫曼(D.A. Huffman)在1952年提出和描述的 “从下到上”的熵编码方法 根据给定数据集中各元素所出现的频率来压 缩数据的一种统计压缩编码方法。这些元素 (如字母)出现的次数越多,其编码的位数就 越少 广泛用在JPEG, MPEG, H.26X等各种信息编码 标准中


2011年1月23日
H ( X ) p ( xi ) log 2 p( xi )
i 1 n
p ( A) log 2 ( p ( A)) p ( B ) log 2 ( p ( B )) p ( E ) log 2 ( p ( E )) = (15/40) log 2 (40/15)+(7/40) log 2 (40/7)+ +(5/40) log 2 (40/5) 2.196


Master's thesis, A symbolic analysis of relay and switching circuits Doctoral thesis: on theoretical genetics

In 1948:
A mathematical theory of communication, landmark, climax (An important feature of Shannon's theory: concept of entropy )
第2章 数据无损压缩
2.2.1 香农-范诺编码(续1)
(1) 压缩比的理论值

按照常规的编码方法,表示5个符号最少需要3位, 如用000表示A,001表示B,…,100表示E,其余3 个代码 (101,110,111)不用。这就意味每个像素用 3位,编码这幅图像总共需要120位。按照香农理 论,这幅图像的熵为
第2章 数据无损压缩

视听冗余


数据冗余

2011年1月23日
7 of 42
2.1 数据的冗余(续1)

决策量(decision content)


在有限数目的互斥事件集合中,决策量是事 件数的对数值 在数学上表示为
H0=log(n) 其中,n是事件数

决策量的单位由对数的底数决定

Sh (Shannon): 用于以2为底的对数 Nat (natural unit): 用于以e为底的对数 Hart (hartley):用于以10为底的对数

(1) 计算该图像可能获得的压缩比的理论值 (2) 对5个符号进行编码 (3) 计算该图像可能获得的压缩比的实际值 表2-1 符号在图像中出现的数目 符号 出现的次数 出现的概率 A 15 15/40 B 7 7/40 C 7 7/40 D 6 6/40 E 5 5/40
14 of 42
2011年1月23日
2011年1月23日
第2章 数据无损压缩
10 of 42
2.1 数据的冗余(续4)

数据的冗余量
2011年1月23日
第2章 数据无损压缩
11 of 42
2.2 统计编码

统计编码

给已知统计信息的符号分配代码的数据无损压缩方法 香农-范诺编码 霍夫曼编码 算术编码 香农-范诺编码和霍夫曼编码的原理相同,都是根据符 号集中各个符号出现的频繁程度来编码,出现次数越 多的符号,给它分配的代码位数越少 算术编码使用0和1之间的实数的间隔长度代表概率大 小,概率越大间隔越长,编码效率可接近于熵
2011年1月23日
第2章 数据无损压缩
20 of 42
2.2.2 霍夫曼编码— Case Study 1 (续2)
(1) 计算该字符串的霍夫曼码
步骤①:按照符号出现概率大小的顺序对符号进行排序 步骤②:把概率最小的两个符号组成一个节点P1 步骤③:重复步骤②,得到节点P2,P3,P4,……, PN,形成一棵树,其中的PN称为根节点 步骤④:从根节点PN开始到每个符号的树叶,从上到下 标上0(上枝)和1(下枝),至于哪个为1哪个为0则 无关紧要,但通常把概率大的标成1,概率小的 标成0 步骤⑤:从根节点PN开始顺着树枝到每个叶子分别写出 每个符号的代码
/news/2001/february/26/1.html
2011年1月23日
第2章 数据无损压缩
5 of 42
2.0 数据无损压缩概述(续3)

Claude Shannon ——The founding father of electronic communications age;American mathematical engineer In 1936~1940, MIT:
2.4.1 词典编码的思想 2.4.2 LZ77算法 2.4.3 LZSS算法 2.4.4 LZ78算法 2.4.5 LZW算法
2.2 统计编码
2.2.1 香农-范诺编码 2.2.2 霍夫曼编码 2.2.3 算术编码
参考文献和站点
2011年1月23日
第2章 数据无损压缩
2 of 42
2.0 数据无损压缩概述
第2章 数据无损压缩

编码方法


编码特性


2011年1月23日
12 of 42
2.2.1 统计编码——香农-范诺编码

香农-范诺编码(Shannon–Fano coding)


在香农的源编码理论中,熵的大小表示非冗余的不 可压缩的信息量 在计算熵时,如果对数的底数用2,熵的单位就用 “香农(Sh)”,也称“位(bit)” 。“位”是1948年Shannon 首次使用的术语。例如

2011年1月23日
第2章 数据无损压缩
6 of 42
2.1 数据的冗余

冗余概念

人为冗余

在信息处理系统中,使用两台计算机做同样的工作是提高 系统可靠性的一种措施 在数据存储和传输中,为了检测和恢复在数据存储或数据 传输过程中出现的错误,根据使用的算法的要求,在数据 存储或数据传输之前把额外的数据添加到用户数据中,这 个额外的数据就是冗余数据 由于人的视觉系统和听觉系统的局限性,在图像数据和声 音数据中,有些数据确实是多余的,使用算法将其去掉后 并不会丢失实质性的信息或含义,对理解数据表达的信息 几乎没有影响 不考虑数据来源时,单纯数据集中也可能存在多余的数 据,去掉这些多余数据并不会丢失任何信息,这种冗余称 为数据冗余,而且还可定量表达
(2) 符号编码

对每个符号进行编码时采用“从上到下”的方法。首 先按照符号出现的频度或概率排序,如A,B,C, D和E,见表2-2。然后使用递归方法分成两个部 分,每一部分具有近似相同的次数,如图2-1所示
2011年1月23日
第2章 数据无损压缩
16 of 42
2.2.1 香农-范诺编码(续3)
第2章 数据无损压缩

数据无损压缩的方法

2011年1月23日
4 of 42
2.0 数据无损压缩概述(续2)

信息论之父介绍

The Father of Information Theory—— Claude Elwood Shannon


Born: 30 April 1916 in Gaylord, Michigan, USA Died: 24 Feb 2001 in Medford, Massachusetts, USA

声音(audio)数据——有损压缩


图像(image)/视像(video) 数据——有损压缩

2011年1月23日
第2章 数据无损压缩
3 of 42
2.0 数据无损压缩概述(续1)

数据无损压缩的理论——信息论(information theory)


1948年创建的数学理论的一个分支学科,研究信息的编码、 传输和存储 该术语源于Claude Shannon (香农)发表的“A Mathematical Theory of Communication”论文题目,提议用二进制数据对信 息进行编码 最初只应用于通信工程领域,后来扩展到包括计算在内的其 他多个领域,如信息的存储、信息的检索等。在通信方面, 主要研究数据量、传输速率、信道容量、传输正确率等问题。 霍夫曼编码(Huffman coding ) 算术编码(arithmetic coding) 行程长度编码(run-length coding) 词典编码(dictionary coding) ……
图2-1 香农-范诺算法编码举例
(3)压缩比的实际值

按照这种方法进行编码需要的总位数为 30+14+14+18+15=91,实际的压缩比为 120:91≈1.32 : 1
第2章 数据无损压缩
2011年1月23日
17 of 42
2.2.2 统计编码——霍夫曼编码

霍夫曼编码(Huffman coding)

一个等概率事件的集合,每个事件的信息量等于该 集合的决策量
第2章 数据无损压缩
2011年1月23日
9 of 42
2.1 数据的冗余(续3)

熵(entropy)
相关文档
最新文档