信息论基础与应用-李梅-第五章 无失真信源编码解析

合集下载

信息论基础与编码— 无失真信源编码ch05.article

信息论基础与编码— 无失真信源编码ch05.article

信息论基础与编码—无失真信源编码Contents1 无失真信源编码基本概念12 定长无失真信源编码23 渐进等同分割性54 定长无失真信源编码定理65 变长无失真编码85.1 Kraft 不等式 (8)5.2 唯一可译码判决准则. . . . . . . . . . . . . . . . . . . . . . . . . 96 变长无失真信源编码定理107 无失真信源编码技术117.1Huffman 编码 (12)7.2Shannon 编码 (12)7.3Shannon-Fano-Elias 编码 (12)7.4Fano 编码 (12)7.5Huffman 编码的几个问题 (13)7.6 算数编码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147.7 游程编码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157.8 通用编码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157.9 几种编码方案的性能对比. . . . . . . . . . . . . . . . . . . . . . . 22 1 无失真信源编码基本概念•对于信源来说有两个基本问题:如何计算信源输出的信息量;如何有效地表示信源输出,即在不失真或允许一定失真的条件下,如何用尽可能少的符号来表示信源,以便提高信息传输的效率。

•编码实质上是对信源的原始符号按照一定的数学规则进行的一种变换。

1, . . . , W q }S : {s Array✻X : {x1, x2, . . . , x r }Figure 1: 信源编码器模型•将信源符号集合中的s i(或者长为N的信源符号序列)变换成由x j 组成的长度为l i 的一一对应的码符号序列W i。

信息论 基础理论与应用第三版(傅祖芸) 第5章 讲义

信息论 基础理论与应用第三版(傅祖芸) 第5章 讲义
l H ( S ) 2 N log r
则不可能实现无失真编码,当N趋向于无穷大时,译码错误 率接近于1。
•分析:定理中的条件式可写成
l log r NH (S )
左边: 长为 l 的码符号(码字)所能载荷的最大信息量; 右边: 长为N的信源符号序列平均携带的信息量。 因此,定理说明了:只要码字传输的最大信息量大于信源序 列携带的信息量,则可以实现无失真编码 。
第5章 无失真信源编码定理
5.1 编码器 5.2 等长码 5.4 等长信源编码定理 5.5 变长码 5.6 变长信源编码定理
引 言
信息通过信道传输到信宿的过程。要做到既不失真又快速地 通信,需要解决两个问题: 信源编码: 在不失真或允许一定失真条件下,提高信息传输率. 信道编码: 在信道受到干扰的情况下,增加信号的抗干扰能力,同时又 使得信息传输率最大.
信源 符号
码字
00: W1W1=B1
001:W1W2=B2 0001:W1W3=B3 0111:W1W4=B4
信源 符号
码字
010:W2W1=B5
信源 符号
码字
α1
α2 α3 α4
α5
: : :

: : α16

: :
111111:W4W4=B16
: : :
6、唯一可译码(单义可译码)
由码构成的任意一串有限长的码符号序列只能被唯一的 译成所对应的信源符号序列。 否则,就为非惟一可译码或非单义可译码。

最佳编码: 一般来说,抗干扰能与信息传输率二者相互矛盾。而编码 定理理论上证明,至少存在某种最佳的编码能够解决上述矛盾, 做到既可靠又有效地传输信息。 信源编码: 信源虽然多种多样,但无论是哪种类型的信源,信源符号 之间总存在相关性和分布的不均匀性,使得信源存在冗余度。 信源编码的目的就是要减少冗余,提高编码效率。

信息论课件第五章_无失真信源编码

信息论课件第五章_无失真信源编码

由此可见,当考虑信源符号之间依赖关系后,有 些信源符号序列不会出现,这样信源符号序列 个数会减少,再进行编码时,所需平均码长就可 以缩短. 英文 等长编码定理给出了信源进行等长编码所需 码长的理论极限值.
5.3 渐进等分割性和ε典型序列
渐进等分割性AEP是弱大数定理的直接推论 大数定理:若X1,X2,…,Xn是独立同分布的随机变 1 量,只要n足够大, ∑ X接近于数学期望E(X)。 n
α i (i = 1,..., q N ) 现在需要把这些长为N的信源符号序列
变换成长度为l的码符号序列 Wi = ( xi1 xi2 ...xil ), ( xi1 ,..., xil ∈ X )
根据前面的分析,若要求得编得的等长码是惟一 可译码则必须满足
qN ≤ rl (5.2)
此式表明,只有当l长的码符号序列数(rl)大于或 等于N次扩展信源的符号数(qN)时,才可能存在等 长非奇异码. 对式(5.2)两边取对数,则有
例如,表5.1中码1是惟一可译码,而码2是 非惟一可译码。 因为对于码2,其有限长的码符号序列能译 成不同的信源符号序列。如:0010,可译成 s1s2s1或s3s1,显然不是惟一的。 下面,我们分别讨论等长码和变长码的最佳 编码问题,也就是是否存在一种惟一可译编 码方法,使平均每个信源符号所需的码符号 最短。也就是无失真信源压缩的极限值。
sik ∈ S ( k = 1, 2,..., N ) xik ∈ X ( k = 1, 2,..., li )
这种码符号序列Wi,称为码字。长度li称为码字长 度或简称码长。所有这些码字的集合C称为码(或 称码书)此码为r元码或称r进制码。
编码就是从信源符号到码符号的一种映射 若要实现无失真编码,必须这种映射是一一 对应的、可逆的。

信息论基础第5章无失真信源编码

信息论基础第5章无失真信源编码
进行霍夫曼编码时,应把合并后的概率总是放在 其他相同概率的信源符号之上,以得到码长方差最小 的码。
r 元霍夫曼编码步骤:
1) 验证所给 q 是否满足 q (r 1) r ,若不满足该式,
可以人为地增加 t 个概率为零的符号,满足式
n (r 1) r ,以使最后一步有 r 个信源符号;
2) 取概率最小的 r 个符号合并成一个新符号,并分别用 0, 1,…,(r 1) 给各分支赋值,把这些符号的概率相加作为该新 符号的概率;
上述不等式只是即时码存在的充要条件,而不能作为判别的依据。
需要注意的是,克拉夫特不等式是即时码存在的充要条件,而 不能作为判别的依据。后来麦克米伦(B. McMillan)证明唯一可译 码也满足克拉夫特不等式。这说明在码长选择的条件上,即时码与 唯一可译码是一致的。
【例】 对于二元码,即 r 2 ,如果 q 4 , L1 2 , L2 2 ,
原始信源普遍存在剩余度,香农信息论认为信源的剩余度主 要来自两个方面:一是信源符号间的相关性,二是信源符号概率 分布的不均匀性。为了去除信源剩余度,提高信源的信息传输率, 必须对信源进行压缩编码。
目前去除信源符号间相关性的主要方法是预测编码和变换编 码,而去除信源符号概率分布不均匀性的主要方法是统计编码。
《信息论基础》
第5章 无失真信源编码
第 2 章已经讨论了离散信源的信息度量—信源熵, 本章将讨论信源的另一个重要问题:如何对信源的输出 进行适当的编码,才能用尽可能少的码元来表示信源信 息,做到以最大的信息传输率无差错地传输信息呢?即 无失真信源编码,它解决的是通信的有效性问题。
本章将首先介绍信源编码器;然后从理论上阐述无 失真信源编码定理,得出“平均码长的理论极限值就是

信息论与编码chapter5

信息论与编码chapter5

渐进均分特性
典型序列的概率估计
设 x G 1 ( 满 足 公 式 5 .3 )
log p ( x ) N H (X )
N [ H ( X ) ] log p ( x ) N [ H ( X ) ]
设取2为底 2 N [ H ( X ) ] p ( x ) 2 N [ H ( X ) ]
(适用于离散信源的编码)
限失真信源编码: 信源符号不能通过编码序列无 差错地恢复。
(可以把差错限制在某一个限度内)
信源编码的目的:提高传输有效性,即用尽可能短 的码符号序列来代表信源符号。
§5.1 信源编码的相关概念
本节主要内容
一、信源编码器 二、码的分类 三、分组码
§5.1.1 信源编码器
将信源符号集中的每一个符号固定映 射成一个码字的码 分组码单符号信源编码器
第五章 无失真信源编码
主要内容
本章主要介绍无失真信源编码定理与一 些重要的无失真信源编码方法
一、概述 二、定长码 三、变长码
四、哈夫曼编码
信源编码:将信源符号序列按一定的数学规律映射 成由码符号组成的码序列的过程。 信源译码: 根据码序列恢复信源序列的过程。 无失真信源编码: 即信源符号可以通过编码序列 无差错地恢复。
若不满足上式 =
H (X
N
l N
l l
log r H ( X )
;Y )
N
l
) H (X
N
/ Y ) H (Y ) lH (Y ) l log r
H (X
) NH ( X )
H (X
N
/ Y ) NH ( X ) l log r 0

第5章_无失真信源编码

第5章_无失真信源编码
l •定理5.3的条件式也可写成: N log r H (S ) l 令:R ' log r 称之为编码信息率。可见,编码信息 N
率大于信源的熵,才能实现无失真编码。
H (S ) H (S ) l R' log r N
为了衡量编码效果,引进
称为编码效率。
H (S )
15
H (S ) H (S ) 最佳编码效率为: ' R H (S )
信源编码理论是信息论的一个重要分支,其理论基础是信源编码的两个定理。
限失真信源编码定理:香农第三定理
是连续信源/模拟信号编码的基础。
信源编码的分类:离散信源编码、连续信源编码和相关信源编码三类。
离散信源编码:独立信源编码,可做到无失真编码;
连续信源编码:独立信源编码,只能做到限失真信源编码; 相关信源编码:非独立信源编码。
q N r l , 两边取对数得: l log q
l N
N
log r
表示平均每个信源符号所需的码符号个数。
DUT
信息论基础
9
5.2 等长码
例:对英文电报得32个符号进行二元编码,根据上述关系:
log 32 l 5 log 2
我们继续讨论上面得例子,我们已经知道英文的极限 熵是1.4bit,远小于5bit,也就是说,5个二元码符号只携 带1.4bit的信息量,实际上,5个二元符号最多可以携带 5bit信息量。我们可以做到让平均码长缩短,提高信息传 输率
8、唯一可译码:
若码的任意一串有限长的码符号序列只能被唯一的译成 所对应的信源符号序列,则称此码为唯一可译码。
DUT
信息论基础
8
5.2 等长码
若对信源进行等长编码,则必须满足

信息论与编码 限失真信源编码

信息论与编码 限失真信源编码

第一节 失真测度
1、失真度
信源 信源 编码 信道 编码 广义无扰信道
信道
干扰
信道 译码
信源 译码
信宿
失真范围: 由于只涉及信源编码问题, 所以可以将信 道编码和信道译码看成是信道的一部分. 这样信宿 收到消息的失真(或误差)只是由信源编码带来的.
第一节 失真测度

试验信道: 由于是失真编码, 所以信道不是一一
前 言

失真传输的研究方向:

在允许一定程度失真的条件下, 能把信源信息压 缩到什么程度, 即最少需要多少比特数才能描述
信源;

也就是说, 在允许一定程度失真的条件下, 如何
能快速地传输信息, 这是本章要讨论的问题。
前 言

这个问题在香农1948年最初发表的经典论文中已 经有所体现, 但直到1959年香农又发表了“保真
条件下, 如何能快速的传输信息, 这就是本章所要讨
论的问题. 本章所讨论的内容是量化、数模转换、频带压 缩和数据压缩的理论基础.
前 言
本章主要介绍信息率失真理论的基本内容, 侧重 讨论离散无记忆信源. 首先给出信源的失真度和信息率失真函数的定义
与性质, 然后讨论离散信源的信息率失真函数计算.
在这个基础上论述保真度准则下的信源编码定理.
前 言

失真传输的可能性:

传送图像时, 也并不是需要全部精确地把图像传送到
观察者. 只需将电视信号每一像素的黑白灰度级分成
256级, 屏幕上的画面就已足够清晰悦目.

对于静止图像或活动图像, 从空间频域来看, 每一帧一 般只含有大量的低频域分量, 高频域分量很少. 若将高 频分量丢弃, 只传输或存储低频分量, 数据率便大大减 少, 而图像质量仍能令人满意. 这是因为人眼有一定的 主观视觉特征, 允许传送图像时有一定的误差存在.

(信息论)第5章无失真信源编码

(信息论)第5章无失真信源编码
这就是说,每个英文电报符号至少要用5位二元符号进行 编码才能得到唯一可译码。 12
定长编码定理
定长信源编码定理讨论了编码的有关参数对译 码差错的限制关系
sq p s q
定理 5.3.1 设离散无记忆信源
S s1 P p s 1 p s 2 s2
的熵为H S ,其 N 次扩展信源为
S N 1 p 1 P
2 q p 2 p q

N N

现在用码符号集 X x1 , x2 ,, xr 对N次扩展信源 S N 进行长度为 l 的定长编码,对于 0, 0 ,只要满足
l H S N log r
则当 N 足够大时,译码错误概率为任意小,几乎可以实 现无失真编码。 反之,若满足
l H S 2 N log r
则不可能实现无失真编码。而当N足够大时,译码错误概 14 率近似等于1。

以上的定理5.3.1 和定理5.3.2实际上说明的是一个 问题,虽然该定理是在平稳无记忆离散信源的条件下 证明的,但它也同样适合于平稳有记忆信源,只要要 2 求有记忆信源的极限熵 H S 和极限方差 存在 即可。对于平稳有记忆信源,式(5.6)和式(5.7 ) 中 H S 应该为极限熵 H S 。
变长码(可变长度码)
2
奇异码:若码中所有码字都不相同,则称此码为非
奇异码。反之,称为奇异码。
同价码:每个码符号所占的传输时间都相同的码。定
长码中每个码字的传输时间相同。而变长码中的每个码 字的传输时间不一定相等。
表 5.1
信源符号si
信源符号出现概率 si p
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
s1 s1s1 s 2 s1s2 s3 s1s3 s16 s4 s4
二次扩展码码字 w j ( j 1, 2,...,16)
w1 w1w1 00 w 2 w1w2 001 w3 w1w3 0001 w16 w4 w4 111111
第五章:无失真信源编码
一、信源编码的相关概念
4. 关于编码的一些术语

编码器输出的码符号序列 wi称为码字;长度 li 称为码 字长度,简称码长;全体码字的集合C称为码。 若码符号集合为X={0,1},则所得的码字都是二元序 列,称为二元码。

将信源符号集中的每个信源符号
si 固定的映射成某
一个码字 wi ,这样的码称为分组码。
码字与信源符号一一对应
2) 不同的信源符号序列对应不同的码字序列
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性(续2)
例1:
1) 奇异码
s1 s2 s3 s4
0 11 00 Байду номын сангаас1
译码 11
s2 s4
奇异码一定不是唯一可译码
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性(续3)
译码 0 0 0 1 1 0 1 1
s1s2 s3 s4
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性(续5)
4)
唯一可译码 1 1 0 1 0 0 1 0 0 0 0
s1 s2
1 10
1 0
1
s2 / s3 ?
s3 100 s4 1000

为非即时码
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性
若任意一串有限长的码符号序列只能被唯一地译为 对应的信源符号序列,则称此码为唯一可译码。

信源符号si s1 s2 s3 s4
码1 0 11 00 11
码2 0 10 00 01
码3 0 10 110 111
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性(续1)

唯一可译码应当满足的条件 1) wi (i 1, 2,..., q) si (i 1, 2,..., q)
第五章:无失真信源编码
一、信源编码的相关概念
2. 信源编码器模型(续2)
例: 5.1
S s1 P p( s ) 1
p(si)
s2 p( s2 )
码1
s3 p ( s3 )
s4 p ( s4 )
码2
信源符号si
s1
s2 s3 s4
p(s1)=1/2
1) 去除码符号间的相关性。
2) 使码符号等概分布。
第五章:无失真信源编码
一、信源编码的相关概念
2. 信源编码器模型
信源编码:将信源符号序列按一定的数学规律映射成 码符号序列的过程。

S
信源
X 编码器
信道
Y 译码器
S’
信宿
S s1 , s2 ,, sq


X {x1 , x2 , , xr }
第五章:无失真信源编码
一、信源编码的相关概念 二、定长码及定长信源编码定理
三、变长码及变长信源编码定理 四、变长码的编码方法
五、实用的无失真信源编码方法
第五章:无失真信源编码
一、信源编码的相关概念
1. 信源编码概述

信源编码的作用:
使信源适合于信道的传输,用信道能传输的符号来代
表信源发出的消息; 在不失真或允许一定失真的条件下,用尽可能少的符 号来传递信源消息,提高信息传输率。
2) 非奇异码
s1 0 s2 10 s3 s4 00 01
译码 0 10 00 01 0 译码
s1s2 s3 s4 s1
01 00
00 10
s4 s3 s3 s2
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性(续4)
3)
等长码

非奇异码

唯一可译码
s1 s2
00 01
s3 10 s4 11
p(s2)=1/4 p(s3)=1/8 p(s4)=1/8
00
01 10 11
0
01 001 111
第五章:无失真信源编码
一、信源编码的相关概念
3. N次扩展码
S s1 , s2 ,, sq


si
C {w1 , w2 ,
, wq }
wi
S s1 , s2 ,
N

, sqN

s jN
若一个码中所有码字的码长都相等,则称为定长码;
否则为变长码。
第五章:无失真信源编码
一、信源编码的相关概念
5. 奇异性
若一个码中所有码字互不相同,则称为非奇异码; 否则为奇异码。
信源符号si 码1 码2
s1 s2 s3 s4
0 11 00 11
0 10 00 01
第五章:无失真信源编码
一、信源编码的相关概念
图1 信源编码器模型
第五章:无失真信源编码
一、信源编码的相关概念
2. 信源编码器模型(续1)
S s1 , s2 ,, sq


编码器
C {w1 , w2 ,
, wq }
X : {x1 , x2 ,..., xr }
码字

wi xi1 xi2
xil
i
将信源符号集中的符号 s(或者长为 N的信源符号序 i 列)映射成由码符号 xi 组成的长度为 li 的一一对应的码 符号序列 wi 。
以提高通信有效性为目的。通常通过压缩信源的冗余 度来实现。采用的一般方法是压缩每个信源符号的平 均码长。

第五章:无失真信源编码
一、信源编码的相关概念
1. 信源编码概述(续1)
信源编码理论是信息论的一个重要分支,其理论基础 是信源编码的两个定理:

无失真信源编码定理 限失真信源编码定理

本章主要介绍无失真信源编码,它实质上是一种统
C N {w1 , w 2 ,, w q N }
w j w j1 w j2 w jN
s j s j1 s j2
j 1,2,, q N
j1 , j2 ,, jN 1,2,, q
第五章:无失真信源编码
一、信源编码的相关概念
3. N次扩展码(续1)
二次扩展信源符号 s j ( j 1, 2,...,16)
6. 唯一可译性(续6)
5) 唯一可译码
s1 s2 s3 s4
计匹配编码,根据信源的不同概率分布而选用与之相 匹配的码。
第五章:无失真信源编码
一、信源编码的相关概念
1. 信源编码概述(续2)

信源的统计剩余度主要决定于以下两个因素 : 1)无记忆信源中,符号概率分布的非均匀性; 2)有记忆信源中,符号间的相关性及符号概率分布 的非均匀性。

怎样压缩信源的冗余度?
相关文档
最新文档