第5章 无失真信源编码定理

合集下载

第5章_无失真信源编码定理

第5章_无失真信源编码定理
则称码C为奇异码。
si , s j S Wi ,W j C
信源符号
概率
编码1
编码2
编码3
编码4
编码5
p(ai )
a1 a2 a3 a4
1/2
00
0
0
0
1
1/4
01
0
1
10
01
1/8
10
1
00
1100011/8111011
111
0001
如表中的“编码2”是奇异码,其他码是非奇异码。
(6)同价码
P( s ) 1
i 1 i
4
而其依赖关系为:
P(s2 / s1 ) P(s1 / s2 ) P(s4 / s3 ) P(s3 / s4 ) 1, 其余P(s j / si ) 0
s1 s2 s3 s4
s1 0 1 P 0 0
s2 1 0 0 0
s3 0 0 0 1
s4
p (s4)
11
101
(4)非奇异码
若一组码中所有码字都不相同(即所有信源符号
映射到不同的码符号序列),则称为非奇异码。
si s j Wi W j
则称码C为非奇异码。
si , s j S Wi ,W j C
(5)奇异码 若一组码中有相同的码字,则为奇异码。
si s j Wi W j
P(s2 / s1 ) P(s1 / s2 ) P(s4 / s3 ) P(s3 / s4 ) 1, 其余P(s j / si ) 0
s3 s2 s4 S s1 P( s ) P( s ) P( s ) P( s ) P( s ) 1 2 3 4

第5章无失真信源编码定理

第5章无失真信源编码定理

如果我们要对信源的N次扩展信源进行编码,也必须满足
qN rl , 两边取对数得: l log q
l
N log r
N 表示平均每个信源符号所需的码符号个数。
5.2 等长码
例:对英文电报得32个符号进行二元编码,根据上述关系:
l log 32 5 log 2
我们继续讨论上面得例子,我们已经知道英文的极限 熵是1.4bit,远小于5bit,也就是说,5个二元码符号只携带 1.4bit的信息量,实际上,5个二元符号最多可以携带5bit 信息量。我们可以做到让平均码长缩短,提高信息传输率
0.8112
0.4715
若采用等长二元编码,要求编码效率 0.96 ,允许错误率
105 ,则: N 4.13107
也就是长度要达到4130万以上。
5.5 变长码
1、唯一可译变长码与及时码
信源符号 出现概率 码1
码2
码3
码4
s1
1/2
0
0
1
1
s2
1/4
11
10
10
01
s3
1/8
00
00
密码:是以提高通信系统的安全性为目的的编码。通常通过加 密和解密来实现。从信息论的观点出发,“加密”可视为增熵 的过程,“解密”可视为减熵的过程。
5.1 编码器
信源编码理论是信息论的一个重要分支,其理论基础是信源编 码的两个定理。 无失真信源编码定理:是离散信源/数字信号编码的基础; 限失真信源编码定理:是连续信源/模拟信号编码的基础。
5.1 编码器
信源编码:以提高通信有效性为目的的编码。通常通过压缩信 源的冗余度来实现。采用的一般方法是压缩每个信源符号的平 均比特数或信源的码率。即同样多的信息用较少的码率传送, 使单位时间内传送的平均信息量增加,从而提高通信的有效性。

第5章无失真信源编码定理

第5章无失真信源编码定理

R 0.811比特/二元码符号
通信与信息基础教学部
33
信息论课件
对该信源的二次扩展信源进行编码如下
0 10 110 111 X 2 x1 x1 x1 x2 x2 x1 x2 x2 9 3 3 1 16 16 16 P( x) 16 这个码的平均长度 L2 27 16 得信源中每一个单个符号的平均码长 L L2 2 27 32 编码效率 2 0.961 信道信息传输率为 R 0.961比特/二元码符号 2 同样可得 R 0.985, R 0.991, 3 4
信源编码器的主要任务:完成输入消息
集合与输出代码集合之间的映射。若要 实现无失真编码,则这种映射必须是一 一对应的、可逆的。
通信与信息基础教学部
4
信息论课件
常用码型
1、二元码:若信道码符号集A={0,1
}, 编码输出的码字都是二元码,称为二元 码。 2 、等长码:若一组码中所有码字的码长 都相同,称为等长码。 3 、变长码:若一组码中所有码字的码长 Ki 各不相同,即任意码字由不同长度的 码符号序列组成,则称为变长码。
信息论课件
第5章 无失真信源编码
编码器 5.2 等长码 5.3 渐进等分割性和e典型序列* 5.4 等长信源编码定理 5.5 变长码 5.6 变长信源编码定理
5.1
通信与信息基础教学部
1
信息论课件
5.1 编码器
对整个通信系统来说,要解决两个问题:信源 编码和信道编码。 对信源来说有两个重要问题:一个是信源输出 信息量的定量度量问题。这在前面信源及其信 息熵章中已讨论。本章将要讨论第二个问题: 如何有效地表示信源输出问题。即将重点讨论 对信源进行无失真信源编码的要求、方法及理 论极限,从而得出香农第一定理。

信息论基础与应用-李梅-第五章 无失真信源编码解析

信息论基础与应用-李梅-第五章 无失真信源编码解析
s1 s1s1 s 2 s1s2 s3 s1s3 s16 s4 s4
二次扩展码码字 w j ( j 1, 2,...,16)
w1 w1w1 00 w 2 w1w2 001 w3 w1w3 0001 w16 w4 w4 111111
第五章:无失真信源编码
一、信源编码的相关概念
4. 关于编码的一些术语

编码器输出的码符号序列 wi称为码字;长度 li 称为码 字长度,简称码长;全体码字的集合C称为码。 若码符号集合为X={0,1},则所得的码字都是二元序 列,称为二元码。

将信源符号集中的每个信源符号
si 固定的映射成某
一个码字 wi ,这样的码称为分组码。
码字与信源符号一一对应
2) 不同的信源符号序列对应不同的码字序列
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性(续2)
例1:
1) 奇异码
s1 s2 s3 s4
0 11 00 Байду номын сангаас1
译码 11
s2 s4
奇异码一定不是唯一可译码
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性(续3)
译码 0 0 0 1 1 0 1 1
s1s2 s3 s4
第五章:无失真信源编码
一、信源编码的相关概念
6. 唯一可译性(续5)
4)
唯一可译码 1 1 0 1 0 0 1 0 0 0 0
s1 s2
1 10
1 0
1
s2 / s3 ?
s3 100 s4 1000

为非即时码
第五章:无失真信源编码
一、信源编码的相关概念

《信息论与编码原理》孟放-第五八章无失真信源编码(编码定理编码算法)-2016-打印版

《信息论与编码原理》孟放-第五八章无失真信源编码(编码定理编码算法)-2016-打印版

【5】无失真信源编码定理【7】保真度准则下的信源编码【8】无失真的信源编码【6】有噪信道编码定理【9】信道的纠错编码271.1、概述–编码器概论(续)✹信源编码理论是信息论的一个重要分支,其理论基础:无失真信源编码定理;限失真信源编码定理。

✹本章主要介绍无失真信源编码,它实质上是一种统计匹配编码,根据信源的不同概率分布而选用与之相匹配的码。

✹信源的统计剩余度主要决定于以下两个因素无记忆信源中,符号概率分布的非均匀性。

有记忆信源中,符号间的相关性及符号概率分布的非均匀性。

81.1、概述–信源编码器模型✹信源编码:将信源符号序列按一定的数学规律映射成码符号序列的过程。

信宿信道信源编码器译码器X ’XSS ’信源编码器模型{}qs s s S ,,,21 =12{,,,}r X x x x = 91.1、概述–信源编码器模型(续)✹将信源符号集中的符号(或者长为N 的信源符号序列)映射成由码符号组成的长度为的一一对应的码符号序列。

{}q W W W C ,,,21 =编码器},...,,{:21r x x x X {}q s s s S ,,,21 ={}ili i i i x x x W 21=i x i s il i W 101.2、概述–基本术语{}q W W W C ,,,21 =编码器},...,,{:21r x x x X {}q s s s S ,,,21 ={}il i i i i x x x W 21=信源符号集码符号集码字码元/ 码符号代码组C / 码Cr 元码定长码、变长码;奇异码、非奇异码平均码长()∑=ii i l s p L 11信源符号出现概率码字码1码2码3S 1p (S 1)W 10000S 2p (S 2)W 2010111S 3p (S 3)W 31000100S 4p (S 4)W 411111111.2、概述–基本术语–例题5.1()()()()⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡43214321s p s p s p s p s s s s P S 例题:设有二元信道的信源编码器,其概率空间如右:定长码:变长码:非奇异码:奇异码:码1码2、码3码1、码2码3121.3、概述–N 次扩展码✹实际接收:N 次无记忆扩展信源--〉N 次扩展码{}q W W W C ,,,21 ={}qs s s S ,,,21 =is {}12,,,NN q S ααα= },,,{21N q N C W W W =12Nj j j js s s α= Nq j ,,2,1 =qj j j N ,,2,1,,,21 =iW Nj j j j W W W 21=W131.3、概述–N 次扩展码✹例题5.1 -续()16,,2,1 =j j W 00111==W W W 001212==W W W 二次扩展信源符号二次扩展码码字(1,2, (16)j j α=111s s α=212s s α=313s s α=1644s s α=0001313==W W W 1111114416==W W W 信源符号码字码2S 1W 10S 2W 201S 3W 3001S 4W 411114✹信源编码器✹分组码✹定长码和定长编码定理✹变长码主要内容定义唯一可译性即时码的判别与构造152.1、分组码✹分组码:将信源符号集中的每个信源符号映射成一个固定的码字。

第5章2无失真和限失真信源编码

第5章2无失真和限失真信源编码
i 1 2
28
5.2.3
最佳变长编码
最佳变长编码 凡是能载荷一定的信息量,且码字的 平均长度最短,可分离的变长码的码字集 合称为最佳变长码。
29
5.2.3
最佳变长编码
能获得最佳码的编码方法主要有:

香农(Shannon)


费诺(Fano)
哈夫曼(Huffman)等
30
5.2.3
最佳变长编码
2
2.83
7.11
Pe=0.04 太大
16
5.2.1
定长编码定理
0.28
H(X ) = 0.90, H(X )
2 8 i 1
( X ) D[ I ( xi )] pi (log pi ) 2 [ H ( X )]2 7.82(bit) 2
若要求译码错误概率 10-6
对于平均符号熵为 HL(X) 的离散平稳 无记忆信源,必存在一种无失真编码方法, 使平均信息率满足不等式
H L (X) K H L (X)
其中为任意小正数。
20
5.2.2
变长编码定理
用变长编码来达到相当高的编码效率, 一般所要求的符号长度 L可以比定长编码小得 多。 编码效率的下界:
编码。
12
5.2.1
定义
定长编码定理

H L ( X) K
为编码效率,即信源的平均符号熵为H(X), 采用平均符号码长为 来编码,所得的效 K 率。 编码效率总是小于1,且最佳编码效率为
H L ( X) , 0 H L ( X)
13
5.2.1
定长编码定理
编码定理从理论上阐明了编码效率接 近1的理想编码器的存在性,它使输出符号 的信息率与信源熵之比接近于1,即

第5章 信源编码 第1讲 无失真信源编码 定长编码定理 2016

第5章 信源编码 第1讲 无失真信源编码 定长编码定理 2016

00 01 10 11
0 01 001 111
12/62
余 映 云南大学
5.1 编码的定义
• 采用分组编码方法,需要分组码具有某些属性, 以保证在接收端能够迅速准确地将码译出。 • 下面讨论分组码的属性:
余 映 云南大学
13/62
5.1 编码的定义
• (1) 奇异码和非奇异码
– 若信源符号和码字是一一对应的,则该码为非奇异码; 反之为奇异码。 – 例如表中码1是奇异码,其他是非奇异码。
信源符号 出现概率 码1 码2 码3 码4
A B C D
1/2 1/4 1/8 1/8
0 11 00 11
余 映 云南大学
0 10 00 01
1 10 100 1000
1 01 001 0001
18/62
5.1 编码的定义
• (3) 即时码和非即时码
– 唯一可译码又分为非即时码和即时码。 – 即时码是一种没有一个码字构成另一码字前缀的码。 在译码时没有延迟,收到一个完整码字后就能立即译 码。 – 如果收到一个完整码字后,不能立即译码,还需等下 一个码字开始接收后才能判断是否可以译码,这样的 码叫做非即时码。
信源符号
出现概率
码1
码2
码3
码4
a1 a2 a3 a4
1/2 1/4 1/8 1/8
0 11 00 11
余 映 云南大学
0 10 00 01
1 10 100 1000
1 01 001 0001
14/62
5.1 编码的定义
• (2) 唯一可译码和非唯一可译码
– 若任意有限长的码元序列,只能被唯一地分割成一个 个的码字,则称为唯一可译码。 – 例如{0, 10, 11}是一种唯一可译码。 – 因为任意一串有限长码序列, – 如100111000

信息论基础第5章无失真信源编码

信息论基础第5章无失真信源编码
进行霍夫曼编码时,应把合并后的概率总是放在 其他相同概率的信源符号之上,以得到码长方差最小 的码。
r 元霍夫曼编码步骤:
1) 验证所给 q 是否满足 q (r 1) r ,若不满足该式,
可以人为地增加 t 个概率为零的符号,满足式
n (r 1) r ,以使最后一步有 r 个信源符号;
2) 取概率最小的 r 个符号合并成一个新符号,并分别用 0, 1,…,(r 1) 给各分支赋值,把这些符号的概率相加作为该新 符号的概率;
上述不等式只是即时码存在的充要条件,而不能作为判别的依据。
需要注意的是,克拉夫特不等式是即时码存在的充要条件,而 不能作为判别的依据。后来麦克米伦(B. McMillan)证明唯一可译 码也满足克拉夫特不等式。这说明在码长选择的条件上,即时码与 唯一可译码是一致的。
【例】 对于二元码,即 r 2 ,如果 q 4 , L1 2 , L2 2 ,
原始信源普遍存在剩余度,香农信息论认为信源的剩余度主 要来自两个方面:一是信源符号间的相关性,二是信源符号概率 分布的不均匀性。为了去除信源剩余度,提高信源的信息传输率, 必须对信源进行压缩编码。
目前去除信源符号间相关性的主要方法是预测编码和变换编 码,而去除信源符号概率分布不均匀性的主要方法是统计编码。
《信息论基础》
第5章 无失真信源编码
第 2 章已经讨论了离散信源的信息度量—信源熵, 本章将讨论信源的另一个重要问题:如何对信源的输出 进行适当的编码,才能用尽可能少的码元来表示信源信 息,做到以最大的信息传输率无差错地传输信息呢?即 无失真信源编码,它解决的是通信的有效性问题。
本章将首先介绍信源编码器;然后从理论上阐述无 失真信源编码定理,得出“平均码长的理论极限值就是
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2、信道编码:是以提高信息传输的可靠性为目的的编码。
通常通过增加信源的冗余度来实现。采用的一般方法是 增大码率/带宽。与信源编码正好相反。
3、密码:是以提高通信系统的安全性为目的的编码。通
常通过加密和解密来实现。从信息论的观点出发,“加
密”可视为增熵的过程,“解密”可视为减熵的过程。 4、信源编码理论是信息论的一个重要分支,其理论基础是 信源编码的两个定理。
N log q ≤ l log r
l log q ≥ N log r
log q l≥ log r
平均每个信 源符号所需 码符号个数
当r=2(二元码),则有
l ≥ log q N
例:对英文电报的32个符号进行二元编码,根据上述关系:
若N 1
log 32 l 5 log 2
我们继续讨论上面的例子,我们已经知道英文的极限 熵是1.4bit,远小于5bit,也就是说,5个二元码符号只携 带1.4bit的信息量,实际上,5个二元符号最多可以携带 5bit信息量。我们可以做到让平均码长缩短,提高信息传 输率。下面举例阐明 设信源
s3 s2 s4 S s1 P( s ) P( s ) P( s ) P( s ) P( s ) 1 2 3 4
4
P( s ) 1
i 1 i
而其依赖关系为:
P(s2 / s1 ) P(s1 / s2 ) P(s4 / s3 ) P(s3 / s4 ) 1, 其余P(s j / si ) 0
定理5.6 若存在一个码长为 l1, l2 ,, lq 唯一可译码,则一定
存在一个同样长度的即时码。
这说明,其他唯一可译码在码长方面并不比即时码占 优。所以在讨论唯一可译码时,只需要讨论即时码就可 以了。源自5.5.4 惟一可译变长码的判断法
萨得纳斯(Sardinas)-彼得森(Patterson)准则
将产生的尾随后缀列出。依此下去,直至没有一个尾随 后缀是码字的前缀或没有新的尾随后缀产生为止。由此 得到由码C的所有可能的尾随后缀组成的集合F。
例5.2 (p210) C={0,10,1100,1110,1011,1101}
码字 00 11 10 10 01 尾随后缀 0 11 1 0 100 110 011 101 0 0 1 11 1
l log r H ( S ) N
令:R ' log r 称之为编码信息率。可见,编码信息 N 率大于信源的熵,才能实现无失真编码。
l
为了衡量编码效果,引进

H (S ) H (S ) l R' log r N
称为编码效率。 最佳编码效率为:
H (S ) H (S ) ' R H (S )
第5章 无失真信源编码定理
◆ 编码器 ◆ 等长码 ◆ 等长信源编码定理 ◆ 变长码
◆ 变长信源编码定理
引 言
1、信源编码:以提高通信有效性为目的的编码。通常通 过压缩信源的冗余度来实现。采用的一般方法是压缩每
个信源符号的平均比特数或信源的码率。即同样多的信
息用较少的码率传送,使单位时间内传送的平均信息量 增加,从而提高通信的有效性。
s1 s2 s3 s4
00 01 10 11
00 11 10 11
若对一个信源S进行等长编码,那么信源S存在惟一
可译等长码的条件是 信源S的 符号个数 等长码的码长
q ≤r
l
码符号个数
若对信源S的N次扩展信源 S N 进行等长编码,要编得 等长码是惟一可译则必须满足
q ≤r
N
l
两边取对数有 或 若N=1,则有
N log r
则不可能实现无失真编码,当N趋向于无穷大是,译码错 误率接近于1。
•定理5.3的条件式可写成:
l log r NH ( S )
左边表示长为 l 的码符号所能载荷的最大信息量,而右
边代表长为N的序列平均携带的信息量。因此,只要码字
传输的信息量大于信源序列携带的信息量,总可以实现无 失真编码 。 •定理5.3的条件式也可写成:
但码3和码4也不太一样,码4称作逗点码,只要收到1,就
可以立即作出译码;而码3不同,当收到一个或几个码时,
必须参考后面的码才能作出判断。 定义 在唯一可译码中,有一类码,它在译码是无须参考 后面的码字就可以作出判断,这种码称为即时码。 定义 如果一个码组中的任一个码字都不是另一个码字 的续长,或者说,任何一个码字后加上若干码元后都不是
F={11,00,10,01,0,1,100,110,011,101}
0
0 0
01
001 0001
树枝数——码的数
节数——码长 端点——码字 满树——等长码 非满树——变长码
码4的树图
码3的树图
在每个节点上都有r个分枝的树称为整树,否则称为非 整树。即时码的树图还可以用来译码。
5.5.3 克拉夫特(Kraft)不等式
定理5.4 对于码符号为 X {x1 , x2 ,..., xr } 的任意即时码,其 码字为 W1 ,W2 ,...,Wq 所对应的码长为 l1 , l2 ,..., lq ,则必定满
足:
r li 1
i 1
q
反之,若码长满足上式,则一定存在这样的即时码 。 可以根据即时码的树图构造法来证明。 1956年,B.McMillan证明了对于唯一可译码也必须满足 上面的不等式, 定理5.5 对于码符号为 X {x1 , x2 ,..., xr }的任意r元唯一 可译码,其码字为 W1 ,W2 ,...,Wq 所对应的码长为l1 , l2 ,..., lq
性之后,我们对信源作N次扩展,在扩展后形成的信源
(也就是句子)中,有些句子是有意义的,而有些句子是 没有意义的,我们可以只对有意义的句子编码,而对那些
没有意义的句子不进行编码,这样就可以缩短每个信源符
号所需的码长。
5.4 等长信源编码定理
定理5.3(等长信源编码定理) 一个熵为H(S)的离散无记 忆信源,若对其N次扩展信源进行等长r元编码,码长为 l 对于任意 大于0,只要满足 l H (S ) N log r 当N无穷大时,则可以实现几乎无失真编码,反之,若: l H ( S ) 2
2、等长码:
若一组码中所有码字的长度都相同,称为等长码。 3、变长码: 若一组码中所有码字的长度各不相同,称为变长码。 4、非奇异码:
若一组码中所有码字都不相同,称为非奇异码。
si s j Wi Wj si , s j S Wi ,Wj C
5、奇异码:
若一组码中有相同的码字,称为奇异码。
si s j Wi Wj si , s j S Wi ,Wj C
6、若码符号集 X ( x1 , x2 ,, xr ) 中每个码符号所占的传
输时间都相同,则编码所得的码C为同价码。
7、码的N次扩展:
若码 C :{W1,W2 ,...,Wq } , 码 B :{Bi (Wi1Wi 2 ...WiN )} 则称码B为 码C的N次扩展码。 8、唯一可译码: 若码的任意一串有限长的码符号序列只能被唯一的译成
码 C 2 的二次扩展码
二次扩展信源符号 码字
αi ,i = 1,2, ,16
Wi,i 1, 2,, 16
1 s1s1 2 s1s2 3 s1s3
16 s4 s4
00 001 0001


111111
5.2
信源符号 s i
等长码
表5.2 等长码
码 C1
码 C2
码组中另一个码字,则称为即时码,也称非延长码或前缀
条件码。 这两个定义是一致的。
所有的码 非奇异码 唯一可译码 即时码
5.5.2 即时码的树图构造法 我们可以用树图的形式构造即时码,如 0 0 0 1 1 1 1 1 1 1 1 0 树根——码字的起点 0 10 100 1000 节点数——码字的一部分
信源符号 s i 符号出现概率p( si ) 码 C1 码C 2
s1
p( s1 )
p ( s2 ) p( s3 ) p ( s4 )
00
0 01 001 111
s2
s3 s4
01 10 11
信源S的二次扩展信源为
S 2 [1 s1s1 2 s1s2 3 s1s3 16 s4 s4 ]
无失真信源编码定理:是离散信源/数字信号编码的基础;
限失真信源编码定理:是连续信源/模拟信号编码的基础。 5、信源编码的分类:离散信源编码、连续信源编码和相关 信源编码三类。 离散信源编码:独立信源编码,可做到无失真编码; 连续信源编码:独立信源编码,只能做到限失真信源编码; 相关信源编码:非独立信源编码。
所对应的信源符号序列,则称此码为唯一可译码。
举例讨论N次扩展码
s2 s3 s4 S s1 p( s ) p( s ) p( s ) p( s ) p( s ) 1 2 3 4
p( s ) 1
i 1 i
4
表5.1 信源S的两种不同编码码字
5.1 编码器
编码器可以看作这样一个系统,它的输入端为原始信 源S,其符号集为 S {S1, S2 ,..., Sq };而信道所能传输的符号集 为 X {x1, x2 ,..., xr } 编码器的功能是用符号集X中的元素,将 原始信源的符号 S i 变换为相应的码字符号 wi ,所以编码器 输出端的符号集为 C :{W1,W2 ,...,Wq }
S {S1 , S2 ,..., Sq }
编码器
C :{W1 ,W2 ,...,Wq }
X {x1 , x2 ,..., xr }
wi 称为码字,Li 为码字wi 的码元个数,称为码字 w 的码字 i 长度,简称码长。 编码就是从信源符号到码符号的一种映射。
相关文档
最新文档