第5章 信源编码

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

H L (X) K H L (X)
其中为任意小正数。
5.2 无失真信源编码
编码效率总是小于1,可以用它来衡量各种编 码方法的优劣。
为了衡量各种编码方法与最佳码的差距,定 义码的剩余度为
1 1
HL (X ) KL log m L 1 HL (X ) K
5.2 无失真信源编码
0 0
0
1 0
1 0
0 0
1 0
1 0
1 0
1
1 0
1
1 0
1
1 0
1
1 0 1
5.1 编码的定义
0 1 2
0 0 1 0
1 2 1
2
0 1
2
0 1
2
2
5.1 编码的定义
唯一可译码存在的充分和必要条件 各码字的长度Ki 应符合克劳夫特不等式:
m
i 1
n
-Ki
1
5.1 编码的定义
例:设二进制码树中X (a1, a2 , a3 , a4 ), K1=1,K2=2,K3=2,K4=3,应用上述判 断定理:
5.2 无失真信源编码
编码效率为
H(X ) 0.811 K
输出的信息效率为 R=0.811比特/二元码符号
5.2 无失真信源编码
长度为2的信源序列进行变长编码(编码方 法后面介绍),其即时码如下表
ai a1a1 a1a2 a2a1 a2a2 p(ai) 9/16 3/16 3/16 1/16 即时码 0 10 110 111
第5章 信源编码
编码分为信源编码和信道编码,其中信源 编码又分为无失真和限失真。
一般称
无失真信源编码定理为第一极限定理;
信道编码定理(包括离散和连续信道)称为第
二极限定理; 限失真信源编码定理称为第三极限定理。
第5章 信源编码
由于信源符号之间存在分布不均匀和相关性, 使得信源存在冗余度,信源编码的主要任务 就是减少冗余,提高编码效率。
5.2 无失真信源编码
无失真的信源编码定理
定长编码定理 变长编码定理
5.2 无失真信源编码
由 L 个符号组成的、每个符号的熵为 HL(X) 的无记忆 平稳信源符号序列X1X2…Xl…XL,可用KL个符号Y1, Y2,…,Yk,…,(每个符号有m种可能值)进行定 长编码。对任意>0,>0,只要 K L
5.1 编码的定义
如图5-1所示,如果信源输出符号序列长度L=1,信源 符号集A(a1,a2,…,an) 信源概率空间为
X a1 P p(a1)
an p(a2 ) p(an ) a2
若将信源 X 通过二元信道传输,就必须把信源符 号 ai 变换成由 0 , 1 符号组成的码符号序列,这个 过程就是信源编码
3. 取Pi二进数的小数点后Ki位即为该消息符 号的二进制码字。
5.2 无失真信源编码
例 设信源共7个符号消息,其概率和累加概 率如下表所示。
信源消息符 符号概 号a i 率 (a i )
a1 a2 a3 a4 a5 a6 a7 0.20 0.19 0.18 0.17 0.15 0.10 0.01
5.2 无失真信源编码
9 3 3 1 K 2 1+ 2+ 3+ 3 16 16 16 16 27 = 二元码符号/信源序列 16
K 2 27 K 二元码符号/信源符号 2 32
5.2 无失真信源编码
编码效率
32 0.811 2 0.961 27
信息效率
R2=0.961比特/二元码符号
5.2 无失真信源编码
0.4715 (0.96) 7 L =4.13 10 2 2 -5 (0.811 ) 0.04 10
2
5.2 无失真信源编码
能获得最佳码的编码方法主要有:
香农(Shannon) 费诺(Fano) 哈夫曼(Huffman)等
5.2 无失真信源编码
香农(Shannon)编码
将信源消息符号按其出现的概率大小依次

5.1 编码的定义
表5-2 码的不同属性
信源符号ai a1 a2 符号出现概率 p (a i ) 1/2 1/4 码1 0 11 码2 0 10 码3 1 10 码4 1 01
a3
a4
1/8
1/8
00
11
00
01
100
1000
001
0001
5.1 编码的定义
通常可用码树来表示各码字的构成
0 1

i 1
4
2 K i 21 2 2 23 23 1
5.2 无失真信源编码
信源输出 X=(X1X2…Xl…XL), Xl{a1,a2,…,ai,…,an} 编码为 Y=(Y1Y2…Yk… YkL), Yk{b1,b2,…,bj,…,bm}。 要求能够无失真或无差错地译码,同时传 送Y时所需要的信息率最小
L
log m H L ( X ) 2
则当L足够大时,必可使译码差错小于; 反之,当 K L log m H ( X ) 时,译码差错一
L
L
定是有限值,而L足够大时,译码几乎必定出错
5.2 无失真信源编码
定长编码定理说明,
K L logm LH L (X) H (X)
5.1 编码的定义
不同的码符号序列,如表5-1所示。
信源符 号ai a1 a2 信源符号出 现概率p(ai) p (a 1 ) p (a 2 )
码表 码1
00 01
码2
0 01
a3 a4
p(a3) p(a4)
10 11
001 111
表5-1 变长码与定长码
5.1 编码的定义
非分组码 奇异码 非唯一可译码 分组码 非奇异码 唯一可译码 即时码(非延长码) 非即时码
第5章 信源编码
信源编码的基本途径有两个:
使序列中的各个符号尽可能地互相独立,即 解除相关性;
使编码中各个符号出现的概率尽可能地相等, 即概率均匀化。
第5章 信源编码
信源编码的基础是信息论中的两个编码定理:
无失真编码定理 限失真编码定理
∆无失真编码只适用于离散信源 ∆对于连续信源,只能在失真受限制的情况下进行限失 真编码
5.1 编码的定义
信源 编码器 信道
码表
图5-1 信源编码器示意图
5.1 编码的定义
信源编码是指信源输出符号经信源编码器编
码后转换成另外的压缩符号 无失真信源编码:可精确无失真地复制信源 输出地消息
5.1 编码的定义
将信源消息分成若干组,即符号序列xi, xi=(xi1xi2…xil…xiL), xilA={a1,a2,…,ai,…,an} 每个符号序列xi依照固定码表映射成一个码字yi, yi=(yi1yi2…yil…yiL), yilB={b1,b2,…,bi,…,bm} 这样的码称为分组码,有时也叫块码。只有分组码才有对 应的码表,而非分组码中则不存在码表。
5.2 无失真信源编码
单个符号变长编码定理:若离散无记忆信源 的符号熵为H(X),每个信源符号用m进制码元 进行变长编码,一定存在一种无失真编码方 法,其码字平均长度满足下列不等式
H(X ) H(X ) K 1 log m log m
5.2 无失真信源编码
离散平稳无记忆序列变长编码定理:对于平 均符号熵为HL(X)的离散平稳无记忆信源,必 存在一种无失真编码方法,使平均信息率满 足不等式
5.2 无失真信源编码
( X) Pe 2 L
2
为自信息方差 2 2(X ) 均为定值时,只要L 为一正数。当 和 足够大,Pe可以小于任一正数。即,
2 ( X) 2 L
2 2 ( X ) E {[ I ( x ) H ( X )] } i 式中
5.2 无失真信源编码
i 1
若要求译码错误概率 10
-6
2(X ) 7.82 7 8 L 9 . 8 10 10 2 0.282 106
5.2 无失真信源编码
变长编码定理
在变长编码中,码长K是变化的 根据信源各个符号的统计特性,如概率大的 符号用短码,概率小的用较长的码,使得编 码后平均码长降低,从而提高编码效率。 (统计匹配)
i 1
8
5.2 无失真信源编码
对信源符号采用定长二元编码,要求编码效 = 90%,若取L=1,则可算出 率 为
K =2.55 9ห้องสมุดไป่ตู้%=2.8比特/符号
Pe=0.04 太大
5.2 无失真信源编码
H(X ) = 0.90, H(X )
8
0.28
2 ( X ) D[ I ( xi )] pi (log pi ) 2 [ H ( X )]2 7.82(bit) 2
H L ( X) 1 KL log m L
L取无限长
5.2 无失真信源编码
例 设离散无记忆信源概率空间为
a2 a3 a 4 a5 a6 a7 a8 X a1 P =0.4 0.18 0.1 0.1 0.07 0.06 0.05 0.04
H ( X ) pi log pi 2.55比特/符号
累加概 率Pi
0 0.2 0.39 0.57 0.74 0.89 0.99
-log p(ai)
码字长 度Ki
3 3 3 3 3 4 7
码字
2.32 2.39 2.47 2.56 2.74 3.32 6.64
000 001 011 100 101 1110 1111110
5.2 无失真信源编码
K p(ai ) K i 3.14 码元/符号
i 1 7
H ( X ) 2.61 R 0.831 比特/码元 3.14 K
5.2 无失真信源编码
费诺编码方法 费诺编码属于概率匹配编码
(1)将信源消息符号按其出现的概率大小依次 排列:p1 p2 pn 。 (2)将依次排列的信源符号按概率值分为两大 组,使两个组的概率之和近于相同,并对 各组赋予一个二进制码元“0”和“1”。
5.2 无失真信源编码
L=3
R3=0.985比特/二元码符号 L=4
R4=0.991比特/二元码符号
5.2 无失真信源编码
定长二元码编码,要求编码效率达到96% -5 时,允许译码错误概率 10
2
(X )
2
p (log p )
i i i 1
2
[ H ( X )]
2
0.4715 (bit) 2
为编码效率,即信源的平均符号熵为H(X), 采用平均符号码长为 K 来编码,所得的效 率。 编码效率总是小于1,且最佳编码效率为
H L ( X) , 0 H L ( X)
5.2 无失真信源编码
编码定理从理论上阐明了编码效率接近1的理 想编码器的存在性,它使输出符号的信息率 与信源熵之比接近于1,即
2 ( X) 当信源序列长度L满足 L 2 时,
能达到差错率要求 P e
( X) 2 L
2
5.2 无失真信源编码
在连续信源的情况下,由于信源的信息量趋 于无限,显然不能用离散符号序列Y来完成无 失真编码,而只能进行限失真编码。
5.2 无失真信源编码
定义

H L ( X) K
码字所能携带的信息量大于信源序列输出 的信息量,则可以使传输几乎无失真,当 然条件是L足够大。
5.2 无失真信源编码
反之,当K H L (X) 时,不可能构成无失真的 编码,也就是不可能做一种编码器,能使收 端译码时差错概率趋于零。
K H L ( X)
时,则为临界状态,可能无失真,也 可能有失真。
2
i 1
4
Ki
2 2
1
2
2
2
2
3
9 1 8
因此不存在满足这种Ki的唯一可译码。
5.1 编码的定义
{1,01,001,000}
惟一可译码;
0 0 0 a4=000 1 a3=011 1 a2=01 1 a1=1
{1,01,101,000} 不是惟一可译码; 均满足克劳夫特不等式
例 设离散无记忆信源的概率空间为
X a1 P 3 4 a2 1 4
5.2 无失真信源编码
1 3 4 H ( X ) log 4 log 0.811 bit / 符号 4 4 3
若用二元定长编码(0,1)来构造一个即 时码: 。 平均码长 = 1二元码符号/信源符号
排列
p1 p2 pn
确定满足下列不等式的整数码长Ki。
-log2 pi Ki log2 pi 1
5.2 无失真信源编码
3. 为了编成唯一可译码,计算第i个消息的累 加概率 i 1
Pi pa k
k 1
4. 将累加概率Pi变换成二进制数。
相关文档
最新文档