第5章 限失真信源编码
合集下载
第5章 限失真信源编码

R(D) min I(X ;Y) min
Pij PD
Pij PD
n i1
m j 1
p(xi
)
p( y
j
/
xi
) log
p(y j / p( y j
xi) )
其单位是比特/信源符号。
应当注意,在研究R(D)时,我们引用的条件概 率 p(y / x)并没有实际信道的含义,只是为了求
平均互信息的最小值而引用的、假想的可变试
第5章 限失真信源编码
1. 信息率失真函数
2. 限失真信源编码定理
3. 常用信源编码方法
第三章我们讨论了无失真信源编码。但是,在很多 场合,特别是对于连续信源,因为其绝对熵为无限 大,若要求无失真地对其进行传输,则要求信道的 信息传输率也为无限大,这是不现实的。因此也就 不可能实现完全无失真传输。
显然或者是最小值不变,或者是变小了,所以 R(D)是非增的。
关于R(D)的连续性,这里我们就不再证明了。 所以,R(D)有如下基本性质: • R(D) 0,定义域为 0 ~ Dma,x 当 D Dm时ax ,
R(D)=0。 • R(D)是关于D的连续函数。 • R(D)是关于D的严格递减函数。
因此,当规定了允许失真,又找到了适当的失真
函数 dij ,就可以找到该失真条件下的最小信息
率R(D),用不同的方法进行数据压缩时(在允 许的失真限度D内),其压缩的程度如何,可以 用R(D)来衡量。由它可知是否还有压缩潜力, 有多大的压缩潜力。因此,有关R(D)的研究也 是信息论领域的一个研究热点。
0 1
1 0
求 Dmax
解:Dmax min d ' ( y) min p(x)d (x, y)
信息论与编码第5章限失真信源编码

4 1 0
第一节 失真测度
• 以上所举的三个例子说明了具体失真度的定义. 一般情况下根据实际信源的失真, 可以定义不同 的失真和误差的度量.
• 另外还可按照其他标准, 如引起的损失、风险、 主观感受上的差别大小等来定义失真度d(ui,vj).
• 从实用意义上说, 研究符号实际信源主观要求的、 合理的失真函数是很重要的.
第一节 失真测度
设信源变量为U={u1,…,ur}, 接收端变量为 V={v1,…,vs}, 对于每一对(u,v), 指定一个非负 函数
d(ui,vj)≥0 称为单个符号的失真度(或称失真函数). 失真函数用来表征信源发出符号ui, 而接收端再现 成符号vj所引起的误差或失真. d越小表示失真越小, 等于0表示没有失真.
➢ 应该指出, 研究R(D)时, 条件概率p(v|u)并没有 实际信道的含义. 只是为了求互信息的最小值而引 用的、假想的可变试验信道. ➢ 实际上这些信道反映的仅是不同的有失真信源编 码或信源压缩. 所以改变试验信道求平均互信息最 小值, 实质上是选择编码方式使信息传输率为最小.
率失真理论与信息传输理论的对偶关系
– 接收端获得的平均信息量可用平均互信息量I(U;V)表示;
– 这就变成了在满足保真度准则的条件下 D D 找平均互信息量I(U;V)的最小值.
,寻
– 因为BD是所有满足保真度准则的试验信道集合, 即可以 在D失真许可的试验信道集合BD中寻找某一个信道 p(vj|ui), 使I(U;V)取最小值.
本章所讨论的内容是量化、数模转换、频带 压缩和数据压缩的理论基础.
前言
本章主要介绍信息率失真理论的基本内容, 侧 重讨论离散无记忆信源.
首先给出信源的失真度和信息率失真函数的定 义与性质, 然后讨论离散信源的信息率失真函数计 算. 在这个基础上论述保真度准则下的信源编码定 理.
第一节 失真测度
• 以上所举的三个例子说明了具体失真度的定义. 一般情况下根据实际信源的失真, 可以定义不同 的失真和误差的度量.
• 另外还可按照其他标准, 如引起的损失、风险、 主观感受上的差别大小等来定义失真度d(ui,vj).
• 从实用意义上说, 研究符号实际信源主观要求的、 合理的失真函数是很重要的.
第一节 失真测度
设信源变量为U={u1,…,ur}, 接收端变量为 V={v1,…,vs}, 对于每一对(u,v), 指定一个非负 函数
d(ui,vj)≥0 称为单个符号的失真度(或称失真函数). 失真函数用来表征信源发出符号ui, 而接收端再现 成符号vj所引起的误差或失真. d越小表示失真越小, 等于0表示没有失真.
➢ 应该指出, 研究R(D)时, 条件概率p(v|u)并没有 实际信道的含义. 只是为了求互信息的最小值而引 用的、假想的可变试验信道. ➢ 实际上这些信道反映的仅是不同的有失真信源编 码或信源压缩. 所以改变试验信道求平均互信息最 小值, 实质上是选择编码方式使信息传输率为最小.
率失真理论与信息传输理论的对偶关系
– 接收端获得的平均信息量可用平均互信息量I(U;V)表示;
– 这就变成了在满足保真度准则的条件下 D D 找平均互信息量I(U;V)的最小值.
,寻
– 因为BD是所有满足保真度准则的试验信道集合, 即可以 在D失真许可的试验信道集合BD中寻找某一个信道 p(vj|ui), 使I(U;V)取最小值.
本章所讨论的内容是量化、数模转换、频带 压缩和数据压缩的理论基础.
前言
本章主要介绍信息率失真理论的基本内容, 侧 重讨论离散无记忆信源.
首先给出信源的失真度和信息率失真函数的定 义与性质, 然后讨论离散信源的信息率失真函数计 算. 在这个基础上论述保真度准则下的信源编码定 理.
第5章限失真信源编码.

第5章 限失真信源编码
例 题:
0 1 1/2 删除信道 X {0 , 1} , Y {0 , 1, 2} , D ,求 Dmin 1 0 1/2
5.2 信息率失真函数
第5章 限失真信源编码
5.2.1 信息率失真函数的一般概念
如果信源和失真度给定,则根据式( 5-3) , D 就只与信道特性有关,把所有满足保真度 准则 D ≤ D 的信道集中起来,构成一个所谓 D 失真允许的试验信道集合,记为 PD ,即:
PD = p( y j | xi ); D ≤ D ; i = 1 , 2 , , m ; j = 1 , 2 , ,n
yn p( y 2 ) p( y n ) y2
对于每一对 ( xi , y j ) ,指定一个非负的函数 d ( xi , y j ) ≥ 0, i 1 , 2 , , m ; j 1 , 2 , , n , 称 d ( xi , y j ) 为单位符号的失真度或失真函数,用它来表示信源发出一个符号 x i ,而在接收端再 现为 y j 所引起的误差或失真的大小。通常较小的 d 值代表较小的失真,而 d ( xi , y j ) 0 表示没 有失真。由于信源 X 有 m 个符号,信道传输 Y 有 n 个符号,所以 d ( xi , y j ) 有 m n 个,这 m n 个非负的函数可以排列成矩阵形式,即:
第5章 限失真信源编码
汉明失真矩阵 D 通常为方阵,且对角线上的元素为 0。即:
0 1 D 1
D 是 m m 阶方阵。
例 题:
1 1 1 0 1 1 1 1 0
设信道输入 X {0 , 1} ,输出 Y {0 , 1 , 2} ,规定失真函数 d (0 , 0) d (1 , 1) 0 , d (0 , 1) d (1 , 0) 1 , d (0 , 2) d (2 , 0) 0.5 ,求 D 。 解:由失真函数和失真矩阵可得出:
第5章2无失真和限失真信源编码

i 1 2
28
5.2.3
最佳变长编码
最佳变长编码 凡是能载荷一定的信息量,且码字的 平均长度最短,可分离的变长码的码字集 合称为最佳变长码。
29
5.2.3
最佳变长编码
能获得最佳码的编码方法主要有:
香农(Shannon)
费诺(Fano)
哈夫曼(Huffman)等
30
5.2.3
最佳变长编码
2
2.83
7.11
Pe=0.04 太大
16
5.2.1
定长编码定理
0.28
H(X ) = 0.90, H(X )
2 8 i 1
( X ) D[ I ( xi )] pi (log pi ) 2 [ H ( X )]2 7.82(bit) 2
若要求译码错误概率 10-6
对于平均符号熵为 HL(X) 的离散平稳 无记忆信源,必存在一种无失真编码方法, 使平均信息率满足不等式
H L (X) K H L (X)
其中为任意小正数。
20
5.2.2
变长编码定理
用变长编码来达到相当高的编码效率, 一般所要求的符号长度 L可以比定长编码小得 多。 编码效率的下界:
编码。
12
5.2.1
定义
定长编码定理
H L ( X) K
为编码效率,即信源的平均符号熵为H(X), 采用平均符号码长为 来编码,所得的效 K 率。 编码效率总是小于1,且最佳编码效率为
H L ( X) , 0 H L ( X)
13
5.2.1
定长编码定理
编码定理从理论上阐明了编码效率接 近1的理想编码器的存在性,它使输出符号 的信息率与信源熵之比接近于1,即
28
5.2.3
最佳变长编码
最佳变长编码 凡是能载荷一定的信息量,且码字的 平均长度最短,可分离的变长码的码字集 合称为最佳变长码。
29
5.2.3
最佳变长编码
能获得最佳码的编码方法主要有:
香农(Shannon)
费诺(Fano)
哈夫曼(Huffman)等
30
5.2.3
最佳变长编码
2
2.83
7.11
Pe=0.04 太大
16
5.2.1
定长编码定理
0.28
H(X ) = 0.90, H(X )
2 8 i 1
( X ) D[ I ( xi )] pi (log pi ) 2 [ H ( X )]2 7.82(bit) 2
若要求译码错误概率 10-6
对于平均符号熵为 HL(X) 的离散平稳 无记忆信源,必存在一种无失真编码方法, 使平均信息率满足不等式
H L (X) K H L (X)
其中为任意小正数。
20
5.2.2
变长编码定理
用变长编码来达到相当高的编码效率, 一般所要求的符号长度 L可以比定长编码小得 多。 编码效率的下界:
编码。
12
5.2.1
定义
定长编码定理
H L ( X) K
为编码效率,即信源的平均符号熵为H(X), 采用平均符号码长为 来编码,所得的效 K 率。 编码效率总是小于1,且最佳编码效率为
H L ( X) , 0 H L ( X)
13
5.2.1
定长编码定理
编码定理从理论上阐明了编码效率接 近1的理想编码器的存在性,它使输出符号 的信息率与信源熵之比接近于1,即
第五章信源编码

(每个符号有m种可能值)进行定长编码。对任意的 0,0
只要
KLHL(X)ε L logm
,则:当L足够大时,必可使译码差
错小于 (几乎无失真编码);反之,当 KLHL(X)2ε L logm
时,译码差错一定是有限值,而当L足够大时,译码几乎必定 出错(译码错误概率接近于1)。
1、解释: KL/L-----编码时,每个信源符号输出的 码长。即每个信源符
其中:左边--KL长码字所能携带的最大信息量, 右边--L长信源序列携带的信息量。
定理表明,只要码字所能携带的信息量大于信源序列输出的信 息量,则可以实现几乎无失真编码,当然条件是L足够大。 反之,不可能实现无失真的编码,也就是不可能做一种编码 器,能使收端译码时差错概率趋于零。
2、举例: (1 单 ) 符号 X A 信 {a1,a源 2...8} ., .n,a 8 ,等,L 概 1 。 分 H 1(X )H (X )lb3 8b /信 it 源符号。 若进行二进B制 {0编 ,1}m ,码 2,据定理,只要 K LLKLH lo(X g)m 3码元 /信源符号,就 无可 失以 真实 编现 码 事实上 3位,二进制码确实示 可8种 以信 表源符号。
或映射规则 元 b 转 j,j换 1,2..m 成 .构由 成码 的码 (也元 称序 为列
y i,i1,2..n.L。
f:xiyi
码K 长 L, i i1,2..n.L .; 平 均_KL 码 nL长 KLPi(: yi)码/元 符 号 序
i1 _
定长编 KL1 码 KL: 2...K .L .L n.KL, KLKL
注:奇异码一定非惟一可译。(非奇异码则不一定)
4、即时码和非即时码:
收到一个完整的码字后能立即译码,或曰及时可译---即时码
第5章 无失真信源编码定理

5.1 编码器
编码器可以看作这样一个系统,它的输入端为原始信 源S,其符号集为 S {S1, S2 ,..., Sq };而信道所能传输的符号集 为 X {x1, x2 ,..., xr } 编码器的功能是用符号集X中的元素,将 原始信源的符号 S i 变换为相应的码字符号 wi ,所以编码器 输出端的符号集为 C :{W1,W2 ,...,Wq }
0
0 0
01
001 0001
树枝数——码的数
节数——码长 端点——码字 满树——等长码 非满树——变长码
码4的树图
码3的树图
在每个节点上都有r个分枝的树称为整树,否则称为非 整树。即时码的树图还可以用来译码。
5.5.3 克拉夫特(Kraft)不等式
定理5.4 对于码符号为 X {x1 , x2 ,..., xr } 的任意即时码,其 码字为 W1 ,W2 ,...,Wq 所对应的码长为 l1 , l2 ,..., lq ,则必定满
第5章 无失真信源编码定理
◆ 编码器 ◆ 等长码 ◆ 等长信源编码定理 ◆ 变长码
◆ 变长信源编码定理
引 言
1、信源编码:以提高通信有效性为目的的编码。通常通 过压缩信源的冗余度来实现。采用的一般方法是压缩每
个信源符号的平均比特数或信源的码率。即同样多的信
息用较少的码率传送,使单位时间内传送的平均信息量 增加,从而提高通信的有效性。
但码3和码4也不太一样,码4称作逗点码,只要收到1,就
可以立即作出译码;而码3不同,当收到一个或几个码时,
必须参考后面的码才能作出判断。 定义 在唯一可译码中,有一类码,它在译码是无须参考 后面的码字就可以作出判断,这种码称为即时码。 定义 如果一个码组中的任一个码字都不是另一个码字 的续长,或者说,任何一个码字后加上若干码元后都不是
信息论:第5章 无失真信源编码定理

19
(4)非奇异码 若一组码中所有码字都不相同(即所有信源符 号映射到不同的码符号序列),则称为非奇异码。
si s j Wi W j
则称码C为非奇异码。
si , s j S Wi ,W j C
20
(5)奇异码
若一组码中有相同的码字,则为奇异码。
si s j Wi W j
30
即时码(异前缀码)一定是唯一可译码。因为,如果没 有一个码字是其他码字的前缀,则在译码过程中,当收到一 个完整码字的码符号序列时,无需考虑下一个符号,就能直 接把它译成对应的码字或信源符号。
31
32
33
5.2
等长码
一般说来,若要实现无失真的编码,这不但要求 信源符号与码字是一一对应的,而且要求码符号序 列的反变换也是唯一的。也就是说,所编的码必须 是唯一可译码。否则,所编的码不具有唯一可译码 性,就会引起译码带来的错误与失真。
11
超过信宿的灵敏度和分辨力所传送的信息是毫无 意义的,也是完全没有必要的。 比如话声信源,界别过多的划分,人耳就很难分 辨。图像信源亦是如此,人们看电影,当图片超过每 秒25张以上时,人眼就能将离散的照片在人脑内反映 成连续画面。
此时,就应该引入限定失真条件下的信源编码问题 。
12
5.1
编码器
32272781179同样可以求得信源序列长度增加到3和4时进行变长编码所得的编码效率和信息传输率分别为如果对这一信源采用等长二元码编码要求编码效率达到96允许译码错误概率105则可以算出自信息方差为98580需要的信源序列长度为可以看出使用等长编码时为了使编码效率较高96需要对非常长的信源序列进行编码且总存在译码差错
此式表明,只有当 l长的 S s1 , , sq ,有 q 个符号,那么它的N次扩展信 码符号序列数大于或等于N次 源 S N 1 , , N 共有 q N 个符号。 q 扩展信源的符号数时,才可
(4)非奇异码 若一组码中所有码字都不相同(即所有信源符 号映射到不同的码符号序列),则称为非奇异码。
si s j Wi W j
则称码C为非奇异码。
si , s j S Wi ,W j C
20
(5)奇异码
若一组码中有相同的码字,则为奇异码。
si s j Wi W j
30
即时码(异前缀码)一定是唯一可译码。因为,如果没 有一个码字是其他码字的前缀,则在译码过程中,当收到一 个完整码字的码符号序列时,无需考虑下一个符号,就能直 接把它译成对应的码字或信源符号。
31
32
33
5.2
等长码
一般说来,若要实现无失真的编码,这不但要求 信源符号与码字是一一对应的,而且要求码符号序 列的反变换也是唯一的。也就是说,所编的码必须 是唯一可译码。否则,所编的码不具有唯一可译码 性,就会引起译码带来的错误与失真。
11
超过信宿的灵敏度和分辨力所传送的信息是毫无 意义的,也是完全没有必要的。 比如话声信源,界别过多的划分,人耳就很难分 辨。图像信源亦是如此,人们看电影,当图片超过每 秒25张以上时,人眼就能将离散的照片在人脑内反映 成连续画面。
此时,就应该引入限定失真条件下的信源编码问题 。
12
5.1
编码器
32272781179同样可以求得信源序列长度增加到3和4时进行变长编码所得的编码效率和信息传输率分别为如果对这一信源采用等长二元码编码要求编码效率达到96允许译码错误概率105则可以算出自信息方差为98580需要的信源序列长度为可以看出使用等长编码时为了使编码效率较高96需要对非常长的信源序列进行编码且总存在译码差错
此式表明,只有当 l长的 S s1 , , sq ,有 q 个符号,那么它的N次扩展信 码符号序列数大于或等于N次 源 S N 1 , , N 共有 q N 个符号。 q 扩展信源的符号数时,才可
第五章 信源编码LVRH1010

解:将信源通过一个二元信道传输,就必须把信源符号si变换 成由0,1符号组成的码符号序列,即进行编码。可以用不同 的二元码符号序列与信源符号 一一对应,就得到不同的码。
信源符号 P(si) s1 s2 s3 s4 P(s1) P(s2) P(s3) P(s4) 码1 00 01 10 11 码2 0 01 001 111 5.1 编码的定义 定长码 变长码 二次扩展信源符号 二次扩展码字 S1=S1S1 s2=S1S2 …… s4=S4S4 00 001 …… 111111
l ≥ log r q = 5
分析:考虑到符号出现的概率以及符号之间的相关性后,实际平均每 分析 个英文电报符号所提供的信息量约1.4bit,远小于5bit,因此定长编码 后,每个码字只载1.5bit信息,5个二进制符号最大能载5bit信息 ,因 此,定长编码的信息传输效率低。 解决方案: 解决方案 (1)对于不会出现的符号序列不予编码,这样不会造成误差; (2)对于概率非常小的信源符号序列不予编码,这样可能会造成一 定误差,但当信源符号序列N足够大,误差概率非常小
第五章 信源编码 五
问题
• 对信源有两个重要问题 1. 信源输出的信息量的度量问题 度量问题; 度量问题 2. 如何更有效地 有效地表示信源输出的问题 输出的问题; 有效地 输出的问题
信源输出的符号序列,经过信源编码,变换成 适合信道传输的符号序列,同时,在不失真或允许 一定失真的条件下,用尽可能少的码符号来传递信 源消息,提高信息传输的效率。
i =1 8
a7 0.05
a8 , 0.04
HL (X ) 2 .55 得K = = 2.83bit / 符号 90 % K 即每个符号用 2.83bit 进行定长二元编码,共 有 2 2.83 = 7.11种可能性 若取 L = 1,据 η = 根据 η = H( X ) = 0.9 ⇒ ε = 0 .28 H (X ) + ε
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
即使对于离散信源,由于处理的信息量越来
越大,使得信息的存储和传输成本很高,而 且在很多场合,过高的信息率也没有必要, 例如:由于人耳能够接收的带宽和分辨率是 有限的,因此对数字音频传输的时候,就允 许有一定的失真,并且对欣赏没有影响。又 如对于数字电视,由于人的视觉系统的分辨 率有限,并且对低频比较敏感,对高频不太 敏感,因此也可以损失部分高频分量,当然 要在一定的限度内。等等…,这些,都决定 了限失真信源编码的重要性。
R( D) min I ( X ; Y ) min
Pij PD
Pij PD
p( x ) p( y
i i 1 j 1
n
m
j
/ xi ) log
p( y j / xi) p( y j )
其单位是比特/信源符号。 应当注意,在研究R(D)时,我们引用的条件概 率 p( y / x) 并没有实际信道的含义,只是为了求 平均互信息的最小值而引用的、假想的可变试 验信道。实际上这些信道反应的仅是不同的有 失真信源编码,或称信源压缩。所以改变试验 信道求最小值,实质上是选择一种编码方式式 信息传输率为最小,也就是在保真度准则
平均每个符号的平均失真度为
1 D D ( L) L L
k 1
当信源无记忆时,D ( L) Dk ,而
1 D L
D
k 1
L
k
若平均失真度不大于我们所允许的失真D,即
DD
我们称此为保真度准则。 四、信息率失真函数 在信源给定,并且也定义了具体的失真函数之 后,我们总是希望在满足一定的失真限度要求 的情况下,使信源最后输出的信息率R尽可能地 小。也就是说,要在满足保真度准则下( D D), 寻找信源输出信息率R的下限值。如果将信源编 码也看成是一个信道,构成了一类假想信道,
设信源输出的符号序列为 x [x1 , x 2 ,, x L ] ,其
中的每一个随机变量 x i 取自同一符号集 x i [ x1 , x2 ,, xr ] ,所以X共有 r L 种不同的符号序 列,记为 i ,接收到的符号为 Y [Y1 , Y2 ,, YL ] ] 式中每一个符号取自符号集 Yi [ y1 , y 2 ,, y s, 所以Y共有 s L 种不同的符号序列,记为 j ,则
显然或者是最小值不变,或者是变小了,所以 R(D)是非增的。 关于R(D)的连续性,这里我们就不再证明了。 所以,R(D)有如下基本性质: • R( D) 0,定义域为 0 ~ Dmax ,当 D Dmax 时, R(D)=0。 • R(D)是关于D的连续函数。 • R(D)是关于D的严格递减函数。
Dmax n p( x)d ( x, y )
Y X
Y
例题1:设输入输出符号表为X=Y={0,1}, 输入概率分布为 p( x) {1 / 3,2 / 3} ,失真矩阵为
d ( x1 , y1 ) d ( x1 , y2 ) 0 1 d 1 0 d ( x2 , y1 ) d ( x2 , y2 )
p( y )
Y
p( y )d ' ( y )
也就是说,要求 d ' ( y)的数学期望的最小值。这 个最小值是一定存在的。比如p( y) 这样分布:当 ' y j d 某一个 使得 ( y j ) 为最小时,就取 p( y j ) 1 ,而 ' d 其余的 p( yi ) 0, i j,此时求得的 ( y)的数学期 望一定是最小的。此时,有
下,使信源的压缩率最高。
五、信息率失真函数的性质 1. R(D)的定义域 R(D)的定义域,即D的取值范围。 (1)因为D是非负函数d(x,y)的数学期望, 因此D也是非负函数,其下界为0。此时,
意味着不允许失真,所以信道的信息率等于 信源的熵,即
R( D) R(0) H ( X )
(2)平均失真D也有一上界值 Dmax 。根据R(D)的 定义,R(D)是在一定的约束条件下,平均互信 息量I(X;Y)的最小值,其下界为0。R(D)和D的 关系曲线一般如下图所示。当D大到一定程度, R(D)就达到其下界0,我们定义这时的D为 Dmax。
在限失真信源编码里,一个重要的问题就是在
一定程度的允许失真限度内,能把信源信息压 缩到什么程度,即最少用多少比特数才能描述 信源。 这个问题已经被香农解决。香农在1948年的经 典论文中已经提到了这个问题,在1959年,香 农又在他的一篇论文“保真度准则下的离散信 源编码定理”里讨论了这个问题。研究这个问 题并做出较大贡献的还有前苏联的柯尔莫郭洛 夫(Kolmogorov)以及伯格(T. Berger)等。
误码失真:
0, xi y j d ( xi , y j ) ( x i , y j ) 1, 其它
也可以按其它的标准,如引起的损失、风险、 主观感觉上的差别等来定义失真函数。 二、平均失真 由于信源X和信宿Y都是随机变量,所以符号失 真度函数也是一个随机变量,传输时引起的平 均失真应该是符号失真度函数 d ( xi , y j ) 在信源概 率空间和信宿概率空间求平均,即
d L ( i , j )
d (x
k 1
L
ik , y jk )
失真函数矩阵应该是一个 r L s L 的矩阵。故对L 长的信源序列,其平均失真度为
D ( L)
p( x, y)d ( x, y) p( ,
i X ,Y i 1 j 1
r L sL
j )d ( i , j )
d被称为失真矩阵。
失真函数d ( xi , y j )的函数形式可以根据需要适当选 取,如平方代价函数、绝对代价函数、均匀代 价函数等: 2 d ( x , y ) ( x y ) 平方失真: i j i j d ( xi , y j ) xi y j 绝对失真: d ( xi , y j ) xi y j / xi 相对失真:
p( y1 ) 0, p( y2 ) 1 . 此时,
(2)R(D)函数的单调递减性和连续性 R(D)的单调递减性是很容易理解的。因为 允许的失真越大,所要求的信息率就可以越小。 根据R(D)的定义,他是在平均失真度小于或等 于允许失真度D的所有试验信道集合PD 中,取 I(X;Y)的最小值。当允许失真D扩大,则 PD 的 集合也扩大,当然仍然包含原来满足条件的所 有信道。这是在扩大了的PD 集合中找I(X;Y)的 最小值,
信息率失真理论矢量化、数摸转换、频带
压缩和数据压缩的理论基础。 本章主要介绍信息率失真理论的基本内容, 包括信源的失真度和信息率失真函数的定 义与性质,离散信源和连续信源的信息率 失真函数计算,介绍一些常用的限失真编 码方法等。
5.1 平均失真和信息率失真函数 一、失真函数 设某信源输出的随机变量为X,其值集合为 X {x1 , x2 ,, xn } ,经过编码后输出为 Y { y1 , y 2 ,, y m },设 x i 对应 y j ,如果 xi y j i 1,2, , n; j 1,2, , m 则认为没有失真。当 xi y j 时,就产生了 失真,失真的大小,用失真函数来衡量。 失真函数的定义为
Dmax的计算:
R(D)
设当平均失真 D Dmax 时, R(D)>0 R(D)=0 R(D)以达到其下界0。当允许 更大失真时,即 D Dmax时, D R(D)仍只能继续是0。因为当 Dmax X和Y统计独立时,平均互信息 I(X;Y)=0,可见当 D Dmax 时,信源X和接收符号Y ( y) x无关。 已经统计独立了,因此 p( y / x) p,与
称为D允许信道(或D失真许可的试验信道), 记为
PD { p( y / x) : D D}
对于离散无记忆信道,有
PD { p( y j / xi ) : D D; i 1,2,, n; j 1,2,, m}
我们的目的,就是要在上述允许信道PD 中,寻 找到一个信道P(Y/X),使得从输入端传送过来 的信息量最少,即I(X;Y)最小。这个最小的互信 息就称为信息率失真函数R(D),简称为率失真 函数,即
xi y j 0 d ( xi , y j ) a a 0 xi y j
由于输入符号有n个,输出符号有m个,所以 d ( xi , y j ) 共有 n m 个,写成矩阵形式,就是
d ( x1 , y1 ) d ( x1 , y m ) d d ( x , y ) d ( x , y ) n 1 n m
i 1
求 Dmax 2 min p ( xi ) d ( xi , y j ) 解: Dmax j 1, 2
1 1 2 1 2 min{ 2, 1 1} j 1, 2 3 2 3 3 3 3 min{ ,1} 1 j 1, 2 2
D
p(x, y)d (x, y) p(x , y )d (x , y ) p(x ) p( y / x )d (x , y )
i j i j i j i i j X ,Y i 1 j 1 i 1 j 1
n
m
n
m
平均失真是符号失真函数在信源空间和信宿空
间平均的结果,是描述某一信源在某一信道传 输时失真的大小,是从整体上描述系统的失真 情况。 三、信源符号序列的失真 从上面的单符号失真函数,可以得到信源符号 序列的失真函数和平均失真度。由于序列时相 当于是一个由单符号随机变量组成的随机矢量, 仿照单符号时的情况,可得:
. 而输出符号概率为 p( y1 ) 0, p( y2 ) 1
例题2:输入输出符号表同上题,失真矩阵为
1 d ( x1 , y1 ) d ( x1 , y 2 ) 1 d 2 d ( x2 , y1 ) d ( x2 , y 2 ) 2 1