限失真信源编码

合集下载

(信息论)第7章限失真信源编码

(信息论)第7章限失真信源编码



(7.5)
BD p y | x : D D

i 1, 2, , n ; j 1, 2, , m

7.2.2 信息率失真函数的定义 在 D 允许信道 BD 中可以寻找一个信道 pY | X ,使 给定的信源经过此信道传输时,其信道传输率 I X , Y 达到 最小,定义为信息率失真函数 RD ,也称为率失真函数, 即


1 n d n xi , y j d xik , y jk n k 1



信源编码过程是这样进行的:当信源发送序列 xi 时, 就从分组码 Y 中选取一个码字 y j,使失真最小,即
d n xi | Y min d n xi , y j
y j Y
(7.7)
所以分组码 Y 的平均失真度为


当采用随机编码方法时,考虑到接收端输出序列分
布q yj
,则分组码 Y 的平均失真度为
p xi q y j d n xi | Y (7.9)
N M i 1 j 1
dn Y E dn Y
对于分组码 M , n ,其最大速率为
7.2 信息率失真函数
7.2.1 D 允许信道(试验信道)
问题的提出 对于信息容量为 C的信道传输信息传输率为 R 的信 源时,如果 R C ,就必须对信源进行压缩,使其压缩 后信息传输率 R 小于信道容量 C,但同时要保证压缩 所引入的失真不超过预先规定的限度。 保真度准则
如果预先规定的平均失真度为 D ,则称信源压缩后 的失真度 D 不大于 D 的准则为保真度准则,即保真度 准则满足
,则平均失真度为

第5章 限失真信源编码

第5章 限失真信源编码

R(D) min I(X ;Y) min
Pij PD
Pij PD
n i1
m j 1
p(xi
)
p( y
j
/
xi
) log
p(y j / p( y j
xi) )
其单位是比特/信源符号。
应当注意,在研究R(D)时,我们引用的条件概 率 p(y / x)并没有实际信道的含义,只是为了求
平均互信息的最小值而引用的、假想的可变试
第5章 限失真信源编码
1. 信息率失真函数
2. 限失真信源编码定理
3. 常用信源编码方法
第三章我们讨论了无失真信源编码。但是,在很多 场合,特别是对于连续信源,因为其绝对熵为无限 大,若要求无失真地对其进行传输,则要求信道的 信息传输率也为无限大,这是不现实的。因此也就 不可能实现完全无失真传输。
显然或者是最小值不变,或者是变小了,所以 R(D)是非增的。
关于R(D)的连续性,这里我们就不再证明了。 所以,R(D)有如下基本性质: • R(D) 0,定义域为 0 ~ Dma,x 当 D Dm时ax ,
R(D)=0。 • R(D)是关于D的连续函数。 • R(D)是关于D的严格递减函数。
因此,当规定了允许失真,又找到了适当的失真
函数 dij ,就可以找到该失真条件下的最小信息
率R(D),用不同的方法进行数据压缩时(在允 许的失真限度D内),其压缩的程度如何,可以 用R(D)来衡量。由它可知是否还有压缩潜力, 有多大的压缩潜力。因此,有关R(D)的研究也 是信息论领域的一个研究热点。
0 1
1 0
求 Dmax
解:Dmax min d ' ( y) min p(x)d (x, y)

信息论与编码民大06限失真信源编码

信息论与编码民大06限失真信源编码

23-Oct-18
21/49
离散信源率失真函数的参量表达式
(2) 离散信源的信息率失真函数
已知平均互信息在(4.2.5)的条件限制下求I(X;Y)的极值, 引入参量S和μi(i=1,2,…,n),构造一个新函数ф (4.2.6) (S 和μi 为待定参量)
23-Oct-18
22/49
离散信源率失真函数的参量表达式


理论上“消息完全无失真传送”的可实现性 信道编码定理:无论何种信道,只要信息率 R=(Klog2 m)/L 小于信道容量C,总能找到一种编码,使在信道上能以任 意小的错误概率和任意接近于C的传输率来传送信息。反 之,若R>C,则传输总要失真。 实际上“消息完全无失真传送”的不可实现性 实际的信源常常是连续的,信息率无限大,要无失真传送 要求信道容量C为无穷大; 实际信道带宽是有限的,所以信道容量受限制。要想无失 真传输,所需的信息率大大超过信道容量R>>C。
引入一个失真函数,计算在失真度一定的情况下信息率的 极小值就变成有意义了。
4/49


23-Oct-18
信息率与失真的关系


信道中固有的噪声和不可避免的干扰,使信源的消息通 过信道传输后造成误差和失真 误差或失真越大,接收者收到消息后对信源存在的不确 定性就越大,获得的信息量就越小,信道传输消息所需 的信息率也越小。

研究信道容量的意义:是为了解决在已知信道中传送最大 信息率问题。目的是充分利用已给信道,使传输的信息量 最大而发生错误的概率任意小,以提高通信的可靠性。这 就是信道编码问题。
23-Oct-18
15/49
信息率失真函数的性质

率失真函数的定义域

第5章2无失真和限失真信源编码

第5章2无失真和限失真信源编码
i 1 2
28
5.2.3
最佳变长编码
最佳变长编码 凡是能载荷一定的信息量,且码字的 平均长度最短,可分离的变长码的码字集 合称为最佳变长码。
29
5.2.3
最佳变长编码
能获得最佳码的编码方法主要有:

香农(Shannon)


费诺(Fano)
哈夫曼(Huffman)等
30
5.2.3
最佳变长编码
2
2.83
7.11
Pe=0.04 太大
16
5.2.1
定长编码定理
0.28
H(X ) = 0.90, H(X )
2 8 i 1
( X ) D[ I ( xi )] pi (log pi ) 2 [ H ( X )]2 7.82(bit) 2
若要求译码错误概率 10-6
对于平均符号熵为 HL(X) 的离散平稳 无记忆信源,必存在一种无失真编码方法, 使平均信息率满足不等式
H L (X) K H L (X)
其中为任意小正数。
20
5.2.2
变长编码定理
用变长编码来达到相当高的编码效率, 一般所要求的符号长度 L可以比定长编码小得 多。 编码效率的下界:
编码。
12
5.2.1
定义
定长编码定理

H L ( X) K
为编码效率,即信源的平均符号熵为H(X), 采用平均符号码长为 来编码,所得的效 K 率。 编码效率总是小于1,且最佳编码效率为
H L ( X) , 0 H L ( X)
13
5.2.1
定长编码定理
编码定理从理论上阐明了编码效率接 近1的理想编码器的存在性,它使输出符号 的信息率与信源熵之比接近于1,即

第6章 限失真信源编码

第6章 限失真信源编码
m ax


i 1 s
r
s
P (u i ) P (v j ) d (u i , v j )
j 1
所以, D 就是在R(D)=0的情况下,D 的最小值
D max min
P (u
i 1 j 1
r
i
) P ( v j ) d (u i , v j )
信息率失真函数的性质
1、R ( D ) 的定义域是 [0, D m ax ] 2、R ( D ) 是D的下凸函数 3、R ( D ) 是定义域上的非增函数
对连续信源进行 熵压缩编码是绝 对必需的
说明
• 有失真的熵压缩编码主要针对连续信源,但其理论同样适 用于离散信源。 • 由于离散信源处理起来比连续信源简单得多,以下将从离 散信源开始有失真编码的讨论。
主要内容
6.1 失真测度 6.2 信息率失真函数及其性质 6.3 限失真信源编码定理 总结
6.1 失真测度
r
取统计平均
P (u , v
i i 1 r j 1 s
s
j
) d (u i , v j )
P (u
i 1 j 1
i
) P ( v j | u i ) d (u i , v j )
符号序列的失真度
信源
U
{u 1 , u 2 , , u r }
信道 (信源编码器)
1 2 N
V
符号的失真度
d (u i , v j )
{ v1 , v 2 , , v s }
N长输入序列 N长输出序列
h uh uh uh
h 1, 2, , r l 1, 2, , s
N
N

第七章:限失真编码1

第七章:限失真编码1


验证:找到满足R(D)的试验信道,验证其正确性 结果分析:R(D)曲线分析
§7.3:率失真函数-8
R(D)(比特/自由度)
1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0
2 1 2 log D D R( D) 2 0 D

研究方法:

抽象信道 虚拟试验信道

§7.1:概述-8

方法:

抽象:将与讨论重点关系小的部分抽象

因为涉及信源编码,对信道进行抽象 信道编码→信道→信道译码 信道* 信道*可以略去

根据信道编码定理 信道*是一个没有干扰的广义信 道,信宿收到信息的失真只来自于信源编码
§7.1:概述-9

验证:找到满足R(D)的试验信道,验证其正确性 结果分析:R(D)曲线分析
§7.3:率失真函数-6
R(D)(比特/符号) 1.0 0.8 0.6 0.4 0.2 0.1 D
H ( ) H ( D) 0 D R( D) 0 D ω=0.5

失真度定义
平均失真度 保真度准则 试验信道



§7.2:失真的度量-2

失真度定义


在U,V联合空间上定义: d(ui,vj),ui∈U, vj∈V 为U,V的失真测度。 d(ui,vj)有距离的概念

性质1:ui=vj时,d=0 性质2:min d=0 性质3:0<d< ∞
§7.2:失真的度量-3

§7.3:率失真函数-1

问题引出

度量了失真,进一步关心的问题是:

信息论_限失真信源编码

信息论_限失真信源编码

信息论的旅程本章将着重讨论允许一定失真的条件下可把信源信 息压缩到什么程度。

第七章 限失真信源编码三、信源的输出中含 有多少信息?四、传输信息的最高速 率(信道容量)2009-12-22五、无失真信源编码 六、有噪信道编码 九、实际信道编码方法七、限失真信源编码2主要内容1.1 概述 失真产生的原因信道噪声的干扰使得信息传输过程会产生差错; 当信息传输率超过信道容量时,必然产生差错; 信源熵是信源无失真压缩的极限,若再继续压缩 则会带来失真。

基本概念1. 概述 1. 概述 2. 系统模型 2. 系统模型失真测度 信息率失真函数 限失真信源编码定理3失真存在的合理性信宿的灵敏度和分辨率是有限的,不要求绝对无 失真; 允许失真的存在,可以提高信息传输率,从而降 低通信成本。

41.1 概述(续)1.2 系统模型 – 只讨论信源编码问题信源 编码 信道 编码 信道 干扰 信道 译码 信源 译码无失真信源压缩的极限:信源的信息熵 本章的研究内容在允许一定程度失真的条件下,能够把信 源信息压缩到什么程度,即最少需要多少 比特才能描述信源。

研究方法用研究信道的方法,来研究有失真信源压 缩问题。

5信源X 试验信道P(Y | X )Y 失真信源无失真 信源编码信道 编码61主要内容失真函数 d (x, y )2.1 失真测度 – 失真函数基本概念非负函数;函数形式可根据需要定义 1. 失真函数 1. 失真函数 2. 平均失真 2. 平均失真 定量描述发出符号与接收符号之间的差异 (失真)x2 L ⎡ X ⎤ ⎡ x1 ⎢ P ⎥ = ⎢ p(x ) p(x ) L ⎣ ⎦ ⎣ 1 2 xn ⎤ p(xn )⎥ ⎦失真测度信息率失真函数 限失真信源编码定理7Y : {y1 , y 2 , L , y m }失真矩阵⎡ d (x1,y1 ) d ( x1,y2 ) L d ( x1,ym )⎤ ⎢d ( x ,y ) d ( x ,y ) L d ( x ,y )⎥ 2 2 2 m ⎥ D=⎢ 2 1 ⎢ M ⎥ M M ⎢ ⎥ d (xn ,y1 ) d ( xn ,y2 ) L d ( xn ,ym )⎦ ⎣82.1 失真测度 – 失真函数(续)常用的失真函数有: (1) 汉明失真2.1 失真测度 – 失真函数 – 例题例7.1 设信道输入 X = {0,1},输出 Y = {0, ?,1} ,规定失 真函数 d(0, 0) = d(1, 1) = 0, d(0, 1) = d(1, 0) = 1, d(0, ?) = d(1, ?) = 0.5,求 D 。

2015秋.信息论.第5章限失真信源编码

2015秋.信息论.第5章限失真信源编码

r r 1 N 1 d N ( x , y ) d ( xi , yi ) d ( x1 , y1 ) d ( x2 , y2 ) d ( x3 , y3 ) N i 1 3
1 1 d3 000,000 d 0,0 d 0,0 d 0,0 0 0 0 0 3 3 1 1 1 d3 000,001 d 0,0 d 0,0 d 0,1 0 0 1 3 3 3
常见失真函数: 1. 汉明失真: 0, if x y, d ( x, y ) 1, if x y.
2. 平方失真:
2 d ( x, y ) (y x) .
3. 绝对失真: d (x, y ) y x
图像处理中,常用平方误差和绝对误差度量失真
9
若源符号集A包含r个符号,码符号集B包含s个符号,
5.1.2 平均失真
失真函数的数学期望称为平均失真。
D E[d ]
i
p( x y
i i j j
j
)d ( xi , y j )
p ( x ) p ( y
i j
| xi )d ( xi , y j ).
单个符号的 失真函数
信源特性
试验信 道特性
矢量平均失真: DN 1 E[ d N ] N 1 E[d ( xi , yi )] N i 1
13
例7.1.2 假定离散矢量信源N=3,输出矢量序列为X=X1X2X3, 其中Xi的取值为{0,1};经信道传输后的输出为Y=Y1Y2Y3, 其中Yi的取值为{0,1}。定义失真函数
d 0, 0 d 11 , 0 d 0, 1 d 1, 0 1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 L DL = ∑E[d ( xil , y jl )] L l =1 1 L = ∑Dl L l =1
13 13
我们已经知道I(X;Y)在固定信源概率分布 的条件下是I(X;Y)的下凸函数,因此变更p (bj / ai ) 就可求得I(X;Y) 的极小值。但是 只要X和Y相互统计独立,即p(bj / ai)= p(bj ),这个极小值就 =0,这样一来求极小值问题 就没有意义了。所以引入一个失真函数,计算 在一定失真度的情况下信息率的极小值。
n
n
Dm = ax
j =1,2,L,m
min
∑p d
i =1
i ij
31
例 设输入输出符号表为X 设输入输出符号表为 X= Y∈{0, 1},输入概率 分布p )={1 分布p(x)={1/3,2/3},失真矩阵为
d (a1 , b1 ) d(a1 , b2 ) 0 1 d= = 1 0 d (a2 , b1 ) d (a2 , b2 )
10
7.1.3 平均失真
单个符号间的平均失真度: D = E[d ] = ∑∑ p(xi y j )d ( xi , y j )
i j
= ∑∑ p( xi ) p( y j | xi )d ( xi , y j ).
i j
信源
试验信 道特性
单个符号的 失真函数
p(yj/xi )在此实质上代表编码方式。
{
}
19
把所有D失真许可的试验信道组成一个集合,用符 号PD表示,即: PD={P (yj /xi):
D
≤ D}
信源给定,且又具体定义了失真函数以后,总希望 在满足一定失真的情况下,使信源传输给收信者的信息 传输率R尽可能地小。即在满足保真度准则下,寻找信 源必须传输给收信者的信息率R的下限值-------------这个 下限值与D有关。 从接收端来看,就是在满足保真度准则下,寻找再 现信源消息所必须获得的最低平均信息量。 而接收端获得的平均信息量可用平均互信息I(X;Y) 来表示,这就变成了在满足保真度准则的条件下,寻找 平均互信息I(X;Y)的最小值。
是在 D≤ D的条件下,信源必须传输的最小平均信息量 ,即:R(D)。 • 率失真函数给出了熵压缩编码可能达到的最小熵率与 失真的关系,其逆函数称为失真率函数,表示一定信 息速率下所可能达到的最小的平均失真。
22
对于离散无记忆信源,R(D)函数可写成 对于离散无记忆信源,R(D)函数可写成
R(D) = min ∑∑ p(ai ) p(bj / ai ) log
R(D) = m I ( X ;Y ) in
P D
R(D)-------信息率失真函数或简称率失真函数 R(D)-------信息率失真函数或简称率失真函数。 率失真函数。 单位是奈特/信源符号 或 比特/信源符号
21
寻找平均互信息I(X;Y)的最小值。而PD是所有 满足保真度准则的试验信道集合,因而可以在D失真许 可的试验信道集合PD中寻找一个信道。 p(bj / aj ) , 使I(U;V) 取极小值。 由于平均互信息I(X;Y)是。 p(bj / aj )的上 凸函数,所以在PD集合中,极小值存在。这个最小值就
ij j i j j
Dmax = min D = min ∑ ∑ pi pijdij
pij pij i =1 j =1
n m
= min ∑ ∑ pi p jdij = min ∑ p j ∑ pidij
pj i =1 j =1 pj j =1 i =1
n m
m
n
需满足条件
∑p
j =1
m
j
=1
30
从上式观察可得: j=1 从上式观察可得:在j=1,…,m中,可找 到 ∑ pi dij值最小的j,当该j对应的pj=1,而 值最小的j 当该j对应的p i =1 其余p 为零时, 上式右边达到最小, 其余 pj 为零时 , 上式右边达到最小 , 这时 上式可简化成
——矢量(序列) 矢量(序列) 矢量 失真矩阵
99
7.1.3 平均失真
由于xi和yj都是随机变量,所以失真函 由于xi和yj都是随机变量,所以失真函 数d( xi,yj)也是随机变量。 d( xi,yj) xi,yj)也是随机变量。 xi,yj) 只能表示两个特定的具体符号xi,yj之间的 只能表示两个特定的具体符号xi,yj之间的 失真,为了能在平均的意义上表示信道每 传递一个符号所引起的失真的大小,定义 平均失真度 为失真函数的数学期望,即d xi,yj)在 为失真函数的数学期望,即d( xi,yj)在 X和Y的联合概率空间p(XY)中的统计平 的联合概率空间p XY)中的统计平 均值。
Pij ∈PD i =1 j =1
n
m
p(bj / ai ) p(bj )
p(ai),i=1,2,…,n 是信源符号概率分布; 是信源符号概率分布; p(bj/ai),i=1,2,…,n,j=1,2,…,m 是转移概率分布; 是转移概率分布; p(bj),j=1,2,…,m 是接收端收到符号概率分布。 是接收端收到符号概率分布。
第七章 限失真信源编码
3
图像压缩
8K
10K
14K
44
在实际问题中,信号有一定的失真是可以容忍的。 但是当失真大于某一限度后,信息质量将被严重 损伤,甚至丧失其实用价值。要规定失真限度, 必须先有一个定量的失真测度。为此可引入失真 函数。
5
7.1.1 失真函数
X={xi},xi∈{a1,…an} X={ 信源编码器 失真函数d(xi,yj) Y={yj},yj∈{b1,…bm} ,
11 11
平均失真度 D 是对给定信源分布p(ai) 经过某种转移概率分布为p(bj / ai)的 有失真信源编码器后产生失真的总体量 度。 注意:序列失真和平均失真的区别。
12
对于连续随机变量同样可以定义平均失真
D=∫∞Biblioteka −∞ −∞∫∞
pxy (x, y)d (x, y)dxdy
对于L长序列编码情况, 对于 长序列编码情况,平均失真为 长序列编码情况
15 15
x ∈{a1, a2,Lan}
X
信源编码器
y ∈{b1, b2,Lbn}
Y
假想信道 p(yj/xi) 信源符号编码概率 信道转移概率 ⇒
将信源编码器看作信道, 将信源编码器看作信道,信源编码器输出的信息率 R对应到信道 , 即为接收端 需要获得的有关 的信息 对应到信道, 即为接收端Y需要获得的有关 需要获得的有关X的信息 对应到信道 量,也就是互信息I(X;Y)。 也就是互信息 。
7
[d(x , y )] ,
i j
常见失真函数: 1. 汉明失真: 0, if x = y, d (x, y) = , if x ≠ y. 1
2. 平方误差失真: d (x, y) = y − x) ( .
2
例7-1
8
7.1.2 失真函数——序列失真函数 失真函数——
r r 设x = ( x1, x2 ,..., xN )与y = ( y1, y2 ,..., yN )分别为长度为N的源字 r r 和码字, x与y之间的矢量失真函数为 1 N r r d (x, y) = ∑d (xi , yi ). N i =1
d (a1, b1) d (a1, b2 ) L d (a1, bm ) d(a , b ) d(a , b ) L d(a , b ) 2 2 2 m d= 2 1 M M M d(an , b1) d (an , b2 ) L d(an , bm )
语音处理中,常用失真度量: Itakura-Saito 距离 图像处理中,常用失真度量: 平方误差失真
26
讨论
何时Dmin=0? 只有当失真矩阵中每行至少有一个零元素。
27
(2) D的上届。 D的上届 的上届。
R(Dmax)=0
Dmax和R(Dmax)
选择所有满足R(D)=0中D的最小值,定义为 = 中 的最小值 定义为R(D) 的最小值, 选择所有满足 定义域的上限D 定义域的上限 max,即
18
D允许试验信道
D = ∑ p( xi ) p ( y j / xi )d ( xi , y j )
i, j
若p(xi)和d(xi,yj)已定,则可给出满足 已定,
D≤D
条件的所有转移概率分布p 它们构成了一个信道集合P 条件的所有转移概率分布pij,它们构成了一个信道集合PD
P = p( y j / xi ) : D ≤ D D 称为D 称为D允许试验信道。
23
24
R(D)的物理意义
由互信息的关系式 可理解为互信息是信源熵H(X)与在噪声干扰下消失的信息量 H(X/Y)之差。 信息在存储和传输时需要去掉冗余,即对信源的原始信息在 允许的失真限度内可进行压缩。由于这种压缩损失了一定的 信息,造成一定的失真,把这种失真等效成由噪声而造成的 信息损失,看成一个等效噪声信道(试验信道)。
20
信息率失真函数R(D) 信息率失真函数R(D) I [p(xi), p(yj/xi)]
当p(xi)一定时,互信息I是关于p(yj/xi) 的U型凸函 一定时,互信息I是关于p 数,存在极小值(2.2节)。 存在极小值( 在上述允许信道P 在上述允许信道PD中, 可以寻找一种信道pij, 使 可以寻找一种信道p 给定的信源p 经过此信道传输后,互信息I 给定的信源p(xi)经过此信道传输后,互信息I(X;Y) 达到最小。 达到最小。
Dmax = m D in
R( D)=0
当R(D)为0,意味着不需要传输任何信息。显然D越 大甚至无限大都能满足这样的情况,这里选取所有能满 足R(D)=0中的D的最小值。 因此可以得到R(D)的定义域为 的定义域为 因此可以得到
相关文档
最新文档