信息论基础与编码复习2
信息论与编码-第2讲-信源及信息度量1

自信息含义
当事件xi发生以前:表示事件xi发生的不确定性。 当事件xi发生以后:表示事件xi所含有(或所提供)的信
息量。在无噪信道中,事件xi发生后,能正确无误地传输到 收信者,所以I(xi)可代表接收到消息xi后所获得的信息量。 这是因为消除了I(xi)大小的不确定性,才获得这么大小的信 息量。
2.1.1 单符号离散信源的数学模型
(1) 信源的描述方法 (2) 单符号离散信源数学模型
(1) 信源的描述方法
在通信系统中收信者在未收到消息以前,对信源发出 什么消息是不确定的。
① 离散信源:输出的消息常常是以一个个符号形式出现,
这些符号的取值是有限的或可数的。 单符号离散信源:只涉及一个随机事件,可用随机变量描述。 多符号离散信源:每次输出是一个符号序列,序列中每一位出现
② 联合自信息量
信源模型为
x2 y1 ,, x2 ym ,, xn y1 ,, xn y m XY x1 y1 ,, x1 ym , P( XY ) p( x y ),, p( x y ), p( x y ),, p( x y ),, p( x y ),, p( x y ) 1 m 2 1 2 m n 1 n m 1 1
计算y1与各种天气之间的互信息量 对天气x1,不必再考虑 对天气x2, I ( x2 ; y1 ) log2 p( x2 / y1 ) log2 1/ 2 1(比特) p( x ) 1/ 4
i i
验概率的函数。
函数f [p(xi)]应满足以下4个条件 根据上述条件可以从数学上证明这种函数形式是对 数形式。
信息论编码与基础课后题(第二章)

第二章习题解答2-1、试问四进制、八进制脉冲所含信息量是二进制脉冲的多少倍? 解:四进制脉冲可以表示4个不同的消息,例如:{0, 1, 2, 3}八进制脉冲可以表示8个不同的消息,例如:{0, 1, 2, 3, 4, 5, 6, 7} 二进制脉冲可以表示2个不同的消息,例如:{0, 1} 假设每个消息的发出都是等概率的,则:四进制脉冲的平均信息量symbol bit n X H / 24log log )(1=== 八进制脉冲的平均信息量symbol bit n X H / 38log log )(2=== 二进制脉冲的平均信息量symbol bit n X H / 12log log )(0===所以:四进制、八进制脉冲所含信息量分别是二进制脉冲信息量的2倍和3倍。
2、 设某班学生在一次考试中获优(A )、良(B )、中(C )、及格(D )和不及格(E )的人数相等。
当教师通知某甲:“你没有不及格”,甲获得了多少比特信息?为确定自己的成绩,甲还需要多少信息? 解:根据题意,“没有不及格”或“pass”的概率为54511pass =-=P 因此当教师通知某甲“没有不及格”后,甲获得信息在已知“pass”后,成绩为“优”(A ),“良”(B ),“中”(C )和“及格”(D ) 的概率相同:41score )pass |()pass |()pass |()pass |(=====D P C P B P A P P 为确定自己的成绩,甲还需信息bits 241loglog score score =-=-=P I 3、中国国家标准局所规定的二级汉字共6763个。
设每字使用的频度相等,求一个汉字所含的信息量。
设每个汉字用一个1616⨯的二元点阵显示,试计算显示方阵所能表示的最大信息。
显示方阵的利用率是多少?解:由于每个汉字的使用频度相同,它们有相同的出现概率,即67631=P 因此每个汉字所含的信息量为bits 7.1267631loglog =-=-=P I 字每个显示方阵能显示256161622=⨯种不同的状态,等概分布时信息墒最大,所以一个显示方阵所能显示的最大信息量是bits322.054log log passpass =-=-=P Ibits 25621loglog =-=-=P I 阵显示方阵的利用率或显示效率为0497.02567.12===阵字I I η 4、两个信源1S 和2S 均有两种输出:1 ,0=X 和1 ,0=Y ,概率分别为2/110==X X P P ,4/10=Y P ,4/31=Y P 。
信息论与编码理论基础(第二章)

I(xk;yj)loga
P(XP(Xxk|Yxk)yj)loga
P(Yyj |Xxk) P(Yyj)
logaP P((X (X,Yx)k)P((xYk,yyj)j))logaqkrkw j j
2019/6/6
10
非平均互信息量直观认识
考虑)此时补充定义qkloga(1/qk)=0。这个定义是合理的,因 为
lim
q0
qloga
1 q
0
2019/6/6
33
平均自信息量——熵
例2.2.1 离散型随机变量X有两个事件x1和x2, P(X=x1)=p,P(X=x2)=1-p。
则X的平均自信息量(熵)为 H(X)=ploga(1/p)+(1-p)loga(1/(1-p)) 。
I( xi ; xi )=[收到xi前,收信者对信源发xi 的不确定性] = I( xi )
2019/6/6
17
2019/6/6
18
2019/6/6
19
2019/6/6
20
条件的非平均自信息量
定义2.1.4(条件的非平均自信息量) 给定一个二维离散型随机 变下量事件{(Xx,k的Y)条, (x件k, 自yj)信, rk息j, k量=1定~义K;为j=1~J}。在事件yj发生的条件 I(xk|yj)=loga(1/P(X=xk|Y=yj))=loga(wj/rkj)。
7
直观认识
从上述两个系统可以看出,在一个系统 中我们所关心的输入是哪个消息的问题, 只与事件出现的先验概率和经过观察后 事件出现的后验概率有关。
信息应当是先验概率和后验概率的函数, 即
I(xk;yj)=f [Q(x),P(xk|yj)]
信息论编码与基础课后题(第二章)

第二章习题解答2-1、试问四进制、八进制脉冲所含信息量是二进制脉冲的多少倍? 解:四进制脉冲可以表示4个不同的消息,例如:{0, 1, 2, 3} 八进制脉冲可以表示8个不同的消息,例如:{0, 1, 2, 3, 4, 5, 6, 7} 二进制脉冲可以表示2个不同的消息,例如:{0, 1} 假设每个消息的发出都是等概率的,则:四进制脉冲的平均信息量symbol bit n X H / 24log log )(1=== 八进制脉冲的平均信息量symbol bit n X H / 38log log )(2=== 二进制脉冲的平均信息量symbol bit n X H / 12log log )(0===所以:四进制、八进制脉冲所含信息量分别是二进制脉冲信息量的2倍和3倍。
2、 设某班学生在一次考试中获优(A )、良(B )、中(C )、及格(D )和不及格(E )的人数相等。
当教师通知某甲:“你没有不及格”,甲获得了多少比特信息?为确定自己的成绩,甲还需要多少信息? 解:根据题意,“没有不及格”或“pass”的概率为54511pass =-=P 因此当教师通知某甲“没有不及格”后,甲获得信息在已知“pass”后,成绩为“优”(A ),“良”(B ),“中”(C )和“及格”(D ) 的概率相同:41score )pass |()pass |()pass |()pass |(=====D P C P B P A P P 为确定自己的成绩,甲还需信息bits 241loglog score score =-=-=P I 3、中国国家标准局所规定的二级汉字共6763个。
设每字使用的频度相等,求一个汉字所含的信息量。
设每个汉字用一个1616⨯的二元点阵显示,试计算显示方阵所能表示的最大信息。
显示方阵的利用率是多少?解:由于每个汉字的使用频度相同,它们有相同的出现概率,即67631=P 因此每个汉字所含的信息量为bits 7.1267631loglog =-=-=P I 字每个显示方阵能显示256161622=⨯种不同的状态,等概分布时信息墒最大,所以一个显示方阵所能显示的最大信息量是bits 322.054loglog passpass =-=-=P Ibits 25621loglog 256=-=-=P I 阵显示方阵的利用率或显示效率为0497.02567.12===阵字I I η 4、两个信源1S 和2S 均有两种输出:1 ,0=X 和1 ,0=Y ,概率分别为2/110==X X P P ,4/10=Y P ,4/31=Y P 。
信息论与编码第二章

p(ai b j ) P( X ai , Y b j )
无条件概率、条件概率、联合概率
满足下面一些性质和关系:
1 0 p(ai )、p(b j )、p(b j ai )、p(ai b j )、p(aib j ) 1 2
p(a ) 1, p(b ) 1, p(b p(a
log p(ai b j ) p(ai ) p(b j )
(2.1.10)
(i 1,2,, n; j 1,2,, m)
2 互信息的性质
1
2
对称性
I (ai ; b j ) I (b j ; ai )
当X和Y相互独立时,互信息为0
(2.1.11)
p(ai b j ) p(ai ) p(b j )
如果信道是理想的,发出ai收到ai则所获得的信息量 =ai的不确定度=I(ai); 如果信道不理想,发出ai收到bj,由bj推测ai的概率,
j 1
m
p(ai b j ) 后验概率
互信息量的定义1
定义b j 对ai的互信息量为 I (ai ; b j ) log p(ai b j ) p(ai ) (2.1.7)
同样的道理,可定义ai 对bj的互信息量为
I (b j ; ai ) log
p(b j ai ) p(b j )
I (b j ) I (b j ai ) (2.1.9)
(i 1,2,, n; j 1,2,, m)
互信息量的定义3
通信前
发送
接收
“输入端出现ai和输出端出现b j”的概率
“今天不是晴天”作为收到的信息b1,计算b1 与各天气之间的互信息量。
今天不是晴天。把这句话作为收到的信息 b1 当收到 b1 后,各种天气发生的概率变成后验概率。其中
《信息论和编码技术》复习提纲复习题

《信息论和编码技术》复习提纲复习题《信息论与编码技术》复习提纲复习题纲第0章绪论题纲:I.什么是信息?II.什么是信息论?III.什么是信息的通信模型?IV.什么是信息的测度?V.自信息量的定义、含义、性质需掌握的问题:1.信息的定义是什么?(广义信息、狭义信息——Shannon信息、概率信息)2.Shannon信息论中信息的三要素是什么?3.通信系统模型图是什么?每一部分的作用的是什么?4.什么是信息测度?5.什么是样本空间、概率空间、先验概率、自信息、后验概率、互信息?6.自信息的大小如何计算?单位是什么?含义是什么(是对什么量的度量)?第1章信息论基础㈠《离散信源》题纲:I.信源的定义、分类II.离散信源的数学模型III.熵的定义、含义、性质,联合熵、条件熵IV.离散无记忆信源的特性、熵V.离散有记忆信源的熵、平均符号熵、极限熵VI.马尔科夫信源的定义、状态转移图VII.信源的相对信息率和冗余度需掌握的问题:1.信源的定义、分类是什么?2.离散信源的数学模型是什么?3.信息熵的表达式是什么?信息熵的单位是什么?信息熵的含义是什么?信息熵的性质是什么?4.单符号离散信源最大熵是多少?信源概率如何分布时能达到?5.信源的码率和信息率是什么,如何计算?6.什么是离散无记忆信源?什么是离散有记忆信源?7.离散无记忆信源的数学模型如何描述?信息熵、平均符号熵如何计算?8.离散有记忆多符号离散平稳信源的平均符号熵、极限熵、条件熵(N阶熵)的计算、关系和性质是什么?9.什么是马尔科夫信源?马尔科夫信源的数学模型是什么?马尔科夫信源满足的2个条件是什么?10.马尔科夫信源的状态、状态转移是什么?如何绘制马尔科夫信源状态转移图?11.马尔科夫信源的稳态概率、稳态符号概率、稳态信息熵如何计算?12.信源的相对信息率和冗余度是什么?如何计算?㈡《离散信道》题纲:I.信道的数学模型及分类II.典型离散信道的数学模型III.先验熵和后验熵IV.互信息的定义、性质V.平均互信息的定义、含义、性质、维拉图VI.信道容量的定义VII.特殊离散信道的信道容量需掌握的问题:1.信道的定义是什么?信道如何分类?信道的数学模型是2.二元对称信道和二元删除信道的信道传输概率矩阵是什么?3.对称信道的信道传输概率矩阵有什么特点?4.根据信道的转移特性图,写出信道传输概率矩阵。
信息论与编码复习期末考试要点

30
1
1
2 W1
2W3
W1
Wi pij Wj
i
1 4W1
13W2
3 4
W3
15W4
W2
W3
2 3
W2
4 5
W4
W4
W1 W2 W3 W4 1
• 稳态分布概率
W 1 3 3 5 , W 2 3 6 5 , W 3 1 2 3 3 3 6 5 5 ,1 3 W 3 6 4 5 1 4 7 4 3 6 5 1 5 7 4 3 9 5
14
三、互信息
• 互信息
• 定义为 xi的后验概率与先验概率比值的对数
I(xi;yj)lo2gp(p x(ix|iy)j)
• 互信息I(xi;yj):表示接收到某消息yj后获得 的关于事件xi的信息量。
15
平均互信息
• 平均互信息定义
I ( X ; Y ) H ( X ) H ( X |Y ) H ( Y ) H ( Y |X )
I(X ; Y ) H (X ) H (Y )
38
• 2)无嗓有损信道 –多个输入变成一个输出(n>m)
p(bi | aj ) 1或0
p(ai
|
bj
)
1或0
• 噪声熵H(Y|X) = 0 • 损失熵H(X|Y) ≠ 0
I(X ; Y )H (Y )H (X )
Cm axI(X ;Y )m axH (Y ) p(a i) 39
加密
y 信道编码
k 加密 密钥
z
信
解密 密钥
道 z'
信宿 v
信源解码
x' 解密
y'
信道解码
信息论与编码复习

信息论与编码复习
去年考点(部分):
简答题:香农第一定理P106、香农第二定理P141
计算题:马尔可夫信源P37、香农编码P110、霍夫曼编码P111、费诺编码P115、平均错误概率P131(例6.3)、例5.10。
重点:
第二章:本章为基础性内容,主要是理解专业词语的含义,记住公式,可参考笔记。
第三章:
重点3.3节,特别是马尔可夫信源P37~P40,会画状态转移图,会求状态转移概率矩阵(例3.5 P38、例3.6 P40)。
第四章:
各种信道容量的计算P58(例4.1、4.2、4.3)、离散对称信道的判别和信道容量计算P61~P64。
第五章:
定长码、码的分类P91、定长码及定长编码定理P94、编码效率P97、Kraft和McMillan不等式、唯一可译码存在条件P100、编码效率及剩余度P108、变长码编码(例 5.5 P108、例5.6 P110、例5.7 P112、例5.8 P115、例5.9 P116)。
第六章:
最大后验概率译码准则、极大似然译码规则P131、平均错误概率P131(例6.3 P131)、编码效率P150、线性分组码P150(例6.6 、6.7、6.8 P154、例5.10 P161)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息论基础与编码复习一、已知信源⎭⎬⎫⎩⎨⎧=⎥⎦⎤⎢⎣⎡5.05.021x x P X 接到信道⎪⎪⎭⎫⎝⎛=8.02.002.098.0)|(X Y P 上,求在该信道上传输的平均互信息量);(Y X I 、疑义度)|(Y X H ,噪声熵)|(X Y H 和联合熵)(XY H 。
参考答案:不要求计算结果,只要与出公式,每份5分,共20分()()(|)P Y P X P Y X =)|(X Y H =-22211()log (|)i j j i i j p x y p y x ==∑∑)|(Y X H =-22211()log (|)i j i j i j p x y p x y ==∑∑)(XY H =-22211()log ()i j i j i j p x y p x y ==∑∑);(Y X I =()()()H X H Y H XY +-二、一维随机变量X 在区间],[b a 内均匀分布,试求此连续信源的熵)(x H c 。
参考答案:1222()()log ()log ()log ()bc b a aH X p x p x dx b a dx b a +∞--∞=-=-=-⎰⎰(bit ) (10分)三、一维随机变量X 的取值是),(+∞-∞,其概率密度函数为222)(221)(σμπσ--=x ex p (高斯信道),试求此连续信源的熵)(x H c 。
参考答案:()EX xp x dx μ+∞-∞==⎰22()()DX x p x dx μσ+∞-∞=-=⎰ (5分)2122()()log ()log (2)c H X p x p x dx e πσ+∞-∞=-=⎰(bit ) (10分)五、一个三状态马尔可夫信源的转移概率矩阵为⎪⎪⎪⎭⎫ ⎝⎛=4121412121212100P ,请绘制状态转移图,并求该马尔可夫信源的稳态分布。
( 10 分) 参考答案:1、绘制状态转移图 (5分) 2、稳态分布731)(=s P ,722)(=s P ,723)(=s P (5分)六、试求以下列信道矩阵代表的信道容量。
⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=100010001001001001][654321321x x x x x x y y y P 参考答案:归并信道,2max(;)max ()log 3()C I X Y H Y p x === /b i t s i g n (10分)七、设一四元对称信源⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧=⎥⎦⎤⎢⎣⎡414141413210)(X P X ,接收符号{}3,2,1,0=Y ,其其失真矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=0111101111011110D ,试求max D ,min D 及信息率失真函数)(D R 。
(15分) 参考答案:min D =1()min (,)0niijji p x d x y ==∑ (5分)max D =34min j jD = (5分)()ln ln (1)ln(1)DD D D R D n α=++--32ln (1)ln(1)D D D D =++-- (5分) 八、设有一单符号离散信源:1234()0.50.20.20.1X x x x x P X ⎧⎫⎡⎤=⎨⎬⎢⎥⎣⎦⎩⎭,试求其信源熵、二进制哈夫曼编码(最优编码),并计算平均码长。
(15分)参考答案:画出最优二元树 (5分) 编码1234010110111x x x x ⎧⎫⎨⎬⎩⎭ (5分)平均码长:0.5*10.2*20.2*30.1*3 1.8K =+++= (5分)九、设有一单符号离散信源:⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡01.01.015.017.018.019.02.0)(7654321x x x x x x x X P X ,试求其信源熵、二进制香农编码,并计算平均码长。
(15分) 参考答案:求信源熵 (5分) 按概率从大到小的排序,计算概率和 编码111111011101011000110010007654321x x x x x x x (5分)平均码长:14.37*01.04*1.03*)15.017.018.019.02.0(=++++++=K (5分)十、设1a ,2a 分别代表某工厂合格品和废品,设该厂产品的合格率)(1a p =99%,废品率)(2a p =1%,若合格品出厂、废品报废,则不会造成损失;若将一个合格品报废,则损失1元;若将一个废品出厂,则损失100元。
现检测系统把合格品误判为废品、废品误判为合格品的概率均为10%,试计算这种检测系统的信息价值率。
(15分) 参考答案: )01.099.0()(21a a X P =,)9.01.01.09.0()|(=X Y P()()(|)i i i i i p x y p x p y x =)010010(=D0min =D21()(,)j i i j i D p x d x y ==∑99.0}99.0,1{min min max ===jj jD D 元, (10分)D =0.199元,∴D D -max =0.791元,(|)()()min(;)j i p y x p D R D I X Y ∈=2222221111(|)(|)(;)()log ()log ()()i j j i i j i j i j i j i i p x y p y x I X Y p x y p x y p x p x =====-=-∑∑∑∑=0.025(sign bit /)所以信息价值率为:max ()D DV R D -==31.6元/比特。
(15分)十一、设某地区的“晴天”概率6/5)(1=a p ,“雨天”概率6/1)(2=a p ,把“晴天”预报为“雨天”、把“雨天”预报为“晴天”造成的损失均为a 元。
又设该预报系统把“晴天”预报为“雨天”、把“雨天”预报为“晴天”的概率均为0.1,把“晴天”预报为“晴天”、把“雨天”预报为“雨天”的概率均为0.9。
试计算这种预报系统的信息价值v (元比特) (15分)参考答案:由题意有:0.90.1(|)0.90.1P Y X ⎛⎫= ⎪⎝⎭12()5166x x P X ⎛⎫ ⎪= ⎪ ⎪⎝⎭()()(|)i i i i i p x y p x p y x =4.50.566()0.90.166P XY ⎛⎫ ⎪=⎪ ⎪ ⎪⎝⎭00a D a ⎛⎫= ⎪⎝⎭0a > (5分)21()(,)j i i j i D p x d x y ==∑1111221()(,)()(,)6a D p x d x y p x d x y =+=21122225()(,)()(,)6aD p x d x y p x d x y =+=max 12min 6j j aD D ≤≤==2211()(|)(,)0.1i j i i j i j D p x p y x d x y a ====∑∑ (10分)∴ max 15aD D -=(|)()()min(;)j i p y x p D R D I X Y ∈=2222221111(|)(|)(;)()log ()log ()()i j j i i j i j i j i j i i p x y p y x I X Y p x y p x y p x p x =====-=-∑∑∑∑所以信息价值率为:max ()D DV R D -=(15分)十二、设有一(7,4)循环码的生成多项式为3()1g x x x =++,试求其生成矩阵和一致校验矩阵,检验接收码字1110011=R 是否有错? (15分) 参考答案:1)(3++=x x x g ,7()(1)/()h x x g x =+=421x x x +++ (5分)按()g x 的升幂()h x 降幂(或者按()g x 的降幂()h x 升幂)生成矩阵11010000110100()00110100001101G =一致校验矩阵1011100(0101110)0010111H = (5分)*T H R =(0,0,1)0T ≠,所以检验出有错误,第七个符号错。
(5分)十三、选择帧长64=N ,对0000000000000000000000000100000000000000000000000000000000000000编冗余位L —D 编码,并译码。
参考答案:264,[log (1)]7N N =+=,用七位编码表示Q (5分)编码:1Q =,126n =,2[log ]6QN c =,11225(11001)Qn T C -===所以,编码为0000001011001 (5分) 译码:前七位表示1Q =,后六位表示25T = 所以126n = (5分)十四、设有一线性分组码的生成多项式为⎪⎪⎪⎭⎫⎝⎛=110100011010101001G ,试求:1、 此分组码??,==k n ,共有多少码字?2、 求此分组码的较验矩阵H ;3、 接收到001001=R 是否有错? (15分)参考答案:1、3,6==k n , 共有823=个码字 (5分)2、较验矩阵⎪⎪⎪⎭⎫⎝⎛=100101010110001011H (5分)*T H R =0)0,1,0(≠T ,所以检验出有错误,第第五个符号错。
(5分)。