信息论讲义4

合集下载

数字通信原理4信息论基础1103页PPT文档

xMy1,pxMy1 xMy2,pxMy2 ...xMyN,pxMyN
满足条件：
M i1
N j1pxiyj 1
2020/4/5
11
离散信源的联合熵与条件熵(续)
第四章信息论基础
两随机变量的联合熵
定义4.2.3 两随机变量 X :x iy Y j,i 1 , 2 ,. M ; .j .1 , 2 ,,. N ..,
I[P(xM)]
H(X)
图4－2－1 符号的平均信息量与各个符号信息量间关系的形象表示
2020/4/5
7
离散信源的熵(续) 示例：求离散信源
X: 0 1 2 3
pX: 38 14 14 18
的熵。
第四章信息论基础
按照定义：
H X i4 1pxilopg xi 8 3lo8 3g 1 4lo1 4g 1 4lo1 4g 8 1lo8 1g
2020/4/5
6
4、离散信源的平均信息量：信源的熵
第四章信息论基础
离散信源的熵
定义4.2.2 离散信源 X:xi,i 1 ,2 ,.N ..的,熵
H X iN 1p xilop x g i
熵是信源在统计意义上每个符号的平均信息量。
I[P(x1)]
I[P(x2)]
I[P(x3)]
I[P(x4)]
同时满足概率函数和可加性两个要求。
2020/4/5
4
离散信源信的息量(续)
第四章信息论基础
定义离散消息xi的信息量:
IPxi loP g1xiloP gxi
信息量的单位与对数的底有关：
log以2为底时，单位为比特：bit
log以e为底时，单位为奈特：nit

《信息论》研究生课程讲义

《信息论》研究生课程讲义2-5 平均互信息量的特性平均交互信息量IX,Y在统计平均的意义上,描述了信源、信道、信宿组成的通信系统的信息传输特性。

这一节将进一步讨论IX,Y的数学特性,重点介绍其特性的结论和其物理意义。

2-5-1 IX,Y的非负性当x为大于0的实数时,底大于1的对数logx是x的严格上凸函数,可以证明若fx为上凸函数,则有:f∑pixi≥∑pifxi,如fxlogx,则有:log∑pixi≥∑pilogxi根据这个关系,考虑平均互信息量,IX,Y ∑∑pxi,yjlog[pxi,yj/pxipyj]则:-IX,Y ∑∑pxi,yjlog[pxipyj/pxi,yj]≤log∑∑pxi,yj[pxipyj/pxi,yj]log∑pxi ∑pyj0所以有:IX,Y ≥0只有当PX,YPXPY,即对于所有的i1,2,…n, j1,2,…m。

都有:pxi,yjpxipyj,才有:IX,Y0互信息量可能出现负值,但平均互信息量不可能出现负值。

接收者收到一个Y的符号,总能从中获取道关于信源X的信息量,只有当XY相互独立时,平均互信息量才为0。

由IX,YHX-HX/Y,可知,在信息传输过程中,后验熵不可能大于先验熵,这种特性称为后熵不增加原理。

当XY相互独立时,pxi,yjpxipyj可得:HX,YHX+HY当XY相互独立时,pyj/xipyj可得:HY/XHY当XY相互独立时,pxi/yjpxi可得:HX/YHX由互信息量的定义可知:IX,YHX+HY-HX,YHX-HX/YHY-HY/X02-5-2 平均互信息量的交互性由于pxi,yjpyj,xi则:IX,YIY,X交互性表明在Y中含有关于X的信息,IX,Y;在X中含有关于Y的信息,IY,X;而且两者相等。

实际上IX,Y和IY,X只是观察者的立足点不同,对信道的输入X 和输出Y的总体测度的两种表达形式。

两个园相交的部分为平均互信息量,可见,平均互信息量的大小体现了X和Y 的相关程度。

信息论课件CHAPTER4

由于
h( X
)

h( X
/Y
)

p( xy) log
p( x / y)dxdy p( x)

p( xy)(1
p( x) )dxdy p(x | y)

0
仅当X、Y独立时等式成立。
4.1.5 连续随机变量集合差熵的性质(续) ——连续熵与离散熵的类似性
3. 可加性设N维高斯随机矢量集合 XΝ X1X2 X N ,很容易证明
4.1.1 连续随机变量的离散化
一个连续随机变量的离散化过程大致如下：
若给定连续随机变量集合X 的概率分布F(x) P{X x} 或概率密度p(x) ；再给定一个由实数集合到有限或可数集合的划分 P ，使得
P {Si, i 1, 2, }，其中Si 表示离散区间，i Si 为实数集合，
主要是高斯信源的差熵；然后介绍连续信源最大熵定理；最后介绍连续集合之间的平均互信息、离散集合与连续集合的平均互信息。
§4.1 连续随机变量集合的熵
本节主要内容：
1.连续随机变量的离散化 2.连续随机变量集的熵 3.连续随机变量集的条件熵 4.连续随机变量集的联合熵 5.连续随机变量集合差熵的性质 6.连续随机变量集合的信息散度
4.1.5 连续随机变量集合差熵的性质 ——连续熵与离散熵的类似性
1. 连续熵与离散熵计算表达式类似。通过比较可见，由计算离散熵到计算连续熵，不过是将离散概率变成概率密度，将离散求和变成积分。
2. 熵的不增性。连续熵同样满足熵的不增原理，即
h( X ) h( X / Y )
(4.1.15)
i
p(xi )x log p(xi ) p(xi )x log x （4.1.5）

信息论4-1

信息论基础课件之信息论基础课件之14
在一般的广义通信系统中，在一般的广义通信系统中，信道是很重要的一部分，信道是信息传输的通道（如电缆、光纤、电波传信道是信息传输的通道（如电缆、光纤、播的介质等物理通道，以及磁盘、光盘等），其任务播的介质等物理通道，以及磁盘、光盘等），其任务），是以信号方式传输信息和储存信息，是以信号方式传输信息和储存信息，在信息论中只研究信号在这些信道中传输的特性及在此基础上信息的可靠传输问题，而并不研究这些特性如何获得的即研可靠传输问题，而并不研究这些特性如何获得的(即研究信道中理论上能够传输和存储的最大信息量，究信道中理论上能够传输和存储的最大信息量，即信道容量问题) 道容量问题。
4.据信道的统计特性来分类据信道的统计特性来分类 ①无记忆信道：信道的输出只与信道该时刻的输入有关无记忆信道：而与其他时刻的输入无关 . 有记忆信道(无扰信道无扰信道) 信道某一时刻输出的消息， ②有记忆信道无扰信道：信道某一时刻输出的消息，不仅与该时刻的输入消息有关，不仅与该时刻的输入消息有关，而且还与前面时刻的输入消息有关。入消息有关。 5. 根据信道的参数与时间关系来划分统计特性)不随时间而变化 ①恒参信道：信道的参数(统计特性不随时间而变化 . 恒参信道：信道的参数统计特性统计特性)随时间而变化 ②随参信道：信道的参数(统计特性随时间而变化随参信道：信道的参数统计特性随时间而变化. 6.根据信道的统计特性对输入端是否有对称性分类根据信道的统计特性对输入端是否有对称性分类 ①恒参信道 ②随参信道
(2) 对称信道 ① 定义若信道矩阵中，每行元素都是第一行元素的不同排列，若信道矩阵中，每行元素都是第一行元素的不同排列，每列元素都是第一列元素的不同排列，每列元素都是第一列元素的不同排列，则这类信道称为对称信道。对称信道。

信息论讲义-第四章(10讲)

信息理论基础第10讲北京航空航天大学201教研室陈杰2006-11-274.3离散无记忆扩展信道一、无记忆Ｎ次扩展信道定义：假设离散信道［X, p (y|x ), Y ］,输入符号集合:A ={a 1,a 2,……,a r }输出符号集合:B ={b 1,b 2, ……,b s } X 取值于Ａ，Ｙ取值于Ｂ．将输入，输出Ｎ次扩展得其中,Ｘi 取值于Ａ，Ｙi 取值于Ｂ，i =1,2,……Ｎ12()N X X X =X "12()N YY Y =Y "信道ＸＹp (y|x )2006-11-274.３离散无记忆扩展信道二、无记忆Ｎ次扩展信道其数学模型如下：若则称为Ｎ次无记忆扩展信道。

信道NX X X ……21NY Y Y ……211212(|)N N p y y y x x x ……12121(|)(|)(|)NN N i i i p p y y y x x x p y x ===∏y x ""[,(|),]N N N N X p y x Y2006-11-27三、离散无记忆信道数学模型信道输入序列取值信道输出序列取值信道转移概率信道X YNX X X X (21)Y Y Y Y ……=2112,N x x x x =……A x i ∈12,N y y y y =……B y i ∈1(|)(|)Ni i i p y x p y x ==∏{,(|),}i ip y x X Y 离散无记忆信道2006-11-27离散信道的数学模型可表示为定义若离散信道对任意N 长的输入、输出序列有称为离散无记忆信道，简记为DMC 。

数学模型为{,(|),}p y x X Y 1(|)(|)Ni i i p y x p y x ==∏{,(|),}i i p y x X Y2006-11-27(1) 对于DMC 信道，每个输出符号仅与当时的输入符号有关，与前后输入符号无关。

(2) 对任意n 和m ，，，若离散无记忆信道还满足则称此信道为平稳信道的或恒参信道。

4信息论(1-2)

22
3.2.3 无失真信源编码理论
无失真信源编码（1）
通信系统的最基本功能就是把信源产生的携带着信息的消息，以某种信号的形式，通过信道传送给信宿，如何才能在确保所传送信息不失真，或者在允许一定程度失真的条件下，进行信息的高速传输，是通信系统的基本性能要求。
23
3.2.3 无失真信源编码理论
28
例：给定离散信源如下：
U u1 u2 p 0.20 0.19 u3 u4 u5 u6 0.18 0.17 0.15 0.10 0.01 u7
如果采用等长编码，需要3位二进制数，其平均码长为 3 。如果采用变长编码（哈夫曼编码、算术编码、费诺编码等）哈夫曼编码如下图所示。
17
3.2
信源及压缩编码理论
引言（2）
信源所产生的消息，必须通过信道传输，才能为信宿所接收。一方面，信源所产生的消息不一定能够适应于信道的要求；另一方面，为了能够以尽量短的时间，尽量小的代价来实现信息传输，就必须对信源输出的消息进行适当的变换，这就是信源编码问题，包括无失真信源编码和限失真信源编码，信源编码问题，实质上就是在符合一定条件的前提下，如何用尽量少的信道符号
27
3.2.3 无失真信源编码理论
无失真信源编码（6）
无失真信源编码定理指出：要得到无失真的信源编码，变换每个信源符号平均所需的最少r元码个数，就是信源的熵。
无失真信源编码定理告诉我们：对信源输出进行无失真编码时，所能达到的最低编码信息率，就是信源的熵H。一旦实际编码信息比率低于信源的熵H，则一定会产生失真。
对象信息
管理者
管理信息
管理对象
组织与序
第二类永动机与麦克斯韦尔妖

信息论第4章

2011-12-1 13
§4.5 信道的组合
例设信道1的转移概率矩阵为
1− p p P= p 1− p
其中0<p<1。则（1）信道1的最佳输入分布是等概分布，(对称信道)信道容量为
1 1 C1 = 1− H ( p) = 1− p log − (1− p) log p 1− p
2011-12-1 3
§4.2 离散无记忆信道
定理4.2.2(p106) 定理（1）输入概率分布{x, q(x), x∈{0, 1, …, K-1}}是最佳输入分布的充分必要条件为：对任何满足q(k)>0的k，
I ( X = k;Y ) = ∑ p( y | k ) log K −1
y =0 z =0 J −1 −1
§4.1 信道分类
信道是传输信息的媒质或通道。（输入→信道 →输出）说明（1）信道输入是随机过程。（2）信道响应特性是条件概率P(输出值为y|输入值为x)，又称为转移概率。（3）信道输出是随机过程，输出的概率分布可以由输入的概率分布和信道的响应特性得到。（全概率公式）
2011-12-1 1
15
§4.5 信道的组合
（3）令自级联的次数N→+∞，则级联信道的转移概率矩阵趋向于
1 1 + (1 − 2 p) N 2 2 N lim P = lim N →+∞ N →+∞ 1 1 − (1 − 2 p) N 2 2
信道容量趋向于0。
1 1 − (1 − 2 p) N 1 / 2 1 / 2 2 2 = 1 1 1 / 2 1 / 2 N + (1 − 2 p) 2 2
0 β 0 1× log 1 + 0 × log 0 1 0 ε 1 − ε β = ε × log ε + (1 − ε ) × log(1 − ε ) = − H (ε ) 1

信息论讲义-绪论

第一章绪论主要内容：（1）信息论的形成和发展；（2）信息论研究的分类和信息的基本概念；（3）一般通信系统模型；（4）目前信息论的主要研究成果。

重点：信息的基本概念。

难点：消息、信号、信息的区别和联系。

说明：本堂课作为整本书的开篇，要交待清楚课程开设的目的，研究的内容，对学习的要求；在讲解过程中要注意结合一些具体的应用实例，避免空洞地叙述，以此激发同学的学习兴趣，适当地加入课堂提问，加强同学的学习主动性。

课时分配：2个课时。

板书及讲解要点：“信息”这个词相信大家不陌生，几乎每时每划都会接触到。

不仅在通信、电子行业，其他各个行业也都十分重视信息，所谓进入了“信息时代”。

信息不是静止的，它会产生也会消亡，人们需要获取它，并完成它的传输、交换、处理、检测、识别、存储、显示等功能。

研究这方面的科学就是信息科学，信息论是信息科学的主要理论基础之一。

它研究信息的基本理论(Information theory)，主要研究可能性和存在性问题，为具体实现提供理论依据。

与之对应的是信息技术(Information Technology)，主要研究如何实现、怎样实现的问题。

它不仅是现代信息科学大厦的一块重要基石，而且还广泛地渗透到生物学、医学、管理学、经济学等其他各个领域，对社会科学和自然科学的发展都有着深远的影响。

1．1 信息论的形成和发展信息论理论基础的建立，一般来说开始于香农(C.E．shannon)研究通信系统时所发表的论文。

随着研究的保深入与发展，信息论具有了较为宽广的内容。

信息在早些时期的定义是由奈奎斯持(Nyquist，H．)和哈特莱(Hartley，L.V.R．)在20世纪20年代提出来的。

1924年奈奎斯特解释了信号带宽和信息速率之间的关系；1928年哈特莱最早研究了通信系统传输信息的能力，给出了信息度量方法；1936年阿姆斯特朗(Armstrong)提出了增大带宽可以使抗干扰能力加强。

这些工作都给香农很大的影响，他在1941—1944年对通信和密码进行深入研究，用概率论的方法研究通信系统，揭示了通信系统传递的对象就是信息，并对信息给以科学的定量描述，提出了信息嫡的概念。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

信源剩余度与自然语言的熵
1、关于离散信源熵的总结实际信源可能是非平稳的有记忆随机序列信源，其极限熵H∞不存在。解决的方法是假设其为离散平稳随机序列信源，极限熵存在，但求解困难；进一步假设其为m阶Markov信源，用其m阶条件熵Hm+1来近似，近似程度的高低取决于记忆长度m 的大小；最简单的是记忆长度 m =1的马尔可夫信源，其熵Hm+1=H2=H(X2|X1) 再进一步简化，可设信源为无记忆信源，信源符号有一定的概率分布。这时可用信源的平均自信息量H1=H(X)来近似。最后可假定是等概分布的离散无记忆信源，用最大熵H0 来近似。
补充：文本隐写技术
– 法轮功的信息传递：使用文本隐写工具软件Snow。
– 该软件使用公开对称加密算法ICE对秘密信息进行加密，再使用基于行末不可见字符的文本隐写方法把秘密信息隐藏在文本中。
– 这种使用隐写技术传递隐秘信息的方法使得政府许多常规侦察方法失去效果，从而使得相关职能部门对这些不法分子进行的不法活动更加难以采取预防措施，给国家安全、社会稳定和经济的发展带来了严峻的挑战。
补充：文本隐写技术
• 4)基于文件格式的文本隐写技术
• 该类方法利用文件格式中通常允许存在一定冗余的特性，在文件格式中加入一些隐藏的信息。比如附加编码法，是在文件中附加经过编码后的隐藏信息；PDF注释法，是在PDF文件格式的注释部分加入编码后的隐藏信息等。
补充：文本本都当作一个独立的m阶时齐遍历马尔可夫信源，以该文本中的单词作为信源符号；即检测方法只考虑每一篇文本内部单词间的关系，而不将该文本与其所属的语种的总体特征进行对比。 • 一般传统意义上关于文本的剩余度是指将某种自然语言作为信源并计算该语言的剩余度，每个单独的文本只是作为该信源的一个输出。
信源符号的相关性与提供的平均信息量
把多符号离散信源都用马尔可夫信源来逼近，则记忆长度不同，熵值就不同，意味着平均每发一个符号就有不同的信息量。 log2n=H0≥H1≥H2≥…≥Hm≥H∞ 由此可见，由于信源符号间的依赖关系使信源的熵减小。如果它们的前后依赖关系越长，则信源的熵越小。并且仅当信源符号间彼此无依赖、等概率分布时，信源的熵才最大，即信源符号的相关性越强，提供的平均信息量越小。
② 离散平稳信源近似为马尔可夫信源
计算N足够大时的HN (X)往往也十分困难，可进一步假设离散平稳信源是m 阶马尔可夫信源。信源熵用m阶马尔可夫信源的熵Hm+1来近似，需要测定的条件概率要少的多。近似程度的高低取决于记忆长度m。越接近实际信源，m值越大；反之对信源简化的越多，m值越小。
• • • 最简单的马尔可夫信源记忆长度m=1，信源熵H2= H1+1= H(X2/X1)。当m=0时，信源变为离散无记忆信源，其熵可用H1(X)表示。继续简化，假定信源是等概率分布的无记忆离散信源，这种信源的熵就是最大熵值 H0(X)=log2n。
• 从提高传输效率的观点出发，总是希望减少或去掉剩余度。 • 剩余度大的消息抗干扰能力强。能通过前后字之间的关联纠正错误。
第七节信源剩余度与自然语言的熵
4、自然语言的熵
从提高传输信息效率的观点出发，总是希望减少或去掉
冗余度。例如把“中华人民共和国”压缩成“中国”；“母亲病愈，身体健康”压缩为“母病愈”。这样原意并没变，而电文变得简洁，冗余度大大减少。
如果不考虑符号间的依赖关系，近似认为信源是离散无记忆的，则信源熵为
无记忆信源的熵：
H1 p(ei ) log2 p(ei ) 4.03(比特 / 符号)
i 1
27
• •
按上表的概率分布，随机选择英语字母排列起来，得到一个输出序列： AI_NGAE_ITE_NNR_ASAEV_OTE_BAINTHA_HYROO_PORE_SETRYGAIET
可夫的极限熵 H∞ =1.4(比特/符号)。
（1）对于英文字母（2）对于中文
1 1
H 1.4 1 0.71 H0 log 27
H 9.733 1 1 1 0.264 4 H0 log10
• 写英语文章时，71%是由语言结构定好的，只有29%是写文字的人可以自由选择的。100页的书，大约只传输29页就可以了，其余71页可以压缩掉。信息的剩余度表示信源可压缩的程度。
程度。
4、自然语言的熵
① 把英语看成是离散无记忆信源
• 英语字母26个，加上一个空格，共27个符号。 • 英语信源的最大熵(等概率) H0=log227=4.76(比特/符号) • 英语字母并非等概率出现，字母之间有严格的依赖关系。对英文书写中表 2.2.227个符号出现的概率统计结果如下表。 27 个英语符号出现的概率
现Q, F, X。即英语字母之间有强烈的依赖性。上述序列仅考虑了字母出现的概率，
忽略了依赖关系。
② 把英语看成马尔可夫信源
• 为了进一步逼近实际情况，可把英语信源近似看做1阶，2阶，…∞阶马尔可夫信源，它们的熵为 H2=3.32(比特/符号) H3=3.1(比特/符号)
• 若把英语信源近似成2阶马尔可夫信源，可得到某个输出序列： • IANKS_CAN_OU_ANG_RLER_THTTED_OF_TO_SHOR_OF_TO _HAVEMEM_A_I_MAND_AND_BUT_WHISS_ITABLY_THERVE REER…
补充：文本隐写技术
• 2)基于不可见字符的文本隐写技术
• 这类方法通过对文本中的不可见字符进行添加、删除、替换等操作来进行信息隐藏，这些不可见字符主要包括文本中显示为空白的字符或某些情况下不显示的字符，如空格可以被加载在句末或行末等位置而不会显著改变文本的外观。最早用于非格式化文本的隐写方法就是该类方法中的行末空格编码方法。
信源剩余度
H 1 1 H0
可见，信源冗余度的大小能很好地反映离散信源输出的符号序列
中符号之间依赖关系的强弱。冗余度越大，表示信源的实际熵H∞越小。
这表明信源符号之间的依赖关系越强，即符号之间的记忆长度越长。反之，冗余度越小，这表明信源符号之间依赖关系越弱，即符号之间的记忆长度越短。当冗余度等于零时，信源的信息熵就等于极大值H0 ，这表明信源符号之间不但统计独立无记忆，而且各符号还是等概率分布。所以冗余度可用来衡量信源输出的符号序列中各符号之间的依赖
实际信源等概的离散无记忆信源
离散平稳信源离散无记忆信源
HN H∞
m阶Markov 信源一阶Markov 信源
Hm+1
H0
H1
H2
① 实际信源近似为平稳信源
实际信源可能是非平稳的，极限熵H∞不一定存在。假设它是平稳的，测得N足够大时的条件概率 P(XN/X1X2…XN-1) ，再计算出平均符号熵HN(X)，近似极限熵H∞ 。
补充：文本隐写技术
• 隐写术按载体分类，可分为图像信息隐藏、视频信息隐藏、音频信息隐藏、文本信息隐藏等。 • 文本中的冗余信息非常有限，所以文本隐写所用的方法与其他几类载体中使用的隐写方法往往截然不同。
补充：文本隐写技术
• 文本隐写算法分类： • 1)图像文本中的隐写技术 • 该类方法针对以图像格式保存的文本或印刷文本进行信息隐藏，主要是利用图像文本的特点，使用图像处理技术来进行信息隐藏。
符号空格 E T O A N I R 概率 0.2 0.105 0.072 0.0654 0.063 0.059 0.055 0.054 符号 S H D L C F,U M P 概率 0.052 0.047 0.035 0.029 0.023 0.0225 0.021 0.0175 符号 Y,W G B V K X J,Q Z 概率 0.012 0.011 0.0105 0.008 0.003 0.002 0.001 0.001
第七节信源剩余度与自然语言的熵
4、自然语言的熵
但是冗余度大的消息具有强的抗干扰能力。当干扰使消息在传输
过程中出现错误时，我们能从它的上下关联中纠正错误。例如，当收到电文为“中×人民×和国”、“母亲病×，身体健
康”时，我们很容易把它纠正。
但若发的是压缩后的电文”中国”和“母病愈”，那么当接收电文为”×国”和“母病×”时，就很难肯定所发的电文。由此将会造成很大的错误。所以，从提高抗干扰能力角度看，总希望增加或保留信源的冗余度。
5、通信效率与可靠性的关系
• 信源编码就是通过减少或消除剩余度来提高通信效率。 • 信道编码是通过增加剩余度来提高通信的抗干扰能力，即提高通信的可靠性。
• 通信的效率问题和可靠性问题往往是一对矛盾。
补充： Information Hiding Techniques 文本隐写
– 文本是一种使用非常广泛的数据形式，比图片等数据形式的使用更为频繁，使用的领域也更为宽广。 – 隐写术(Steganography)，也称为信息隐藏技术。该技术是将秘密信息隐藏在其他载体信息中，通过载体的存储与传输来实现秘密信息的保存与传递。隐写术使秘密信息能很好地避免第三方的注意，从而比单纯使用传统加密技术能更有效地保障秘密信息存储与传递的安全。 – 文本隐写工具：Ffencode、WbStego、ByteShelter、Snow、加密奇兵、InfriHide、Crypto123、Stego、Texto、Sams Big Play Maker 、Nicetext、TextHide。
• 这个序列中被空格分开的两字母或三字母，组成的大都
是有意义的英语单词，而四个以上字母组成的“单词”，
很难从英语词典中查到。因为该序列仅考虑了3个以下字母之间的依赖关系。实际英语字母之间的关系延伸到更
多的符号，单词之间也有依赖关系。
• 有依赖关系的字母数越多，即马尔可夫信源的阶数越高，输出的序列就越接近于实际情况。当依赖关系延伸到无穷远时，信源输出的就是真正的英语，此时可求出马尔