实验一离散信源及其信息测度

合集下载

第二章 离散信源及其信息测度讲解

第二章 离散信源及其信息测度讲解

空间称为信源空间。
6
单消息(符号)信源--离散信源
特点:这些信源可能输出的消息数是有限的或可数的,
而且每次只输出其中一个消息。因此,可以用一维离散
型随机变量X来描述这个信源输出的消息。这个随机变 量X的样本空间就是符号集A;而X的概率分布就是各消 息出现的先验概率,信源的概率空间必定是一个完备集。
一般情况下,信源在不同时刻发出的符号之间是相互依赖 的。也就是信源输出的平稳随机序列X中,各随机变量Xi之 间是有依赖的。例如,在汉字组成的中文序列中,只有根 据中文的语法、习惯用语、修辞制约和表达实际意义的制 约所构成的中文序列才是有意义的中文句子或文章。所以, 在汉字序列中前后文字的出现是有依赖的,不能认为是彼 此不相关的。其他如英文,德文等自然语言都是如此。这 种信源称为有记忆信源。
X P(x)


a1, a2 ,aq

P(a1
),
P(a2
),
P(aq
)
重点掌握: 形式,每个 符号的含义
例:对于二进制数据/数字信源:U={0,1},则

UP

u0
0, p0 ,
u1 p1

1
当p0

p1

1 2


0 ,1 1,1
• 离散信源的信息熵性质:
什么是信息熵; 九大性质
• 几种具体信源:
离散平稳信源 马尔可夫信源
3
信源特性与分类
信源的统计特性
• 1)什么是信源?
信源是信息的来源,实际通信中常见的信源有:语音、文字、 图像、数据…。在信息论中,信源是产生消息(符号)、消 息(符号)序列以及连续消息的来源,数学上,信源是产生

信息论:第2章离散信源及其信息测度

信息论:第2章离散信源及其信息测度
4
Copyright ©赵越 ise_zhaoy1@
概率
概率是事件发生可能性的数量指标。 即在多次重复后,某结果出现的比率。 1、古典型概率
定义1 若试验结果一共有n个基本事件组成,且这些事 件的出现具有相同的可能性,且事件A由其中某m个基 本事件组成,则事件A的概率为
有利于A的基本事件数 m P(A) = 试验的基本事件总数 n
联合概率p(xiyj) ——X 取值xi ,Y 取值yj同时成立的概率
条件概率p(yj/xi)——X 取值xi 条件下,Y 取值yj的概率 条件概率p(xi/yj)——Y 取值yj条件下,X取值xi的概率
15
Copyright ©赵越 ise_zhaoy1@
无条件概率、条件概率、联合概率满足下 面一些性质和关系:
信源分类有多种方法,根据信源输出的消息在时间和 取值上是离散或连续进行分类:
时间(空间) 取值 离散 离散 信源种类 离散信源 (数字信 源) 举例 文字、数据、 离散化图象 数学描述 离散随机变量序列
离散
连续
跳远比赛的结果、 连续随机变量序列 连续信号 语音信号抽样以 后 波形信源 (模拟信 源) 语音、音乐、热 噪声、图形、图 象 不常见 信源的分类
23
Copyright ©赵越 ise_zhaoy1@
例:掷一个六面均匀的骰子,每次出现朝上一面
的点数是随机的,以朝上一面的点数作为随机实 验的结果,并把实验结果看作一个信源的输出, 试建立数学模型。
24
Copyright ©赵越 ise_zhaoy1@
A:{1,2,3,4,5,6}——样本(状态)空间 离散随机变量X P:{p(X=1)=1/6,p(X=2)=1/6,…, p(X=6)= 1/6} 信源的数学模型:

信息论基础第2章离散信源及其信息度量[83页]

信息论基础第2章离散信源及其信息度量[83页]
④ 一般情况下,如果以 r 为底 r 1,则
I (ai ) logr P(ai ) (r进制单位)
通常采用“比特”作为信息量的实用单位。在本书中,且为了 书写简洁,底数 2 通常省略不写。
【例】假设有这样一种彩票,中奖概率为 0.0001,不中 奖概率为 0.9999。现有一个人买了一注彩票。 试计算
定义: 设信源的概率空间为
X
P( x)
a1 P(a1
)
a2 P(a2 )
aq
P(aq )
则自信息量的数学期望定义为信源的平均自信息量,即
q
H ( X ) E[I (ai )] P(ai ) log2 P(ai ) (bit/符号) i 1
简记为
H ( X ) P(x) log2 P(x) xX
(1) 事件“彩票中奖”的不确定性; (2) 事件“彩票不中奖”的不确定性; (3) 事件“彩票中奖”和事件“彩票不中奖”相
比较,哪个提供的信息量较大?
【例】 对于 2n 进制的数字序列, 假设每一符号的出现相互 独立且概率相等,求任一符号的自信息量。
解:
根据题意, P(ai ) =1/2n,所以 I (ai ) log P(ai ) log(1/ 2n ) n(bit)
一般的多符号离散信源输出的随机序列的统计特性 比较复杂,分析起来也比较困难。将在第 3 章中详细讨 论。
《信息论基础》
2.3 离散随机变量的信息度量
一、自信息量I(xi)和信息熵H(X)
定义: 随机事件的自信息量定义为该事件发生概率的
对数的负值。设集合 X 中的事件 x ai 发生概率为 P(ai ) ,
按输出符号之间依赖关系分类,多符号离散信源 可分为无记忆信源和有记忆信源。

信息论与编码基础第2章离散信源及其信息测度

信息论与编码基础第2章离散信源及其信息测度

故:
P1(Xi) = P2 (Xi)= ···= PN (Xi)
N
P( X ) P( X1, X 2, , X N ) P( X i ) i 1
2.1 信源的数学模型及分类
15
设各随机变量 Xi 取自同样符号集 A={a1, a2, …, aq},则:
N
P( X i ) P(ai1 , ai2 ,..., aiN ) P(aik ), ik {1, 2,..., q} k 1
... ...
aq P(aq )
q
P(ai ) 1
i 1
称事件ai发生所含有的信息量为 ai 的自信息量。定义为:
I (ai )
f [P(ai )] logr
1 P(ai )
logr
P(ai )
2.2 离散信源的信息熵
24
I(ai)代表两种含义:(1) 当事件ai 发生以前,表示事件ai 发生 的不确定性;(2) 当事件ai 发生以后,表示事件ai 所提供的信 息量。
1
信息论与编码基础
第二章 离散信源及其信息测度
第二章 离散信源及其信息测度
2
消息是信息的载荷者。对信息的研究,要从消息开始。 信源是产生消息或消息序列的源头。我们并不关心信源的内
部结构,不关心消息的产生原因和过程,而研究信源各种可 能的输出,以及输出各种可能消息的不确定性。 对收信者而言,在收到消息之前,对于信源发送什么消息是 不可预知的、随机的。因此可以用随机变量和随机过程来描 述信源输出的消息,或者说用一个概率空间来描述信源。 不同的信源输出不同类型的消息。可以根据消息不同的随机 性质来对信源进行分类。
qN
qN N
k 1
P(i ) P(aik ) 1

信息论基础第2章离散信源及其信息度量

信息论基础第2章离散信源及其信息度量
《信息论基础》
第2章 离散信源及其信息度量
本章内容
2.1 离散信源的分类 2.2 离散信源的统计特性 2.3 离散随机变量的信息度量 2.4 离散信源的N次扩展信源 2.5 离散平稳信源 2.6 马尔可夫信源 2.7 离散信源的相关性和剩余度
《信息论基础》
2.1 离散信源的分类
离散信源的分类
按照离散信源输出的是一个消息符号还是消息符 号序列,可分为单符号离散信源和多符号离散信 源。
,
q2 pn
,
qm ) pn
n
m
其中, pi 1, qj pn 。
i1
j 1
可见,由于划分而产生的不确定性而导致熵的增加量为
pnHm (
q1 pn
,
q2 pn
, qm pn
)
6、上凸性
熵函数 H (p) 是概率矢量 p ( p1, p2 ,
pq ) 的严格∩型凸函数
( 或 称 上 凸 函 数 )。 即 对 任 意 概 率 矢 量 p1 ( p1, p2 , pq ) 和
成 H ( p1) 或 H ( p2 ) 。
和自信息相似,信息熵 H ( X ) 有两种物理含义:
① 信源输出前,信源的信息熵表示信源的平均 不确定度。
② 信源输出后,信源的信息熵表示信源输出一 个离散消息符号所提供的平均信息量。如果信道无噪 声干扰,信宿获得的平均信息量就等于信源的平均信 息量,即信息熵。需要注意的是,若信道中存在噪声, 信宿获得的平均信息量不再是信息熵,而是 2.5 节介 绍的平均互信息。
联合熵 H (XY ) 的物理含义表示联合离散符号集 XY 上
的每个元素对平均提供的信息量或平均不确定性。 单位为“bit/符号对”。 需要注意的是,两个随机变量 X 和 Y 既可以表示两个

信息论 基础理论与应用第三版(傅祖芸)第2章 离散信源及其信息测度

信息论 基础理论与应用第三版(傅祖芸)第2章 离散信源及其信息测度

2)离散无记忆平稳信源
离散平稳信源的特例,信源发出的符号都相互统计独立,即各随机变 量Xi (i=1,2,…,N)之间统计独立。
性质:
独立->P(X)= P(X1, X2, …,XN)= P1(X1) · P2(X2)· · · PN(XN) 平稳->P1(Xi) = P2(Xi)=· · ·= PN(Xi) = P(Xi)
5)m阶马尔可夫信源(非平稳信源)
不同时刻发出的符号间的依赖关系
P(xi | xi2 xi1xi1 xi2 xim x1 ) P(xi | xi1xi2 xim ) (i 1,2, , N )
记忆信源的记忆长度为m+1时,称这种有记忆信源为m 阶马尔可夫信源。
若上述条件概率与时间起点 i 无关,信源输出的符号序 列可看成为时齐马尔可夫链,则此信源称为时齐马尔可 夫信源。
乙地天气预报的信源空间的信息熵为:
H (Y ) 7 log 7 1 log 1 log 1 7 log 7 0.544(bit / 符号)
8 88 8
88
讨论:甲地极端情况
X 晴 阴 大雨 小雨
极端情况1:晴天概率=1
P(x)
1
0
0
0
H(X ) 1 log1 0 log 0 0 log 0 0 log 0
4)有记忆信源
信源在不同时刻发出的符号之间是相互依赖的,即信源输出 的随机序列X中,各随机变量Xi之间相互依赖。
须使用随机矢量的联合概率分布和条件概率分布来说明它们 之间的关联关系。
例:汉字组成的中文序列中,只有根据中文的语法、习惯用语、 修辞制约和表达实际意义的制约所构成的中文序列才是有意义 的中文句子或文章。所以,在汉字序列中前后文字的出现是有 依赖的,是彼此相关的。

通信原理第三章-离散信源及信息测度

通信原理第三章-离散信源及信息测度
源的信息测度。 设离散信源 X,其概率空间为
X P(x)
a1, P(a1),
a2 , P(a2 ),
aq
P(aq ),q 源自 1P(ai )1
我们将自信息的数学期望定义为信源的平均自信息量,即
1 q
H
(X
)
E
log
P(ai
)
i1
P(ai
) log
P(ai
)
(3-6)
H ( X ) 也被称为信源的信息熵。
言文字作为信源,输出的消息是由汉字和标点符号组成的符号序列,其中每个符号的出现是 不确定的、随机的,由此构成了不同的中文消息。又如,对离散化的平面灰度图像信源来说, 从 XY 平面空间上来看,每幅黑白灰度画面都是一系列空间离散的灰度值符号,而空间每一 点的符号(灰度值)又都是随机的,由此形成了不同的图像消息。上述这类信源输出的一系 列随机变量,即为随机矢量。这样,信源的输出可用 N 维随机矢量 X (X1X2 X N ) 来描 述,其中 N 可为有限正整数或可数的无限值。这 N 维随机矢量 X 也称为随机序列。
在通信系统中收信者在未收到消息以前,对信源发出什么消息是不确定的,是随机的, 所以可用随机变量、随机矢量或随机过程来描述信源输出的消息。不同的信源输出的消息不 同,可以根据消息的不同的随机性质来对信源进行分类。
1)信源输出的单符号消息可用随机变量描述 在实际情况中,有些信源可能输出的消息数是有限的或可数的,而且每次只输出其中一
个消息,如书信文字、计算机的代码、电报符号、阿拉伯数字码等。这些信源输出的都是单
个符号的消息,它们符号集的取值是有限的或可数的。我们可用一维离散型随机变量 X 来
描述这些信源的输出。这样的信源称为离散信源。它的数学模型就是离散型的概率空间

第2章离散信源及其信息测度

第2章离散信源及其信息测度

X
P
(a, b) p(x)
p(x) 0,
b
p(x)dx 1
a
2.1 信源的数学模型及分类
2.1.2 信源输出的消息用随机矢量描述
实际信源每次输出的消息是按一定概率选取的 符号序列,可以看做是时间上或者空间的随机矢 量。用N维随机矢量X=(X1,X2,…,XN)表示,又称 为随机序列。
主要内容
2.1 信源的数学模型及分类 2.2 离散信源的信息熵 2.3 信息熵的基本性质 2.4 离散无记忆信源的扩展信源 2.5 离散平稳信源 2.6 信源剩余度
2.1 信源的数学模型及分类
通信过程是从信源开始的,信源发送的是消息 或消息序列,通信系统中传递的是消息,消息中 包含信息。因此,通过研究消息来研究信源。
若随机矢量的各维概率分布都与时间起点无关, 这样的信源称为平稳信源。
每个随机变量Xi都是离散取值且其可能取值是 有限的,这样的信源称为离散平稳信源。
每个随机变量Xi都是连续取值的连续型随机变 量,则为连续平稳信源。
2.1 信源的数学模型及分类
若信源先后发出的各个符号彼此统计独立,则:
P(X ) P(X1X 2 X N ) P(X1)P(X 2)P(X N )
小与信源的符号数及其概率分布有关。
用概率矢量P来表示概率分布,H(P)为熵函数。
P (P(a1), P(a2), , P(aq )) ( p1, p2, , pq )
2.1 信源的数学模型及分类
则信源X所输出的随机矢量X所描述的信源称 为离散无记忆信源X的N次扩展信源
若信源在不同时刻发出的符号之间是相互依赖 的,这种信源为有记忆信源。
通常符号之间的依赖关系(记忆长度)是有限 的,若记忆长度为m+1,则称这种有记忆信源为 m阶马尔可夫信源。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

预备知识一、矩阵处理1)在MATLAB中矩阵的创建应遵循以下基本常规:矩阵元素应用方括号([])括住;每行内的元素间用逗号(,)或空格隔开;行与行之间用分号(;)或回车键隔开;元素可以是数值或表达式。

2)矩阵赋值若A=[1 2 3; 4 5 6; 7 8 9;10 11 12]若A=[1 2 3; 4 5 6; 7 8 9;10 11 12],选出前3行构成矩阵B,B=A(1:3,:)选出前2列构成矩阵C,C=A(:,1:2)3)矩阵删除在MATLAB中可以对数组中的单个元素、子矩阵和所有元素进行删除操作,删除就是将其赋值为空矩阵(用[]表示)。

若将A的2,3行去除,则A([2,3],:)=[]4)矩阵变换A' %矩阵A的转置A(:) %矩阵A按列展开形成一维数组5)矩阵运算点运算两个矩阵之间的点运算是按照数组运算规则计算,矩阵的对应元素直接运算。

要求参加运算的矩阵大小必须相同。

有“.*”、“./”和“.\”三种运算符。

乘法运算两个矩阵的维数相容时(A的列数等于B的行数),可以进行A乘B的乘法运算。

二、M文件if语句最简单的选择结构语句,其基本格式为:if 表达式语句组end说明:表达式多为关系或逻辑表达式。

如果表达式为真(非零),就执行if和end之间的语句组,然后再执行end之后的语句;如果表达式为假(零),就直接执行end之后的语句。

for语句for语句为计数循环语句,在许多情况下,循环条件是有规律变化的,通常把循环条件初值、终值和变化步长放在循环语句的开头,这种形式就是for语句的循环结构。

for循环的一般形式是:for 循环变量名=表达式1:表达式2:表达式3语句体end说明:其中表达式1的值是循环变量的初值,表达式2的值是循环步长,表达式3的值是循环变量的终值。

初值、步长和终值可以取整数、小数、正数和负数,步长可以缺省,缺省值为1。

continue语句continue语句用于控制for循环或while循环跳过某些执行语句,当出现continue 语句时,则跳过循环体中所有剩余的语句,继续下一次循环,即结束本次循环。

三、函数文件基本结构函数文件由function关键字引导,其基本结构为:function [输出形参表]=函数名(输入形参表)注释说明部分函数体语句return说明:以function开头的一行为引导行,表示该文件是一个函数文件。

函数名的命名规则与变量名相同。

输入形参表是函数的输入参数,可以有多个,用“逗号”来分隔;输出形参表为函数的输出参数,当输出形参只有一个时,直接输入变量名而不用方括号,多个输出形参用“逗号”来分隔。

注意:函数文件编辑结束后,不能像M文件那样单击〈F5〉或单击Debug → Save and Run选项运行,而是要直接存盘。

函数调用函数文件编制好后,就可以调用函数进行计算了。

函数调用的一般格式为:[输出实参表]=函数名(输入实参表)需要注意的是,函数调用时各实参出现的顺序、个数,应与函数定义时形参的顺序、个数一致,否则会出错。

函数调用时,先将实参传递给相应的形参,从而实现参数传递,然后再执行函数的功能。

四、二维绘图二维绘图plot(x,y,’参数’)说明:x,y可以是向量或矩阵,参数选项为一个字符串,决定二维图形的颜色、线型及数据点的图标。

plot (x1, y1, ‘参数1’,x2, y2, ‘参数2’,…)说明:可以用同一函数在同一坐标系中画多幅图形,x1,y1确定第一条曲线的坐标值,参数1为第一条曲线的选项参数;x2,y2为第二曲线的坐标值,参数2为第二条曲线的选项参数;其他图形以次类推。

坐标轴的调整(1)坐标轴比例控制函数:axis([xmin xmax ymin ymax])说明:将图形的x轴范围限定在[xmin xmax]之间,y轴的范围限定在[ymin ymax ]之间。

MATLAB绘制图形时,按照给定的数据值确定坐标轴参数范围。

(2)有关图形的标题、坐标轴标注等图形文字标识类函数如下:函数:title(‘字符串’)说明:图形标题。

函数:xlabel(‘字符串’)说明:x轴标注。

函数:ylabel(‘字符串’)说明:y轴标注。

函数:text(x,y,‘字符串’)说明:在坐标(x,y)处标注说明文字。

函数:gtext(‘字符串’)说明:用鼠标在特定处标注说明文字。

图形控制(1)图形的保持函数:hold on说明:保持当前图形及轴系的所有特性(2)网格控制函数:grid on说明:在所画的图形中添加网格线五、三维绘图1.meshgrid函数按指定方式创建网格矩阵。

函数:[X,Y]=meshgrid(a,b)说明:将等长度向量a,b,转换为二维网格数据,再以一组z轴的数据对应到这个二维网格,即可得到三维数据。

MATLAB提供了plot3函数绘制三维曲线图形。

该函数将绘制二维图形的函数plot的特性扩展到了三维空间,其功能和使用方法类似于绘制二维图形的函数。

其格式为:plot3(x1,y1,z1,‘参数1’,x2,y2,z2,‘参数2’,…)三维曲面图:surf (z)色的,其内部用不同的颜色填充六、符号计算1.定义符号变量函数:syms 变量名1 变量名2 变量名3 …说明:一次创建多个符号变量。

2.符号方程求解[x1,x2,…xn]solve(s1,s2,…sn)求解由符号表达式s1,s2,…sn组成的代数方程组,自变量分别为x1,x2,...xn3.级数的符号求和函数格式说明函数格式说明symsum(S)计算符号表达式S(表示级数的通项)对于默认自变量的不定和。

symsum(S,a,b)计算符号表达式S对于默认自变量从a到b的有限和。

symsum(S,x)计算符号表达式S对于自变量x的不定和。

symsum(S,x,a,b)计算符号表达式S对于自变量x从a到b的有限和。

4.符号计算结果的绘图实验一 离散信源及其信息测度一、[实验目的]1.掌握离散信源熵的原理和计算方法。

2.熟悉matlab 软件的基本操作,练习应用matlab 软件进行信源熵函数曲线的绘制。

3.理解信源熵的物理意义,并能从信源熵函数曲线图上进行解释其物理意义。

二、[实验环境]windows 系统,MATLAB三、[实验原理]1. 离散信源相关的基本概念、原理和计算公式(1)产生离散信息的信源称为离散信源。

离散信源只能产生有限种符号。

随机事件的自信息量I (xi )为其对应的随机变量xi 出现概率对数的负值。

即: I (xi )= -log2p ( xi)(2)信源输出的各消息的自信息量的数学期望为信源的信息熵,信源熵是信源的统计平均不确定性的描述,是概率函数()p x 的函数。

表达式如下:1()[()]()log ()qi i i H X E I xi p x p x ===-∑2. 二元信源的信息熵及二维绘图1)设信源符号集X={0,1} ,每个符号发生的概率分别为p(0)= p ,p(1)= q ,p+ q =1,即信源的概率空间为 :,则该二元信源的信源熵为:H( X) = - plogp –qlogq = - plogp –(1 - p)log(1- p) 即:H (p) = - plogp –(1 - p)log(1- p) 其中 0 ≤ p ≤1 2)MATLAB 二维绘图用matlab 中的命令plot( x , y) 就可以自动绘制出二维图来。

如:在matlab 上绘制余弦曲线图,y = cos x ,其中 0 ≤ x ≤ 2。

>>x =0:0.1:2*pi ; %生成横坐标向量,使其为 0,0.1,0.2,…,6.2 >>y =cos(x ); %计算余弦向量 >>plot(x ,y ) %绘制图形 3.求解联合熵,条件熵,平均符号熵4.求解马尔可夫信源的稳态分布及n 步转移矩阵 P (n )=P^n ;稳态分布要满足W*P=W 及∑W=1四、[实验内容]1、用matlab 编程实现离散无记忆信源熵值的计算。

编写一M 函数文件:function H= entropy(p)2、绘制2元符号信源熵函数与概率分布曲线,图形如下图所示:)(21)(212X X H X H =21211(|)()(|)q i i i H X X p a H X X a ===∑1111()(|)log (|)()log (|)qqqqi j i j i i j j i i j i j p a p a a p a a p a a p a a =====-=-∑∑∑∑1211()()log ()q qi j i j i j H X X p a a p a a ===-∑∑)|()(121X X H X H +=aiaj0 1 20 1/4 1/18 0 1 1/18 1/3 1/18 2 0 1/18 7/36 2124、一个马尔可夫信源有3个符号{}1,23,u u u ,转移概率为:()11|1/2p u u =,()21|1/2p u u =,()31|0p u u =,()12|1/3p u u =,()22|0p u u =,()32|2/3p u u =,()13|1/3p u u =,()23|2/3p u u =,()33|0p u u =,求出各符号稳态概率分布及二步转移概率矩阵五、[设计思路]1) 求解信息熵过程:去除信源中符号分布概率为零的元素, 根据平均信息量公式,求出离散信源的熵。

2) H (p) = - plogp –(1 - p)log(1- p) 其中 0 ≤ p ≤1 ,用matlab 中的命令plot( x , y) 就可以自动绘制出二维图来。

3) 根据公式进行求解4) 可列出状态转移矩阵为:1/21/201/302/31/32/30p ⎛⎫ ⎪= ⎪ ⎪⎝⎭,设状态u 1,u 2,u 3稳定后的概率分别为W 1,W 2、W 3由1231WP W W W W =⎧⎨++=⎩得1231132231231112331223231W W W W W W W W W W W W ⎧++=⎪⎪⎪+=⎪⎨⎪=⎪⎪⎪++=⎩ 六、[实验步骤]七、[实验结果]。

相关文档
最新文档