编码理论习题

编码理论习题
编码理论习题

目录

第一章概述 (1)

1.1:通信的主要目的是什么? (1)

1.2-1:信道编码的主要目的是什么? (1)

1.2-2:信源编码的主要目的是什么? (1)

1.3:仙农编码定理的主要内容是什么? (1)

1.4:请画出数字通信系统模型的通用框图。 (1)

1.5:信源编码扩张了数据么,为什么? (2)

1.6:信道编码扩张了数据么,为什么? (2)

1.7:为什么要用信源编码器?理想的信源编码器应该满足什么要求? (2)

1.8:为什么要用信道编码器? (2)

1.9:为什么要用调制器? (2)

1.10:有哪些典型的传输信道、存储媒质和信道干扰? (2)

1.11:为什么要用解调器? (3)

1.12:信道译码器的功能是什么? (3)

1.13:为什么要用信源译码器? (3)

1.14:请画出数字通信系统模型的简化框图。 (3)

1.15:简述信道编码的主要应用领域? (3)

1.16:简述分组码和卷积码的相同点和不同点。Ppt 7-20 (3)

1.17:硬判决和软判决有什么不同?ppt 22 (4)

1.18:仙农信息论的基本思想是什么? (4)

1.19:什么是正交振幅调制?PPT41-42 (4)

1.20:最大后验概率译码和最大似然译码之间的关系是什么?PPT45-48 (5)

1.21:最小距离译码准则和最大似然译码准则的关系。PPT48 (5)

1.22:列出2种典型传输错误并说明其不同点。PPT50-51 (5)

1.23:列出3种差错控制方式,比较传输效率。PPT53-57 (6)

1.24:计算题:自信息、概率、互信息、信息熵、条件熵 (6)

1.25:信息熵和消息的平均信息量、信源的平均不确定性之间有什么关系?PPT81-82 .8

1.26:简述等长信源编码定理的主要内容。PPT86 (8)

1.27:简述前缀码和惟一可译码之间的关系。PPT91 (9)

1.28:霍夫曼编码唯一么?简述霍夫曼编码的主要步骤。PPT97-100 (9)

1.29:计算题:游程编码压缩率 (9)

1.30:简述LZ编码的分段方法和编码方法。PPT103-104 (10)

1.31:求LZ编码后的码字。 (10)

1.32:计算题:求信道容量。 (10)

1.33:求具有如下信道传递矩阵的信道的容量。 (11)

1.34:简述信道编码定理的内容。PPT110 (11)

1.35:什么是无记忆信道和二元对称信道?PPT27 (12)

1.36:仙农的信息定义是什么?信息量的多少跟事件发生的不确定性之间有什么关系?

ppt75 (12)

第二章数学基础 (12)

2.1:某些域中元素有大小之分,另一些域中的元素无大小之分,各举一个例子。 (12)

2.2:交换律、分配律、结合律在群上成立么?在环上成立么?在域上成立么?PPT3、

12、14 (12)

2.3:简述群、环、域三者之间的关系? (12)

2.4:存在含有256个元素的有限域么?为什么? (13)

2.5:构造一个含13个元素的有限域。在该域中,3的逆元和负元是什么? (13)

2.6:全体整数的集合对普通减法是否构成一个群?为什么? (13)

2.7:全体非负整数的集合在加法和乘法下是否构成群?为什么?PPT3 (13)

2.8:证明群的性质定理1-4。PPT6-7 (13)

2.9:简述循环群的定义,什么是生成元?PPT8 (14)

2.10:什么是有限域?什么是扩域?什么是域的特征?PPT16-18 (14)

2.11:证明有限域的性质定理1-3。PPT19-21 (14)

2.12:证明有限域的特征定理1-3。PPT18,23-25 (15)

2.13:简述本原元的定义,并且会用该定义判断当给定q时有限域GF(q)上的本原元。

(15)

2.14:什么是多项式?什么是首一多项式?PPT27 (15)

2.15:掌握根据本原多项式和本原元生成GF(2)的扩域GF(2m)的方法。PPT27-29 (15)

2.17:什么是本原多项式?PPT38 (15)

2.18:证明GF(2)上的多项式f(x)满足[f(x)]2= f(x2) PPT39 (15)

2.19:GF(2)上的多项式的根的特点是什么。PPT46 (15)

2.20:什么是域元素的共轭元。PPT47 (16)

2.21:什么是最小多项式?PPT49 (16)

2.22:什么是矢量空间?PPT56 (16)

2.23:矢量空间有哪些性质?PPT58 (16)

2.24:简述n重的定义。PPT59 (16)

2.25:什么是线性组合?什么是线性相关?PPT63 (16)

第三章 (17)

3.1:简述线性(n,k)分组码的定义。PPT2 (17)

3.2:什么是生成矩阵?请具体构造几个线性(n,k)分组码的生成矩阵。PPT4-5 (17)

3.3:什么是线性系统(n,k)分组码? (18)

3.4:什么是一致校验方程?什么是一致校验矩阵?什么是对偶码?PPT7-10 (18)

3.5:什么是伴随式?伴随式纠错的原理是什么?PPT11-14 (18)

3.6:什么是汉明重量?什么是汉明距离?汉明距离的性质是什么? (19)

3.7:重量分布和距离分布的定义是什么?简述二者之间的联系。 (19)

3.8:如何计算线性分组码的检错纠错能力?PPT19-22 (19)

3.9:什么是最大距离可分码?PPT23 (19)

3.10:简述标准阵的构造步骤?PPT25-17 (19)

3.11:标准阵的性质是什么?证明标准阵的性质2。PPT28 (20)

3.12:什么是陪集和陪集首?PPT29 (20)

3.13:简述基于标准阵的译码策略和最小距离译码策略的内容。PPT30 (20)

3.14:证明陪集的性质定理1-4。PPT34-36 (20)

3.15:简述伴随式译码方法的步骤。PPT39 (21)

3.16:请构造一种线性分组码,给出具体的生成矩阵,一致校验矩阵,以及译码方法等。

(21)

4.1:什么是循环右移?什么是循环码?PPT2 (21)

4.2:什么是码字多项式?证明码字多项式v(i)(x)就是x i v(0)(x)/(x n+1)的余式。PPT3-5 (21)

4.3:证明循环码的代数性质定理1-3?PPT6-9 (22)

4.4:简述系统循环码的编码原理和编码步骤?ppt15 (22)

4.5:请构造一个具体的循环码并且采用适当的算法进行译码? (23)

4.6:如何根据码字多项式g(x)得到循环码的生成多项式? (24)

带计算器,书,打印PPT

第一章概述

1.1:通信的主要目的是什么?

通信: 采用某种方法,借助某种媒介将信息从甲地传送到乙地的过程

通信的目的:要把对方不知道的消息及时可靠地(有时秘密的)传送给对方

1.2-1:信道编码的主要目的是什么?

纠错编码:主要用于实现信道纠错,又叫做信道编码或者差错控制编码

信道编码的主要作用是:通过对做完信源编码后的信息加入冗余信息,使得接收方在收到信号后,可通过信道编码中的冗余信息,做前向纠错。保证通信的可靠性。

1.2-2:信源编码的主要目的是什么?

信源编码的主要作用是:在保证通信质量的前提下,将模拟信号转化为数字信号,尽可能的通过对信源的压缩,提高通信时的有效性。就是让通信变得更加的有效率。以更少的符号来表示原始信息,所以减少了信源的冗余度。

1.3:仙农编码定理的主要内容是什么?

仙农编码定理:如果系统的传输率小于信道容量,那么适当选择编码技术就能实现可靠通信,即可以将差错率减小到任意小的程度。更确切地,每个信道都具有固定的信道容量C,对任何小于C的信息传输率R,存在一个码长为n码率为R的分组码,若用最大似然译码,

则其译码错误概率为

)

(R

nE

e

b

Ae

P-

。对于码率为R约束长度为n

e

的卷积码,其译码错误

概率也有类似的关系,即

)

(R

nE

e

b

Ae

P-

其中A和B都为大于0的数,Eb(R)和Ee(R)

为正实函数,叫做误差指数。

1.4:请画出数字通信系统模型的通用框图。

所有的数字通信系统,如雷达,遥控遥测,数字存储系统,计算机等,都可以归结为如下的模型:

数字传输和存储有共同之处,两者都是将数据从信源传送到目的地

1.5:信源编码扩张了数据么,为什么?

信源: 信源可以是人或机器,信源发出的消息可以是语言、文字、图像、声音、传感器输出的数据等,信源的输出可以是连续波形,也可以是离散的符号序列

信源编码器:将信源输出变成二元数字(bit)序列,称为信息序列,在信源连续的情况下,还需要进行模/数(A/D)转换(模拟量analogue->数字量digital的转换,模拟信号进行数字化)。理想信源编码器模型要满足(1)为表示信源输出所要求的单位时间的比特数要尽量小;(2)信源的输出S可从信息序列U中确切的重新构造

答:信源编码没有扩张数据。信源编码减少了数据的冗余度。

信源编码器:将信源输出变成二元数字(bit)序列,称为信息序列,在信源连续的情况下,还需要进行模/数(A/D)转换。理想信源编码器模型要满足(1)为表示信源输出所要求的单位时间的比特数要尽量小;(2)信源的输出S可从信息序列U中确切的重新构造

1.6:信道编码扩张了数据么,为什么?

答:信道编码扩张了数据。人为增加冗余度,使其具有自动检错和纠错的能力。

信道编码器:将信息序列U变换成离散的有结构的编码序列X,这称为码字。即为了使传输有效,人为的增加一些冗余度,使其具有自动检错和纠错的能力。码字的结构主要用以对付传输或存储码字的有扰信道。

1.7:为什么要用信源编码器?理想的信源编码器应该满足什么要求?

答:为了减少数据的冗余。

信源编码器:将信源输出变成二元数字(bit)序列,称为信息序列,在信源连续的情况下,还需要进行模/数(A/D)转换。

理想信源编码器模型要满足:

(1)为表示信源输出所要求的单位时间的比特数要尽量小;

(2)信源的输出S可从信息序列U中确切的重新构造

1.8:为什么要用信道编码器?

为了使传输有效,人为的增加一些冗余度,使其具有自动检错和纠错的能力。

信道编码器:将信息序列U变换成离散的有结构的编码序列X,这称为码字。即为了使传输有效,人为的增加一些冗余度,使其具有自动检错和纠错的能力。码字的结构主要用以对付传输或存储码字的有扰信道,码字的设计和实现是本课程的主题。

1.9:为什么要用调制器?

调制器(写入单元):离散符号不适合于在实际信道上传输或记录在数字存储媒质上。调制器将信道编码器的每个输出的离散符号,通过调制变成适合传输(或存储)的持续时间为T的波形,此波型进入信道(或存储媒质),并受噪声干扰。

1.10:有哪些典型的传输信道、存储媒质和信道干扰?

典型的传输信道:有线信道、无线信道、电话线路、高频无线线路、遥测线路、微波线路、卫星线路、光纤信道、磁记录信道、大气光信道、水声信道等

典型的存储煤质:磁芯和半导体存储器、磁带、磁鼓、磁盘、光存储器、光盘等

典型的干扰:开关脉冲噪声、热噪声、串音、闪电、磁涂层缺损、光盘划痕等

1.11:为什么要用解调器?

解调器(或读出单元) :处理接收到的每个持续时间为T的波形,并产生一个可能是离散的(量化的)或连续的(未量化的)输出。对应于编码序列X的解调器的输出序列Y称为接收序列

1.12:信道译码器的功能是什么?

信道译码器:将接收序列Y变换成二元序列V,称为估值序列。在理想的情况下,V与信息序列U完全一致,但是噪声会造成译码错误。译码方法根据信道编码规则和信道(或存储煤质)的噪声特性而定。

1.13:为什么要用信源译码器?

信源译码器:把估值序列V变成信源输出的估值(原来消息的估值),并将此估值传送给用户。如果信源是连续的,需要进行数/模转换(D/A转换)。在一个精心设计的系统中,除非信道(或存储煤质)的干扰太强,否则这个估值将是信源输出的准确重现

1.14:请画出数字通信系统模型的简化框图。

离散信源:指原来的信源和信源编码器

编码信道:调制器、实际信道和解调器

信宿:信源译码器和用户

1.15:简述信道编码的主要应用领域?

通信系统:如卫星、有线和无线的电话通信、军事通信等,利用纠错码来实现可靠通信和敌人的恶意干扰

计算机系统:如计算机存储器、数字磁带、磁盘、光盘、数字逻辑电路中

商业领域:如条形码,由黑白相间的不同宽度的条纹来代表不同的信息,包含了一定的纠错信息,可以纠正由于条码的模糊不清等原因造成的读写错误,因此条形码在运输、仓储、超级市场管理等物流行业获得了广泛的应用

1.16:简述分组码和卷积码的相同点和不同点。Ppt 7-20

分组码:

编码器:将信息序列分为长度为K比特的消息段U=[u

1,u

2

, …,u

K

],称为消息,分组进行编

码,总共有2K

个消息,将每个消息U独立的变换成长度为N比特的码字的序列V=[v

1

,v

2

, …,v

N

]

(N, K)分组码:所有个2K

码字的集合

码速率:比值R=K/N ,可以理解为码字含有信息比特数量,为使编码不冲突,R ≤1

纠错机理:当R <1时,码字比消息多了n-k 个比特,称为校验位,可以抗干扰

无记忆:每个N 长的码字V 由相应的K 长消息U 唯一确定

分组码可用组合逻辑电路来实现

卷积码:

编码器:也是接收长度K 比特的信息序列U =[u 1,u 2, …,u K

],并产生一个长度为N 比特的码字的序列V =[v 1,v 2, …,v N

] 有记忆:每一编码组不仅与同一时间单元上K 比特消息有关,还与前m 个输入有关。

因而编码器的存储器为m 级

(N, K, m)卷积码:有K 个输入,N 个输出,存储级为m 的编码器产生的序列集

码速率:比值R=K/N

在K

数,当保持K,N 不变时,可通过增大存储级来添加更多的冗余度

卷积码有记忆,必须用序列逻辑电路来实现

1.17:硬判决和软判决有什么不同?ppt 22

因为存在噪声或干扰,信号在信道中传输,经常会发生错误,所以接收端必须进行判决

以确定发送端发送的是什么码元:

硬判决:当用二元码时,调制器仅有二元输入。类似的,解调器输出采用二元量化时,译码器只有二元输入,这种情况下,解调器采用硬判决。高于门限值的认为是1,低于门限值的认为是0。

软判决:如解调器输出未量化或者量化门限大于2,则解调器采用软判决。供给译码器

的值不止二个,而有Q 个(通常为 2m 个)。另一方面,在某些情况下也可由解调器输出的未量化的模拟电压序列或其变换序列作为似然函数,送入译码器译码。译码器利用解调器送入的 Q 进制量化序列或模拟序列,并利用码的代数结构译码的方法称为软判决译码,它是一种概率译码方法。

删除信号:对没有把握做出正确判决的信号,就暂时搁置起来不做判决,并用“×”表

示,称为删除符号

1.18:仙农信息论的基本思想是什么?

1948年,仙农在一篇具有历史意义的论文指出证明了:对信息进行适当的编码,在不

牺牲信息传输和存储速率的情况下,可以将有扰信道或存储介质引入的差错减到任意低的程度。

仙农编码定理解决了纠错码的存在性问题,从此纠错编码的研究与应用开始了前所未有

的发展,人们一直在不停的努力解决构造性问题

过程比结果更重要:为了接近信息传输率的上限,已经提出了很多的纠错编码技术

1.19:什么是正交振幅调制?PPT41-42

QAM :Quadrature Amplitude Modulation

数据信号:由相互正交的两个载波的幅度变化表示

幅度、相位联合调制:在最小距离相同的条件下可实现更高的频带利用率

QAM最高已达到1024-QAM(1024个样点) ,样点数目越多,传输效率越高

举例:具有16个样点的16-QAM信号,每个样点表示一种矢量状态,16-QAM有16态,每4位二进制数规定了16态中的一态,16-QAM中规定了16种载波和相位的组合,16-QAM

的每个符号和周期传送4比特

调制的原理:发送数据在编码器内被分成两路,各为原来两路信号的1/2,然后分别与一对正交调制分量相乘,求和后输出。接收端完成相反过程,正交解调出两个相反码流,均衡器补偿由信道引起的失真,判决器识别复数信号并映射回原来的二进制信号。

1.20:最大后验概率译码和最大似然译码之间的关系是什么?PPT45-48

最大后验概率译码:对于每个输入Y,如果译码器能在码字集合中选择一个码字X,作为发送码字的估值,并且使P(X/Y)最大,称这种规则为最大后验概率译码。则这种译码规则一定能使译码器输出的错误概率最小,为最佳译码。

最大似然译码:假设发送端发送每个码字概率P(Xi)均相等,且P(Y)与译码方式无关。若能在码字集合选择合适的码字X,使得P(Y/X)最大,则这种译码规则被称为最大似然译码。如果发送端发送每个码字概率P(Xi)不相等,最大似然译码则不是最佳译码。

贝叶斯公式:

如果先验满足均匀分布,那么最大后验概率和最大似然估计得到的结果一致。

1.21:最小距离译码准则和最大似然译码准则的关系。PPT48

最小距离译码器:在BSC中,MLD规则变成了选择能使Y和X之间的汉明距离为最小的向量,作为码字X的估计值

MLD:对应的译码器称为最大似然译码器

BSC信道:二进制信道

DMC信道:离散无记忆信道

1.22:列出2种典型传输错误并说明其不同点。PPT50-51

(1)随机错误:

定义:接收序列中的传输错误是随机出现的

这样的信道称为随机错误信道

常见于无记忆信道中,因为噪声随机独立的影响每个传输信号

深空通信和卫星通信信道都是典型的随机错误信道

为纠正随机错误而设计的码称为纠随机错误码

(2)突发错误

定义:不同状态特性下,错误出现的概率不一样,这种错误为突发错误

信道状态特性变化较大,进而有突发错误信道的概念。常出现在有记忆信道中,此时噪声对各次传输的影响是彼此相关的

突发错误的例子:无线通信(由多径传输引起的信号衰落造成的错误),有线和电缆传输(开关脉冲和串话的影响),磁带记录(涂层缺损和灰尘引起的带脱落)

纠突发错误码:为纠正突发错误而设计的码

(3)不同点:随机错误的特点是码元间的错误相互独立,及每个码元的错误概率与它前后的错误无关。突发错误则不然,一个码元的错误往往影响前后码元的错误概率。即一个码元产生错误则后面几个码元都可能发生错误。

1.23:列出3种差错控制方式,比较传输效率。PPT53-57

(1)前向纠错(FEC):利用纠错码自动的纠正接收端检查出的错误

单向传输系统一般只能这样差错控制

优点:不需要反馈信道,译码实时性好,控制电路简单,能进行一个用户对多个用户的同播通信

缺点:译码设备较复杂,对信道适应性差,所选用的纠错码必须与信道的干扰情况相匹配,编码效率低

例子:磁带存储系统(记录在磁带上的信息很久以后再重读),深空通信系统(飞行体上的编码设备很简单,地面的译码设备可以很强大),军事通信

(2)自动要求重传(ARQ):当接收端检查到错误时,就自动要求发送端重新传送该消息

优点:易于实现,成本和复杂性低

缺点:必须有反馈信道,实现控制较复杂,难以用于同播系统,通信效率低,很难适合实时传输系统

双向传输系统可使用这种方法进行差错控制

(3)混合差错控制(HEC):是FEC和ARQ方式的结合,具有FEC和ARQ方式的优点

发送端:发送有纠错和检错能力的码

接收端:检查错误情况,如果错误在该码的纠错能力范围内,则自动进行纠正;如果信道干扰很严重,错误超过纠错能力,但是能检测出来,则经反馈信道请求发送端重发适用于环路时延大的高速传输系统中,如卫星通信

(4)信息反馈方式(IRQ)

接收端:把接收到数据,原封不动的通过反馈信道送回发送端

发送端:比较发送数据和反馈数据,如发现错误,则重新发送出错的消息,直到没有发信错误为止

优点:不需要检、纠错、编、译码器,控制设备和检错设备较简单

缺点:需要反馈信道,环路时延较大,发送端需要存储器存储已经发送的码组

仅适用于传输效率较低,数据信道错误率较低,有双向传输信道和控制简单的系统中(5)传输速率:自动要求重传(ARQ)通信效率低,混合差错控制(HEC)传输速率较高,信息反馈方式(IRQ)传输速率较低。

1.24:计算题:自信息、概率、互信息、信息熵、条件熵

对于如图1.1所示的BSC信道,信源符号发生的概率为P(x1)=0.6,P(x2)=0.4, 求(1) 信源X中事件x1和x2分别的自信息(以比特为单位);(2)接收符号yi(i=1,2)发生的概率;(3)求条件概率P(xi|yi);(4)收到消息yi(i=1,2)后,获得的关于xi(i=1,2)的信息量;(5)x和yi之间的互信息;

(6)信源X和信源Y的信息熵;(7)条件熵H(X|Y)和H(Y|X)

概念:

自信息PPT76:

考虑离散随机变量X,其样本空间为{xi, i=1, 2,…,n},则事件X=xi的自信息的定义为

自信息的单位由对数的底来决定,以2为底,单位就是比特(bits),以e为底就是奈特(nats)。自信息非负。

条件自信息量PPT78:

定义:在给定Y=yi的情况下,考虑离散随机变量X,其样本空间为{xi, i=1, 2,…,n},则事件X=xi的条件自信息量的定义为

其中P(xi|yi)是xi的条件概率,也称为后验概率。P(xi)称为先验概率。条件自信息量非负

互信息PPT79:

定义:x i和y i之间的互信息定义为

互信息的性质:

性质1:互易性,I(x i;y i)= I(y i;x i)

性质2:当x i和y i是统计上独立的,即P(x i|y i)= P(x i),则I(x i;y i)=0

性质3:互信息量可以是正的,也可以是负的

平均自信息量(信息熵)PPT81:

定义:离散随机变量X的平均自信息定义为,其样本空间为{xi, i=1, 2,…,n},则事件X=xi 的平均自信息量的定义为

H(X)表示每个信源符号的平均信息量

条件熵(平均条件自信息量)PPT84:

平均条件自信息H(X|Y)定义为

条件概率:

P(AB):

P(AB)=P(A)-P(AB) P(AB)=P(B)-P(AB)

若A与B相互独立P(AB)=P(A)P(B)

当P(A)>0 P(AB)=P(A)P(B|A)

当P(B)>0 P(AB)=P(B)P(A|B)

答:

(1)X1的自信息I(x1)=-log20.6= I(x2)=-log20.4=

(2)P(y1)=0.6*(5/6)+0.4*(3/4)=0.8

P(y2)=0.6*(1/6)+0.4*(1/4)=0.2

(3)P(x1|y1)=P(x1y1)/P(y1)=P(y1|x1)P(x1)/P(y1)=(5/6)*0.6/0.8=5/8

P(x1|y2)=P(x1y2)/P(y2)=P(y2|x1)P(x1)/P(y2)=(1/6)*0.6/0.2=1/2

P(x2|y1)=P(x2y1)/P(y1)=P(y1|x2)P(x2)/P(y1)=(3/4)*0.4/0.8=3/8

P(x2|y2)=P(x2y2)/P(y2)=P(y2|x2)P(x2)/P(y2)=(1/4)*0.4/0.2=1/2

(4)I(x1|y1)=log2(P(x1|y1))=log2(5/8)

I(x1|y2)=log2(P(x1|y2))=log2(1/2)

I(x2|y1)=log2(P(x2|y1))=log2(3/8)

I(x2|y2)=log2(P(x2|y2))=log2(1/2)

(5)I(x1;y1)=log2(P(x1|y1) /P(x1))=log2(5/8 / 0.6)

I(x1;y2)=log2(P(x1|y2) /P(x1))=log2(1/2 / 0.6)

I(x2;y1)=log2(P(x2|y1) /P(x2))=log2(3/8 / 0.4)

I(x2;y2)=log2(P(x2|y2) /P(x2))=log2(1/2 / 0.4)

(6)H(X)=-(P(x1)logP(x1)+P(x2)logP(x2))=-(0.6log0.6+0.4log0.4)=

H(Y)=-(P(y1)logP(y1)+P(y2)logP(y2))=-(0.8log0.8+0.2log0.2)=

(7)H(X|Y)==-(P(x1y1)log(P(x1|y1)) + P(x2y1)log(P(x2|y1)) + P(x1y2)log(P(x1|y2)) + P(x2y2)log(P(x2|y2)))=-( 0.5log0.5+ 0.3log0.3+0.1log0.1+0.1log0.1)

1.25:信息熵和消息的平均信息量、信源的平均不确定性之间有什么关系?PPT81-82

平均自信息量即信息熵,定义:离散随机变量X的平均自信息定义为,其样本空间为{xi, i=1,

2,…,n},则事件X=xi的平均自信息量的定义为

平均自信息量表示信源输出后,每个消息(或符号)提供的平均信息量

平均自信息量表示信源输出前,信源的平均不确定性

例如:上页例子中,H(Y)>H(X),对于信源X,两个输出消息不是等概率的,事先大致可以猜测消息x1会出现,故信源X的不确定性要小

H(X)表示变量X的随机性

当信源符号是等概率出现的时候,信息熵可以达到最大值

1.26:简述等长信源编码定理的主要内容。PPT86

定理: 一个熵为H(X)的离散无记忆信源,若对信源长为N的符号序列进行等长编码,

设码字是从r 个字母的码符号集合中,选取 个码元组成。对于任意的ε>0,只要满足 ()r X H N l log ε+≥

则当N 足够大时,可实现几乎无失真编码,即译码错误概率可为任意小。

1.27:简述前缀码和惟一可译码之间的关系。PPT91

前缀码/前缀条件码

定义: 若码C 中,没有任何完整的码字是其他码字的前缀,称此码为前缀码,也称即时码或非延长码

前缀码和即时码的定义是一致的:如果没有一个码字是其他码字的前缀,则在译码过程中,当收到一个完整码字的码符号序列时,就能直接把它译成对应的信源符号,无需等待下一个信号到达后才作判断,这就是即时码

关系:前缀码是惟一可译码的一类子码:即前缀码一定是惟一可译码,但是惟一可译码不一定是前缀码

1.28:霍夫曼编码唯一么?简述霍夫曼编码的主要步骤。PPT97-100

不唯一。一个离散无记忆信源有7个符号xi, i=1,..,7, P(X=x1)=0.46, P(X=x2)=0.30, P(X=x3)=0.12, P(X=x4)=0.06, P(X=x5)=0.03, P(X=x6)=0.02, P(X=x7)=0.01, 将7个信源符号按照概率递减的顺序进行排序构造如下页图所示的2种霍夫曼树

霍夫曼编码的步骤:

将信源符号按照概率递减的顺序进行排序

将0和1符号分别分配给概率最小的两个信源符号,并将这两个概率最小的符号合并成一个新符号,用这两个信源符号的概率之和作为这个新符号的概率

以此类推继续这个过程,直到只剩下2个符号为止,从而完成霍夫曼树的构造

从树的最后一个节点,依编码路径从后往前返回,读出每个分支上对应的符号标示,即可得到对应的码字

1.29:计算题:游程编码压缩率

考虑比特流

111111111111111000000000000000000111111,如果对之用游程编码方案进行压

缩编码,那么压缩率为多少?PPT102

游程编码定义:游程指的是信源输出的字符序列中,各种字符连续的重复出现的字符串的个数

游程编码:就是将这种字符序列映射成字符串的长度和字符串的位置的标志序列

考虑比特序列111111111111111000000000000000000111111,可以被表示成(15,1),(18,0),(6,1),字符最长的重复的数目为18,因此把该比特序列编码为(01111,1), (10010,0), (00110,1),此时压缩率为18:39=1:2.17

1.30:简述LZ编码的分段方法和编码方法。PPT103-104

LZ编码分段的方法为:(1)游程先取第一个符号作为第一段,然后再继续分段(2)若有出现与前面符号一样时,就再添加紧跟后面的一个符号一起组成一段(3)尽可能取最少个连着的符号并保证各段都不相同(4)以此类推,直至信源符号序列结束

编码方法为:首先去掉最后一个符号,然后看剩下的字符串在字典中的排序,这个排序值转换成二进制数作为指针K的值,最后一个信源符号作为码字第2项d的值,即得到码字(K, d) K是信源去掉最后一个符号后在原序列的位置的二进制码

d就是信源最后一个码字

举例:考虑比特序列101011011010101011,根据上面的编码方法可把该比特序列分段为1, 0, 10, 11, 01, 101, 010, 1011

码字为:(000,1),( 000,0), (001,0), (001,1), (010,1), (011,1), (101,0), (110,1)

以1011的码字为例,去掉最后一个符号为101,在字典中的字段位置为0110,最后一个符号为1,所以码字为(110,1)

1.31:求LZ编码后的码字。

考虑比特序列01010110011010101011,如果用LZ编码,那么其分段是什么,编码后的码字又是什么?

0,1,01,011,00,11,010,10,101,1

(000,0),( 000,1), (001,1), (011,1), (001,0), (010,1), (011,0), (010,0),( 1000,1),( 000,1)

1.32:计算题:求信道容量。

考虑一个如图1.2所示的BSC信道,其信道转移概率为P(0|1)=P(1|0)=p,求该信道的容量。

PPT106

定义:考虑某种概率分布为P(x)的离散无记忆信源,对于一个固定的信道,信道容量被定义为最大的平均互信息,此时传输每个符号平均获得的信息量最大,即对于每个固定的信道可以达到最大的信息传输率,即

其约束条件为

如果ω=0.5,用信道容量的公式,可以获得BSC 的信道容量为C=1+plog2p+(1-p)log2(1-p),熵函数为H(p)=-plog2p-(1-p)log2(1-p),因此得到C=1-H(p)

1.33:求具有如下信道传递矩阵的信道的容量。

??????----q p q p p q q p 11

一个信道,也可由它的传递概率组成的矩阵来表示

例如二元BSC 信道的信道矩阵为

一般离散单符号信道的信道矩阵为

1.34:简述信道编码定理的内容。PPT110

定理:假设DMS 有信源字符集X ,熵为每信源符号H(X)比特,而且信源每Ts 秒产生一个符号,那么信源的平均信息率为每秒H(X)/ Ts 比特,假设信道可以每Tc 秒使用一次,而信道容量为每次信道使用C 比特,那么每单位时间的信道容量为每秒钟C/Tc 比特。如果H(X)/ Ts ≤ C/Tc ,那么就存在编码方案使得在有噪声的信道上传输的信源消息,能够以任意小的错误概率进行恢复。

1.35:什么是无记忆信道和二元对称信道?PPT27

无记忆信道:如果在给定时间间隔上,检测器的输出只与在该时间间隔上传送的信号有关,而与任何前面时间的传送的信号无关,称此信道为无记忆信道

离散无记忆信道:是一种M 元输入、Q 元输出的信道模型

二元对称信道: 二进制对称信道(Binary Symmetric Channel )是离散无记忆信道(discrete memoryless channel )在M=Q=2时的特例。

1.36:仙农的信息定义是什么?信息量的多少跟事件发生的不确定性之间有什么关系?ppt75

仙农对于信息的定义:信息是事物运动状态或存在方式不确定性的描述

一个句子中所含信息的多少,同句子中所表达的事件出现的概率有关:呈现相反的关系 信息量的多少,同事件发生的不确定性有关:呈现相反的关系

第二章 数学基础

2.1:某些域中元素有大小之分,另一些域中的元素无大小之分,各举一个例子。 有理数域、实数域可以比较大小。复数域无法比较大小。

2.2:交换律、分配律、结合律在群上成立么?在环上成立么?在域上成立么?PPT3、12、14

(1) *的结合律在群上成立,交换律不一定成立,若*的交换律在群上成立则称为阿贝尔

群,分配律群上不成立。

(2) 乘法的结合律在环上成立,加法和乘法在环上满足分配律,乘法的交换律不一定成

立,交换律(乘法)在交换环上成立。

(3) 在全体元素下加法在域上满足交换律、乘法在非零元素下满足交换律、加法和乘法

之间在群上满足分配律、结合律。

2.3:简述群、环、域三者之间的关系?

群定义:一个集合G ,在其上定义了一个二元运算*,若它满足以下条件称为群

满足封闭性,即对G 中任意两个元素a,b,有a*b ∈G

二元运算*满足结合律

G 中存在一个元素e ,称为恒元或单位元,使得G 中任何元素,有a*e=e*a=a

对于G 中任何一个元素a ,G 中存在另一个元素 ,称作a 的逆元,使得e a a a a =*'='*

环定义:非空元素集合R 中,定义了两种二元运算,称作加法和乘法,这样的代数系统(R,+,·)称为一个环,若它满足以下条件

R 中全体元素在加法下构成交换群,单位元为0,逆元记为-a

乘法运算满足封闭性

满足乘法结合率,即 (a ·b)·c=a ·(b ·c) ,

加法和乘法之间满足分配律

a ·(b+c)=a ·b+a ·c, (b+c)·a=

b ·a+

c ·a,

全体整数集合在实数加法和乘法运算下构成交换环

域定义:非空元素集合F 中,定义了两种二元运算,称作加法和乘法,这样的代数系统(F,+,·)称为一个域,若它满足以下条件

F 中全体元素在加法下构成交换群,恒元为0

F 中非零元素在乘法下为交换群,恒元为1

加法和乘法之间满足分配律

(a+b)·c=a ·c+b ·c

环中全体元素在加法下构成交换群,单位元为0,逆元记为-a

域中全体元素在加法下构成交换群,恒元为0

域中非零元素在乘法下为交换群,恒元为1

2.4:存在含有256个元素的有限域么?为什么?

不是

由有限域的性质可知:有限域的特征数必为某一素数

256不是素数

2.5:构造一个含13个元素的有限域。在该域中,3的逆元和负元是什么? 加法逆元称为负元,则逆元为1/3,负元为-3

2.6:全体整数的集合对普通减法是否构成一个群?为什么?

不构成群,群的二元运算需要满足结合律,而减法不满足结合律 3-(2-1)与(3-2)-1不等

2.7:全体非负整数的集合在加法和乘法下是否构成群?为什么?PPT3

均不构成群。

对于加法和乘法而言,在全体非负整数即自然数集合下满足封闭性和结合律,均存在恒元,但不存在逆元。对于加法而言,0为恒源,不存在逆元a ’,使得a+a ’=0,;对于乘法而言,1为恒元,不存在逆元a ’,使得a*a ’=1

2.8:证明群的性质定理1-4。PPT6-7

定理1:群G 的恒元是唯一的

证明:假定G 中有两个恒元e 和e ',则有

e e e e =*'=' 证毕

定理2:任何一个群元素的逆元是唯一的 证明:假定元素a 有两个逆元

,则

证毕 定理3:若a,b ∈G ,则

证明:

所以a*b和互为逆元

定理4:给定G中任意两个元素a和b,则方程a*x=b和y*a=b在G中有唯一解证明:方程a*x=b的解是x=a-1*b,这是因为a*a-1*b=e*b=b,同理,y*a=b的解是y=b*a-1。

下面证明解的唯一性。如果在方程a*x=b中,除了x=a-1*b,还有另外一个解x1,使a*x1=b,则把该式两边左乘以a的逆元a-1,则有a-1*a*x1=a-1*b,由此可得e*x1=x1=a-1*b。同理,可证方程y*a=b的解的唯一性

2.9:简述循环群的定义,什么是生成元?PPT8

定义:若存在a∈G是一个集合,使得G中的每个元素都是a的某次幂,即an(n是整数),则称G是循环群

生成元:该循环群由a生成,a是该群的生成元

2.10:什么是有限域?什么是扩域?什么是域的特征?PPT16-18

有限域:阶为有限的域,也称为Galois(伽罗华)域, 阶:域中元素的个数

扩域的定义:对任何正整数m,可以将素域GF(q)扩展为有qm个元素的域,称为GF(q)的扩域,记为GF(qm)。称GF(q)为GF(qm)的基域。此外已经证明,任何有限域的阶都是素数的幂次

有限域的特征:设F是域,0和e是加法和乘法的单位元,若对任意正整数n,都有ne≠0,则称域F的特征是0;若有正整数n,使ne=0,则称使ne=0成立的最小正整数n为域F的特征。域的特征或是0,或是有限的素数。

2.11:证明有限域的性质定理1-3。PPT19-21

2.12:证明有限域的特征定理1-3。PPT18,23-25

2.13:简述本原元的定义,并且会用该定义判断当给定q 时有限域GF(q)上的本原元。

本原元:在有限域GF(q)中,若非零元素a 的阶为q-1,则称之为本原元。

有限域的元素个数是有限的,域中的全体非零元素集合构成有限乘群,乘群中每个元素的阶是有限的,可以证明,该群是循环群,本原元能生成这个群

例如:对于GF(5)={0,1,2,3,4},元素1的阶是1;元素2的阶是4,因为21=2, 22=4, 23=3, 24=1;元素3的阶是4,因为31=2, 32=4, 33=2, 34=1;元素4的阶是2,因为41=4, 42=1。元素2和3是本原元

2.14:什么是多项式?什么是首一多项式?PPT27

多项式定义:二元域GF(2)中表达式f (x )=f 0+f 1x +…+f n

x n

,其中fi=0或1。若fn ≠0,则

称f(x)是n 次多项式,记为deg(f(x))=n ,fn 称为多项式的首项系数。GF(2)中共有2n 个多项式

首一多项式:首项系数为1的多项式

2.15:掌握根据本原多项式和本原元生成GF(2)的扩域GF(2m)的方法。PPT27-29 本原多项式定理:GF(2)上的任意m 次既约多项式可以除尽x (2^m-1)+1

例子:x 3+x+1除尽x 7+1。x 7+1=(x 3+x+1)*(x 4+x 2+x+1)(mod 2)

2.16:什么是最高公因式?什么是公倍式?什么是最低公倍式?PPT36

最高公因式:若f(x)为a(x)与b(x)的所有公因式中次数最高的,并且首项系数为1,记为gcd(a(x), b(x))

f(x)为a(x)与b(x)的公倍式:当a(x)≠0, b(x)≠0,并且a(x)| f(x),b(x)|f(x)

最低公倍式:若f(x)为a(x)与b(x)的所有公倍式中次数最低的,并且首项系数为1,记为LCM(a(x), b(x))

2.17:什么是本原多项式?PPT38

本原多项式定理:GF(2)上的任意m 次既约多项式可以除尽x 2^m-1+1

本原多项式的定义:若m 次既约多项式p(x)可以除尽x n +1的最小整数n 满足n=2m -1,则称p(x)是本原多项式

例子:x3+x+1除尽x7+1。x7+1=(x3+x+1)*(x4+x2+x+1)(mod 2)

2.18: 证明GF(2)上的多项式f(x)满足[f(x)]2= f(x 2) PPT39

2.19: GF(2)上的多项式的根的特点是什么。PPT46

定理:若f(x)为GF(2)上的一个m 次既约多项式,则其扩域GF(2m )含有f(x)的m 个根;进一步的,若m|d ,则任何GF(2d )含有f(x)的根

定理:若f(x)是系数取自GF(2)的多项式,令b 是GF(2)扩域中的元素,若b 是f(x)的根,则对任意的l ≥0,b2l 也是f(x)的根

既约多项式定义:不能被任何次数更小的多项式整除的多项式称为既约多项式。

a|b的意思是:1、a为除数,b为被除数,即a|b(“|”是整除符号),读作“a整除b”或“b能被a整除”

2.20:什么是域元素的共轭元。PPT47

注:元素b2l称为b的共轭元,以上定理说明若是b是多项式f(x)的根,则b的所有共轭元b2l也是f(x)的根

2.21:什么是最小多项式?PPT49

定义:令m(x)是使得m(b)=0成立的次数最低的多项式,则称m(x)是b的最小多项式

定理1:域元素b的最小多项式是既约的

定理2:令f(x)是GF(2)上的多项式,m(x)是域元素b的最小多项式,若b是f(x)的根,则f(x)可以除尽m(x)

2.22:什么是矢量空间?PPT56

定义:令V是元素的集合,在其上定义了一个称作是加法(+)的二元运算。令F是域。在域F 中的元素和V中的元素之间还定义了一个数乘运算(·)。若集合V满足下述条件,就称它为域F上的矢量空间或线性空间:

条件1:V是加法下的可交换群

条件2:对F中的任意元素a和V中的任意元素v,a·v是V中的元素

条件3:分配率。对任意u,v∈V和a,b∈F,有a·(u+v)=a·u+a·v, (a+b)·v=a·v+b·v

条件4:结合率。对任意v∈V和a,b∈F,有(a·b)·v=a·(b·v)

条件5:令1是F的单位元,则对任意v∈V ,有1·v= v

2.23:矢量空间有哪些性质?PPT58

性质1:令0是域F中的零元,对任意的v∈V,有0·v=0

性质2:对任意c∈F,有c·0=0

性质3:对任意c∈F和v∈V ,有

(-c)·v=c·(-v)=-(c·v)

性质4:如果c·v=0,则c=0或者v=0

2.24:简述n重的定义。PPT59

n重:GF(2)上的n个分量的有序序列(a1,a2,…,an)称作n重,共有2n个不同的n重,令Vn表示所有n重的集合

2.25:什么是线性组合?什么是线性相关?PPT63

令v1,v2,…,vk∈V是k个矢量,a1,a2,…,ak∈F是k个标量,称∑ai vi为线性组合

定理:令v1,v2,…,vk是域F上矢量空间V的k个矢量,则v1,v2,…,vk的所有线性组合构成V的一个子空间

例:GF(2)中的两个5重(00111)和(11101)的所有线性组合是:0·(00111)+0·(11101)=(00000), 0·(00111)+1·(11101)=(11101), 1·(00111)+0·(11101)=(00111), 1·(00111)+1·(11101)=(11010), 这4个5重构成一个子空间

定义:域F上矢量空间V的一组矢量v1,v2,…,vk称作是线性相关的,当且仅当存在不全为0

的标量a1,a2,…,ak ,使得01=∑=k i i i v a 。否则称v1,v2,…,vk 是线性独立的

第三章

3.1:简述线性(n,k)分组码的定义。PPT2

分组码:将消息序列分组进行编码

在分组码中,二元信息序列被分成长度固定的一组组消息;每组消息u 有k 个信息位,共有2k 个不同的消息

编码器按照一定规则将每个输入消息u 变换成二元n 重v ,n>k ,这个二元n 重v 称作消息u 的码字或码矢。所有2k 个码字组成的集合称作是分组码

线性分组码:具有线性性质的分组码

定义:长为n ,有2k 个码字的分组码,当且仅当其2k 个码字构成GF(2)上所有n 重矢量空间的一个k 维子空间时,称作线性(n,k)分组码

3.2:什么是生成矩阵?请具体构造几个线性(n,k)分组码的生成矩阵。PPT4-5 因为线性(n,k)分组码C 是一个k 维子空间,所以在码C 中能找到k 个线性独立的码字g 0, g 1,…, g k-1,使得C 中的每个码字v 都是这k 个码字的一种线性组合,即v=u0g0+u1g1+…+uk-1gk-1 将这k 个线性独立的码字作为行,得到k ×n 阶矩阵

????????????=??????? ??=-------111110111110100100110n k k k n n k g g g g g g g g g g g g G

此矩阵称为码C 的生成矩阵。线性(n,k)分组码任何k 个线性独立的码字都可以用来构成码C 的生成矩阵

举例: (7,4)线性分组码

如果表格所表示的线性分组码,有如下的生成矩阵

统计学原理测试题及答案

统计测试一 注:这是基础统计前两章的测试题;准备本月下旬测试。 一、单项选择题 1.要了解某班50名学生的性别构成情况,则总体是(C)。 A.每一个学生 B.每一个学生的性别 C.全体学生 D.全体学生的性别 2.要了解全国的人口情况,总体单位是(A)。 A.每一个人 B.每一户 C.每个省的人口 D.全国总人口 3.某班四名学生金融考试成绩分别为70分、80分、86分和90分,这四个数字是(A)。 A.变量值 B.标志 C.指标 值 D.指标 4.工业企业的职工人数、职工工资是(B)。 A.离散变量 B.前者是离散变量,后者是连续变量 C.连续变量 D.前者是连续变量,后者是离散变量 5.统计学与统计工作的关系是(C)。 A.理论与应用的关系 B.工作与结果的关系 C.理论与实践的关系 D.工作与经验的关系 6.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的90%的五个大型水泥厂的生产情况进行调查,这种调查方式是(B)。 A.典型调查 B.重点调查 C.抽样调查 D.普查 7.某地进行国有商业企业经营情况调查,则调查对象是(B)。 A.该地所有商业企业 B.该地所有国有商业企业 C.该地每一家商业企业 D.该地每一家国有商业企业

8.对企业先按经济类型分组,再按企业规模分组,属于(C)。 A.简单分组 B.平行分组 C.复合分组 D.再分组 9.某变量数列,其末组为开口组,下限为600,又知其相邻组的组中值为550,则末组的组中值是(C)。 A.100 B.500 C.650 D.700 10.统计表的宾词是用来说明总体特征的(A)。 A.统计指标 B.总体单位 C.标志 D.统计对象 11.下面属于时期指标的是(A)。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 12.用水平法检查长期计划完成程度,应规定(B)。 A.计划期初应达到的水平 B.计划期末应达到的水平 C.计划期中应达到的水平 D.整个计划期应达到的水平 13.第五次人口普查结果,我国每10万人中具有大学程度的为3611人。该数字资料为(D)。 A.绝对数 B.结构相对数 C.比较相对 数 D.强度相对数 14.某商场计划11月份销售利润比10月份提高2%,实际提高了3%,则销售利润计划完成程度为(A)。 A.100.98% B.95.10% C.99.00% D.105.10% 15.平均数反映了(C)。 A.总体分布的集中趋势 B.总体分布的离中趋势 C.总体中各单位分布的集中趋势 D.总体变动的趋势 16.中位数和众数是一种(B)。

《信息理论与编码》,答案,考试重点(1--3章)

《信息理论与编码》习题参考答案 1. 信息是什么信息与消息有什么区别和联系 答:信息是对事物存在和运动过程中的不确定性的描述。信息就是各种消息符号所包含的具有特定意义的抽象内容,而消息是信息这一抽象内容通过语言、文字、图像和数据等的具体表现形式。 2. 语法信息、语义信息和语用信息的定义是什么三者的关系是什么 答:语法信息是最基本最抽象的类型,它只是表现事物的现象而不考虑信息的内涵。语义信息是对客观现象的具体描述,不对现象本身做出优劣判断。语用信息是信息的最高层次。它以语法、语义信息为基础,不仅要考虑状态和状态之间关系以及它们的含义,还要进一步考察这种关系及含义对于信息使用者的效用和价值。三者之间是内涵与外延的关系。 第2章 1. 一个布袋内放100个球,其中80个球是红色的,20个球是白色的,若随机摸取一个球,猜测其颜色,求平均摸取一次所能获得的自信息量 答:依据题意,这一随机事件的概率空间为 120.80.2X x x P ????=???????? 其中: 1 x 表示摸出的球为红球事件, 2 x 表示摸出的球是白球事件。 a)如果摸出的是红球,则获得的信息量是 ()()11log log0.8 I x p x =-=-(比特) b)如果摸出的是白球,则获得的信息量是 ()()22log log0.2 I x p x =-=-(比特) c) 如果每次摸出一个球后又放回袋中,再进行下一次摸取。则如此摸取n 次,红球出现的次数为 () 1np x 次,白球出现的次数为 () 2np x 次。随机摸取n 次后总共所获得信息量为 ()()()() 1122np x I x np x I x + d)则平均随机摸取一次所获得的信息量为 ()()()()()()()()()112211221 log log 0.72 H X np x I x np x I x n p x p x p x p x =+????=-+????=比特/次

国标(GB2312-80)汉字编码对照表

汉字编码简明对照表 说明: 1、下列汉字取自国标(GB 2312-80)中的分级与排列内容;包含所有的第一级汉字和第二级汉字中的常用部分。 2、第一级汉字(16—55区的汉字)以拼音字母为序进行排列,同音字以笔形顺序横、竖、撇、捺、折为序,起笔相同的按第二笔,依次类推;第二级汉字(56-87区的汉字)按部首为序进行排列。 3、对于多音字,仅在表中出现一次。如:柏,音(bai,bo),表中仅出现在“bai”中。 4、汉字区位码用阿拉伯数字表示,每个汉字对应4个数字。 5、本汉字代码表摘自《字符集和信息编码国家标准汇编》,(中国标准出版社,1998年编)。 a 啊 1601 阿 1602 吖 6325 嗄 6436 腌 7571 锕 7925 ai 埃 1603 挨 1604 哎 1605 唉 1606 哀 1607 皑 1608 癌 1609 蔼 1610 矮 1611 艾 1612 碍 1613 爱 1614 隘 1615 捱 6263 嗳 6440 嗌 6441 嫒 7040 瑷 7208 暧 7451 砹 7733 锿 7945 霭 8616 an 鞍 1616 氨 1617 安 1618 俺 1619 按 1620 暗 1621 岸 1622 胺 1623 案 1624 谙 5847 埯 5991 揞 6278 犴 6577 庵 6654 桉 7281 铵 7907 鹌 8038 黯 8786 ang 肮 1625 昂 1626 盎 1627 ao

凹 1628 敖 1629 熬 1630 翱 1631 袄 1632 傲 1633 奥 1634 懊 1635 澳 1636 坳 5974 拗 6254 嗷 6427 岙 6514 廒 6658 遨 6959 媪 7033 骜 7081 獒 7365 聱 8190 螯 8292 鏊 8643 鳌 8701 鏖 8773 ba 芭 1637 捌 1638 扒 1639 叭 1640 吧 1641 笆 1642 八 1643 疤 1644 巴 1645 拔 1646 跋 1647 靶 1648 把 1649 耙 1650 坝 1651 霸 1652 罢 1653 爸 1654 茇 6056 菝 6135 岜 6517 灞 6917 钯 7857 粑 8446 鲅 8649 魃 8741 bai 白 1655 柏 1656 百 1657 摆 1658 佰 1659 败 1660 拜 1661 稗 1662 捭 6267 呗 6334 掰 7494 ban 斑 1663 班 1664 搬 1665 扳 1666 般 1667 颁 1668 板 1669 版 1670 扮 1671 拌 1672 伴 1673 瓣 1674 半 1675 办 1676 绊 1677 阪 5870 坂 5964 钣 7851 瘢 8103 癍 8113 舨 8418 bang 邦 1678 帮 1679 梆 1680 榜 1681 膀 1682 绑 1683 棒 1684 磅 1685 蚌 1686 镑 1687 傍 1688 谤 1689 蒡 6182 浜 6826 bao 苞 1690 胞 1691 包 1692 褒 1693 剥 1694 薄 1701 雹 1702 保 1703 堡 1704 饱 1705 宝 1706 抱 1707 报 1708 暴 1709 豹 1710 鲍 1711 爆 1712 葆 6165 孢 7063 煲 7650 鸨 8017 褓 8157 趵 8532 龅 8621 bei 杯 1713 碑 1714 悲 1715 卑 1716 北 1717 辈 1718 背 1719 贝 1720 钡 1721 倍 1722 狈 1723 备 1724 惫 1725 焙 1726 被 1727 孛 5635 陂 5873 邶 5893 蓓 6177 悖 6703 碚 7753 鹎 8039 褙 8156 鐾 8645 鞴 8725 ben 奔 1728 苯 1729 本 1730 笨 1731 畚 5946 坌 5948 贲 7458 锛 7928 beng 崩 1732 绷 1733 甭 1734 泵 1735 蹦 1736 迸 1737 嘣 6452 甏 7420 bi

统计学原理练习题

统计学原理练习题(一) 一、单项选择题(在备选答案中选择一个正确答案,并将答案号填在其后的括号内) 1、以产品的等级来衡量某种产品的质量好坏,则该产品等级就是( ) A、品质标志 B、数量指标 C、质量指标 D、数量标志 2、几位学生的某门课成绩分别就是67分、78分、88分、89分、96分,则“成绩”就是( ) A、数量标志 B、标志值 C、数量指标 D、品质标志 3、要了解100个学生的学习成绩,则总体单位就是( ) A、每一个学生 B、100个学生的学习成绩 C、每一个学生的学习成绩 D、100个学生 4、某企业的职工人数27000人,这里“职工人数27000”就是( ) A、变量 B、标志值 C、指标 D、标志 5、对一批炮弹进行质量检验,通常采用的调查方法就是( ) A、抽样调查 B、典型调查 C、重点调查 D、全面调查 6、在对总体现象进行分析的基础上有意识的选择调查单位进行调查,这种调查方法就是( ) A、典型调查 B、重点调查 C、普查 D、抽样调查

7、统计分组的关键在于( ) A、按品质标志分组 B、应用多个标志进行分组,形成一个分组体系 C、分组形式的选择 D、分组标志的正确选择 8、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项就是正确的( ) A、80%以下、80、1—90%、90、1—100%、100、1—110% B、90%以下、90—100%、100—110%、110%以上 C、85%以下、85—95%、95—105%、105—115% D、80—89%、90—99%、100—109%、110%以上 9、次数分配数列就是( ) A、按品质标志分组形成的数列 B、按数量标志或品质标志分组形成的数列 C、按总体单位数分组形成的数列 D、按数量标志分组形成的数列 10、单项式变量分布数列与组距式变量分布数列都必不可少的基本要素就是( ) A、组限与组中值 B、变量与次数 C、变量与组限 D、组数与组距 二、多项选择题(在备选答案中选择两个或两个以上正确答案,并将答案号填在 题后的括号内) 1、下面研究问题中所确定的总体单位有( ) A、研究某地区粮食收获率时,总体单位就是每一亩播种面积 B、研究某种农产品价格,总体单位可以就是每一吨农产品 C、研究货币购买力(一定单位的货币购买商品的能力),总体单位应就是每元货币 D、确定某商店的销售额,总体单位就是每一次销售行为 E、研究某地区国有企业的规模时,总体单位就是每个国有企业

字符汉字编码学案.doc

字符汉字编码学案 一、请同学们仔细观察下面的数据,发现石什么规律吗? 十进制二进制 00 11 210 311 4100 5101 6110 7111 8100 9100 1 10101 11101 1 12110 13110 1 14111 15111 1 161000 思考: 7> 〃个二进制位最大值是多少?数学公式为? 2、用〃个二进制位最多可以表示多少种不同的信息?数学公式为 3、要表示X个状态至少要用几位二进制? 二、二进制虽然复合计算机的特点,但不便于我们人类书写和记忆,转换成十进制乂费时费力,你有什么好的方法吗? 请同学们观察书木P5的图表,思考十六进制的特点

10U0011B=D 68D=B 110010B=H 43H=B 11 1011 B 12 1100 C 13 1101 D 14 1110 E 15 1111 F 1、从位数上来分析,十六进制和二进制位数上存在什么样的比例关系:? 2、 二进制、十进制、十六进制的标识分别是大写字母\\ 3、 小组探究任务:十进制与二进制互换: HOIOOIOB ==?H 7FH=? B (请同学们熟悉进位制的标识) 你觉得用十六进制来记录二进制的优点有哪些:? 4、 50D=B 110110B=D 1110011B=H 101H=B (选择手工或计算器来完成) 三、任务挑战: 1、(请分别用智能ABC 和智能拼音输入) 右图是演员王刚在影视作品《宰相刘罗锅》中的塑造的人物 9 . 另外大家认得这个“幼”字吗?它的读音是? 2、 同学们觉得上述现象的原因是? 3、 双击打开“验证字符的ASCII 码.exe”或“查询字符的编码.exe”,观 察26个英文字母 和十个数字所对应的编码;汉字能不能查看?例如输入“效实”,会有什么结果?为什么? 四、一探究竟 打开桌而上的快捷方式:? Ultra Edit,熟悉使用后,完成下列任务: 1、 完成学生活动手册中Plv 实践一>中的4. (1)、(2)、(3) (4),并在活动手册上做好相 关记录,思考其中的GBK 和GB2312指什么?可参考书本P7内容 2、 小组探究任务(结合刚才的实践活动和书本P6-P8的内容) (1)日前国际上通用的字符编码是 ___________ ,占―位二进制,最多能表示 个 字母符号等内容 (2)作为世界上三大古老文字之一的汉字,计算机乂是如何对其进行编码的?即编码的 名称是,占—位二进制,原因是? (3)拼音码、GB2312、处理码、字形码是同一种编码吗?为什么? 知识链接:汉字的编码(交换码)知多少: GB2312: 6763 个汉字(80 年)

信息论与编码试题集

1. 在无失真的信源中,信源输出由H (X )来度量;在有失真的信源中,信源输出由R (D )来度量。 2. 要使通信系统做到传输信息有效、可靠和XX ,必须首先信源编码, 然后_____加密____编码,再______信道_____编码,最后送入信道。 3. 带限AWGN 波形信道在平均功率受限条件下信道容量的基本公式,也就是有名的香农公式是log(1)C W SNR =+;当归一化信道容量C/W 趋近于零时,也即信道完全丧失了通信能力,此时E b /N 0为-1.6dB ,我们将它称作香农限,是一切编码方式所能达到的理论极限。 4. XX 系统的密钥量越小,密钥熵H (K )就越 小 ,其密文中含有的关于明文的信息量I (M ;C )就越 大 。 5. 设输入符号表为X ={0,1},输出符号表为Y ={0,1}。输入信号的概率分布为p =(1/2,1/2),失真函数为d (0,0) = d (1,1) = 0,d (0,1) =2,d (1,0) = 1,则D min =0,R (D min )=1bit/symbol ,相应的编码器转移概率矩阵[p(y/x )]=1001?? ???? ;D max =0.5,R (D max )=0,相应的编码器转移概率矩阵[p(y/x )]=1010?? ???? 。 二、判断题 1. 可以用克劳夫特不等式作为唯一可译码存在的判据。(√) 2. 线性码一定包含全零码。 (√ ) 3. 算术编码是一种无失真的分组信源编码,其基本思想是将一定精度数值作为序列的 编码,是以另外一种形式实现的最佳统计匹配编码。(×) 4. 某一信源,不管它是否输出符号,只要这些符号具有某些概率特性,就有信息量。 (×) 5. 离散平稳有记忆信源符号序列的平均符号熵随着序列长度L 的增大而增大。 (×) 6. 限平均功率最大熵定理指出对于相关矩阵一定的随机矢量X ,当它是正态分布时具 有最大熵。 (√ ) 7. 循环码的码集中的任何一个码字的循环移位仍是码字。 (√ ) 8. 信道容量是信道中能够传输的最小信息量。(×) 9. 香农信源编码方法在进行编码时不需要预先计算每个码字的长度。 (×) 10. 在已知收码R 的条件下找出可能性最大的发码i C 作为译码估计值,这种译码方 法叫做最佳译码。(√ ) 三、计算题 某系统(7,4)码 )()(01201230123456c c c m m m m c c c c c c c ==c 其三位校验 位与信息位的关系为:

Unicode汉字编码表

Unicode汉字编码表 1 unicode编码表 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。 编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97, 对于汉字的编码,事实上Unicode 对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用4个字节来编码字符,不过现在普遍采用的还是UCS-2,只用两个字节来编码,看一下Unicode对汉字的编码: ------------------------------------------------------------------------ 2 汉字编码表 U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F ----------------------------------------------------- 4e00 一丁丂七丄丅丆万丈三上下丌不与丏 4e10 丐丑丒专且丕世丗丘丙业丛东丝丞丟 4e20 丠両丢丣两严並丧丨丩个丫丬中丮丯

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

信息理论与编码参考答案

2、3 一副充分洗乱的牌(含52张),试问: (1)任一特定排列所给出的不确定性就是多少? (2)随机抽取13张牌,13张牌的点数互不相同时的不确定性就是多少? 解:(1)52张扑克牌可以按不同的顺序排列,所有可能的不同排列数就就是全排列种数,为 526752528.06610P =!≈? 因为扑克牌充分洗乱,任一特定排列出现的概率相等,设事件A 为任一特定排列,则其发生概 率为 ()681 1.241052P A -=≈?! 可得,该排列发生所给出的信息量为 ()()22log log 52225.58I A P A =-=!≈ bit 67.91≈ dit (2)设事件B 为从中抽取13张牌,所给出的点数互不相同。 扑克牌52张中抽取13张,不考虑排列顺序,共有13 52C 种可能的组合。13张牌点数互不 相同意味着点数包括A,2,…,K,而每一种点数有4种不同的花色意味着每个点数可以取4中花色。所以13张牌中所有的点数都不相同的组合数为13 4。因为每种组合都就是等概率发生的,所以 ()131341352441339 1.05681052P B C -?!! ==≈?! 则发生事件B 所得到的信息量为 ()()13 21352 4log log 13.208I B P B C =-=-≈ bit 3.976≈ dit 2、5 设在一只布袋中装有100只对人手的感觉完全相同的木球,每只上涂有1种颜色。100只球的颜色有下列三种情况: (1) 红色球与白色球各50只; (2) 红色球99只,白色球1只; (3) 红,黄,蓝,白色各25只。 求从布袋中随意取出一只球时,猜测其颜色所需要的信息量。 解:猜测木球颜色所需要的信息量等于木球颜色的不确定性。令 R ——“取到的就是红球”,W ——“取到的就是白球”, Y ——“取到的就是黄球”,B ——“取到的就是蓝球”。 (1)若布袋中有红色球与白色球各50只,即 ()()501 1002P R P W == = 则 ()()221 log log 212 I R I W ==-== bit (2)若布袋中红色球99只,白色球1只,即

常用汉字五笔编码查询手册.

常用汉字五笔编码查询手册 龙马工作室搜集整理 常用汉字五笔编码查询手册 一级简码 字符一级简码86 一级全码86 字符一级简码98 一级全码98 工 a aaaa 工 a aaaa 东 a aii 其 a adwu 东 a aii 世 a anv 了 b bnh 了 b bnh 子 b bbbb 子 b bbbb 也 b bnhn 也 b bnhn 以 c nywy 以 c nywy 又 c cccc 又 c cccc 对 c cfy 对 c cfy 在 d dhfd 在 d dhfd 大 d dddd 大 d dddd 而 d dmjj 而 d dmjj

有 e def 有 e def 月 e eeee 月 e eeee 用 e etnh 用 e etnh 地 f fbn 地 f fbn 土 f ffff 土 f ffff 去 f fcu 去 f fcu 一g ggll 一g ggll 王g gggg 王g gggg 来g goi 来g gusi 上h hhgg 上h hhgg 目h hhhh 目h hhhh 点h hkou 点h hkou 不i gii 不i dhi 水i iiii 水i iiii 小i ihty 小i ihty 2 常用汉字五笔编码查询手册 字符一级简码86 一级全码86 字符一级简码98 一级全码98

是j jghu 是j jghu 日j jjjj 日j jjjj 时j jfy 时j jfy 中k khk 中k khk 口k kkkk 口k kkkk 只k kwu 只k kwu 国l lgyi 国l lgyi 田l llll 田l llll 回l lkd 回l lkd 同m mgkd 同m mgkd 山m mmmm 山m mmmm

统计学原理统计资料习题答案

统计学原理统计资料习 题答案 文件管理序列号:[K8UY-K9IO69-O6M243-OL889-

第三章统计资料整理 一.? 判断题部分 1:对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(×) 2:统计分组的关键问题是确定组距和组数。(×)3:组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。(×) 3:分配数列的实质是把总体单位总量按照总体所分的组进行分配。(∨) 4:次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标志值在总体中所起的作用程度。(∨)5:某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(×) 6:连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(∨)

7:对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(∨) 8:任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于1 或100%。(×) 9:按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。( ∨ ) 10:按数量标志分组的目的,就是要区分各组在数量上的差异。(×) 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(∨) 12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越小。(×) 二.单项选择题部分 1:统计整理的关键在( B )。

A、对调查资料进行审核 B、对调查资料进行统计分组 C、对调查资料进行汇总 D、编制统计表 2:在组距分组时,对于连续型变量,相邻两组的组限 ( A )。 A、必须是重叠的 B、必须是间断 的 C、可以是重叠的,也可以是间断的 D、必须取整数 3:下列分组中属于按品质标志分组的是( B )。 A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组 4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。

答案~信息论与编码练习

1、有一个二元对称信道,其信道矩阵如下图所示。设该信道以1500个二元符号/秒的速度传输输入符号。现有一消息序列共有14000个二元符号,并设在这消息中P(0)=P(1)=1/2。问从信息传输的角度来考虑,10秒钟内能否将这消息序列无失真地传送完? 解答:消息是一个二元序列,且为等概率分布,即P(0)=P(1)=1/2,故信源的熵为H(X)=1(bit/symbol)。则该消息序列含有的信息量=14000(bit/symbol)。 下面计算该二元对称信道能传输的最大的信息传输速率: 信道传递矩阵为: 信道容量(最大信息传输率)为: C=1-H(P)=1-H(0.98)≈0.8586bit/symbol 得最大信息传输速率为: Rt ≈1500符号/秒× 0.8586比特/符号 ≈1287.9比特/秒 ≈1.288×103比特/秒 此信道10秒钟内能无失真传输得最大信息量=10× Rt ≈ 1.288×104比特 可见,此信道10秒内能无失真传输得最大信息量小于这消息序列所含有的信息量,故从信息传输的角度来考虑,不可能在10秒钟内将这消息无失真的传送完。 2、若已知信道输入分布为等概率分布,且有如下两个信道,其转移概率矩阵分别为: 试求这两个信道的信道容量,并问这两个信道是否有噪声? 3 、已知随即变量X 和Y 的联合分布如下所示: 01 100.980.020.020.98P ?? =?? ??11112222 1111222212111122221111222200000000000000000000000000000000P P ????????????==????????????11 222 2111 2222 2 log 4(00)1/()log 42/log 8(000000)2/(),H bit symbol H X bit symbol C C H bit symbol H X C =-===>=-==1解答:(1)由信道1的信道矩阵可知为对称信道故C 有熵损失,有噪声。(2)为对称信道,输入为等概率分布时达到信道容量无噪声

汉字编码

汉字编码 1.汉字的区位码由一个汉字的区号和位号组成,其区号和位号的范围各为______。 A、区号 1-95 ,位号 1-95 B、区号 1-94 ,位号 1-94 C、区号 0-94 ,位号 0-94 D、区号 0-95 ,位号 0-95 2.下列4个4位十进制数中,属于正确的汉字区位码的是______。 A、5601 B、9596 C、9678 D、8799 3.区位码输入法的最大优点是______。 A、一字一码,无重码 B、易记易用 C、只用数码输入,简单易用 D、编码有规律, 不易忘记 4.根据汉字国标GB2312-80的规定,一级常用汉字个数是_____。 A、3000个 B、7445个 C、3008个 D、3755个 5.在微型机中,普遍采用的字符编码是______。 A、BCD码 B、ASCII码 C、EBCD码 D、补码 6.一个汉字的内码码长为______。 A、8 bits B、12 bits C、16 bits D、24 bits 7.根据国标GB2312-80的规定,总计有各类符号和一、二级汉字编码______。 A、7145个 B、7445个 C、3008个 D、3755个 8.根据汉字国标GB2312-80的规定,二级次常用汉字个数是____。 A、3000个 B、7445个 C、3008个 D、3755个 9.若已知一汉字的国标码是5E38H,则其内码是______。 A、DEB8H B、DE38H C、5EB8H D、7E58H 10.显示或打印汉字时,系统使用的是汉字的______。 A、机内码 B、字形码 C、输入码 D、国标交换码 11.已知”装”字的拼音输入码是”zhuang”,而”大”的拼音输入码是”da”,则存储它们的内码分别需要的字节个数是______。 A、6,2 B、3,1 C、2,2 D、3,2 12.根据汉字国标码GB2312-80的规定,将汉字分为常用汉字和次常用汉字两级。次常用汉字按______排列。 A、偏旁部首 B、汉语拼音字母 C、笔划多少 D、使用频率多少 13.已经知汉字”中”的区位码是5448,则其国标码是______。 A、7468D B、3630H C、6862H D、5650H 14.汉字国标码(GB2312-80)把汉字分成______等级。 A、简化字和繁体字两个 B、一级汉字,二级汉字,三级汉字共三个 C、一级汉字,二级汉字共二个 D、常用字,次常用字,罕见字三个 15.要存放10个24×24点阵的汉字字模,需要______存储空间。 A、72B B、320B C、720B D、72KB 16.用16×16点阵来表示汉字的字型,存储一个汉字的字型需用______个字节。 A、16×1 B、16×2 C、16×3 D、16×4 17.一个汉字的国标码用2个字节存储,其每个字节的最高二进制位的值分别为______。 A、0,0 B、1,0 C、0,1 D、1,1 18.根据汉字国标码GB2312-80的规定,将汉字分为常用汉字(一级)和非常用汉字(二级)两级汉字。一级常用汉字按______排列。

统计学原理例题分析一(20200920021933)

统计学原理例题分析(一) 一、判断题(把“V”或“X”填在题后的括号里) 1.社会经 济统计的研究对象是社会经济现象总体的各个方面。()参考答案:X 2.总体单位是标志的承担者,标志是依附于单位的。() 参考答案:“ 3?标志通常分为品质标志和数量标志两种。() 参考答案:“ 4.当对品质标志的标志表现所对应的单位进行总计时就形成统计指标。() 参考答案:“ 5.调查方案的首要问题是确定调查对象。() 参考答案:“ 6.我国目前基本的统计调查方法是统计报表、抽样调查和普查。() 参考答案:“ 7.调查单位和填报单位在任何情况下都不可能一致。() 参考答案:X 8.按数量标志分组,各组的变量值能准确的反映社会经济现象性质上的差别。() 参考答案:X 9.在确定组限时,最大组的上限应低于最大变量值。() 参考答案:X 10.按数量标志分组的目的,就是要区别各组在数量上的差别。() 参考答案:X 11.离散型变量可以作单项式分组或组距式分组,而连续型变量只能作组距式分组。() 参考答案:2

12.对于任何两个性质相同的变量数列,比较其平均数的代表性,都可以采

用标准差指标。() 参考答案:X 13.样本成数是指在样本中具有被研究标志表现的单位数占全部样本单位数的比重。() 参考答案:“ 14.样本容量指从一个总体中可能抽取的样本个数。() 参考答案:X 15.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定、唯一的。() 参考答案:X 16.产量增加,则单位产品成本降低,这种现象属于函数关系。() 参考答案:X 17.在直线回归方程Y = a +bx中,b值可以是正的,也可以是负的。 () 参考答案:“ 18.回归系数b和相关系数丫都可用来判断现象之间相关的密切程度。 () 参考答案:X 19.平均指标指数是综合指数的一种变形。() 参考答案:X 20.序时平均数与一般平均数完全相同,因为它们都是将各个变量值的差异抽象化了。() 参考答案:X 二、单项选择题(从下列每小题的四个选项中,选出一个正确的,请将正确答案的序号填在括号内) 1 ?以产品的等级来衡量某种产品的质量好坏,则该产品等级是() A.数量标志 E.品质标志 C.数量指标 D.质量指标。

信息理论与编码-期末试卷A及答案

一、填空题(每空1分,共35分) 1、1948年,美国数学家 发表了题为“通信的数学理论”的长篇论文,从而创立了信息论。信息论的基础理论是 ,它属于狭义信息论。 2、信号是 的载体,消息是 的载体。 3、某信源有五种符号}{,,,,a b c d e ,先验概率分别为5.0=a P ,25.0=b P ,125.0=c P ,0625.0==e d P P , 则符号“a ”的自信息量为 bit ,此信源的熵为 bit/符号。 4、某离散无记忆信源X ,其概率空间和重量空间分别为1 234 0.50.250.1250.125X x x x x P ????=??? ?????和1234 0.5122X x x x x w ???? =??????? ? ,则其信源熵和加权熵分别为 和 。 5、信源的剩余度主要来自两个方面,一是 ,二是 。 6、平均互信息量与信息熵、联合熵的关系是 。 7、信道的输出仅与信道当前输入有关,而与过去输入无关的信道称为 信道。 8、马尔可夫信源需要满足两个条件:一、 ; 二、 。 9、若某信道矩阵为????? ????? ??01000 1 000001 100,则该信道的信道容量C=__________。 10、根据是否允许失真,信源编码可分为 和 。 12、在现代通信系统中,信源编码主要用于解决信息传输中的 性,信道编码主要用 于解决信息传输中的 性,保密密编码主要用于解决信息传输中的安全性。 13、差错控制的基本方式大致可以分为 、 和混合纠错。 14、某线性分组码的最小汉明距dmin=4,则该码最多能检测出 个随机错,最多能纠正 个随机错。 15、码字101111101、011111101、100111001之间的最小汉明距离为 。 16、对于密码系统安全性的评价,通常分为 和 两种标准。 17、单密钥体制是 指 。 18、现代数据加密体制主要分为 和 两种体制。 19、评价密码体制安全性有不同的途径,包括无条件安全性、 和 。 20、时间戳根据产生方式的不同分为两类:即 和 。 二、选择题(每小题1分,共10分) 1、下列不属于消息的是( )。 A. 文字 B. 信号 C. 图像 D. 语言 2、设有一个无记忆信源发出符号A 和B ,已知43 41)(,)(==B p A p ,发出二重符号序列消息的信源,无记忆信源熵)(2 X H 为( )。 A. 0.81bit/二重符号 B. 1.62bit/二重符号 C. 0.93 bit/二重符号 D . 1.86 bit/二重符号 信息论与编码

最常用汉字表

汉字的数量非常庞大,总数大约九万左右。但常用字才三千多个,即使是常用字,使用频率的差别也很悬殊。国家标准GB2312-80《信息交换用汉字编码字符集*基本集》就是根据这种事实制订的。一级字库为常用字,3755个,二级字库为不常用字,3008个,一、二级字库共有汉字6763个。一级字库的字,使用频率合计达99.7%。即在现代汉语材料中的每一万个汉字中,这些字就会出现9970次以上,其余的所有汉字也不足30次。而最常用的1000个汉字,使用频率在90%以上. 根据国家出版局抽样统计,汉字中最常用字560个,常用字807个,次常用字1033个。三者合计2400个,占一般书刊用字的99%,所以小学生如果认识2400个常用字就能阅读一般书刊。 我国古代的周兴嗣能在一夜之间将1000个不同的常用字编成四言的押韵体《千字文》,既表达了一定的意义,又通俗易懂,和辙押韵,成为历代的识字课本。 最常用的140个汉字(按使用频率从高到低的右序排列): 的一是了我不人在他有这个上们来到时大地为子中你说生国年着就那和要她出也得里后自以会家可下而过天去能对小多然于心学么之都好看起发当没成只如事把还用第样道想作种开美总从无情己面最女但现前些所同日手又行意动方期它头经长儿回位分爱老因很给名法间斯知世什两次使身者被高已亲其进此话常与活正感 (这140个汉字的使用频率之和为50%) 其中: 最常用的5个汉字: 的一是了我 (这5个汉字的使用频率之和为10%) 最常用的17个汉字: 的一是了我不人在他有这个上们来到时 (这17个汉字的使用频率之和为20%) 最常用的42个汉字: 的一是了我不人在他有这个上们来到时大地为子中你说生国年着就那和要她出也得里后自以会 (这42个汉字的使用频率之和为30%) 最常用的79个汉字: 的一是了我不人在他有这个上们来到时大地为子中你说生国年着就那和要她出也得里后自以会家可下而过天去能对小多然于心学么之都好看起发当没成只如事把还用第样道想作种开 (这42个汉字的使用频率之和为30%) 使用频率排名141-232的汉字(这92个汉字的频率之和为10%) 见明问力理尔点文几定本公特做外孩相西果走将月十实向声车全信重三机工物气每并别真打太新比才便夫再书部水像眼等体却加电主界门利海受听表德少克代员许稜先口由死安写性马光白或住难望教命花结乐色 使用频率排名233-380的汉字(148个汉字,使用频率之和10%) 更拉东神记处让母父应直字场平报友关放至张认接告入笑内英军候民岁往何度山觉路带万男边风解叫任金快原吃妈变通师立象数四失满战远格士音轻目条呢病始达深完今提求清王化空业思切怎非找片罗钱紶吗语元喜曾离飞科言干流欢约各即指合反题必该论交终林请医晚制球决窢传画保读运及则房早院量苦火布品近坐产答星精视五连司巴 382-500 (5.43%)

统计学原理期末复习练习题附答案

1.统计总论练习 单项选择题 1.对某市工业生产设备情况进行统计研究,这时,总体单位是该市( 4 )①每一个工业企业②每一台设备③每一台生产设备④每一台工业生产设备 2.几位工人的工资分别是100元、120元、150元、200元这几个数字是(3 ) ①指标②变量③变量值④标志 3.标志是( 3 ) ①总体的特征②总体的数量特征③总体单位的属性或特征的名称④总体单位的数量特征 多项选择题 在全国人口普查中(235 ) ①全国所有人口数是总体②每一个人是总体单位③人的年龄是变量④某人的性别为“女性”是一个品质标志 ⑤全部男性人口的平均寿命是统计指标 2.统计调查练习 一、单项选择题 1、统计调查方案中调查期限是指_1____。 ①调查工作的起迄时间②搜集资料的时间③时期现象资料所属的时间④时点现象资料所属的时间 2、重点调查中的重点单位是指___4__。 ①这些单位是工作的重点②这些单位举足轻重 ③这些单位数量占总体全部单位的比重很大 ④这些单位的标志总量在总体标志总量中占较大比重 3、研究某型号炮弹的平均杀伤力,可以采用__4___。 ①重点调查②普查③典型调查④抽样调查 4、对某地食品物价进行一次全面调查,调查单位是__4__。 ①该地区所有经营食品的商店②每一个经营食品的商店③全部零售食品④每一种零售食品 二、多项选择题 1、抽样调查和重点调查的主要区别有_24____。 ①抽选调查单位的多少不同②抽选调查单位的方式方法不同③调查的组织形式不同 ④在对调查资料使用时,所发挥的作用不同⑤原始资料的来源不同 2、第四次全国人口普查的标准时点是1990年7月1日零点,下列人员不应计入人口总数之中_135____。 ①1990年7月1日23时出生的人口 ②1990年7月10日死亡的人口 ③1990年6月25日出生,30日23时死亡的人口④1990年6月29日出生,7月2日死亡的人口 ⑤1990年6月30日零点死亡的人口 3、以系统为单位调查某市全部商业状况,调查对象是__34___。 ①该市全部商品销售额②该市商业企业的总和③该市各商业系统商业状况总和④该市所有商业系统商业状况总和 3.统计整理练习单项选择题 1.一个分配数列的构成要素有_4___。 ①分组标志和指标②数量分组标志值和频数③品质分组标志和频数④分组标志及次数 2.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为__1___。 ①230 ②560 ③185 ④515 3.有20名工人看管机器台数资料如下:3,5,4,6,5,2,3,4,4,3,4,2,3,5,4,4,5,3,3,4,按上述资料编制变量数列应采用___1___。 ①单项分组②组距分组③等距分组④异距分组 4.组距数列中影响各组次数分布的要素是_2_____。 ①组中值②组距和组数③全距④总体单位数 多项选择题 1.对离散型变量分组_12345____。 ①可按每个变量值分别列组②也可采用组距分组③相邻组的组限可以不重④各组组距可相等也可不等 ⑤要按“上组限不在本组内”的原则处理与上组限相同的变量值 2.统计分组的作用是_134____。 ①反映总体的内部结构②比较现象间的一般水平③区分事物的性质④研究现象之间的依存关系 ⑤分析现象的变化关系 判断:将某市500家工厂按产值多少分组而形 成的变量数列,其次数是各厂的产值数。 4.综合指标练习 一、单项选择题 1.平均指标将总体内各单位数量差异(a ) a.抽象化 b.具体化 c.一般化 d.形象化 2. 加权算术平均方法中的权数为( d ) a.标志值 b.标志总量 c.次数之和 d.单位数比重 3. 某公司有十个下属企业,现已知每个企业的产值计划完成百分比和实际产值资料,计算该公司平均产值计划完成程度时,所采用的权数应该是(c ) a.企业数 b.工人数 c.实际产值 d.计划产值 4. 计算平均比率最适宜的平均数是(c ) a.算术平均数 b.调和平均数 c.几何平均数 d.位置平均数 5. 受极端数值影响最小的平均数是( d ) a.算术平均数 b.调和平均数 c.几何平均数 d.位置平均数 6. 由组距数列确定众数时,如果众数组相邻两组的次数 相等,则 ( b ) a.众数为零 b.众数组的组中值就是众数 c.众数不能确定 d.众数组的组限就是众数 7.已知甲数列的平均数为100,标准差为;乙数列的平均数为,标准差为。由此可断言( a ) a.甲数列平均数的代表性好于乙数列 b.乙数列平均数的代表性好于甲数列 c.两数列平均数的代表性相同

相关文档
最新文档