第二章 信息量化与编码
信息论与编码技术

信息论与编码技术信息论是研究信息传输、存储和处理的一门学科,而编码技术则是信息论的一项重要应用。
信息论与编码技术的发展,对现代通信、数据存储和计算机科学等领域产生了深远的影响。
本文将从信息熵、信道容量和编码理论等方面来探讨信息论与编码技术的基本概念和应用。
一、信息熵信息熵是信息论中的一个重要概念,它用来衡量一个离散随机变量的不确定性。
在信息论中,信息熵越大,代表着信息的不确定性越高,信息量也就越大;相反,信息熵越小,表示信息的不确定性越低,信息量也就越小。
信息熵的计算公式为:H(X) = -∑(p(i) * log2(p(i)))其中,H(X)表示离散随机变量X的信息熵,p(i)表示X取各个值的概率。
通过计算信息熵,我们可以评估信息的平均编码长度。
在通信系统中,对于概率分布已知的消息源,我们可以使用无损编码技术将信息源的输出编码成二进制串,从而实现高效的信息传输和存储。
二、信道容量信道容量是衡量信道传输速率的理论上限。
在信息论中,我们可以通过计算信道容量来确定一种特定的编码和调制方案是否可以实现理论最大传输速率。
对于离散无记忆信道,其信道容量C计算公式为:C = ∑(p(x) * log2(p(x)/p(y)))其中,p(x)表示发送端发出的信号为x的概率,p(y)表示接收端接收到的信号为y的概率。
在计算信道容量时,我们需要寻找一种合适的编码方案,使得发送端发出的信号与接收端接收到的信号之间的互信息最大化。
这样可以有效提高信道的利用率,提高信号传输的可靠性。
三、编码理论编码理论是信息论的重要组成部分,它研究如何将信息源的输出进行编码,以减少数据传输或存储过程中的冗余,从而提高信息传输的效率。
常见的编码技术有可变长编码、定长编码、哈夫曼编码等。
其中,哈夫曼编码是一种基于概率的编码方法,它可以根据不同符号的出现概率,为每个符号分配不同长度的编码,从而实现信息的高效压缩。
除了无损编码技术,还有一种重要的编码技术是差分编码。
信息编码习题答案或提示

第二章部分习题2.1 试问四进制、八进制脉冲所含信息量是二进制脉冲的多少倍?答:2倍,3倍。
2.2 一副充分洗乱了的牌(含52张牌),试问 (1) 任一特定排列所给出的信息量是多少?(2) 若从中抽取13张牌,所给出的点数都不相同, 能得到多少信息量?解:(1) !52log 2 (2) 任取13张,各点数不同的概率为1352!13C ,信息量:9.4793(比特/符号)2.3 居住某地区的女孩子有%25是大学生,在女大学生中有75%是身高160厘米上的,而女孩子中身高160厘米以上的占总数的一半。
假如我们得知“身高160厘米以上的某女孩是大学生”的消息,问获得多少信息量? 答案:1.415比特/符号。
提示:设事件A 表示女大学生,事件C 表示160CM 以上的女孩,则问题就是求p(A|C),83214341)()|()()()()|(=⨯===C p A C p A p C p AC p C A p2.4 设离散无忆信源()123401233/81/41/41/8X a a a a P X ====⎛⎫⎧⎫=⎨⎬ ⎪⎩⎭⎝⎭,其发出的消息为(202120130213001203210110321010021032011223210),求(1) 此消息的自信息量是多少?(2) 在此消息中平均每个符号携带的信息量是多少?解:(1)87.81比特,(2)1.951比特。
提示:先计算此消息出现的概率,再用自信息量除以此消息包含的符号总数(共45个)。
2.5 从大量统计资料知道,男性中红绿色盲的发病率为7% ,女性发病率为0.5%,如果你问一位男士:“你是否是色盲?”他的回答可能是“是”,可能是“否”,问这两个回答中各含有多少信息量?平均每个回答中含有多少信息量?如果问一位女士,则答案中含有的平均自信息量是多少?(1) 男性回答是的信息量为2log 0.07 3.8369-=比特,回答否的信息量是0.1047比特,平均每个回答含的信息量(即熵)是0.36596比特。
信息理论与编码问题详解姚善化清华大学出版社

实用文档《信息理论与编码》习题参考答案第 1 章1.信息是什么? 信息与消息有什么区别和联系?答:信息是对事物存在和运动过程中的不确定性的描述。
信息就是各种消息符号所包含的具有特定意义的抽象内容,而消息是信息这一抽象内容通过语言、文字、图像和数据等的具体表现形式。
2.语法信息、语义信息和语用信息的定义是什么?三者的关系是什么?答:语法信息是最基本最抽象的类型,它只是表现事物的现象而不考虑信息的内涵。
语义信息是对客观现象的具体描述,不对现象本身做出优劣判断。
语用信息是信息的最高层次。
它以语法、语义信息为基础,不仅要考虑状态和状态之间关系以及它们的含义,还要进一步考察这种关系及含义对于信息使用者的效用和价值。
三者之间是内涵与外延的关系。
第 2 章1.一个布袋内放 100 个球,其中 80 个球是红色的, 20 个球是白色的,若随机摸取一个球,猜测其颜色,求平均摸取一次所能获得的自信息量?答:依据题意,这一随机事件的概率空间为X x1x2P0.80.2其中:x1表示摸出的球为红球事件,x2表示摸出的球是白球事件。
a)如果摸出的是红球,则获得的信息量是I x1log p x1log0.8(比特)b)如果摸出的是白球,则获得的信息量是I x2log p x2log0.2 (比特)c) 如果每次摸出一个球后又放回袋中,再进行下一次摸取。
则如此摸取n次,红球出现的次数为np x1次,白球出现的次数为np x2次。
随机摸取n次后总共所获得信息量为np x1 I x1np x2 I x2d)则平均随机摸取一次所获得的信息量为H X1np x I x np x I x1122 np x1 log p x1p x2 log p x20.72 比特 / 次2.居住某地区的女孩中有25%是大学生,在女大学生中有中身高 1.6 米以上的占总数的一半。
假如我们得知 “身高 1.6问获得多少信息量?75%是身高 1.6 米以上的,而女孩米以上的某女孩是大学生”的消息,答:设事件 A 为女孩是大学生;设事件 B 为女孩身高 1.6米以上。
第二章 信息量化与编码

2.2.2标量量化器结构
• 量化器的特性完全取决于输入分段及输出电平集合,编码 器实现的主要是输入分段,而解码器实现的则是输出电平。 也就是说,编码器的主要功能是判定输入信号位于哪一个 信号分段之内,所以我们可以定义一个选择函数Si(x)如下:
实现选择函数Si(x) 的系统结构如图所示
• 解码器的实现直接通过下标i查表即可得到 相应的量化电平yi 。因此,我们可将量化器 的特性表示成如下形式:
• 正规量化器典型量化曲线图
• 在一般情况下,输入信号都是有界的,此时,最两 端的边界点一般取为x0=min(x),xN=max(x),而量化器 的量化范围为B=xN-x1。对于输入无界的情形,相当 于x0=- ∞,xN=+ ∞,量化器的量化范围定义为B=xN-1-x1, 即量化范围为所有输入分段之和的长度。 • 从结构上看,量化器可分编码器与解码器两个部分。 编码器完成输入到数字的映射,即ε: R → I, I={1,2,…N},而解码器则是实现由数字到电平的转换, 即D:I →C.若Q(x)=yi,则有ε(x)=i, D(i)=yi ,亦即 Q(x)=D(ε(x))。在通信系统中,编码器只能传送所选 量化电平yi 的下标i,而不是yi 本身。解码器根据 接收到的下标i, 通过查表可得到相应的电平值。
• 更为一般的是乘幂误差,定义为
其中m=1时即为绝对误差,m=2时随机过程X的概率密度为fX (x),则输入 量化误差的期望值为
此公式所示的D是一种最常用的性能测度。而 其中又以误差测度为平方误差时最为普遍, 此时的性能测度又称为均方误差,可写为:
• 2 性噪比 性噪比是另一个常用的性能测度,定义 为 其中,D为均方误差。SNR的单位为分贝(db)
一.给定解码器时的最佳编码器
pcm脉冲编码调制课程设计

pcm脉冲编码调制课程设计一、课程目标知识目标:1. 学生能理解脉冲编码调制(PCM)的基本概念和原理;2. 学生能掌握PCM系统的组成部分,包括模拟信号的采样、量化、编码和解码过程;3. 学生能解释采样定理及其在PCM中的应用;4. 学生了解不同类型的量化方法和编码方式,并明白它们对信号质量的影响。
技能目标:1. 学生能够运用所学知识,设计简单的PCM编码解码系统;2. 学生能够通过计算实例,评估不同PCM参数(如采样频率、量化位数)对信号恢复质量的影响;3. 学生能够操作相关软件或硬件工具,进行PCM的实际信号处理实验。
情感态度价值观目标:1. 学生通过PCM的学习,培养对通信技术发展的兴趣和认识,激发对工程问题的探究精神;2. 学生能够在小组合作中展现出团队精神和沟通能力,增强合作解决问题的意识;3. 学生能够认识到技术在现代社会中的重要作用,理解技术发展对生活的影响,培养积极的技术伦理观。
课程性质分析:本课程属于电子信息技术或通信原理的范畴,理论与实践相结合,通过PCM的学习,使学生掌握模拟信号数字处理的基础。
学生特点分析:针对高中年级或大一、大二理工科学生,他们具备一定的数学基础和物理概念,对通信技术有一定的好奇心,但需要具体案例和实际操作来加深理解。
教学要求:教学内容需结合实际案例,通过直观演示和动手实验,使学生在理解理论基础上,能够达到技能和情感态度价值观的双重目标。
教学过程中应注重启发式教学,鼓励学生提问和思考,促进知识的深入理解与应用。
二、教学内容1. PCM基本概念:介绍脉冲编码调制的基本原理,包括模拟信号的数字化过程;- 教材章节:第二章“模拟信号的数字化”- 内容:信号的采样、量化、编码与解码的基本定义和流程。
2. 采样定理:探讨奈奎斯特采样定理,理解采样频率与信号频率的关系;- 教材章节:第二章“采样定理”- 内容:采样频率的选择,避免混叠现象的方法。
3. 量化方法:讲解均匀量化和非均匀量化,以及量化误差的分析;- 教材章节:第三章“量化与编码”- 内容:量化级数的确定,量化误差的计算。
计算机网络第二章参考答案

第二章作业参考答案1.数据通信过程包括哪几个阶段,各阶段的特点是什么?答:数据通信过程一般包括以下5个阶段:建立物理连接:建立通信线路的连接;建立逻辑连接:建立数据传输线路,通信双方建立同步联系,相互核对地址;数据传输;传送通信数据;断开逻辑连接;双方通过通信控制信息确认此次通信结束;断开物理连接:通信结束,切断物理链接通道。
2. 试解释以下名词:数据、信号、模拟数据、数字信号。
答:数据(Data):传递(携带)信息的实体。
信息(Information):数据的内容或解释。
信号(Signal):数据的物理量编码(通常为电编码),数据以信号的形式在介质中传播。
3. 模拟通信系统和数字通信系统有何不同?答:模拟通信系统是在模拟信道上实现模拟信息或数字信息的传输,需要经过调制和解调;数字通信系统是在数字信道上实现模拟信息或数字信息的传输,需要经过编码和解码。
4. 举出现实生活中单工及双工通信的例子答:单工是指数据单向传输,如无线电广播。
半双工是指数据可以双向交替传输,但不能在同一时刻双向传输,例如对讲机。
全双工是指数据可以双向同时传输,例如电话。
5. 基带传输与宽带传输的主要区别是什么?答:基带传输:不需调制,编码后的数字脉冲信号直接在信道上传送。
宽带传输:把信号调制成频带为几十MHz到几百MHz的模拟信号后再传送,接收方需要解调。
6. 同步通信与异步通信的主要区别是什么?答:同步通信要求接收端与发送端在时间基准上一致,收发双方不停地发送和接收连续的同步比特流。
而异步通信时不要求接收端时钟和发送端时钟同步。
发送端发送完一个字节后,可经过任意长的时间间隔再发送下一个字节。
得同步通信的传输速率较异步通信更快,但系统需要在首发两端保持同步,因此一般比异步通信更为复杂。
同时,异步通信为使接收端正确识别数据,开销较大。
7. 通过比较说明双绞线、同轴电缆和光纤三种传输介质的特点?答:双绞线:组装密度高、节省空间,安装容易,平衡传输,抗干扰性一般,连接距离短,,价格便宜。
第二章 视频与音频信号的数字化
信号带宽: 视频信号:6MHz(Y、R、G、B) 色差信号:1.5MHz(R-Y、B-Y压缩)
像素:组成图像的最小基本单元。
像素颗粒越小,单位面积上的像素数越多, 图像就越清晰、越逼真。
●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●
fs≥2fm
3、频谱混叠和限带滤波
当fs<2fm时,上下边带的边界处频谱重叠在 一起,使信号分离不出来而产生干扰失真,叫 混叠干扰。
• 限带:使fm信号的最高频率<1/2·fs。
通常取fs=(2.2~2.7)fm。
二、量化
量化的概念 量化:把在时间上离散化的信号在幅度上
也离散化。
①量化级与量化级差
如果是4:4:4标准:总数码率R=3×13.5×8=324Mb/s。
2.6 ITU-R601标准和中国HDTV标准介绍
一、 ITU-R601标准介绍 演播室数字分量编码(4:2:2)标准—
ITU-R601 主要参数为:P22
参数名称
1.编码信号
2.一行取样点数 亮度信号(Y) 色度信号R-Y、B-Y
R、G、B或Y:74.25MHz
CR、CB :37.125MHz
格式:1920×1080i/50
第一、二章小结
数字电视: HDTV的基本参数: 数字电视的主要优缺点 数字电视系统的基本组成 音频信号的数字化
取样频率:32KHz、44.1KHz、48KHz 量化比特数:n=16bit 数码率: R=fs×n×声道数
清华大学出版社信息编码论第二章全解
2.1一个马尔可夫信源有3个符号{}1,23,u u u ,转移概率为:()11|1/2p u u =,()21|1/2p u u =,()31|0p u u =,()12|1/3p u u =,()22|0p u u =,()32|2/3p u u =,()13|1/3p u u =,()23|2/3p u u =,()33|0p u u =,画出状态图并求出各符号稳态概率。
解:状态图如下状态转移矩阵为:1/21/201/302/31/32/30p ⎛⎫ ⎪= ⎪ ⎪⎝⎭设状态u 1,u 2,u 3稳定后的概率分别为W 1,W 2、W 3由1231WP W W W W =⎧⎨++=⎩得1231132231231112331223231W W W W W W W W W W W W ⎧++=⎪⎪⎪+=⎪⎨⎪=⎪⎪⎪++=⎩计算可得1231025925625W W W ⎧=⎪⎪⎪=⎨⎪⎪=⎪⎩2.2 由符号集{0,1}组成的二阶马尔可夫链,其转移概率为:(0|00)p =0.8,(0|11)p =0.2,(1|00)p =0.2,(1|11)p =0.8,(0|01)p =0.5,(0|10)p =0.5,(1|01)p =0.5,(1|10)p =0.5。
画出状态图,并计算各状态的稳态概率。
解:(0|00)(00|00)0.8p p == (0|01)(10|01)p p== (0|11)(10|11)0.2p p == (0|10)(00|10)p p == (1|00)(01|00)0.2p p == (1|01)(11|01)p p== (1|11)(11|11)0.8p p == (1|10)(01|10)0.5p p ==于是可以列出转移概率矩阵:0.80.200000.50.50.50.500000.20.8p ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭状态图为:设各状态00,01,10,11的稳态分布概率为W 1,W 2,W 3,W 4 有411i i WP W W ==⎧⎪⎨=⎪⎩∑ 得 13113224324412340.80.50.20.50.50.20.50.81W W W W W W W W W W W W W W W W +=⎧⎪+=⎪⎪+=⎨⎪+=⎪+++=⎪⎩ 计算得到12345141717514W W W W ⎧=⎪⎪⎪=⎪⎨⎪=⎪⎪⎪=⎩2.3 同时掷出两个正常的骰子,也就是各面呈现的概率都为1/6,求:(1) “3和5同时出现”这事件的自信息; (2) “两个1同时出现”这事件的自信息;(3) 两个点数的各种组合(无序)对的熵和平均信息量; (4) 两个点数之和(即2, 3, … , 12构成的子集)的熵; (5) 两个点数中至少有一个是1的自信息量。
第二章计算机网络物理层(1).
(答案仅供参考如有不对请自己加以思考)第二章计算机网络物理层一、习题1.电路交换的优点有()。
I 传输时延小 II 分组按序到达III 无需建立连接 IV 线路利用率高A I IIIB II IIIC I IIID II IV2 下列说法正确的是()。
A 将模拟信号转换成数字数据称为调制。
B 将数字数据转换成模拟信号称为调解。
C 模拟数据不可以转换成数字信号。
D 以上说法均不正确。
3 脉冲编码调制(PCM)的过程是()。
A 采样,量化,编码B 采样,编码,量化C 量化,采样,编码D 编码,量化,采样4 调制解调技术主要使用在()通信方式中。
A 模拟信道传输数字数据B 模拟信道传输模拟数据C 数字信道传输数字数据D 数字信道传输模拟数据5 在互联网设备中,工作在物理层的互联设备是()。
I 集线器 II 交换机 III 路由器 IV 中继器A I IIB II IVC I IVD III IV6一个传输数字信号的模拟信道的信号功率是0.26W,噪声功率是0.02W,频率范围为3.5 ~3.9MHz,该信道的最高数据传输速率是()。
A 1Mbit/sB 2Mbit/sC 4Mbit/sD 8Mbit/s7 在采用1200bit/s同步传输时,若每帧含56bit同步信息,48bit控制位和4096bit数据位,那么传输1024b需要()秒。
A 1B 4C 7D 148 为了是模拟信号传输的更远,可以采用的设备室()。
A中继器 B放大器 C 交换机 D 路由器9 双绞线由螺旋状扭在一起的两根绝缘导线组成,线对扭在一起的目的是()。
A 减少电磁辐射干扰B 提高传输速率C 减少信号衰减 D减低成本10 英特网上的数据交换方式是()。
A 电路交换B 报文交换C 分组交换 D异步传输11 ()被用于计算机内部的数据传输。
A 串行传输B 并行传输 C同步传输 D 异步传输12 某信道的信号传输速率为2000Baud,若想令其数据传输速率达到8kbit/s,则一个信号码元所取的有效离散值个数应为()。
无线多媒体传输中的数据量化及编码研究
无线多媒体传输中的数据量化及编码研究在日常生活中,我们经常会使用手机、电视、电脑等设备进行多媒体数据传输与接收。
这些设备采用的无线传输技术不仅需要高速、稳定的信号传输,同时需要对数据进行量化和编码。
在无线多媒体传输中,数据量化和编码是重要的研究方向,本文将从数据量化和编码两方面进行论述。
一、数据量化数据量化是将模拟信号或数字信号转换为离散的二进制数字序列。
在无线多媒体传输中,数据量化通常采用的是压缩编码模式,将信号进行压缩后再进行传输。
其中,压缩编码的主要方式有无损压缩和有损压缩两种。
无损压缩:无损压缩是指在压缩信号的同时不丢失原始数据信息的方式。
通常采用的无损压缩方法有熵编码、算术编码等。
熵编码是根据信号出现的概率进行编码,出现概率高的信号用较少的比特表示,出现概率低的信号用较多的比特表示。
算术编码是把整个信号流看作一个小数,通过多次除以进位数来进行编码。
无损压缩虽然压缩率较低,但是不丢失数据信息,适用于一些敏感数据的传输。
有损压缩:有损压缩是指在压缩信号的同时会有部分数据信息丢失的方式。
通常采用的有损压缩方法有DCT压缩、小波压缩等。
DCT压缩是通过对信号进行基变换,将其转化为一组频率系数,再根据频率系数的大小进行编码,以达到压缩的目的。
小波压缩是根据小波变换原理进行压缩,通过变换信号的时间和频率属性,将信号分解成不同尺度和不同频段的子信号,再根据子信号的权重系数进行编码。
有损压缩可以大幅度地提高压缩率,但是会丢失部分数据信息。
二、编码数据编码是将量化后的数据转换为二进制数据流的过程。
直接将量化后的数据进行传输的话,由于受到噪声、干扰等因素的影响,传输数据会出现各种错误,甚至导致数据传输失败。
编码的目的是在传输过程中增强数据的可靠性和稳定性,同时在有限的带宽内提高数据传输的速率和效率。
在无线多媒体传输中,编码包括信道编码和源编码两个方面。
信道编码:信道编码是指在信道传输之前,对数据进行一些冗余码的添加,以增强数据的可靠性和恢复性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 正规量化器典型量化曲线图
• 在一般情况下,输入信号都是有界的,此时,最两 端的边界点一般取为x0=min(x),xN=max(x),而量化器 的量化范围为B=xN-x1。对于输入无界的情形,相当 于x0=- ∞,xN=+ ∞,量化器的量化范围定义为B=xN-1-x1, 即量化范围为所有输入分段之和的长度。 • 从结构上看,量化器可分编码器与解码器两个部分。 编码器完成输入到数字的映射,即ε: R → I, I={1,2,…N},而解码器则是实现由数字到电平的转换, 即D:I →C.若Q(x)=yi,则有ε(x)=i, D(i)=yi ,亦即 Q(x)=D(ε(x))。在通信系统中,编码器只能传送所选 量化电平yi 的下标i,而不是yi 本身。解码器根据 接收到的下标i, 通过查表可得到相应的电平值。
• (3)信息量化与编码要研究的主要问题 • 从信息的角度来看,当信号由连续幅度转 换成离散幅度时,必然会有信息的损失, 因此,信息量化属于有失真编码。不过, 通过适当的设计,我们可以将这种损失减 至能接受的地步。从这种意义出发,信息 量化与编码要研究的问题便是如何进行有 效的设计,使在一定条件下,编码的失真 达到最小。
• 下面我们分析均匀量化器的均匀失真
考虑输入为有界的情形,不妨设位于区间(a , b)之 内,变化范围为B=b-a。左右两边的边界点分别为:x0=a , xN=b。假定将区间分为N等分,每个子区间为△=B/N,也就 是量化器有N级输出,每级之间相距△。
量化误差ε=Q(X)-X,所以在均匀量化时,最大的可能量 化误差为△/2,即B/2N。所以均匀量化误差是一种使最大 量化误差达到最小的量化方式。这一特点使得均匀量化在 很广泛的一类输入信号下,都能保持较好的量化性能。这 正是模拟/数字转换器大多采用均匀量化方式的原因。
非均匀量化器可用均匀量化器的压扩模型表示,如图
由图可见,输入信号x首先经过单调非线性变换G,变成G(x), 然后对G(x)进行均匀量化,最后再经非线性变换G的逆变 换G-1,得到最后的非均匀量化输出。其中, G通常是一个 压缩变换,因为大多数信号的分布都是集中在某一区域内 的,对应的, G-1 为一个扩张变换。
• 当输入信号亦为均匀分布时,量化误差ε的均 值 • 总的失真为
• 在实际情况中,输入信号大多不是有界的,此时,我 们可将左右两端的区间(-∞,x1], (XN-1,+∞]单独取出来考虑。其余的区间与上述有界信号 输入时是一样的。不过在无界输入的情况下,最大量 化误差也必定是无限的,因此没有什么意义。主要的 性能测度是平均量化误差,由于多数输入信号的分布 主要集中于某一个区间,输入信号位于左右两端的区 间的机会很小,因此上述对有限输入信号的结论依然 是近似成立的,特别是当量化层数N很大时。
其中V值是用于控制最大量化电平,而u及A值则是用来控制 压缩特性的陡峭程度,也就是最大量化阶距与最小量化阶 距之比。对于大的u及A值,可以增加信号的动态范围,但 另一方面也将减少大信号的量化性噪比。因此u及A值应综 合考虑多种因素,实际中用的较多的是u=255及A=87.6。
三.分段线性压扩
从数学的角度看,连续可导的压扩特性固然便于分析, 但在具体实现中,却不易做到低成本高精度。因此,实际 中,是采用分段线性压扩器来逼近连续可导的非线性压扩 特性。分段线性压扩器是指量化器在量化范围内分为许多 小段,每一小段相当于一个均匀量化器,但不同小段之间 量化的阶距不同。 稍作修改,即可将均匀量化的平均失真结果用到分段 均匀量化器中。设输入的概率分布是均匀分布,记△i 表 示第i段均匀量化的量化阶距,共有M段,则容易推出分段 均匀量化器的平均失真为
第二章 信息量化与编码
• 2.1 引言 (1)什么是信息量化与编码 • 量化:在数字信号处理领域,量化指将信号的连续取值(或 者大量可能的离散取值)近似为有限多个(或较少的)离散 值的过程。量化主要应用于从连续信号到数字信号的转换中。 连续信号经过采样成为离散信号,离散信号经过量化即成为 数字信号。 • 编码:编码是信息从一种形式或格式转换为另一种形式的过 程也称为计算机编程语言的代码简称编码。用预先规定的方 法将文字、数字或其它对象编成数码,或将信息、数据转换 成规定的电脉冲信号。 • (2)为什么要进行信息量化与编码
一.给定解码器时的最佳编码器
这个问题相当于在给定解码器时,寻找对量化输入信 号的最佳分段,所谓解码器给定,即相当于输出电平集合 C={y1,y2,...y N}已知。从直观上看,对于输入信号x,量化输 出满足以下条件显然最佳:
换言之,应该有
事实上,此时的量化器的平均量化输出也的确达到最小,因 为
• 很显然当输入xi位于yi-1 与yi之间时,应选择 与 x较近的 y作为量化输出。所以对输入信 号的分段边界点应位于yi -1与yi的中点,即 xi=(yi-1+yi)/2 二.给定编码器时的最佳解码器
2.2.2标量量化器结构
• 量化器的特性完全取决于输入分段及输出电平集合,编码 器实现的主要是输入分段,而解码器实现的则是输出电平。 也就是说,编码器的主要功能是判定输入信号位于哪一个 信号分段之内,所以我们可以定义一个选择函数Si(x)如下:
实现选择函数Si(x) 的系统结构如图所示
• 解码器的实现直接通过下标i查表即可得到 相应的量化电平yi 。因此,我们可将量化器 的特性表示成如下形式:
另一方面,我们有:
所以
从而得到平均失真的近似计算式为
• 当N很大时,每个最小量化区间Ri可近似认 为是一个均匀量化过程,由前面关于均匀 量化器的性能分析,我们可得:
2.2.6 最佳量化
• 所谓最佳量化,是指给定量化层数N时,使平均量化误差 达到最小的量化。在一般情况下,这个问题并没有显式的 理论解,但可以由数值解有效的实现。 • 量化器的结构可分为编码器跟解码器,在寻找最佳量化器 时,我们常常将问题简化,如假定其中一部分是固定的, 而另一部分则是可变的。下面我们首先从两个方面分析问 题,即在给定编码器条件下寻找最佳解码器,以及在给定 解码器条件下寻找最佳编码器。然后分析一般情况下的最 佳量化问题。最佳的原则是使均方误差最小。
• 更为一般的是乘幂误差,定义为
其中m=1时即为绝对误差,m=2时为平方误差, 这两种情形应用得最为普遍。
设输入随机过程X的概率密度为fX (x),则输入 量化误差的期望值为
此公式所示的D是一种最常用的性能测度。而 其中又以误差测度为平方误差时最为普遍, 此时的性能测度又称为均方误差,可写为:
• 2 性噪比 性噪比是另一个常用的性能测度,定义 为 其中,D为均方误差。SNR的单位为分贝(db)
量化器的基本结构图
2.2.3量化器性能测度• 1 Nhomakorabea均方误差
• 量化器的功能是将未知输入值用有限精度的离散值来代替, 因此不可避免的要引起失真,如何衡量这种失真便是本节 要讨论的问题。 • 根据量化的结果,我们无法精确知道输入值的大小,只能 知道其位于某个范围内。因此通常都假设输入是一个随机 变量,概率密度函数已知,相应的每个输入值的量化误差 也是一个随机变量。量化器的性能指标应是描述所有输入 值量化误差引起的总的失真效应。因此常用统计平均的方 法来解决这类问题。 • 最常用的的失真测度是平方误差,定义为
2.2.4 均匀量化器
最常用的标量量化器是均匀量化器,大多数的模拟/数字转换器就属于此类。 所谓均匀量化器,是一个正规量化器,并且满足: (1)各个分段是等长的; (2)每个分段的中点即为相应的量化输出。 换言之,对于均匀量化器,我们有
当然,输入信号的左右边界可能是无限的,对于区间(-∞,y1],我 们有y1=x1-△/2,对区间[yN,+∞),有yN=xN-1 + △/2。
2.2标量量化
(1)标量量化的定义: 标量量化可以视为将一段连续的实轴上的线映射成 一个离散的点集,这个离散点集的大小是受限的,若记 此离散点集为 C={y1,y2,...y N},一般我们约定下标的排列是以y值的大小为序 的,即 y1<y2<…< y N 记R表示连续实轴。当量化器为n点时,相当于将R划分 为N个区段Ri , Ri=(xi-1,xi],i=1,2,…,N,为半开半闭区间。显 然,区间的划分是充分以及不相交的。
• 结论2.1(压扩模型的通用性)对任何有限正规
的量化器,都存在着如图2-2-6所示的压扩模型,其中压扩 变换G及扩张变换G-1 与输入信号的概率分布有关。 证明:设输入信号分段边界点为{x1,x2,…,XN-1},(x0,xN可以是无 穷大,不考虑),输出值为{y1,y2,...y N}。我们按以下方式构 造压扩模型。首先定义两个集合: P={(yi , i△+k),i =1,2,…,N} Q= ={(xi , i△+ △/2+ k),i =1,2,…,N-1} P中包含平面上N个点,这N个点横坐标是yi, 而纵坐标则是一 系列以△为间隔的等间距点。Q的情况类似。将P及Q两个 集合代表的平面重叠在一起,则可得到平面上一个新的点 集,其中,纵坐标仍是以△为间隔的等间距点,而横坐标 则是xi , yi 交错(因为是正规量化器)。将相邻区间边界点 对应的平面上的点以线段相连,即可构成一个分段直线的 单调增曲线G(x),满足
记Q表示量化器,则Q的特性完全决定于对输入信号的分 段及输出值决定。
• (2)一个正规量化器还满足如下的条件: • ①:每个分段Ri都是一个连续的区间, 可以是开的,或半开半闭的。 • ②:每个分段Ri对应的量化值yi位于Ri中, 即yi ∈ Ri=(xi-1,xi). • 正规量化器的输入分段边界点xi及量化输 出点yi满足已下序列关系: x0<y1<x1<y2<x2<…<yN<xN
2.2.5 非均匀量化器
一 .压扩模型
均匀量化器有一个缺点,即当输入信号 变化范围大时,量化器量化层数也必须相应变 大,以保持一定的性能。而由于在许多实际场 合,输入信号并不是均匀分布的,且取大值的 概率相对小一些,所以,从统计的观点来看, 均匀量化器这种大小信号一视同仁均匀量化的 方法不太合理。因此产生了非均匀量化的概念。 从直观上看,当输入信号不是均匀分布时,就 应该用非均匀量化器。