语音信号的A率(或u率)压缩算法

合集下载

g711编码原理

g711编码原理
G.711编码原理
G.711编码是一种常用的音频编码标准，用于将模拟语音信号转换为数字信号，以提高通信效率和节省带宽。

本文将介绍G.711编码的基本原理.
G.711编码使用了基于时域的脉冲编码调制（PCM）技术，将模拟语音信号进
行采样和量化，然后将其转换为数字信号以进行传输. G.711编码标准主要包括两
种压缩算法：μ律编码（μ-law）和A律编码（A-law）.
μ律编码是在北美和日本广泛使用的一种算法，而A律编码则是在欧洲和国际
上使用的一种算法. 这两种编码算法在原理上相似，都是将模拟信号映射到更小的
动态范围内以减小信号的位数.
在μ律编码中，信号的动态范围被分为255个离散级别. 较大幅度的信号将被
映射为较小的幅度，而较小幅度的信号将被映射为较大的幅度. 这种非线性映射允
许更高的精度分配给较小幅度的信号.
在A律编码中，信号的动态范围被分为一个更精细的离散级别，共有87个级别. 类似于μ律编码，A律编码也将较大幅度的信号映射为较小的幅度，反之亦然.
G.711编码使用8位字节表示每个采样样本，通过这种方式将带宽减小到64 kbps. 这使得G.711编码在语音传输和存储中具有广泛的应用.
总结一下，G.711编码是一种常用的音频编码标准，它通过采样、量化和非线
性映射的过程，将模拟语音信号转换为数字信号以实现高效传输. 在实际的应用中，人们可以根据地区使用的标准选择μ律编码或A律编码算法来进行编码过程。

语音的压缩编码

应用于声音的传输（通信）:
长途电话 (8 KHz x 8 bit x 1), 时分多路复用TDM (time-division multiplexing)
应用于全频带数字声音的表示/存储:
CD-DA（CD唱片），DAT (44.1 KHz x 16 bit x 2)
原理：声音信号具有很强的相关性，可从已知信号来预测未知信号, 即使用前面的样本预测当前的样本，实际样本值与预测值之间的误差往往很小。利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码小的差值，使用大的量化阶去编码大的差值，效果：量化位数可以显著减少，从而降低了总的码率。
+
预测值
差值
重建信号
DPCM
编码输出
CCITT G.721 ADPCM编码器
A
量化阶适配器
自适应
( 4 位 )
6阶自适应线性预测， 4位的自适应量化器，输出码率： 8k x 4 = 32 kbps
ADPCM 小结
PCM话音质量 4.5级 ADPCM话音质量 4.34级,码率降低一倍(32 kbps)。 ADPCM应用：数字语音通信多媒体应用中的语音（解说词）
ADPCM自适应差分脉冲编码调制 (Adaptive Differential PCM)
增量调制(DM)
差分脉冲编码调制 DPCM
实际样本值
利用样本与样本之间存在的相关性进行编码，即根据前面的样本估算当前样本的大小，然后对预测误差进行量化编码。
差值
线性预测公式： Xn = A1*Xn-1 + A2*Xn-2 + ... + Am*Xn-m
举例
根据输入样本幅度的大小来改变量化阶大小。可以是瞬时自适应，即量化阶的大小每隔几个样本就改变，也可以是音节自适应，即量化阶的大小在较长时间周期里发生变化。

话音编码

x 为输入信号，规格化为－1<= x <=1 为输入信号，规格化为－为确定压缩量的参数， µ 为确定压缩量的参数，它反映最大量化间隔和最小量化间隔之比， 500。小量化间隔之比，取100 <= µ <= 500。
由于输入和输出关系是对数关系，所以这种编码又称为对数由于输入和输出关系是对数关系，所以这种编码又称为对数PCM。。
8
话音产生的数字模型
周期
周期脉冲序列发生器
声道参数
浊/清选择清选择
时变数字滤波器语音输出
伪随机噪声产生器
音量控制
9
话音技术的研究热点
话音压缩编码（ Coding）话音压缩编码（Speech Coding）话音识别（话音识别（Speech Recognition） Recognition）文本话音转换（文本话音转换（Text To Speech） Speech）
13
话音编译码器的分类
波形编译码器（波形编译码器（waveform coder）：不利用生 coder）：）：不利用生成话音的信号的任何知识，成话音的信号的任何知识，将话音视为一种普通的声音，直接对波形信号进行采样和量化。通的声音，直接对波形信号进行采样和量化。例如PCM、DPCM、ADPCM等例如PCM、DPCM、ADPCM等。音源编译码器（音源编译码器（Source coder）：也叫参数编 coder）：）：也叫参数编译码器、声码器（vocoder）。）。它从话音波形信译码器、声码器（vocoder）。它从话音波形信号中提取话音生成模型的参数，号中提取话音生成模型的参数，使用这些参数通过话音生成模型重构出话音。通过话音生成模型重构出话音。混合编译码器（ coder）：）：综合使用上混合编译码器（Hybrid coder）：综合使用上述两种技术。述两种技术。使用的激励信号波形尽可能接近于原始话音信号的波形。例如CELP CELP。于原始话音信号的波形。例如CELP。

A率算法

3、语音的A 律压缩与解压统计表明对于每一个讲话者来说，语音中小幅度成分出现的概率要比大幅度多得多，为了在语音信号的整个动态范围内都可以接受低电平信号，量化电平必须照顾到语音的低电平信号，极低电平的量化间隔要小，高电平的量化间隔要大。

压缩扩展技术能过借用3种方法实现：（1）模拟信号在到达ADC 前，即进行8比特量化前，首先通过一个非线性电路；（2）使用一个8比特ADC ，其内部量化电平取非均等间隔；（3）使用线性12比特ADC 然后借助于数字查表（12笔特输入，8比特输出）。

这三种方法都需要有非线性性功能，差别仅是非线性放在什么地方。

两个标准的压缩扩展特性曲线称为u 律和A 律，使CCITT 提出的G.711协议PCM 编码方式的一部分。

北美和日本使用u 律，欧洲使用A 律，两个算法使用了非线性，把量化间隔变换成人耳能检测的线性空间。

A 律限制采样值为12比特，A 律的压缩可以按照下列公式进行定义：)1||1(ln 1||ln 1)sgn()1||0(ln 1||)sgn()(≤≤++=≤≤+=x AA x A x A x A x A x x F式中，A 是压缩参数（在欧洲，A=87.6）x 是需要压缩的归一化整数。

从线性到A 律的压缩转换如下表所示：压缩后的码字组成：比特0-3表矢量化值，比特4-6表示段值，压缩后的码字符号放在比特7，为了简化未写出.A 律的扩展可定义为：)1)ln(11()ln()sgn())ln(110()]ln(1[)sgn()()]ln(1[1≤≤++=+≤≤+=+-y A A A A e y A y A A y y y F A y从1 0 0 a b c d 0 0 0 1 a b c d 1 0 0 0 1 0 1 a b c d 0 0 1 a b c d 1 0 0 0 0 1 1 0 a b c d 0 1 a b c d 1 0 0 0 0 0 1 1 1 a b c d 1 a b c d 1 0 0 0 0 0 0II. 原理概述G ．711的两个标准的压缩扩展特性曲线称为A 律和μ律，是CCITT 提出的G.711协议PCM 编码方式的一部分。

语音信号压缩μ率

1语音信号压缩（μ律）原理1.1语音信号编码概念：语音编码一般分为两类：一类是波形编码，一类是被称为“声码器技术”的编码。

PCM编码即脉冲编码调制。

波形编码的最简单形式就是脉冲编码调制（Pulse code modulation），这种方式将语音变换成与其幅度成正比的二进制序列，而二进制数值往往采用脉冲表示，并用脉冲对采样幅度进行编码，所以叫做脉冲编码调制。

脉冲编码调制没有考虑语音的性质，所以信号没有得到压缩。

量化：脉冲编码调制用同等的量化级数进行量化，即采用均匀量化，而均匀量化是基本的量化方式。

但是均匀量化有缺点，在信号动态范围较大而方差较小的时候，其信噪比会下降。

国际上有两种非均匀量化的方法：A律和μ律，μ律是最常用的一种。

在美国，7位μ律是长途电话质量的标准。

而我国采用的是A律压缩，而且有标准的A律PCM 编码芯片。

DPCM&ADPCM ：降低传输比特率的方法之一是减少编码的信息量，这要消除语音信号中的冗余度。

相邻的语音样本之间存在明显的相关性，因此对相邻样本间的差信号进行编码，便可使信息量得到压缩。

因为差分信号比原语音信号的动态范围和平均能量都小。

这种编码叫Differential PCM,简称DPCM，即差分脉冲编码调制。

ADPCM即自适应差分脉冲编码调制，是包括短时预测的编码系统。

CCITT（国际电报电话咨询委员会）在1984年提出的32 kbit/s的编码器建议就是采用ADPCM作为长途传输中的国际通用语音编码方案。

这种ADPCM编码方案达到64 kbit/s PCM的语音传输质量，并具有很好的抗误码性能。

1.2压缩算法及压缩技术介绍1. 压缩算法的介绍用途抽样频率(kHz) 压缩标准或系统压缩技术码率(kbit/s)长途电话8 G.711G.726G.728PCMADPCMLD-CELP6440/32/24/1616移动电话8 GSMIS54/IS95G.729RPE/LTPVSELP/QSELPCS-ACELP13.216/8/4/2/18ISDN,会议电视1 G.722 SB-ADPCM 64/56/48 VCD 32/48 ISO/IEC10149 MPEG1 192/128/96表1 .1压缩算法表2. 压缩技术的介绍波形编码：直接对语音时域或频域波形样值进行编码。

语音信号压缩μ率

1语音信号压缩（μ律）原理1.1语音信号编码概念：语音编码一般分为两类：一类是波形编码，一类是被称为“声码器技术”的编码。

PCM编码即脉冲编码调制。

脉冲编码调制没有考虑语音的性质，所以信号没有得到压缩。

量化：脉冲编码调制用同等的量化级数进行量化，即采用均匀量化，而均匀量化是基本的量化方式。

但是均匀量化有缺点，在信号动态范围较大而方差较小的时候，其信噪比会下降。

国际上有两种非均匀量化的方法：A律和μ律，μ律是最常用的一种。

在美国，7位μ律是长途电话质量的标准。

而我国采用的是A律压缩，而且有标准的A律PCM 编码芯片。

DPCM&ADPCM ：降低传输比特率的方法之一是减少编码的信息量，这要消除语音信号中的冗余度。

相邻的语音样本之间存在明显的相关性，因此对相邻样本间的差信号进行编码，便可使信息量得到压缩。

因为差分信号比原语音信号的动态范围和平均能量都小。

这种编码叫Differential PCM,简称DPCM，即差分脉冲编码调制。

ADPCM即自适应差分脉冲编码调制，是包括短时预测的编码系统。

CCITT（国际电报电话咨询委员会）在1984年提出的32 kbit/s的编码器建议就是采用ADPCM作为长途传输中的国际通用语音编码方案。

这种ADPCM编码方案达到64 kbit/s PCM的语音传输质量，并具有很好的抗误码性能。

DSP设计--语音压缩

DSP设计--语音压缩DSP课程设计实验报告语音压缩、存储与回放院（系）：设计人员：成绩：评语：指导教师签字：日期：工程设计50报告20答辩30总分目录一、设计任务书 (3)二、设计内容 (4)三、设计方案、算法原理说明 (4)四、程序设计、调试与结果分析 (9)五、设计（安装）与调试的体会 (20)六、参考文献 (23)一、设计任务书语音信号是信息的重要形式,语音信号处理有着广泛的应用领域，而语音压缩在语音信号的传输、存储等方面有非常广泛的作用，而且在通信领域中已经有较成熟的发展和广泛应用。

本设计要求采用DSP及其A/D、D/A转换器进行语音信号的压缩、存储和回放。

1、设计要求及目标（1）使用DSP实现语音压缩和解压缩的基本算法，算法类型自定，例如可以采用G.711、G.729等语音压缩算法。

（2）采用A/D转换器从MIC输入口实时采集语音信号，进行压缩后存储到DSP的片内和片外RAM存储器中，存储时间不小于10秒。

（3）存储器存满之后，使用DSP进行实时解压缩，并从SPEAKER输出口进行回放输出。

（4）使用指示灯对语音存储和回放过程进行指示。

2、要求完成的任务（1）编写C语言程序，并在CCS集成开发环境下调试通过。

（2）实现设计所要求的各项功能。

（3）按要求撰写设计报告。

3、实验目的（1）建立信号处理系统的概念，学会使用DSP处理器；（2）了解DSP处理系统的关键器件的使用方法；（3）掌握DSP课程设计的基本方法，巩固信号处理的基本理论知识；（5）掌握DSP集成开发环境的使用和调试方法；（6）掌握DSP片外资源和片上资源访问的基本方法，如存储器、定时器、McBSP、DMA、A/D和D/A转换器等。

4、设计思路语音信号的幅度（发音强度）并非均匀分布，由于小信号占的比例比大信号大很多，因此可以进行非均匀量化。

达到这一目标的基本做法是，对大信号使用大的量化间隔，而小信号则使用小的台阶。

ITU-TG.711建议的PCMA律和μ律语音压缩标准可以分别将13比特和14比特压缩为8比特，达到语音压缩的目的。

a-law 压缩算法 c

A-law压缩算法是一种用于对音频信号进行压缩和编码的算法，通常用于数字通信系统中，以减小音频信号的动态范围并减小传输带宽。

以下是A-law压缩算法的C语言实现示例：```c#include <stdio.h>#include <math.h>#define A_LAW_BIAS 0x84 // A-law的偏置值#define MAX_AUDIO_VALUE 32767.0 // 16位音频的最大值// A-law压缩函数unsigned char compressALaw(short pcmValue) {const int A_LAW_MAX = 0x7FFF; // A-law的最大值if (pcmValue == A_LAW_MAX) {return 0x7F; // 最大A-law值} else {int sign = (pcmValue >> 8) & 0x80; // 符号位if (sign != 0) {pcmValue = -pcmValue; // 取负值}// 找到最高有效位int exponent = 7;for (int i = 0x4000; (pcmValue & i) == 0 && i != 0; i >>= 1) {exponent--;}// 计算A-law编码int mantissa = (pcmValue >> ((exponent == 0) ? 4 : (exponent + 3))) &0x0F;unsigned char alawValue = static_cast<unsigned char>(exponent << 4 | mantissa);return static_cast<unsigned char>(alawValue ^ (sign ^ A_LAW_BIAS));}}int main() {short pcmSample = 12345; // 16位PCM样本值unsigned char alawSample = compressALaw(pcmSample);printf("PCM Sample: %d\n", pcmSample);printf("A-law Sample: 0x%02X\n", alawSample);return 0;}```上述C语言代码演示了如何将16位PCM样本值使用A-law压缩算法进行压缩。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

语音信号的A律（或μ律）压缩算法
一试验目的
（1）了解PCM编码的格式和原理；
（2）了解A律和μ律压缩解压的原理
（3）熟悉A律和μ律压缩解压实现方法；
二试验内容
本试验要求完成的内容是使用AD将外部语音信号采集，DSP对语音信号保存处理，经过DA将处理后的语音信号输出；DSP对语音信号的处理包括A律和μ律压缩解压、声音信号的音效处理等。

三试验原理
PCM（Pulse Code Modulation）编码即脉冲编码调制，也就是将模拟信号转换为数码，
A律和μ律压缩编码压缩码是CCITT（Consultative Committee for International Telegraph and Telephone）国际电报电话协会最早推出的G.711语音压缩解压编码的一种格式的主要内容。

其中欧洲和中国等国家采用A律压缩解压编码，美国日本等国家采用μ律压缩解压编码。

由于中国采用A律，本试验只介绍A律压缩解压。

图5.1是DSP进行数据压缩解压的简单流程，DSP将传输来的压缩后的数据进行解压成16位或者32位，然后对解压后的数据进行分析、处理；然后将处理后的数据按照要求压缩成8位的数据格式输出到相应设备，供其他设备读取。

图5.1
图5.2是DSP 将数据解压的值，DSP 将压缩的8位数据解压成16位的DSP 通用数据格式，其中高12位为解压后的数据，低4位补0。

DSP 将解压后的数据放在缓冲串口的发送寄存器中，只要运行发送指令，缓冲串口就会将数据发送出去。

对接受数据的解压缓冲串口有一样的操作。

图5．2 A 律数据解压图
DSP 内部的缓冲串口（MCBSPS ）带有硬件实现的A 律和律压缩解压，用户只需要在相应寄存器中设置就可以了。

所有与缓冲串口相关的寄存器和引脚如图5.4所示，图5.4中有13个需要设置的寄存器，分别为RSR 、XSR 、RBR 、DRR 、DXR 、SPCR 、RCR 、XCR 、SRGR 、PCR 、MCR 、RCER 、XCER 等。

在进行A 律压缩时，对于采样到的12位数据，默认其最高位为符号位，压缩时要保持最高位即符号位不变，原数据的后11位要压缩成7位。

这7位码由3位段落码和4位段内码组成。

具体的压缩变换后的数据根据后11位数据大小决定。

具体的编译码表如表5.2所示。

压缩后的数据的最高位（第7位）表示符号，量阶分别为1、1、2、4、8、16、32、64，由压缩后数据的第6位到第4位决定，第3位到第0位是段内码。

压缩后的数据有一定的失真。

有些数据不能表示出，只能取最近该数据的压缩值。

例如，数据125，压缩后的值为
发送缓冲器
图5.2 和缓冲串口相关的引脚和寄存器图
任务一：
硬件仿真：完成A律压缩子函数的编写。

任务二：
硬件仿真：完成A律解压子函数的编写。

并利用任务一的结果，实现音频信号采集压缩和解压回放。