语音信号的A率(或u率)压缩算法

合集下载

g711编码原理

g711编码原理

g711编码原理
G.711编码原理
G.711编码是一种常用的音频编码标准,用于将模拟语音信号转换为数字信号,以提高通信效率和节省带宽。

本文将介绍G.711编码的基本原理.
G.711编码使用了基于时域的脉冲编码调制(PCM)技术,将模拟语音信号进
行采样和量化,然后将其转换为数字信号以进行传输. G.711编码标准主要包括两
种压缩算法:μ律编码(μ-law)和A律编码(A-law).
μ律编码是在北美和日本广泛使用的一种算法,而A律编码则是在欧洲和国际
上使用的一种算法. 这两种编码算法在原理上相似,都是将模拟信号映射到更小的
动态范围内以减小信号的位数.
在μ律编码中,信号的动态范围被分为255个离散级别. 较大幅度的信号将被
映射为较小的幅度,而较小幅度的信号将被映射为较大的幅度. 这种非线性映射允
许更高的精度分配给较小幅度的信号.
在A律编码中,信号的动态范围被分为一个更精细的离散级别,共有87个级别. 类似于μ律编码,A律编码也将较大幅度的信号映射为较小的幅度,反之亦然.
G.711编码使用8位字节表示每个采样样本,通过这种方式将带宽减小到64 kbps. 这使得G.711编码在语音传输和存储中具有广泛的应用.
总结一下,G.711编码是一种常用的音频编码标准,它通过采样、量化和非线
性映射的过程,将模拟语音信号转换为数字信号以实现高效传输. 在实际的应用中,人们可以根据地区使用的标准选择μ律编码或A律编码算法来进行编码过程。

语音的压缩编码

语音的压缩编码
应用于声音的传输(通信):
长途电话 (8 KHz x 8 bit x 1), 时分多路复用TDM (time-division multiplexing)
应用于全频带数字声音的表示/存储:
CD-DA(CD唱片),DAT (44.1 KHz x 16 bit x 2)
原理: 声音信号具有很强的相关性,可从已知信号来预测未知信号, 即使用前面的样本预测当前的样本,实际样本值与预测值之间的误差往往很小。 利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值, 效果:量化位数可以显著减少,从而降低了总的码率。
+
预测值
差值
重建信号
DPCM
编码输出
CCITT G.721 ADPCM编码器
A
量化阶适配器
自适应
( 4 位 )
6阶自适应线性预测, 4位的自适应量化器, 输出码率: 8k x 4 = 32 kbps
ADPCM 小结
PCM话音质量 4.5级 ADPCM话音质量 4.34级,码率降低一倍(32 kbps)。 ADPCM应用: 数字语音通信 多媒体应用中的语音(解说词)
ADPCM自适应差分脉冲编码调制 (Adaptive Differential PCM)
增量调制(DM)
差分脉冲编码调制 DPCM
实际样本值
利用样本与样本之间存在的相关性进行编码,即根据前面的样本估算当前样本的大小,然后对预测误差进行量化编码。
差值
线性预测公式: Xn = A1*Xn-1 + A2*Xn-2 + ... + Am*Xn-m
举例
根据输入样本幅度的大小来改变量化阶大小。 可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。

话音编码

话音编码

x 为输入信号,规格化为-1<= x <=1 为输入信号,规格化为- 为确定压缩量的参数, µ 为确定压缩量的参数,它反映最大量化间隔和最 小量化间隔之比, 500。 小量化间隔之比,取100 <= µ <= 500。
由于输入和输出关系是对数关系,所以这种编码又称为对数 由于输入和输出关系是对数关系,所以这种编码又称为对数PCM。 。
8
话音产生的数字模型
周期
周期脉冲序 列发生器
声道参数
浊/清选择 清选择
时变数字滤 波器 语音 输出
伪随机噪声 产生器
音量控制
9
话音技术的研究热点
话音压缩编码( Coding) 话音压缩编码(Speech Coding) 话音识别( 话音识别(Speech Recognition) Recognition) 文本话音转换( 文本话音转换(Text To Speech) Speech)
13
话音编译码器的分类
波形编译码器( 波形编译码器(waveform coder):不利用生 coder): ):不利用生 成话音的信号的任何知识, 成话音的信号的任何知识,将话音视为一种普 通的声音,直接对波形信号进行采样和量化。 通的声音,直接对波形信号进行采样和量化。 例如PCM、DPCM、ADPCM等 例如PCM、DPCM、ADPCM等。 音源编译码器( 音源编译码器(Source coder):也叫参数编 coder): ):也叫参数编 译码器、声码器(vocoder)。 )。它从话音波形信 译码器、声码器(vocoder)。它从话音波形信 号中提取话音生成模型的参数, 号中提取话音生成模型的参数,使用这些参数 通过话音生成模型重构出话音。 通过话音生成模型重构出话音。 混合编译码器( coder): ):综合使用上 混合编译码器(Hybrid coder):综合使用上 述两种技术。 述两种技术。使用的激励信号波形尽可能接近 于原始话音信号的波形。例如CELP CELP。 于原始话音信号的波形。例如CELP。

A率算法

A率算法

3、语音的A 律压缩与解压统计表明对于每一个讲话者来说,语音中小幅度成分出现的概率要比大幅度多得多,为了在语音信号的整个动态范围内都可以接受低电平信号,量化电平必须照顾到语音的低电平信号,极低电平的量化间隔要小,高电平的量化间隔要大。

压缩扩展技术能过借用3种方法实现: (1)模拟信号在到达ADC 前,即进行8比特量化前,首先通过一个非线性电路; (2)使用一个8比特ADC ,其内部量化电平取非均等间隔;(3)使用线性12比特ADC 然后借助于数字查表(12笔特输入,8比特输出)。

这三种方法都需要有非线性性功能,差别仅是非线性放在什么地方。

两个标准的压缩扩展特性曲线称为u 律和A 律,使CCITT 提出的G.711协议PCM 编码方式的一部分。

北美和日本使用u 律,欧洲使用A 律,两个算法使用了非线性,把量化间隔变换成人耳能检测的线性空间。

A 律限制采样值为12比特,A 律的压缩可以按照下列公式进行定义:)1||1(ln 1||ln 1)sgn()1||0(ln 1||)sgn()(≤≤++=≤≤+=x AA x A x A x A x A x x F式中,A 是压缩参数(在欧洲,A=87.6)x 是需要压缩的归一化整数。

从线性到A 律的压缩转换如下表所示:压缩后的码字组成:比特0-3表矢量化值,比特4-6表示段值,压缩后的码字符号放在比特7,为了简化未写出.A 律的扩展可定义为:)1)ln(11()ln()sgn())ln(110()]ln(1[)sgn()()]ln(1[1≤≤++=+≤≤+=+-y A A A A e y A y A A y y y F A y从1 0 0 a b c d 0 0 0 1 a b c d 1 0 0 0 1 0 1 a b c d 0 0 1 a b c d 1 0 0 0 0 1 1 0 a b c d 0 1 a b c d 1 0 0 0 0 0 1 1 1 a b c d 1 a b c d 1 0 0 0 0 0 0II. 原理概述G .711的两个标准的压缩扩展特性曲线称为A 律和μ律,是CCITT 提出的G.711协议PCM 编码方式的一部分。

语音信号压缩μ率

语音信号压缩μ率

1语音信号压缩(μ律)原理1.1语音信号编码概念:语音编码一般分为两类:一类是波形编码,一类是被称为“声码器技术”的编码。

PCM编码即脉冲编码调制。

波形编码的最简单形式就是脉冲编码调制(Pulse code modulation),这种方式将语音变换成与其幅度成正比的二进制序列,而二进制数值往往采用脉冲表示,并用脉冲对采样幅度进行编码,所以叫做脉冲编码调制。

脉冲编码调制没有考虑语音的性质,所以信号没有得到压缩。

量化:脉冲编码调制用同等的量化级数进行量化,即采用均匀量化,而均匀量化是基本的量化方式。

但是均匀量化有缺点,在信号动态范围较大而方差较小的时候,其信噪比会下降。

国际上有两种非均匀量化的方法:A律和μ律,μ律是最常用的一种。

在美国,7位μ律是长途电话质量的标准。

而我国采用的是A律压缩,而且有标准的A律PCM 编码芯片。

DPCM&ADPCM :降低传输比特率的方法之一是减少编码的信息量,这要消除语音信号中的冗余度。

相邻的语音样本之间存在明显的相关性,因此对相邻样本间的差信号进行编码,便可使信息量得到压缩。

因为差分信号比原语音信号的动态范围和平均能量都小。

这种编码叫Differential PCM,简称DPCM,即差分脉冲编码调制。

ADPCM即自适应差分脉冲编码调制,是包括短时预测的编码系统。

CCITT(国际电报电话咨询委员会)在1984年提出的32 kbit/s的编码器建议就是采用ADPCM作为长途传输中的国际通用语音编码方案。

这种ADPCM编码方案达到64 kbit/s PCM的语音传输质量,并具有很好的抗误码性能。

1.2压缩算法及压缩技术介绍1. 压缩算法的介绍用途抽样频率(kHz) 压缩标准或系统压缩技术码率(kbit/s)长途电话8 G.711G.726G.728PCMADPCMLD-CELP6440/32/24/1616移动电话8 GSMIS54/IS95G.729RPE/LTPVSELP/QSELPCS-ACELP13.216/8/4/2/18ISDN,会议电视1 G.722 SB-ADPCM 64/56/48 VCD 32/48 ISO/IEC10149 MPEG1 192/128/96表1 .1压缩算法表2. 压缩技术的介绍波形编码:直接对语音时域或频域波形样值进行编码。

语音信号压缩μ率

语音信号压缩μ率

1语音信号压缩(μ律)原理1.1语音信号编码概念:语音编码一般分为两类:一类是波形编码,一类是被称为“声码器技术”的编码。

PCM编码即脉冲编码调制。

波形编码的最简单形式就是脉冲编码调制(Pulse code modulation),这种方式将语音变换成与其幅度成正比的二进制序列,而二进制数值往往采用脉冲表示,并用脉冲对采样幅度进行编码,所以叫做脉冲编码调制。

脉冲编码调制没有考虑语音的性质,所以信号没有得到压缩。

量化:脉冲编码调制用同等的量化级数进行量化,即采用均匀量化,而均匀量化是基本的量化方式。

但是均匀量化有缺点,在信号动态范围较大而方差较小的时候,其信噪比会下降。

国际上有两种非均匀量化的方法:A律和μ律,μ律是最常用的一种。

在美国,7位μ律是长途电话质量的标准。

而我国采用的是A律压缩,而且有标准的A律PCM 编码芯片。

DPCM&ADPCM :降低传输比特率的方法之一是减少编码的信息量,这要消除语音信号中的冗余度。

相邻的语音样本之间存在明显的相关性,因此对相邻样本间的差信号进行编码,便可使信息量得到压缩。

因为差分信号比原语音信号的动态范围和平均能量都小。

这种编码叫Differential PCM,简称DPCM,即差分脉冲编码调制。

ADPCM即自适应差分脉冲编码调制,是包括短时预测的编码系统。

CCITT(国际电报电话咨询委员会)在1984年提出的32 kbit/s的编码器建议就是采用ADPCM作为长途传输中的国际通用语音编码方案。

这种ADPCM编码方案达到64 kbit/s PCM的语音传输质量,并具有很好的抗误码性能。

1.2压缩算法及压缩技术介绍1. 压缩算法的介绍用途抽样频率(kHz) 压缩标准或系统压缩技术码率(kbit/s)长途电话8 G.711G.726G.728PCMADPCMLD-CELP6440/32/24/1616移动电话8 GSMIS54/IS95G.729RPE/LTPVSELP/QSELPCS-ACELP13.216/8/4/2/18ISDN,会议电视1 G.722 SB-ADPCM 64/56/48 VCD 32/48 ISO/IEC10149 MPEG1 192/128/96表1 .1压缩算法表2. 压缩技术的介绍波形编码:直接对语音时域或频域波形样值进行编码。

DSP设计--语音压缩

DSP设计--语音压缩

DSP设计--语音压缩DSP课程设计实验报告语音压缩、存储与回放院(系):设计人员:成绩:评语:指导教师签字:日期:工程设计50报告20答辩30总分目录一、设计任务书 (3)二、设计内容 (4)三、设计方案、算法原理说明 (4)四、程序设计、调试与结果分析 (9)五、设计(安装)与调试的体会 (20)六、参考文献 (23)一、设计任务书语音信号是信息的重要形式,语音信号处理有着广泛的应用领域,而语音压缩在语音信号的传输、存储等方面有非常广泛的作用,而且在通信领域中已经有较成熟的发展和广泛应用。

本设计要求采用DSP及其A/D、D/A转换器进行语音信号的压缩、存储和回放。

1、设计要求及目标(1)使用DSP实现语音压缩和解压缩的基本算法,算法类型自定,例如可以采用G.711、G.729等语音压缩算法。

(2)采用A/D转换器从MIC输入口实时采集语音信号,进行压缩后存储到DSP的片内和片外RAM存储器中,存储时间不小于10秒。

(3)存储器存满之后,使用DSP进行实时解压缩,并从SPEAKER输出口进行回放输出。

(4)使用指示灯对语音存储和回放过程进行指示。

2、要求完成的任务(1)编写C语言程序,并在CCS集成开发环境下调试通过。

(2)实现设计所要求的各项功能。

(3)按要求撰写设计报告。

3、实验目的(1)建立信号处理系统的概念,学会使用DSP处理器;(2)了解DSP处理系统的关键器件的使用方法;(3)掌握DSP课程设计的基本方法,巩固信号处理的基本理论知识;(5)掌握DSP集成开发环境的使用和调试方法;(6)掌握DSP片外资源和片上资源访问的基本方法,如存储器、定时器、McBSP、DMA、A/D和D/A转换器等。

4、设计思路语音信号的幅度(发音强度)并非均匀分布,由于小信号占的比例比大信号大很多,因此可以进行非均匀量化。

达到这一目标的基本做法是,对大信号使用大的量化间隔,而小信号则使用小的台阶。

ITU-TG.711建议的PCMA律和μ律语音压缩标准可以分别将13比特和14比特压缩为8比特,达到语音压缩的目的。

a-law 压缩算法 c

a-law 压缩算法 c

A-law压缩算法是一种用于对音频信号进行压缩和编码的算法,通常用于数字通信系统中,以减小音频信号的动态范围并减小传输带宽。

以下是A-law压缩算法的C语言实现示例:```c#include <stdio.h>#include <math.h>#define A_LAW_BIAS 0x84 // A-law的偏置值#define MAX_AUDIO_VALUE 32767.0 // 16位音频的最大值// A-law压缩函数unsigned char compressALaw(short pcmValue) {const int A_LAW_MAX = 0x7FFF; // A-law的最大值if (pcmValue == A_LAW_MAX) {return 0x7F; // 最大A-law值} else {int sign = (pcmValue >> 8) & 0x80; // 符号位if (sign != 0) {pcmValue = -pcmValue; // 取负值}// 找到最高有效位int exponent = 7;for (int i = 0x4000; (pcmValue & i) == 0 && i != 0; i >>= 1) {exponent--;}// 计算A-law编码int mantissa = (pcmValue >> ((exponent == 0) ? 4 : (exponent + 3))) &0x0F;unsigned char alawValue = static_cast<unsigned char>(exponent << 4 | mantissa);return static_cast<unsigned char>(alawValue ^ (sign ^ A_LAW_BIAS));}}int main() {short pcmSample = 12345; // 16位PCM样本值unsigned char alawSample = compressALaw(pcmSample);printf("PCM Sample: %d\n", pcmSample);printf("A-law Sample: 0x%02X\n", alawSample);return 0;}```上述C语言代码演示了如何将16位PCM样本值使用A-law压缩算法进行压缩。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音信号的A律(或μ律)压缩算法
一试验目的
(1)了解PCM编码的格式和原理;
(2)了解A律和μ律压缩解压的原理
(3)熟悉A律和μ律压缩解压实现方法;
二试验内容
本试验要求完成的内容是使用AD将外部语音信号采集,DSP对语音信号保存处理,经过DA将处理后的语音信号输出;DSP对语音信号的处理包括A律和μ律压缩解压、声音信号的音效处理等。

三试验原理
PCM(Pulse Code Modulation)编码即脉冲编码调制,也就是将模拟信号转换为数码,
A律和μ律压缩编码压缩码是CCITT(Consultative Committee for International Telegraph and Telephone)国际电报电话协会最早推出的G.711语音压缩解压编码的一种格式的主要内容。

其中欧洲和中国等国家采用A律压缩解压编码,美国日本等国家采用μ律压缩解压编码。

由于中国采用A律,本试验只介绍A律压缩解压。

图5.1是DSP进行数据压缩解压的简单流程,DSP将传输来的压缩后的数据进行解压成16位或者32位,然后对解压后的数据进行分析、处理;然后将处理后的数据按照要求压缩成8位的数据格式输出到相应设备,供其他设备读取。

图5.1
图5.2是DSP 将数据解压的值,DSP 将压缩的8位数据解压成16位的DSP 通用数据格式,其中高12位为解压后的数据,低4位补0。

DSP 将解压后的数据放在缓冲串口的发送寄存器中,只要运行发送指令,缓冲串口就会将数据发送出去。

对接受数据的解压缓冲串口有一样的操作。

图5.2 A 律数据解压图
DSP 内部的缓冲串口(MCBSPS )带有硬件实现的A 律和 律压缩解压,用户只需要在相应寄存器中设置就可以了。

所有与缓冲串口相关的寄存器和引脚如图5.4所示,图5.4中有13个需要设置的寄存器,分别为RSR 、XSR 、RBR 、DRR 、DXR 、SPCR 、RCR 、XCR 、SRGR 、PCR 、MCR 、RCER 、XCER 等。

在进行A 律压缩时,对于采样到的12位数据,默认其最高位为符号位,压缩时要保持最高位即符号位不变,原数据的后11位要压缩成7位。

这7位码由3位段落码和4位段内码组成。

具体的压缩变换后的数据根据后11位数据大小决定。

具体的编译码表如表5.2所示。

压缩后的数据的最高位(第7位)表示符号,量阶分别为1、1、2、4、8、16、32、64,由压缩后数据的第6位到第4位决定,第3位到第0位是段内码。

压缩后的数据有一定的失真。

有些数据不能表示出,只能取最近该数据的压缩值。

例如,数据125,压缩后的值为
发送缓冲器
图5.2 和缓冲串口相关的引脚和寄存器图
任务一:
硬件仿真:完成A律压缩子函数的编写。

任务二:
硬件仿真:完成A律解压子函数的编写。

并利用任务一的结果,实现音频信号采集压缩和解压回放。

相关文档
最新文档