多媒体技术 音频编码基础和标准
2.3-音频编码技术

Page 36
3.2 自动噪声抑制-ANR
自动噪声抑制-ANR (Adaptive Noise Reduction):
噪声
解决通话中由于背景噪声太大无法听清
话音的问题,含有噪声的语音信号进行 噪声抑制以提高主观语音质量。
已被抑制
Page 37
3.2 自动电平控制-ALC
Page 19
第2章 常用语音编码比较和应用
2.1 常用语音编码算法 2.2 视频会议常用音频技术
Page 20
2.2 视频会议中音频技术
2006 1992 1988 1972 G.722
音质较好 延迟较长
AAC-LD
高保真CD音质 低延时编码
G.728
低延时编码 音质较差
低复杂度编码
G.711
舒适噪音生成CNG (Comfort Noise Generation):与VAD配合使用,设置播放舒 适噪音。
怎么这么静?是不是挂 断了?
舒适噪音:CNG
静音检测:VAD
用户 A
用户 B:停顿期间
Page 33
3.2 回声消除-EC (回声形成)
回声表示说话者的声音,经过网络设备后,环回到了自己。
输出码率:24/32/48Kbps
采样频率:32KHZ 优点:低运算,低带宽,高保真质量 缺点:牺牲高频信息,Polycom授权,极少数产商使用 应用领域:CD级高保真语音质量
Page 25
2.2 G.728
G.728是1992年由国际电信联盟(ITU-T)建议的一个压缩原则16 kbps 的压缩标准,并
Page 15
音频压缩编码原理及标准.

声音压缩编码的声学原理
声音信号的频率范围? 20Hz-20KHz
声音频谱的特点: 高频段快速下降,高幅值大部分集中在中频段,有的延 伸到低频段
电平分布特点: 声音信号的电平存在冗余
声音压缩编码的声学原理
掩蔽效应
一个较弱的声音(被掩蔽音)的听觉感受被 另一个较强的声音(掩蔽音)影响
掩蔽量
时频变化的方法:离散余弦变换DCT 、改进的离 散余弦变换MDCT
离散余弦变换(DCT)
时频变换(DFT)
逆变换
变换时将PCM样值分为N长的一块块进行变换 块长:一块中包含的样本数N 窗长:N ×(1/Fs) 频率分辨率:Fs/N 频率轴上的所能得到的最小频率间隔 块越长,变化编码的频率分辨率越高,但损失了时域分辨率
MPEG-1 层1原理方框图
MPEG-1 层1 1、子带分析滤波器组
将宽频带信号分割成32个子带信号 子带为等宽的均匀划分
2、标定
将每个子带中12个采样值归并成一个块 找出12个采样值中绝对值最大的样本值 根据其值的大小确定比例因子(查表得到,大于该绝对值 的一系列值中的最小值定为比例因子) 将12个采样值用比例因子归一化(标定)
可预先定义压缩后的数码率
编码后的数据流支持循环冗余校验 支持数据流中载带附加信息
MPEG-1 音频压缩编码的基本原理
MPEG-1音频压缩的基础是量化
MPEG-1使用感知音频编码来达到压缩音频数据又尽可能 保证音质的目的。
感知音频编码的理论依据是听觉系统的掩蔽特性。基本 思想是在编码过程中,保留有用的信息而丢掉被掩蔽的 信号。
MPEG-1 层2
、
SCPSI 比例因子选择信息
为了降低传送比例因子的码率,信号平稳变化时,只传 送其中1个或2个较大的比例因子;对于瞬态变化的信号 ,3个比例因子都传递。 00 传送所有的3个比例因子 01 传送第1和第3个比例因子 10 传送一个比例因子 11 传送第1和第2个比例因子
多媒体信息处理技术音频处理技术

1、媒体和多媒体媒体(Media)是人与人之间实现信息交流的中介,简单地说,就是信息的载体,也称为媒介。
多媒体就是多重媒体的意思,可以理解为直接作用于人感官的文字、图形、图像、动画、声音和视频等各种媒体的统称,即多种信息载体的表现形式和传递方式。
其实在传播学中,使用媒价来表示传递信息的手段、方式或载体,用媒体来表示传播活动的组织、机构或人员,但人们在计算机中已经约定俗成的使用多媒体来表示信息的手段、方式或载体,比如视频,音频等。
2、多媒体的特点:(1)集成性能够对信息进行多通道统一获取、存储、组织与合成。
(2)控制性多媒体技术是以计算机为中心,综合处理和控制多媒体信息,并按人的要求以多种媒体形式表现出来,同时作用于人的多种感官。
(3)交互性交互性是多媒体应用有别于传统信息交流媒体的主要特点之一。
传统信息交流媒体只能单向地、被动地传播信息,而多媒体技术则可以实现人对信息的主动选择和控制。
(4)非线性多媒体技术的非线性特点将改变人们传统循序性的读写模式。
以往人们读写方式大都采用章、节、页的框架,循序渐进地获取知识,而多媒体技术将借助超文本链接(Hyper Text Link)或其他方法,把内容以一种更灵活、更具变化的方式呈现给读者。
(5)实时性当用户给出操作命令时,相应的多媒体信息都能够得到实时控制。
(6)信息使用的方便性用户可以按照自己的需要、兴趣、任务要求、偏爱和认知特点来使用信息,任取图、文、声等信息表现形式。
(7)信息结构的动态性“多媒体是一部永远读不完的书”,用户可以按照自己的目的和认知特征重新组织信息,增加、删除或修改节点,重新建立链。
3、多媒体系统的组成多媒体硬件系统、多媒体操作系统、媒体处理系统工具和用户应用软件。
(1)多媒体硬件系统:包括计算机硬件、声音/视频处理器、多种媒体输入/输出设备及信号转换装置、通信传输设备及接口装置等。
其中,最重要的是根据多媒体技术标准而研制生成的多媒体信息处理芯片和板卡、光盘驱动器等。
多媒体技术基础之MPEG简介(ppt 52页)

Rate Buffer
factor controller fullness
MPEG-1视频编码标准(MPEG-1 Video) MPEG-1音频编码标准(MPEG-1 Audio) MPEG-1一致性测试:详细说明如何测试比特
数据流和解码器是否满足MPEG-1前3个部分 (Part1,2和3)中所规定的要求。
MPEG-1软件模拟:一个技术报告,给出了软
件执行MPEG1前3个部分的运行结果。
2
多媒体技术基础
视频压缩编码的标准
ITU-T标准
用于ISDN视频会议的 H.261(Px64)标准 用于PSTN可视电话的 H.263标准 用于ATM/B-ISDN视频会议的 H.262标准
ISO/IEC 国际标准
用于VCD的ISO 11172(MPEG-1 video)标准 用于数字电视和DVD的ISO/IEC 13818(MPEG-2 video) 标准 用于交互式多媒体应用的视听编码标准 MPEG-4
企业(公司)标准: AVI, QuickTime, RealVideo
计算机科学系
3
多媒体技术基础
视频压缩编码的国际标准
ITU-T
H.261
H.263 H.263+ H.263++
Joint ITU-T/MPEG
H.262/MPEG-2
H.26L
MPEG
MPEG-1 MPEG-4
84 86 88 90 92 94 96 98 00 02标准
MPEG标准文件的创建过程分成4个阶段
(1) 工作文件(Working Draft,WD):工作组 (Working Group,WG)准备的工作文件 (2) 委员会草案(Committee Draft,CD):从工 作组WG准备好的工作文件WD提升上来的文件。 这是ISO文档的最初形式,它由ISO内部正式调查 研究和投票表决。
常见的音频编码标准

常见的音频编码标准在自然界中人类能够听到的所有声音都称之为音频,它可能包括噪音、声音被录制下来以后,无论是说话声、歌声、乐器都可以通过数字音乐软件处理。
把它制作成CD,这时候所有的声音没有改变,因为CD本来就是音频文件的一种类型。
而音频只是储存在计算机里的声音。
演讲和音乐,如果有计算机加上相应的音频卡,我们可以把所有的声音录制下来,声音的声学特性,音的高低都可以用计算机硬盘文件的方式储存下来。
反过来,我们也可以把储存下来的音频文件通过一定的音频程序播放,还原以前录下的声音。
自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。
PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
然而,3G网络带来了移动多媒体业务的蓬勃发展,视频、音频编解码标准是多媒体应用的基础性标准,但其种类较多,有繁花渐欲迷人眼之感。
那么常见的编码技术就是我们必须知道的,下面我们介绍一下最常见的编码技术。
1.PCMPCM 脉冲编码调制是Pulse Code Modulation的缩写。
PCM编码的最大的优点就是音质好,最大的缺点就是体积大。
我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
2.W A VWA V是Microsoft Windows本身提供的音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。
实际上是Apple电脑的AIFF格式的克隆。
通常我们使用W A V格式都是用来保存一些没有压缩的音频,但实际上W A V格式的设计是非常灵活(非常复杂)的,该格式本身与任何媒体数据都不冲突,换句话说,只要有软件支持,你甚至可以在W A V格式里面存放图像。
之所以能这样,是因为W A V文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据。
在WINDOWS 平台上通过ACM(Audio Compression Manager)结构及相应的驱动程序(通常称为CODEC,编码/解码器),可以在W A V文件中存放超过20种的压缩格式,比如ADPCM、GSM、CCITT G.711、G.723等等,当然也包括MP3格式。
多媒体技术视频与编码标准

多媒体技术视频与编码标准多媒体技术是指以数字技术作为基础,通过图像、声音、视频等多种媒体形式的集成展示方式。
而编码标准则是为了在传输和存储过程中将多媒体数据进行压缩和解压缩的一种方法。
多媒体技术在现代社会中的应用非常广泛,从电视广播、电影制作到在线视频、游戏、虚拟现实等领域,都离不开多媒体技术的支持。
而编码标准则起到了优化多媒体数据传输和存储的作用,使得多媒体内容能够以更高效、更稳定的方式呈现给用户。
目前,常用的视频编码标准包括MPEG-2、H.264/AVC和HEVC(H.265)。
MPEG-2是最早的数字视频编码标准之一,广泛应用于DVD和数字电视广播。
H.264/AVC是当前最主流的视频编码标准,被广泛应用于在线视频平台和高清电视广播。
而HEVC是最新的视频编码标准,相较于H.264/AVC,具有更好的压缩性能,能够提供更高质量的视频内容。
在多媒体技术中,音频编码标准也是不可或缺的一部分。
常见的音频编码标准包括MP3、AAC和Opus。
MP3是最早流行起来的音频编码标准,它能够在较小的文件大小下保持相对较高的音质。
AAC是一种高级音频编码标准,通常用于音乐和音频流媒体传输。
而Opus是一种适用于各种应用领域的新一代开放式音频编码标准,具有较高的音质和较低的延迟。
在多媒体技术中,还有许多其他编码标准被应用于图像、文字和其他类型的多媒体数据。
例如,JPEG是一种常用的图像编码标准,用于压缩静态图像。
MP4、AVI等是常用的多媒体容器格式,可以包含视频、音频和文本等不同类型的多媒体数据。
总结来说,多媒体技术与编码标准密不可分。
多媒体技术通过利用编码标准对多媒体数据进行压缩和解压缩,实现了高效的传输和存储。
随着技术的不断进步,多媒体技术和编码标准也在不断发展,为用户提供更好的观看和体验体验。
多媒体技术的发展已经成为现代社会不可或缺的一部分。
从电影到电视广播,从网络直播到游戏,多媒体技术为人们提供了丰富多样的视听娱乐体验。
多媒体技术及应用数字音频技术02

4. WMA文件
WMA(Windows Media Audio)是 Windows Media格式中的一个子集(音频 格式)。
特点:压缩到MP3一半
多媒体技术及应用数字音频技术02
2-11
2.1 数字音频基础
5. MIDI和RMI文件 MIDI(乐器数字接口)是由一组音乐、乐 谱或乐器符号的数字集合。 特点:播放效果与硬件相关,数据量很小, 音质不高、音色单调等 6.VOC文件 创新公司开发的声音文件格式,由文件头 块和音频数据块组成。
音乐是符号化的声音。
多媒体技术及应用数字音频技术02
2.1 数字音频基础
二、声音的数字化 1.声音信号的类型 模拟信号(自然界、物理) 数字信号(计算机) 2.声音数字化过程
模拟信号
采样
量化
编码
数字信号
模拟信号
A/D ADC D/A DAC
数字信号
多媒体技术及应用数字音频技术02
2.1 数字音频基础
霍夫曼编码、算术编码、行程编码 ②有损压缩
波形编码--PCM、DPCM、ADPCM 子带编码、矢量量化
参数编码--LPC 混合编码--MPLPC、CELP
多媒体技术及应用数字音频技术02
2.2 数字音频压缩标准
二、音频压缩技术标准
分类
电话语 音质量
调幅广 播质量 高保真 立体声
标准 G.711 G.721 G.723 G.728
多媒体技术及应用数字 音频技术02
2020/11/14
多媒体技术及应用数字音频技术02
第二章 数字音频技术
2.1 数字音频基础 2.2 数字音频压缩标准 2.3 声卡与电声设备 2.4 MIDI与音乐合成 2.5 音频编辑软件 2.6 语音识别技术 本章小结
多媒体技术数字音频基础PPT课件

– 音色 由声音的波形或它的频谱结构决定,它是个 复杂感觉,无法定量表示
6
信号的获取
话 筒 放 大
滤 波
采 样 保 持 A /D
接 口 微 机
采 样 脉 冲
• 获取法:利用声音获取硬件得到声源发生的声 音
• 合成法:通过一种专门定义的语音去驱动一台
预制的语音或音乐合成器。
• 多媒体计算机中三类声音:
①语音②音乐③效果声(sound effects)如刮风、下雨
等
7
音频信号的处理
A/D转换后进行数据压缩
存储或传输
硬件(DSP)
采样与混叠
思考题:设音频信号的高频截至频率为7KHz, 抽样频率为6KHz,
问:0.5KHz信号中混有哪些频率的信号?
0 1 2 3 4 5 6 7 KHz 21
抽样与混叠
思考题:设音频信号的高频截至频率为7KHz, 抽样频率为6KHz,
问:0.5KHz信号中混有哪些频率的信号?
0 1 2 3 4 5 6 7 KHz 22
称之为抽样。该时间间隔称为抽样周期(其倒数
称为采样频率)。
13
音频数字化
14
2.1 数字音频基础
1、数字化音频的获取与处理基本概念 2、模拟音频与数字音频的区别 3、数字音频采样和量化的基本原理 4、数字音频的文件格式 5、音频信号的特点。
采样
采样——将连续的声波信号x(t)按一定的 时间间隔(T)取值,得到离散的信号序 列x(nT)
T——采样周期 1/T——采样频率 x(nT)——离散信号序列
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、G.728编码标准
G.728建议的技术基础是美国AT&T公 司贝尔实验室提出的LD-CELP(低延时-码 激励线性预测)算法。该算法考虑了听觉 特性,其特点是:
✓以块为单位的后向自适应高阶预测; ✓后向自适应型增益量化; ✓以适应为单位的激励信号量化。
20
5、MPEG中的音频编码
MEPG中的MPEG I标准中规定了音频编 码标准,包括高质量音频编码方法,存储 表示和解码方法。编码器的输入和解码器 的输出与现存的.1声道为环绕声系统由五个全频域声 道加一个超低音声道组成,其中五个声道 包括前置的“左声道” (L) 、“中置声道” (C)、“右声道”(R)、后置的“ 左环 绕声道”(LS)和“右环绕声道”(RS), 第六个声道也就是超低音声道包含了一些 额外的低音信息,使得一些场景如爆炸、 撞击声等的效果更好。
4
音频编码基础
从信息保持的角度讲,只有当信源本身具有冗 余度,才能对其进行压缩。根据统计分析结果,语 音信号存在着多种冗余度,其最主要部分可以分 别从时域和频域来考虑。另外由于语音主要是给 人听的,所以考虑了人的听觉机理,也能对语音 信号实行压缩。
1、时域信息的冗余度 2、频域信息的冗余度 3、人的听觉感知机理
22
(2)编码层次
根据应用需求,可以使用不同层次的编码 系统:
✓ 层Ⅰ包括将数字音频变成32个子带的基本映射。将数 据格式化成块的固定分段。决定自适应位分配的心理 声学模型。利用块压扩和格式化的量化器。理论上, 层Ⅰ编码/解码的最少延时约为19ms。
✓ 层Ⅱ 提供了位分配,缩放因子和抽样的附加编码。使 用不同的帧格式。这层理论上的最小编码/解码延时 约为35ms。
24
(4)解码
解码器按编码器定义的语法接收压缩的音频 数据流、按解码部分的方法解出数据元素,产生 数字音频输出。其过程如下:
✓ 数据流输入到解码器 ✓ 帧扩展进行数据流拆封,恢复出各种信息 ✓ 重构单元将重构一组映射抽样的量化方案 ✓ 逆映射单元把这些抽样变换回均匀PCM
已编码 数据流
帧扩展
重构
逆映射
14
1、G.711—话音的PCM编码
本建议公布于1972年,它给出话音信号 编码的推荐特性。话音的抽样率为8KHz。 每个样值采用8位二进制编码。推荐使用A 律和μ律量化。分别给出A律和μ律的定义: 将13位PCM码按A律、14位PCM码按μ律转 换8位编码。
15
2、G.721---32kb/s的ADPCM
脉冲编码调制(PCM) 自适应脉冲编码调制(APCM) 差值脉冲编码调制(DPCM) 自适应差值脉冲编码调制(ADPCM)
参数编码:
预测方式:前向/后向, 短时/长时 参数类型:LPC, LSP, CEP 激励方法: 编码策略:合成-分析法
感知编码---MPEG,AC-3
12
2.3.2 音频编码标准
行统计的所谓短时自相关。如果在较长的时问间 隔(如几十秒)进行统计,便得到长时自相关函数。
8
2、频域信息的冗余度
非均匀的长时功率谱密度 在相当长的时间间隔内进行统计平均,可得到长 时功率谱密度函数.其功率谱呈现强烈的非平坦 性。从统计的观点看,这意味着没有充分利用结 定的频段,有固有的冗余度
语音特有的短时功率谱密度 语音信号的短时功率谱,在某些频率上出现峰值, 这些峰值频率不只一个,但最主要的是第一和第 二个,由它们决定不同的语音特征。
5
1、时域信息的冗余度
幅度的非均匀分布 一般语音中小幅度样本比大幅度样本出现的
概率要高,并且通话中必然会有间隙,更会出现 大量低电平样本。因此.语音信号取样值的幅度 分布是非均匀的,可以采用非均匀量化对其编码。
样本间的相关 对语音波形的分析表明,取样数据的最大相
关性存在于邻近样本之间,并且取样速率越高, 样本间相关性越强。根据相关性,可利用N阶差 分编码技术,进行有效的数据压缩。
40 K 960k
3
压缩编码的必要性
数据压缩造成音频质量的下降、计算量的增 加。人们在实施数据压缩时,要在音频质量、数 据量、计算复杂度三方面进行综合考虑。
各领域的专家致力于算法的研究,众多的企 业致力于芯片和产品的研制,国际标准化组织也 先后推出一系列建议。
高质量高效率的音频压缩技术广泛地用于多 媒体应用、音像制品、数字广播、数字电视等领 域。
28
AC-3可编程解码器
29
这个建议是1984年公布。1986年作了 进一步修订。它用于64kb/s的A律或μ律 PCM到32kb/s ADPCM之间的转换,实现了 对PCM信道的扩容。
16
编码器的输入信号是64kb/s A律或μ律PCM编码。首 先将其转换为标准PCM编码。从中减去估计值Se(k),得 到差值信号d(k)。15阶自适应量化器将d(k)量化成4位二 进制值I(k)。逆量化器从这4位二进制数中产生量化的差 值信号dq(k)。dq(k)和估计信号Se(k)相加得到重构信号 Sr(k)。自适应预测器利用dq(k)和Sr(k)生成输入信号的 估计值。
自适应 逆 32bit/s 量化器
+
输入
转换为 PCM
自适应 预测器
(b) ADPCM 解码器
同步编码 调节
64bit/s A 律或 U 律输出
18
3、G.722- 64kb/s SB-ADPCM
G.722建议的带宽音频压缩仍采用波形 编码技术,因为要保证既能适用于话音, 又能用于其他方式的音频,只能考虑波形 编码。G.722编码采用了高低两个子带内的 ADPCM方案,高低子带的划分以4KHz为 界。然后再对每个子带内采用类似G.721建 议的ADPCM编码,因此G.722建议的技术 方案可以简写为SB-ADPCM(子带-自适应 差分脉冲码调制)。
26
AC-3的工作原理
杜比AC-3是种感知型编码方式,它利 用心理声学原理:较强的声音信号可以掩 蔽临近频段中较弱的信号。换言之,如果 在某一频段中出现了一个较强的信号,那 么该频段中所有低于某一门槛值的信号都 将被强信号掩蔽掉,成为人耳不可闻的信 号。滤除这缜弱信号将不会对音质产生不 良影响,而且能减少编码后的数据量,所 以可以把它们作为噪声信号来对待。
PCM 音频抽样
辅助数据
25
6、DOLBY AC-3
AC-3音频编码标准的起源是DOLBY (杜比)AC-1。AC-1应用的编码技术是自 适应增量调制技术,它把20kHz的宽带立体 声音频信号编码成512kb/s的数据流。AC-2 采用类似MDCT的重叠窗口的FFT编码技术, 其数据率在256kb/s以下。AC-2被应用在 PC声卡和综合业务数字网等方面
2.3 音频编码基础和标准
2.3.1 音频编码基础 2.3.2 音频编码标准
2.3.1 音频编码基础
一、压缩编码的必要性 二、音频编码基础 三、音频编码的分类
压缩编码的必要性
多媒体音频数据的存储和传输中,必须 压缩数据。利用音频编码压缩数据。
采样数据率(每秒比特数):
信号类型
频率范围
电话话音
( HZ) 200 ~ 3400
9
3、人的听觉感知机理
人的听觉具有掩蔽效应 当两个响度不同的声音作用于人耳时,响度
较高的频率成分会影响对响度较低频率成分的感 受。 人耳对不同频段的声音敏感度不同
低频成分容易掩蔽高频成分。即使是对同样声 压级的声音,人耳的实际感觉到的音量也是随频 率而变化。 人耳对语音信号的相位变化不敏感
入耳听不到或感知极不灵敏的声音分量都不 妨视为冗余的。
1972年:G.711--- 64kb/s PCM编码标准。 1984年:G.721---32kb/s 自适应差值脉冲编码(ADPCM)
G.722--- 64kb/s 子带ADPCM编码标准 G.723.1--- 5.3kb/s和6.3kb/s LSF G.726 ---16kb/s 1990年:G.727---16-40kb/s 镶嵌式ADPCM标准。 1992年:G.728 /G.729---16kb/s LD-CELP 1988年:RPE-LTP---13kb/s长时预测规则码激励(欧洲)GSM 1989年:VSELP---6.7kb/s 矢量和激励线性预测(日本)
7
1、时域信息的冗余度(续)
静音系数 两人间打电话,平均每人的讲话时间为通话总时 间的一半,另一半时间听对方讲。听的时候—般 不讲活,而即使是在讲话的时候,也会出现停顿。 声音间隔本身就是一种冗余,若能正确检测出该 静比段,便可“插空”传输更多的信息。
长时自相关函数 上述周期间等相关性,都是在20 ms间隔内进
当前编码技术发展的一个重要的方向就 是综合现有的编码技术,制定全球的统一 标准,使信息管理系统具有普遍的互操作 性并确保了未来的兼容性。国际上,对于 语音信号压缩编码的审议在CCITT下设的第 十五研究组进行,相应的建议为G系列,多 由ITU发表。
13
CCITT和ISO先后提出一系列有关音频编码的建议, 推荐的标准:
高质量音频
20 ~ 20K
采样率 ( KH Z)
8
44.1
量化精度 (位) 8 16
数据率 (位 /秒)
64k 705.6k
压缩编码数据率:
信号类型
数据率
(位 /秒)
IP 电话话音
64k
高质量音频
705.6k
压缩编码 标准 G.723 44.1
数据率 (位 /秒 )
5.3k 128k
数据率 (字节 /分钟 )
6
1、时域信息的冗余度(续)
周期之间的相关 虽然语音信号需要一个电话通路提供整个200~
3400HZ的带宽,但在特定的瞬间,某声音只有少数 频率成分在作用,它们在周期域周期间,存在着一 定的相关性。
基音之间的相关 人说话声音分为浊音和清音,浊音不仅有周期间