第三章音频信号及数字化

合集下载

第03章_数字音频基础

第03章_数字音频基础

3.2.2 量化(Quantization)
量化是指用若干比特表示一个样本的过程;表示一个样本所使用的比特数称为量化深度 (bit depth)。常见的量化深度有 4 比特、8 比特、16 比特、32 比特等等。不难理解,量化实 际上是一个对声音样本的幅值进行离散化处理的一个过程。虽然采样已经在时间上将模拟信号 离散化了,但是样本的大小(即幅值)仍然有无限种可能的取值(所以本质上还是连续量), 而数字系统只能表示有限种状态,例如,用 8 个比特表示样本大小的话,则只能有 256 种取值。 所以,量化是一个将无限多种可能取值归结为有限多个数字值的过程。通常,系统会将一个样 本以最接近其值大小的数字表示。总之,采样是时间上的离散化,而量化则是空间上的离散化。 需要强调的是,量化深度也是影响数字音频信号质量的重要因素。4 比特只有 16 种取值, 显然,试图通过这样少数几个状态来恢复原始模拟音频信号是十分困难的。但是,量化深度越 多,数据量也会越大,传输和存储的压力自然越大。所以,也需要根据实际应用环境来采用合 适的量化深度。例如,一般的网络音频应用采用了 8 位的量化深度,CD 音频的量化深度则是 16 比特,而有些高级数字音频系统采用了 32 位的量化深度。 3.2.3 编码(Coding) 在采样、量化处理后,模拟音频数字化的第三个步骤是编码。编码实际上是以某种格式最 终生成数字音频数据流的过程,所得到的数字音频数据将会被存储、传输或者进行各种处理。 本章第 3 节将介绍几种重要的音频编码技术。 需要读者注意的是,把数字化过程分解成采样、量化、编码三个阶段实际上是一种简化描 述,各种不同的数字音频技术会有不同的采样、量化与编码机制,特别是量化与编码往往是同 步进行的,而且编码还包括后续的数据流格式化。因此,多数介绍数字音频技术的教科书或学 术著作在提到音频编码的时候,都将这三个步骤合称为编码系统或编码技术,并在编码系统的 框架下对整个模数转换过程进行整体性介绍。本教程下面的阐述也沿用了这一模式。

音频信号的数字化

音频信号的数字化

(2). 影响数字音频质量的技术参数
对模拟音频信号进行采样量化编码后,得 到数字音频。数字音频的质量取决于采样频率、 量化位数和声道数三个因素。 1). 采样频率 采样频率是指一秒钟时间内采样的次数。 在计算机多媒体音频处理中,采样频率通常采 用三种:11.025KHz(语音效果)、22.05KHz(音 乐效果)、44.1KHz(高保真效果)。常见的CD唱 盘的采样频率即为44.1KHz。
当D/A转换器从图4-2得到的数值中重构原来 信号时,得到图4-3中蓝色(直线段)线段所 示的波形。从图中可以看出,蓝色线与原 波形(红色线)相比,其波形的细节部分丢失 了很多。这意味着重构后的信号波形有较 大的失真。
• 左图为采样率2000Hz,量化等级为20的采样量化过程 • 右图为采样率4000Hz,量化等级为40的采样量化过程 • • 当采样率和量化等级提高一倍,从图中可以看出,当 用D/A转换器重构原来信号时(图中的轮廓线),信号的失真 明显减少,信号质量得到了提高。
• • • • • • • • • •

• • • • •
CD格式——天籁之音 CD音轨文件的后缀名为:cda 标准CD格式是44.1K的采样频率,速率88K/秒,16位量化位数,近似无损的。 CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。 WAV格式——无损的音乐 WAV为微软公司开发的一种声音文件格式。 标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化位 数,声音文件质量和CD相差无几! 特点:音质非常好,被大量软件所支持。 MP3格式——流行的风尚 全称Moving Picture Experts Group Audio Layer III),是当今较流行的一种 数字音频编码和有损压缩格式。 是ISO标准MPEG1和MPEG2第三层(Layer 3),采样率16-48kHz,编码速率 8K-1.5Mbps。 特点:音质好,压缩比比较高,被大量软件和硬件支持,应用广泛。 MIDI——作曲家的最爱 MIDI(Musical Instrument Digital Interface)乐器数字接口 。 MIDI数据不是数字的音频波形,而是音乐代码或称电子乐谱。 MIDI文件每存1分钟的音乐只用大约5~10KB。

数字音频基础

数字音频基础
采样 量化
编码
压缩
音频 文件
100101100011101
模拟信号的数字化过程
一、声音的数字化过程
1. 采样(Sampling) • 对振幅随时间连续变化的模拟信号波形按一定的时间间隔 取出样值,形成在时间上不连续的脉冲序列,称之为采样。 2. 量化(Quantization) • 将采样值相对于振幅进行离散的数值化的操作称为量化。 即将模拟信号的幅度,在动态范围内划分为相等间隔的若 干层次,把采样输出的信号电平按照四舍五入的原则归入 最靠近的量值。 3. 编码(Coding) • 把采样、量化所得的量值变换为二进制数码的过程称为编 码。 4. 压缩(Compress)目的是减少数据量与提高传输效率。 依据:声音信息中存在着多种冗余;听觉器官的不敏感性; 采样的标本中存在着相关性。
例2
例3
一般播音员的播音频率是4kHz,采用8bit的采用精度单声道 进行采样的时候,计算该播音员播音10分钟的数据量为:
8kHz*10*60 ≈ 4.5MB
例4
以CD音质(44.1kHz的采样频率,16位立体声形式)记录一 首5分钟的乐曲所需的存储容量为: 44 100(Hz)×(16/8)(B)×2×5×60 ≈ 51600kB
705.6
立体声
1411.2
立体声
1536
第2节 常用音频格式介绍
• WAV文件(.wav)
– WAV——Wave,波形文件 – 由Microsoft和IBM联合开发的音频文件格式 – 特点:层次丰富、还原性好、表现力强;数据量大;应用 广泛
• CD-DA文件(.cda)
– 标准激光盘文件 – 特点:数据量大,音质好
• AIFF文件(.aif/.aiff)

第三章多媒体音频信息处理

第三章多媒体音频信息处理

一、音频信号的分类
音频信号可分为两类:
❖ 语音信号:语音是语言的物质载体,它包含了 丰富的语言内涵,是人类进行信息交流所特有 的形式。
❖ 非语音信号:主要包括音乐和自然界存在的其他 声音形式。非语音信号的特点是不含复杂的语义 和语法信息,其信息量低,识别简单。
二、音频信号的形式
声音可用一条连续的曲线来表示。这条连 续的曲线无论多么复杂,都可分解成一系列正 炫波的线性叠加,称为声波。因声波是在时间 上和幅度上都连续变化的量,因此称之为模拟 量。模拟信号有两个重要参数:频率和幅度。
1996.3 1992.9 1996.3
音频编码标准和算法
编码 类型
波形 编码
参数 编码
混合
算法
PCM
μ(A)
APCM DPCM
ADPCM
SBADPCM
LPC
CELPC VSELP RPECELP
名称 均匀量化
μ(A) 自适应量化 差值量化 自适应差值量化
子带一自适应差值量化
线性预测编码 码激励LPC
①高压缩比,存储空间小。 ②适合网络播放。 ③音质不是很好。 ④专用播放器Realplayer、
超级解霸2001以上的版本等
➢ AIFF格式文件
AIF是音频交换文件格式(Audio Interchange File Format)的英文缩写,是苹果计算机公司开发的一 种声音文件格式。
七、声卡
虽然PC声卡是在20世纪90年代才得以普及,但 它的问世却是在1984年。英国的ADLIB公司是目前公 认的“声卡之父”,虽然他们最初开发的产品只能提供 简单的声音效果,并且无法处理音频信号,但在当时 无疑已经是一个很大的突破。由于技术不够成熟,成 本又非常昂贵,因此这类带有试验品性质的早期ADLIB 音乐卡,因在当时计算机的运算速度还不足以应付大 规模的多媒体处理,所以未能普及。

数字媒体技术基础 第三章 数字音频处理技术

数字媒体技术基础 第三章 数字音频处理技术

第二节 数字音频压缩技术
2.2.4 音频压缩标准 1、MPEG-1音频标准:属于感知编码类型。它 规定了三个不同层次的编码方案。Ⅰ、Ⅱ层建立 在掩蔽模式通用子带和多路复用编码算法的基础 之上。
Ⅲ层次编码复杂程度较大,应用于目前常见的 MP3音频文件编码。
2、 MPEG-2音频标准:经历了三个阶段,前两个 阶段增加了低取样频率的应用,同时增加了单声 道、双声道立体声、5.1声道立体声应用。有向 后兼容的特点。第三阶段支持多声道应用,不向 后兼容。
(1)霍夫曼编码 霍夫曼编码是哈夫曼于1952年提出的一种代 码长度不均匀的编码方法。它的基本原理是按信 源符号出现的概率大小进行排序,出现概率大的 分配短码,反之则分配长码。在分配码字时,需 建立一株n阶完全二叉树。哈夫曼编码有时称为 最佳编码,因为当符号的概率都是2的乘方时, 哈夫曼编码中码字的平均长度达到最小的极限。 即信源的熵。霍夫曼编码是消除编码冗余的最常 用技术。
第二节 数字音频压缩技术
(3)算术编码 算术编码是一种较好的统计编码,每一符号对 应[0,1]上的一个子空间,区间长度为该符号出 现的概率。该方法将被编码的符号串表示为一个 0和1之间的一个区间。
第二节 数字音频压缩技术
第二节 数字音频压缩技术
2、有损压缩 普通的无损压缩方法对信号的保真度高,但是信 号传输占用带宽较宽,保存占有磁盘空间较大。 所以,压缩技术的发展拓展了数字技术发展的平 台。
1、语音合成 语音合成最基本的目的是让机器模仿人类的语言发声 来传送信息。例如:常见的自动化语音服务系统。 (1)波形编码语音合成:以语句、短句、词和音节为合 成单元,这些单元被分别录音后,直接进行数字编码, 经适当数据压缩后组成数字语音库。重放时,根据待输 出的信息,在语音库中取出相应单元的波形数据,串接 或编辑在一起,经解码还原出声音。

信息技术选修教材 第三章 声音

信息技术选修教材  第三章 声音

第三章声音一、声音的数字化表示:①声音的三个要素:音调、音强和音色②音频文件的格式:WA V格式:涉与到软件调用是首选,因为它的兼容性最好。

MIDI格式:乐器数字接口的缩写。

由电子乐器制造商建立的一个通信标准,用以规定计算机音乐程序和其他电子设备之间交换信息的格式。

MP3格式:RA:体积小适合在网络上传输。

1.如下采样的波形声音质量最好的是〔〕。

A.单声道、8位量化、44.1kHz采样频率B.双声道、8位量化、22.05kHz采样频率C.双声道、16位量化、44.1kHz采样频率D.单声道、16位量化、22.05kHz采样频率2、下述声音分类中质量最好的是〔〕。

A.数字激光唱盘 B.调频无线电广播C.调幅无线电广播 D.3、在声音的数字化过程中,采样频率越高,声音的______ 越好。

A、保真度B、失真度C、噪音D、精度4、使用数字波形法表示声音信息是,采样频率越高,如此数据量______ 。

A、越大B、越小C、恒定D、不能确定5、使用数字波形法表示声音信息是,采样频率越高,如此声音质量______ 。

A、越好B、越差C、不变D、不能确定6、声音与视频信息在计算机内是以______ 表示的。

A、模拟信息B、模拟信息或数字信息C、数字形式D、二进制形式的数字7、使用16位二进制表示声音与使用8位二进制表示声音效果相比,前者______。

A、噪音小,保真度低,音质差B、噪音小,保真度高,音质好C、噪音大,保真度高,音质好D、噪音大,保真度低,音质差8、MIDI是各种电子乐器实现乐谱的数字______ 。

A、通信接口B、通信电缆C、编码方法D、编码标准9、声音卡有______ 两种。

A、4位和8位B、16位和8位C、32位和8位D、16位和32位10、声音卡是用于处理______ 。

A、音频信息B、视频信息C、声音压缩D、声音复原11、数字音频采样和量化过程所用的主要硬件是:〔A〕数字编码器〔B〕数字解码器〔C〕模拟到数字的转换器〔A/ D转换器〕〔D〕数字到模拟的转换器〔D/ A转换器〕答:〔C〕12、音频卡是按〔〕分类的。

第3章_数字音频处理技术

▪ 8kHz,11.025kHz,22.05kHz,16kHz,37.8 kHz, 44.1 kHz,48 kHz。
▪ 其中8kHz ,11.025 kHz,22.05 kHz,44.1 kHz 是音频工业标准采样频率,多数声卡都支持。市 场上的非专业声卡的最高采样率为48kHz,专业 声卡可高达96kHz或以上。
▪ 例如:8位的声音从最低到最高有28,即256个级别,16位 声音有216,即65536个级别。位数越多,音质越细腻,但 数据量也越大。
❖ 量化位数主要有8位和16位两种。专业级别使用24位 甚至32位。
❖量化的方法可以归纳为两类:一类称为均 匀量化,另一类称为非均匀量化。
均匀量化
❖ 采用相等的量化间隔 对采样得到的信号做 量化就是均匀量化。
❖把量化后的值写成有利于计算机传输和存 储的数据格式,这称之为编码。
例如,模拟电压幅度、量化和编码的关系
电压范围(V) 0.5~0.7 0.3~0.5 0.1~0.3 -0.1~0.1 -0.3~-0.1 -0.5~-0.3 -0.7~-0.5 -0.9~-0.7
量化 3 2 1 0 -1 -2 -3 -4
编码 011 010 001 000 111 110 101 100
3. 影响声音数字化质量的主要因素
❖ 采样频率:也就是每秒钟需要采集多少个 声音样本
❖量化位数:每个声音样本的位数应该是多 少,也叫量化精度
❖声道数:指所使用的声音通道的个数
(1) 采样频率
❖采样频率决定了声音的保真度 。频率以kHz (千赫兹)去衡量。
音频文件格式
▪ VOC:Creative公司的声霸卡(Sound Blaster)使用的 波形音频文件格式。
▪ MID:Windows的MIDI文件(MIDI Audio)存储格式。 ▪ MP3: MP3压缩格式文件。

音频信号的数字化名词解释

音频信号的数字化名词解释导言:随着科技的不断发展,数字化已经深入到我们生活的方方面面。

从音乐到电影,从电话到广播,数字化的影响无处不在。

而音频信号的数字化是其中一个重要的方面。

本文将深入解释音频信号的数字化,包括相关的技术原理和常见的名词解释,旨在帮助读者更好地了解数字化音频的概念与应用。

一、音频信号音频信号是指在一段时间内,传递声音信息的信号。

它是物理声波在电子设备中的电信号表示。

音频信号的传输可以通过电线、光纤或无线电波等介质进行。

二、数字化音频1. 采样率采样率是指在一秒钟内对连续音频信号进行离散取样的次数。

它决定了数字化音频信号的质量。

较高的采样率可以更准确地还原原始声音,提供更高的音频保真度。

2. 量化位数量化位数是指对声音的幅度进行离散化处理的位数。

一般用Bit表示,如8 Bit、16 Bit等。

较高的量化位数可以提供更高的动态范围,使得音频信号更加真实和细腻。

3. 声道数声道数表示同时传输的独立音频通道的数量。

单声道表示只有一个独立的音频通道,立体声表示有两个独立的音频通道。

在数字化音频中,常见的声道数有单声道、立体声和环绕声等。

4. 压缩编码为了减小音频文件的大小和传输带宽,音频信号通常会经过压缩编码处理。

常见的压缩编码算法包括MP3、AAC等,它们通过利用人耳听觉特性和音频信号冗余来实现对音频信号的压缩。

三、数字化音频的优势和应用1. 高保真度数字化音频通过增强采样率和量化位数,可以提供接近原始声音的还原效果。

这种高保真度使得数字化音频成为重要的音乐、电影和广播产业的基础。

2. 容易传输和存储与模拟音频信号相比,数字化音频信号可以更容易地通过计算机网路进行传输和存储。

数字化音频文件可以压缩为较小的大小,并且可以通过互联网进行传输和分享。

3. 多媒体应用数字化音频已经广泛应用于多媒体领域,如音乐制作、电影拍摄和游戏开发等。

数字化音频可以与图像、文字和视频等其他媒体元素进行组合,为用户提供更丰富的多媒体体验。

第三章+音频信号的数字化及特征分析


3.2 音频信号的时域分析
1. 2. 3.
短时能量分析 短时平均过零率 短时自相关函数和短时平均幅度差函数
3.2.1
短时能量分析
短时能量计算说明
3.2.1
短时能量分析
短时平均能量方框图
3.2.1
短时能量分析
短时能量的主要用途
可以区分清音段和浊音段。 可以区分清音段和浊音段。 浊音的En比清音 大得多 浊音的 比清音En大得多 比清音 可以区分声母和韵母的分界,无声和有声的分界, 可以区分声母和韵母的分界,无声和有声的分界,连 字的分界。 字的分界。 可以用于语音识别
语音技术及其应用
第三章 音频信号的数字化及特征分析
洪青阳 副教授 厦门大学信息学院 Email: qyhong@
本章内容
1. 2. 3. 4. 5.
音频信号的数字化 音频信号的时域分析 音频信号的频域分析 音频信号的时频域分析 音频信号的倒谱分析
3.1 音频信号的数字化
1. 2.
X n (e
jwk
)=
m =−∞


x(m) w(n − m)e− jwk m
0 ≤ k ≤ N −1
3.3.1
傅里叶变换
在短时傅里叶变换的基础上,可以得到短时功率 谱。短时功率谱实际上是短时傅里叶变换幅度的 平方,不难证明,它是信号x(n)的短时自相关函 数的傅里叶变换,即
Pn (e jw ) =| X n (e jw ) |2 =
若两个信号波形完全不同,则互相关函数为零; 若两个信号波形完全不同,则互相关函数为零; 若两个信号波形相同,则在超前、滞后处出现峰值。 若两个信号波形相同,则在超前、滞后处出现峰值。
自相关函数用于研究信号本身。 自相关函数用于研究信号本身。

第三章 数字音频技术基础

• 音频数字化一般经过三个阶段“采样——量化——编码”。
第三章 数字音频技术基础
17
3.2 音频数字化 3.2.2音频的数字化过程
• 音频数字化过程的具体步骤包括: • 第一步,将麦克风转化过来的模拟电信号以某一频率进行离散化的样本
采集,这个过程就叫采样; • 第二步,将采集到的样本电压或电流值进行等级量化处理,这个过程就
第三章 数字音频技术基础
7
3.1 音频技术及特性 3.1.2模拟音频记录设备
• 由干音频技术的迅猛发展,不论从机型的繁衍、结构和改进、功能的扩 展、性能的提高诸多方面都取得了瞩目的进步.
• 上述材料中显示了传统音频记录技术的演变历史,从记录介质上看历经 了石蜡(锡箔)记录、钢丝记录、磁带记录;从技术手段上来看经历了 机械记录和磁性记录,从外形上面来看录音设备由原来的开放式结构变 成后来的封闭式的设备(盒式)。
• 例如:用44.1kHz、16bit来进行立体声(即两个声道)采样(标准的 CD音质),录制(或采集)3分钟的音频,那么在该未经压缩的声音数 据文件的大小为:
• 一秒钟内采样44.1×1000次,每次的数据量是16×2=32bit(因为立 体声是两个声道),那么3分钟的总共数据量是44100×32×60×3= 254016000(bit),换算成计算机中的常用单位(Byte),总共数据量 是254016000/8/1024/1024= 30.28MByte。
可分等级越多,音质越好。 • 音频流码率:数字化后,单位时间内音频数据的比特容量,流码率越大
音质越好。 • 以上三个方面的指标中,前面两个指标是绝对指标,而音频流码率是一
个相对指标,可以间接用来考察音频的质量。
第三章 数字音频技术基础
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3章
3.1.2
音视频信号及数字化
3.1 音频信号及数字化
模拟信号与数字信号
注:①数字信号强调在时间上和幅值上都不连续。
②数字信号的描述方式采用二进制数量来表示。
③二进制数与数字信号是两个概念,前者只是对后者的 一种描述,在数字信号中强调的是状态。 ④正逻辑是人们用“1”表示有脉冲或电源接通,而用 “0” 表示无脉冲或电源断开。 ⑤二进制与十进制的关系:
① 动态范围大。若采用16 bit量化方法,音频信号的幅度可分为 65536个量化级,动态范围达96 dB。 ② 信息易处理。可以通过计算机对音频、视频信号进行各种特技及 非线性编辑。 ③ 媒体易保存。使用时间长,采用数字化的光盘,重放时不存在机 械磨损,使用寿命长。 ④ 成本低。数字化信息便于大规模集成电路的存储和处理,可降低 成本。 ⑤ 可靠性高。数字信号只要求脉冲的有无,而不依赖信号的幅值大 小,对硬件一致性和稳定性要求下降了许多,从而提高了可靠性。
第3章
音频、视频信号及数字化
3.
声音:是一种波,其本质是机械运动或气流扰动引起周围弹性 媒质发生波动的现象; (声音可以在空气、液体和固体中传播) A
振幅 t
周期(T)
声波
振幅
频率
周期
(一)振幅:声波中的振幅就是通常所说的音量;
声压(P)
44.1kHz作为CD级音频信号的采样频率;
第3章
3.1.6
音视频信号及数字化
3.1 音频信号及数字化
采样定理及音频采样频率标准
6. 音频信号的采样频率标准
选用了44.1 kHz作为CD声音的采样标准 音频信号频率上限为20 kHz,故采样信号频率 fs 应大于 40kHz以上,考虑到LPF在20kHz处大约衰减10%,为全频带高 质量的还原,可以用22kHz的两倍频率作为音频信号的采样频 率,但又为了能与电视信号同步,PAL制场频为50 Hz,NTSC 制场频为60 Hz,所以取二者的整倍数,则选用了44.1 kHz作 为CD声音的采样标准。
②与被测信号的变化速度有关。 在过短的时间里反复测量体温或是河流水位的变化 是完全没有必要的。这就是说,采样频率的选择必须考 虑被采样信号变化的快慢程度,fs是一个相对值。
第3章
3.1.6
音视频信号及数字化
3.1 音频信号及数字化
采样定理及音频采样频率标准
4. 采样定理
采样频率fs必须高于被采样信号所含最高频率的两倍。
第3章
3.1.6
音视频信号及数字化
3.1 音频信号及数字化
采样定理及音频采样频率标准 如fs低于信号中最高频率的两倍,将出现频谱混叠,
原信号的频谱与下边带无法分开,破坏了原信号的频谱, 原信号将无法恢复。
亨利.奈奎斯特(Harry Nyquist)采样定理:当对连续变化的信号 波形采样时,若采样频率fs高于该信号所含最高频率的2倍,那么 可以由采样值通过插补技术正确地恢复原信号的波形;
SPL = 20 lg
弱,这种表示方式称为声压级。
P rms P ref
Prms SPL = 20 lg Pref
Prms----计量点的声压有效值
(单位用分贝dB)
Pref----零声级的参考声压值(Pref=2×10-5帕)
a .
pref 为具有正常听力的年轻人对1kHz的单一频率
信号刚刚能觉察到它存在时的声压值。
注: ① 模拟信号强调在时间上的连续性。 ② 模拟信号强调在幅值上的连续性。 ③计量和描述方式,一般采用十进制数。
变化的信号
缺点:a、噪声容限低; b、抗干扰能力差
第3章
3.1.2
音视频信号及数字化
3.1 音频信号及数字化
模拟信号与数字信号
2.数字信号
在时间上和幅值上都是离散(不连续)的信号称为数 字信号。
该定理指出:当对连续变化的信号波形进行采样时,
若采样频率fs高于该信号所含最高频率的两倍,那么可以由
采样值通过插补技术正确地恢复原信号的波形,否则将会 引 起 频 谱 混 叠 ( Aliasing) 产 生 混 叠 噪 声 ( Aliasing
Noise),而重叠的部分是不能恢复。这一定理不仅适用于
第3章
3.1.7 量化
音视频信号及数字化
3.1 音频信号及数字化
1. 量化级数 对满幅度模拟信号平均分得的份数称为该信号的量化级数; 2. 量化位数 表示该级数的二进制位数称为量化位数 所以得出:当量化位数为n时,量化级数为
2
n级
书中图3.9
第3章
3.1.7 量化
音视频信号及数字化
3.1 音频信号及数字化
是某个声音的最强音与最弱音的强度差,用 分贝表示。它是衡量声音强度变化的重要参数。
第3章
音视频信号及数字化
3.1 音频信号及数字化
3.1.1 音频信号及其心理特征 9.音频信号在时域和频域中的表现形式
在时域空间中表现为幅值随时间连续变化的曲线,
在频域中则是将音频信号经傅里叶(Fourier)变换后
b .声压级实际上是一种相对量,是某点的声压与零 声压的比,是描述声音变化的动态范围的物理量.
(二)频率
音频与音高 音频是指声音信号的频率; 人对于声音频率 的感觉表现为音调的高低。在音乐中称为音高。
音频信号:人类听觉的频率相应不是平直的,频率在 20Hz-20kHz是人类可以听到的听觉频带, 我们称为“音频信号”。
3. 量化级差
量化级的最小单位称为量化级差,用△表示
4. 量化误差(量化噪声) 由四舍五入所引起的输入信号样值与量化后输出值的 差,叫做量化误差,也称为量化噪声(N)。 由于量化值是在对应量化级内四舍五入得到的,所以量
化误差应不大于: │N│<△/2
第3章
3.1.7 量化
音视频信号及数字化
3.1 音频信号及数字化
D= Σbi 2 i i=0
n-1
第3章
3.1.3 为什么要数字化
音视频信号及数字化
3.1 音频信号及数字化
仅从三个方面分析
1. 音频信号的动态范围
2. 噪声容限 (对噪声的承受能力)
3. 与计算机的兼容性
1. 音频信号的动态范围
①实际声场中声音强弱的变化达120 dB。
②传统的模拟音响设备的动态范围:采用模拟信号处 理方式记录和重放音频信号。比如:磁带录音机等,其动 态范围不会超过60 dB。 ③数字音响设备的动态范围接近或者达到实际声音的 动态范围。
单位时间内的采样次数.用fs表示. 1 Ts
f s=
第3章
3.1.6
音视频信号及数字化
3.1 音频信号及数字化
采样定理及音频采样频率标准
3. 采样频率的选择 ①与采样精度和采样后的数据量大小有关。
在单位时间内采样次数越多,则对信号的描述越细腻, 越接近真实信号,即采样频率fs应尽量高。但一味提高采 样频率,增大数据量,给数据处理带来了麻烦,增加了技 术实现上的困难。
第3章
3.1.5 数字化方法
音视频信号及数字化
3.1 音频信号及数字化
1.模拟信号的数字化 将模拟信号转变成数字信号的处理过程称为模拟信 号的数字化。
第3章
音视频信号及数字化
3.1 音频信号及数字化
3.1.5 数字化方法(三步曲) 2.模拟信号的数字化方法
①采样:以适当的时间间隔观测模拟信号波形幅值的过程叫采样。
②量化:将采样时刻的信号幅值归整(四舍五入)到与其最接近的 整数标度叫做量化。
③编码:将量化后的整数,用一个二进制数码序列来表示叫做编码。
第3章
3.1.6
音视频信号及数字化
3.1 音频信号及数字化
采样定理及音频采样频率标准
1. 采样周期
两次采样的时间间隔大小叫做采样周期, 用Ts表示
2. 采样频率
(1)量化噪声是随样值的不同而变化的,则设
-△/2≤n≤△/2,方均值为: N 2
1 =


2
2
2 N 2 dN = 12
平均值(方均根值)为:
Δ
√12
(2)量化噪声总是量化级差△的1/√12 ,这个重要结论是由 W.R.贝内特给出的。
第3章
3.1.7 量化
音视频信号及数字化
3.1 音频信号及数字化
5. 信噪比:信号与噪声的量值比S / N(对数形式) (1) 音频信号的信噪比:因为音频信号总是双极性的,
第3章
3.1.3 为什么要数字化
音视频信号及数字化
3.1 音频信号及数字化
采用16 bit量化(如16位声卡),则声音的强弱范围
就可划分成:20 lg216 = 96 (dB) 个等级,因而动态范 围可达96 (dB) 。
结论:数字系统的音频信号动态范围比模拟系统提 高了近一倍。这也是CD技术之所以获得高水准的音质的
声压级(SPL)
1.声压(P)
声压:声波引起某处媒质压强的变化量称为该处的声压。 (单位为Pa(帕斯卡),即牛顿/米2是压强的量纲)
总结: a.声压是有声波时该处的压强值与没有声波时该 处的压强值的差值。 b.声压越大,声音也就越大。
2.声压级(SPL)
声压级:将声压的有效值取对数的形式表示声音强
模拟音频信号,也同样适用于模拟视频信号的采样。
第3章
3.1.6
音视频信号及数字化
3.1 音频信号及数字化
采样定理及音频采样频率标准
5. 被采样后的信号可恢复的原因
设有一音频信号 f(t),图(a) 是对其在时域与频域中的描述。
设有一采样信号,图(b)其频 谱为一个频率为nfs的波列。 图(c)为采样后的波形与频谱。 信号可恢复的原因:原信号的频 谱完好保留,可以通过插补技术 将原信号恢复。
相关文档
最新文档