第3章 数字音频处理技术
第03章_数字音频基础

3.2.2 量化(Quantization)
量化是指用若干比特表示一个样本的过程;表示一个样本所使用的比特数称为量化深度 (bit depth)。常见的量化深度有 4 比特、8 比特、16 比特、32 比特等等。不难理解,量化实 际上是一个对声音样本的幅值进行离散化处理的一个过程。虽然采样已经在时间上将模拟信号 离散化了,但是样本的大小(即幅值)仍然有无限种可能的取值(所以本质上还是连续量), 而数字系统只能表示有限种状态,例如,用 8 个比特表示样本大小的话,则只能有 256 种取值。 所以,量化是一个将无限多种可能取值归结为有限多个数字值的过程。通常,系统会将一个样 本以最接近其值大小的数字表示。总之,采样是时间上的离散化,而量化则是空间上的离散化。 需要强调的是,量化深度也是影响数字音频信号质量的重要因素。4 比特只有 16 种取值, 显然,试图通过这样少数几个状态来恢复原始模拟音频信号是十分困难的。但是,量化深度越 多,数据量也会越大,传输和存储的压力自然越大。所以,也需要根据实际应用环境来采用合 适的量化深度。例如,一般的网络音频应用采用了 8 位的量化深度,CD 音频的量化深度则是 16 比特,而有些高级数字音频系统采用了 32 位的量化深度。 3.2.3 编码(Coding) 在采样、量化处理后,模拟音频数字化的第三个步骤是编码。编码实际上是以某种格式最 终生成数字音频数据流的过程,所得到的数字音频数据将会被存储、传输或者进行各种处理。 本章第 3 节将介绍几种重要的音频编码技术。 需要读者注意的是,把数字化过程分解成采样、量化、编码三个阶段实际上是一种简化描 述,各种不同的数字音频技术会有不同的采样、量化与编码机制,特别是量化与编码往往是同 步进行的,而且编码还包括后续的数据流格式化。因此,多数介绍数字音频技术的教科书或学 术著作在提到音频编码的时候,都将这三个步骤合称为编码系统或编码技术,并在编码系统的 框架下对整个模数转换过程进行整体性介绍。本教程下面的阐述也沿用了这一模式。
第3章 数字音频处理技术

信息科学技术学院·曹晓兰 20
3.2.4 音频的编码与压缩技术
音频压缩编码时考虑的因素: 音频质量
数据量
计算复杂度
多媒体技术
信息科学技术学院·曹晓兰
21
常见音频编码算法和标准
多媒体技术
信息科学技术学院·曹晓兰
22
1.波形编码
基于音频数据的统计特性进行的编码,其目 标是使重建语音波形保持原波形的形状。 特点:算法简单,易于实现,可获得高质量 语音。
MIDI音频文件是一个脚本语言,它通过对“事 件”编码,产生声音。一个MIDI事件包含一个音 阶的音调、持续时间和音量等参数。
多媒体技术
信息科学技术学院·曹晓兰
31
1.MIDI乐音合成方法
频率调制(FM)合成法
FM声音合成器波形
原理:根据傅立叶级数理论,任何一种波形信号都可 被分解成若干个频率不同的正弦波
需要以音乐为背景的音响效果,同时从CD -ROM中装载其他数据时; 需要以音乐为背景的音响效果,同时播放波形音 频或实现文-语转换,实现音乐和语音同时输出时。
多媒体技术
信息科学技术学院·曹晓兰
37
多媒体技术
信息科学技术学院·曹晓兰
38
3.4.1 常见音频软件简介
1.Cool Edit Pro
专业级多轨录音和音频处理软件。 Syntrillium Software Corporation公司开发。 功能强大、效果出色。 详见下节介绍。
多媒体技术
信息科学技术学院·曹晓兰
时域掩蔽
除了同时发出的声 音之间有掩蔽现象之外, 在时间上相邻的声音之 间也有掩蔽现象。包括 超前掩蔽和滞后掩蔽。
9
3.1.4 音频信号处理过程 音频数字化过程
第三章 音频处理技术PPT课件

除了量化精度以外,数字化声音的技术指标还有采样频率和声道数。
量化精度指每个声音样本需要用多少位二进制数来表示,它反映出度量声音 波形幅度的精确程度,由于计算机按字节运算,一般的量化精度为8位或16 位,量化精度越高,数字化后的声音信号就越可能接近原始信号,但所需要 的存储空间也越大。
超声波
超低频
低频
20Hz
60Hz 80Hz
低频谐波 临场感
250Hz
4kHz 5kHz 6kHz
声音的频率范围
清晰度
停止
12kHz 16kHz 20kHz
要使声音文件能像文字和图形信息一样进行存储、检索、编辑等处理,需要 将声音数字化。声音数字化就是将模拟的连续声音波形在时间上和幅值上进行 离散化处理,共分为两个步骤:采样和量化。
采样就是将声音信号在时间上进行离散化处理,即每隔相等的一段时间在声 音信号波形曲线上采集一个信号样本(声音的幅度)。
量化就是把采样得到的声音信号幅度转换成相应的数字值。采样后的数值不 一定能在计算机内部进行方便的表示,所以将每一个样本值归入预先编排的 最近的量化级上,该过程称为量化。
如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。
声音压缩方法分类: 波形编码 参数编码 混混合合编编码码
采用线性技术构成声道模型,不只传输预测参数和清浊音信息,而是将 预测误差信息和预测参数同时传输,在接收端采用新的预测参数构成合 思 成滤波器,使得合成滤波器输出的信号波形与原始语声信号的波形最大 想 程序的拟合,从而获得自然度较高的语声。这种编码技术的关键是:如 何高效地传输预测误差信息。
第3章数字音频处理技术

MPEG音频编码具有很高的压缩率: 音频编码具有很高的压缩率: 音频编码具有很高的压缩率 MP1-------4:1 MP2-------6:1~8:1 MP3-------10:1~12:1
3.4数字音频信号的编码 ●3.4数字音频信号的编码
一般情况下,声音的制作是使用麦克风或录音机来产生, 一般情况下,声音的制作是使用麦克风或录音机来产生, 再由声卡上的WAVE合成器的( WAVE合成器的 数转换器)对模拟音频采样后, 再由声卡上的WAVE合成器的(模/数转换器)对模拟音频采样后, 量化编码为一定字长的二进制序列,并在计算机内传输和存储。 量化编码为一定字长的二进制序列,并在计算机内传输和存储。 在数字音频回放时,再由数字到模拟的转化器( 模转换器) 在数字音频回放时,再由数字到模拟的转化器(数/模转换器) 解码可将二进制编码恢复成原始的声音信号, 解码可将二进制编码恢复成原始的声音信号,通过音响设备输 如下图所示。 出。如下图所示。
S=44100×10×(16/8)×2=1764KB = × × / )
●
VOC文件 文件
是声霸卡使用的音频文件格式。 是声霸卡使用的音频文件格式。
文件头:包含一个标识、版本号个一个指向数据块起始 文件头:包含一个标识、版本号个一个指向数据块起始 标识 地址的指针 地址的指针 VOC文 文 件格式 数据块:分为各种类型的子块。 声音数据、静音、标记、 数据块:分为各种类型的子块。如声音数据、静音、标记、 ASCII码文件、重复、重复的结束及中止标记等。 码文件、 码文件 重复、重复的结束及中止标记等
文件头:包含一个标志符、语音特征值、声道特征值以及 文件头:包含一个标志符、语音特征值、声道特征值以及 标志符 PCM格式类型标志等 格式类型标志等 格式类型标志 RIFF文 文 件格式 数据块:数据子块标记、数据块长度、波形音频数据 个数据 数据块:数据子块标记、数据块长度、波形音频数据3个数据 子块组成、 子块组成、
第3章数字音频处理技术二

语音识别的发展
语音识别想其他技术一样都是在经历了风雨之后, 才见到今天的彩虹。从上个世纪50年代在美国和我国 对于语音识别就开始研究,并有所收获。到了70年代 后期,语音技术沿着三个不同的发展方向前进:特定 人向非特定人扩展、孤立词向连接词扩展、小词汇量 向大词汇量扩展。到了80年代有了长足的进步和实质 性的进展。出现了一个标志——HMM模型和一大批语 音识别系统,其中美国的CMU的Sphinx是一个经典作 品。
声卡的结构与功能
声卡一般由Wave合成器、MIDI合成器、混 合器、MIDI电路接口、CD-ROM接口、DSP数字信 号处理器等组成。
(1). Wave合成器 Wave合成器的模/数转换和数/模转换是声
卡上数据处理器件。
(2). MIDI合成器 标准的多媒体计算机通过MIDI合成器播放
MIDI文件。
● 音源
•
由于音乐艺术最终要以声音的形式表现出来,
所以做为电脑音乐系统中产生声音的设备,音源音 色的数量、品种和质量都将对最终音乐作品的好坏 产生巨大的影响。现在市场的音源种类很多,有适 合做流行音乐的,有适合做管弦乐作品的,还有适 合于做电子音乐的。另外,不同牌子的音源往往也 会各有优劣之处,购买时应认真加以比较挑选。除 音色的好坏可以直接听到外,选购音源还应注意其 音色数、操作的难易程度和音色的编辑能力等等
MIDI是由软件和硬件部分组成的系统规范, 这个规范定义了MIDI设备间数字传送时电缆硬件 接口和协议。规定定制的目的时使各生产乐器厂 家之间通过统一的MIDI交换信息及控制信号,从 而完成音乐的合成。这样,任何电子乐器,只要 有处理MIDI信息的处理器和适当的硬件接口都能 变成MIDI装置。
● 2.MIDI系统的组成
第3章数字音频处理技术

(3) 音色 音色指声音的感觉特性,与波形相关,影响声音感觉特色
的因素是复音。所谓“复音”是指具有不同频率和不同振幅的 混合声音,自然声中大部分是复音。在复音中,最低频率是 “基音”,它是声音的基调;其他频率的声音称为“谐音(泛 音)”。 5 声音的主要性质 ● 连续性:在时间轴上是连续信号,具有连续性和过程性。
教学进程
3.2 数字化音频
3.2.1 数字音频基本概念
量化
对采样后的声音信号的振幅值进行离散化处理。如果幅 度的划分是等间隔的,就称为线性量化,否则就称为非 线性量化。
编码
将采样和量化后的数字化声音信息以二进制形式并按 照一定的数据格式进行表示,这个过程称为编码。
教学进程
3.2.2 数字音频音质技术指标
(2) 音强
音强即声音的响亮程度(或音量),与振幅相关,取决于声波信 号的强弱程度。音强与声波振幅成正比,振幅越大,强度越大,反之 亦然。唱盘、CD盘以及其他形式的声音载体中的音强是一定的,通 过播放设备的音量控制,可以改变聆听时的强度。如果想改变原始声 音的音强,可以在声音数字化以后,使用音频处理软件提高音强。
采样率/kHz 8 16
37.8 44.1
量化位数/bit 8 16 16 16
教学进程
● 相关性:构成声音的数据,前后之间具有强烈的相关性。
● 实时性:对处理声音的计算机硬件和软件提出很高要求。
教学进程
3.2 数字化音频
模拟信号与数字信号 从模拟信号过渡到数字信号
回顾历史,大多数电信号的处理一直是用模拟元部件(如晶体管、变压 器、电阻、电容等)对模拟信号进行处理。但是,开发一个具有相当精 度、且几乎不受环境变化影响的模拟信号处理元部件是相当困难的, 而且成本也很高。
数字音频处理技术的创新与发展

数字音频处理技术的创新与发展第一章引言数字音频处理技术是近年来迅速发展的一个领域。
随着科技的不断进步,数字音频处理技术已经在广播、音乐录音、娱乐等领域得到了广泛应用。
本文将介绍数字音频处理技术的基本原理以及其创新与发展的现状。
第二章数字音频处理技术基础2.1 采样和量化对于音频信号的处理,首先需要对其进行采样和量化。
采样是将连续的音频信号转化为离散的数值序列,而量化则是将取样值映射为有限数量的离散级别。
采样率和比特深度是两个重要参数,它们决定了音频信号的质量和精度。
2.2 压缩编码为了减小音频文件的存储空间和传输带宽,压缩编码是必不可少的。
常见的音频压缩编码方法包括有损和无损压缩。
有损压缩方法可以通过去除人耳无法感知的信号成分来减小文件大小,而无损压缩方法则是通过减少冗余信息来实现。
常见的音频压缩编码算法有MP3、AAC等。
第三章数字音频处理技术的创新3.1 空间音频处理空间音频处理是指通过声场编码和渲染技术实现立体声、环绕声等音频效果。
通过合理的声源布置和数字信号处理算法,可以使得听众感受到来自不同方向的声音,并且能够感受到声音的距离和高度变化,提供更加逼真的听觉体验。
3.2 实时音频处理实时音频处理是指以实时性为要求的音频信号处理。
这种处理一般用于语音通信、音频会议等需要即时反馈的场景。
实时音频处理技术需要具备较低的延时和高的处理速度,因此对算法的优化和硬件的支持有着较高的要求。
3.3 虚拟现实音频处理虚拟现实音频处理是指通过音频技术为虚拟现实场景提供声音支持。
虚拟现实技术通过模拟真实的视听感受,使用户身临其境地感受到虚拟场景。
音频在虚拟现实中的作用同样重要,可以通过音频定位和音频效果来增强用户对虚拟场景的沉浸感。
第四章数字音频处理技术的发展趋势4.1 人工智能技术的应用人工智能技术的快速发展为数字音频处理技术带来了许多新的机遇。
通过机器学习和深度学习等方法,可以对音频信号进行智能化处理和分析,实现自动识别和分类、音频增强和修复等功能。
数字媒体技术基础 第三章 数字音频处理技术

第二节 数字音频压缩技术
2.2.4 音频压缩标准 1、MPEG-1音频标准:属于感知编码类型。它 规定了三个不同层次的编码方案。Ⅰ、Ⅱ层建立 在掩蔽模式通用子带和多路复用编码算法的基础 之上。
Ⅲ层次编码复杂程度较大,应用于目前常见的 MP3音频文件编码。
2、 MPEG-2音频标准:经历了三个阶段,前两个 阶段增加了低取样频率的应用,同时增加了单声 道、双声道立体声、5.1声道立体声应用。有向 后兼容的特点。第三阶段支持多声道应用,不向 后兼容。
(1)霍夫曼编码 霍夫曼编码是哈夫曼于1952年提出的一种代 码长度不均匀的编码方法。它的基本原理是按信 源符号出现的概率大小进行排序,出现概率大的 分配短码,反之则分配长码。在分配码字时,需 建立一株n阶完全二叉树。哈夫曼编码有时称为 最佳编码,因为当符号的概率都是2的乘方时, 哈夫曼编码中码字的平均长度达到最小的极限。 即信源的熵。霍夫曼编码是消除编码冗余的最常 用技术。
第二节 数字音频压缩技术
(3)算术编码 算术编码是一种较好的统计编码,每一符号对 应[0,1]上的一个子空间,区间长度为该符号出 现的概率。该方法将被编码的符号串表示为一个 0和1之间的一个区间。
第二节 数字音频压缩技术
第二节 数字音频压缩技术
2、有损压缩 普通的无损压缩方法对信号的保真度高,但是信 号传输占用带宽较宽,保存占有磁盘空间较大。 所以,压缩技术的发展拓展了数字技术发展的平 台。
1、语音合成 语音合成最基本的目的是让机器模仿人类的语言发声 来传送信息。例如:常见的自动化语音服务系统。 (1)波形编码语音合成:以语句、短句、词和音节为合 成单元,这些单元被分别录音后,直接进行数字编码, 经适当数据压缩后组成数字语音库。重放时,根据待输 出的信息,在语音库中取出相应单元的波形数据,串接 或编辑在一起,经解码还原出声音。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.2 数字化音频
3.2.1 数字音频基本概念 声音的数字化过程
采 样
声音采样的基本原理是:首先输入模拟声音信号,然后按照 固定的时间间隔截取该信号的振幅值,每个波形周期内截取 两次,以取得正、负想的振幅值。该振幅值采用若干位二进 制数表示,从而将模拟声音信号变成数字音频信号。模拟声 音信号是连续的,而数字音频信号是离散的。 将声音信号在时间上进行离散化处理,即每隔相等的一段时
教学进程
3.1.2 声音的特点 1 声音的传播方式
声音依靠介质(空气、液体、固体)的振动进行传播。声源是 一个振荡源,它使周围的介质产生振动,并以波的形式进行传播。 人耳感觉到这种传播过来的振动,再反映到大脑,就听到了声音。 声音在不同的介质中传播,其传播的速度和衰减的速率是不一样的, 这两个因素导致了声音在不同的介质中传播的距离不同。 2 声音的频率范围
教学进程
3.2 数字化音频
模拟信号与数字信号
从模拟信号过渡到数字信号 回顾历史,大多数电信号的处理一直是用模拟元部件(如晶体管、变压 器、电阻、电容等)对模拟信号进行处理。但是,开发一个具有相当精
度、且几乎不受环境变化影响的模拟信号处理元部件是相当困难的,
而且成本也很高。 如果把模拟信号转变成数字信号,用数字来表示模拟量,对数字信号 做计算,那么难点就发生了转移。把开发模拟运算部件的问题转变成 开发数字运算部件的问题,这就出现了数字信号处理器(digital signal processor,DSP)。DSP与通用微处理器相比,除了它们的结构不同外, 其基本差别是,DSP有能力响应和处理采样模拟信号得到的数据流,
“直达声”与“反射声”示 意图
教学进程
4
声音的三要素
(1) 音调
音调即声音的高低,与频率有关。频率越高,音调越高,反之亦 然。在使用音频处理软件对声音的频率进行调整时,其音调会随之变 化。不同的声源有它自己特定的音调,如果改变了声源的音调,那么 声音会发生质的转变,使人们无法辨别声源本来的面目。 (2) 音强 音强即声音的响亮程度(或音量),与振幅相关,取决于声波信 号的强弱程度。音强与声波振幅成正比,振幅越大,强度越大,反之 亦然。唱盘、CD盘以及其他形式的声音载体中的音强是一定的,通 过播放设备的音量控制,可以改变聆听时的强度。如果想改变原始声
(3) 准立体声 准立体声指的是在录制声音的时候采用单声道,而放音有时 是立体声,有时是单声道。
教学进程
(4) 四声道环绕 准立体声指的是在录制声音的时候采用单声道,而放音有时 是立体声,有时是单声道。 (5) 5.1声道
5.1声音系统来源于4.1环绕,不同之处在于它增加了一个中 置单元。这个中置单元负责传送低于80 Hz的声音信号,在欣赏 影片时有利于加强人声,把对话集中在整个声场的中部,以增加 整体效果。 (6) 7.1声道 是在5.1的基础上又增加了中左和中右两个发音点,以求达到 更加完美的境界。
数据的采样频率和量化位数是影响数据的两个因素。提高采样频率
和增加量化位数将使相应的数据量大大增加,给声音信号的存储与 传输带来困难,这就需要在声音的质量与数据量之间作出恰当的选
择。
教学进程
常用的采样指标及等效音质 采样频率 /kHz 量化位 数/bit 声道数 每分钟的数据量 /MB(无压缩) 等效音质
第
3章
数字音频处理技术
3.1 声音的概述 3.4 MIDI技术 3.1.1 声音的定义 3.4.1 何谓MIDI技术 3.1.2 声音的特点 3.4.2 MIDI声音特点 3.2 数字化音频 3.4.3 MIDI规范 3.2.1 数字音频基本概念 3.4.4 MIDI合成方式 3.2.2 数字音频音质技术指标 3.4.5 MIDI音乐制作系统 3.2.3 数字音频存储量 3.4.6 常用MIDI音乐制作软件 3.2.4 数字音频文件格式 3.5 数字音频的采集、编辑和转换 3.2.5 数字音频处理 3.5.1 Windows录音机的使用 3.2.6 音频信号的特点 3.5.2 数字音频的采集方式 3.3 声卡与音箱 3.5.3 使用GoldWave编辑数字音频 3.3.1 声卡 3.5.4 数字音频的转换 3.3.2 音箱
教学进程
不同声音的不同频率范围
次声波
<20Hz
人耳可听域
20~20000Hz
超声波
>20000Hz
常见的声源及其频率范围
教学进程
3
声音的传播方向
声音以振动的形式从声源向四周传播。从声源直接到达人类 听觉器官的声音是“直达声”。直达声的方向辨别非常容易。但 是,在现实生活中,森林、海洋、建筑、地貌和景物等存在于我 们周围,声音从声源发出后,经过多次反射才能被人们听到,这 就是“反射声”。
音的音强,可以在声音数字化以后,使用音频处理软件提高音强。
教学进程
(3) 音色
音色指声音的感觉特性,与波形相关,影响声音感觉特色 的因素是复音。所谓“复音”是指具有不同频率和不同振幅的
混合声音,自然声中大部分是复音。在复音中,最低频率是
“基音”,它是声音的基调;其他频率的声音称为“谐音(泛 音)”。 5 声音的主要性质 ● 连续性:在时间轴上是连续信号,具有连续性和过程性。 ● 相关性:构成声音的数据,前后之间具有强烈的相关性。 ● 实时性:对处理声音的计算机硬件和软件提出很高要求。
11.025
22.05 44.1
8
16 16
单声道
双声道 双声道
0.63
5.05 10.09
语音
FM广播 CD唱盘
数字音频等级
信号类型
电话话音 宽带音频 调频广播 高质量音频
频率范围/Hz
200~3400 50~7000 20~15000 20~20000
采样率/kHz
教学进程
4
编码算法 音频数据压缩比的表达式
压缩后的音频数据
音频数据压缩比 = 压缩前的音频数据
编码作用:一方面是采用一定的格式来记录数字数据,另一方面是 采用一定的算法来压缩数字数据以减少存储空间和提高传输效率。 压缩比越大,信息丢失越多,信号还原后失真越大。 5 数据率及数据文件格式
数据率为每秒位数,它与信息在计算机中的实时传输有直接关系, 而其总数据量又与计算机的存储空间有直接关系。用数字音频产生 的数据一般以WAVE的文件格式存储,以 “.WAV”作为文件扩展名。
教学进程
3.2.2 数字音频音质技术指标
2
量化位数 量化位数又称取样大小,它是每个采样点能够表示的数据 范围。量化位数的大小决定了声音的动态范围,即被记录和重 放的声音最高与最低之间的差值。
3
声道数
声道数是指所使用的声音的通道个数,它表明声音一次同
时产生的声波组数。声音的声道数也是技术发展的重要标志, 从单声道到环绕立体声,声音的质量越来越好,但是同时增加 了对存储和传输媒体的要求。
教学进程
3.2 数字化音频
模拟信号与数字信号 话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是 连续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值 有无穷多个,在幅度上“连续”是指幅度的数值有无穷多个。我们把在时 间和幅度上都是连续的信号称为模拟信号。 在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),由这 些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷
本章要点:
► 声音的概述 ► 数字化音频 ► 声卡与音箱 ► MIDI技术 ► 数字音频的采集、编辑和转换
教学进程
3.1 声音的概述
3.1.1 声音的定义 声音(Sound)是通过一定介质(如空气、水等)传播的连续波,在 物理学中称为声波。声音是振动的波,是随时间连续变化的物理量。
(1) 振幅 (Ampliade) 声波的振幅通常是指音量,它是声波波形的高低幅度,表示 声音信号的强弱程度。 (2) 周期(Period) 声音信号的周期是指两个相邻声波之间的时间长度,即重复 出现的时间间隔,以秒(s)为单位。 (3) 频率(Frequency) 声音信号的频率是指每秒钟信号变化的次数,即为周期的倒 数,以赫兹(Hz)为单位。
多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取值的数
目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。例如, 假设输入电压的范围是0.0V-0.7V,并假设它的取值只限定在0,0.1,0.2…,0.7 共8个值 。如果采样得到的幅度值是0.123V,它的取值就应算作0.1V, 如果采样得到的幅度值是0.26V,它的取值就算作0.3,这种数值就称为 离散数值。我们把时间和幅度都用离散的数字表示的信号就称为数字信声道是比较原始的声音复制形式,早期的音频卡采用的比 较普遍。当通过两个扬声器回放单声道信息的时候,可以明显感 觉到声音是从两个音箱中间传递到耳朵里的。 (2) 立体声
立体声又称为双声道。单声道缺乏对声音的位置定位,而立 体声技术则彻底改变了这一状况。声音在录制过程中被分配到两 个独立的声道,从而达到了很好的声音定位效果。
间在声音信号波形曲线上采集一个信号样本。
教学进程
3.2 数字化音频
3.2.1 数字音频基本概念
量 化
对采样后的声音信号的振幅值进行离散化处理。如果幅 度的划分是等间隔的,就称为线性量化,否则就称为非
线性量化。
编 码
将采样和量化后的数字化声音信息以二进制形式并按 照一定的数据格式进行表示,这个过程称为编码。
教学进程
3.2.3 数字音频存储量 数据量=采样频率×(量化位数/8)×声道数×声音持续时间 对于调频广播级立体声,采样频率为44.1kHz,量化等级为16 位(即2字节)声道形式为双声道,则转换后每秒以千字节为 单位的数据量为:
例 3-1
44 100(Hz)×(16/8)(B)×2=176 400B/s≈172kB/s