第3章 音频

合集下载

第三章物理层3

第三章物理层3
24×8+1=193位 编码效率为:168/193,开销:25/193 数据速率为193bit/125μs=1.544Mbps 或193bit/次×8000次/s=1.544Mbps E1载波: 每一帧开始有8bit做同步,中间有8bit做信令,再有30 路8位数据,全帧长256位。 数据速率为256bit/125μs=2.048Mbps。 T2载波: 6.312Mbps(由4条T1载波时分复用)。 T3载波: 为多条T2线路组成,为45Mbps(44.736Mbps)。
第三章 物理层(三)
六、多路复用
把许多信号在单一的传输线路上用单一的传输设备来 进行传输,即一个信道同时传输多路信号,可以大大节省 电缆的安装和维护费用。
多路复用可分为:
• 频分多路复用 • 时分多路复用 • 波分多路复用
1.频分多路复用(FDM)
在物理信道能提供比单个原始信号宽得多的带宽情况 下,可将该物理信道的总带宽,分割成若干个与传输的单 个信号带宽相同(或略宽一点)的子信道,每个子信道传 输一路信号,称为频分多路。 如某信道带宽1MHZ,传送音频信号,每个音频信号 带宽为4KHZ(话音信号),那么,可以按频率分成:
L T 电路交换 S (n+1)m B
4.报文交换
不需要在两个站点之间建立一条专用通路。 数据传输的单位是报文(即站点一次性要发送的数据 块,长度不限且可变)。 传送的方式采用存储-转发方式。
站点的延迟时间:
等于接收报文的所有位所需的时间+等待时间(重传 到下一节点所需的排队延迟时间)。
设两个给定站点之间的转接点为n,报文长 度为L,分组的长度为P,其中每个分组有开销 h,数据速率为B,虚电路建立时间为S。两个 节点之间的传播延迟时间为m,每个节点的处 理延迟时间为d。 分组个数为L/(P-h)假设为x个分组,其 中x-1个分组是满的,长度为P ;最后一个分组 有可能长度不是为P。设最后一个分组长度为y:

第3章 多媒体信息的输入与输出

第3章 多媒体信息的输入与输出
34
3.1.2
显卡的基本结构
8.BIOS ROM BIOS ROM又称为基本输入输出系统。它是 一种特殊的存储芯片(ROM),存放生产厂家提 供的硬件图形加速芯片与驱动软件之间的输入、输 出逻辑控制程序,此外,还存放显卡的名称﹑型号
以及显示内存的信息等。BIOS的性能决定了显示
卡硬件与操作系统之间的配合程度,以及能否充分
Geforce 6系列显示芯片分为6200系
列、6600系列和6800系列。
70
Geforce 6800芯片
Geforce 6600芯片
Geforce 6200芯片
71
3.1.4
主流显示芯片组
2.nVIDIA显示芯片 (3)Geforce 7系列 Geforce 7系列是nVIDIA最新发布的 显示芯片,这块基于G 70核心的显示卡被 nVIDIA命名为Geforce 7800。
第3章 多媒体信息的输入 与输出
主讲人:厉青
1
第3章 多媒体信息的输入与输出
本章要点: 1. 显示卡 2. 音频卡 3. 视频编辑卡 4. 常用外部输入输出设备
2
1 什么是显卡
显示卡(又称显示适配器)是显示器与主机通信的控 制电路和接口,作用是控制显示器的显示方式。在显 示器里也有控制电路,但起主要作用的是显示卡。
21
VGA 插口
视 频 插口
显示卡的结构
AGP 总 线接口 覆盖散热 片的 图形加速 芯片
VGA Feature 插口
显存
22
3.1.2
显卡的基本结构
一般的显示卡上有显示芯片、显示内存及显示输 出接口(VGA接口、DVI接口和S-Video接口)等 。 1.显示芯片 2.显示内存

录音技术基础(1)

录音技术基础(1)

录音技术基础第一章声学基本知识1.声音物体的振动产生声音——声音的产生声音是被人耳感知的高于或低于正常大气压的压力变化——什么是声音产生声音的物体称为声源。

2声音的物理属性振幅:高于或低于正常大气压的峰值频率:声源每秒钟振动的次数(f)声速;:通常情况下(在一个标准大气压下,常温时V=340米/(空气)波长:在一个周期时间内,声音传播的距离λλ=VT=v/f相位:声音信号的叠加:同相信号相加,相互加强;反相信号相加,相互抵消3.基频与谐频→决定音调与音色单音:一个频率组成的声音叫单音。

复音:由许多频率组成的声音叫复音。

频率最低的为基频,其它为谐频。

声能集中在基频和低次谐频分量上。

(复音信号频率分解:基频与谐频)4.声波的反射、折射a.当声波从一种介质传到另一种介质时,如果两种介质分界面的大小与声波波长可以相比拟时,则声波的传播方向要发生变化,产生反射、折射现象。

b.吸声系数α=吸收的声能/入射声能(1>α>0)和物质有关c物体吸声系数越大,说明吸收声音的能力越强;吸声系数越小,吸收声音的能力越小5.声波的绕射规律:频率越低越易绕射,频率越高越不易绕射6.人耳的结构:外耳,中耳,内耳7.人耳的听觉特性:(1)频率范围20Hz-20kHz (语言60- 1000Hz基频;敏感区3000-5000Hz)(2)动态范围闻阈:0.0002毫巴0dB ;痛阈:超过120dB语言40dB 音乐80dB听阈(声压级在0dB以上的声音)8.声音三要素(主观感觉)响度:人耳对声音强弱的主观感受,由振幅决定(和振幅对数成正比),与频率和波形有关音调:由基频决定,受声音强度影响音色:在听觉上区别有同样响度,同样音调的声音之所以不同的特性,由谐频成分的多少及大小决定。

9.等响曲线说明:a.人耳对声音的响度感觉是随声音强度大小变化而变化的b.同样声强的声音,频率不同,响度级也不同c.人耳对高频和低频信号的敏感程度差,对低频尤为突出d.1000Hz时,响度级和声音强度数值是相同的10.听觉现象(三种)掩蔽效应:由于第一种声音的存在而使第二种声音提高闻阈的现象.是复杂的生理、心理现象,与声音的大小、频谱、方向、持续时间有关。

Adobe Audition CS6课件第3章 AuditionCS6的基本操作

Adobe Audition CS6课件第3章 AuditionCS6的基本操作

3.10 快速打开最近使用的文件
在Audition中,如果关闭某个文件之后,想要再次打开,那么 可以选择“打在所要打开的文件上单击 ,即可打开文件。
“文件”面板
课堂练习——转换为新的音乐格式
“导出多轨缩混”对话框
3.7 关闭文件
在Audition中,如果要关闭声音文件,可以通过关闭命令进行实现。 通过“文件 > 关闭”、“文件 > 全部关闭”命令,可以将文件关闭 。
“文件”菜单
3.8 批处理存储全部音频
在Audition中,可以将“文件”面板中的多种格式音频文件转换为统一格式。 选择“文件 > 以批处理保存全部音频”命令,弹出“Audition”对话框,单击 “确定”按钮,“文件”面板中的所有音频文件全部添加到“批处理”面板中。 单 击“批处理”面板下方的“导出设置”按钮,弹出“导出设置”对话框,在对话框中 进行设置,设置完成之后,单击“确定”按钮,确认设置。 单击“批处理”面板下方的“运行”按钮,将所有音频文件按照前面设置的选 项进行输出。
选择“文件 > 新建 > 多轨混音项目”命令,或按Ctrl+N组合键,弹出“ 新建多轨项目”对话框。在对话框中可以设置新建多轨项目的名称、文件夹位 置、模板、采样率、位深度、主控等选项,设置完成后,单击“确定”按钮, 即可完成新建多轨合成项目文件。
“新建多轨项目”对话框
“多轨项目”界面
3.1.3 打开文件
在声音编辑的过程中,如果将波形水平方向放大后,可以通过波形界 面上的滚动条左右移动波形的位置,也可以将鼠标光标放置到时间刻度线上 并左右拖曳鼠标。
3.6 保存于导出文件
保存文件 导出文件
3.6.1 保存文件
如果声音文件已在单轨界面中编辑好,那么就需要将其进行保存。 通过“文件 > 保存”、“文件 > 另存为”、“文件 > 保存选中为” 、“文件 > 全部保存”、“文件 > 以批处理保存全部音频”命令,可以将 文件保存在磁盘上。编辑好的声音在进行第一次存储时,选择“文件 > 保 存”命令,弹出“另存为”对话框。在对话框中进行设置,设置好之后单击 “确定”按钮,即可将其保存。

第3章-数字声音编码

第3章-数字声音编码
用公式表示为 fs ≥2f 或者 Ts ≤ T/2 其中f为被采样信号的最高频率
21 of 49
采样精度
每个声音样本的位数
样本位数越多,声音的质量越高,而需要的存储空间也越多;位 数越少,声音的质量越低,需要的存储空间越少。
采样精度的另一种表示方法是信号噪声比-----SNR
SNR 10 log10
3.4声音质量的MOS评分标准 3.5 脉冲编码调制(PCM)
3.5.1 PCM的概念 3.5.2 均匀量化 3.5.3 非均匀量化
3.6 PCM在通信中的应用
3.6.1 频分多路复用 3.6.2 时分多路复用 3.6.3 数字通信线路的数据传输率
3.7 增量调制与自适应增量调制
3.7.1 增量调制(DM) 3.7.2 自适应增量调制(ADM)
A律压扩
A律压扩主要用在欧洲和中国大陆等地区的数字电话通信中,按下面的 式子确定量化输入和输出的关系
0 ≤ |x| ≤ 1/A 计算时,A=87.56
35 of 49
话音编码(补充)
G.711标准(普通电话标准):单声道、8位/样本、采样频率 为8 kHz的话音数据流。使用μ率和A率压缩算法,信 号带宽为3.4 kHz,压缩后的数据率为64 kb/s;

(Vsignal )2 (Vnoise )2


20
log10
Vsignal

Vnoise

Vsignal表示信号电压,Vnoise表示噪声电压;SNR的单位为分贝(db)
例:假设Vnoise=1,采样精度为1位表示Vsignal=21,信噪比SNR=6分贝。
采样精度为8位表示Vsignal=28,信噪比SNR=6*8=48分贝

第3章 音频处理软件CoolEditPro-1

第3章 音频处理软件CoolEditPro-1
• 相位指声音处于左右声道中的位置(在听觉上的位置) 相位指声音处于左右声道中的位置(在听觉上的位置)
调整方法: 调整方法: • 右键单击,出现滑钮调整 右键单击, • 按住左键的同时鼠标上下拖动
裁剪音频波形
拖放鼠标, 拖放鼠标,选择需处理的音频波形
• 剪切([编辑]—[剪切]) 剪切( 编辑] 剪切] • 修剪到选区([编辑]—[反向]) 修剪到选区( 编辑] 反向]
要注意对录音电平(录音音量)的调整。 要注意对录音电平(录音音量)的调整。在录音时我 们要尽量保证录制的声音以最高电平进入麦克风。 们要尽量保证录制的声音以最高电平进入麦克风。声 音的电平越高,声音也就越清晰。不过, 音的电平越高,声音也就越清晰。不过,声卡对可处 理的声音电平也有一个限度,太高的电平会使声音出 理的声音电平也有一个限度, 现爆音,听起来不舒服。 现爆音,听起来不舒服。 数字音频中的声音强度与生活中的声音强度概念有所 不同,虽然单位都是dB 分贝), dB( ),且数字越高表示声 不同,虽然单位都是dB(分贝),且数字越高表示声 音强度越大。 生活中的声音强度都是正数, 音强度越大。但生活中的声音强度都是正数,最小的 声音被规定为0dB 而在数字音频领域中 0dB; 数字音频领域中, 声音被规定为0dB;而在数字音频领域中,声音强度则 以负数形式记录,最大的声音被规定为0dB,而最小的 以负数形式记录,最大的声音被规定为0dB, 0dB 声音是负无穷。 声音是负无穷。 为了录制的声音尽可能清晰, 为了录制的声音尽可能清晰,我们既需要尽量大的音 又不能超过系统可以接受的0dB最大音量, 0dB最大音量 量, 又不能超过系统可以接受的0dB最大音量,这是录 音时要严格掌握的尺度。 音时要严格掌握的尺度。
三、多轨音频编辑

Adobe Audition第3章

Adobe Audition第3章
注意:如果需要一次打开多个文件,可按住Shift键选择多个连续
文件或按住Ctrl键选择多个不连续文件。 2.此时可以看到“波形编辑器”中音频的波形。选择“文件”>
“另存为”命令,将文件命名为“demo03.wav”,并将其保存在“Sta rt03”文件夹。
3.2.1导入音频文件
如果导入多个文件 后想的打径开向指定文件, 可选择“编辑器” 面板的文件选择下 拉菜单,如图所示, 可以看到加载的文 件列表。
3.5利用多个剪切板存储和组装音频
4. 选择前奏区域,然后选择“编辑>设置当前剪贴板”,并选择 “剪贴板1”(它可能已经被默认选中)或者通过按“Ctrl+1”组合键 选择此剪贴板。
5. 选择“编辑>剪切”或按“CtrI+X”组合键,将该音频区域存 储在剪贴板1中(可以看到原本 “剪贴板1”旁出现的“空”字消失)。
移至文件开始处。
3.2 剪切、复制、粘贴、静音和删除音频区域
3.2.3剪切选中音频区域
操作步骤如下: 1.单击“波形”视图下方的“播放”按钮,确定当前波形要编辑 的区域(此处将demo03的1.6秒-2.2秒作为编辑区域)。 2.选中区域后,单击传输控制按钮组中最右侧的“跳过所选项目” 按钮(此时该按钮会变绿),然后单击“播放”按钮,预览剪切后音 频区域效果,此时文件将从头播放,然后跳过选中区域继续播放。如 果对此次操作满意则继续下步操作,否则,可重新选择要操作的区域。 3. 选择“编辑>剪切”或者按“Ctrl+X”组合键,剪切选中区域, 并将剪切内容放置剪切板1
3.5利用多个剪切板存储和组装音频
此处,我们将音频的4.3秒处放置标记1,音频的8.2秒处放置标记2, 音频的11.6秒处放置标记3,音频的15.6秒处放置标记4。

06 第3章-3 声波 超声波(1)

06 第3章-3 声波 超声波(1)

声波超声波3.8 声波3.8.1声波和声速声波是在弹性介质中传播的一种机械波(纵波).人对声音的感觉频率范围是20Hz—20kHz,称为声波.频率低于20Hz叫做次声波.频率高于20kHz的叫做超声波.100Hz1000Hz10kHz 所有物体的振动,传播出去都是声,但不是所有的声都能听到的.阻尼钢板钢板*声纹语音是人的自然属性之一,由于不同的人有不同的发音方式和习惯,发音的频率也就各不相同.因此,运用计算机对语音作分析、处理,利用这种声纹图中的特性差异,就可作为个人身份的识别.同一人说话不同人说话声速声波在介质中传播的速度.其大小因介质的性质和状态而异.声速的数值在固体中比在液体中大,在液体中又比在气体中大.它的大小还随大气温度的变化而变化.媒质温度℃声速m s-1空气0331氢01270水201400冰05100黄铜203500玻璃05500花岗岩03950铝205100在干燥空气中,音速的经验公式是:u=331.3+(0.606c)m s-1(c:摄氏气温)声压某一时刻,在介质中的某处,有声波传播时的压强与无声波传播时的压强之差.介质质量密度:ρ无声波时的压强:p 0有声波时右侧声压:p 0+p +d p 由牛顿第二定律:ax S S p p p S p p ⋅=++-+d )d ()(00ρ3.8.2声压和声强a x p ⋅=-d d ρxux t A d ])(cos[2ϕωωρ+--=积分后,得声压:])(sin[ϕωωρ+-=uxt A u p Au p ωρ=m 声压幅值(声幅):结论:声压随空间位置和时间作周期性变化,并且与振动速度同相位.定义:声波的声幅与介质质点振动速度的幅值之比值.声阻(表征介质传播声波的性质的物理量)])(sin[ϕωωρ+-=uxt A u p 声阻:up Z ρ==mmv 声强声波的强度称为声强.声强与声阻及声幅关系:Zp Zv A u I m 221212m222===ωρ在最佳音频(约1000~4000Hz)条件下,人对声强感受范围:3.8.3声强级和响度级实用上,听觉强度范围甚宽需要以更方便的单位来表示.即声强级L .单位:分贝(dB).定义为:1贝(B)=10分贝(dB)dBlg 10B lg 00I I I I L ==-12-2 声强级响度级在同一等响曲线上,它们表示同一响度等级.单位:方(phon).响度级大小是以频率为1000Hz的声音声强级分贝数为该响度级的方数.0方曲线为听阈曲线.120方曲线为痛阈曲线.正常人听力曲线耳疾病人听力曲线电子听力计发出不同音调(20Hz~20000Hz)和不同声强(-10db~100db)的纯音,测量病人的听力曲线.听力曲线的0分贝并不是都以I 0作为标准.而是以正常人的不同频率的听阈值作为标准.听力曲线3.9 超声和超声诊断超声的特性通常的超声波频率范围:Hz105~10298⨯⨯超声波具有声波的通性,由于频率高(波长短),因而还具备如下特点:1.方向性好.2.强度高.3.贯穿能力强.4.在声阻不同界面上产生显著反射.3.9.1超声波及应用原理超声的主要作用1.机械作用使介质中的离子受迫高频振动,强烈的振动能量能破坏物质的力学结构.如:高强度超声波在人体中传播,会对细胞组织产生直接的效应.2.空化作用在液体中传播时,稠区受压,稀区受拉.液体受拉形成空腔,下一个声压有使其迅速闭合,由此产生局部高压高温和放电现象,称空化作用.3.温热效应超声波能量被介质吸收而转化为热量,引起介质温度升高的现象.热效应早已应用于临床理疗,近来作为加热治疗癌症的一种热源受到重视.工程学方面:水下定位与通讯、地下资源勘查等;超声波的应用生物学方面:剪切大分子、生物工程及处理种子等;治疗学方面:理疗、治癌、外科、体外碎石、牙科等.3.9.2超声医学诊断A超(amplitude mode):是以回波振幅的大小和回波的疏密来显示人体组织的特征.图示的是A型超声诊断仪的原理示意图.纵坐标表示回波信号的强弱,横坐横表示回波的时间(或距离).超声回波以脉冲形式按时间先后在荧光屏上显示出来.B超(brightness mode):是以回波亮度的强弱来显示人体内部组织结构的图像.当探头按次序移动扫描时,屏幕上的点状回波与其同步移动.由于扫描形成与超声波方向一致的切面回波,所形成的图像属于二维图象,具有真实性强、直观性好、容易掌握和诊断方便等优点.M超(motion mode):是用于观察活动界面按时间变化的一种方法.最适用于检查心脏的活动情况,其曲线的动态改变称为超声心动图.它可将心脏各层结构的反射信号以点状回波显示在屏幕上.D 超(Doppler mode):是利用多普勒效应检测血液流动和器官活动的一种超声诊断方法.设超声波在人体组织的传播速度为u ,超声波频率为ν,且与血流方向成α角.νανu v u cos 0-=′ναανανcos cos cos 000v u v u v u u +=′+=′′-ναανννcoscos 2Δ00v u v +=′′=-频移002cos Δu v u ανν>>=v Q ∴0Δ2cos u ννα=v 血液流速为。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

音色:即特色的声音。声音分纯音 复音 纯音和复音 2 ) 音色 纯音 复音两种类型。所 谓纯音,是指振幅和周期均为常数的声音;复音则是具有不同 频率和不同振幅的混合声音。大自然中的声音绝大部分是复音。 在复音中,最低频率的声音是“基音 基音”,它是声音的基调。其 基音 他频率的声音称为“谐音”,也叫泛音 泛音。基音和谐音是构成声 泛音 音音色的重要因素。各种声源都具有自己独特的音色,例如各 种乐器的声音、每个人的声音、各种生物的声音等,人们就是 依据音色来辨别声源种类的。 3)音强:声音的强度,也被称为声音的响度,常说的“音量” 音强 也是指音强。音强与声波的振幅成正比,振幅越大,强度越大。 唱盘、CD激光盘以及其他形式声音载体中的声音强度是一定的, 通过播放设备的音量控制,可改变聆听时的响度。
音調頻率表 音調 頻率 C 262 D 294 E 330 F 349 G 392 A 440 B 494 C 523 D 587 E 659 F 698 G 784 A 880 B 988 C 1047 D 1175 E 1319 F 1397 G 1568 A 1760 B 1976
第3章 音频信息处理 章
fs ≥ 2f
2. 量化
采样只解决了音频波形信号在时间坐标 即横轴 时间坐标(即横轴 时间坐标 即横轴)上把一个波 形切成若干个等分的数字化问题,但是还需要用某种数字化的 方法来反映某一瞬间声波幅度的电压值大小。该值的大小影响 音量的高低。我们把对声波波形幅度的数字化表示称之为“量 对声波波形幅度的数字化表示称之为“ 对声波波形幅度的数字化表示称之为 化”。 量化的过程是先将采样后的信号按整个声波的幅度划分成 量化的过程 有限个区段的集合,把落入某个区段内的样值归为一类,并赋 于相同的量化值。如何分割采样信号的幅度呢? 我们还是采取二 进制的方式,以8位(bit)或16位(bit)的方式来划分纵轴 的方式来划分纵轴。也就是 以 或 位 的方式来划分纵轴 说在一个以8位为记录模式的音效中,其纵轴将会被划分为个量 化等级,用调:代表了声音的高低。音调与频率有关,频率越高, 1 ) 音调 音调越高,反之亦然。 读者也许有这样的经验,当提高磁带录音机的转速时,其 旋转加快,声音信号的频率提高,其喇叭放出来声音的音调 提高了。同样,在使用音频处理软件对声音的频率进行调整 时,也可明显感到音调随之而产生的变化。各种不同的声源 具有自己特定的音调,如果改变了某种声源的音调,则声音 会发生质的转变,使人们无法辨别声源本来的面目。
未压缩的声音文件的存储量可用下式计算: 未压缩的声音文件的存储量可用下式计算: 可用下式计算 存储量(KB) 采样频率KHZ 采样位数bit 声道数×时间秒) KHZ× bit× 存储量(KB)=(采样频率KHZ×采样位数bit×声道数×时间秒)/8
2.VOC文件 2.VOC文件
VOC文件是Creative公司所使用的标准音频文件格式, 多用于保存 Creative Sound Blaster(创新声霸)系列声卡所采 集的声音数据,被Windows平台和DOS平台所支持。 与WAV格式类似,VOC文件由文件头块和音频数据块组成。 文件头包含一个标识、版本号和一个指向数据块起始地址 的指针,这个指针帮助数据块定位以便顺利找到第一个数 据块。数据块分成各种类型的子块,如声音数据、静音、 标记、ASCII码文件、重复、重复的结束及终止标记等。
3.1.3 数字音频的文件格式
在多媒体技术中,存储音频信息的文件格式主要 有:WAV文件、VOC文件和MP3文件等。 1. WAV文件 WAV文件 WAV文件又称波形文件,来源于对声音模拟波形 的采样,并以不同的量化位数把这些采样点的 值轮换成二进制数,然后存入磁盘,这就产生 了波形文件。WAV文件用于保存Windows平台的 音频信息资源,被Windows平台及其应用程序所 广泛支持。
WAV声音文件是使用RIFF(Resource Interchange File Format资源交换文件)的格式描述的,它由文件头和波形 音频文件数据块组成。文件头包括标志符、语音特征值、 声道特征以及PCM格式类型标志等。WAV数据块是由数据子 块标记、数据子块长度和波形音频数据3个数据子块组成。 Wave格式支持多种压缩算法,支持多种音频位数、采样 频率和声道,是PC机上最为流行的声音文件格式,但其文 件尺寸较大,多用于存储简短的声音片断。
失真在采样过程中是不可避免的,如何减少失真呢 如何减少失真呢?可以直 失真 如何减少失真呢 观地看出,我们可以把上图中的波形划分成更为细小的区间,即 采用更高的采样频率。同时,增加量化精度,以得到更高的量化 采用更高的采样频率。同时,增加量化精度 等级,即可减少失真的程度。在下图(左)中,采样率和量化等 级均提高了一倍,分别为2000次/秒和20个量化等级。在下图(右) 中,采样率和量化等级再提高了一倍,分别达到4000次/秒和40个 量化等级。从图中可以看出,当用D/A转换器重构原来信号时 (图中的轮廓线),信号的失真明显减少,信号质量得到了提高。
模拟音频信号有两个重要参数:频率和幅度 频率和幅度。声音的频率 频率和幅度 体现音调的高低,声波幅度的大小体现声音的强弱。 一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰 所发生的数目称之为信号的频率 频率,单位用赫兹(Hz)或千赫兹 频率 (kHz)表示。信号的幅度 信号的幅度是从信号的基线到当前波峰的距离。 信号的幅度 幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音 频信号,声音的强度用分贝(dB)表示 声音的强度用分贝(dB)表示,分贝的幅度就是音量。 声音的强度用分贝(dB)表示
3. 编码
模拟信号量经过采样和量化以后,形成一系列的离散信 号——脉冲数字信号。这种脉冲数字信号可以一定的方式进行 编码,形成计算机内部运行的数据。所谓编码,就是按照一定 编码, 编码 的格式把经过采样和量化得到的离散数据记录下来, 的格式把经过采样和量化得到的离散数据记录下来,并在有用 的数据中加入一些用于纠错、同步和控制的数据。在数据回放 的数据中加入一些用于纠错、同步和控制的数据 时,可以根据所记录的纠错数据判别读出的声音数据是否有错, 如在一定范围内有错,可加以纠正。 编码的形式比较多,常用的编码方式是PCM——脉冲调制。 脉冲编码调制( 脉冲编码调制(PCM)是把模拟信号变换为数字信号的一种调 ) 制方式, 制方式,即把连续输入的模拟信号变换为在时域和振幅上都离 散的量,然后将其转化为代码形式传输或存储。 散的量,然后将其转化为代码形式传输或存储
5.声音的频谱 5.声音的频谱
声音的频谱有线性频谱和连续频谱之分。线性频谱 线性频谱是具有 线性频谱 周期性的单一频率声波;连续频谱 连续频谱是具有非周期性的带有 连续频谱 一定频带所有频率分量的声波。纯粹的单一频率的声波只 能在专门的设备中创造出来,声音效果单调而乏味。自然 界中的声音几乎全部属于非周期性声波,该声波具有广泛 的频率分量,听起来声音饱满、音色多样且具有生气。
3.1.2 模拟音频的数字化过程
数字化的声音易于用计算机软件处理,现在几乎所有的专 业化声音录制、编辑器都是数字方式。对模拟音频数字化过程 涉及到音频的采样、量化和编码。 音频的采样、 音频的采样 量化和编码。 采样和量化的过程可由A/D转换器实现 A/D转换器实现。A/D转换器以固定的 采样和量化的过程可由A/D转换器实现 频率去采样,即每个周期测量和量化信号一次。经采样和量化 后声音信号经编码后就成为数字音频信号,可以将其以文件形 式保存在计算机的存储介质中,这样的文件一般称为数字声波 文件。
学习目标
了解声音信号的特点、存储格式及质量的度量方
法 理解音频信号压缩方法及音频编码标准 掌握常用的音频处理软件对声音信号进行处理
3.1 音频信息处理基础
音频信息在多媒体中的应用 应用极为广泛:视频图像配以娓 音频信息 应用 娓动听的音乐和语音 ;静态或动态图像配以解说和背景音 乐 ;立体声音乐可增加空间感 ;游戏中的音响效果等。 音频处理技术主要包括电声转换、音频信号的存储、重 音频处理技术主要包括 放技术、加工处理技术以及数字化音频信号的编码、压缩、 传输、存取、纠错等。
以下图所示的原始模拟波形为例进行采样和量化。假设采样 频率为1000次/秒,即每1/1000秒A/D转换器采样一次,其幅度被 划分成0到9共10个量化等级,并将其采样的幅度值取最接近0~ 9 之间的一个数来表示,如下图所示。图中每个正方形表示一次 采样。
D/A转换器 转换器从上图得到的数值中重构原来信号时,得到下 转换器 图中蓝色(直线段)线段所示的波形。从图中可以看出,蓝色线 与原波形(红色线)相比,其波形的细节部分丢失了很多。这意 味着重构后的信号波形有较大的失真。
规则音频是一种连续变化的模拟信号,可用一条连续的曲线 规则音频 来表示,称为声波 声波。因声波是在时间和幅度上都连续变化的量, 声波 我们称之为模拟量 模拟量。 模拟量 用声音录制软件记录的英文单词“Hello” 用声音录制软件记录的英文单词“Hello”的语音实际波形
2.模拟音频信号的两个重要参数 2.模拟音频信号的两个重要参数
3.MPEG音频文件——.MP1/.MP2/.MP3
这里的音频文件格式指的是MPEG标准中的音频部分,即 MPEG音频层(MPEG Audio Layer)。MPEG音频文件的压缩是 一种有损压缩,根据压缩质量和编码复杂程度的不同可分 为三层(MPEG Audio Layer 1/2/3),分别对应MP1、MP2和MP3 这三种声音文件; MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分 别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~ 12∶1,也就是说一分钟CD音质的音乐,未经压缩需要 10MB存储空间,而经过MP3压缩编码后只有1MB左右,同 时其音质基本保持不失真。
3.1.1 音频信号的特点
1.音频信号的分类 1.音频信号的分类
音频信号可分为两类:语音信号和非语音信号 音频信号可分为两类:语音信号和非语音信号。 语音是语言的物质载体,是社会交际工具的符号, 它包含了丰 语音 富的语言内涵,是人类进行信息交流所特有的形式。 非语音信号主要包括音乐和自然界存在的其他声音形式。非语 非语音信号 音信号的特点是不具有复杂的语义和语法信息,信息量低、识 别简单。
相关文档
最新文档