数字音频的采集与处理

数字音频的采集与处理
数字音频的采集与处理

数字音频的采集与处理

一个多媒体系统,如果仅仅是文本、图像、视频和动画的结合,而没有背景声音、音乐等演播支持,即使是五彩缤纷的多媒体演示也会因无声无息而变得十分平淡。在多媒体课件中,适当地运用声音能起到文字、图像、动画等媒体形式无法替代的作用,如调节课件使用者的情绪,引起使用者的注意等。当然,声音作为一种信息载体,其更主要的作用是直接、清晰地表达语意。

本章对多媒体pc机中的数字音频部分进行有关介绍,并就音频处理的问题,为大家介绍一些简单的使用操作方法。

第一节数字音频基础

1.1 数字音频知识简介

1.基本概念

声音本质上是一种机械振动,它通过空气传播到人耳,刺激神经后使大脑产生一种感觉。在一些专业场合,声音通常被称为声波或音频。

声音是物体的振动产生的。物体的振动引起空气的振动,传到人的耳朵以后引起耳膜的振动,通过听觉神经传到大脑,使人听到了声音。这个过程中首先需要振动源(就是发声的物体),同时需要传播振动的介质(在真空中声音是不能传播的),然后才是接收声音的人耳。如果用一个话筒来代替人耳,使得声音的振动转化成电信号,以电信号电压的变化表示声音的变化,这就是模拟音频信号;普通物理学告诉我们,磁和电是一对亲密无间的好兄弟,模拟音频信号可以转化成磁信号,而磁信号可以存储在磁带中,还可以转化成机械轨迹固化在唱片中,这就是模拟音频的录制;在一定的条件下,我们把磁带里的磁信号和唱片里的轨道信号转换成机械振动,再次通过空气来传播,这就是模拟音频的重放。关于模拟音频,就说这几句,说得很简单,对于我们学音乐的朋友,就这样吧!

和1组成的二进位数字),声音信息也不例外。要把连续变化的的模拟音频信号转换成间隔断续的(即离散的、不连续的)数字信号的数列,就产生了两个问题,也就是数字声音的两个基本参数:采样和量化。

来表示声音波形的一个片段。如下图,横向代表时间的过程,往右是时间的增加;纵向代表

声音的强弱,往上是声音振幅的增加。

每一瞬间变化都会引起声音振幅的变化,实际上这是一个连绵不断的过程,我们不可能将所有的变化全都用数字记录下来,只能是在时间轴上每隔一个固定的时间在声音波形曲线上抽取一个点进行一次取值,称为“采样”。采样频率就是每秒钟抽取的点的个数。显然,抽取的点的数量越多越密,取值的结果就会和真正的声音越一致,也就是说采样频率越高音质就越好越真,但是生成的电脑文件的“个头儿”也就越大,所以凡事都得有个限度。技术上常用的采样频率是以下3种:每秒11025次、每秒22050次和每秒44100次,分别标记为11.025KHz、22.5KHz和44.1KHz。

记录下来。我们只能将一定幅度以下的数值变化予以忽略,只用一个数字表示。这就叫做量化。量化位数就是2的平方数字,例如量化位数为4,就是24=16;量化数字为8,就是28=256;量化位数为16,就是216=65536,将声音幅度分为65536份。这已经是很细的划分了,对声音的描述非常精确,远远超过了人耳所能辨别的精度。

。实践中还有一个声道数:单声道、双声道还是更多声道,很好理解,就不多说了。

众所周知,计算机只能处理数字化的信息。声音也不例外,自然的声音振动或用模拟信号表示的声音,都需经过数字化处理才能在计算机中使用。

计算机中广泛应用的数字化声音文件有两类:一类是专门用于记录乐器声音的MIDI 文件;还有一类是采集各种声音的机械振动而得的数字文件(也称为波形文件),其中包括乐器的数字音乐、数字语音及数字化的自然界的效果音(音效文件)等。

2.数字音频处理

大家知道,无论现在的多媒体电脑功能如何强大,其内部也只能处理数字信息。而我们听到的声音都是模拟信号,怎样才能让电脑也能处理这些声音数据呢?还有,究竟模拟音频与数字音频有什么不同呢?数字音频究竟有些什么优点呢?这些都是我们下面所要介绍的。

把模拟音频转成数字音频,在电脑音乐里就称作采样,其过程所用到的主要硬件设备便是模拟/数字转换器(Analog to Digital Converter,即ADC)。采样的过程实际上是将通常的模拟音频信号的电信号转换成许多称作“比特(Bit)”的二进制码0和1,这些0和1便构成了数字音频文件。如下图,图中的正弦曲线代表原始音频曲线;填了颜色的方格代表采样后得到的结果,二者越吻合说明采样结果越好。

上图中的横坐标便是采样频率;纵坐标便是采样分辨率。图中的格子从左到右,逐渐加密,先是加大横坐标的密度,然后加大纵坐标的密度。显然,当横坐标的单位越小即两个采样时刻的间隔越小,则越有利于保持原始声音的真实情况,换句话说,采样的频率越大则音质越有保证;同理,当纵坐标的单位越小则越有利于音质的提高,即采样的位数越大越好。有一点请大家注意,8位(8Bit)不是说把纵坐标分成8份,而是分成2^8=256份;同理16位是把纵坐标分成2^16=65536份;而24位则分成2^24=16777216份。现在我们来进行一个计算,看看一个数字音频文件的数据量到底有多大。假设我们是用44.1kHz、16bit来进行立体声(即两个声道)采样,即采样成标准的CD音质(也称作红皮书音频)。那么就是说,一秒钟内采样44.1千次,每次的数据量是16×2=32bit(因为立体声是两个声道)。而大家知道,一个字节(Byte)含有8个位(Bit),那么一秒钟内的数据量便是44.1k×32bit /(8bit / Byte)=176.4 kByte。一个汉字在电脑里占用两个字节,那么176.4kB的空间可以存储176.4k / 2=88200个汉字,也就是说一秒钟的数字音频数据量与近九万个汉字(一部中篇小说)的数据量相当。由此可见,数字音频文件的数据量是十分庞大的。

也许有人会问,为什么要把CD音质的采样频率规定成44.1kHz而不是其他的频率呢?

这个问题问得好。44.1kHz意味着每秒采样四万多下,这会不会太多了点呢?究竟每秒采样多少次才算合理呢?大家请看下图。图中,上半部分表示原始音频的波形;下半部分表示录制后的波形;红色的点表示采样点。

大家可以发现,上下波形之所以不吻合,是因为采样点不够多,或严谨一点说,是采样频率不够高。这种情况,我们称之为低频失真。

一个常见的低频失真的例子便是电影上车辆行驶时车轮转动的情况(一个典型的“马车轮”效应的例子)。你也许早已发现,飞快转动的车轮有时看起来似乎是静止不动甚至会向反方向转动(类似的情况也发生在直升飞机的翼片和螺旋浆上面)。关于合理的采样频率这一问题在Nyquist(奈奎斯特)定理中早已有明确的答案:要想不产生低频失真,则采样频率至少得是录制的最高频率的两倍(上图中,采样频率只是录制频率的4/3倍)。这个频率通常称作Nyquist极限。

在正常的音乐中,最高的音符也只不过7kHz-8kHz,这似乎意味着16kHz的采样频率便已足够。其实这7、8kHz仅仅表示基音的音高,还有大量的泛音未包括在内,故用这种方法来定采样频率是十分不科学的。其实,所谓“不失真”,换句话说便是“人们听不到失真”。人类的听力范围是20Hz-20kHz,所以采样频率至少得是20k×2=40kHz便可保证不产生低频失真。CD音质的44.1kHz正是这样制定出来的(略高于40kHz是为了留有余地)。按照Nyquist定理,这样的采样频率可以保证即使是22.05kHz的超声波也不会产生低频失真。而音频的工业标准所规定的48kHz采样频率(如DAT,Digital Audio Tape)则有更高的Nyquist极限,满足更苛刻的要求。

那么数字音频又是如何播放出来的呢?首先,将这些由大量数字描述而成的音乐送到一个叫做数/模转换器(Digital to Analog Converter,即DAC)的线路里。它将数字回变成一系列相应的电压值,然后通过有助于稳定的保持线路,最后将信号由低通滤波器输出。这样,

比较平缓的具有脉动电压的模拟信号可继续发送至放大器和扬声器,电流经过放大再转变成声音。

相对应的模拟音频又是怎样录制与播放的呢?首先,声波通过麦克风,空气分子的振动转变为电信号的波动(数字录音也必需经过这一步)。录音磁头的电磁铁根据通过电流的大小而产生大小不同的磁场,磁场的变化情况会相应的记录在磁带上(实际上是磁带上的磁粉排列发生了变化),这样便完成录音过程。播放时,放音磁头读出印记在磁带上的磁场大小变化的情况(即磁粉的排列位置),并转变为相应的电信号。之后的情况与数字音频的播放完全类似,即这些波动的电信号(模拟信号)继续传送至放大器和扬声器,电信号重新转变为声音(即空气分子的振动)。

说到这里,我们可以理解数字录音的好处了。首先,录制好的音乐是以数字来储存的,而数字的传输错误率是相当低甚至是可以避免的,所以录制好的音乐可以多次复制而效果不减(这在制作过程中十分重要)。而模拟信号则每传输一次就失真一次。而且,模拟录音的本底噪音很大,要想满足严谨的录音要求则需要购买复杂而又昂贵的设备,操作也十分繁琐。况且,处理数字信息是电脑的拿手好戏,只需面对显示器,所有的工作都可以弹指一挥间完成。正是基于以上这些优点,使得建立一个家庭工作室(Home Studio)显得非常具有吸引力,并且技术上也成为可能。

3.数字音频与MIDI的比较

现在我们用的最多的音频名词之一MIDI(musical instrument digital interface)是作为“乐器数字接口”的缩写出现的,并用它来泛指数字音乐的国际标准。由于它定义了计算机音乐程序、合成器及其他电子设备交换信息和电子信号的方式,所以可以解决不同电子乐器之间不兼容的问题。另外,标准的多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音乐,所需的存储量最少。

至于MIDI文件,是指存放MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个通道的演奏定义。文件包括每个通道的演奏音符信息:键通道号、音长、音量和力度(击键时,键达到最低位置的速度)。由于MDDI文件是一系列指令,而不是波形,它需要的磁盘空间非常少;并且现装载MIDI文件比波形文件容易的多。这样,在设计多媒体节目时,我们可以指定什么时候播放音乐,将有很大的灵活性。在以下几种情况下,使用

MIDI文件比使用波形音频更合适:需要播放长时间高质量音乐,如想在硬盘上存储的音乐大于4分钟,而硬盘又没有足够的存储容量;需要以音乐作背景音响效果,同时从CD-ROM 中装载其它数据,如图像、文字的显示;需要以音乐作背景音响效果,同时播放波形音频或实现文一语转换,以实现音乐和语音的同时输出。

音频媒体有数字音频、合成MIDI音频和CD音频三种形式。

数字音频大多是波形文件,也成W A V文件,可以是录制的声音,比如解说和音响效果。数字音频是声音的实际表示,它代表了声音的瞬间幅度。因为它与设备无关,任何一种具有声卡功能的设备都可以播放,每次播放时它都放出相同的声音。

实验13、CoolEdit数字音频处理剖析

实验13、CoolEdit数字音频处理 实验课时: 课内:2课时;课外:1课时 实验目的: 了解音频数据的特性及其获取和处理的方法,学会使用音频编辑工具CoolEdit进行音频数据的录制、编辑和播放 实验内容: 操作准备 1.在D:或E:分区创建一个以你的“完整学号+姓名”命名的文件夹(名称应类似: 198009010001文立斌),我们把这个文件夹简称为“你的文件夹” 2.以下操作步骤中所涉及的198009010001、文立斌均应替换成你的学号、姓名 3.准备好音频实验环境,个别人物需要准备麦克风、音箱(或耳机) 任务一、音频提取 1.打开CoolEditPro软件 2.如下图所示,单击工具栏最左边的按钮切换到波形编辑界面 → 3.依次执行菜单命令【文件】→【从视频文件中提取】,通过系统显示的“选择视频文件” 对话框选定“说唱脸谱.dat”文件后单击【打开】按钮,系统开始从“说唱脸谱.dat” 中提取音频 4.等待系统提取音频结束后,执行菜单命令【文件】→【另存为】,将提取到的波形保存 为类似“文立斌A.wma”(.wma格式)的文件 任务二、淡入淡出 1.打开CoolEditPro软件 2.如下图所示,单击工具栏最左边的按钮切换到波形编辑界面 → 3.依次执行菜单命令【文件】→【打开】,通过系统显示的“打开波形文件”对话框选定 “最炫民族风.mp3”文件后单击【打开】按钮打开该文件,原始波形编辑面板类似:

4.单击视窗左下角录播工具面板中的播放按钮,试听歌曲,确定演唱(人声)从何时(第 几秒)开始——大约是第23秒! 5.如下图所示,在波形编辑面板中以鼠标拖拽的方式选定最前面23秒波形: 如果需要精确选定波形区域,您还可以借助视窗右下角的如下面板,直接输入始末时间: 6.依次执行菜单命令【效果】→【波形振幅】→【渐变】,如下图所示,在“波形振幅” 对话框中,选择“Fade in”(淡入),然后单击【确定】按钮: 7.系统进行淡入处理后的波形类似: 您应该对照一下处理前后的前23秒波形的异同 8.试听,您应该能听到淡入处理的效果(音量越来越大)才对! 9.从4分20秒位置开始选定直到音频结束处的波形,为选定的波形添加淡出效果,处理 第2页

数字音频处理器中文使用说明

MAXIDRIVER3.4数字音频处理器 ALTO MAXIDRIVER3.4数字处理器是集增益、噪声门、参数均衡、分频、压缩限 幅、延时为一体的全功能数字音频处理器,具有2个输入通道和6个输出通道,本机内设10种工厂预设的分频模式,64个用户程序数据库位置以及利用多媒体卡(MMC)进行128个用户程序外置储存的功能。MAXIDRIVER3.4是新一代全数字音 频处理器,采用分级菜单形式,操作非常方便。 功能键介绍 前面板 1、MODE---分级菜单选择,按动时循环选择PRESET(预设)、DELAY(延时)、EDIT(编辑)、UTILITY(系统设置)菜单功能。同时相对应的LED指示灯会被点亮。这时可以进入所选择的菜单进行参数编辑。 2、LED指示灯---当你用MODE键选择需要编辑的菜单时,相对应的LED指示 灯会被点亮。 3、2X16位LCD显示屏---显示正在编辑或查看的系统参数或系统状态。 4、数据轮---转动这个数据轮可以调节需要编辑的参数的数值,顺时针旋转提高数值,逆时针旋转减低数值。 5、PREV/NEXT---前翻/后翻键,每个主菜单下面都有若干个子菜单,通过按动这两个按键可以向前或向后选择所需要进行编辑的子菜单。 6、NAVIGATION CURSOR KEYS---光标移动键,每个子菜单中都有若干个可以 编辑的参数选择,按动这两个键,可以选择需要编辑的参数,选中的参数会闪烁。 7、CARD---储存卡插入口,在这个插口插入MMC储存卡,利用PRESET(预设) 菜单下,可以对该储存卡进行写入、读出等操作。 8、ENTER---确认键,按此键可以对所选择的菜单或编辑的参数数值进行确认。 9、ESC---取消键,按此键可以对所选择的菜单或编辑的参数数值进行取消操作,返回上一级菜单。 10、输入电平指示表,实时指示A/B两个输入通道输入电平的强弱数值。 11、MUTE---静音按键,按下后将关闭相应输出通道的输出信号,相对应的 红色LED指示灯将点亮。 12、输出电平指示表,显示每个输出通道输出电平大小数值,这里显示的数 值不是绝对的输出电平数值,而是与该列LED指示灯中的LIMIT(限幅)指示为基础相比较的数值。

数字音视频处理

实验报告 课程名称数字音视频原理 实验题目MATLAB音频文件处理 专业电子信息工程 班级3班 学号09080323 学生姓名王志愿 实验成绩 指导教师吴娱 2012年3月 一、实验目的 1、掌握录制语音信号的基本过程; 2、掌握MATLAB编程对语音信号进行简单处理的方法并分析结果。 二、实验要求

上机完成实验题目,独立完成实验报告。 三、实验内容 1、问题的提出:数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢? 信号是传递信息的函数。离散时间信号(序列)——可以用图形来表示。 按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种: (1)连续时间信号:在连续时间范围内定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。 (2)离散时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。 (3)数字信号:时间离散而幅度量化的信号。 语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余弦波,余弦平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。 2、设计方案: 首先要对声音信号进行采集,Windows自带的录音机程序可驱动声卡来采集语音信号,并能保存成.WAV格式文件,供MATLAB相关函数直接读取、写入或播放。 利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波。对于波形图与频谱图(包括滤波前后的对比图)都可以用MATLAB画出。我们还可以通过sound/wavplay命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 3、主体部分: (1)语音的录入与打开: [x,fs,bits]=wavread('d:\1.wav');%用于读取语音,采样值放在向量x中,fs 表示采样频率(Hz),bits表示量化位数。

BIAMP Nexia CS数字音频处理器

BIAMP Nexia CS数字音频处理器 [会议系统]适用于需要大量话筒的应用环境,诸如法庭,会议室,理事会等场合。 Nexia CS是一台数字信号处理器,配有10路话筒/线路输入和6路独立的混合输出,可满足会议室、法庭和理事会等场合的会议应用。Nexia的设计软件中提供了大量的路由选择、信号处理等模块,用户可以通过PC软件来对系统进行搭积木式的设计。通过控制软件的屏幕、RS-232接口或者其他兼容的遥控设备可以对Nexia CS进行控制。利用以太网和NexLink数字音频接口,多台Nexia 设备可以联机构成大系统工作。 特性: 10路平衡式话筒/线路输入,采用裸线接口端子。 6路平衡式输出,采用裸线接口端子。 以太网接口用于软件设置/控制。 串行接口用于第三方RS-232远程控制。 远程控制母线用于特制的控制面板。 NexLink接口用于多台设备联机工作。 NEXIA软件,可工作在WindowsNT4.0/2000/XP。 固定数量的输入输出接口,内部处理可自由设定。 具有混合、线路交换、组合、均衡、延时、控制等多种功能。 CE认证标志,通过CSA UL6500标准测试。 设计师和工程师用指标说明 数字会议系统应该具备10路配有裸线接口端子的平衡式话筒/线路输入和6路配有裸线接口端子的平衡式线路输出。输入输出都是模拟信号,设备内部采用24-bit量化、48kHz取样频率进行模拟/数字和数字/模拟转换。所有的内部处理都是数字处理。采用NexLink连接后,允许在多台设备间共享数字音频信

号。 可以用软件来创建或者连接每一台硬件设备中数字信号处理组件。可选用的系统组件应该包括(并不限定于):调音台、均衡器、分频器、动态增益控制器,路由选择、延时器、远程控制器、电平表、信号发生器以及诊断器。软件设置和控制可通过以太网连接进行操作。设定完成之后,处理器可以通过软件显示屏进行控制。第三方RS-232控制系统和第三方遥控设备都可以用来控制本设备。软件可以在一台工作在Windows NT4.0/2000/XP下,配有网卡的个人电脑下运行。 Nexia CS就是满足以上要求的数字会议系统。 各模块界面: (1)输入/输出模块界面 输入/输出10进6出界面 (2)其它模块界面与Nexia SP相同。

教你怎样使用数字音频处理器

怎样使用数字音频处理器现在数字音频处理器越来越多地运用到工程当中了,对于有基础有经验的人来说,处理器是一个很好用的工具,但是,对于一些经验比较欠缺的朋友来说,看着一台处理器,又是一大堆英文,不免有点无从下手。其实不用慌,我来介绍一下处理器使用步骤,以一个2进4出的处理器控制全频音箱+超低音音箱的系统为例 1、首先是用处理器连接系统,先确定好哪个输出通道用来控制全频音箱,哪个输出通道用来控制超低音音箱,比如你用输出1、2通道控制超低音,用输出3、4通道控制全频。接好线了,就首先进入处理器的编辑(EDIT)界面来进行设置,进入编辑界面不同的产品的方法不同,具体怎么进入,去看说明书。 2、利用处理器的路由(ROUNT)功能来确定输出通道的信号来自哪个输入通道,比如你用立体声方式扩声形式,你可以选择输出通道1、3的信号来自输入A,输出通道的2、4的信号来自输入B。信号分配功能不同的产品所处的位置不同,有些是在分频模块里,有些是在增益控制模块里,这个根据说明书的指示去找。 3、根据音箱的技术特性或实际要求来对音箱的工作频段进行设置,也就是设置分频点。处理器上的分频模块一般用CROSSOVER或X-OVER表示,进入后有下限频率选择(HPF)和上限频率选择(LPF),还要滤波器模式和斜率的选择。首先先确定工作频段,比如超低音的频段是40-120赫兹,你就把超低音通道的HPF设置为40,LPF设置为120。全频音箱如果你要控制下限,就根据它的低音单元口径,设置它的HPF大约在50-100Hz,。处理器滤波器形式选择一般有三种,bessel,butterworth和linky-raily,我以前有帖子专门说明过三种滤波器的不同之处,这里不赘述。常用的是butterworth和linky-raily两种,然后是分频斜率的选择,一般你选24dB/oct就可以满足大部分的用途了。 4、这个时候你需要检查一下每个通道的初始电平是不是都在0dB位置,如果有不是0的,先把它们都调到0位置上,这个电平控制一般在GAIN功能里,DBX的处理器电平是在分频器里面的,用G表示。 5、现在就可以接通信号让系统先发出声音了,然后用极性相位仪检查一下音箱的极性是否统一,有不统一的,先检查一下线路有没有接反。如果线路没接反,而全频音箱和超低音的极性相反了,可以利用处理器输出通道的极性翻转功能(polarity或pol)把信号的极性反转,一般用Nomal或“+”表示正极性,用INV或“-”表示负极性。 6、接下来就要借助SIA这类工具测量一下全频音箱和超低音的传输时间,一般来说是会有差异的,比如测到全频的传输时间是10ms,超低音是18ms,这个时候就要利用处理器的延时功能对全频进行延时,让全频和低音的传输时间相同。处理器的延时用DELAY或DLY表示,有些用m(米)有些用MS(毫秒)来显示延时量,SIA软件也同时提供了时间和距离的量,你可以选择你需要的数据值来进行延时 7、接下来就该进行均衡的调节了,可以配合测试工具也可以用耳朵来调,处理器的均衡用EQ来表示,一般都是参量均衡(PEQ),参量均衡有3个调节量,频率(F),带宽(Q 或OCT),增益(GAIN或G)。具体怎么调,就根据产品特性、房间特性和主观听觉来调了,这个就自己去想了。 8、均衡调好后,就要进行限幅器的设置了,处理器的限幅器用LIMIT来表示,进去以后一般有限幅电平(THRESHOLD),压缩比(RA TIO)的选项,你要做限幅就要先把压缩比RA TIO设置为无穷大(INF),然后配合功放来设置限幅电平,变成限幅器后,启动时间A TTACK和恢复时间RELEASE就不用去理了。DBX处理器的限幅器用PEAKSTOP来表示,启动后,直接设置限幅电平就可以了,至于怎么调限幅器,我有专门的帖子,自己去看。 9、都调好了就要保存数据,处理器的保存一般用STORE或SA VE表示,怎么存,就看产品说明书了。

(完整版)数字音频处理

数字语音实验 吕佩壕 10024134 一、实验要求 1.编程实现一句话语音的短时能量曲线,并比较窗长、窗口形状(以直 角窗和和哈明窗为例)对短时平均能量的影响 ; 2. 编程分析语音信号的短时谱特性,并比较窗长、窗口形状(以直角窗 和和哈明窗为例)对语音短时谱的影响 ; 3. 运用低通滤波器、中心削波和自相关技术估计一段男性和女性语音信 号的基音周期,画出基音轨迹曲线,给出估计准确率。 二、实验原理及实验结果 1.窗口的选择 通过对发声机理的认识,语音信号可以认为是短时平稳的。在5~50ms 的范围内,语音频谱特性和一些物理特性参数基本保持不变。我们将每个短时的语音称为一个分析帧。一般帧长取10~30ms 。我们采用一个长度有限的窗函数来截取语音信号形成分析帧。通常会采用矩形窗和汉明窗。图1.1给出了这两种窗函数在窗长N=50时的时域波形。 图1.1 矩形窗和hamming 窗的时域波形 矩形窗的定义:一个N 点的矩形窗函数定义为如下: {1,00,()n N w n ≤<=其他 Hamming 窗的定义:一个N 点的hamming 窗函数定义为如下: 0.540.46cos(2),010,()n n N N w n π-≤<-??? 其他 = 这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发 0.2 0.40.60.811.2 1.41.61.82矩形窗 sample w (n ) 0.1 0.20.30.40.50.6 0.70.80.91hanming 窗 sample w (n )

现(如图1.2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;汉明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。表1.1对比了这两种窗函数的主瓣宽度和旁瓣峰值。 图1.2 矩形窗和Hamming 窗的频率响应 2.短时能量 由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为: 2 2 1 [()()] [()()]n n m m n N E x m w n m x m w n m ∞ =-∞ =-+= -= -∑∑ ,其中N 为窗长 特殊地,当采用矩形窗时,可简化为: 2 () n m E x m ∞ =-∞ = ∑ 图2.1和图2.2给出了不同矩形窗和hamming 窗长,对所录的语音“我是吕佩壕”的短时能量函数: (1)矩形窗(从上至下依次为“我是吕佩壕”波形图,窗长分别为32,64,128,256,512的矩形窗的短时能量函数): 00.10.20.3 0.40.50.60.70.80.91 -80 -60-40-20 0矩形窗频率响应 归一化频率(f/fs)幅度/d B 00.10.20.3 0.40.50.60.70.80.91 -100 -50 Hamming 窗频率响应 归一化频率(f/fs) 幅度/d B

数字音频处理器参数

1. 扩声系统升级改造 (1)新增2台数字音频处理器。该处理器需要和原有视频会议系统、数字会议系统、讲台话筒、现场图传背包TVU系统、无线麦克风、控制室电脑、有线电视等信号源(原调音台连接图附件1图1所示)和新增录播系统进行音频集成,实现各系统音频信号的任意路由和控制。处理器具备12进8出,12路输入通道带AEC回声消除功能,拥有AVB网络接口,支持多达128X128AVB网络,具备 Speech Sense (语音触发技术)和 Sona AEC (回声消除技术)的新型处理算法,信号处理可通过软件直观的配置和控制,如:信号路由和混音、均衡、滤波、动态处理、延迟等。 (2)新增会场前后方音箱。在大厅前方选用2只柱状线列阵音箱,铰接列阵与线性列阵技术的结合,在大厅中后场两侧柱子上壁挂两只补声音箱,以满足中后场的声压级。 整个扩声系统改造后需要符合会场声学环境要求,声音清楚无回声,声音大小符合会场扩声需求。声学特性指标按中华人民共和国国家标准GB50371-2006《厅堂扩声系统设计规范》要求,列表如下: 2. 中控系统升级改造 新购一套中控系统,系统需具有双网卡功能,局域网端口用于连接主机到外部网络,ICSLAN端口连接AMX设备或其他第三方A/V设备使其独立于主要网络;同时支持IPv6和802.1X网络标准和特性;支持灵活的编程应用实现(RPM,NetLinx和Java);具有向后和跨平台的兼容性;具有自动诊断功能,能自动检测断线或连接错误的串口和红外端口;程序文件支持从USB驱动器导入/导出。 中控系统需要和原有及新增系统高度集成,将音频、视频、灯光、升降器、大屏控制等进行集中控制管理,能完成所有原系统控制部分的操作,支持一键式的模式切换,同时可支持此项目新购系统的统一控制。原中控系统连接示意图如下图所示:

第3章_音频处理技术

一、选择题 1、下列选项不属于多媒体组成部分的是:( C )。 A、视频 B、声音 C、像素 D、文字 2、声波不能在( D )中传播。 A、水 B、空气 C、墙壁 D、中空 3、下列选项不属于声音的重要指标的是:( B )。 A、频率 B、音色 C、周期 D、振幅 4、下列选项表示波的高低幅度即声音的强弱的是:( D )。 A、频率 B、音色 C、周期 D、振幅 5、下列选项表示两个相邻的波之间的时间长度的是:( C )。 A、频率 B、音色 C、周期 D、振幅 6、下列选项表示每秒中振动的次数的是:( A )。 A、频率 B、音色 C、周期 D、振幅 7、自然界的声音是——信号,要使计算机能处理的音频信号必须将其——, 这种转换过程即声音的数字化。 (A/D) A. 连续变化的模拟离散化 B. 离散变化的模拟连续化 C. 连续变化的数字离散化 D. 离散变化的数字连续化 8、对声音信号进行数字化处理,是对声音因信号——。 (D) A. 先量化再采样 B. 仅采样 C. 仅量化 D. 先采样再量化 9、对声音信号进行数字化处理首先需要确定的两个问题是——。 (A) A. 采样频率和量化精度 B. 压缩和解压缩 C. 录音与播放 D. 模拟与压缩 10、对声音信号进行数字化时,间隔时间相等的采样称为——采样。 (B) A. 随机 B. 均匀 C. 选择 D. 模拟 11、对声音信号进行数字化时,用多少哥二进制位来存储表示数字化声音的 数据,称为——。 (D) A. 采样 B.采样频率 C.量化 D.量化精度 12、对声音信号进行数字化时,每秒钟需要采集多少个声音样本,称为——。 (B) A. 压缩 B. 采样频率 C. 解压缩 D. 量化精 13、乃奎斯特采样理论指出,采样频率不超过声音最高频率的(B)倍 A. 1 B. 2 C.3 D.4 14、满足奈奎斯特采样理论,则经过采样后的采样信号(A) A.可以还原成原来的声音 B.不能还原成原来的声音 C.是有损压缩 D.模拟声音 15、从听觉角度看,声音不具有(C)要素 A.音调 B.响度 C.音长 D.音色 16、声音的高低叫做(),他与频率(B) A.音调无关 B.音调成正比C.音调成反比D.响度无关 17、下列表示人耳对声音音质的感觉的是(C) A.音调 B.响度 C.音色 D.音量 18、从电话,广播中分辨出是熟人的根据(A)的不同,它是由谐音的多寡,各 谐音的特性决定的 A.音色 B.响度 C.频率 D.音调

音频、视频采集与处理知识点整理

音频、视频采集与处理相关知识点 知识点整理: 1.音频数字化及存储量的计算 数字化音频是指通过采样和量化把模拟音频信号转换成由二进制数码“0”或“1”组成的数字化音频文件。 采样频率是指将单位时间的音频波形分隔成的点数,单位为赫兹(HZ)。采样频率决定了声音采集的质量,采样频率越高,声音的质量越好,存储容量越大。 量化位数是指将采样得到的点实现用二进制编码表示。量化位数越大,其量化值越接近采样值,即精度越高,所以存储量也越大。 常见的wave文件所占存储量的计算公式: 存储量(字节)=采样频率*量化位数*声道数*时间(秒)、8 2.声音素材的采集 声音素材的获取途径:成品声音文件的使用、声音素材的截取等。 声音文件的录制分硬件设备和软件录制两个部分。硬件设备主要需要声卡、话筒等。常用的声音录制与编辑软件有:GoldWave、录音机、Cool Edit、Wave Edit等。 3.声音的基本处理 通过GoldWave软件的状态栏,观察打开声音文件的采样频率、量化位数、声道数、声音长度、文件格式等信息。利用GoldWave软件可以对音频文件进行删除、剪裁、设置静音、淡入、淡出、音量调整、合成等操作。 (1)用GoldWave软件进行声音素材的处理: ①打开的音频文件在状态栏显示的参数信息:

②选取音频文件中的部分音轨信息 方法一:通过“设标”按钮,设置基于时间位置的“开始”和“结束”的时间参数。 如下图所示: 方法二:借助“开始标记线”和“结束标记线”。这种方法对音频区间的选取在时间不是很准确,要做好相对准确,可以事先将音频文件放大。 注意:如果需要选择立体声音频中某一声道的音轨信息,需要先进行声道选择。如需选择“左声道”中1:00分钟——3:00分钟的音轨信息,则可以先通过“编辑”菜单中的“声道”去指定处理的音频是左声道还是右声道。 ③选中的音频信息的执行删除、剪裁操作 :“开始标记”和“结束标记”之间的这段音频素材被删除。 :“开始标记”和“结束标记”之间的这段音频素材被保留下来。 ④选中的音频信息淡入、淡出效果的设置 淡入:实现声音音量由小到大的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡入”,并设置好初始音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 淡出:实现声音音量由大到小的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡出”,并设置好最终音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 ⑤选中的音频信息更改音量效果的设置 选中音频信息,选择“效果”菜单中的“音量”→“更改音量”,并设置好音量或预设的参数。其中音量单位为分贝(dB),正值为音量增加,负值为音量减少。

Biamp_Nexia数字音频处理器介绍

B i a m p N e x i a音频处理器介绍 编者案:传统扩音都是由调音台、音频处理、功放和音箱组成,设备众多,总投资不菲。而非专业音频的用户往往不会操作,刚调好的一个声场,几个月后已经是惨不忍睹。在数字化的今天,我们迎来 更加符合现代数字音视频集成工程应用的需要。 1.?前言 Biamp Nexia 于1976年在美国俄勒冈州注册,最早是生产高品质的音乐器材,紧随着专业音频技术的发展,逐步转型生产专业音频处理设备。1996年生产出第一台Audia数字媒体矩阵,2003年推出智能话筒混音器、单声道/立体声线路混音器,功率放大器系列,同年推出专门针对中小型多媒体会议系统的NEXIA系列小型媒体矩阵(PM CS SP)。当远程会议走入人们视线时,Biamp也在2006年生产了专门针对远程会议的Nexia TC&VC.基于他们生产音乐器材的背景和对声音的热爱,他们对声音有很高的要求,同时也把这样的要求应用到所有产品中,而且把高品质声音作为产品生产的第一位。应用范围很广,涉及政府、学校、公交、以及视频会议系统、体育场馆扩声工程,并享有很高的赞誉。在国际信息化产业联盟ICIA公布的最佳系统集成固定安装类产品大奖中,BIAMP公司的产品被权威期刊评为“最佳DSP处理大奖”。2003年进入中国市场,市场份额逐年上升; 你的远见可以成为现实 Nexia系列产品根据工程中遇到的现实问题而量身定做的。很多客户往往预算紧张,但对声音质量的要求却毫不妥协,并且希望联网遥控。通过创新的数字信号处理技术,Nexia以小巧的外形提供了远胜于模拟系统的解决方案。 通过标配的Nexlink接口,最多可以4台Nexia设备级联成系统,彼此交换数字音频信号,并共享DSP资源。再配合VS8这样人性化的线控面板,一个灵活而实用的数字音频系统就展现在你的面前。高雅、简洁而且功能强大,在每天的日常实用中稳定地发挥效能。 Nexia软件:易于使用、精于设计。 界面直观、操作简单、功能强大,Nexia软件允许您以搭积木的方式进行系统设计。所有的设计操作都在同一个界面下完成,无需反复在不同页面间切换。令设计、修改,甚至推翻重来这一切工作都变 为使工程项目进展更快,所有Nexia产品出厂时都包含了标准的音频系统设计,通电就能使用!如果您有特殊需求,也可以对工厂内置的系统设计进行修改,实现您的梦想! 线控组件:人性外观,简洁有效。

分频器数字音频处理器功放音响

精心整理 在一套音响系统中提到分频器一般来说是指能将:20Hz--20000Hz 频段的音频信号分成合适的、不同的几个频率段,然后分别送给相应功放,用来推动相应音箱的一种音响周边设备。由于它是一种用来处理、分配音频频率信号的电子设备,所以我们通常也叫它:电子分频器。电子分频器的详细功能和工作原理我就不多说了,这里我只是侧重于对一些大家比较重视或经常感到困惑的方面做一些通俗易懂的介绍,希望能对大家有所帮助! 一、我们为什么要使用电子分频器 我们音响师研究电声和现在电声设备与技术的不断发展都是为了一个目的:就是要尽量忠实的再123频率( 1、我们可以用电子分频器将高频信号通过功放送到高音扬声器中. 2、可以用电子分频器将中频信号通过功放送到中音扬声器中。 3、可以用电子分频器将低频信号通过功放送到低音扬声器中。 这样高、中、低频信号独立输出、互不干涉,因此可以尽可能发挥不同扬声器的工作频段优势,使音响系统中各频段声音重放显得更加均衡一些,使声音更具层次感,使音色更加完美。这也就

是我们为什么使用电子分频器的原因了。 二、电子分频器的作用和特点 通过以上的介绍大家应该对电子分频器有一个大体认识了吧,那么使用分频器还有哪些作用和特点,甚至是缺点呢?根据多年的工作经验我总结了下面几点: (一)、作用和特点 1、基本分频任务:由于现在音箱的种类很多,系统中要采用什么功能的、几分频的电子分频器还是要灵活配置的,现在通常用的电子频器有2分频、3分频、4分频等区分,超过4分频就显得太复杂和无实际意义了。当然现在的电声技术日新月异,目前还有一些分频器在分频的同时还可以对音频信号进行一些其它方面的处理,但不管什么类型电子分频器的主要功能和任务当然还是分频了。 2、 15寸3、 (二) 1 2、 声音来,但如果经过了电子分频器分频后在200Hz以上频率工作的话,那这只音箱的丰满度和震撼力就会全没有了,因为此时音箱的低音给电子分频器切掉了。同样情况下我们利用电子分频器也切掉了大部分低音音箱的高音部分,虽然这样音色可能会好听了,但不可否认的是低音音箱也浪费掉了大量的能量。这对于音箱数量较多又注重音色的音响系统来说还无所谓,但如果一套音响系统中音箱数量不多又不注重音色只是要大声些,那此时还是不使用电子分频器现实一些。 3、分配频率不合理会导致设备损坏:上面说了合理使用电子分频器可以保护设备,同样电子分频器还是一把双刃剑,使用不当的话反而会损害设备:例如我们把从电子分频器里分出的高音信号送给了低音音箱,由于低音喇叭发不出这么高频率的声音来,所以此时的现象就是:高音音箱和低音音箱都不会有声音。如果有些音响师不看原因,只是一味的增加前级信号和后级功放的音量,那结果就是增加再大的音量也没有用。此时还会很容易损害功放,而且要是电平信号大到失真还容易烧坏扬声器,别以为低音音箱没有声音就没有事了,毕竟此时已经有很大的电流在通过

最新数字音视频制作讲义

数字音视频制作讲义 主讲:黄雅 办公电话:85220308 办公地点:科学馆611 一、数字音、视频基础 1、音频 (1)音频的数字化过程包括采样和量化两个步骤。 ?采样:每隔一段相同的时间间隔读一次波形的振幅,并记录下来。 这就跟我们中学代数画曲线图是一样的。把x轴定为时间轴,把y轴定为采样值,假设单位时间定为0.1微秒,每隔0.1微秒读一次波形的振幅,最后用曲线把这些点连接起来,那么就形成了一段波形。我们把采样的频率简称为采样率,由此可见,采样率越高获得的波形也就越精确。 ?量化:将采样得到的在时间上连续的信号加以数字化,使其变成在时间上不连续的 信号序列。 例如,在0~10V之间的电压有无穷多个数,但只用0,1,2,…,9共10个数来近似表示时,像0.15,0.001这一类的数就都要用0表示,但如果是用0,1,2,…,100共100个数来表示时,像0.001还是用0来表示,但0.15就可以用0.1来表示了,这样数据就精确一些了。显然,用来表示一个电压值的数位越多,得到的数据就越精确。 ?采样率和量化位数越高,音频的质量就越高,存储空间越大。 ?我们常用44100Hz的采样率,双声道,16位来录制声音。 ?声音文件大小=采样频率×量化位数×声道数×时间(s)/8 (2)声卡的原理 ?数字音频和模拟音频之间要进行转化必须依靠声卡。

line out(绿色,接音箱) line in(蓝色,线路输入) Mic in(红色,接麦克风) (3)音频媒体的格式 数字音频的存储格式,常见的有以下几种: ?WAV文件是一种波形文件,是声音的实际表示,质量高,存储空间大; ?MP3文件是经过压缩后的声音文件,存储空间比较小。 ?除此以外还有合成MIDI音频、CD音频等等。 2、视频 (1)计算机常用视频的参数是: 全屏为800×600或1024×768的分辨率,30帧/秒的刷新速度,24位的采样深度。 (2)常用数字视频的格式 ?A VI文件格式未经压缩,容量非常大.avi ?QuickTime格式(MPEG4标准文件格式) .mov ?MPEG格式经压缩,容量为A VI文件的1/6 ?Video CD和Karaoke CD格式 ?RealVideo格式等等。 二、音、视频软件的使用 (一)用豪杰超级解霸3000将所需要的视频素材截取下来,保存成MPEG格式。 (二)用豪杰超级解霸的“MP3数字CD抓轨”工具从CD中把音乐抓取下来,并生成MP3格式。 (三)用Cool Edit进行声音的录制和编辑。 (四)用Premiere对视、音频素材进行编辑,生成A VI文件。 (五)用豪杰超级解霸的“A VI转MPEG”工具对生成的A VI文件进行格式转换,缩小文件容量。 (一)豪杰超级解霸3000的视频截取功能 豪杰超级解霸3000的“循环选择开关”、“选择开始点”、“选择结束点”、 “录像”这四个按钮结合使用,可实现录像功能,将指定区域录制为MPG或MPV文件。解霸在播放或停止状态均可录像,录像指定区域为MPG或MPV文件。 1、打开豪杰超级解霸3000,并放入VCD,播放。

数字音频处理器参数

数字音频处理器参数 Prepared on 24 November 2020

1. 扩声系统升级改造 (1)新增2台数字音频处理器。该处理器需要和原有视频会议系统、数字会议系统、讲台话筒、现场图传背包TVU系统、无线麦克风、控制室电脑、有线电视等信号源(原调音台连接图附件1图1所示)和新增录播系统进行音频集成,实现各系统音频信号的任意路由和控制。处理器具备12进8出,12路输入通道带AEC回声消除功能,拥有AVB网络接口,支持多达128X128AVB网络,具备 Speech Sense(语音触发技术)和 Sona AEC (回声消除技术)的新型处理算法,信号处理可通过软件直观的配置和控制,如:信号路由和混音、均衡、滤波、动态处理、延迟等。 (2)新增会场前后方音箱。在大厅前方选用2只柱状线列阵音箱,铰接列阵与线性列阵技术的结合,在大厅中后场两侧柱子上壁挂两只补声音箱,以满足中后场的声压级。 整个扩声系统改造后需要符合会场声学环境要求,声音清楚无回声,声音大小符合会场扩声需求。声学特性指标按中华人民共和国国家标准GB50371-2006《厅堂扩声系统设计规范》要求,列表如下: 2. 中控系统升级改造 新购一套中控系统,系统需具有双网卡功能,局域网端口用于连接主机到外部网络,ICSLAN端口连接AMX设备或其他第三方A/V设备使其独立于主要网络;同时支持IPv6和网络标准和特性;支持灵活的编程应用实现 (RPM,NetLinx和Java);具有向后和跨平台的兼容性;具有自动诊断功能,能自动检测断线或连接错误的串口和红外端口;程序文件支持从USB驱动器导入/导出。 中控系统需要和原有及新增系统高度集成,将音频、视频、灯光、升降器、大屏控制等进行集中控制管理,能完成所有原系统控制部分的操作,支持一键式的模式切换,同时可支持此项目新购系统的统一控制。原中控系统连接示意图如下图所示: 3. 录播系统升级改造

Biamp_Nexia数字音频处理器介绍

Biamp Nexia音频处理器介绍 编者案:传统扩音都是由调音台、音频处理、功放和音箱组成,设备众多,总投资不菲。而非专业音频的用户往往不会操作,刚调好的一个声场,几个月后已经是惨不忍睹。在数字化的今天,我们迎来数字媒体矩阵时代,调音台及各种音频处理设备被数字媒体矩阵取代,其计算机操作与集中控制联动,更加符合现代数字音视频集成工程应用的需要。 1.前言 Biamp Nexia 于1976年在美国俄勒冈州注册,最早是生产高品质的音乐器材,紧随着专业音频技术的发展,逐步转型生产专业音频处理设备。1996年生产出第一台Audia数字媒体矩阵,2003年推出智能话筒混音器、单声道/立体声线路混音器,功率放大器系列,同年推出专门针对中小型多媒体会议系统的NEXIA系列小型媒体矩阵(PM CS SP)。当远程会议走入人们视线时,Biamp也在2006年生产了专门针对远程会议的Nexia TC&VC.基于他们生产音乐器材的背景和对声音的热爱,他们对声音有很高的要求,同时也把这样的要求应用到所有产品中,而且把高品质声音作为产品生产的第一位。应用围很广,涉及政府、学校、公交、以及视频会议系统、体育场馆扩声工程,并享有很高的赞誉。在国际信息化产业联盟ICIA公布的最佳系统集成固定安装类产品大奖中,BIAMP公司的产品被权威期刊评为“最佳DSP处理大奖”。2003年进入中国市场,市场份额逐年上升; 你的远见可以成为现实

Nexia系列产品根据工程中遇到的现实问题而量身定做的。很多客户往往预算紧,但对声音质量的要求却毫不妥协,并且希望联网遥控。通过创新的数字信号处理技术,Nexia以小巧的外形提供了远胜于模拟系统的解决方案。 通过标配的Nexlink接口,最多可以4台Nexia设备级联成系统,彼此交换数字音频信号,并共享DSP资源。再配合VS8这样人性化的线控面板,一个灵活而实用的数字音频系统就展现在你的面前。高雅、简洁而且功能强大,在每天的日常实用中稳定地发挥效能。 Nexia软件:易于使用、精于设计。 界面直观、操作简单、功能强大,Nexia软件允许您以搭积木的方式进行系统设计。所有的设计操作都在同一个界面下完成,无需反复在不同页面间切换。令设计、修改,甚至推翻重来这一切工作都变得快捷而充满乐趣。为使工程项目进展更快,所有Nexia产品出厂时都包含了标准的音频系统设计,通电就能使用!如果您有特殊需求,也可以对工厂置的系统设计进行修改,实现您的梦想! 线控组件:人性外观,简洁有效。

(完整版)音频、视频采集与处理知识点整理

音频、视频采集与处理相关知识点 单元知识点考试要求试题类型 音频、视频采集与处理1.音频的数字化和存储容量的计算 b 选择题、填空题 必考+加试2.声音素材的采集 C 3.声音素材的制作 C 4.声音的格式转换 C 5.视频的数字化和存储容量的计算 b 6.视频素材的采集和处理 C 知识点整理: 1.音频数字化及存储量的计算 数字化音频是指通过采样和量化把模拟音频信号转换成由二进制数码“0”或“1”组成的数字化音频文件。 采样频率是指将单位时间的音频波形分隔成的点数,单位为赫兹(HZ)。采样频率决定了声音采集的质量,采样频率越高,声音的质量越好,存储容量越大。 量化位数是指将采样得到的点实现用二进制编码表示。量化位数越大,其量化值越接近采样值,即精度越高,所以存储量也越大。 常见的wave文件所占存储量的计算公式: 存储量(字节)=采样频率*量化位数*声道数*时间(秒)、8 2.声音素材的采集 声音素材的获取途径:成品声音文件的使用、声音素材的截取等。 声音文件的录制分硬件设备和软件录制两个部分。硬件设备主要需要声卡、话筒等。常用的声音录制与编辑软件有:GoldWave、录音机、Cool Edit、Wave Edit等。 3.声音的基本处理 通过GoldWave软件的状态栏,观察打开声音文件的采样频率、量化位数、声道数、声音长度、文件格式等信息。利用GoldWave软件可以对音频文件进行删除、剪裁、设置静音、淡入、淡出、音量调整、合成等操作。 (1)用GoldWave软件进行声音素材的处理: ①打开的音频文件在状态栏显示的参数信息:

②选取音频文件中的部分音轨信息 方法一:通过“设标”按钮,设置基于时间位置的“开始”和“结束”的时间参数。 如下图所示: 方法二:借助“开始标记线”和“结束标记线”。这种方法对音频区间的选取在时间不是很准确,要做好相对准确,可以事先将音频文件放大。 注意:如果需要选择立体声音频中某一声道的音轨信息,需要先进行声道选择。如需选择“左声道”中1:00分钟——3:00分钟的音轨信息,则可以先通过“编辑”菜单中的“声道”去指定处理的音频是左声道还是右声道。 ③选中的音频信息的执行删除、剪裁操作 :“开始标记”和“结束标记”之间的这段音频素材被删除。 :“开始标记”和“结束标记”之间的这段音频素材被保留下来。 ④选中的音频信息淡入、淡出效果的设置 淡入:实现声音音量由小到大的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡入”,并设置好初始音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 淡出:实现声音音量由大到小的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡出”,并设置好最终音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 ⑤选中的音频信息更改音量效果的设置 选中音频信息,选择“效果”菜单中的“音量”→“更改音量”,并设置好音量或预设的参数。其中音量单位为分贝(dB),正值为音量增加,负值为音量减少。

实验四 数字音频处理实验报告

云南大学软件学院 实验报告 序号:姓名:学号:指导教师:刘春花,刘宇成绩: 实验四数字音频处理 一、实验目的 1、熟悉并掌握MATLAB工具的使用; 2、实现音频文件的生成、读取、播放和转换的基本操作。 二、实验环境 MATLAB 6.5以上版本、WIN XP或WIN2000计算机 三、实验内容 1、用matlab 产生音乐。在matlab命令窗口执行下列命令,并回答问题 cf = 220; sf = 22050; d = 0.5; n = sf * d; t = (1:n)/sf; s0 = sin(2*pi*cf*t); sound(s0, sf); 1)信号的频率是多少? 采样频率是多少?采样间隔是多少?一共有

多少个采样点?声音有多少秒? 频率:220 采样频率:22050 采样间隔: (1:n)/sf采样点: sin(2*pi*cf*t) 时长:0.5s 2)请解释sound(s, sf)函数的参数和实现的功能。如果把 sound(s0,sf)改为sound(s0,2*sf)听起来会有什么不同,为什么?时间更短,因为频率发生改变,变成了原来的2倍 3)执行sound1.m,听一听,能否在此程序基础上做修改,实现一小段音乐旋律,时间不少于10秒。并保存为为wav文件。 文件。获取相应参数,填空wav )读取1、2. 执行语句: [B, fs, nbits]=wavread('C:\TEMP\hootie.wav'); % loads the clip size(B); % the size of B sound(B,fs) % plays the sound. 采样频率:44100

数字音频处理器使用说明书

重要的安全事项(针对火灾、电击或伤害人体的指示) 注意-使用该电器产品时,有以下基本的预防措施: 1.使用该产品前请详细阅读全部的安全事项; 2.本产品应当接地,如果出现故障时,电流经最小的接地电阻流入大地,以减小电击; 本产品的电源线和电源插头都配备安全接地,电源插头应当牢固插入适当的电源座,此电源座应当完全按当地的条例来安装和接地。 警告-接地装置连接不当会导致电击; 如果你对产品是否正确接地存在疑问,请委托合格电工或维修人员检查; 请不要尝试私自更改产品的电源插头,如果不适合电源插座,可委托合格电工安装适当的电源插座; 3.为了减小伤害的风险,当产品在小孩附近使用时,要严密监管; 4.请勿在湿度很大的地方使用机器,例如靠近浴缸、洗面盆、厨房水槽、湿度大的地下室或者靠近游泳池和湖泊; 5.该产品应当安装与通风良好的地方; 6.该产品必须远离热源,例如电暖炉、电热毯或者其他产生热量的产品; 7.该产品的电源类型必须符合操作指示或者产品上标明的类型; 8.该产品要配备一条两端的电源线(一端的插片长过另一端)。这是安全装置。如果你无法把电源插头插入电源插座,请联系电工来更换旧插座。 9.长时间不使用时,请把电源线从电源插座中拔出,从电源插座拔出电源线时,请勿拉扯电源线,应当抓住电源插头将其拔出; 10.细心护理,请勿让杂物或者液体从其缝隙掉进机器内; 11.当有下列情况时,应委托合格维修人员修理: A.电源线或电源插头已被损坏 B.杂物或者液体已掉进机内 C.产品已被雨淋 D.产品已不能正常操作或在演出中出现明显变化 E.产品已跌坏或外观损坏 12.当出现在用户维修指南中没有描述的情况时,请勿尝试私自修理,应当委托合格的维修人员修理; 13.警告-勿让重物积压或踩踏电源线,切忌拉、拔或强力扭曲电源线。请勿滥用电源线,不合格的电源线可能导致火灾或对人构成伤害。

相关文档
最新文档