声音信号的获取与处理

声音信号的获取与处理
声音信号的获取与处理

实验一声音信号的获取与处理

声音媒体是较早引入计算机系统的多媒体信息之一,从早期的利用PC机内置喇叭发声,发展到利用声卡在网上实现可视电话,声音一直是多媒体计算机中重要的媒体信息。在软件或多媒体作品中使用数字化声音是多媒体应用最基本、最常用的手段。通常所讲的数字化声音是数字化语音、声响和音乐的总称。在多媒体作品中可以通过声音直接表达信息、制造某种效果和气氛、演奏音乐等。逼真的数字声音和悦耳的音乐,拉近了计算机与人的距离,使计算机不仅能播放声音,而且能“听懂”人的声音是实现人机自然交流的重要方面之一。

采集(录音)、编辑、播放声音文件是声卡的基本功能,利用声卡及控制软件可实现对多种音源的采集工作。在本实验中,我们将利用声卡及几种声音处理软件,实现对声音信号的采集、编辑和处理。

实验所需软件:

Windows录音机

Cool Edit Pro 2.1

进行实验的基本配置:

●●Intel Pentium 120 CPU或同级100%的兼容处理器

●●大于16MB的内存

●●8位以上的DirectX兼容声卡

1.1 实验目的和要求

本实验通过麦克风录制一段语音信号作为解说词并保存,通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理,制作出一段完整的带背景音乐的解说词。

1.2 预备知识

1.数字音频和模拟音频

模拟音频和数字音频在声音的录制和播放方面有很大不同。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上,如磁带或唱片。播放时将纪录在媒体上的信号还原为波形。模拟音频技术应用广泛,使用方便。但模拟的声音信号在多次重复转录后,会使模拟信号衰弱,造成失真。

数字音频就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理,主要包括采样和量化两个方面。

2.数字音频的质量

数字音频的质量取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在2OkHz左右,根据采样理论,为了保证声音不失真,采样频率应在4OkHz左右。经常使用的采样频率有11.025kHz、22.05kHz和44.lkHz 等。采样频率越高,声音失真越小、音频数据量越大。量化数据位数(也称量化级)是每个采样点能够表示的数据范围,经常采用的有8位、12位和16位。例如,8位量化级表示每个采样点可以表示256个(0-255)不同量化值,而16位量化级则可表示65536个不同量化值。

量化位数越高音质越好,数据量也越大。反映数字音频质量的另一个因素是通道(或声道)个数。单声道是比较原始的声音复制形式, 每次只能生成一个声波数据。立体声(双声道)技术是每次生成二个声波数据,并在录制过程中分别分配到两个独立的声道出输出,从而达到了很好的声音定位效果。四声道环绕(4.1声道)是为了适应三维音效技术而产生的,四声道环绕规定了4个发音点:前左、前右,后左、后右,并建议增加一个低音音箱,以加强对低频信号的回放处理。Dolby AC-3音效(5.1声道)是由5个全频声道和一个超重低音声道组成的环绕立体声。

在多媒体音频技术中,存储声音信息的文件有多种格式,如Wav、Midi、Mp3、Rm、VQF等等。

1)Wav格式

Wav格式的文件又称波形文件,是用不同的采样率对声音的模拟波形进行采样得到的一系列离散的采样点,以不同的量化位数(16位、32位或64位)把这些采样点的值转换成二进制数得到的。Wav是数字音频技术中最常用的格式,它还原的音质较好,但所需存储空间较大。

2)Midi格式

Midi是Musical Instrument Digital Interface(乐器数字接口)的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,并于 1988年正式提交给MIDI制造商协会,便成为数字音乐的一个国际标准。MIDI标准规定了电子乐器与计算机连接的电缆硬件以及电子乐器之间、乐器与计算机之间传送数据的通信协议等规范。 MIDI标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。Midi文件纪录的是一系列指令而不是数字化后的波形数据,所以它占用存储空间比Wav文件要小很多。

3)MP3格式

MP3是对MPEG Layer 3的简称,是目前最热门的音乐文件。其技术采用MPEG Layer 3标准对W AVE音频文件进行压缩而成,特点是能以较小的比特率、较大的压缩率达到近乎CD音质。其压缩率可达1:12,每分钟CD音乐大约需要1兆的磁盘空间。

4)Rm格式

Rm是RealMedia文件的简称。Real Networks公司所制定的音频视频压缩规范称为RealMedia,是目前在Internet上相当流行的跨平台的客户/服务器结构多媒体应用标准,它采用音频/视频流和同步回放技术来实现在Intranet上全带宽地提供最优质的多媒体,同时也能够在Internet上以28.8Kbps的传输速率提供立体声和连续视频。

1.3 实验内容与步骤

一.实验内容:

1.1.硬件与软件的准备

目前,多媒体计算机中的音频处理工作主要借助声卡,从对声音信息的采集、编辑加工,直到声音媒体文件的回放这一整个过程都离不开声卡。声卡在计算机系统中的主要作用是声音文件的处理、音调的控制、语音处理和提供MIDI接口功能等。

进行录制音频信号所需的硬件除了声卡,还有麦克风、音箱以及外界的音源信号设备(如CD唱机、录音机等),把麦克风、音箱、外界音源信号设备与声卡正确连接完成硬件准备工作。在Windows的【控制面板】/【多媒体】中选择正确的录音和回放设备,并对其进行调试。

2.2.用Windows录音机录制解说词

使用Windows录音机录制任意一段语音信号作为解说词,录制完毕后把文件存为Wav 格式,文件名为【示例1_1】。

3.3.使用Cool Edit录制背景音乐

使用Cool Edit 2.1录制任意一段语音信号作为背景音乐,要求录制的声音文件

采样频率为44100Hz,立体声,量化位数为16位,保存文件为Wav格式,文件名【示例1_2】。4.4.使用Cool Edit编辑和处理背景音乐

使用Cool Edit对【示例1_2】先进行回声处理,然后进行【淡入】和【淡出】处理。5.5.使用Cool Edit进行混音处理

使用Cool Edit的【Mix paste】功能对【示例1_1】和【示例1_2】进行混音处理。把【示例1_2】加入【示例1_1】中去,编辑成为一个完整的带背景音乐的解说词,保存为【示例1_3】

二.示例

1.硬件与软件的准备

要录取声音文件需要的硬件主要有:声卡、麦克风,为了回放所录取的声音还需要配备音箱,如图1.1所示。

图1.1麦克风、声卡、CD音源、音箱

声卡后有几个接口,标有Midi/Game的梯形接口是接Midi键盘和游戏手柄的,标有Audio Out的圆口是接音箱的,标有Mic的圆口是接麦克风的,标有Line In的圆口是外接音频输入设备的。声卡、音箱和麦克风的连接,如图1.2所示。

图1.2电脑连线图

在完成了硬件设备的连接后为了使声卡能正常工作还要进行软件的调试。进入Windows98,选择【开始】/【设置】/【控制面板】,选【多媒体】。在【多媒体属性】对话框中选择的【音频】,在【回放】和【录音】的首选设备中选择声卡所对应的输入和输出选项,如图1.3所示。

图1.3【多媒体属性】的对话框

为确保麦克风和线性输入能正常使用,双击位于桌面右下任务栏的喇叭,打开【播放控制】对话框,确认话筒和线性输入的【静音】前没有打“√”,如图1.4所示。

图1.4【播放控制】的对话框

2.用Windows录音机录制解说词

步骤1:首先准备一份所需录制的材料作为解说词。

步骤2:执行【开始】/【程序】/【附件】/【娱乐】/【录音机】。打开【录音机】,单击【录音】按钮开始录音。Windows录音机录制音频文件时一次能录制的时间

为60秒,当录制时间大于60秒后,按【录音】继续录制。当朗读文章结束后,单

击【停止】结束录音,如图1.5所示。

图1.5windows录音机

步骤3:执行菜单【文件】/【另存为】命令,在出现的【另存为】对话框中的【格式】项,选【更改】。在【选择声音】对话框中修改【属性】项为【22.05Hz16位86KB/s】,

单击【确定】返回【另存为】对话框,选好保存的路径,文件名存为【示例1_1】,保存类型选Wav,如图1.6所示。

图1.6 windows 录音机的保存及属性修改 这样一个完整语音音频文件便保存好了。

3.使用Cool Edit 录制背景音乐

背景音乐可由录音机、CD 唱机等输出的模拟音频获取。首先保证外界音源设备与声卡的Line In 接口正确相连。

步骤1:选择【开始】/【程序】/【Cool Edit Pro 2.1】/【Cool Edit Pro 2.1】,打开Cool Edit Pro 2.1 。 如图1.7所示。

图1.7 Cool Edit Pro 2.1主界面

步骤2:单击工具栏的【Record 】按钮,如图1.8所示。

图1.8 Cool Edit Pro 2.1的工具栏 出现【New Waveform 】对话框,分别选择【Sample Rate 】为44100,【Channels 】为【Stereo 】,【Resolution 】为【16-bits 】,单击【OK 】按钮开始录音,如图1.9所示。

图1.9 【New Waveform】对话框

步骤3:录音结束,单击工具栏的【Stop】按钮完成录音,如图1.8所示。

步骤4:执行【File】/【Save As…】,打开保存对话框,如图1.10所示。选择好路径,文件名存为【示例1_2】,保存类型选【Windows PCM(*.Wav)】,单击【保存】完成对音乐文件的录制。

图1.10 保存【Music.wav】音乐文件

4.使用Cool Edit进行混音处理

步骤1:打开【示例1_1】,执行【Edit】/【Mix paste…】命令,打开【Mix paste】对话框如图1.14所示。

图1.14 【Mix paste】对话框

1) 在Volume框中,【Volume L,R】代表左右声道音量,若为单声道文件,则只有一个声道

音量调节,若选中【Invert】,则文件在被粘贴前声音数据将会颠倒。当【Lock left/Right】被选中时,左右声道调节钮将被锁定,调节时将一齐变化。

2)在合成方式框中,选定【Insert】,则被粘贴的文件插入当前文件之中。选定【Overlap】时,则被粘贴的文件不会取代当前文件中的选定部分,而是以选定的部分与当前文件叠加。若被粘贴的文件比当前文件的选定部分长,则超出范围的部分将继续被粘贴。选定【Replace】,则被粘贴的声音文件将覆盖源文件。选定【Modulate】,则被粘贴的声音文件与当前文件一起调制,即将每采样点的幅值相乘混合后输出。激活【Crossfade】,输入时间(ms),则在粘贴前后粘贴的文件有一定的淡入淡出。

3)在选择被粘贴的文件来源框中,选中【From Clipboard】表示被粘贴的文件来源于剪贴

【From File】板。

【From windows Clipboard】表示被粘贴的文件来源于Windows剪贴板。

表示被粘贴的文件来源于新文件,单击【Select File…】按钮可选择文件。

4)【Looppast】指粘贴文件的次数。

在本实验中设置【Volume L,R】为90,选中【Overlap】,设置【Crossfade】值为50,选中【From File】,单击【Select File…】选择作为背景音乐的文件【示例1_2】,【Looppast】为1,单击【OK】完成设置。

步骤2:处理结束后,打开【File】/【Save As…】,选择好路径,文件名存为【示例1_3】单击【保存】,完成混音处理,如图1.15所示。

图1.15混音处理后的音频文件

数字信号处理知识点总结

《数字信号处理》辅导 一、离散时间信号和系统的时域分析 (一) 离散时间信号 (1)基本概念 信号:信号传递信息的函数也是独立变量的函数,这个变量可以是时间、空间位置等。 连续信号:在某个时间区间,除有限间断点外所有瞬时均有确定值。 模拟信号:是连续信号的特例。时间和幅度均连续。 离散信号:时间上不连续,幅度连续。常见离散信号——序列。 数字信号:幅度量化,时间和幅度均不连续。 (2)基本序列(课本第7——10页) 1)单位脉冲序列 1,0()0,0n n n δ=?=?≠? 2)单位阶跃序列 1,0 ()0,0n u n n ≥?=?≤? 3)矩形序列 1,01 ()0,0,N n N R n n n N ≤≤-?=?<≥? 4)实指数序列 ()n a u n 5)正弦序列 0()sin()x n A n ωθ=+ 6)复指数序列 ()j n n x n e e ωσ= (3)周期序列 1)定义:对于序列()x n ,若存在正整数N 使()(),x n x n N n =+-∞<<∞ 则称()x n 为周期序列,记为()x n ,N 为其周期。 注意正弦周期序列周期性的判定(课本第10页) 2)周期序列的表示方法: a.主值区间表示法 b.模N 表示法 3)周期延拓 设()x n 为N 点非周期序列,以周期序列L 对作()x n 无限次移位相加,即可得到周期序列()x n ,即 ()()i x n x n iL ∞ =-∞ = -∑ 当L N ≥时,()()()N x n x n R n = 当L N <时,()()()N x n x n R n ≠ (4)序列的分解 序列共轭对称分解定理:对于任意给定的整数M ,任何序列()x n 都可以分解成关于/2c M =共轭对称的序列()e x n 和共轭反对称的序列()o x n 之和,即

12声音素材(一)基础知识

12声音素材(一)基础知识 (2课时) [教学目标] 1、了解数字声音的基础知识; 2、知道常用声音设备的使用方法; 3、掌握各种数字声音文件的播放方法。 [教学重点与难点] 1、数字声音的基础知识; 2、常用声音设备; 3、声音文件的播放。 [教学手段] 多媒体演示教学、研讨法和上机探索练习 [教学过程] 前面我们化了较多时间研究了多媒体课件制作中的重要素材——图像素材,下面我们研究另一种多媒体素材——声音素材。在多媒体作品中,适当地运用声音能起到文字、图像、动画等媒体形式无法替代的作用,如调节使用者的情绪,引导、刺激观众的兴趣,引起使用者的注意;声音作为一种信息载体,其更主要的作用是直接、清晰地表达语意;因此声音能给多媒体作品带来令人惊奇的效果,还最大限度地影响展示效果。本次课主要研究数字声音的基础知识。 第一部分:数字声音基础知识 第二部分:常用声音设备 第三部分:声音文件的播放 上机作业: 1、常规声音设备有哪些?分别起什么作用? 2、简要说明扩音原理。 3、多媒体电脑的声音设备核心是什么?它起什么作用? 4、掌握耳麦的使用,并学会播放电脑或网络中的声音。 5、继续完成综合考试任务。

回目录 第一部分:数字声音的基础知识 声音数字化有两种:一是将模拟声音信号(波形信号)通过取样、量化、编码等过程转化为数字声音(波形文件)。二是计算机合成声音,包括语音合成和音乐合成(MIDI文件)。所有这些文件通称数字音频文件。 一、波形文件: 波形文件是声音模拟信号的数字化结果,可以通过录音获取。其形成过程是:音源发出的声音(机械振动)通过麦克风转换为模拟信号(模拟电信号),模拟电信号通过声卡的取样、量化、编码,得到数字信号(数字电信号)。所有声音如乐器、语音及自然界音效等都可以通过这种方式记录为数字声音。 ⑴数字波形文件参数: *采样频率:每秒钟将模拟信号转变为数字形式信息的次数。 11025Hz语音25050Hz音乐44100Hz CD效果 *采样位数:表示存储、记录声音振幅所使用的二进制位数,它决定声音的动态范围。若是8 位,表示采样的精度为28,即 256。 8位、16位、32位 *通道数:单声道、双声道 ⑵数字波形文件的大小: (采样频率×采样位数×声道 数)/8=字节数/秒 例:CD唱片的采样频率为 44.1kHz,采样位数为16位,双 声道,则一分钟的声音数据量为 ((44.1×16×2)/8) × 60=10584kB,所以,一张650M的光盘可存放60多分钟的声音。 ⑶数字波形文件的压缩:

声音信号的获取与处理

实验一声音信号的获取与处理 声音媒体是较早引入计算机系统的多媒体信息之一,从早期的利用PC机内置喇叭发声,发展到利用声卡在网上实现可视电话,声音一直是多媒体计算机中重要的媒体信息。在软件或多媒体作品中使用数字化声音是多媒体应用最基本、最常用的手段。通常所讲的数字化声音是数字化语音、声响和音乐的总称。在多媒体作品中可以通过声音直接表达信息、制造某种效果和气氛、演奏音乐等。逼真的数字声音和悦耳的音乐,拉近了计算机与人的距离,使计算机不仅能播放声音,而且能“听懂”人的声音是实现人机自然交流的重要方面之一。 采集(录音)、编辑、播放声音文件是声卡的基本功能,利用声卡及控制软件可实现对多种音源的采集工作。在本实验中,我们将利用声卡及几种声音处理软件,实现对声音信号的采集、编辑和处理。 实验所需软件: Windows录音机(Windows98内含) Creative WaveStudio(Creative Sound Blaster系列声卡自带) Syntrillium Cool Edit 2000(下载网址:https://www.360docs.net/doc/1112271420.html,) 进行实验的基本配置: Intel Pentium 120 CPU或同级100%的兼容处理器 大于16MB的内存 8位以上的DirectX兼容声卡 1.1 实验目的和要求 本实验通过麦克风录制一段语音信号作为解说词并保存,通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理,制作出一段完整的带背景音乐的解说词。 1.2 预备知识 1.数字音频和模拟音频 模拟音频和数字音频在声音的录制和播放方面有很大不同。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上,如磁带或唱片。播放时将纪录在媒体上的信号还原为波形。模拟音频技术应用广泛,使用方便。但模拟的声音信号在多次重复转录后,会使模拟信号衰弱,造成失真。 数字音频就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理,主要包括采样和量化两个方面。 2.数字音频的质量 数字音频的质量取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在2OkHz左右,根据采样理论,为了保证声音

4声音素材编辑与制作

实验四声音素材编辑与制作 一、实验目的: 1.通过实验学习用“音频解霸”抓取声音文件。 2.掌握声音处理工具软件Gold Wave的用法,掌握录音、编辑声音、制作MP3格式声音的方法。 二、需要的软件和硬件: 1.带有声卡、耳麦、和光驱的多媒体计算机。 2.Windows98(中文版)、Windows2000或Windows XP操作系统。 3.超级解霸3000。 4.声音处理软件Gold Wave 。 三、实验内容: 1.用“音频解霸3000”抓取声音文件。(抓取一段Midi音乐) (1)运行《豪杰超级解霸》组件中的《音频解霸》,进入如图1所示的界面 (2)在“文件”菜单中选择“打开一个文件”命令,在对话框中选择文件路径为“实验四文件夹——MIDI文件夹——长城长.mid”,打开“长城长.mid”的音乐文件。 (说明:如果要抓取CD(MP3)音乐光碟或其它能用“音频解霸3000”播放的声音,只要在“文件”菜单中选择“播放CD光碟”命令,或“打开一个文件”命令,把CD或MP3音乐光碟放入光驱,选择播放的曲目,就可以按照下面的步骤完成声音文件的抓取。) (3)单击“播放”按钮 ,开始播放声音文件。 图1 音频解霸3000界面 (4)当播放到要录制的点时,单击“停止”按钮。(可以在图1显示的音频解霸面板上最下方的时间处查询当前停止的位置。上图的停止位置的时间为00:34。 (5)单击“波形录音”按钮,打开如图2所示的“保存声音波形文件”对话框。 1

2 图2 “保存声音波形文件”对话框 (6) 输入要保存的波形文件的路径和文件名,单击“保存”按钮即开始录制。需要结束时单击“停止”按钮,则所录的波形文件到此结束。 (注:当单击“保存”时,所保存的声音文件是一个空文件,只有录制了一段时间后,单击“停止”按钮,这时刚刚播放的声音文件才被抓取下来。这是用音频解霸3000录制WA V (波形文件)的唯一方法。) 2. 用“Gold wave ”软件录制声音(录制1分钟的语音) (1) 将话筒或耳麦与声卡连接好。 (2) 单击“开始”—“程序”—Gold wave 命令,或双击桌面上的“Gold wave ”快捷 方式图标,或直接双击Gold wave.exe 文件图标启动Gold wave 程序,打开如图3工作界面。 图3 Gold wave 工作界面

声音的采集与加工教学设计

《声音的采集与加工》教学设计 一、基本信息 二、设计思想 广东版选修教材《多媒体技术应用》中的“声音的采集与加工”教学模块主要包括四部分内容:“声音文件的存储格式”、“声音的采集”、“声音文件格式的转换”、“声音的加工”。仔细分析教材内容,基本上是音频理论知识和音频处理的相关操作介绍,如果按教材的先后顺序进行学习,学生很难从需求出发理解学习内容的实际意义,学习的兴趣就很难调动起来。“超级女声”在全国的异常火爆和网络翻唱的盛行,让我迅速创设了激发学生学习兴趣的情景,在此基础上对教材进行了二次开发,重新编排学习内容,将学习内容的了解和掌握适时穿插于整个作品的制作过程中,让学生经历“挫折”后,带着释疑的心情去探索新知,对所学内容记忆深刻,而且还能自我建构出许多书本上没有的新知识。 课前对学生学习情况的分析也是非常重要的一环,这个阶段学生已经完成了信息技术基础模块的学习,基本具备了网上搜索能力,掌握了简单的多媒体制作的方法,具有一定的设计、规划完成任务的能力。我还在学生中进行了“暗访”,了解到大部分学生对数字音频的加工、处理了解甚少,但却对此充满了神秘感,对数字音频在生活中的广泛应用展现出着浓厚的兴趣,对学习声音的采集和加工的学习充满期待。学生的喜好也是我暗访的重点,这为我最终确定创作主题起到决定性作用。虽然《超级女声》在学生中掀起一股唱卡拉OK的热潮,可是并非所有的学生都喜欢唱歌,单一的创作主题,很难满足全体同学的需求。于是我又构思出另一个主题,让学生根据自己的理解和编排创造性地给电影、动画、广告片断重新配语音和音效,有能力的同学还可以自己编制音乐故事,甚至还可以自

编、自导、自演电视音乐故事。基础薄弱学生的反映,引起我的关注,他们并没有表现极大的热情,并不是因为对主题不敢兴趣,而是担心自己无法胜任这个“高难度”的任务,于是我专门为能力薄弱的学生设计了一个简单而又有趣的声音编辑任务,使他们也能获得成就感。 教师事先的暗访是教学中活动安排的重要依据,对学生情况的了解使得活动主题及难度的设置贴近学生实际,而不是形式的“关怀”。 三、教学目标 1.知识与技能 认识多种声音文件存储格式、差异及适用情况; 掌握采集声音素材的技能,包括录制、声音素材的多途径获取; 掌握声音加工的具体技能:声音的剪辑、添加特殊效果、声音的合成; 掌握声音的存储和格式转换的基本方法。 2.过程与方法 让学生在对声音进行处理的过程中,关注运用了哪些知识和基本原理; 培养学生通过有计划、合理的数字音频加工进行创造性探索和解决实际问题的能力。 3.情感态度与价值观 让学生体会数字音频对人的生活带来的影响; 养成积极主动探究音频处理技术的习惯,帮助有困难的同学完成任务; 学会正确引用网络、光盘上的音乐,避免侵犯版权; 增强音乐的鉴赏能力,合理选用背景音乐。 四、教学重点和难点 重点:掌握声音采集、编辑和合成的一般方法。 难点:高质量地采集声音;润色声音(降噪、混响、高音激励等);多音轨合成声音。

语音信号处理实验一采集和预处理

实验一语音信号的采集及预处理 一、实验目的 在理论学习的基础上,进一步地理解和掌握语音信号预处理及短时加窗的意义及基于matlab的实现方法。 二、实验原理 1.语音信号的录音、读入、放音等:练习matlab中几个音频处理函数,利用函数wavread 对语音信号进行采样,记住采样频率和采样点数,给出以下语音的波形图(2.wav)。利用wavplay或soundview放音。也可以利用wavrecord自己录制一段语音,并进行以上操作(需要话筒)。 2.语音信号的分帧:对语音信号进行分帧,可以利用voicebox工具箱中的函数enframe。 voicebox工具箱是基于GNU协议的自由软件,其中包含了很多语音信号相关的函数。3.语音信号的加窗:本步要求利用window函数设计窗口长度为256(N=256)的矩形窗(rectwin)、汉明窗(hamming)及汉宁窗(hann)),利用wvtool函数观察其时域波形图及频谱特性,比较得出结论。观察整个信号加矩形窗及汉明窗后的波形,利用subplot与reshape函数将分帧后波形、加矩形窗波形及加汉明窗波形画在一张图上比较。取出其中一帧,利用subplot与reshape函数将一帧语音的波形、加矩形窗波形及加汉明窗波形画在一张图上比较将得出结论。 4.预加重:即语音信号通过一个一阶高通滤波器1 9375 1- -z。 .0 三、实验步骤、实验程序、图形及结论 1.语音信号的录音、读入、放音等 程序: [x,fs,nbit]=wavread('D:\2.wav'); %fs=10000,nbit=16 y=soundview('D:\2.wav') 2.语音信号的分帧 程序: [x,fs,nbit]=wavread('D:\2.wav'); len=256; inc=128; y=enframe(x,len,inc); figure; subplot(2,1,1),plot(x) subplot(2,1,2),plot(y)

学习“声音素材的获取与处理”心得体会

学习“声音素材的获取与处理”心得体会 东风中学祁聪2014年11月6、13、20、27日,我学习了“声音素材的获取与处理”的课程,通过学习我的到了一些心得体会。 首先,学习了声音素材的的获取: 一、声音素材主要包括背景音乐、解说词、郎诵、效果声及评语分析等等。 二、多媒体课件中的声音主要包括人声、音乐和音响效果三大类。 三、恰当的使用音乐和音响效果的作用 四、设计声音素材时的注意事项 五、数字声音、声音文件的采集和制作可以有以下7种方式、音频素材的获取方法、利用属性查找音频素材资源地址方法、利用属性查找音频素材资源地址方法、利用话筒录制声音的步骤、录音音量列表名词解释 通过这些学习我知道了声音的获取、录制、格式、编辑等方法。 其次、学习了MP3、WAV格式的区别。 1——MP3(MPEG AUDIO LAYER 3)是一种具有高压缩率的音响信号文件。虽然它音乐信号的压缩比例较高,但依然可以与CD/MD 的音质媲美。MP3高达10比1的压缩比例。使一张CD-R/RW上可以容纳10张普通CD的音乐。达到可以长时间播放音乐。您可以从互联网或其它渠道获取MP3格式的音乐。 2——WMA(WINDOW MEDIA AUDIO)是微软公司所开发的。引

导示来音乐的声音压缩技术。其音质可以与MP3媲美,有较高的压缩。有部分歌曲制成WMA格式音乐的大小可以达到MP3的三分之一!只要通过WINDOW MEDIA PLAYER 7.0以上的版本,就能将您喜爱的音乐编辑成WMA档案。 3——WAV(Waveform)格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。 总之,学习了这个课程,我学会了很多的东西,特别是在计算机信息处理得到了很大的提升。对声音的处理也学到了很多的东西。

第三讲 声音的采集与处理

第三讲声音的采集与处理 教学目标: 1.了解常见声音文件的格式。 2.掌握制作声音文件的一般流程。 3.会用Sound Forge等录音软件录制声音。 4.掌握用Sound Forge编辑声音的基本方法,能熟练地对声音文件进行剪辑与合成。 5.掌握熔炼五音,用Sound Forge对声音进行特殊效果处理的方法。 重点: 录音及对声音进行基本编辑的方法。 难点:声音的剪辑、合成及特殊效果处理方法。 一、常用声音文件格式 常用的声音文件格式有:WAV格式、MIDI格式、MP3格式、CDA格式。 WAV格式:WAV格式是多媒体教学软件中常用的声音文件格式,它的兼容性非常好,但文件较大。WAV格式的声音属性,如采样频率、采样位数、声道数直接影响到WAV格式文件的大小。 MIDI格式:是电子乐器声音文件格式, MIDI文件本身只是一些数字信号,占用磁盘空间较小,常作为多媒体教学软件的背景音乐文件。 MP3格式:是一种经过压缩的文件格式,播放时需要专门的MP3播放器。占用磁盘空间较小。 CDA格式:CD唱片中的音乐文件常用CDA格式保存,一般为44kHz,16bits立体声音频质量。 二、声音文件的制作流程 我们在制作多媒体教学软件时,需要各种各样的声音文件,对声音的制作一般分为两个基本阶段:声音的获取阶段,声音的加工处理阶段。声音的获 取有三种方法来源:剥离视频中的声音,录音,使用已有的声音文件。 声音的处理流程是:首先打开声音文件,然后对声音进行基本剪辑,进一

第一节走进Sound Forge 三、走进Sound Forge 我们可以把Sound Forge视为熔炼声音的熔炉,它能够对音频文件(.wav 文件)、视频文件(.avi文件)中的声音进行各种处理,打造出我们需要 的声音效果。在制作多媒体教学软件时,你想对获得的原始声音素材进行灵 活的处理吗?那么走进Sound Forge,让我们来领略它神气强大的功能吧! 好了,下面就让大家轻松亲身体验一下,为一多媒体教学软件制作声音。 首选来欣赏:我为一年级小学语文课文《一次比一次有进步》教学软件制作的声音文件。 下面就让我们用Sound Forge7.0一步步试着为课文录音、配音吧!要完成上面教学软件中的声音,要经过如下步骤: (一)录制声音 1.建立新的声音文件 选择“File”菜单下的“New”命令,新建一声音文件。在弹出的对话框中,设置新建声音文件的格式,即采样位数,声道数(立体声/单声道),采样频率,然后单击“OK”。 2.开始录音 2.1启动录音功能: 你可以用三种方法启动录音功能:按快捷键Ctrl+R; 单击工具栏上的录音按钮——红色圆点键; 选择菜单“Special”\“Transport”\下的“Record(录音)”命令; 2.2设置录音模式: 当你按下录音键后,会弹出一个录音设置对话框。你可以设置:录音模式(Mode),录音起始(start)、停止(End)时间位置。录音时的采 样率(samplerate)、采样位数(sample size)、立体声/单声道(stereo/mono) 的选择。 2.3开始录音:设置完毕后,单击录音设置对话框中的红色录音按钮,即 可用麦克风开始录音。 4.停止录音:按“End”停止按钮即可结束录音。 5.保存声音文件:选择菜单“File”下的“Save as”命令,保存文件。 这样一个自己录制的声音文件已经录制好了。(听听我录制的声音吧) 你想知道吗?(补充材料) (一).声音文件的三个基本属性

声音的获取与处理

声音的获取与处理(初中信息技术八年级)【教学设计学科名称】 声音的获取与处理是甘肃教育、甘肃声像出版社出版的初中信息技术八年级教材全一册模块一《多媒体素材的获取与处理》第三节教学内容。0 【学情分析】 授课对象是八年级学生。八年级学生经过前两节内容的学习,已基本具备多渠道获取信息的能力,对电脑的操作使用,文字信息、数据信息、多媒体信息均具备了一定的处理能力。而本节课的内容《声音的获取与处理》对学生来说应该是新奇、好玩的,且“学会了是有用的”。从内容上比较容易使学生主动注意,激发他们的求学欲。 【教材内容分析】 本节内容是甘肃教育、甘肃声像出版社出版的初中信息技术八年级教材全一册模块一《多媒体素材的获取与处理》第三节教学内容。本节主要让学生学会使用“录音机”录音,学会使用“豪杰超级解霸”抓取cd唱片中的声音,掌握使用“录音机”处理声音效果的方法。要求学生通过本节课的学习能了解声音文件的获取途径与方法,能正确选择适合的声音文件格式,并初步掌握声音文件的播放、转换和编辑。 【教学目标】

知识与技能:学会使用“录音机”录音,学会使用“豪杰超级解霸”抓取cd唱片中的声音,掌握使用“录音机”处理声音效果的方法。 过程与方法:采用创设情景、任务驱动的教学法,将知识技能融合于生活任务中,创设能激发学生兴趣的任务情境。采用简单合适的分组方法,在任务操作过程中融入合作交流的因子,倡导合作探究学习。 情感态度与价值观:培养学生根据实际需要主动运用多媒体处理工具加工和表达信息的能力关,并关注声音文件的版权问题,尊重知识产权。 【教学重难点分析】 教学重点:“录音机”录音方法,“豪杰超级解霸”抓取cd唱片中的声音 教学难点:使用“录音机”处理声音效果方法的掌握 【教学课时】 2课时 【教学过程】

声音的采集与处理(教学设计)

声音的采集与处理 一、指导思想: 信息技术新课标要求初中学生能够使用自己熟悉的多媒体制作软件采集和处理多媒体素材,并把各种素材有机的集成在一起形成多媒体作品,用多媒体作品来更好的表达自己的意愿和观点。声音的采集与处理是多媒体技术的重要组成部分,也是多媒体作品制作的必要前提和知识准备,初二学生第一次接触声音的采集与加工处理的内容,而且,这个年龄阶段的学生比较喜欢听音乐,也想对自己收集的音乐进行加工处理,所以这部分内容对他们有很强的吸引力。 二、教材内容分析: 本课是广东版初中信息技术第二册上第二章第二节的内容——《声音的采集与处理》。教材对本节的定位是,《声音的采集与处理》是对上一节图像的处理的延续,要求学生能够利用常用的软件来采集声音,并对声音进行加工处理,从而能够为上一节获取处理的图像配音,让学生初步感受多媒体表达的效果,也是为以后制作多媒体作品做好准备,激发学生逐步养成用多媒体的方式表达自己的思想的兴趣。 三、教学对象分析: 本节的教学对象是初二年级的学生。他们初步掌握了计算机中文件管理的方法。基本了解多媒体计算机的常见配置,能够安装一些应用软件,并在初一时已经试着用录音机软件进行录制声音和用Word进行文字编辑,初步掌握文字和图像的处理知识。学生思维比较活跃,模仿能力强,合作意识及操作能力较好。能够在教师的引导下自主探索、获取知识。 四、教学重点、难点分析: 重点:利用WaveCN软件采集声音信息,声音信息的剪辑和混音。 难点:在短时间内熟悉并掌握新软件WaveCN的使用操作。 五、教学目标设计: 1.知识与技能: 了解多种声音的采集录制以及加工处理的方式。 2.过程与方法: (1)研究把已掌握的相似功能软件的使用经验迁移到新的软件使用 上来。 (2)学习掌握声音的简单剪辑和混音方法。 3.情感态度与价值观: 引导学生联系物理课上所学的声波的知识,分析声音文件,

2声音的采集与处理

第二讲声音的采集与处理 教学目标: 1.了解常见声音文件的格式。 2.掌握制作声音文件的一般流程。 3.会用Sound Forge等录音软件录制声音。 4.掌握用Sound Forge编辑声音的基本方法,能熟练地对声音文件进行剪辑与合成。 5.掌握熔炼五音,用Sound Forge对声音进行特殊效果处理的方法。 重点: 录音及对声音进行基本编辑的方法。 难点:声音的剪辑、合成及特殊效果处理方法。 一、常用声音文件格式 常用的声音文件格式有:WAV格式、MIDI格式、MP3格式、CDA格式。 WAV格式:WAV格式是多媒体教学软件中常用的声音文件格式,它的兼容性非常好,但文件较大。WAV格式的声音属性,如采样频率、采样位数、声道数直接影响到WAV格式文件的大小。 MIDI格式:是电子乐器声音文件格式, MIDI文件本身只是一些数字信号,占用磁盘空间较小,常作为多媒体教学软件的背景音乐文件。 MP3格式:是一种经过压缩的文件格式,播放时需要专门的MP3播放器。占用磁盘空间较小。 CDA格式:CD唱片中的音乐文件常用CDA格式保存,一般为44kHz,16bits立体声音频质量。 二、声音文件的制作流程我们在制作多媒体教学软件时,需要各种各样的声音文件,对 声音的制作一般分为两个基本阶段:声音的获取阶段,声音的加工处理阶段。 声音的获取有三种方法来源:剥离视频中的声音,录音,使用已有的声音文 件。 声音的处理流程是:首先打开声音文件,然后对声音进行基本剪辑,进一步美化声音,对声音进行特殊效果处理。 成上面教学软件中的声音,要经过如下步骤: (一)录制声音 1.建立新的声音文件 选择“File”菜单下的“New”命令,新建一声音文件。在弹出的对话框中,设置新建声

第二章 语音信号处理基础知识

第二章语音信号处理基础知识 1、语音信号处理? 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。 2、语音信号处理的目的? 1)如何有效地,精确地表示、存储、传递语音信号及其特征信息;2)如何用机器来模仿人类,通过处理某种运算以达到某种用途的要求,例如人工合成出语音,辨识出说话人、识别出说话内容等。 因此,在研究各种语音信号处理技术之前,需要了解语音信号的基本特性,同时,要根据语音的产生过程建立实用及便于分析的语音信号模型。 本章主要包括三方面内容:语音的产生过程、语音信号的特性分析以及语音信号生成的数学模型。 第一部分内容语音的产生过程,我们要弄清两个问题:1)什么是语音?2)语音的产生过程? 3、什么是语音? 语音是带有语言的声音。人们讲话时发出的话语叫语音,它是一种声音,由人的发音器官发出且具有一定的语法和意义。语音是声音和语言的组合体,所以对于语音的研究包括:1)语音中各个音的排列由一些规则控制,对这些规则及其含义的研究成为语言学;2)对语音中各个音的物理特征和分类的研究称为语音学。 4、语音的产生 语音的产生依赖于人类的发声器官。人的发音器官包括:肺、气管、喉、咽、鼻、口等。 ◆喉以上的部分称为声道,其形状随发出声音的不同而变化; ◆喉的部分称为声门。 ◆喉部的声带是对发音影响很大的器官。声带振动产生声音。 ◆声带开启和闭合使气流形成一系列脉冲。

每开启和闭合一次的时间即振动周期称为基音周期,其倒数为基音频率,简称基频。基频决定了声音频率的高低,频率快则音调高,频率慢则音调低。 基音的范围约为70 -- 350Hz,与说话人的性别、年龄等情况有关。 人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。 人的说话的过程: 1)想说阶段:人的说话首先是客观事实在大脑中的反映,经大脑的决策产生了说话的动机; 接着说话神经中枢选择适当的单词、短语以及按照语法规则的组合,以表达想说的内容和情感。 2)说出阶段:由想说阶段大脑中枢的决策,以脉冲形式向发音器官发出指令,使得舌、唇、鄂、声带、肺等部分的肌肉协调地动作,发出声音。与此同时,大脑也发出一些指令给其他有关器官,使之产生各种动作来配合言语的效果,如表情、手势、身体姿态等。经常有些人说话时会手舞足蹈。另外,还会开动“反馈”系统来帮助修正语音。 3)传送阶段:说出的话语是一连串声波,凭借空气为媒介传送到听者的耳朵。有时遇到某种阻碍或其他声响的干扰,使声音产生损耗或失真。 4)接收阶段:从外耳收集的声波信息,经过中耳的放大作用,达到内耳。经过内耳基底膜的振动,激发器官内的神经元使之产生脉冲,将信息以脉冲形式传送给大脑。 5)理解阶段:听觉神经中枢收到脉冲信息后,经过一种至今尚未完全了解的方式,辨认说话人及听到的信息,从而听懂说话人的话。 再开始介绍语音信号的特性之前,我们先了解一下语音和语言的定义。 5、语言 是从人们的话语中概括总结出来的规律性的符号系统。包括构成语言的语素、词、短语和句子等不同层次的单位,以及词法、句法、文脉等语法和语义内容。语言学是语音信号处理的基础。例如,可以利用句法和语义信息减少语音识别中搜索匹配范围,提高正确识别率。 6、语音学 Phonetics是研究言语过程的一门科学。它考虑的是语音产生、语音感知等的过程以及语音中各个音的特征和分类问题。现代语音学发展成为三个分支:发音语音学、声学语音学以

经典matlab信号处理基础知识

常用函数 1 图形化信号处理工具,fdatool(滤波器设计),fvtool(图形化滤波器参数查看)sptool (信号处理),fvtool(b,a),wintool窗函数设计.或者使用工具箱filter design设计。 当使用离散的福利叶变换方法分析频域中的信号时,傅里叶变换时可能引起漏谱,因此需要采用平滑窗, 2数字滤波器和采样频率的关系。 如果一个数字滤波器的采样率为FS,那么这个滤波器的分析带宽为Fs/2。也就是说这个滤波器只可以分析[0,Fs/2]的信号.举个例字: 有两个信号,S1频率为20KHz,S2频率为40KHz,要通过数字方法滤除S2。 你的滤波器的采样率至少要为Fs=80HKz,否则就分析不到S2了,更不可能将它滤掉了!(当然根据采样定理,你的采样率F0也必须大于80HK,,Fs和F0之间没关系不大,可以任取,只要满足上述关系就行。) 3两组数据的相关性分析r=corrcoef(x,y) 4 expm 求矩阵的整体的exp 4离散快速傅里叶fft信号处理中,傅里叶变换的典型用途是将信号分解成幅值分量和频率分量)。Ft为连续傅里叶变换。反傅里叶ifft 5 ztrans(),Z变换是把离散的数字信号从时域转为频率 6 laplace()拉普拉斯变换是把连续的的信号从时域转为频域 7 sound(x)会在音响里产生x所对应的声音 8 norm求范数,det行列式,rank求秩 9 模拟频率,数字频率,模拟角频率关系 模拟频率f:每秒经历多少个周期,单位Hz,即1/s; 模拟角频率Ω是指每秒经历多少弧度,单位rad/s; 数字频率w:每个采样点间隔之间的弧度,单位rad。 Ω=2pi*f; w = Ω*T 10 RMS求法 Rms = sqrt(sum(P.^2))或者norm(x)/sqrt(length(x)var方差的开方是std标准差,RMS应该是norm(x)/sqrt(length(x))吧. 求矩阵的RMS:std(A(:)) 11ftshift 作用:将零频点移到频谱的中间 12 filtfilt零相位滤波, 采用两次滤波消除系统的非线性相位, y = filtfilt(b,a,x);注意x的长度必须是滤波器阶数的3倍以上,滤波器的阶数由max(length(b)-1,length(a)-1)确定。

声音信号的获取与处理

声音信号的获取与处理 一、实验目的和要求 本实验通过麦克风录制一段语音信号作为解说词并保存,通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理,制作出一段完整的带背景音乐的解说词。 二、实验内容和步骤 1、软件与硬件的准备 目前,多媒体计算机中的音频处理工作主要借助声卡,从对声音信息的采集、编辑加工,直到声音媒体文件的回放这一整个过程都离不开声卡。声卡在计算机系统中的主要作用是声音文件的处理、音调的控制、语音处理和提供MIDI接口功能等。 进行录制音频信号所需的硬件除了声卡,还有麦克风、音箱以及外界的音源信号设备(如CD唱机、录音机等),把麦克风、音箱、外界音源信号设备与声卡正确连接完成硬件准备工作。在Windows的【控制面板】/【多媒体】中选择正确的录音和回放设备,并对其进行调试。 2、用Windows录音机录制解说词 使用Windows录音机录制任意一段语音信号作为解说词,录制完毕后把文件存为Wav 格式,文件名为【示例1_1】。 3、使用Cool Edit录制背景音乐 使用Cool Edit 2000录制任意一段语音信号作为背景音乐,要求录制的声音文件 采样频率为44100Hz,立体声,量化位数为16位,保存文件的为Wav格式,文件名【示例1_2】。

4、使用WaveStuido编辑和处理背景音乐 使用WaveStuido对【示例1_2】先进行回声处理,【幅度】值为100%,【回声延迟】为300毫秒。然后进行【淡入】和【淡出】处理,【幅度】值各为50%。 5、使用Cool Edit进行混音处理 使用Cool Edit的【Mix paste】功能对【示例1_1】和【示例1_2】进行混音处理。把【示例1_2】加入【示例1_1】中去,编辑成为一个完整的带背景音乐的解说词,保存为【示 例1_3】

多媒体实验报告:声音的采集与处理

深圳大学实验报告 课程名称:多媒体技术及应用 实验项目名称:声音采集与处理 学院:传播学院 专业: 指导教师:王志强 报告人:刘立娜学号: 2012080286 班 级:4 实验报告提交时间: 2013.03.30 教务处制

一、实验目的与要求 1.通过实验加深对声音数字化的理解。 2.学会正确连接耳麦以及设置录音和放音的方法。 3.掌握声音录制方法并从网上下载音频文件。 4.掌握一种数字音频编辑软件的使用方法。 二、实验方法及步骤 1.实验方法:运用以前了解到的知识内容,在通过阅读书上的实验步骤进行操作。 2.实验步骤 ①Audition的启动与退出 ②录制音频、播放音频、导入音频 ③音频的剪辑 ④音频的特效 三、实验过程及内容 1.Audition的启动与退出 Audition是集声音录制、音频混合和编辑于一身的音频处理软件,它的主要功能包括录音、混音、音频编辑、效果处理、降噪、音频压缩与刻录音乐CD等,还可以与其它音频软件或视频软件协同合作。 Audition提供广泛的、灵活的工具箱,完全能够满足专业录音和专业视频用户的需求。利用Audition,可以录制多轨文件、编辑音频文件、创建原始音乐文件、混缩无限的音频轨道。 启动计算机进入Windows后,可以用鼠标单击任务栏中的“开始”在弹出的开始菜单中,将鼠标指针移到“所有程序—Adobe Audition3.0”菜单命令上,单击即可启动。或把 Audition快捷方式一到桌面上来,单击即可。

图2.1Audition应用程序窗口 如果要退出Audition,可以选择“文件—退出”菜单命令,或按Ctrl+Q组合键,也可以直接单击Audition应用程序窗口右上角的“关闭”在退出之前,如果有已修改的但未存盘的文件,系统会提示保存它。或者点击左上角的“文件—保存”。 图2.2保存提示图2.3 “另存为“对话框 2.录音、播放音频、导入音频 1)录音的操作过程:(单轨录音) 1.选择“文件—新建”菜单命令,这时会出现“新建波形”会话框,如图 2.4所示。选择适当的采样频率、采样分辨率和声道数,如选取44100Hz,16-bit和立体声就可以到达CD 音频效果。 图2.4“新建波形”对话框 2.单击“传送器”控制面板中的红色“录音”按钮,开始录音。对准话筒进行录音,完成后单击“传送器”控制面板的“停止”按钮即可。我们还可以通过控制时间长短来录音,在编辑视图中,选择“选项”菜单中的“时间录音模式”命令。在“传送器”控制面板中单击“录音”这时会出现“定时录音模式”对话框,如图2.5所示。在该对话框中,可以设置录制的时间长短和开始录音。设置完毕,单击“确定”开始按设置进行录音。 图2.5“定时录音模式”对话框

振动信号的采集与预处理

振动信号的采集与预处理 几乎所有的物理现象都可看作是信号,但这里我们特指动态振动信号。 振动信号采集与一般性模拟信号采集虽有共同之处,但存在的差异更多,因此,在采集振动信号时应注意以下几点: 1. 振动信号采集模式取决于机组当时的工作状态,如稳态、瞬态等; 2. 变转速运行设备的振动信号采集在有条件时应采取同步整周期采集; 3. 所有工作状态下振动信号采集均应符合采样定理。 对信号预处理具有特定要求是振动信号本身的特性所致。信号预处理的功能在一定程度上说是影响后续信号分析的重要因素。预处理方法的选择也要注意以下条件: 1. 在涉及相位计算或显示时尽量不采用抗混滤波; 2. 在计算频谱时采用低通抗混滤波; 3. 在处理瞬态过程中1X矢量、2X矢量的快速处理时采用矢量滤波。 上述第3条是保障瞬态过程符合采样定理的基本条件。在瞬态振动信号采集时,机组转速变化率较高,若依靠采集动态信号(一般需要若干周期)通过后处理获得1X和2X矢量数据,除了效率低下以外,计算机(服务器)资源利用率也不高,且无法做到高分辨分析数据。机组瞬态特征(以波德图、极坐标图和三维频谱图等型式表示)是固有的,当组成这些图谱的数据间隔过大(分辨率过低)时,除许多微小的变化无法表达出来,也会得出误差很大的分析结论,影响故障诊断的准确度。一般来说,三维频谱图要求数据的组数(△rpm分辨率)较少,太多了反而影响对图形的正确识别;但对前面两种分析图谱,则要求较高的分辨率。目前公认的方式是每采集10组静态数据采集1组动态数据,可很好地解决不同图谱对数据分辨率的要求差异。 影响振动信号采集精度的因素包括采集方式、采样频率、量化精度三个因素,采样方式不同,采集信号的精度不同,其中以同步整周期采集为最佳方式;采样频率受制于信号最高频率;量化精度取决于A/D转换的位数,一般采用12位,部分系统采用16位甚至24位。 振动信号的采样过程,严格来说应包含几个方面: 1. 信号适调 由于目前采用的数据采集系统是一种数字化系统,所采用的A/D芯片对信号输入量程有严格限制,为了保证信号转换具有较高的信噪比,信号进入A/D以前,均需进行信号适调。适调包括大信号的衰减处理和弱信号的放大处理,或者对一些直流信号进行偏置处理,使其满足A/D输入量程要求。 2. A/D转换

教案声音的获取与处理

【课题】声音的获取与处理 【课时】2课时 【教学目标】 1.了解声音文件的格式 2.初步掌握声音文件的获取方式 3.能够播放及转换声音,对声音进行删除、混合和淡入淡出处理 【教学重点】 1.删除声音片段; 2.混合声音,对声音进行淡入淡出处理 【教学难点】 混合声音,对声音进行淡入淡出处理,声音文件的保存 【教学过程】 一、例比导入 图片有不同的格式,有不同的种类,思考一下声音是不是也有不同的格式呢? 二、探究新知 (1)每个格式的特点是什么? 任务一:试听不同格式茉莉花歌曲,并思考每个格式歌曲有什么不一 样。 (2)师:声音有哪些获取方式呢? 生:从网上下载 生:从视频截取 生:自己录制 生:从CD里获取 师:同学们回答的很好,有人说可以从视频中截取,那么你们知道怎么截取吗? 生:不知道 师:有很多软件可以获取视频中的声音,老师今天给你们推荐个最简单的软件—千千静听(教师演示千千静听),千千静听还可以转换视频格式(演示)

(3)自己录制声音又用什么软件进行录制呢? windows 自带的录音软件 自带的录音软件录制长度有限制,我们可以用另外一款软件录制声音, 打开cool edit pro 介绍界面 (4)请一位同学上台朗诵学生最近学的一首诗-《沁园春.雪》,教师演示录制过程,并保存。 (5)教师给学生观看配乐诗朗诵,我们可以自己作一首配乐诗朗诵。教师演示cool edit pro 新建工程、添加音频、音频淡入淡出、删除片段等 关键步骤,声音文件的保存。 三、任务驱动,共同提高 任务二:将环节一录制的音乐保存,添加背景音乐,删除无关片段,设置音乐淡入淡出效果,合成配乐诗朗诵。 任务三:选择两首自己喜爱的歌曲,进行适当裁剪,合成音乐串烧。 四、评价成果,归纳总结 将学生做好的作品进行演示,自评以及共同评价作品的优缺点,教师和学生共同总结,并留几分钟时间给学生自行修改作品。 五、教学反思 1.学生基本上能完成任务,在保存时不能很好区分保存工程文件和音乐文 件; 2.有些学生没有搞清楚单轨道和多轨的特点,导致在合成音乐时将所有音 乐放在一个轨道里;因此教师在讲课时要强调这一点。 3.由于软件自身的问题,有些音乐文件采样频率不兼容于软件工程频率, 会导致文件无法导入。

实验一 声音信号的获取与处理

多媒体技术与应用 实验报告 专业班级:计算机11-4班 学号: 2011101593 学生姓名:齐国强 指导教师:李海芳 2014年5月

实验一声音信号的获取与处理 目的与要求 1、了解音频数据的获取和处理方法; 2、学会使用简单的声音编辑工具进行音频数据的录制、编辑和播放; 3、了解不同的音频文件在质量上和数据量上的差异。 实验仪器与器件 硬件:计算机、声卡、话筒、音箱或耳机 软件:声音播放软件(如豪杰音频解霸、暴风影音等)、音频处理软件cool edit 实验内容 cool edit操作基础1)使用Cool Edit录制声音 ①运行用Cool Edit,打开主界面窗口 ②右击音轨1的空白处,插入伴奏音乐,如图2所示。

③按下音轨2的R键及左下方的红色录音键,跟随伴奏音乐开始演唱(或朗诵)和录制。 图3 声音格式的设置 ④结束录音可按“停止”按钮。点左下方播音键进行试听,看有无严重的出错,无误后双击音轨 2 进入波形編辑界面,把录制的声音存储为无压缩的.wav 文件。“保存类型”可选择为“Windows PCM”。(也可以另存为其他格式) 2)用Cool Edit编辑音频文件 ①降噪处理: 在波形编辑界面,找出一段适合用来作噪声采样波形,打开“效果--噪声

消除--降噪器”准备进行噪声采样,如图4和图5所示。在按默认参数值进行噪声采样后,关闭降噪器,回到波形編辑界面,全选录制的声音波形,进入降噪器并点击确定,完成降噪处理。 图4 噪声选择示意图 图5 噪声采样示意图 ②混响处理: 打开【效果】|【常用效果器】|【混响】,调节混响长度、起始缓冲、高频吸收时间、干湿声比例等值,如图6所示,反复调节试听,达到最佳效果为止。图

语音信号预处理方法研究

一、设计目的与要求 本次课程设计的目的是利用MATLAB对语音信号进行数字信号处理和分析,要求学生采集语音信号后,在MATLAB软件平台进行频谱分析和特征提取;并对所采集的语音信号使用合适的滤波器滤除噪声,分析比较不同滤波器的性能。 要求利用MATLAB来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波。特征提取包括对原信号进行预加重处理,然后分帧并加窗,采样和量化,端点检测等。然后我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。

二、设计方案论证 2.1 设计理论依据 2.1.1 采样定理 在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中,最高频率fmax的2倍时,即:fs.max>=2fmax,则采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;采样定理又称奈奎斯特定理。 1924年奈奎斯特(Nyquist)就推导出在理想低通信道的最高大码元传输速率的公式: 理想低通信道的最高大码元传输速率=2W*log2 N (其中W是理想低通信道的带宽,N是电平强度)。 2.1.2 采样频率 采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。采样频率与声音频率之间有一定的关系,根据奎斯特理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。 2.1.3采样位数与采样频率 采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。 采样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机,44.1kHz意味着音频流进入计算机时计算机每秒会对其拍照达441000次。显然采样率越高,计算机摄取的图片越多,对于原始音频的还原也越加精确。

相关文档
最新文档