基于DirectSound技术的音频捕获与多路混音的实现

0引言

DirectX 是Microsoft 开发的专门用于开发游戏和多媒体软件的应用程序接口，它包含编制高级计算机游戏和多媒体应用程序的最新技术工具，可以方便的实现图形/图像、动画、多媒体等方面的应用开发。DirectSound 应用程序接口是Di-rectX SDK 的声音处理部分。DirectSound 在与已存在的设备驱动程序保持兼容的同时提供了低延迟的音频混合、硬件加速和在不知道硬件的具体细节情况下对声音设备的直接访问。因此，开发者可以十分方便的利用DirectSound 使用各种音频设备，并针对其特性做出优化。随着网络和Internet 的日益发展和普及，人们对通过网络进行有声交流与沟通的需求逐渐提高。本文给出了一个基于DirectSound 的实现方案，该方案可方便有效的实现对本地音频流数据的捕获，并混合网络上的多路音频流，达到网络上多人同时讲话的目的。

1DirectSound 中音频流的捕获和混音

1.1DirectSound 的音频流捕获

DirectSound 的声音捕获是通过缓冲机制实现的。Direct-

Sound 提供了静态缓冲和流式缓冲两种缓冲区机制。静态缓

冲指一次将一段完整的音频数据写入缓冲中；而流式缓冲并不将全部的音频数据一次写入缓冲，而是由程序周期性的动态写入，占用内存空间较小，因此可以通过使用较小的内存来播放较长的声音，这样可以提高缓冲区的使用效率。通常来讲，如果音频数据容量有限，使用静态缓冲更有助于提高系统的效率；相反，如果是容量很大、实时性要求较高的音频数据流，则使用流式缓冲为佳。在实现网络多路混音的系统中，由于接收的音频数据量一般来说是较大的，为保证各路话音的流畅性，使声音能够连续播放，可选择使用流式缓冲。

1.2DirectSound 的混音机制

进行混音时，声音缓冲区分为主缓冲区和辅助缓冲区两种。主缓冲区内含用户将要听到的音频，每个辅助缓冲区都包含一段单一的声音或音频流。除了主缓冲区外，程序至少还应该创建一个辅助缓冲区，辅助缓冲区的作用是储存将要使用的声音，在不使用的时候可以释放掉，但主缓冲区是不可释放的。在初始化DirectSound 时，会自动创建一个主缓冲区，当声音在辅助缓冲区中播放时，主缓冲会进行混音并把混音结果送到输出设备。通常情况下，并不需要和主缓冲打交道，DirectSound 会自己来管理它，除非我们要使用自己写的混音部分，这时，DirectSound 就会让我们自行管理主缓冲。

收稿日期：2006-01-08E-mail ：cm_yuan@https://www.360docs.net/doc/5010406013.html,

作者简介：苑春苗(1975－)，女，天津人，硕士，讲师，研究方向为网络多媒体；杨清永，男，硕士，讲师。

基于DirectSound 技术的音频捕获与多路混音的实现

苑春苗1，杨清永2

(1.天津工业大学计算机学院，天津300160；2.天津天地伟业数码科技公司，天津300384)

摘

要：给出了一个如何使用DirectSound 技术实现音频流的捕获并实现网络上多路声音混合的方案。该方案通过Direct-Sound 提供的缓冲机制实现了音频流的捕获，

结合网络技术和辅助缓冲技术可实现网络上多路声音的混合，提高了音频处理的效率和通用性。阐述了DirectSound 的相关技术，给出了系统的框架图及音频捕获与混音的实现方法，提出了环形缓冲区设计方案，最后给出了系统优化方案。

关键词：DirectSound;网络;音频流;混音;缓冲技术中图法分类号：TP37

文献标识码：A

文章编号：1000-7024(2007)03-0613-02

Method of audio capture and multi-audio mixing based on DirectSound technology

YUAN Chun-miao 1,

YANG Qing-yong 2

(1.School of Computer,Tianjin Polytechnic University,Tianjin 300160,China;

2.Tianjin Tiandy Digital Technology Company Limited,Tianjin 300384,China )

Abstract ：An implementation of audio streaming capture and mixing multiple audio streaming on network based on DirectSound tech-nology.Audio streaming capture adopts DirectSound's buffer mechanisms,while multi-sound mixing combines technologies related network with DirectSound's secondary buffer mechanisms.The scheme enhance the efficiency and generality of audio process.Some related technologies of DirectSound and the architecture of system are introduced,how to implement voice capture and mixing and the using of ring-buffer are https://www.360docs.net/doc/5010406013.html,st,an optimization policy is proposed.

Key words ：DirectSound;network;audio streaming;sound-mixing;buffer technology

2007年2月计算机工程与设计

Feb.2007

第28卷第3期Vol.28

No.3

Computer Engineering and Design

混音过程如图1所示，当程序同时对多个辅助缓冲区中的音频数据进行回放时，DirectSound 会把这些来自于不同辅助缓冲区的声音在主缓冲区进行自动混音，然后通过输出设备输出。如果所有的缓冲区都使用同一种声音格式而且硬件输出也是使用这种格式，那么DirectSound 的混音将不需要在格式转换上花任何的工夫，从而达到最优的效果。

基于DirectSound 的音频流捕获及网络多路混音

2.1

系统的实现框架

为实现网络多路混音，在系统中可设置多个辅助缓冲区，

在将本机捕获的声音发送给网络的同时，不断将本机捕获的声音及从网络上收到的多路声音分别写入辅助缓冲区中，这样在播放时就可实现声音的混合了，系统框架如图2所示。

2.2环形缓冲区设计

可将辅助缓冲区设计成环形缓冲，不断循环向其中写入

音频数据，当数据积累到一定程度时，就可以播放声音了，播放过的声音则成为旧音频数据，可以重新向该部分缓冲区内写入新捕获的音频数据。环缓冲区是使用动态方式申请的内存区域，利用数学中的取余运算，可以把它建构成一个抽象的环形域。在缓冲区中设立写指针和回放指针，写指针用于记录接收线程的写数据位置，回放指针用于记录回放线程读数据的位置。环形流式缓冲的使用如图3所示。按回放音频数据的顺序来看，写指针的位置总是较回放指针稍微靠前，并且它们间保持着一定的间距，而这个间距会根据不同的系统状况而有所不同。缓冲区大小一般设置为1M 字节左右为宜，一般可以将缓冲区分割成3~4个区域，并在分割位置设定通知事件。当写指针或回放指针到达该位置后会得到相应的事件通知，当一个区域写满数据后才可以进行回放；当一个区域的数据回放完之后才可以写入新数据。这样可以很好地互斥使用缓冲区，使回放的声音更平滑顺畅。

2.3音频流捕获实现方案

DirectSound 的声音捕获部分基于IDirectSoundCapture 和

IDirectSoundCaptureBuffer COM 接口实现。

在进行声音的捕获时，要使用该接口，必需先建立一个接口实例，然后给该接口

创建一个捕获缓冲区，声音捕获工作是由捕获缓冲区对象的

方法完成的。

首先需要创建一个缓冲区，通过对一个DSBUFFERDESC 结构赋值，可以指定要创建的缓冲区的特征，例如：单双声道、采样率、量化位数、对齐方式等；然后调用IDirectSoundCapture::CreateSoundBuffer ()方法，

创建一个需要的缓冲区对象，之后就可以按照如下步骤实现声音的捕获了：①调用IDirectSound-CaptureBuffer::Start 方法启动缓冲区。从缓冲区开始处填入来自输入设备的音频数据。②等待直到有足够的数据被读入。可以通过使用IdirectSoundNotify::SetNotificationPosition 方法在缓冲区中设置通知点，当捕获指针到达缓冲区中某一位置时，即触发指定事件，表明此时缓冲区中数据已足够多。③当有足够的数据后，会收到前面所设置的消息通知，调用IDirec-tSoundCaptureBuffer::Lock 方法锁住该部分捕获缓冲区。④从缓冲拷贝数据。⑤用IDirectSoundCaptureBuffer::Unlock 方法对缓冲去锁。⑥重复步骤②到⑤直到所有的数据被捕获。然后调用IDirectSoundCaptureBuffer::Stop 方法。

通常缓冲区会在捕获位置到达其末尾时自动停止捕获操作。然而，如果在调用IDirectSoundCaptureBuffer::Start 方法时设置其dwFlags 参数为DSCBSTART_LOOPING ，捕获操作会继续下去直到IDirectSoundCaptureBuffer::Stop 方法被调用，这时捕获位置被移动到了缓冲区的开始处。部分关键代码如下：

LPDIRECTSOUNDCAPTURE

m_dscDirectSoundCapture;

DirectSoundCaptureCreate (NULL,&m_dscDirectSoundCapture,

NULL );

DSCBUFFERDESC dscbd;

static LPDIRECTSOUNDCAPTUREBUFFER m_dscbInput;…//初始化dscbd ，用于设置捕获缓冲区的特征；

m_dscDirectSoundCapture ->CreateCaptureBuffer (&dscbd,&m_dscbInput,NULL );

m_dscbInput->Start (DSCBSTART_LOOPING );//开始捕获…//拷贝音频数据到缓冲区m_dscbInput ；m_dscbInput->Stop ();//停止CaptureBuffer

m_dscbInput ->Release ();//释放m_dscbInput

m_dscDirectSoundCapture ->Release ();//释放m_dscDirectS-oundCapture

2.4网络混音的实现方案

为实现声音的混音和回放，则需要创建IDirectSound 对

象，DirectSound 会自动创建主缓冲区，

但辅助缓冲区需要我们图3回放指针和写指针与流式缓冲区的关系

图1DirectSound 的混音机制

辅助缓冲区

图2系统实现框架

收到的声音

输入设备

输出设备网

络

旧音频数据

新音频数据；回放指针

写指针

导航控制系统的设计。实际系统采用嵌入式计算机及基于微电子机械器件(MEMS)的导航传感器设备，结合合理的软件、硬件设计，大为提高了导航系统的可靠性，同时也满足了工程中对系统性能的要求。

参考文献:

[1]胡小平.自主导航理论与应用[M].长沙:国防科技大学出版社,

2002.

[2]肖业伦.航空航天器运动的建模－飞行动力学的理论基础[M].

北京:北京航空航天大学出版社,2003.[3]吴俊伟.惯性技术基础[M].哈尔滨:哈尔滨工程大学出版社,

2002.

[4]付梦印,邓志红,张继伟.Kalman滤波理论及其在导航系统中

的应用[M].北京:科学出版社,2003

[5]耿德根,宋建国,马潮,等.AVR高速嵌入式单片机原理与应用

[M].北京:北京航空航天大学出版社,2001.

[6]高鹏,安涛,寇怀成.电路设计与制版－Protel99入门与提高[M].

北京:人民邮电出版社,2000.

[7]何强,何英.Matlab扩展编程[M].北京:清华大学出版社,2002.

[8]John Goerzen.Linux编程宝典[M].北京:电子工业出版社,2000.

(上接第614页)

自己创建。使用辅助缓冲区时，也要使用和前述相似的加锁和解锁机制及通知机制，在此不在赘述。本方案中，首先要根据要混合的声音的最大路数，在应用程序中创建相应个数的辅助缓冲区，然后将从本机捕获的音频数据和从网络上接收的多路音频数据分别写入到不同的辅助缓冲区中，由主缓冲进行混音并把混音结果送到输出设备，这样就可以实现网络上多路声音的混合了。以下是部分关键代码：

LPDIRECTSOUND m_dsDirectSound;//Directsound对象DirectSoundCreate(NULL,&m_dsDirectSound,NULL);

m_dsDirectSound->SetCooperativeLevel(hWnd,DSSCL_ PRIORITY);//设置合作级别

DSBUFFERDESC dsbd;

static LPDIRECTSOUNDBUFFER m_dsbPrimary;

//主缓冲区

…//初始化dsbd，用于设置主缓冲区的特征；

m_dsDirectSound->CreateSoundBuffer(&dsbd,&m_dsbPrimary, NULL);

DSBUFFERDESC m_dsbdOutput;

…//初始化m_dsbdOutput，用于设置多个辅助缓冲区的特征；

//创建多个辅助缓冲区用于混音

static LPDIRECTSOUNDBUFFER m_arDsbOutput[MAX_ NUM];

for(i=0;i

dsrval=m_dsDirectSound->CreateSoundBuffer(&m_dsbd-Output,&m_arDsbOutput[i],NULL)

…//填充本机捕获的音频数据到环形辅助缓冲区；

…//填充从网络上接收的音频数据到环形辅助缓冲区；

for(int i=0;i

m_arDsbOutput[i]->Play(0,0,DSBPLAY_LOOPING);

…

//停止播放辅助缓冲区

for(int i=0;i

m_arDsbOutput[i]->Stop();

…//释放缓冲区。

3系统优化

考虑到网络传输带宽的限制，可以在音频采集模块中加入静音检测技术，即监测到有音频输入时才将音频流从网络上传输出去，当无音频输入即音频流数据为静音数据时则不传输，这样既可以节省网络带宽，又可以减少混音的路数，可以提高系统的效率和混音后的音频质量。

4结束语

经测试，该方案可以十分容易的实现音频流的捕获，并可以实现多路网络音频流混合，且混合后的各路声音没有时延、停顿，语音清晰，效果良好。DirectX技术在开发多媒体应用时使用十分方便高效，现已被广泛采用。音频的捕获、混音以及回放在现今的网络通信中如网络视频会议、网上聊天、多媒体教学及多人网络游戏中有广泛的应用，本方案可以达到多人同时讲话的效果，提高了音频处理的效率和通用性。

参考文献:

[1]Microsoft公司.Microsoft directX8.0SDK[EB/OL].http://www.

https://www.360docs.net/doc/5010406013.html,.

[2]罗智勇,张会汀.使用DirectX技术实现视频会议中的音频通

信[EB/OL].https://www.360docs.net/doc/5010406013.html,.

[3]林浩,张国基.DirectSound封装技术及其音频捕捉应用[J].微

型电脑应用,2004,20(3):57-59.

[4]林丕源,肖德琴.局域网上声音实时捕捉和传送的实现[J].计算

机应用,2002,22(6):64-66.

[5]张占君,韩承德,杨雪量.基于自适应节的多媒体流QoS保证的

研究[J].计算机学报,2002,23(12):1320-1324.

[6]肖勇军,金伟正.基于DirectX技术的语音编解码系统的实现

[J].计算机工程,2005,31(8):180-182.

[7]唐朝京,鲜明,肖顺平,等.Windows平台上实现多媒体信息实

时捕获的几种主要技术研究[J].计算机应用研究,2003,20(5): 37-39.

[8]黄永峰.因特网语音通信技术及其应用[M].北京:人民邮电出

版社,2002.

[9]Richard Stevens W.TCP/IP详解卷1:协议[M].北京:机械工业

出版社,2001.

[10]黄永峰.IP网络多媒体通信技术[M].北京:人民邮电出版社,

2003.

[11]沈乐君,程小平.基于模式的实时音频流分割与控制系统[J].

计算机工程与设计,2004,25(7):1211-1213.

(完整word版)录音混音方法

录音混音方法一. 录音环境对录音这项看似平常，简单到从你家的电话录音机，到市面上出版的CD,DVD等，再到每天离不开你生活的广播电视，在在都显现出录音的重要角色，但是在就录音技术的讨论层面而言，对录音结果的好坏所造成的影响有几项因素。就我个人的浅见认为，录音环境、录音设备、『人』这三样因素影响最大。谈到录音环境，就必须先对录音的种类有所认识与区分，大致来说录音可分为： 1. 广播录音：节目预录、电话收录、广播剧制作等。 2. 商业录音：唱片出版、广告制作、有声书等。 3. 电视制作录音：戏剧成音、配乐制作等。 4. 电影现场同步录音：对白收录、环境音收录、特效收录、生效创造等。 5. 音乐会/演唱会现场录音：单点录音、多轨录音等。 6. 环境音效录音：大自然声音收录、机械声收录、语音纪录保存等。这几个分类算是最主要的录音需求，然而又会因为各类本身的实际状况与复杂性，产生各种不同的环境标准，当然这其中的重点，在于录音环境是否能提供一个合于该节目或音乐需求的因素，我们必须记着一点，只要你能收录到你所要用的声音，而且该声音合于你要出版或播出的水准，任何地方都可以成为最佳的录音环境；当然，要达到

真正的专业录音，好的录音设备也是重要的因素之一，最后影响录音结果的因素，则在『人』这个复杂的因子，因为这其中包含了个人专业技术与知识、人的情绪与心智、生理状况与听力等诸多复杂的影响范畴，这一部份我们且先略过，我们就先来谈录音环境吧！如何挑选建录音室的地点： 1 远离机场、航道。 2 远离火车站、铁道。 3 远离市中心、大马路边。 4 尽量不要建在大楼之中，因为无法控制各楼层的噪音影响，不过在台湾不太可能不选择此一途径。 5 选择独立建筑。可以排除在大楼建筑中产生的结构性噪音问题。 6 远离工业区。当然这些基本原则能达到最好，因为至少在设计与处理上比较经济，若无法避免就只好在设计上下工夫，多花一些预算了。如何决定录音室的空间大小：这是一般常被忽略的因素，一般我们会建议越大越好，因为隔音墙与声效墙、浮动地板与浮动天花板、空调与线路管线都会使建构完成的空间缩小，虽然有所谓的黄金比例的影响，如1:1.25:1.6的比例等，但不见得每个场地都有此等身材，因此专业的声响〈ACOUSTICS〉设计师对您就非常重要，特别是在有限的空间创造无限的声场可能性。接下来我将以录音室的总体考量为例，简单的介绍一个专业的录音室要如何建构，又要注意哪些问题。

公共广播系统设计方案

公共广播系统方案设计说明设计方案目录一、项目概述 (2) 1.1项目概况 (2) 1.2项目需求 (2) 二、方案设计 (2) 2.1设计原则及依据 (2) 2.2设计思想 (3) 2.3系统介绍 (4) 2.4设计效果 (5) 三、方案配置 (5) 3.1系统配置 (5) 3.2系统功能 (9) 四、设备参数 (10)

一、项目概述 1.1项目概况该项目为少年宫大楼。 1.2项目需求 1），背景音乐广播主要作用是掩盖本地噪声，并创造一种轻松和谐的听觉气氛。背景音乐扬声器呈均匀布置，无明显声源方向性，且音量适宜，不影响人群正常交谈。 2），业务呼叫广播可以起到商业宣传、播放通知、寻人等作用。该功能要求扩声系统的声场强度略高于背景音乐，以不影响两人对面讲话为原则。 3），应急事故广播人的生命是第一位的，；当火灾或紧急状态发生时用以指挥和疏散人群，以保证在紧急情况发生时，可以利用其提供足以使建筑物内可能涉及的区域的人群能清晰的听到警报、疏导的语音。二、方案设计 2.1设计原则及依据从投资合理、外观美观、设计规范的思想出发，日常广播和紧急广播二个系统的设计，在功能上互相独立，在设备及器材上有机结合。根据规范要求，紧急广播的控制具有最高优先权，并采用智能的联动和自动火灾报警广播方案。设有音量调节器的扬声器，平时在接收日常广播时可以调节音量或关闭，紧急广播时扬声器不受音量调节器控制，都将处于紧急广播状态。设计原则： 1.实用性：系统设备立足于用户对整个系统的具体需求，最大限度地发挥投资的效益；

2.先进性：系统的结构和功能应具有先进性和成熟性，避免了因技术陈旧造成整个系统性能不高而过早被淘汰； 3.可靠性：保证系统运行的稳定性和安全性。保证重要信息不致破坏和丢失； 4.开放性：系统应具有良好的开放性，并提供标准接口，可以根据用户需求对系统进行扩展和升级； 5.兼容性：系统设备的选择要以先进性和成熟性为基础，同时考虑兼容性，避免因兼容性造成系统难以升级和扩展； 6.标准化：进行设备选择时，应符合国际、国内标准设计，避免因新技术不支持而造成设备淘汰。设计依据：本系统规划设计必须按照国际、国家和本地区的有关标准和规范进行。本设计将依据和参照以下的设计规范和要求进行： 1.《公共广播系统工程技术规范》GB50526-2010 2.《火灾自动报警系统设计规范》（GB 50116—2013） 3.《智能建筑设计标准》（GB/T 50314—2006） 4.《城市住宅建筑综合布线系统工程设计规范》（CECS 119—2000） 5.《民用建筑电气设计规范》（JGJ 16—2008） 6.《高层民用建筑设计防火规范（2005版）》（GB 50045—95） 7.《火灾自动报警系统施工及验收规范》（GB 50166—2007） 8.《智能建筑工程质量验收规范》（GB 50339—2013） 9.《综合布线系统工程验收规范》（GB 50312—2007）客户技术要求和相关建筑平面图（客户提供），根据此规格书及最新版的有关标准对公共广播系统进行设计、施工和验收。 2.2设计思想综合大楼对公共广播系统的使用需求，本次公共广播系统设备考虑背景音乐广播和紧急消防广播两部分，公共广播系统设计主要满足大楼的背景音乐播放、信息广播、广播通知、紧急广播等使用需求。为满足项目的需求，广播系统走向智能化管理,同时系统具有可扩展性，扩展方便。我们设计了一套从音频信号集中控制传输，可靠实用的背景音乐、公共（紧急）广播系统。即设计背景音乐广播

对讲求助报警系统

平安城市对讲求助系统设计说明书一、系统概况在社会发展过程中，往往会出现各种突发事件。当前社会的各种因素对国家安全和社会稳定的影响日益显现。在做好传统领域安全工作的同时，对防范一些恶意危害他人人身安全突发事件等方面的工作，必须切实予以加强。数字化IP网络视频对讲系统可以及时有效的掌握社会动态，对求助者以帮助，发现有不良动向的人予远程喊话予震慑，是“创建平安城市，构建和谐社会”的重要组成部分，更能完善‘社会更加和谐’这一理念。平安城市IP网络视频语音对讲系统的主要功能特点：音像结合，一键呼叫，人民群众需要帮助时可以视频语音全双工通话监控中心可以远程巡逻城市的各个监控网点，发现可疑迹象，可对不法分子远程喊话，同时也可以远程开启警笛等辅助设备，给犯罪分子予以震慑公安局、公安分局和辖区派出所的3级管理模式，如有突发事件发生，所在地的辖区派出所会在第一时间给予响应，同时辖区派

出所可以向上级部门进行汇报，请求兄弟单位协。总指挥中心结合所有的安监设施，当有突发事件时，可以对整个公安系统、分局、派出所进行远程语音喊话、指挥、广播，将事件的危害性降低到最低程度终端配置有中断触发口、大功率功放等，可外接警笛、警灯、扩音喇叭等，在有突发事件发生时，将结合现场情况，智能给予驱动控制系统可以定时播放、实时采播、自动打铃、远程巡更等特性系统具备传输数字化、布局网络化、应用智能化、工程简单化等优势所有操作，都可录音录像或以日志的形式予以保存，以备后期查阅。核心技术 1) TCP/IP 技术采用tcp/ip 网络技术，纯数字传输，通信不受地域限制。 2) 数字音视频技术数字音视频技术是将模拟音视频信号数字编码，通过网络传输后，再由网络终端解码成高保真的模拟音视频信号。本系统借助于已有的以太网网络，具有传输损耗小、画面清晰、音质佳、不受区域限制、后期维护成本低等优势，得到业内好评。模拟音源网络音频设备网络音频终端喇叭 3) 回音消除技术回音消除技术是为避免双向对讲时终端扬声器的声音再次进入话筒，引起的音质差、啸叫等现象的发生；抑制环境噪音对通话质量的影响而采取的技术手段，保证高质量的语音通话。局域网/广域网 LAN/WAN

[教程]混音步骤与实例

Mixing(混音)步驟：、 1.將配器按照要素分類 2.戴上耳機播放音樂，檢查音頻的瑕疵 3.調整整體音量平衡 4.調整各項配器EQ(均衡)，Filter(過濾)不需要的頻段 5.壓縮各項配器(Compress) 6.視需求加注各項效果器(如Distortion) 6.創建立體聲效，聲向的配置需考量到配器頻段(低頻無指向需求) 7.增加需要的或刪減不需要的音頻區段 8.整體空間感的營造，先建立整體音場，再針對單一樂器 9.微調各項Effect的數據 10.製作歌曲所需的Auto machine，如淡出與淡入、聲向變化等等 11.在不同的系統聆聽混音結果人聲處理步驟： 1.降噪 2.麥克風仿真和真空管仿真 3.均衡：提升6KHz以上區段，其他區段可不處理 4.壓限與聲效激勵 5.迴響：將高中低頻分開製作，高頻衰減的時間長，濕度要大；中低音區衰減的時間要短，濕度要小。高音區的迴響加身歷聲增強器，可擴大聲場。中低音區的混響要儘量小，小到聽不太清最好。中低音區的混響容易製造空間感，必須要留出一軌乾聲，用來強化人聲定位動態處理實例： 1.對人聲音軌行進行壓縮處理少量壓縮─RATIO 2：1 Threshold：-10DB Attack time & Release time根據音樂節奏設置輕柔的人聲使用過度壓縮─RATIO 6：1至10：1可增加"空氣感" 在Compress(壓縮)器後面加放DE-ESSER(嘶聲消除器)消除齒擦音 2.對BASS進壓縮/限制處理壓縮器可以使Bass變得肥厚，增加聲音的持續聲音。在壓縮器之前放一個限制器可以有效地防止信號發生超載 3.用擴展器處理TOM鼓使用擴展器來擴展TOM鼓的動態，TOM的持續音會自然衰減 4.對軍鼓進行壓縮處理對小鼓使用雜訊門

华平多路音频的混音方法

华平多路音频的混音方法背景及问题目前，随着视频会议及监控的迅速发展，视频和音频的应用技术已经相对成熟。在实际应用中，音频的交互处理仍然处于最基本和最核心的部分，人们对音频的实时性要求更为苛刻，因此，在网络带宽允许的条件下，当不同地点的多个终端，需要进行实时音频交互时，需要将多路音频按照一定的策略进行混合，并最终编码发送给另外的终端。多路音频交互的核心问题就是混音，而提供资源使用率相对低且音频交互质量更高的混音方法，以提升用户的实际体验效果，已成为本领域技术人员需要解决的技术难题。传统多路音频混音方法分析为解决此类问题，传统的方法是采用多点控制单元(MCU)将多路音频信号混音为一路，如此可以有效降低网络数据的传输量。MCU混音的方式是：根据信号线性叠加的原理，将多路音频信号的采样量化数据叠加。随着终端数量的增多，此种方式会导致MCU的运算负荷和上传带宽急剧增大，所以此方式只能适用在较小规模的会议系统中。将混音处理都集中在一台服务器来进行，对服务器的上传带宽和CPU处理能力要求很高，由此衍生出了分布式处理方式，即由多个终端来进行混音处理，而分布式的混音方法遇到的最主要问题就是对终端的下载带宽要求较高，同时也需要终端具有较高的多路音频解码和混音的处理能力，此外还需要终端配置良好的混音算法以获得高质量的混音效果。目前，诸多的混音算法，用于处理4路以内的音频，还能获得较好的混音效果，然而对于4路以上的音频，混音后音质会急剧下降，而且极易出现量化溢出等问题(效果)。为了确保各路音频的波形尽量能够在混音后保持原始的形态，以达到声音真实还原和音质更佳的效果，就必须解决数据叠加溢出的问题。常见的几种解决溢出问题的方式如下： 1.平均化时域线性叠加的方法；此法最为简单，但是混音效果很不好，存在混音后各路的音频衰减太多，音量偏小，不利于实时的沟通。 2.基于变换域的混音方法：将各路音频转化为频域并做覆盖性差值，最后转换回时域得到混音数据的方法。此类方法虽然能很好解决溢出问题，但实现四路以上的混音难度较高，不具备普遍应用的优势。图1现有直接叠加混音后的效果图(6路音频输入) 华平多路音频混音方法分析华平提供的多路音频帧的混音方法是一种基于时域信号叠加的自适应的多路音频混合方法，能够混合超过4路以上的音频，实现方法：先将多路音频帧中相应采样点的值分别叠加以获得至少一个样点数据，且当有叠加后的结果超出预设范围时，对当前帧增益因子进行调整，当一帧叠加完成后，将所得的当前帧增益因子与前一帧增益因子进行比较，根据比较后的结果再次调整当前帧增益因子，接着，再根据再次调整后的当前帧增益因子、及音量强度的初始值计算当前帧的音量强度等级，并判断音量强度等级是否等于预设值，如果是，则将叠加后获得的各样点数据形成的帧作为混音帧，如果否，则根据音量强度等级对各样点数据进行处理，以使处理后的各样点数据都处于预设范围内，并将处理后的各样点数据所形成的帧作为混音帧。本多路音频帧的混音方法通过对线性叠加后的混音数据进行溢出判断，当溢出时，对当前帧增益因子做一定的调整和计算，然后通过对混音后每帧数据进行对比分析，根据对比前后帧的相关参数来不断调整增益调节因子，并当混音出现溢出的时候自动将当前帧做饱和处

大型工厂公共广播系统设计方案.doc

大型工厂公共广播系统设计方案一、系统的功能设计对于大型工厂、企业的公共广播系统来说，无论是对声场均匀度的要求还是对器材的选择，与其它场合的公共广播系统相比，都比较简单，基本可以参照大型商场、超市的公共广播系统设计方案实行。二、公共广播系统设计方案举例 1．工程概况 OMRON 中国工厂共有大型工业厂房4栋、2层办公楼1栋、6层职工宿舍楼2栋，厂区占地面积近20000平方米。 2．计方案简要说明 ● 整个广播系统设备按照标准配置，AMA为首选品牌。AMA公共广播系统设备外形美观、音质优美、价廉物美，在工程界口碑极佳，深受广大工程商的青睐。 ● 整个系统共分11个广播区域，其中工业厂房一栋为1个区、职工宿舍楼为1个区，办公楼按楼层分区、厂区道路为1个区，共分为8个广播区域。 ● OMRON 中国工厂公共广播系统将背景音乐广播和消防紧急广播合二为一。 ● 节目源设置四个：数码调谐器、CD唱机、双卡录音座和广播钟声话筒。 ● 办公楼内所有办公室设置具有强切功能的房间音量控制器。 ● 公共广播系统中扬声器的选型基本遵循以下原则：办公楼内有装饰天花板的区域采用AMA PC-865B 吸顶式扬声器，厂房内无装饰天花板的区域采用AMA HS-815 悬吊式音箱，职工宿舍楼采用AMA WS-601B 壁挂式音箱，厂区道路两旁采用AMA HS-620 圆筒型户外音箱。 ● 整个OMRON 中国工厂共配置134只扬声器，具体分布情况如下表所示：

● 扬声器的功率分配根据AMA扬声器的技术参数，参照消防广播要求，每只扬声器功率分配如下： AMA PC-865B 吸顶式扬声器分配功率 3W AMA HS-815 悬吊式音箱分配功率 15W AMA WS-601B 壁挂式音箱分配功率 5W AMA HS-620室外音箱分配功率 15W ● 系统输出功率计算根据系统设计所确定的扬声器数量以及每只扬声器的分配功率，计算出所有扬声器的损耗功率为：50只×3W /只 + 24只×5 W /只+ 50只×15 W /只 + 10只×15 W /只= 1170 W

虚拟低音的实现原理方案

虚拟低音的实现原理及验证方案背景和理论原理: 在当前手持设备或其他消费电子设备中，由于体积和外形的要求，作为发声的喇叭尺寸受到了极大限制，尺寸的限制造成了喇叭对于低音部分无法响应.造成音频部分低音的缺失，无法给消费者提供更高要求的享受. 在人耳的研究中发现，人可以对两个高音的差频产生响应，给了听觉上造成低音的感觉，这就是所谓的虚拟低音. 实现算法框图图1 其中谐波发生器和增益控制器的框图采用MAXBASS公布的算法：如图2

2 这里我们可以看出我们需要做的就是: ●提取低音信号和高音信号，需要设计一个高通和低通滤波器，低通滤波器来提取低音信号，高通滤波器来提取高音信号，低通滤波器的截止频率为扬声器的截止频率，在demo 的时候我们做成固定的100HZ. ●谐波发生器. ●混频器. 滤波器滤波器我们采用matlab的FDATOOL工具来实现，然后可以根据工具生成的系数，根据滤波器的结构采用matlab语言自己编写.滤波器可以看见的总共有4个，输入高低滤波的滤波器HPF-IN和LPF-IN，这两个滤波器的功率互补的. HPF-OUT和HPF-IN是一样的. HPF-FB是反馈回路高通滤波器.

上图可知，上面提到的4个滤波器的截止频率都是可调的.这里需要注意. 一开始我们可以做成频率固定的，因为我们可能并不会做成IC的形式，因此可以在软件中随时调整截止频率. 自动幅度控制模块: 上图为等响度曲线图，我们可以看出不同的频率，相同的升压变化造成的响度变化是不同的.这里我们定义声压-响度扩展比率，即升压变化/响度变化的值R. 在频率为20~700hz，响度为20-80方内:R的值可以近似为:

录音人声处理步骤

录音人声处理步骤和方法 2009-05-05 22:31:28| 分类：音乐技术交流阅读1132 评论1 字号：大中小订阅录音人声处理步骤和方法母带处理软件IZotope.Ozone3臭氧教程母带处理软件IZotope.Ozone3臭氧教程软音源地址：https://www.360docs.net/doc/5010406013.html,本工作室开设：古典吉他考级和电吉他班编曲作曲电脑音乐制作班乐理辅导班等等希望广大乐迷积极参与哦！{注：深圳吉他} 各位录音兄弟们好。现在是凌晨三点半。我从睡梦中醒来，给大家写这个教程。由于时间仓促，所以行文快速，有错漏的请各位高手们一一指出了。后期处理即是母带处理。也就是录音混缩最后一个阶段的制作处理，做混音最后一步的调整和处理。母带处理不是件小事，绝对不能忽视，它甚至关系到整个作品给人的听觉上的感受。后期处理广义上指的是整个作品经过伴奏的录制、人声录制，人声效果混音、合成混缩后的再进行的环节。这是我对后期处理的理解，不知各位觉得是否贴切。许多兄弟位后期处理用恐龙（T-RACKS），哪个更好用，是仁者见仁、智者见智的，不过我还是对臭氧情有独钟。 Ozone3，江湖人称臭氧3。是一款运行在DX平台上的综合式音频效果插件，主要用于后期的母带处理。也就是最好用的后期处理软件。该插件界面超酷、功能强大、操作复杂、品质一流，目前最新版本为3.0.111版，由izotope公司开发。 OZONE3是个组合式的插件。包含有10段均衡器、混响器、电平标准化、高质量的采样精度转换、多段激励器、多段动态处理、多段立体声扩展、总输入/输出电平调节。比OZONE2多了好多新功能和算法。软件预置的方案比以往版本更丰富，有很大的实用和参考价值，并且还可以到https://www.360docs.net/doc/5010406013.html,下载许多新的预置参数。我用臭氧的时间不长，不过细细研究了一番。发现它并没有像许多人说的那么难。对OZONE的六个效果器基分别解释： 1）均衡器是个典型的参量式EQ，可任意定制频段数量、范围和频点。这是我用过的音质最好最精细的EQ。EQ也并没有有些人说得那么神话。如果只是做流行音乐的话，你只需要记得这些人声的频段就行了。 100hz 以下（必切，喷麦声，低频噪音频段） 200-500hz 人声低音（决定响度、力度、震撼度；鼻音重则衰减） 500-900hz 人声中音、乐音、泛音（决定温暖度、音色；音色坚硬则衰减） 900-2Khz 人声齿音、人声高频（决定穿透力，音色太刺则衰减） 4-10Khz 选择切除臭氧3 EQ的使用快捷键： ←→左移/右移频段节点（每按一次） ↑↓增益/衰减0.1db（每按一次） Ctrl + ← 增加Q值（值越大，带宽越小） Ctrl + → 减少Q值（值越小，带宽越大）我一般只用它来修补和突出某频段的人声，这是我的常用设置： 1.5K 提升 5.3db 增加明亮感 29hz 衰减-2.3db 减少轰隆声 69hz 衰减-0.9db 减少轰隆声 600){return this.width=600;}"> 2）混响器母带加的混响不同于混缩时的混响。最重要的是不能破坏作品的清晰度、原有声相，并要合理地设置声场。要与混音时的混响相互配合。这是我混音的设置： 600){return this.width=600;}"> 与之相对应的后期混响，要适度了(也就是说要两次混响，混音时一次，后期时一次，所以混音时的混响要适度)。不要加了效果像唱K房的感觉，这是最失败的混响。做音乐不像唱K，可以猛加混响掩盖声线的缺陷。混响太多，会令人感到不亲切，不真实，不自然地。 600){return this.width=600;}"> 后期处理加的混响主要用来冲淡伴奏轨和人声轨的混响达到统一，令人声与伴奏融合得更和谐。所以添加一定要适度。界点为50hz和7khz，以保证混响不至于浑浊。 3）音量最大化左边部分是最大化音量（电平标准化），这个很好理解，也可以说这部分是个母带处理的整体限制器。相信用过WAVES L2的朋友很容易上手的。比L2多了几个选项。要慢慢理解。

音频常见指标介绍

THD（Total Harmonic Distortion，总谐波失真）: 谐波失真是指音箱在工作过程中，由于会产生谐振现象而导致音箱重放声音时出现失真。尽管音箱或耳机中只有基频信号才是声音的原始信号，但由于不可避免地会出现谐振现象（在原始声波的基础上生成二次、三次甚至多次谐波），这样在声音信号中不再只有基频信号，而是还包括由谐波及其倍频成分，这些倍频信号将导致音箱放音时产生失真。对于普通音箱允许一定谐波信号成分存在，但必须是以对声音基频信号输出不产生大的影响为前提条件。而总谐波失真是指用信号源输入时，输出信号（谐波及其倍频成分）比输入信号多出的额外谐波成分，通常用百分数来表示。一般说来，1000Hz频率处的总谐波失真最小，因此不少产品均以该频率的失真作为它的指标。所以测试总谐波失真时，是发出1000Hz的声音来检测，这一个值越小越好。注：一些产品说明书的总谐波失真表示为THD<0.5%，1W，这样看来总谐波失真较小，但只是在输出功率为1W的总谐波失真，这与标准要求的测量条件下得到的总谐波失真是不同的。 SNR（Signal to Noise Ratio，信噪比）: 指在规定输入电压下的输出信号电压与输入电压切断时，输出所残留之杂音电压之比，也可看成是最大不失真声音信号强度与同时发出的噪音强度之间的比率，通常以S/N表示。一般用分贝（dB）为单位，信噪比越高表示音频产品越好，常见产品都选择60dB以上。 Sample（采样）: 这个字同时为动词与名词。做为名词之用时，表示一段录进来的声音（Audio）；做为动词使用时，则表示录一段取样声音的录音动作。会用到"采样"这个字眼的场合，多半是针对采样过程，特别在不是录一整首歌曲，而只是录一段声音的状况。 Resolution（解析力、分辨率）: 若是用在数字声音信号的领域当中，解析度是指一个取样值的位数，位数越大所能表现的数值范围就越广。解析力也叫还原度，顾名思义，是声音的还原能力。即声音的细节表现程度，以及复杂音场的处理能力酒阅茉角浚缏方涌谏杓圃郊眩乖纫苍礁撸诖鞰P3等高压缩比音乐时，还原度会主变得相当重要，高还原度意味着音乐不会走样。解析力很差的机子，播放什么类型的音乐都会混乱不清，基本上不能再谈什么细节表现与层次感，亦无法把细微、复杂的东西都交代得一清二楚。然而，即使是最高级的MP3，解析力也远不如HIFI音响。 BIT RATE（比特率）：作为一种数字音乐压缩效率的参考性指标，比特率表示单位时间（1秒）内传送的比特数bps（bit per second，位/秒）的速度。通常我们使用kbps（通俗地讲就是每秒钟1000比特）作为单位。cd中的数字音乐比特率为1411.2kbps（也就是记录1秒钟的cd音乐，需要1411.2×1024比特的数据），音乐文件的BIT RATE高是意味着在单位时间（1秒）内需要处理的数据量（BIT）多，也就是音乐文件的音质好的意思。但是，BIT RATE高时文件大小变大，会占据很多的内存容量，音乐文件最常用的bit rate是128kbps，MP3文件可以使用的一般是8～320kbps，但不同MP3机在这方面支持的范围不一样，大部分的是32-256Kbps，这个指数当然是越广越好了，不过320Kbps是暂时最高等级了。 EQ均衡器: Equalization（均衡）将声音中的各频率的组成泛音等级加以修改的动作。例如，将频率为100 Hz的组成泛音推大，就会让声音中100 Hz左右的低频部份听起来明显一些。若觉

MEDSOME(美迪声)公共广播系统设计方案

背景音乐＆消防报警公共广播系统工程 1.系统设计思想严格按照中华人民共和国公安部火灾自动报警系统设计规范（摘录）（GB50116-98）作为设计依据，结合贵方的需求，用最佳设计方案体现最高的性能价格比，使系统的功能和指标达到国内同类型系统的先进行列，是我们的总体设计思想。本设计是根据甲方的要求，综合吸取当前国内公共/消防广播系统的先进技术，设计成的设备先进、格调高雅、音质优美、功能齐全的现代化公共/消防广播系统。所配置的设备均选用美迪声(MEDSOME)牌产品以确保高超的性能指标。运用我们从事系统工程设计和施工多年的理论和实践经验，精心搭配组合，确保性能优异，质量可靠。下面分别对公共/消防广播系统的设计方案分别作一简要说明。 2.公共广播系统的组成不管哪一种广播音响系统，基本可如下图所示分四个部分：节目源设备、信号放大处理设备、传输线路和扬声器系统。

1）节目源设备：节目源通常为无线电广播，激光唱机和录音卡座等设备提供，此外还有传声器、电子乐器等； 2）信号放大器和处理设备：包括均衡器、前置放大器、功率放大器和各种控制器材及音响加工设备等。这部分设备的首要任务是信号放大，其次是信号的选择。调音台和前置放大器作用和地位相似（当然调音台的功能和性能指标更高），它们的基本功能都是完成信号的选择和前置放大，此外还对音量和音响效果进行各种调整和控制。有时为了更好地进行频率均衡和音色美化，还另外单独投入图示均衡器。这部分是整个广播音响系统的“控制中心”。功率放大器则将前置放大器或调音台送来的信号进行功率放大，再通过传输线去推动扬声器放声； 3）传输线路：传输线路虽然简单，但随着系统和传输方式的不同而有不同的要求，对礼堂、剧场等，由于功率放大器与扬声器的距离不远，一般采用低阻大电流的直接馈送方式，传输线要求用专用喇叭线，而对公共广播系统，由于服务区域广，距离长，为了减少传输线路引起的损耗，往往采用高压传输方式，由于传输电流小，故对传输线要求不高； 4）扬声器系统：扬声器系统要求整个系统的匹配，同时其位置的选择也要切合实际。礼堂、剧场、歌舞厅音色，而扬声器一般用大功率音箱。而公共广播系统，由于它对音色要不高，室内一般用3W-6W的天花喇叭即可。 3.公共广播工程系统设计思路根据用户对公共广播系统的基本功能、规模布局的要求和有关标准，规范的规定以及用户初步预算等方面的考虑明确下列要求： ●确定广播服务区，哪些场所需要广播；本医院是专科医院，我们前期设计在公共场所覆盖背景音乐广播。 ●确定广播节目源的种类，需要哪些节目源信号；节目源基本播放的音源，

音视频通讯技术视频二次开发方案

当我们使用像Skype、QQ这样的工具和朋友流畅地进行语音视频聊天时，我们可曾想过其背后有哪些强大的技术在支撑？网络语音通话通常是双向的，就模型层面来说，这个双向是对称的。为了简单起见，我们讨论一个方向的通道就可以了。一方说话，另一方则听到声音。看似简单而迅捷，但是其背后的流程却是相当复杂的。语音采集语音采集指的是从麦克风采集音频数据，即声音样本转换成数字信号。其涉及到几个重要的参数：采样频率、采样位数、声道数。简单的来说：采样频率，就是在1秒内进行采集动作的次数；采样位数，就是每次采集动作得到的数据长度。而一个音频帧的大小就等于：（采样频率×采样位数×声道数×时间）/8。通常一个采样帧的时长为10ms，即每10ms的数据构成一个音频帧。假设：采样率16k、采样位数16bit、声道数1，那么一个10ms的音频帧的大小为：（16000*16*1*0.01）/8 = 320 字节。计算式中的0.01为秒，即10ms。编码假设我们将采集到的音频帧不经过编码，而直接发送，那么我们可以计算其所需要的带宽要求，仍以上例：320*100 =32KBytes/s，如果换算为bits/s，则为256kb/s。这是个很大的带宽占用。而通过网络流量监控工具，我们可以发现采用类似QQ等IM软件进行语音通话时，流量为3-5KB/s，这比原始流量小了一个数量级。而这主要得益于音频编码技术。所以，在实际的语音通话应用中，编码这个环节是不可缺少的。目前有很多常用的语音编码技术，像G.729、iLBC、AAC、SPEEX等等。网络传送

当一个音频帧完成编码后，即可通过网络发送给通话的对方。对于语音对话这样Realtime 应用，低延迟和平稳是非常重要的，这就要求我们的网络传送非常顺畅。解码当对方接收到编码帧后，会对其进行解码，以恢复成为可供声卡直接播放的数据。语音播放完成解码后，即可将得到的音频帧提交给声卡进行播放。如果仅仅依靠上述的技术就能实现一个效果良好的应用于广域网上的语音对话系统，那就没什么太大的必要来撰写此文了。正是有很多现实的因素为上述的概念模型引入了众多挑战，使得网络语音系统的实现不是那么简单，其涉及到很多专业技术。当然，这些挑战大多已经有了成熟的解决方案。首先，我们要为“效果良好”的语音对话系统下个定义，我觉得应该达到如下几点：（1）低延迟。只有低延迟，才能让通话的双方有很强的Realtime的感觉。当然，这个主要取决于网络的速度和通话双方的物理位置的距离，就单纯软件的角度，优化的可能性很小。（2）背景噪音小。（3）声音流畅、没有卡、停顿的感觉。（4）没有回音。下面我们就逐个说说实际网络语音对话系统中额外用到的技术。回音消除AEC 现在大家几乎都已经都习惯了在语音聊天时，直接用PC或笔记本的声音外放功能。殊不知，这个小小的习惯曾为语音技术提出了多大的挑战。当使用外放功能时，扬声器播放的声音会被麦克风再次采集，传回给对方，这样对方就听到了自己的回音。所以，实际应用中，回音消除的功能是必需的。

Samplitude Pro X 12人声后期制作的步骤

人声后期制作教程之－－混音的步骤及效果器的选择主讲：Sunday 总引：第一步降噪第二步音量的平衡第三步美化人声1、高频激励效果器2、电子管模拟器第四步重中之重EQ均衡器第五步模拟效果的添加1、延迟2、混响第六步母带处理第七步导出第一步降噪

在录音开始前呢，我们一般情况下，在歌手进入录音室是第一遍让歌手听音乐什么都不要做，也不要唱歌，听一段伴奏在歌手听伴奏的时候，录音师要做的就是录个5~10秒的录音室环境噪音一集软件设备连接造成的噪音，以便我们降噪时作为采样。点击保存保存采样后点击右下角确定。。。之后选中所有波形打开降噪器载入保存的采样试试调节处理程度切记不要降噪太多只要不要把人声原有的东西给降

了就OK，重复确定第二步音量的平衡1.压缩器compressor压限器

这个就是我们所说的压缩器了，作用呢，就是均衡人声的大小，现在仔细说一下每个的作用按照图文里的标记来说滤波器：指压限过后的声音圆滑度，也就是指穿透力度，数越大，就越圆滑阀值：压限作用阀值指的是控制人声大小的数值，简单来说就是把大小不一的声音放在一个点上，比率：这个是压缩的比率，这是和前面的阀值相互作用的，就像水龙头的开关一样，一点一点的开启，如果将这个开到6：1的时候，就好像一个水库，有６米高，只存着１米的水这样是极其不协调的，但是如果小于1的时候，就变成了水位超过储存量，这样就变成了扩散器了，所以调的时候一般就大于１的数值入：输入的电平信号出：压限过后人声的大小启奏：这里是指起始缓冲，就是声音超过压限作用阀值的时候在多长的时间开始发挥压

虽然对于录音和混音来说没有什么一定的原则

虽然对于录音和混音来说没有什么一定的原则，但是一旦你开发出一套自己的混音步骤，那么它至少可以告诉你混音工作应该从哪儿下手。下面就是我的混音步骤。在混音中你会花大量的时间来进行各种各样的调整。关于混音我们这里列出了12个(这只是个最低数量!)主要的步骤，而混音中最难的地方却是这些步骤之间的相互影响。当你改变均衡设臵的同时，电平值也会发生变化，这是因为你对声音中的某些元素进行了提升或是衰减，它会影响到其他的元素。事实上，你可以认为混音就是一把“音频密码锁”。当你将所有的号码都调到了正确的数字时，那么你就完成了一件伟大的混音。让我们一起来看一看这12个步骤，但是你要切记一点，这只是某一个人关于混音的见解，你很可能需要一套完全不同的但却是最适合于你的混音方法。第1步：做好准备混音可能是一件非常单调而乏味的事情，因此要设臵一个高效率的工作空间。如果你没有一把坐感舒适的椅子，那么你最好还是到附近的办公用具商店去一趟。准备一些纸张和一个笔记本，以便进行记录时使用，将灯光调整得暗一些，这样可以使你耳朵的灵敏度高于你的眼睛，还要让自己兴奋起来，开始你的“旅行”。要定时进行休息(例如每隔45到60分钟)，这样可以让耳朵得到放松并使你保持一个清醒的头脑投入到工作当中去。如果你是在录音绷中进行工作，那么这种休息就显得有些太奢侈了，但是这种两三分钟的休息却可以让你更加客观地进行判断，使你的混音工作得以迅速地完成。第2步：回顾音轨先使用较低的音量听一听所有音轨中都有些什么东西，然后记录下音轨的信息，并使用即时贴或是可以擦除的笔来简要地标明哪一个声音对应调音台上的哪一路。最好按照一般的逻辑习惯来组合声音，例如将所有打击乐器的声音都放在调音台上相连的路中。第3步：带上耳机清除瑕疵检查录音细微的瑕疵是一件需要用到“左脑”的理性行为，这不同于用“右脑”来进行感性的混音工作。如果大脑在这两种性质不同的工作状态中跳来跳去一定会阻碍你创造力的发挥，因此在进行正式的混音之前，要尽可能地做好清理工作——消除录音中的杂音、弹错的音符以及其他类似的东西。这时你可以戴上耳机，分别单独播放每一个音轨来捕捉录时中的每一个细节。如果你是对MIDI音轨进行混音，那么此刻你应该做的工作无疑是减薄多余的控制器信号，消除重叠的音符，删去单音乐器音轨中多出来的声音(例如贝司和铜号的声部)。为了整理录在磁带上(包括数字式磁带和模拟式磁带)的音轨，可以先将它们转录到硬盘录音机中，进行一些数字化的编辑和噪声抑制工作。虽然一些细小的杂音

【图文教程】广播剧和广播剧ED歌曲音频后期混响大法

混响大法（一）真实世界中的混响 ——整理：徐胤清声音遇到障碍会反射，所以我们这个世界充满了混响。如图：在这个世界中，有没有没有混响的地方呢？有！你坐上飞机，飞到一万米高空，然后往下跳，这时你大喊大叫，就是没有混响的，因为你在空中，周围没有任何障碍物，你的声音将会无限扩散出去而不会被反射回来。所以就没有混响。另一个没有混响的地方就是声学实验室。声学实验室的墙壁、天花板、地面是经过特殊处理的，声音到达墙壁后将会被墙壁吸收而不会被反射回来。为什么会被吸收？你可以做一个小实验，找100根针，就是缝衣服的针，把它们捆在一起，弄齐，然后你可以看看这一捆针的针头面，你会发现它是黑的，因为光线到达这一面后，经过多次反射，一直射到里面去，出不来，所以就没有光被反射出来，就好像光都被吸收了一样。声学实验室的布置也是

类似于此，把声音吸收。录音棚是半个声学实验室，能做到吸收大部份的混响。录音棚的墙壁排列都是不规则的，表面是用松软的棉制品构成，虽然比不上那捆针头，但声音到达墙壁后进入那乱糟糟的棉花里，七反射八反射就留在棉花里出不去了，所以录音棚里的混响也很小。在一个房间里大吼一声，会有多少反射声，答案是无数。看图：在这个房间里，你拍一下巴掌，得到的声音是这样：

是不是很多？这其实是比较简单的一个反射过程。如果这个房间里再摆上一些桌子椅子，反射会更加复杂。闭上眼睛，大吼一声，你就可以知道你大概处在一个什么样的环境中，在外面，还是在家里。甚至你在家里大吼一声，就可以知道你在哪个房间里，在这个房间的哪个位置上。这是因为各个房间由于空间大小不一样、家具的摆放不同、墙壁的材料不同，所以具有各自不同的混响特征；同一个房间里不同的位置上，由于你距离墙壁的远近不同，所以也具有不同的混响特征。你熟悉这些特征，所以你就能光凭声音就能分辨你在什么位置上。一个看起来很菜鸟的问题：为什么录音和混音要加混响？为什么录音和混音要加混响？答：因为录音时是没有混响的。为什么录音时是没有混响的？答：因为录音棚是无混响的。为什么录音棚是无混响的？其实专业的录音棚是有混响的，他们有很多板状的材料，可以灵活把房间改造成各种混响特征。但随着数字录音技术的飞速发展，数字混响效果器能够模拟真实情况下的混响，所以大家就干脆把录音棚弄成无混响的，录完音后再用效果器来模拟混响效果，想要什么混响就有

音乐后期制作——歌曲混音的12个步骤

第1步：做好准备。混音可能是一件非常单调而乏味的事情，因此要设置一个高效率的工作空间。如果你没有一把坐感舒适的椅子，那么你最好还是到附近的办公用具商店去一趟。准备一些纸张和一个笔记本，以便进行记录时使用，将灯光调整得暗一些，这样可以使你耳朵的灵敏度高于你的眼睛，还要让自己兴奋起来，开始你的“旅行”。要定时进行休息(例如每隔45到60分钟)，这样可以让耳朵得到放松并使你保持一个清醒的头脑投入到工作当中去。如果你是在录音绷中进行工作，那么这种休息就显得有些太奢侈了，但是这种两三分钟的休息却可以让你更加客观地进行判断，使你的混音工作得以迅速地完成。第2步：回顾音轨。先使用较低的音量听一听所有音轨中都有些什么东西，然后记录下音轨的信息，并使用即时贴或是可以擦除的笔来简要地标明哪一个声音对应调音台上的哪一路。最好按照一般的逻辑习惯来组合声音，例如将所有打击乐器的声音都放在调音台上相连的路中。这一步如果有什么问题，可以去音乐基地论坛找高手问问。第3步：带上耳机清除瑕疵。检查录音细微的瑕疵是一件需要用到“左脑”的理性行为，这不同于用“右脑”来进行感性的混音工作。如果大脑在这两种性质不同的工作状态中跳来跳去一定会阻碍你创造力的发挥，因此在进行正式的混音之前，要尽可能地做好清理工作??消除录音中的杂音、弹错的音符以及其他类似的东西。这时你可以戴上耳机，分别单独播放每一个音轨来捕捉录时中的每一个细节。如果你是对MIDI音轨进行混音，那么此刻你应该做的工作无疑是减薄多余的控制器信号，消除重叠的音符，删去单音乐器音轨中多出来的声音(例如贝司和铜号的声部)。为了整理录在磁带上(包括

Au_30_混音录歌教程

Adobe Audition 3.0录音教程录音篇：首先我们点选左上角的“文件”菜单，选择“新建会话”如图：在这里是选择你作品的采样率，点确定。采样率越高精度越高，细节表现也就越丰富，当然相对文件也就越大，这里我们选择默认的也就是44100，因为大多数网络下载的伴奏都是44100HZ的，当然也有少数精品是48000HZ，比如一些CD上的扒下来的，所以大家在录音前先要知道自己选用的伴奏采样率是多少，乱选的话会出现变调的尴尬事接下来我们要插入伴奏，可以点选“文件”菜单选择“导入”来插入你要的伴奏，或者是通过点选左边的快捷图标,被导入的文件会排列在左边的材质框里，我们选择刚刚导入的伴奏按右键，出现菜单，点选插入到多轨，它回自动插入到默认的第一轨道，也可以通过点选伴奏后按住左键不放直接拖到轨道里。

这样一来伴奏就加载完成了，接下来我们进入最重要的一个环节，就是录人声。点选第2轨，按下红色按钮R会出现一个对话框让你保存录音的项目，选择一个容量比较大的硬盘分区，新建一个专门的文件夹，然后保存在那里，以后每次录音的时候都会有一个保存项目，这就是录音文件的临时储存区，所有录音的内容都可以从那里找到，不过最好养成定期清理的习惯要不你会被庞大的文件淹没到你的硬盘的。呵呵！

言归正传，点选左下角的红色录音按钮，现在我们就可以拿起武器（麦）开始放声怒吼拉 ~~~（省略以下像杀猪叫一般的过程~~~）录音完毕我们按下左下脚的方块停止键，此时将得到一条线条优美饱满的人声（翻胃中）。

二、效果篇~ 人要打扮才漂亮，歌也一样不好好打扮打扮还真没法出去见人。现在我们就来为刚录好的人声磨个皮，~~呵呵俗称降噪！首先左键双击人声的轨道切换到单轨编辑模式，也可以通过选择左上脚编辑、多轨切换图标来选择。进入单轨编辑视图后，在人声轨道找一处没开唱的部分，点左键刷选一段，然后点选左上角的“效果”切换到效果界面，选择下面的“修复”菜单，双击“降噪器”后将回出现如下面版，注意我红圈里的两个参数，特性快照指的是在刷选时间里的采样副数，这里根据你的电脑性能来选择，数字越高采集点越密集，但是速度越慢，一般短时间内选1000就够了，我选了4000（谁叫俺电脑快呢~~）然后是FFT大小，这个依据你的设备好坏录音环境和电流底噪来决定，这个参数和你的设备性能等比上升，当然设备不好也可以选择高位参数只不过不准确，一般耳麦选4096~8192，设备和录音环境好的依次上升。参数都选好后点获取特性.

基于数字语音教室的多路混音算法及应用

基于数字语音教室的多路混音算法及应用 Multi-Point Audio Mixing Algorithm Based on Digital Classroom for Language learning and Its Application （1.武汉理工大学；2.长沙理工大学；3衡阳师范学院）刘新华13，李方敏1，旷海兰23，张小麟1 LIU Xinhua，LI Fangmin，KUANG Hailan, ZHANG Xiaolin 摘要：在研究音频混音技术的基础上，结合基于嵌入式技术的数字语音教室的实际情况,提出了一种应用于数字语音教室的多路实时混音算法，并给出了在数字语音教室中利用多路混音算法实现多人实时音频交互的方法。关键词：数字语音教室；嵌入式技术；混音中图分类号： TP393 文献标识码： A 【Abstract】By researching on audio mixing technology and combining the real situation of digital classroom for language learning based on embedded technology, this paper proposes a algorithm for multi-point real-time audio mixing and its real application in digital classroom for language learning to solve the multi-point real-time audio communication. 【Keywords】Digital classroom for language learning; Embedded technology; Audio Mixer 0引言随着多媒体语音数码技术、网络通信技术、实时嵌入式软件和硬件技术的进步，数字语音教室的技术日趋成熟。由于其在语音教学应用上有着传统语音教室无可比拟的强大功能，而被现代教育系统推广。数字语音教室是建立在网络数据交换的基础上，将经过A/D转换后的语音数据或音频的数据，通过标准的网络协议，传送到用户终端，网络及终端之间的消息传递，以符合标准网络协议的命令数据的形式反映，以达到语言学习的良好音质，满足教学方式多样性需求，充分合理的组建和利用教学资源的一种全新的语言学习系统。作为现代化教学的手段，数字语音教室将逐渐取代传统的语音教室。在数字语音教室中，学生终端是基于嵌入式技术，而教师机采用的是计算机多媒体技术，二者通过网络通信技术实现交互，在这种交互过程中，尤其是以学生终端与教师机之间的实时音频交流为主要内容。在课堂教学中，当教师机进行广播讲话或广播音频时，学生端被动接受音频流；当教师端与学生终端进行一对一谈话时，由于双方均可收发音频流，在基于TCP/IP协议下，可以实现双工通信，但是如果将这种一对一谈话，向全班同学示范，即其他终端均能实时听见双方的谈话内容，就必须将双方的音频流进行混音，实时地广播给其他终端，特别是在一对多实时音频交流、小组实时音频讨论的情况下，需要进行更为复杂的混音处理，即多路混音处理。因此，多路实时音频混音技术，是设计开发数字语音教室的一个关键技术。本文从分析数字语音教室的体系结构出发，在考虑学生终端处理能力及网络通信负荷的情况下，对数字音频混音技术进行了研究，提出了一种应用于数字语音教室的多路实时音频混音算法并分析了数字语音教室中混音技术的实际应用。 1数字语音教室的体系结构传统型语言学习系统的结构设计主要就是以录音机机芯为主体，通过各厂家自行定义的相关线缆来进行连接与传输。数字化系统的核心技术是基于计算机数据传输协议的网络技术，在实际应用中，我们设计开发的数字语音教室的体系结构如图1所示：学生终端基于嵌入式技术，支持TCP/IP网络协议，支持语音输入、输出处理，能够输入4个以上选择项，具有选择和执行菜单功能。并具有以下外部接口：以太网网卡；电源接口；麦克风/耳机语音输入输出设备、显示屏（LCD）及键盘。教师机采用普通的PC机，采用Windows系统，利用Visual C＋＋编写的服务器程序来控制包括学习终端的整个系统。根据实际要求可以为教师端配置磁带卡座、DVD播放器、投影仪、VCD机等外部辅助教学工具，这些均由教师机通过主板