WMP12高清硬解+个性化字幕+多音轨切换+音效增强+数字音频输出设置

WMP12高清硬解+个性化字幕+多音轨切换+音效增强+数字音频输

出设置

https://www.360docs.net/doc/f817669648.html,/thread-711898-1-2.html 用Win7codecs的朋友们都知道，安装这个解码包之后，默认状态下就开启了H.264编码高清视频的硬件加速功能，不过在默认状态下，WMP不能正常播放采用MPEG-2,AC3编码，TS封装，隔行扫描的高清视频，通常是只有画面没有声音，逐行扫描的MPEG-2编码的高清TS视频基本是正常播放的，而且WMP还不能正常播放采用VC-1编码，TS封装的高清视频，通常是只有声音没有画面，不仅如此，WMP 在播放蓝光多音轨高清电影时，通常只能播放和本地语言相同的音轨，比如中文音轨，而原声音轨却分离不出来，例如DTS音轨，出现这些情况的原因就是Win7codecs中包含的haali media spliter是有问题的，不是老版本，老版本解决了LPCM音频分离问题，也解决了TS视频分离问题，新版本却又出现了这些问题，才导致WMP播放不正常，而且貌似RMVB不能预览，容易导致资源管理器崩溃，而且让WMP 显示字幕之后，字幕的位置，字体的颜色，字体的大小都不是让人满意的，用WMP播放H.264编码的高清视频时，通常音量偏小，不管是AAC,AC3还是DTS音轨，音量都偏小，就算把WMP和系统音量调到最大，声音仍然不够震撼，这个现象在Windows Media Center中尤其明显，把WMC的音量调到最大之后，声音听起来依然很弱，没有很强的力度感，而且很多人也不知道如何让WMP直接输出数字音频到数字音频设备.因此，默认状态下的win7codecs并不是完美的。

软件准备：Win7codecs 2.4.5+Windows 7 codec pack 2.3.0(只需要此解码包默认选择的分离器部分，其他部分都不需要,目前我只知道这个版本的解码包中含有的分离器是正常工作的，其他版本的不清楚）

6月4日更新日志：

目前Win7codecs已经更新到2.5.4版本，如果你已经安装了这个版本，就不必再安装Windows 7 codec pack 2.3.0了，直接按照下面的图进行设置就可以了，2.5.4版本更新了最新版的haali分离器，解决了TS封装的视频分离问题，MPEG-2和VC-1编码的TS视频都能正常分离了，按图设置之后就可以完美硬解了，不过有一点问题，播放多音轨的高清视频时，音轨的语言无法识别，有些音轨甚至是分离错误的（可以把TS或者PS分离器设置成gabest's blu-ray splitter,此时默认是关闭haali分离器的，此时蓝光电影（M2TS格式）里的所有音轨都能分离出来了，不过音轨的语言依然无法识别，但此时MPEG-2编码的TS视频播放时就没有声音了，取消关闭haali分离器之后，MPEG-2编码的TS视频能正常播放了，但此时蓝光电影(M2TS格式）就不能分离出所有音轨了，做不到两全其美），而且加载字幕也出现了一些问题，我用的2.4.5的这个版本需要另一个解码包的分离器配合起来才能正常工作，唯一的缺点就是播放MPEG-2编码，隔行扫描的高清视频时画面有轻微抖动(此问题可以间接解决，可以使用TsmuxeR对

MPEG-2编码，隔行扫描的高清视频重新封装成TS格式封装的视频，目的就是要重新校正视频，然后就可以正常流畅播放了），WMP在播放视频方面还有不少问题需要解决，相信以后会逐步解决的，现在把音量增强和数字音频输出的设置也增加进来。

下载地址：

Win7codecs 2.4.5 (32/64位操作系统必须安装）https://www.360docs.net/doc/f817669648.html,/filebox/down/fc/eac08e41832e7f8

2f8b4ed03571af788

X64 Components V2.4.5（64位操作系统）https://www.360docs.net/doc/f817669648.html,/filebox/down/fc/5a8cb2c3868cdf8

6cbd1ae75dbbd5e2b

Windows 7 Codec Pack 2.3.0

https://www.360docs.net/doc/f817669648.html,/filebox/down/fc/54d9acf0948c584

dd4dba1334030fc8c

下面先说硬解设置：

先安装Win7codecs 2.4.5,安装完之后，以管理员权限运行application

settings，然后下面的设置，我就不细细说明了，看图就明白；

设置完之后开始安装Windows codec pack 2.3.0:

至此，硬解设置完成，多音轨切换也可以实现了，本人电脑是速龙2 X4 630处理器，主频2.8GHz,性能算是比较强的了，显卡是HD4670 256MB GDDR4,下面有软解和硬解的详细对比）：

采用MPEG-2，AC3编码的1080I高清TS视频播放截图：

视频码率：18Mbps

软解CPU占用率：16%

硬解CPU占用率：4%

采用H.264,AAC编码的1080P高清MKV视频播放截图：

视频码率：4.8Mbps

软解CPU占用率：26%

硬解CPU占用率：1%

采用VC-1，AC3编码的1080P高清TS视频播放截图：

视频码率：27.6Mbps

软解CPU占用率：36%

硬解CPU占用率：3%

测试证明硬解确实强悍，另外Windows media center也打开了硬解，这两者使用的都是同一个播放核心。

下面是采用H.264,AAC编码的720P视频播放截图：

小品《捐助》

2008年北京奥运会开幕式

另外，很多人都觉得硬解播放H.264编码的高清视频时画面色彩比较淡，那是因为硬解的时候画面色深是12bit，而软解的时候输出的画面色深是16bit的，所以硬解播放时画面不如软解，当然，我们可以调节WMP的饱和度使视频画面接近于软解的画质，缺点就是重新播放视频时就要调节一次，WMP无法保存对饱和度的调节，播放视频的时候才

能调节饱和度，建议设置到20以内，过高的话颜色就不对了：

下面提供三个不同编码的高清视频，大家可以下载测试一下是否都能正

常播放：

文件名：CCTV-HD温哥华冬奥会宣传片

视频封装格式：TS

视频码率：18Mbps

时间长度：43秒

文件大小：95.7MB

视频编码格式：MPEG-2

分辨率：1920X1080

画面宽高比：16：9

帧速：25fps

音频编码格式：AC3

音频码率：448Kbps

声道数：6

下载地址：

https://www.360docs.net/doc/f817669648.html,/filebox/down/fc/4b4febd92b14974356be65c

62b79d3f7

文件名:CCTV-HD温哥华冬奥会第三天精彩集锦

封装格式：MKV

视频码率：4.8Mbps

时间长度：2分19秒

文件大小：81.97MB

视频编码格式：H.264

分辨率：1920X1080

画面宽高比：16：9

帧速：25fps

音频编码格式：AAC

音频码率：256Kbps

声道数：6

下载地址：

https://www.360docs.net/doc/f817669648.html,/filebox/down/fc/f4a071150de455415336629

6cfd85aa7

文件名：[LG蓝光演示片

断].LG.Super.Multi.Blue.Demo.Blu-ray.REMUX.1080P.VC-1.LPCM.

DD51.Clip2-SiLU.ts

封装格式：TS

视频码率:27.6Mbps

时间长度：1分9秒

文件大小：227.1MB

视频编码格式：VC-1

分辨率：1920X1080

画面宽高比：16：9

帧速：24fps

音频编码格式：AC3

音频码率：384Kbps

声道数：6

下载地址：

ed2k://|file|%5BLG%E8%93%9D%E5%85%89%E6%BC%94%E7%A4%BA%E7%89% 87%E6%96%AD%5D.LG.Super.Multi.Blue.Demo.Blu-ray.REMUX.1080P.V C-1.LPCM.DD51.Clip2-SiLU.ts|238131516|97d90e9776bae2858629da4 06ca64216|h=2TQDI5OS5ZFM3U7UGBWK267IWOW22BQZ|/

下面是多音轨切换截图：

蓝光电影《特种部队-眼镜蛇的崛起》（33GB)

蓝光电影《变形金刚2-堕落者的复仇》(37GB)

下面是字幕的设置。如图所示；

至此，字幕设置完成，如果你喜欢别的字体和颜色，可自行修改，请看

字幕效果截图：

上述设置方法也存在一点不足之处，比如TS或者M2TS封装的视频不能加载字幕，而且WMP加载字幕播放的时候不能保持硬解，下面介绍另外一种设置方法，在前面的设置基础之上做一些调整就可以解决这些

问题，具体设置请看图：

如何加载电影字幕

现在比较流行的字幕格式分为图形格式和文本格式两类。图形格式字幕：由idx和sub文件组成，它们的文件名应该相同。idx相当于索引文件，里面包括了字幕出现的时间码和字幕显示属性等，加载字幕的时候加载的文件选择idx即可。sub 文件就是存放字幕本身了，注意是图片格式的，所以比较大，可能有10M以上。idx+sub可以存放很多语言的字幕，提供了在播放的时候的选择。文本格式字幕：srt文本字幕最为流行，因为其制作规范简单，一句时间代码+ 一句字幕，使得制作修改就相当简单，文件很小，大概约有30K。其他的文本字幕格式还有很多，就不再介绍。注：本文只以srt格式字幕做例子。关于字幕的下载在下载视频的时候，一般都会提供字幕的下载；如果没有提供字幕，则可到射手网搜索下载字幕。射手网https://www.360docs.net/doc/f817669648.html,/ 字幕版本：在射手网上搜索到的字幕一般都会有很多的版本，要选择与你的电影版本相同且分割段数相同的那个字幕来下载，否则字幕会与影片（特别是后半部分）会不同步。【字幕加载图解教程】关于字幕的自动加载：当视频文件名和字幕文件名相同（扩展名不同）并且它们在同一目录下是，stormplayer会自动加载该字幕，比如视频文件名和字幕文件名为： The.Good.the.Bad.And.The.Ugly.1966.黄金三镖客.CD1.avi The.Good.the.Bad.And.The.Ugly.1966.黄金三镖客.CD1.srt 有时候字幕文件名会比视频文件名多出字幕语言类型的标识，如chs表示简体中文，而cht表示繁体中文，而eng表示引文字幕，如 The.Good.the.Bad.And.The.Ugly.1966.黄金三镖客.CD1.chs.srt 即使多出了chs也能照样自动加载，因为chs之前的文件名是一样的。自动加载字幕的缺点：字幕太小，位置有点偏高，如下图

基于MATLAB 的声音信号采集系统(论文)

基于MATLAB 的声音信号采集系统野龙平（陕西师范大学电子信息科学与技术，陕西）摘要: 声音是各种信号传递与交流最直接的体现，因此对声音信号的研究有十分重要的意义。本文主要针对Matlab指令系统对声音信号的采集，作者利用Matlab 提供的数据采集工具箱, 介绍了倆种采集方法，简单分析并比较其优缺点。基于matlab的数据采集系统, 具有实现简单、性价比和灵活度高的优点。关键词: Matlab; 数据采集 0 引言随着科技的发展，对于语音信号的采集已经有很多种方法，如基于单片机技术、VC,C++等编程、纯硬件电路，本文介绍的方法主要通过一款软件MATLAB。它是MathWorks 公司推出的一种面向工程和科学运算的交互式计算软件, 其中包含了一套非常实用的工具-- 数据采集工具箱。使用此工具箱更容易将实验测量、数据分析和可视化的应用集合在一起。数据采集工具箱提供了一整套的命令和函数, 通过调用这些命令和函数, 可以直接控制数据采集设备的数据采集。作者简单介绍了一种用声卡进行语音信号采集和MATLAB 的数据采集工具箱进行分析处理的语音信号采集系统。经实验证明, 该系统可实现在线连续采集语音信号并进行分析和处理, 具有实现简单、性价比和灵活度高的特点。 1 语音数据采集系统设计 MATLAB 中提供了强大的数据采集工具箱( DAQ- Data Acquisition Toolbox) , 可满足控制声卡进行数据采集的要求。用户通过调用MATLAB 命令, 可对采集的数据进行分析和处理, 为用户带来了极大的方便。语音数据采集过程如图1 所示。

图1 声卡采集声音信号有两种方式: 传输线输入方式(LineIn) 和麦克风输入( MicIn) 方式。LineIn 方式是通过传输线把其他声音设备, 如录音机等设备的音频输出信号连接到声卡, 通过声卡记录数据存入计算机。本系统采用MicIn 方式, 即用麦克风接收语音通过声卡将音频信号存入计算机。利用MicIn 方式通过声卡采集数据有两种方法: 方法一是采用对声卡产生一个模拟输入对象进行采集, 方法二是直接利用MATLAB 数据采集箱中提供的的函数命令进行采集。 1. 1 方法1 本系统是以声卡为对象利用MATLAB 数据采集工具箱提供的环境完成数据采集过程, 麦克风成为数据采集系统中的传感器。数据采集过程与其他硬件设备无关, 只与声卡有关, 因此应对声卡产生一个模拟输入对象(AI) 。数据采集过程的具体实现: 1) 初始化: 创建设备对象。 ai= analoginput(‘ winsound ’ ) 2) 配置: 根据数据采集硬件设备的特性, 增加通道和控制数据采集的行为。为AI 添加1 个通道, 设置采样频率和采样时间。 addchannel( ai, 1) freq= 8000; % 采样频率fs8000Hz set( AI, sampleRate, freq) %为模拟输入设备设置采样频率 duration= 2; %采样时间为2 秒 set (AI, SamplesPerTriffer, duration* freq) ; % 为模拟输入设备设置触发时间 3) 执行: 启动设备对象, 采集数据。 start( ai) ; %启动设备对象 data= getdata( ai) ; % 获得采样数据 4) 终止: 删除设备对象。 stop( ai) ; % 停止设备对象语音信号输入声卡 Matlab 数据采集箱计算机

个性化音乐推荐系统设计与实现

个性化音乐推荐系统设计与实现摘要 21世纪是信息化时代，随着信息技术和网络技术的发展，信息化已经渗透到人们日常生活的各个方面，与人们的日常生活早已建立了离不开的联系。对网络音乐服务来说，不管是音乐下载服务，或者是网络音乐电台服务，都需要用到优秀的内容推荐系统去辅助整个系统。个性化音乐推荐系统是目前最流行的应用方法之一。同时音乐成为重要的媒介与朋友交流文化，所以很多SNS应用当中将音乐服务添加到里面。本系统采用SSH框架组合进行设计，基于Java Web技术，系统使用UML建模。本系统的功能模块主要包括：音乐上传、单曲管理、个人信息维护、收集歌曲信息、音乐检索以及系统推荐等。音乐上传利用JavaScript脚本定义了一个函数，单曲管理在action中定义一个方法，系统推荐是利用协同过滤算法来进行的。整个系统主要实现了从用户注册和登录、检索音乐到收听音乐、评分音乐，个性化推荐的整个音乐系统，管理员可使用系统后台对音乐歌曲信息进行修改、会员信息修改、系统推荐等进行有效的管理。很大程度上提高了对音乐管理的效率，符合了广大用户们的基本需求。关键词：SSH框架，音乐系统，协同过滤，MVC模式

DESIGN AND INPLEMENTATION OF PERSONALIZED MUSIC RECOMMENDATION SYSTEM Abstract The 21st century is the era of information, with the development of information technology and network technology, it has penetrated into every aspect of daily life, with people in daily life has been inextricably linked to the the Internet music service, whether it is music download service, or network music radio service, all need to use the excellent content recommendation system to support the whole system. Personalized music recommendation system is one of the most popular applications. At the same time music has become an important medium of communication with friends culture, so many SNS applications when the music services added to the inside. The system uses a combination of SSH framework design, based on Java Web technology，system used UML modeling. Site function modules include: Music upload, music management,personal information maintenance, collecting music information, music search and system recommend. The entire site is simple, user-friendly, flexible and practical. The main achievement of the user registration and login, retrieve music to listen to music, the whole comment is called online music listening processes, and system administrators can use the background information on the goods, membership information, message information, and effective management. Greatly improving the efficiency of music management, in line with the needs of customers. Keywords: SSH Framework,Music System,Collaborative Filtering,MVC Pattern

数字音频作业及其答案

第一次作业： 1:、声音可分为两种：纯音和复合音，平常人们说话的声音属于哪一种？语音的频率范围是多少？音频通常包括哪几种声音信号？其频率范围是多少？ 2、请说明音频信号数字化的三个步骤？ 3、如何理解量化是信号数字化过程中重要的一步，而这一过程又是引入噪声的主要根源”这句话的含义？通过哪些途径可以减小量化误差？ 4对双极性信号若采用均匀量化，则量化信噪比SNR与量化比特数之间的关系为： SNR=6.02xN+1.76dB试分析此式对实际量化与编码的指导意义？ 5:、A/ D、D/A转换器的技术指标有哪些？答：1:人们说话的声音为复合音，语言的频率范围为300HZ-3000HZ音频暴多语音、音乐、效果声等声音信号，频率范围为20HZ-20KHZ 2: 1取样：对连续信号按一定的时间间隔取样。奈奎斯特取样定理认为，只要取样频率大于等于信号中所包含的最高频率的两倍，则可以根据其取样完全恢复出原始信号，这相当于当信号是最高频率时，每一周期至少要采取两个点。但这只是理论上的定理，在实际操作中，人们用混叠波形，从而使取得的信号更接近原始信号。2量化：取样的离散音频要转化为计算机能够表示的数据范围，这个过程称为量化。量化的等级取决于量化精度，也就是用多少位二进制数来表示一个音频数据。一般有8位，12位或16位。量化精度越高，声音的保真度越高。以8位的举例稍微说明一下其中的原理。若一台计算机能够接收八位二进制数据，则相当于能够接受256个十进制的数，即有256个电平数，用这些数来代表模拟信号的电平，可以有256种，但是实际上米样后的某一时刻信号的电平不一定和256个电

平某一个相等，此时只能用最接近的数字代码表示取样信号电平。3编码：对音频信号取样并量化成二进制，但实际上就是对音频信号进行编码，但用不同的取样频率和不同的量化位数记录声音，在单位时间中，所需存贮空间是不一样的。波形声音的主要参数包括：取样频率.量化位数.声道数.压缩编码方案和数码率等，未压缩前，波形声音的码率计算公式为：波形声音的码率=取样频率*量化位数*声道数/8。波形声音的码率一般比较大，所以必需对转换后的数据进行压缩。 3:量化是按四舍五入对采样的样本值进行计量的，这个过程会产生误差可对噪声进行整形，提高采样频率等方法减小量化误差 4:量化比特数增加一位，则信噪比提高6dB,信噪比提高意味着声音动态范围的加宽，若采用量化比特N=16的A/D变换器的数字声记录在磁带上可以扩展到98dB,接近于交响乐动态范围，若将量化比特提高到N=20,可扩至人儿的122dB动态范围。 5: A/D的技术指标有：分辨率、转换速率、量化误差、偏移误差、满刻度误差和线性度误差等。D/A转换器的技术指标有：分辨率和建立时间。第二次作业： 1. 什么叫最小可闻阈？什么叫掩蔽阈？什么叫频域掩蔽？什么叫时域掩蔽？掩蔽效应的一般规律是什么？ 2. 何谓临界频带？简述它在音频编码中的应用。 3. 音频编码通常分为哪几类？它们各有什么优缺点？ 4. 声音压缩的依据是什么？MPEG-1音频编码利用了听觉系统的什么特

labview声音采集系统

虚拟仪器技术姓名：史昌波学号：2131391 指导教师：孙来军院系(部所)：电子工程学院专业：控制工程

目录 1、前言 (3) 2、声卡的硬件结构和特性 (3) 2．1声卡的作用和特点 (3) 2．2声卡的构造 (5) 3、LABVIEW中与声卡相关的函数节点 (5) 4、LABVIEW程序设计 (6) 4．1程序原理 (6) 4．2程序结构 (7) 4．3结果分析 (9) 5、结束语 (9) 6、参考文献 (10)

基于声卡的数据采集与分析 1、前言虚拟仪器技术是利用高性能的模块化硬件，结合高效灵活的软件来完成各种测试、测量和自动化的应用。在虚拟仪器系统中，硬件解决信号的输入和输出，软件可以方便地修改仪器系统的功能，以适应不同使用者的需要。其中硬件的核心是数据采集卡。目前市售的数据采集卡价格与性能基本成正比，一般比较昂贵1。随着DSP(数字信号处理)技术走向成熟，计算机声卡可以成为一个优秀的数据采集系统，它同时具有A／D和D／A转换功能，不仅价格低廉，而且兼容性好、性能稳定、灵活通用，驱动程序升级方便，在实验室中，如果测量对象的频率在音频范围，而且对指标没有太高的要求，就可以考虑使用声卡取代常规的DAQ设备。而且LABVIEW中提供了专门用于声卡操作的函数节点，所以用声卡搭建数据采集系统是非常方便的2。 2、声卡的硬件结构和特性 2．1声卡的作用和特点声卡的主要功能就是经过DSP（数字信号处理）音效芯片的处理，进行模拟音频信号的与数字信号的转换，在实际中，除了音频信号以外，很多信号都在音频范围内，比如机械量信号，某些载波信号等，当我们对这些信号进行采集时，使用声卡作为采集卡是一种很好的解决方案。声卡的功能主要是录制与播放，编辑与合成处理，MIDI接口三个部分3。（1）录制与播放

个性化推荐系统分析与设计

课程设计报告课程名称系统分析设计与开发方法课题名称个性化推荐系统的分析与设计专业信息管理与信息系统班级1002 学号201003110215 姓名黄天玲指导教师唐志航 2014年元月4 日

一、设计内容与设计要求 1．设计内容：见附录 2．设计要求： 1）．设计正确，方案合理。 2）．界面友好，使用方便。 3）．建模语言精炼，结构清晰。 4）．设计报告4000字以上，含建模语言说明，用户使用说明，UML建模图。 5）．上机演示。二、进度安排第十七周星期四下午：课题讲解，查阅资料、系统分析星期五上午：总体设计、详细设计第十八周星期一：建模，上机调试、撰写课程设计报告星期二下午：答辩附：课程设计报告装订顺序：封面、任务书、目录、正文、评分、附件（A4大小的图纸及程序清单）。正文的格式:一级标题用3号黑体,二级标题用四号宋体加粗,正文用小四号宋体;行距为22。

设计课题：个性化推荐系统的分析与设计一、问题描述：对网络购物个性化推荐系统进行分析与设计，对购物流程进行分析，对购物中关键环节进行设计，实现对商品的录入、显示、修改、排序、保存、销售、售后服务以及客户管理等操作实现推荐结果准确性、推荐结果多样性、用户交互度、系统界面设计、系统交互设计、推荐透明度(推荐解释)。二、功能要求： 1、用UML完成一个小型团购系统的分析、设计。 2、写出系统需求报告，说明系统的功能。 3、通过面向对象的分析和设计建立系统模型。 4、画出完整的用例图、类图、对象图、包图;及时序图、协作图、状态图、活动图；及组件图和配置图）三、建模提示： 1、使用Enterprise Architect 8.0建模。 2、使用 Ration Rose 或StarUML建模。四、其它对该系统有兴趣的同学可以在实现上述基本功能后，完善系统的其它功能，特别是售后以及客户关系管理。

数字音频技术_MP3_的压缩编码原理与制作方法

第4卷第2期2004年6月长沙航空职业技术学院学报 CHAN GSHA AERONAU TICAL VOCA TIONAL AND TECHN ICAL COLL EGE JOURNAL Vol.4No.2 J un.2004 收稿日期:2004-03-20 作者简介:张晓婷(1964-),女,上海市人,讲师,主要从事计算机教学与研究。数字音频技术(MP3)的压缩编码原理与制作方法张晓婷 (珠海市工业学校,广东珠海　519015) 摘要:本文从音频压缩理论的角度,阐述MP3音频格式、压缩编码原理,同时介绍专业制作 MP3的方法。关键词:MP3音频格式;压缩编码原理;制作经验与技巧中图分类号:TN919.3+11　文献标识码:A 文章编号:1671-9654(2004)02-051-06 Compression Coding Principle and F acture of Digital Audio Frequency T echnique (MP 3) ZHAN G Xiao 2ting (Zhuhai Indust ry School ,Zhuhai Guangdong 519015) Abstract :　From the perspective of Audio Compression Theory ,the paper discusses format of audio Frequency tech 2 nique (MP3)and compression coding principle and also introduces the facture of audio Frequency technique (MP3). K ey w ords :　Fomat of audio Frequency technique (MP3);compression coding principle ;facture 一、引言数字技术的出现与应用为人类带来了深远的影响,特别是互联网的普及,使数字音频技术得到更为广泛的应用,并具有良好的市场前景。与之相关的数字音频压缩技术也得到了充分的发展,一些著名的研究机构和公司都致力于开发专利技术和产品。其中,MP3便是目前为止开发得最为成功的数字音频压缩技术之一。二、MP3简介 (一)数字音频MP3的格式 MP3音频格式诞生于20世纪80年代,全名MPEG Audio layer 3,是MPEG (Moving PicturesEx 2pert Group 运动图像专家组)当初和影像压缩格式同时开发的音频压缩格式,是MPEG 21标准中的第三个层次,是综合了MPEG Audio layer 2和ASPEC 优点的混合压缩技术,音频质量好,主要用于MP3音频压缩,典型的码流为每通道64Kbit/s 。 (二)数字音频MP3压缩的优点使用数字音频MP3压缩方式的处理,能增加更多的存储空间。由于MP3的压缩比约在十到十二倍之间,一分钟的CD 音乐经MP3压缩后,只需要一兆左右的存储空间,即一张光盘可以存储六百五十分钟到七百五十分钟的音乐;MP3典型的码流是每通道64Kbit/s ,只有CD 音乐每通道大约十分之一的码流,非常适合网上传输。更重要的是,即使压缩比如此惊人,音乐的品质依然较好,这主要是利用了人类听觉掩蔽效应(Masking Effect )的缘故。MP3具有容量小、数码化、制作简单、传输方便、成本低廉等特点,虽历经14余年,仍然是网上最流行的音乐格式之一。三、MP3压缩编码原理在MPEG 21的音频压缩中,采样频率可分为32、44.1和48KHz ,可支持的声道有单声道(mono 2phonic )、双—单声道(dual 2monophonic )、立体声模式 ? 15?

声音信号的获取与处理

实验一声音信号的获取与处理声音媒体是较早引入计算机系统的多媒体信息之一，从早期的利用PC机内置喇叭发声，发展到利用声卡在网上实现可视电话，声音一直是多媒体计算机中重要的媒体信息。在软件或多媒体作品中使用数字化声音是多媒体应用最基本、最常用的手段。通常所讲的数字化声音是数字化语音、声响和音乐的总称。在多媒体作品中可以通过声音直接表达信息、制造某种效果和气氛、演奏音乐等。逼真的数字声音和悦耳的音乐，拉近了计算机与人的距离，使计算机不仅能播放声音，而且能“听懂”人的声音是实现人机自然交流的重要方面之一。采集(录音)、编辑、播放声音文件是声卡的基本功能,利用声卡及控制软件可实现对多种音源的采集工作。在本实验中，我们将利用声卡及几种声音处理软件，实现对声音信号的采集、编辑和处理。实验所需软件： Windows录音机（Windows98内含） Creative WaveStudio(Creative Sound Blaster系列声卡自带) Syntrillium Cool Edit 2000(下载网址：https://www.360docs.net/doc/f817669648.html,) 进行实验的基本配置： Intel Pentium 120 CPU或同级100%的兼容处理器大于16MB的内存 8位以上的DirectX兼容声卡 1.1 实验目的和要求本实验通过麦克风录制一段语音信号作为解说词并保存，通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理，制作出一段完整的带背景音乐的解说词。 1.2 预备知识 1．数字音频和模拟音频模拟音频和数字音频在声音的录制和播放方面有很大不同。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上，如磁带或唱片。播放时将纪录在媒体上的信号还原为波形。模拟音频技术应用广泛，使用方便。但模拟的声音信号在多次重复转录后，会使模拟信号衰弱，造成失真。数字音频就是将模拟的(连续的)声音波形数字化(离散化)，以便利用数字计算机进行处理，主要包括采样和量化两个方面。 2．数字音频的质量数字音频的质量取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在2OkHz左右，根据采样理论，为了保证声音

关于硬字幕的添加及置顶特效

片子里出现提示，而没有时间轴的部分，要求翻译主动添加时间轴，填入相对应的中文翻译。 1.一般会碰到的情况是：地名人名[一般还会有该人身份介绍] 建筑名[某某场馆某某医院等等一般片中会给该建筑物一个特写] 等等如：片中出现提示Los Angeles，California 在提示出现的相应时间点，翻译需要加轴，并作中文翻译。 00:00:05,830 --> 00:00:09,160 加州洛杉矶 2．片名一般是每个任务P1的同学要注意的地方。片名出现时，需要加时间轴，翻译片名。纪录片的要求是：凡是剧中出现的，需要说明的地方一定要主动添加硬字幕。(其实其他美剧也都是一样的，只是这里特别强调) 关于硬字幕的置顶特效：这个在纪录片里碰到比较多，特别提出来讲一下。比如一个片子，有位科学家出来作介绍，片子中会提示这位科学家的名字、研究领域，或者头衔、职位等等但同时，他讲话的字幕也在播放，需要翻译。这个时候，就需要将人物介绍的字幕，置顶显示。请各位记一下这行代码： {\an8}{\fn方正黑体简体\fs18\b1\bord1\shad1\3c&H2F2F2F&} 其中，{\an8}表示置顶显示；后面其他的，是字幕的字体等特效。以后咱纪录片置顶的字幕就统一用这个了。具体方法：单独做一个时间轴，把要置顶的硬字幕，写在这个代码的后面就行了。例如： 39 00:03:00,120 --> 00:03:03,450 这些年轻的数学家们都很狂妄自大 These young mathematicians were all pretty cocky, 40

00:03:03,650 --> 00:03:07,880 但是论自大自信和行为反常 But he towered over them in arrogance 41 00:03:03,650 --> 00:03:12,816 {\an8}{\fn方正黑体简体\fs18\b1\bord1\shad1\3c&H2F2F2F&}西维亚?娜萨《美丽心灵》作者 42 00:03:08,230 --> 00:03:12,920 他都更胜一筹 And confidence and also in eccentricity. 可以看到：置顶的时间轴是单独的；且对应时间可以跟正常的轴重合，相互不影响。比如这里是找了些相关的人来口述历史，正常的轴就放讲话的内容，置顶的轴就介绍讲述人是身份。如果硬字幕跟一般字幕不冲突，就不用置顶显示了。正常添加时间轴就可以，当然还是一样，这些时间轴间不能有重合。大家碰到的时候就参考本帖处理。要是还有问题，群里讨论，或者发邮件。

音频信号分析与处理

实验三音频信号的分析与处理1 一、实验目的 1.掌握音频信号的采集以及运用Matlab软件实现音频回放的方法； 2.掌握运用Matlab实现对音频信号的时域、频谱分析方法； 3.掌握运用Matlab设计RC滤波系统的方法； 4.掌握运用Matlab实现对加干扰后的音频信号的进行滤波处理的方法； 5.锻炼学生运用所学知识独立分析问题解决问题的能力，培养学生创新能力。二、实验性质设计性实验三、实验任务 1.音频信号的采集音频信号的采集可以通过Windows自带的录音机也可以用专用的录制软件录制一段音频信号（尽量保证无噪音、干扰小），也可以直接复制一段音频信号，但必须保证音频信号保存为.wav的文件。 2.音频信号的时域、频域分析运用Matlab软件实现对音频信号的打开操作、时域分析和频域分析，并画出相应的图形（要求图形有标题），并打印在实验报告中（注意：把打印好的图形剪裁下来，粘贴到实验报告纸上）。 3.引入干扰信号在原有的音频信号上，叠加一个频率为100KHz的正弦波干扰信号（幅度自定，可根据音频信号的情况而定）。 4.滤波系统的设计运用Matlab实现RC滤波系统，要求加入干扰的音频信号经过RC滤波系统后，能够滤除100KHz的干扰信号，同时保留原有的音频信号，要求绘制出RC滤波系统的冲激响应波形，并分析其频谱。

% 音频信号分析与处理 %% 打开和读取音频文件 clear all; % 清除工作区缓存 [y, Fs] = audioread('jyly.wav'); % 读取音频文件 VoiceWav = y(300000 : 400000, 1); % 截取音频中的一段波形 clear y; % 清除缓存 hAudio = audioplayer(VoiceWav, Fs); % 将音频文件载入audioplayer SampleRate = get(hAudio, 'SampleRate'); % 获取音频文件的采样率KHz T = 1/SampleRate; % 计算每个点的时间，即采样周期SampLen = size(VoiceWav,1); % 单声道采样长度 %% 绘制时域分析图 hFig1 = figure('Units', 'normalized', 'Position', [0 0.05 0.49 0.85]); t = T: T: (SampLen* T); subplot(2, 1, 1); % 绘制音频波形 plot(t, VoiceWav); % 绘制波形 title('音频时域波形图'); axis([0, 2.3, -0.5, 0.5]); xlabel('时间(s)'); ylabel('幅值(V)'); % 显示标题 %% 傅里叶变换 subplot(2, 1, 2); % 绘制波形 myfft(VoiceWav, SampleRate, 'plot'); % 傅里叶变换 title('单声道频谱振幅'); % 显示标题 xlabel('Frequency (Hz)'); ylabel('|Y(f)|'); play(hAudio); % 播放添加噪声前的声音 pause(3); %% 引入100KHz的噪声干扰 t = (0: SampLen-1)* T; noise = sin(2 * pi * 10000 * t); % 噪声频率100Khz，幅值-1V到+1V hFig2 = figure('Units', 'normalized', 'Position', [0.5 0.05 0.5 0.85]); subplot(2, 1, 1); % 绘制波形 plot(t(1: 1000), noise(1: 1000)); title('100KHz噪声信号'); % 显示标题 noiseVoice = VoiceWav+ noise'; % 将噪声加到声音里面 hAudio = audioplayer(noiseVoice, Fs); % 将音频文件载入audioplayer subplot(2, 1, 2); % 绘制波形 [fftNoiseVoice, f] = myfft(noiseVoice, SampleRate, 'plot'); title('音乐和噪声频谱'); % 显示标题 play(hAudio); % 播放添加噪声后的声音 pause(3);

光纤声音采集系统

摘要：科技的发展带来许多电磁干扰或射频干扰的恶劣环境，要想解决电磁干扰问题的，必须从本质上改变麦克风的工作模式。文章提出了利用激光的传输频带宽、通信容量大和抗电磁干扰能力强等优点，研制一种基于光相位干涉的高灵敏度声音采集系统。光纤声音采集能够传送非常高的声音质量，适用于多种恶劣环境下的声音采集。关键词：光纤声音采集、干涉型光纤传感器引言：麦克风在声场和电场中起着重要的沟通界面，它可将声音信号传至任何地方或者记忆装置。传统型的使用电磁场或静电场来产生动作，外部的强电磁场影响会阻绝这些装置的功能。本项目研制的光纤声音采集系统是一种新颖的声音信号传感器，在反射式强度型光纤传感器的原理基础上，利用激光来采集声音信号，由于它与传统的麦克风有着本质的区别，所以在使用方面具有很大的优越性。系统由非导磁材料制成，其主要工作本体是光，即使在强电磁场或高射频环境中也能正常工作。把光纤应用于麦克风，充分利用了光纤传感器体积小、结构简单、灵敏度高、抗电磁干扰且光纤本身低损耗、耐腐蚀、安全可靠等优良特性。 1、系统结构本系统利用干涉型光纤传感器的原理，开发基于光相位干涉的高灵敏度声音采集系统，由光纤传感探头、光路系统、光信号调制解调器等部分组成。干涉型光纤传感器通常将被测量转化为光信号的相位，因此，相位测量是该类型传感器信号处理的基本要求。若直接对相位进行测量，那么有两个问题将限制系统的性能：一是系统受到环境的干扰时被测相位会产生随机漂移，从而引入测量误差，此外，相位漂移还会导致信号衰减；二是直接测相意味着直流检测，信号处理易受电路直流漂移的影响。针对这两个问题引出了相位生成载波技术。相位生成载波调制是在被测信号带宽以外的某一频带之外引入大幅度的相位调制，被测信号则位于调制信号的边带上，这样就把外界干扰的影响转化为对调制信号的影响，且把被测信号频带与低频干扰频带分开，以利于后续的噪声分离。项目研制的光纤声音采集系统，在对传统michelson干涉仪加以改进的基础上，通过构造由光纤耦合器和振动膜组成的动态michelson干涉光路，能够将外界声压对振膜的作用转化为对光路相位的调制，得到的干涉光信号直接光电转换后即可解调还原声音信号。在多种干涉型光纤传感器的解调方法中，相位生成载波解调技术（pgc）由于是一种无源解调技术，并具有高灵敏度、大动态范围和好的线性度而得到广泛的应用。 2、系统原理 2.1光纤传感探头原理：激光器发出的激光经耦合器到达传输光纤，由光纤出射的光束照射到振动膜上，传输光纤出射端面m1与振动膜构成一个干涉腔，从两表面反射回的光进行干涉，干涉光再经耦合器由光电探测器接收，外界声音信号通过改变干涉腔的光纤出射端面m1和振动膜之间的距离对光相位进行调制。系统中半导体激光器发出的光源光频随输入的调制电流线性变化，振动膜采用硅微技术进行研制。 2.2解调原理：光纤声音采集系统中的调制解调器是由光源，光电转换器，高增益微弱信号放大电路，背景噪声消除器等组成。光源向光纤传感头发射一稳定的激光，传感头内的振动薄膜被周围声音振动信号带动，从而对发射到振动薄膜上的激光进行相位调制后再反射回去，被调制的激光在光路系统里发生干涉，形成携带微弱声音强度的激光信号，光电转换系统的探测器将此激光信号转换成电信号，再经高增益微弱信号放大，pgc解调，噪声滤除，后将解调后的电信号还原成声音信号输出。

基于LabView的双声道声卡数据采集系统

基于LabView的双声道声卡数据采集系统班级：热动1007 姓名：刘堂俊学号：U201011568 在虚拟仪器系统中，信号的输入环节一般采用数据采集卡实现。商用的数据采集卡具有完整的数据采集电路和计算机借口电路，但一般比较昂贵，计算机自带声卡是一个优秀的数据采集系统，它具有A/D和D/A转换功能，不仅价格低廉，而且兼容性好、性能稳定、通用性强，软件特别是驱动程序升级方便。如被测对象的频率在音频范围内，同时对采样频率要求不是太高，则可考虑利用声卡构建一个数据采集系统。 1.从数据采集的角度看声卡 1.1声卡的作用从数据采集的角度来看，声卡是一种音频范围内的数据采集卡，是计算机与外部的模拟量环境联系的重要途径。声卡的主要功能包括录制与播放、编辑和处理、MIDI接口三个部分。 1.2声卡的硬件结构图1是一个声卡的硬件结构示意图。一般声卡有4~5个对外接口。图1 声卡的硬件结构示意图声卡一般有Line In 和Mic In 两个信号输入，其中Line In为双通道输入，Mic In仅作为单通道输入。后者可以接入较弱信号，幅值大约为0.02~0.2V。声音传感器（采用通用的麦克风）信号可通过这个插孔连接到声卡。若由Mic In 输入，由于有前置放大器，容易引入噪声且会导致信号过负荷，故推荐使用Line In ，其噪声干扰小且动态特性良好，可接入幅值约不超过1.5V的信号。另外，输出接口有2个，分别是Wave Out和SPK Out。Wave Out（或LineOut）给出的信号没有经过放大，需要外接功率放大器，例如可以接到有源音箱；SPK Out给出的信号是通过功率放大的信号，可以直接接到喇叭上。这些接口可以用来作为双通道信号发生器的输出。 1.3声卡的工作原理声音的本质是一种波，表现为振幅、频率、相位等物理量的连续性变化。声卡作为语音信号与计算机的通用接口，其主要功能就是将所获取的模拟音频信号转换为数字信号，经过DSP音效芯片的处理，将该数字信号转换为模拟信号输出。输入时，麦克风或线路输入（Line In）获取的音频信号通过A/D转换器转换成数字信号，送到计算机进行播放、录音等各种处理；输出时，计算机通过总线将数字化的声音信号以PCM（脉冲编码调制）方式送到D/A转换器，变成模拟的音频信号，进而通过功率放大器或线路输出（Line Out）送到音箱等设备转换为声波。

个性化推荐系统在当当网中的运用分析

目录一、摘要二、当当网概述 1）当当网简介三、个性化推荐系统营销理论综述及原因 1）个性化推荐系统营销概念及分类 a 基于内容的推荐系统 b 协同过滤推荐系统 c 混合推荐系统 2）个性化推荐系统的发展历程 3）当当网使用个性化推荐系统的原因四、个性化推荐系统的结构及在当当网运用中的具体表现 1）个性化推荐系统在电子商务网站中的结构 a 输入功能模块 b推荐引擎模块 c输出功能模块 2）个性化推荐系统在当当网中的具体运用 a商品信息页面 b购物车、收藏夹 c Email邮件 d独立的个性化页面 3）个性化推荐系统在当当网中的新运用 4）个性化推荐系统在当当网未来的发展趋势五、个性化推荐系统在当当网运用中的特点 1）“当当推荐”系统功能分析及推荐效果评价 a 当当推荐系统功能 b 推荐效果评价 2）当当网特性化推荐2.0 六、个性化推荐系统在当当网运用中的不足与风险 1）个性化推荐系统在当当网运用中的不足 2）当当网个性化推荐运用中的风险

3）在个性化推荐上当当网和亚马逊的对比分析七、通过当当网浅谈个性化推荐系统对电子商务发展的影响 1）电子商务新时代的到来 2）由推网的兴起八、结语与建议九、注解与参考文献

个性化推荐系统在当当网中的运用分析摘要：在完善用户购物体验方面，当当网还针对用户需求推出了“为你推荐”功能，通过对顾客历史数据的分析，根据不同顾客的购物习惯向他们推荐针对其个人的商品。这样的定制推荐把用户从海量的商品信息中解放出来，极大的减少了用户的时间成本，通过强大的系统分析，实际上做到了顾客给自己推荐商品，成为自己的顾问。一个好的个性化推荐就好像网站里的智能导购员一样，只不过它是隐形的，对于购物者来说，它是无处不在的。它能将隐形而无处不在的特性发挥到极致，让购物者不讨厌它，也时刻能使用到它，最终，它能够为网站创造更多的销量。关键词：个性化推荐；当当网；应用；电子商务；信息超载。 Personalized recommendation system in dangdang network analysis of the application Abstract: To improve the user shopping experience,dangdang also according to user needs introduced a \"recommend\" function,through the analysis of the historical data of customers,according to different customers' shopping habits to their recommended according to the personal goods.This custom recommend the user from mass of commodity information liberate, greatly reduce the user's time cost, through the powerful system analysis, in fact do the customer to recommend commodities, to become their own advisers. A good personalized recommend like website intelligent shopping guide，only it is invisible, for shoppers for, it is everywhere. It can store and the ubiquity of characteristics to acme, let shoppers don't hate it, time can be used to it, eventually, it can create more sales for the web site Key words:Personalized recommendation ; dangdang; apply ; electronic commerce；information overload

声音信号的获取与处理

声音信号的获取与处理一、实验目的和要求本实验通过麦克风录制一段语音信号作为解说词并保存，通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理，制作出一段完整的带背景音乐的解说词。二、实验内容和步骤 1、软件与硬件的准备目前，多媒体计算机中的音频处理工作主要借助声卡，从对声音信息的采集、编辑加工，直到声音媒体文件的回放这一整个过程都离不开声卡。声卡在计算机系统中的主要作用是声音文件的处理、音调的控制、语音处理和提供MIDI接口功能等。进行录制音频信号所需的硬件除了声卡，还有麦克风、音箱以及外界的音源信号设备（如CD唱机、录音机等），把麦克风、音箱、外界音源信号设备与声卡正确连接完成硬件准备工作。在Windows的【控制面板】/【多媒体】中选择正确的录音和回放设备，并对其进行调试。 2、用Windows录音机录制解说词使用Windows录音机录制任意一段语音信号作为解说词，录制完毕后把文件存为Wav 格式，文件名为【示例1_1】。 3、使用Cool Edit录制背景音乐使用Cool Edit 2000录制任意一段语音信号作为背景音乐，要求录制的声音文件采样频率为44100Hz,立体声，量化位数为16位，保存文件的为Wav格式，文件名【示例1_2】。

4、使用WaveStuido编辑和处理背景音乐使用WaveStuido对【示例1_2】先进行回声处理，【幅度】值为100%，【回声延迟】为300毫秒。然后进行【淡入】和【淡出】处理，【幅度】值各为50%。 5、使用Cool Edit进行混音处理使用Cool Edit的【Mix paste】功能对【示例1_1】和【示例1_2】进行混音处理。把【示例1_2】加入【示例1_1】中去，编辑成为一个完整的带背景音乐的解说词，保存为【示例1_3】

音频信号采集与传输

《信号与系统》 ——综合性设计性实验报告标题：音频信号采集与传输组长：学号成员：学号学号学号实验时间：2011年6月20日星期一第1、2节2011年6月27日星期一第1、2节实验地点：电子信息楼617 实验课室：机械与电气工程学院电子信息工程系信息工程专业教师：胡晓

目录 1、课题设计流程 (3) 2、课题设计理论基础 (3) 2.1信号的采集 (3) 2.2频谱分析 (3) 2.3 调制与解调 (3) 2.4 高斯白噪声 (4) 2.5 滤波 (4) 3、课题设计（程序） (4) 4、课题设计效果（效果图） (6) 5、课题设计总结 (7) 6、心得体会 (7)

1、课题设计流程用matlab录制音频文件 ?→ ?)(f t频谱分析?→ ?调制? ? ? ?→ ?加入高斯白噪声解调?→ ?滤波?→ ?扬声器 2、课题设计理论基础 2.1信号的采集用matlab录制5秒mic声音，y = wavrecord(5*fs,fs,'int16')，其中采样率为44100，时长为5*fs，然后用wavplay(y,fs);语句播放出来，再写成以xinhao_test01命名的wav文件。Y也可以直接用windows自带的录音工具进行录音，并直接读取[y,fs,bits]=wavread('xinhao_test01.wav')，然后对声音进行回放sound(y,fs)，感觉效果。 2.2频谱分析快速傅里叶变换原理：在matlab的信号处理工具箱中函数FFT用于快速傅里叶变换，此次实验调用FFT函数的一种格式y=fft(x,N),其中x是序列，y是序列的FFT，N为正整数，函数执行N点的FFT，由于实验中fs=44100，所以取N=2^16，由于经过fft求得的y一般是复序列，所以用其幅值进行分析，可以用函数abs(y)进行计算复向量y的幅值。由于用matlab自带的FFT快速傅里叶变换得到的幅频图的横坐标是从1到1/2fs,是从低频到高频，再由1/2fs到1，是从高频到低频，实验中用语句Y0(2^N/2+1:2^N)=Y(1:2^N/2)，Y0(1:2^N/2)=Y(2^N/2+1:2^N)（其中N=16）。这样就可以将幅频图变成横坐标原点是低频，向坐标的正负端频率逐渐递增的形式，这是平常傅里叶变换得到的幅频图横坐标。

WMP12高清硬解+个性化字幕+多音轨切换+音效增强+数字音频输出设置

如何加载电影字幕

基于MATLAB 的声音信号采集系统(论文)

个性化音乐推荐系统设计与实现

数字音频作业及其答案

labview声音采集系统

个性化推荐系统分析与设计

数字音频技术_MP3_的压缩编码原理与制作方法

声音信号的获取与处理

关于硬字幕的添加 及置顶特效

音频信号分析与处理

光纤声音采集系统

基于LabView的双声道声卡数据采集系统

个性化推荐系统在当当网中的运用分析

声音信号的获取与处理

音频信号采集与传输

关于硬字幕的添加及置顶特效