(完整版)语音识别开题报告

(完整版)语音识别开题报告
(完整版)语音识别开题报告

青岛大学

毕业论文(设计)开题报告

题目:孤立词语音识别的并行编程实现

学院:自动化工程学院电子工程系

专业:通信工程

姓名:李洪超

指导教师:庄晓东

2010年3月22日

一、文献综述

语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。

广泛意义上的语音识别按照任务的不同可以分为4个方向:说话人识别、关键词检出、语言辨识和语音识别[1]。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术,本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一个方向,也是本文讨论的主要内容。

1.1 语音识别技术现状

1.1.1 语音识别获得应用

伴随着语音识别技术的不断发展,诞生了全球首套多语种交谈式语音识别系统E-talk。这是全球惟一拥有中英混合语言的识别系统,能听能讲普通话、广东话和英语,还可以高度适应不同的口音,因而可以广泛适用于不同文化背景的使用者,尤其是中国地区语言差别较大的广大用户。由于E-talk可以大大提高工作效率,降低运营成本,并为用户提供更便捷的增值服务,我们相信它必将成为电信、证券、金融、旅游等重视客户服务的行业争相引用的电子商务应用系统,并成为电子商务发展的新趋势,为整个信息产业带来无限商机。

目前,飞利浦推出的语音识别自然会话平台SpeechPearl和SpeechMania已成功地应用于国内呼叫中心,SpeechPearl中的每个识别引擎可提供高达20万字的超大容量词库,尤其在具有大词汇量、识别准确性和灵活性等要求的各种电信增值服务中有着广泛的应用。

1.1.2 语音合成信息服务被用户接受

语音合成技术把可视的文本信息转化为可听的声音信息,其应用的经济效益和社会效益前景良好。尤其对汉语语音合成技术的应用而言,全球有十几亿人使用中文,其市场需求、应用前景和经济效益等可见一斑。

语音技术已逐渐在电信声讯信息服务领域智能电话查询系统中展开应用,并迅速推广。在电话高度普及的今天,如果打电话就能查询到所需信息,无疑将给人们的日常生活带来极大方便。汉语语音合成技术应用到声讯服务领域内,对现有的电话查询系统将产生革命性的影响。

语音技术与互联网已成功地结合。电话Internet网关是一种用于实现电话网和Internet 网之间信息互访的系统。简而言之,就是让电话用户能够轻松地通过电话网访问Internet 网。利用语音合成技术的信息服务得到了用户的广泛接纳,给用户生活提供了极大的方便。

1.1.3 面向对象的语音编码

长期以来,在通信网的发展中,解决信息传输效率是一个关键问题,极其重要。目前科研人员已通过两个途径研究这一课题,其一是研究新的调制方法与技术,来提高信道传输信息的比特率,指标是每赫兹带宽所传送的比特数;其二是压缩信源编码的比特率,例如标准PCB编码,对3.4KHz频带信号需用64KHz编码比特率传送,而压缩这一比特率,显然可以提高信道传送的话路数。这对任何频率资源有限的传输环境来说,无疑是极为重要的,尤其是在无线通信技术决定今后通信发展命运的今天更显得重要。实际上,压缩语音编码比特率与话音存储、语音识别及语音合成等技术都直接相关。

语音编码技术的进展对通信新业务的发展有极为明显的影响,例如IP电话业务、实时长途翻译业务、交换机的人工智能接口等。因此,国际电报电话咨询委员会(CCITT)第15组提出了许多急需制订的话音编码标准建议,以推动通信网的发展。由于VLDSI的发展,实现这一技术的代价已从在昂贵的信道中采用,发展到一般信道中都可接受的水平,因此,编码技术日益受到重视。当前,数字移动通信和个人通信(PCN)是深受人们重视的通信手段,其重要问题之一是压缩语音编码速率,形成面向对象的语音编码技术。

数字语音编码技术从1938年提出PCM开始,其编码方法已有了很大的发展,如1968年提出的线性预测编码技术(LPC)、20世纪70年代末出现的隐马尔科夫技术(HMM)以及矢量量化(VQ)等。

1.1.4 口语机器翻译受到重视

口语翻译的一个重要目的就是帮助聋哑人与正常人交流,近来越来越受到人们的重视。首先,聋哑人要戴上一副特制的手套,计算机根据他打出的手语进行识别,然后,通过语音合成系统就可以把图像信息翻译成语言信息。同时,系统还能够完成将正常人的语言翻译成

聋哑人的手语,只要将正常人说的话键入计算机,经程序分析处理之后,翻译成有表情、有动作的三维图像,从而最终达到聋哑人与正常人之间通过翻译机进行交流的目的。口语翻译的研究在其他很多方面都有重要价值,如用手势控制计算机,甚至用手势导航等。

1.2 语音识别技术的发展

1.2.1 神经网络用于训练韵律模型

由于人工神经网络具备良好的自学习和自适应能力,将其应用于语音合成系统中的韵律模型研究具有很重要的意义。将神经网络模型与已有的文语转换系统有机结合,可以改变传统的文语转换系统的韵律模型,具有更强的适应性和可训练性,使合成语音的自然度得到显著提高,增加了系统的灵活性和风格的多样性。

1.2.2 数据挖掘用于发现语音知识

数据挖掘作为一种在大量数据库中发现隐藏新知识的计算技术方法,通过语音定性模型的建立,将数据分析和挖掘结果转化为逻辑规则或用可视化的形式进行表达。因此,将数据挖掘和人机交互接口紧密地联系在一起,将对计算机语音信号处理的研究工作产生巨大的推动力,为语音信号处理提供了一条崭新的研究途径。

1.2.3 文本-可视语音转换系统研制成功

文本-可视语音转换技术的出现是多媒体技术迅速发展的产物也迎合了社会发展的需求。它给人们的生活增添了新的色彩,使计算机更加人性化,人们与计算机的交流变得更为简单。相信在不久的将来,它会在众多的技术、商业和娱乐领域得到广泛的应用,并逐步进入我们每个人的生活。

1.3 语音识别技术的研究方向

1.3.1 连续自然语音的识别与理解

自然语音识别与理解研究的是计算机如何理解人类的语言其目的就是让计算机能够理解人说的话,当我们使用计算机时,要告诉它应该做什么,它就能按照所理解的去执行。虽然现在自然语音识别与理解的理论研究得到了进一步完善,同时,计算机的功能、容量和速度都有了很大的提高,但研究仍局限在对孤立音节的识别与理解上。人类流畅的自然发音不是孤立音节发音的简单组合,它是在一定时间范围内输出的一种连续语流,因此,需要对连续语音进行处理。连续语音识别与理解技术中需要解决的难点很多,对它的研究是语音技术今后的目标之一。

1.3.2 高自然度、具有表现力的合成语音

提高合成语音的自然度仍然是高性能文语转换的当务之急。就汉语语音合成来说,目

前在单字和词组级上,合成语音的可懂度和自然度已基本解决,但是对于句子乃至篇章级,其自然度问题就比较大。未来的文语转换系统的发展趋势是采用基于语境相关的合成思想进行设计,能够将发音人的原始发音特征最大限度地保留下来,辅助以先进的层次化语言韵律模型,通过分散统计的模型方法来涵盖语义语音之间的内在联系,使系统能够输出具有高自然度和表现力的合成语音。但是,在目前的合成系统中,普遍存在合成输出语音的机器味比较浓、语境的知识层次模型研究不完善等问题。因此获得高自然度、具有表现力的合成语音,也是今后语音技术的研究目标之一。

1.3.3 语音技术与多媒体技术的结合

伴随着现代语音技术的不断发展,人类对语音信号的需要已经不仅仅停留在可懂性和正确性上,语音合成技术的研究方向已是合成语音的美感并同时输出辅助的视频特征,实现虚拟主持人的效果,通过将视觉效果包括人的头部建模、唇形同步技术和表情因素等视频信息的加入,可以更好地体现语音合成系统的表现力和感染力。因此,我们完全有理由相信,语音技术和多媒体技术的有机结合将使合成系统展现出广阔的应用前景。

1.3.4 语音技术与网络技术的结合

目前,语音技术已逐渐应用于电信的声讯信息服务领域和互联网消息收发方面。随着电话网与互联网的融合、网络信息项目的增多和时效性要求逐步提高,建立适合于股票交易、航班动态查询、电话自动报税等业务的语音系统成为可能,电话用户可以通过传统的语音、传真获取互联网上无穷无尽的信息。这些业务将彻底解决传统数字录音回放技术所无法解决的海量信息库和动态变化信息的实时生成与存储的难题。因此,将语音技术与网络进行完美的结合具有强大的生命力。

1.3.5 多语种

语言是人们交流的工具,不同民族有自己不同的语言,不同语言之间的交流在今天开放的信息社会和网络时代显得十分重要,因此,多语种的文语合成有着独特的应用价值。例如,在自动电话翻译、有声电子邮件等应用中都提出了多语种语音合成的需求,即使是对汉语合成也有多方言文语转换问题。理想的多语种合成系统最好是各种语言共用一种合成算法或语音合成器,但现有的语音合成系统大多是针对某一种语言或若干种语言开发出来的,所采用的算法及规则都是与某种语言密切相关的,因此很难推广到其他语种。如汉语和西方语言之间存在着很大的差异,而目前国内的系统都是做汉语英语转换的,其韵律控制规则完全不适合于英语,而且它们主要是合成汉语普通话的,即使推广到广东话和上海话都有相当的难度。

可见要真正解决多语种的文语合成,从文本处理到语音合成都必须有新的思路,因此,研制多语种语音合成转换系统具有重要的理论和现实意义。

二主要研究内容和方法

语音识别技术是利用计算机对语音进行特征提取,获取最能表征语音特征的有用信息,根据这些信息来对语音所代表的内容或说话人身份判断的技术。因此需要对语音波形的幅值、频率等特点进行研究,我们把语音识别的研究内容大致可以分为语音提取,特征提取,语音识别,内容分析,内容匹配。

在特征提取之前,一个重要的问题是消除噪音、空白音及音长不同的影响。根据语音识别技术的发展历史,语音识别方法大致可分为基于说话人的语音识别方法、基于说话内容的语音识别方法、基于统计的语音识别方法和基于网络的语音识别方法。

三基本设计要求及设计思路

3.1 语音识别系统原理

使用C语言编程,实现基于马尔科夫模型的数据特征提取,在此基础上编程实现特定语音实例的语音识别;将语音识别功能编写成可供其他模块调用的函数,为进一步实现语音识别系统提供基础;并且从中培养、提高查阅文献和综合运用知识的编程开发能力。

语音识别本质上是一种模式识别的过程,未知语音的模式与已知语音的参考模式逐一进行比较,最佳匹配的参考模式被作为识别结果。图1是基于模式匹配原理的自动语音识别系统原理框图。

图1 语音识别系统原理框图

(1)预处理模块:对输入的原始语音信号进行处理,滤除掉其中的不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重等处理。

(2)特征提取模块:负责计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数用于后续处理。现在较常用的特征参数有线性预测(LPC)参数、线谱对(LSP)参数、LPCC、MFCC、ASCC、感觉加权的线性预测(PLP)参数、动态差分参数和高阶信号谱类特征等[1]。其中,Mel频率倒谱系数(MFCC)参数因其良好的抗噪性和

鲁棒性而应用广泛。

(3)训练阶段:用户输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模式库。

(4)识别阶段:将输入的语音提取特征矢量参数后与参考模式库中的模式进行相似性度量比较,并结合一定的判别规则和专家知识(如构词规则,语法规则等)得出最终的识别结果。

3.2 语音识别的几种基本方法

当今语音识别技术的主流算法,主要有基于动态时间规整(DTW)算法、基于非参数模型的矢量量化(VQ)方法、基于参数模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)和支持向量机等语音。

按照该过程,首先实现用MATLAB编程的过程,然后将具体MATLAB的程序用C语言改写,以便于在系统间进行移植等。

四预期的课题进度计划

第1周---第2周:查阅、学习相关文献资料,完成文献综述。

第3周---第6周:了解基于马尔科夫模型语音数据特征提取及语音数据特征识别的基本原理;学习所需的C语言编程技术;进行初步的实验编程。

第7周---第9周:在初步的原理实验通过后,根据具体的应用要求,编写、调试功能较为全面的语音识别程序;实现基本的特征提取、识别功能。

第10周---第12周:进一步优化程序,实现具有实用功能的应用程序,完成外文文献译稿。

第13周---第14周:系统及程序测试,进行系统的输入,处理,输出全面测试。进行实验报告总结,撰写论文,完成毕业设计初稿。

第15周:整理完成程序设计说明书,完善所有设计图纸及程序,准备答辩。

五参考文献

[1]胡光锐,语音处理与识别,上海科学技术文献出版社,1994.

[2]赵立,语音信号处理,机械工业出版社,2003.

[3]程佩青,数字信号处理教程(第三版),清华大学出版,2007.

[4] 拉宾纳L,Rabiner Lawrence,阮平望, Juang Biing-Hwang, 语音识别基本原理, 清华大学出版社, 1999.

[5] 王炳锡,屈丹,彭煊,实用语音识别基础[M].北京:国防工业出版社,2005.

[6] 詹新明,黄南山,杨灿.语音识别技术研究进展[J].现代计算机,2008.

[7] 高新涛,陈乖丽,语音识别技术的发展现状及应用前景[J].甘肃科技纵横,2007.

基于单片机的语音控制小车的开题报告_共4页

一、选题的依据、意义和理论或实际应用方面的价值 随着现代生活水平的不断提高,人们对智能化产品有着巨大的需求,语音智能控制作为简单快捷方便的操作方式得到越来越广泛人们的认可,例如手机智能语音拨号功能,就是很好的例子。随着电子业的发展, 自动化已不再是一 个新鲜的话题, 无人驾驶的小汽车也必将进入实用阶段, 未来驾驶汽车, 不再是只能依靠手动,语音等方式也有可能成为未来汽车的辅助驾驶途径之一。当前电子设计系统已进人了片上系统时代, 语音识别与处理技术在信息技术的人机 接口中得到了普遍关注。语音识别的音控小车作为典型应用之一,简单地诠释了人机一体化的设计思想。其设计理念缩短了人机界面的距离,增强了互动性和智能性,同时使得将信息技术和控制技术引入到车辆的操纵控制中,形成机器智能,使驾驶员的感知、决策和执行能力扩展成为可能。 二、本课题在国内外的研究现状 Bill Gates 在世界计算机博览会(COMDEX)主题演讲会上描绘IT事业的发展宏图时,率先指出:下一代操作系统和应用程序的用户界面将是语音识别。工业界应对语音识别领域的重大突破做好充分准备,因为那将是一场席卷全球的另一次热潮。 据统计部门的数据,至2006年中国汽车保有量已达3500万辆(其中轿车占80%,约2500万辆),每年仍以30%的速度递增。我国成为了继美国之后的第二大汽车生产和消费大国。汽车行业的迅猛发展也带动了相关配套、服务业的发展。而将功能强大的智能车载信息系统——车载电脑加载到汽车上已经成为欧美、日本等地汽车市场的首选新装备。我国语音智能控汽车产业有着巨大的发展前景。车载电脑给汽车带来了一场信息化的革命,让每辆汽车构建成一个完美的车载信息与娱乐系统终端,包括车载通讯系统、导航系统、数字娱乐系统以及辅助驾驶系统。车载通讯与导航系统主要指GPRS和GPS,让你“轻 车熟路”,而且轻松打电话。 三、课题研究的内容及拟采取的方法 我研究的课题题目是实现语音对小车的智能控制,按照其功能的实现可以划分如下模块:语音输入模块、主控模块(SPCE061A)、电机驱动模块、语 音输出模块、电源模块。语音输入模块实现语音的输入,讲录入的语音作为数据源。主控模块实现对语音的分辨、识别、与存储单元中的指令匹配,发出控制命令。电机模块通过主控模块的控制,对电机发出控制命令。语音输出模块控制发出控制命令相对应的语音。电源模块控制电源的连通。首先对存储器初始化,之后进行录音初始化,进入录音循环中,定时器中断程序控制采样频率,并按时间间隔将采样值送入语音样本队列,录音循环从语音样本队列中获取数据并进行编码,将编码后的数据送入存储器,成为语音资源。在训练过程中,系统调用了语音播放子程序,需要进行播放初始化,进入播放循环中,从语音资源中获取数据,解码,填入播放队列中,定时器中断程序从播放队列中取出数据送到D /A 转换器中,将语音信号送到扬声器中,使得整个训练过程在语音提示下从容进行。 四、课题研究中的主要难点以及解决的方法 1)如何实现对SPCE061A的无线语音接入? SPCE061A 内置MIC 放大电路和AGC 电路, 可很方便地接上MIC 使用。但考虑到小车在运动到距离用户较远的地方时, 无法接收到用户的语音命令, 而

【最新2018】数据库 开题报告-word范文 (3页)

【最新2018】数据库开题报告-word范文 本文部分内容来自网络,本司不为其真实性负责,如有异议或侵权请及时联系,本司将予以删除! == 本文为word格式,下载后可随意编辑修改! == 数据库开题报告 随着现在信息科技的发展,数据的储存量越来越大,那么数据库的发展趋势又是怎样的呢? 数据库技术的现状及其发展趋势研究开题报告 数据库技术的现状及其发展趋势研究开题报告专业:信息管理与信息系统学生:**学号:09246201X6 一、选题背景及意义: 数据库技术主要研究如何存储、使用和管理数据 ,是计算机技术中发展最快、应用最广的技术之一。作为计算机软件的一个重要分支,数据库技术一直是倍受信息技术界关注的一个重点。尤其是在信息技术高速发展的今天,数据库技术的应用可以说是深入到了各个领域。当前,数据库技术已成为现代计算机信息系统和应用系统开发的核心技术,数据库已成为计算机信息系统和应用系统的组成核心,更是未来信息高速公路的支撑技术之一。因此,为了更好的认识和掌握数据库技术的现状及发展趋势,本文对有关数据库发展的文献进行了收集整理,以求在对现有相关理论了解、分析的基础上,对数据库发展进行综合论述,对数据库技术发展的总体态势有比较全面的认识,从而推动数据库技术研究理论的进一步发展。 二、论文综述1、数据库技术发展历程:许多年以来在数据库技术领域很少有重大的技术创新能够引起人们对整个数据库发展历程的回顾与反思。201X 年DB2 9中推出的pureXML技术,对过去数十年来关系型数据库的最基本的数据组织方式进行了重大的创新,第一次让我们对数据库的历史,以及过去支撑其发展壮大的理论基础和外部挑战从新的角度进行审视。今天我们很少去回顾数据库的历史,对于绝大多数IT技术人员,数据库等同于关系型数据库,数据则和表紧密联系。E-R模型几乎是我们描述世界的唯一方式,SQL语言是数据库信息访问处理的唯一手段。关系型数据库已经成为了一种宗教式的信仰,数据相关的所有理论问题似乎都已经解决。 然而历史的发展总是在我们不经意间产生转折,所有重大技术的产生及发展都有其生存的土壤。40年前数据库的诞生并不是关系型数据库,第一代的数据库第一次实现了数据管理与应用逻辑的分离,采用层次结构来描述数据,是层次型数据库(IMS)。第二代数据库奠基于上世纪70年代E.F Codd博士提出的关系

(完整版)基于单片机的语音控制开关设计毕业设计

题目基于单片机的语音控制开关设计所在学院物理与电信工程学院专业班级通信工程专业 1102 班指导教师郑争兵 完成地点物理与电信工程学院实验室 2015年 6月03日

毕业论文﹙设计﹚任务书 院(系) 物理与电信工程学院专业班级通信1102 学生姓名朱楠 一、毕业论文﹙设计﹚题目基于单片机的语音控制开关设计 二、毕业论文﹙设计﹚工作自_2015 _年_ 1__月_10_日起至_2015__年 6 月_ 10 日止 三、毕业论文﹙设计﹚进行地点: 物理与电信工程学院实验室 四、毕业论文﹙设计﹚的内容要求: 智能家居作为一个新生产业,目前处于一个导入期与成长期的临界点,随着智能家居市场推广普及的进一步落实,培育起消费者的使用习惯,智能家居市场的消费潜力必然是巨大的,产业前景光明。本课题设计语音智能控制开关,具体要求如下: 1. 掌握语音识别的工作原理,使用语音识别芯片完成硬件设计; 2.能实现语音控制开关的开启和关闭; 3. 系统集成,焊接电路板,调试。 成果形式:实验样机一套。 毕业设计进度安排: 1.10─3.20:查阅资料(参考文献不少于10篇),进行方案论证,完成开题报告。完成不少于3000字的外文翻译; 3.20─ 4.30:设计硬件电路,编写相关软件、完成电路仿真及样机调试; 5.1─5.20:完善系统调试,撰写论文,准备毕业设计验收等工作; 5.21- 6.10:整理资料,修改论文,准备毕业答辩。

指导教师系(教研室)通信教研室 系(教研室)主任签名批准日期 接受论文(设计)任务开始执行日期学生签名

基于单片机的语音智能开关设计 朱楠 (陕西理工学院物理与电信工程学院通信1102班,陕西汉中 723003) 指导教师:郑争兵 [摘要]语音识别是解决机器“听懂”人类语言的一项技术。随着语音识别理论研究的深入和数字信号处理软、硬件技术的发展,语音识别技术应用的研究越来越受到人们的关注。智能语音家电控制系统实质上就是一个替代传统手动开关的受声控制的电子开关。此系统以STC11L08XE和LD3320语音芯片为硬件核心,对语音芯片LD3320的信息进行处理,并对开关进行控制,通过LD3320外界的麦克风采集声音信号,再通过LD3320语音芯片进行频谱分析,在提取语音特征,之后和关键词语列表中的关键词进行对比匹配,最后找出得分最高的关键词作为识别结果输出给单片机,单片机进行处理后,再输出信号来控制继电器,再通过继电器来控制开关工作,开关又可实现对电器的控制。语音芯片的功能都是通过单片机控制实现的。最终实现对智能语音开关的控制 [关键词] STC11L08XE单片机语音芯片LD3320 语音识别 Design of intelligent voice switch based on MCU Zhu nan (Grade11,Class2,Major of Communication Engineering,School of Physics and Tutor:Zheng Zheng bing Abstract: Speech recognition is a technology to solve the machine to understand human language. Along with the research of speech recognition theory and the development of digital signal processing software and hardware technology, The research on the application of speech recognition technology is getting more and more attention.The intelligent speech appliance control system is essentially an electronic switch which replaces the traditional acoustic control with the manual switch. This system LD3320 voice chip and the stc11l08xe as hardware core and the voice chip ld3320 information for processing, and control the switch, through ld3320 external microphone audio signal acquisition, and then through the ld3320 voice chip spectrum analysis, key words in speech feature extraction, and the list of key words contrast matching, finally to find the highest score of the words as recognition results output to the MCU, MCU processing, then the output signal to control the relay, then through the relay to control of the switch, the switch can be to achieve control of the electric appliances. The function of the speech chip is realized by the MCU control. Control of the intelligent speech switch is realized finally. Key words : STC11L08XEMCU LD3320 voice chip Speech recognition

语音识别技术综述

语音识别技术综述

语音识别技术综述 电子信息工程2010级1班郭珊珊 【摘要】随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展,该技术的发展和应用改变了人们的生产和生活方式,正逐步成为计算机处理技术中的关键技术。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 【关键词】语音识别;语音识别原理;语音识别发展;产品 语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器人自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的命令或文本的高新技术。 1 语音识别的原理 语音识别系统本质是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单位元。未知语音经过话筒变换成电信号后加载识

别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需特征,在此基础上建立语音识别所需的模板。 计算机在识别过程中要根据语音识别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表可给出计算机的识别结果。这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。 2 语音识别系统的分类 语音识别系统可以根据对输入语音的限制加以分类。 2.1从说话者与识别系统的相关性考虑 可以将识别系统分为3类:(1)特定人语音识别系统:仅考虑对于专人的话音进行识别;(2)非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识

别系统进行学习;(3)多人的识别系统:通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。 2.2从说话的方式考虑 也可以将识别系统分为3类:(1)孤立词语音识别系统:孤立词识别系统要求输入每个词后要停顿;(2)连接词语音识别系统:连接词输入系统要求对每个词都清楚发音,一些连音现象开始出现;(3)连续语音识别系统:连续语音输入是自然流利的连续语音输入,大量连音和变音会出现。 2.3从识别系统的词汇量大小考虑 也可以将识别系统分为3类:(1)小词汇量语音识别系统。通常包括几十个词的语音识别系统。(2)中等词汇量的语音识别系统。通常包括几百个词到上千个词的识别系统。(3)大词汇量语音识别系统。通常包括几千到几万个词的语音识别系统。随着计算机与数字信号处理器运算能力以及识别系统精度的提高,识别

毕业论文开题报告模板格式(完整版)

报告编号:YT-FS-1763-43 毕业论文开题报告模板格 式(完整版) After Completing The T ask According To The Original Plan, A Report Will Be Formed T o Reflect The Basic Situation Encountered, Reveal The Existing Problems And Put Forward Future Ideas. 互惠互利共同繁荣 Mutual Benefit And Common Prosperity

毕业论文开题报告模板格式(完整 版) 备注:该报告书文本主要按照原定计划完成任务后形成报告,并反映遇到的基本情况、实际取得的成功和过程中取得的经验教训、揭露存在的问题以及提出今后设想。文档可根据实际情况进行修改和使用。 毕业论文开题报告范文格式【一】 一、本研究的主要依据和目标。 本项目的研究意义及其在现实生活的研究现状 1,本项目的意义 团队建设顾名思义就是要搞好整体,维护整体,带动一个企业的发展前进。团队建设注重团队的核心目标,团队的管理机制,团队的精神。"团队的业绩大于个体业绩的总和"——这是团队建设根本利益之所在。一个良好团队的建设还会在公司决策执行,项目开发,企业形象,资源整合,公司效率和管理行为的执行中起极其有效的作用。广告公司的业务团队的建设又有其特殊性,它不仅具有"协作性"团队所拥有的

合作作用,同时,它也十分重视团队个体的个性发挥。建设良好的广告业务团队将有助于广告公司效率的大大提高,具有十分重要的意义。 2,国内外的研究现状以及存在的问题 随着我国广告业的不断发展,广告之间的竞争也是越来越激烈。广义上来说,服务的竞争实质上是一种无形产品的竞争。但最终意义上的竞争是人的竞争,人的竞争是更高层次,更高品位的竞争。福州广告公司经过几年的发展,从经营业务较为单一,部门设置较为简单,管理制度较为简单的企业,发展成为现在的广告业务多元化,部门设置较为齐全,管理制度较为规范化的公司。 目前,根据目前的广告公司的资料表明,大多数都存在以下问题:(一)传统的经营思想和淡薄的发展意识阻碍了福州地区广告公司的业务团队建设发展。 (二)福州地区的广告专业人才大量缺乏阻碍了广告公司的业务团队建设(三)缺乏有效的行业管理和监管,对福州广告业的发展带来严重的负面影响,破坏了福

基于PHP+mysql网页设计开题报告

基于PHP+MySQL的网页开发 一、课题来源、目的、意义、国内外基本研究概况 1.课题来源 随着因特网的迅猛发展,网络已经深入到世界的各个角落,网站作为因特网的主要组成部分,其数量与质量都在快速地提升。网站与用户的交互主要使用网页来实现,为了简化和方便网页的开发,Web领域的主要开发商相继推出了多种Web开发技术,PHP就是其中一种。由于容易学习和它与Apache及MySQL组成的AMP体系代码的开源性,PHP 和MySQL数据库被广泛的应用于各种网站网页的设计。 2.目的 通过PHP+MySQL实现实验室网页的开发。访问者通过浏览该网页能了解到他们感兴趣的实验室的信息,并为访问者提供一些查询服务,让他们了解更多的实验室信息。 3.意义 网页是企业向用户和网民提供信息(包括产品和服务)的一种方式,是企业开展电子商务的基础设施和信息平台,离开网站(或者只是利用第三方网站)去谈电子商务是不可能的,企业的网址被称为“网络商标”,也是企业无形资产的组成部分,而网站是INTERNET 上宣传和反映企业形象和文化的重要窗口,此外网站在人们的日常生活中发挥的作用越来越大,因此网站的开发有着重要的意义。 二、预计达到的目标、关键理论和技术、技术指标、完成 课题的方案及主要措施 1.预计达到的目标 通过PHP+MySQL的网页开发,初步掌握网页搭建设计的基础知识,熟悉MySQL 数据库的建立及基本操作,理解并掌握PHP+MySQL+Apache的组合编程。

2.关键理论和技术 MySQL数据库。MySQL是一个小型关系型数据库管理系统,也可以说是一种支持SQL数据库查找语言的数据库引擎,开发者为瑞典MySQL AB公司。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,MySQL被广泛地应用在Internet上的中小型网站中。除了具有许多其它数据库所不具备的功能和选择之外,MySQL数据库是一种完全免费的产品,用户可以直接从网上下载。 Apache服务器。Apache HTTP Server(简称Apache)是Apache软件基金会的一个开放源码的网页服务器,可以在大多数计算机操作系统中运行,由于其多平台和安全性[1]被广泛使用,是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩展,将Perl/Python等解释器编译到服务器中。Apache可以运行在几乎所有广泛使用的计算机平台上。Apache的特点是简单、速度快、性能稳定,并可做代理服务器来使用。Apache是以进程为基础的结构,进程要比线程消耗更多的系统开支,不太适合于多处理器环境,因此,在一个Apache Web站点扩容时,通常是增加服务器或扩充群集节点而不是增加处理器。 PHP语言。PHP,是英文超级文本预处理语言Hypertext Preprocessor的缩写。PHP 是一种HTML 内嵌式的语言,是一种在服务器端执行的嵌入HTML文档的脚本语言。PHP 独特的语法混合了C、Java、Perl 以及PHP 自创新的语法。它可以比CGI 或者Perl 更快速的执行动态网页。用PHP做出的动态页面与其他的编程语言相比,PHP是将程序嵌入到HTML文档中去执行,执行效率比完全生成HTML标记的CGI要高许多;PHP还可以执行编译后代码,编译可以达到加密和优化代码运行,使代码运行更快。PHP 具有非常强大的功能,所有的CGI的功能PHP都能实现,而且支持几乎所有流行的数据库以及操作系统。 3.技术指标 ①能实现基本浏览功能 ②能实现部分查询功能 ③管理员可以对信息进行修改 ④其他相关功能 4.完成课题的方案及主要措施 整个系统基于B-S结构设计,使用W AMP(windows+ Apache +MySQL +PHP)平台进行搭建。系统框图如下图1:

开题报告完整版

收集精品文档 ============================= ================================= ================================= ========= 四川农业大学本科毕业论文(设计)开题报告 ==============================专业 收集精品文档 =============================

收集精品文档 ============================= ================================= ================================= ========= ==============================专业 收集精品文档 =============================

收集精品文档 ============================= ================================= ================================= ========= ==============================专业 收集精品文档 =============================

收集精品文档 ============================= ================================= ================================= ========= ==============================专业 收集精品文档 =============================

基于MATLAB的语音信号分析及处理开题报告

基于MATLAB的语音信号分析及处理开题报告毕业设计开题报告 设计题目基于MATLAB的语音信号分析及处理 学生姓名系、专业指导教师选题目的和意义: 语音处理是最早采用数字信号处理技术的领域之一,本世纪50年代提出的语音形成数字模型,被广泛应用于语音编码、语音合成、语音识别、语音增强、说话人确认、语音邮件和语音存储等。因此研究语音信号的数字处理技术,有很大的工程意义,而实现的工程软件是MATLAB。利用MATLAB设计滤波器,可以随时对比设计要求和滤波器特性调整参数,直观简便,极大的减轻了工作量,有利于滤波器设计的最优化。利用MATLAB作为编程工具进行计算机实现,从而加深对所学知识的理解,建立概念。 本课题在国内外的研究状况及发展趋势: 数字处理技术已经成熟,正在获得广泛应用。目前在数字领域和通信领域正在发生一场数字化革命。DSP在其中扮演很重要的角色,它为新体制新算法和新原理提供了最佳的实现条件。 主要研究内容: MATLAB是主要适用于矩阵运算和信息处理领域的分析设计,它使用方便,输入简捷,运算高效,内容丰富,并且很容易由用户自行扩展.MATLAB当前已成为美国和其他发达国家在大学教学和教学研究中最常用而必不可少的工具.传统的数字滤波器的设计过程复杂,计算工作量大,滤波特性调整困难,影响了它的应用。本文介绍了利用MATLAB快速有效的设计由软件组成的常规数字滤波器的设计方法,综合运用数字信号处理的理论知识进行频谱分析和滤波器设计,通过理论推导得到相应结论,给出了使用MATLAB语言进行程序设计并进行界面设计的详细步骤。

实验设计: 录制一段自己的语音信号,并对录制的信号进行采样;画出采样后语音信号的时域波形和频谱图;给定滤波器的性能指标,采用窗函数法或双线性变换设计滤波器,并画出滤波器的频率响应;然后用自己设计的滤波器对采集的语音信号进行滤波,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化;回放语音信号;最后,用 MATLAB 设计一个信号处理系统界面。 完成设计的条件、方法及措施: 声音的导入、采样和频谱分析 采集语音信号利用计算机Windows下的录音机设备,可以采集语音信号并采样,得出数据文件'12.wav'保存在MATLAB的work路径下,在M文件中键入: “x1=wavread('I:\work\12.wav ');”读取语音信号的数据,赋给变量x1。并且播出声音,键入“sound(x1,22050);”。对声音型号进行采样和频谱分析:对信号做1024点FFT变换;然后在对型号做出时域波形图、FFT频谱图。 滤波器的选择和分析 数字滤波器是一种用来过滤时间离散信号的数字系统,通过对抽样数据进行数学处理来达到频域滤波的目的。根据其单位冲激响应函数的时域特性可分为两类:无限冲激响应(IIR)滤波器和有限冲激响应(FIR)滤波器。与FIR滤波器相比,IIR 的实现是非递归的。所以这次设计在MATLAB中设计的就是IIR数字滤波器。因此这次设计采用一个BUTTERWORTH的低通滤波器,并且我们采取双线性变换法来实现。 估算巴特沃思滤波器的阶数N和3dB截止频率Wn。输入参数是通带截止频率Wp,阻带截止频率Ws,通带波纹Rp,阻带波纹Rs。 回放语音信号

语音识别发展现状与展望

中国中文信息学会第七次全国会员代表大会 暨学会成立30周年学术会议 语音识别发展现状与展望中科院自动化研究所徐波 2011年12月4日

报告提纲 ?语音识别技术现状及态势?语音识别技术的行业应用?语音识别技术研究方向?结论与展望

2010年始语音识别重新成为产业热点?移动互联网的兴起成为ASR最重要的应用环境。在Google引领下,互联网、通信公司纷纷把语音识别作为重要研究方向 –Android系统内嵌语音识别技术,Google语音 翻译等; –iPhone4S 上的Siri软件; –百度、腾讯、盛大、华为等都进军语音识别领 域; –我国语音技术领军企业讯飞2010年推出语音云识别、讯飞口讯 –已有的QQ2011版语音输入等等

成熟度分析-技术成熟度曲线 ?美国市场调查咨询公司Gartner于2011年7月发布《2011新兴技术成熟度曲线》报告:

成熟度分析-新兴技术优先矩阵?Gartner评出了2011年具有变革作用的技术,包括语音识别、语音翻译、自然语言问答等。其中语音翻译和自然语言问答有望在5-10年内获得大幅利用,而语音识别有望在2-5年内获得大幅利用;

三十年语音识别技术发展 ---特征提取与知识方面?MFCC,PLP,CMS,RASTA,VTLN;?HLDA, fMPE,neural net-based features ?前端优化 –融入更多特征信息(MLP、TrapNN、Bottle Neck Features等) ?特征很大特点有些是跟模型的训练算法相匹配?大规模FSN图表示,把各种知识源集中在一起–bigram vs. 4-gram, within word dependencies vs. cross-word

(完整版)毕业设计开题报告,DOC

兰州交通大学毕业设计(论文)开题报告 (2)X—真实课题;Y—模拟课题;Z—虚拟课题

(1)、(2)均要填,如AX、BY等。 一、课题背景、目的及意义 1.课题背景 本设计为西宁市污水处理厂工艺设计,拟设计污水处理厂建设规模为d m/ 900003,包括生活污水和工业废水。其中工业废水为d 500003综合 m/ 400003,生活废水为d m/ 。2. 二、目前国内外研究现状及发展趋势 目前,国内外城市污水处理厂厂采用的工艺有普通活性污泥法、A/O生物脱氮活性污泥法、A/A/O生物脱氮除磷工艺、AB工艺、氧化沟法(循环混合式活性污泥法)、SBR间歇时活性污泥法等工艺。 1.关于活性污泥法

当前流行的二级处理工艺有:AB法、SBR法、氧化沟法、普通曝气法、A/A/O法、A/O法等,这几种工艺都是从活性污泥法派生出来的,且各有其特点。 AB法(Adsorption—Biooxidation) 该法由德国Bohuke教授首先开发。该工艺对曝气池按高、低负荷分二级供氧,A 级负荷时间短,产生污泥量大,污泥负荷2.5kgBOD/(kgMLSS·d)以上,池容积负荷 6kgBOD/(m3·d)以上;B级负荷低,污泥龄较长。A级与B级间设中间沉淀池。二级池子F/M(污染物量与微生物量之比)不同,形成不同的微生物群体。AB法尽管有节能的优点,但不适合低浓度水质,A级和B级亦可分期建设 (2)SBR法(SequencingBatchReactor) SBR法早在20世纪初已开发,由于人工管理繁琐未予推广。此法集进水、曝气、沉淀、出水在一座池子中完成,常由四个或三个池子构成一组,轮流运转,一池一池地间歇运行,故称序批式活性污泥法。现在又开发出一些连续进水连续出水的改良性SBR工艺,如ICEAS法、CASS法、IDEA法等。这种一体化工艺的特点是工艺简单,由于只有一个反应池,不需二沉池、回流污泥及设备,一般情况下不设调节池,多数情况下可省去初沉池,故节省占地和投资,耐冲击负荷且运行方式灵活,可以从时间上安排曝气、缺氧和厌氧的不同状态,实现除磷脱氮的目的。SBR法中曝气池兼具沉淀的作用,厌氧、好氧也在同一池进行。其运行操作由流入、反应、沉淀、排放、待机五个工序组成。通过调节每个工序的时间,可达到除磷脱氮的效果。 前处理——SBR反应器——过滤——出水 | 污泥处置 该工艺具有很多优点:工艺系统组成简单,不设二沉池,无污泥回流设备;耐冲击负荷,一般不用设置调节池;反映推动力大,易于得到优于连续流系统的出水水质;运行操作灵活,通过适当调节各单元的状态可达到脱氮除磷的效果;污泥沉淀性能好,SVI 值较低,能有效的防治丝状菌膨胀;各项运行指标和各操作阶段可通过计算机加以控制,便于自控运行,易于维护管理。 但因每个池子都需要设曝气和输配水系统,采用滗水器及控制系统,间歇排水水头损失大,池容的利用率不理想,因此,一般来说并不太适用于大规模的城市污水处理厂 (3)A/A/O法(Anaerobic—Anoxic—Oxic) 由于对城市污水处理的出水有去除氮和磷的要求,故国内10年前开发此厌氧—缺氧—好氧组成的工艺。利用生物处理法脱氮除磷,可获得优质出水,是一种深度二级处

文字识别开题报告

太原理工大学信息工程学院 本科毕业设计(论文)开题报告 毕业设计(论文)题目 基于边缘检测的文字图像识别 学生姓名导师姓名 专业信息 报告日期 班级07-1 指导教 师意见 签字年月日 专业(教 研室)主 任意见 年月日系主任 意见 年月日

1. 国内外研究现状及课题意义 文字图像信息是人类获取外界信息的主要来源,在近代科学研究、军事技术、工农业生产、医学、气象及天文学等领域中,人们越来越多的利用图像信息来识别和判断事物,解决实际问题。例如:由于空间技术的发展,人造卫星拍摄了大量地面和空间的照片,人们要分析照片,获得地球资源、全球气象和污染情况等;在医学上,医生可以通过X射线分析照像,观察到人体个部位的多次现象;在工厂,技术人员可以利用电视图像管理生产;生活中,交通管理部门也要利用文字图像识别技术确定违章车辆的牌照,对其进行监督管理,由此可见文字图像信息的重要性【1】。 获得文字图像信息非常重要,但更重要的是对文字图像进行处理,从中找到我们所需要的信息,因此在当今科学技术迅速发展的时代,对文字图像的处理技术提出了更高的要求,能够更加快速准确的获得有用信息。 1.1国内外研究现状 20世纪20年代文字图像处理首次得到应用。20世纪60年代中期,电子计算机的发展得到普遍应用,文字图像处理技术也不断完善,逐渐成为一个新兴的科学。从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理技术也向更高、更深的层次迈进。到了20世纪90年代,机器人技术已经成为工业的三大支柱之一,人们已经开始研究如何用计算机系统解释图像,实现类似人类视觉系统来理解外部世界,这被称为图像理解活计算机视觉。很多国家,特别是发达国家投入更多的人力、物力道这项研究,取得了不少重要的研究成果。 数字图像处理主要是为了修改图形,改善图像质量,或是从图像中提取有效信息,还有利用数字图像处理可以对图像进行体积压缩,便于传输和保存。目前,数字图像处理主要应用于通讯技术、宇宙探索遥感技术和生物工程等领域。数字图像处理因易于实现非线性处理,处理程序和处理参数可变,故事一项通用性强,精度高,处理方法灵活,信息保存、传送可靠的图像处理技术。主要用于图像变换、测量、模式识别、模拟以及图像产生。广泛应用在遥感、宇宙观测、影像医学、通信、刑侦及多种工业领域【2】。1.2文字图像识别面临的问题 文字图像识别的发展经历了三个阶段:文字识别、图像处理和识别、物体识别。现在对于文字图像识别技术的研究,还面临几个问题,一是图像数据量大,一般来说,要取得较高的识别精度,原始图像应具有较高的分辨率,至少应大于64×64。二是图像污

语音识别技术概述

语音识别技术概述 摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的发展前景和应用。 关键词:语音识别;特征提取;模式匹配;模型训练 Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to face.Then,the developing prospect ion and application of the speech-identification technology are discussed in the last part. Keywords:Speech identification;Character Pick-up;Mode matching;Model training 一、语音识别技术的理论基础 语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。 不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式

语音识别开题报告

青岛大学 毕业论文(设计)开题报告 题目:孤立词语音识别的并行编程实现 学院:自动化工程学院电子工程系 专业:通信工程 姓名:李洪超 指导教师:庄晓东 2010年 3月22日

一、文献综述 语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。 广泛意义上的语音识别按照任务的不同可以分为4个方向:说话人识别、关键词检出、语言辨识和语音识别[1]。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术,本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一个方向,也是本文讨论的主要内容。 1.1 语音识别技术现状 1.1.1 语音识别获得应用 伴随着语音识别技术的不断发展,诞生了全球首套多语种交谈式语音识别系统E-talk。这是全球惟一拥有中英混合语言的识别系统,能听能讲普通话、广东话和英语,还可以高度适应不同的口音,因而可以广泛适用于不同文化背景的使用者,尤其是中国地区语言差别较大的广大用户。由于E-talk可以大大提高工作效率,降低运营成本,并为用户提供更便捷的增值服务,我们相信它必将成为电信、证券、金融、旅游等重视客户服务的行业争相引用的电子商务应用系统,并成为电子商务发展的新趋势,为整个信息产业带来无限商机。 目前,飞利浦推出的语音识别自然会话平台SpeechPearl和SpeechMania已成功地应用于国内呼叫中心,SpeechPearl中的每个识别引擎可提供高达20万字的超大容量词库,尤其在具有大词汇量、识别准确性和灵活性等要求的各种电信增值服务中有着广泛的应用。 1.1.2 语音合成信息服务被用户接受 语音合成技术把可视的文本信息转化为可听的声音信息,其应用的经济效益和社会效益前景良好。尤其对汉语语音合成技术的应用而言,全球有十几亿人使用中文,其市场需

数据库开题报告

数据库开题报告 随着现在信息科技的发展,数据的储存量越来越大,那么数据库的发展趋势又是怎样的呢? 数据库技术的现状及其发展趋势研究开题报告 数据库技术的现状及其发展趋势研究开题报告专业:信息管理与信息系统学生:**学号:0924620036 一、选题背景及意义: 数据库技术主要研究如何存储、使用和管理数据 ,是计算机技术中发展最快、应用最广的技术之一。作为计算机软件的一个重要分支,数据库技术一直是倍受信息技术界关注的一个重点。尤其是在信息技术高速发展的今天,数据库技术的应用可以说是深入到了各个领域。当前,数据库技术已成为现代计算机信息系统和应用系统开发的核心技术,数据库已成为计算机信息系统和应用系统的组成核心,更是未来信息高速公路的支撑技术之一。因此,为了更好的认识和掌握数据库技术的现状及发展趋势,本文对有关数据库发展的文献进行了收集整理,以求在对现有相关理论了解、分析的基础上,对数据库发展进行综合论述,对数据库技术发展的总体态势有比较全面的认识,从而推动数据库技术研究理论的进一步发展。 二、论文综述 1、数据库技术发展历程:许多年以来在数据库技术领域很少有重大的技术创新能够引起人们对整个数据库发展历程的回顾与反思。2006年DB2 9中推出的pureXML技术,对过去数十年来关系型数据库的最基本的数据组织方式进行了重大的创新,第一次让我们对数据库的历史,以及过去支撑其发展壮大

的理论基础和外部挑战从新的角度进行审视。今天我们很少去回顾数据库的历史,对于绝大多数IT技术人员,数据库等同于关系型数据库,数据则和表紧密联系。E-R模型几乎是我们描述世界的唯一方式,SQL语言是数据库信息访问处理的唯一手段。关系型数据库已经成为了一种宗教式的信仰,数据相关的所有理论问题似乎都已经解决。 然而历史的发展总是在我们不经意间产生转折,所有重大技术的产生及发展都有其生存的土壤。40年前数据库的诞生并不是关系型数据库,第一代的数据库第一次实现了数据管理与应用逻辑的分离,采用层次结构来描述数据,是层次型数据库(IMS)。第二代数据库奠基于上世纪70年代E.F Codd博士提出的关系型理论以及SQL语言的发明。实现了数据建模和数据操作处理的标准化,关系型数据库在其后的20多年的时间取得了长足的发展,得到了广泛的应用。技术的演进主要集中在性能、扩展性和安全性等方面的提升,其基本的理论框架和技术理念并没有大的变化。 与之相反,在过去的20多年里,IT产业发生了重大的变化和一系列技术及理念的创新。数据库所生存的外部土壤随着Internet以及在网络环境下IT系统互联互通相互协作的趋势,对信息管理技术提出了新的挑战。 2、国内研究的综述:《移动数据库技术研究综述》《Web数据库技术综述》《Web 与数据库技术》《数据库技术发展趋势》 三、论文提纲 (一)数据库技术概论 1、数据库技术概念及类型 2、数据库技术发展历程

语音识别实验2

关于语音识别的研究 网络工程专业网络C071班贾鸿姗 076040 摘要:语音识别技术的广泛应用 1前言: 语音识别技术也被称为自动语音识别 (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T 贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。。到1950年代末,伦敦学院(Colledge of London)的Denes 已经将语法概率加入语音识别中。 1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC),及动态时间弯折Dynamic Time Warp技术。 语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。。此后严格来说语音识别技术并没有脱离HMM框架。 尽管多年来研究人员一直尝试将“听写机”推广,语音识别技术在目前还无法支持无限领域,无限说话人的听写机应用。 2 正文 2.1应用领域 2.1.1.电话通信的语音拨号 特别是在中、高档移动电话上,现已普遍的具有语音拨号的功能。随着语音识别芯片的价格降低,普通电话上也将具备语音拨号的功能。 2.1.2.汽车的语音控制 由于在汽车的行驶过程中,驾驶员的手必须放在方向盘上,因此在汽车上拨打电话,需要使用具有语音拨号功能的免提电话通信方式。此外,对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响等设备的操作,同样也可以由语音来方便的控制。 工业控制及医疗领域。当操作人员的眼或手已经被占用的情况下,在增加控制操作时,最好的办法就是增加人与机器的语音交互界面。由语音对机器发出命令,机器用语音做出应答。 2.1.3数字助理 个人数字助理(Personal Digital Assistant,PDA)的语音交互界面。PDA的体积很小,人机界面一直是其应用和技术的瓶颈之一。由于在PDA上使用键盘非常不便,因此,现多采用手写体识别的方法输入和查询信息。但是,这种方法仍然让用户感到很不方便。现在业界一致认为,PDA的最佳人机交互界面是以语音作为传输介质的交互方法,并且已有少量应用。随着语音识别技术的提高,可以预见,在不久的将来,语音将成为PDA主要的人机交互界面。 智能玩具 通过语音识别技术,我们可以与智能娃娃对话,可以用语音对玩具发出命令,让其完成一些简单的任务,甚至可以制造具有语音锁功能的电子看门狗。智能玩具有很大的市场潜力,而其关键在

相关文档
最新文档