基于单片机的智能语音识别系统设计毕业设计论文

合集下载

基于单片机的智能语音识别控制窗帘系统设计

4
系统测试与优化
系统测试与优化
1
完成硬件和软件设计后，需要对系统进行测试和优化
2
测试主要包括语音识别的准确率、窗帘电机的动作是否符合
预期等
3
根据测试结果对系统进行优化，如调整语音识别算法的参数、改进单片机程序的逻辑等，以
提高系统的性能和用户体验
5 结语
结语
A
本设计基于单片机的智能语音识别
硬件设计
窗帘电机模块
窗帘电机模块包括电机和电机驱动器。电机驱动器采用市面上常见的L293D或L298N 等，能够驱动直流电机或步进电机。电机的输出轴连接到窗帘的滑轨，通过电机的正转或反转来实现窗帘的开关和调节
3
软件设计
软件设计
语音识别算法
本系统采用基于关键词的语音识别算法，通过对用户输入的语音进行预处理、特征提取和匹配，识别出对应的指令。语音识别算法的具体实现可以根据实际情况选择合适的算法库或自行开发
软件设计
单片机程序设计
单片机程序主要实现以下功能：接收语音识别模块的指令、解析指令、控制窗帘电机模块实现相应的动作。程序中需要定义不同的指令和对应的电机动作，如" 开窗帘"、"关窗帘"、"调节窗帘 "等指令
软件设计
电机控制逻辑
电机控制逻辑根据单片机的指令来实现窗帘的开关和调节。对于 "开窗帘"指令，电机正转，直到窗帘完全打开；对于"关窗帘"指令，电机反转，直到窗帘完全关闭；对于"调节窗帘"指令，电机根据设定的速度和目标位置进行调节，以达到用户要求的开度
控制窗帘系统，利用成熟的语音识

(完整版)基于单片机的语音控制开关设计毕业设计

题目基于单片机的语音控制开关设计所在学院物理与电信工程学院专业班级通信工程专业 1102 班指导教师郑争兵完成地点物理与电信工程学院实验室2015年 6月03日毕业论文﹙设计﹚任务书院(系) 物理与电信工程学院专业班级通信1102 学生姓名朱楠一、毕业论文﹙设计﹚题目基于单片机的语音控制开关设计二、毕业论文﹙设计﹚工作自_2015 _年_ 1__月_10_日起至_2015__年 6 月_ 10 日止三、毕业论文﹙设计﹚进行地点: 物理与电信工程学院实验室四、毕业论文﹙设计﹚的内容要求：智能家居作为一个新生产业，目前处于一个导入期与成长期的临界点，随着智能家居市场推广普及的进一步落实，培育起消费者的使用习惯，智能家居市场的消费潜力必然是巨大的，产业前景光明。

本课题设计语音智能控制开关，具体要求如下：1. 掌握语音识别的工作原理，使用语音识别芯片完成硬件设计；2．能实现语音控制开关的开启和关闭；3. 系统集成，焊接电路板，调试。

成果形式：实验样机一套。

毕业设计进度安排: 1.10─3.20：查阅资料（参考文献不少于10篇），进行方案论证，完成开题报告。

完成不少于3000字的外文翻译；3.20─4.30：设计硬件电路，编写相关软件、完成电路仿真及样机调试；5.1─5.20：完善系统调试，撰写论文，准备毕业设计验收等工作；5.21-6.10：整理资料，修改论文，准备毕业答辩。

指导教师系(教研室)通信教研室系(教研室)主任签名批准日期接受论文(设计)任务开始执行日期学生签名基于单片机的语音智能开关设计朱楠（陕西理工学院物理与电信工程学院通信1102班，陕西汉中 723003）指导教师：郑争兵[摘要]语音识别是解决机器“听懂”人类语言的一项技术。

随着语音识别理论研究的深入和数字信号处理软、硬件技术的发展，语音识别技术应用的研究越来越受到人们的关注。

智能语音家电控制系统实质上就是一个替代传统手动开关的受声控制的电子开关。

基于单片机的语音录放系统设计

常州工学院（成人教育）毕业设计（论文）题目基于单片机的语音录放系统设计副题目性质：学生姓名年级教学点专业指导教师评定成绩优良中合格不合格摘要介绍ISD2560语音芯片的结构及引脚功能，所设计的系统实现了单片机对ISD2560的操纵，并能够实现录放音及循环放音等功能。

由单片机AT89C51及数码语音芯片ISD2560组成的语音设计系统出了系统的硬件电路，并给出了录、放音有效的源程序。

目前，语音合成、语音识别、语音存储和回放技术的应用愈来愈普遍，尽管利用一样的单片机测控系统中都有的硬件电路（如A/D、 D/A、存储器等）能完成语音信号的数字化处置，可是功能比较单一、且成效不是专门好，因此基于单片微机和语音芯片系统的应用愈来愈普遍，如电脑语音钟、语音型数字万用表、电话话费查询系统、排队机、监控系统语音报警和公共汽车报站器等等。

本设计用单片机和录放时刻达60秒的数码芯片ISD2560设计了一个智能语音录放系统。

关键词：单片微机数码语音芯片智能目录第一章绪论 (1)第二章ISD2560芯片介绍 (2)语音芯片的选取 (2)语音芯片ISD2560简介 (3)语音芯片引脚功能介绍 (4)第三章电路原理图及说明 (9)复位电路 (9)复位电路的作用 (9)大体的复位方式 (10)时钟电路 (11)单片机与语音芯片部份外围接线 (12)第四章语音录放工作流程 (15)硬件流程 (15)软件流程 (17)第五章程序说明 (19)第六章结语 (25)第七章致谢 (26)第八章参考文献 (27)第一章绪论在声学领域，单片机技术与各类语音芯片相结合，即可完成语音的合成技术，使得单片机语音系统的实现成为可能。

所谓语音芯片，确实是在人工或操纵器的操纵下能够录音和放音的语音芯片,但语音信号是模拟量（语音芯片存储和播放声音的大体工作方式为：声音→模拟量→ A/D →存储→ D/A →模拟量→播放）。

采纳此方式的语音芯片外围电路比较复杂，声音质量也有必然失真。

基于单片机的智能语音识别系统设计毕业设计论文

基于单片机的智能语音识别系统设计（硬件部分）系别：专业班：姓名：学号：指导教师：基于单片机的智能语音识别系统设计(硬件部分)The Design of Intelligent SpeechRecognition System Based onSingle-chip Computer(HardWare)摘要本文设计一个让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术的语音识别系统。

本语音识别系统以LD3320语音识别芯片为核心部件，主控MCU选用STC10L08XE。

主控MCU通过控制LD3320内部寄存器以及SPI flash实现语音识别和对话。

通过麦克风将声音信息输入LD3320进行频谱分析，分析后将提取到的语音特征和关键词语列表中的关键词语进行对比匹配，找出得分最高的关键词语作为识别结果输出给MCU，MCU针对不同的语音输入情况通过继电器对语音命令所对应的电器实现控制。

同时也可以通过对寄存器中语音片段的调用，实现人机对话。

设计中，电源模块采用3.3V供电，主要控制及识别部分采用LM1117-3.3稳压芯片，语音播放及继电器部分采用7812为其提供稳定的电流电压。

寄存器采用一片华邦SPI flash芯片W25Q40AVSNIG，大小为512Kbyte。

系统声音接收模块采用的传感器为一小型麦克风——驻极体话筒，在它接收到声音信号后会产生微弱的电压信号并送给MCU。

另外系统还采用单片机产生不同的频率信号驱动蜂鸣器来完成声音提示，此方案能完成声音提示功能，给人以提示的可懂性不高，但在一定程度上能满足要求，而且易于实现，成本也不高。

关键词：语音识别 LD3320 STC10L08XE单片机频谱分析AbstractThis paper designs a hi-tech speech recognition system which enables machines to transfer speech signals into corresponding texts or orders by recognizing and comprehending. The centerpiece of the speech recognition system is LD3320 voice recognition chip，its master MCU is STC10L08XE. Master MCU achieve voice conversation by controlling the internal registers and SPI flash LD3320.The sound information is inputted into LD3320 by microphone to do spectrum analysis. After analyzing the voice characteristics extracted are compared and matched with the key words in the list of key words.Then the highest scores of key words found would be output to MCU as recognition results. MCU can control the corresponding electrical real of speech recognition for different voice input through the relays and can also achieve voice conversation through a call to voice clips in register.In the design,power module uses 3.3V.The main control and identification part adopt LM1117-3.3 voltage regulator chip,and 7812 is used to provide stable current and voltage for the part of voice broadcast and relay.Register uses chip SPI flash W25Q40A VSNIG which is 512Kbyte. The sensor used in the speech reception module of the design is microphone,namely electrit microphone.After receiveing the sound signal,it can produce a weak voltage signal which will be sent to MCU. In addition,the system also adopts a different frequency signals generated by microcontroller to drive the buzzer to complete the voice prompt, and this program can complete the voice prompt.The program gives a relatively poor intelligibility Tips.However, to some extent,it can meet the requirements and is easy to implement and the cost is not high.Key words：Speech Recognition LD3320 STC10L08XE Single-chip computer Spectrum Analysis目录摘要 (I)Abstract (II)绪论 (1)1设计方案 (5)1.1 系统设计要求 (5)1.2总体方案设计 (5)2 系统硬件电路设计 (6)2.1电源模块 (6)2.2 寄存器模块 (6)2.3 控制单元模块 (7)2.3.1 STC10L08XE单片机简介 (8)2.3.2 STC11/10xx系列单片机的内部结构 (10)2.4 声音接收器模块 (10)2.5 声光指示模块 (11)2.6 语音识别模块 (11)2.6.1 LD3320芯片简介 (11)2.6.2 功能介绍 (12)2.6.3 应用场景 (13)2.6.4 芯片模式选择 (15)2.6.5 吸收错误识别 (16)2.6.6 口令触发模式 (17)2.6.7 关键词的ID及其设置 (18)2.6.8 反应时间 (18)3 系统软件设计 (20)3.1 系统程序流程图 (20)3.2 系统各模块程序设计 (20)3.2.1 主程序 (20)3.2.2 芯片复位程序 (27)3.2.3 语音识别程序 (28)3.2.4 声音播放程序 (37)4 系统调试 (44)4.1 软件调试 (44)4.1.1 上电调试 (44)4.1.2 读写寄存器调试 (44)4.1.3 检查寄存器初始值 (44)4.2 硬件电路调试 (45)4.2.1 硬件检查 (45)4.2.2 硬件功能检查 (45)4.3 综合调试 (46)结论 (47)致谢 (48)参考文献 (49)附录1实物图片 (50)附录2系统电路图 (51)绪论课题背景及意义让机器听懂人类的语音，这是人们长期以来梦寐以求的事情。

毕业设计(论文)-语音智能识别系统设计[管理资料]

目录1 绪论 (3) (3) (3) (4)DSP的应用前景 (4)2 方案论证与比较 (5)语音识别方案的论证 (5)语音的采集和处理方案论证 (6)控制部分方案论证 (6)显示部分方案论证 (7)接口部分方案论证 (7)3 硬件系统设计 (8)系统概述 (8)语音采集部分 (9)DSP处理部分 (9)控制——显示部分 (10)硬件电路设计 (11)DSP接口电路设计 (11)串行接口电路设计 (11)单片机串行通信接口设计 (12)LCD电路设计 (13)4 软件实现 (14)DSP的软件实现 (14)端点检测 (14)语音特征提取 (15)模式识别——动态时间规整（DTW） (16)FLASH引导的实现 (17) (18) (18) (18) (18)FLASH的烧写 (19)——显示板软件设计 (19) (19)LCD程序设计 (20)5 总结与展望 (22) (22) (22)致谢 (24)参考文献 (25)附录一 (26)附录二 (28)1 绪论语音识别技术发展到今天，特别是中小词汇量非特定人语音识别系统识别精度已经大于98%，对特定人语音识别系统的识别精度就更高。

这些技术已经能够满足通常应用的要求。

由于大规模集成电路技术的发展，这些复杂的语音识别系统已经完全可以制成专用芯片，大量生产。

在西方经济发达国家，大量的语音识别产品已经进入市场和服务领域。

一些用户交换机、电话机、手机已经包含了语音识别拨号功能、语音记事本、语音智能玩具等产品，同时也包括语音识别与语音合成功能。

人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息。

调查统计表明，多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。

可以预测，在近5年内，语音识别系统的应用将更加广泛，各种各样的语音识别系统产品将不断出现在市场上。

语音识别技术在人工邮件分拣中的作用也日益显现，发展前景诱人。

一些发达国家的邮政部门已经使用了这一系统，语音识别技术逐渐成为邮件分拣的新技术。

基于单片机的语音识别控制灯-毕业论文

---文档均为word文档，下载后可直接编辑使用亦可打印---摘要自然语音作为人机交互在目前得以广泛的应用以及极大的发展前景。

该设计介绍了基于非指定人语音芯片LD3320的语音控制器结构及其实现语音控制的方法。

该语音控制器利用CST89C52单片机作为主要控制器，控制芯片对输入的进行语音识别并处理，根据语音指令产生相对应的脉冲序列，替代按键式遥控器，实现对电路的语音控制。

本次设计采用了ICRpute公司的LD3320语音识别芯片和相关控制电路，设计实现一款语音控制系统，该系统可以通过语音控制操作，实现无键盘语音控制家用电器工作的功能。

关键词：LD3320；语音识别；CST89C52单片机；Speech recognition control lamp based on MCUAbstractNatural voice as human-computer interaction in current to a wide range of application and great development prospect of the design is introduced based on the specified person voice chip LD3320 voice controller structure and the realization of voice control method using the voice controller CST89C52 single chip microcomputer as main controller, the control chip of input speech recognition and processing, according to voice commands should be relative pulse sequence, alternative button remote control, realize the voice control of the circuit This design USES the LD3320 speech recognition chip of ICRpute company and the relevant control circuit, and designs and realizes a speech control system, which can operate through speech control and realize the function of keyless speech control of household appliancesKey words: LD3320; Speech recognition; CST89C52 Single chip microcomputer;目录1绪论 (1)1.1课题研究意义 (1)1.2世界研究现状 (1)1.3研究的内容和要求 (2)2方案论证 (3)2.1方案论证 (3)2.2芯片选择 (3)3硬件单元电路设计 (4)3.1LD3320语音识别模块 (4)3.1.1 LD3320芯片的部分参数 (6)3.2 STC89C52单片机核心控制版块 (6)3.2.1 主要性能 (7)3.2.2 单片机引脚 (8)3.2.3 时钟电路 (10)3.2.4 复位电路 (11)3.2.5 继电器 (12)3.3 电源电路的设计 (12)4 软件设计 (13)4.1 主程序流程图 (13)4.2 语音识别程序设计 (14)4.2.1 LD3320语音识别原理 (14)4.2.2 非特定语音识别程序流程图 (15)参考文献 (18)谢辞 (19)附录 (20)1绪论1.1课题研究意义伴随着科学的技术发展，互联网时代的高速发展，各类产品的研究也是百家争鸣，更多性能、功能齐全的各类产品出现在人们的日常生活中，其中与我们生活息息相关的便是各类电子产品，如电话，家电，办公用品等等，曾经我们幻想着机器人，我们可以操控他们实现我们想要的功能，而如今随着各国科学家利用语音识别技术研发出的新颖的电子产品，让我们曾经遥不可及的梦想变得日益普及，不仅仅是对家用电器的控制，乃至各类声控产品也慢慢的涌入市场，供人们选用，我们会发现，在我们的生活中对各类电子产品慢慢的不再需要以有繁多按键的遥控来控制，正如现在中国国内火爆的小米公司的"小爱同学"，苹果手机上的"siri"同志，他们不再以之前的按键控制，只需要随口的一句之灵，便可以很轻松的利用说话来控制电器产品，为当今家庭以及工业提供了更多便利。

单片机课程设计(论文)-基于语音识别技术的门禁系统

目录第一章绪论 (2) (2) (2) (3) (3) (4) (4) (5)第二章硬件电路设计 (6)2.1 AT89S52单片机电路设计 (6)2.1.1 AT89S52简介 (6) (7) (9)2.2 S3C2410硬件设计 (11)2.2.1 S3C2410芯片简介 (11)2.2.2 S3C2410引脚图 (13)2.2.3 S3C2410硬件设计 (13) (14)第三章系统软件设计 (15)3.1 linux和QT (15)3.1.1 嵌入式linux 简介 (15)3.1.2 QT简介 (16)3.2 系统软件的实现 (18)3.2.1 S3C2410的软件实现 (18) (19)第四章总结 (20)基于语音识别技术的门禁系统摘要：通过对语音识别原理的系统分析，结合特定人语音识别的具体情况，阐了基于语音识别的门禁系统的设计思路，介绍了其中的几个关键性技术要点。

应用ARM 芯片S3C2410,51单片机，从硬件、软件、算法优化等方面实现了基于语音识别门禁系统的总体设计，在S3C2410-S平台上完成了原型系统的开发，并从应用的角度阐明了本系统理论上的合理性与可行性。

关键词：语音识别s3c2410 ARM 门禁系统单片机第一章绪论综合集成计算机、通讯、自动识别、机械工程和安全管理系统等相关技术的门禁系统有效地解决了重要部门和场所的安全访问控制问题，已得到广泛的应用，成为日常工作和生活中的电子门卫。

目前，门禁系统采用较多的是非接触式RF卡、生物识别技术、IC卡、密码输入等方式。

然而随着科学技术的发展，综合应用语音识别、指纹识别、虹膜识别、红(热)感应等最新生物识别技术，结合电磁锁等技术的门禁系统已广泛吸引了人们的注意，并将逐步成为门禁系统发展的主流与最终目标之一。

利用语音识别技术来实现门禁系统不用像其他方式一样需要触摸，具有方便、安全、准确、信息完整、独立性强、反应速度快等优点。

因此，基于语音识别技术的门禁系统有着非常独特的优势和发展前景。

毕业设计(论文)-基于单片机的语音播放系统分析与设计

摘要今天,数码语音技术已经发展成为一种时尚化智能化,人性化的代表技术，出现在工业、交通、军事、安全保卫、教育、娱乐、体育、通讯、广告、旅游、休闲、政治宣传等各个领域。

自然的语音、声音是稍纵即逝的,聪慧的人类想了很多办法来留存它们,这样可以在任何需要的时候重复播放出来。

这种保留原声的媒介曾有过钢丝、黑胶唱片、胶片、磁带、激光唱片等等，这些媒介都需要精密复杂的机械传动装置来配合，大多体积比较大,耗电大，控制不够灵活，有介质磨损,使用寿命有限。

现在,我们可以采用数码电子技术将纯的无任何机械的半导体集成电路(IC)去完成语声信号的存储和还原,这样一类经过存储而还原播放的语言声音，我们称为数码语声。

这类保存着数码语声的集成电路我们称为数码语声电路，或语声IC,有了这些语声IC声音就能保留和还原，而且能被选择性地反复播放，也就能让不会说话的各种物品发出声音或开口说话。

语声IC具有体积小、耗电少、可控制性能好、永无磨损、永久寿命等特点。

它是采用电子处理技术将复杂的语声信号“切分”成很多份，以最小的单位存储在自己内部的存储器里。

当需要时，再把这些小份拼接成完整的语声信号播放出来。

经由语声IC的处理、保存再回放出来的声音效果会比原声有一定的失真,现在还原声音最好的是激光唱片方式,它的声音取样频率是44.1KHZ,取样位数是24位，简单的说就是把一秒钟的语声信号横着切24份，再竖着切4万4千多份，累计把一秒钟的信号切成了约100万份分别存储在激光唱片上，等播放时再拼在一起还原出来，因此有较好的还原度。

而语声IC因为制造技术和成本问题，其能够使用的存储器容量比较小,大多数的语声IC都采用6KHZ5位采样，即大约把一秒种的信号切成3万份，因此还原效果就要差不少。

但随着技术的发展，这一差距正在减少。

语声IC的成本主要取决于内部电路的复杂程度和存储器的容量，在短时间语声长度的产品中,语声IC的性能价格比是非常高,有的种类的语声IC价格低到只有几分钱，这是任何其它数码语声还原设备无法比拟的。

基于单片机的智能语音播报控制系统设计

基于单片机的智能语音播报控制系统设计摘要：随着科技的不断发展，人们对智能控制系统的需求也越来越大。

本文针对市场上常见的语音播报控制系统进行了研究和设计，采用单片机实现了智能语音播报控制系统。

设计过程中，主要考虑了硬件和软件的实现，包括传感器的使用、单片机的编程、语音识别技术、语音合成技术等。

以此为基础，实现了智能化语音播报控制系统的功能，能够实现声音的输入、语音播放和控制等多种功能，满足了人们日常生活和工作的多种需求。

关键词：智能控制、单片机、语音识别、语音播报、传感器Abstract: With the continuous development of technology, there is a growing demand for intelligent control systems. In this paper, we have conducted research and designed an intelligent voice playback control system based on single-chip microcontrollers for common voice playback control systems on the market. During the design process, we focused on the hardware and software implementation, including the use of sensors, single-chip programming, speech recognition technology, speech synthesis technology, etc. Based on this, we have implemented the functions of intelligent voice playback control system, which can realize voice input, voice playback, and control, and meet various needs in daily life and work.Keywords: intelligent control, single-chip microcontroller, speech recognition, voice playback, sensor1. 介绍随着科技的不断发展，各类智能化系统也越来越普及。

基于单片机的智能家居语音控制系统设计

基于单片机的智能家居语音控制系统设计一、概述随着科技的飞速发展，智能家居系统正逐渐成为现代家庭生活中不可或缺的一部分。

这些系统通过集成各种先进的传感器、执行器和通信技术，为用户提供了更为便捷、舒适和节能的居住环境。

而语音控制技术作为智能家居领域的一项重要技术，其方便性、直观性和人性化特点受到了广泛关注。

基于单片机的智能家居语音控制系统设计，旨在通过单片机作为核心控制器，结合语音识别技术，实现对家居设备的语音控制。

该系统不仅提高了家居生活的便捷性，还通过智能调节家居设备的运行状态，达到了节能降耗的目的。

该系统还具备较高的可扩展性和灵活性，可以根据用户的实际需求进行定制和扩展。

在本文中，我们将详细介绍基于单片机的智能家居语音控制系统的设计方案。

我们将对系统的整体架构进行阐述，包括硬件组成和软件设计。

我们将重点介绍语音识别的实现方法，包括语音信号的采集、预处理、特征提取和识别算法等。

我们还将讨论单片机与家居设备之间的通信方式以及控制策略。

我们将对系统的性能进行评估，并展望未来的发展趋势和应用前景。

通过本文的介绍，读者将能够深入了解基于单片机的智能家居语音控制系统的设计原理和实现方法，为进一步的研究和应用提供有益的参考。

1. 智能家居的发展背景及现状随着科技的飞速发展和人们生活品质的不断提升，智能家居作为信息化社会的重要产物，正逐步融入千家万户的日常生活之中。

智能家居的发展背景源于人们对居住环境智能化、舒适化和便捷化的追求，以及对传统家居生活的革新与升级。

近年来，物联网、人工智能、云计算等技术的快速发展，为智能家居提供了强大的技术支撑。

通过集成各种传感器、控制器和执行器，智能家居系统能够实现对家庭设备的自动化控制和智能化管理，为人们带来前所未有的便捷体验。

同时，随着消费者对于个性化、定制化服务的需求日益增长，智能家居也在逐步向个性化、差异化方向发展。

目前，智能家居市场已呈现出蓬勃发展的态势。

众多企业纷纷涉足智能家居领域，推出了一系列具有创新性和实用性的产品。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

本语音识别系统以LD3320语音识别芯片为核心部件，主控MCU选用STC10L08XE。

主控MCU通过控制LD3320内部寄存器以及SPI flash实现语音识别和对话。

同时也可以通过对寄存器中语音片段的调用，实现人机对话。

设计中，电源模块采用3.3V供电，主要控制及识别部分采用LM1117-3.3稳压芯片，语音播放及继电器部分采用7812为其提供稳定的电流电压。

寄存器采用一片华邦SPI flash芯片W25Q40AVSNIG，大小为512Kbyte。

系统声音接收模块采用的传感器为一小型麦克风——驻极体话筒，在它接收到声音信号后会产生微弱的电压信号并送给MCU。

语音识别是一门交叉学科，关系到多学科的研究领域，不同领域上的研究成果都对语音识别的发展作了贡献。

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

计算机语音识别过程与人对语音识别处理过程基本上是一致的。

目前主流的语音识别技术是基于统计模式识别的基本理论。

一个完整的语音识别系统可大致分为三部分：（1）语音特征提取：目的是从语音波形中提取随时间变化的语音特征序列。

（2）声学模型与模式匹配（识别算法）：声学模型是识别系统的底层模型，并且是语音识别系统中最关键的一部分。

声学模型通常由获取的语音特征通过训练产生，目的是为每个发音建立发音模板。

在识别时将未知的语音特征同声学模型（模式）进行匹配与比较，计算未知语音的特征矢量序列和每个发音模板之间的距离。

声学模型的设计和语言发音特点密切相关。

声学模型单元大小（字发音模型、半音节模型或音素模型）对语音训练数据量大小、系统识别率，以及灵活性有较大影（3）语义理解：计算机对识别结果进行语法、语义分析。

明白语言的意义以便作出相应的反应。

通常是通过语言模型来实现。

语音识别过程实际上是一种认识过程。

就像人们听语音时，并不把语音和语言的语法结构、语义结构分开来，因为当语音发音模糊时人们可以用这些知识来指导对语言的理解过程。

对机器来说，识别系统也要利用这些方面的知识，只是鉴于语音信号的多变性、动态性、瞬时性，语音识别技术与人类的大脑还有一定的差距。

因此在语言识别技术选择，其应用模式和系统开发上，都需要专业的设计和调试，以实现最好的应用效果[1]。

1996年9月，Charles Schwab开通了首个大规模商用语音识别应用系统：股票报价系统。

该系统有效地提高了服务质量和客户满意度，并减少了呼叫中心的费用。

不久，Schwab又开通了语音股票交易系统。

美国主要电信运营商Sprint的PCS部门以卓越和有创新的客户服务著称。

自2000年来为客户开通了语音驱动系统，提供客户服务、语音拨号、查号和更改地址等业务。

2001年9月开通的可以自然方式对话的咨询系统，更实现了以自然、开放的询问方式实时获得所需要的信息。

Bell Canada，加拿大最大的电信运营商，也拥有多个语音驱动系统，提供从客户服务，增值业务和资讯服务多种功能。

这些系统不但减少了用户的投诉，也为无线网络服务增值，增强了客户的忠诚度并开辟了新的收入来源。

仔细分析这些案例不难发现，一个成功的语音应用首先是基于详细准确的用户需求调查。

只有详细了解客户需求，才能根据需要选用不同类型的产品。

目前市场上的语音识别产品基本可分为：特定人/非特定人：是按照声学模型建立的方式来划分。

特定人识别的声学模型是针对某一特定用户训练的。

一般来说用户需要先训练系统，然后才能识别该用户的发音。

而非特定人识别的声学模型是针对某一种特定的语言来训练的，发音人不需要训练既可使用。

虽然在建立模型时需要大量的语料，对用户来说却提供了更大方便，他们甚至不需要了解该过程。