基于单片机的语音识别系统研究开题报告

基于单片机的语音识别系统研究开题报告
基于单片机的语音识别系统研究开题报告

论文开题报告

一、毕业论文设计的目的及意义

随着人们生活水平不断提高。越来越多的人开始注意私人或工作场所的保密性以及安全性。为了满足人们的不同需求,设计者们开发了多种多样的门禁系统。它们被广泛应用于私人住宅,学校、医院、商店、企业,政府单位等各种场所。按照识别方式分类,有指纹识别式,人脸识别式,语音识别式等等。这些系统各有特点、各有优势。随着计算机功能越来越强大,微电子技术不断发展,即使简单的单片机也能够实现简单的人机对话。这就为语音识别门禁系统的设计提供了必要条件探究语音识别技术在嵌入式系统中的应用,通过嵌入式技术实现语音识别,扩展嵌入式系统的应用领域,将语音识别技术应用于门禁系统,为人们的生活提供便利。

二、结构和主要内容

本文分成五个部分.

第一部分是概述这部分主要论述本系统实现的技术基础,简要介绍了系统用到的嵌入式技术,主要介绍了嵌入式技术的核心-单片机;以及语音识别技术。通过论述语音识别技术的原理,分类,发展前景等,简单的介绍语音识别技术的特点、功能、应用。

第二部分是硬件系统设计。这部分分析硬件系统的组成结构,具体组成模块,具体电路设计,用到的主要的组成部件等。在这里我详细介绍了应用到的系统核心单片机,以及语音识别模块的核心,语音识别芯片。为具体直观的体现本系统的设计思路,将系统分为处理器核心部分、语音信号处理部分、门锁控制电机部分、门锁,一共四个模块。然后分别介绍每个模块的电路设计。

第三部分是软件系统设计,不同模块软件的实现。简要介绍了处理器核心部分的软件实现和门锁控制部分的软件实现。

第四部分是系统的仿真过程,因为软件的仿真更加方便快捷,所以本文选择的是通过软件进行仿真。

三、研究方法

1.收集和整理资料,参阅部分收集到的资料,对论文命题有了初步的认识。

2.完成开题报告,并透过指导老师和论文开题答辩小组审查。

3.查找与阅读论文相关的适宜的英文文献,对其进行翻译并完成。

4.寻找实习单位,进行为期一个月的实习,实习资料涉及社会实践和与论文相关的实地研究。

5.实习期间写下实习周记。

6.透过文献研究和实践研究,对论文命题有了较为全面的理解后,结合前人的研究成果,完成论文初稿的撰写

四、主要参考文献:

[1]李建忠编著.单片机原理及应用.西安:西安电子科技大学出版社,2002

[2]李群芳,肖看编著.单片机原理、接口及应用.北京:清华大学出版社,2005

[3]于海生编著.微型计算机控制技术.北京:清华大学出版社,2008

[4]戴梅萼,史嘉权编著.微型计算机技术及应用(第3版).北京:清华大学出版社,2008

[5]刘建清.轻松玩转51单片机[M].北京:北京航空航天大学出版社,2011.67-69

基于单片机的语音控制小车的开题报告_共4页

一、选题的依据、意义和理论或实际应用方面的价值 随着现代生活水平的不断提高,人们对智能化产品有着巨大的需求,语音智能控制作为简单快捷方便的操作方式得到越来越广泛人们的认可,例如手机智能语音拨号功能,就是很好的例子。随着电子业的发展, 自动化已不再是一 个新鲜的话题, 无人驾驶的小汽车也必将进入实用阶段, 未来驾驶汽车, 不再是只能依靠手动,语音等方式也有可能成为未来汽车的辅助驾驶途径之一。当前电子设计系统已进人了片上系统时代, 语音识别与处理技术在信息技术的人机 接口中得到了普遍关注。语音识别的音控小车作为典型应用之一,简单地诠释了人机一体化的设计思想。其设计理念缩短了人机界面的距离,增强了互动性和智能性,同时使得将信息技术和控制技术引入到车辆的操纵控制中,形成机器智能,使驾驶员的感知、决策和执行能力扩展成为可能。 二、本课题在国内外的研究现状 Bill Gates 在世界计算机博览会(COMDEX)主题演讲会上描绘IT事业的发展宏图时,率先指出:下一代操作系统和应用程序的用户界面将是语音识别。工业界应对语音识别领域的重大突破做好充分准备,因为那将是一场席卷全球的另一次热潮。 据统计部门的数据,至2006年中国汽车保有量已达3500万辆(其中轿车占80%,约2500万辆),每年仍以30%的速度递增。我国成为了继美国之后的第二大汽车生产和消费大国。汽车行业的迅猛发展也带动了相关配套、服务业的发展。而将功能强大的智能车载信息系统——车载电脑加载到汽车上已经成为欧美、日本等地汽车市场的首选新装备。我国语音智能控汽车产业有着巨大的发展前景。车载电脑给汽车带来了一场信息化的革命,让每辆汽车构建成一个完美的车载信息与娱乐系统终端,包括车载通讯系统、导航系统、数字娱乐系统以及辅助驾驶系统。车载通讯与导航系统主要指GPRS和GPS,让你“轻 车熟路”,而且轻松打电话。 三、课题研究的内容及拟采取的方法 我研究的课题题目是实现语音对小车的智能控制,按照其功能的实现可以划分如下模块:语音输入模块、主控模块(SPCE061A)、电机驱动模块、语 音输出模块、电源模块。语音输入模块实现语音的输入,讲录入的语音作为数据源。主控模块实现对语音的分辨、识别、与存储单元中的指令匹配,发出控制命令。电机模块通过主控模块的控制,对电机发出控制命令。语音输出模块控制发出控制命令相对应的语音。电源模块控制电源的连通。首先对存储器初始化,之后进行录音初始化,进入录音循环中,定时器中断程序控制采样频率,并按时间间隔将采样值送入语音样本队列,录音循环从语音样本队列中获取数据并进行编码,将编码后的数据送入存储器,成为语音资源。在训练过程中,系统调用了语音播放子程序,需要进行播放初始化,进入播放循环中,从语音资源中获取数据,解码,填入播放队列中,定时器中断程序从播放队列中取出数据送到D /A 转换器中,将语音信号送到扬声器中,使得整个训练过程在语音提示下从容进行。 四、课题研究中的主要难点以及解决的方法 1)如何实现对SPCE061A的无线语音接入? SPCE061A 内置MIC 放大电路和AGC 电路, 可很方便地接上MIC 使用。但考虑到小车在运动到距离用户较远的地方时, 无法接收到用户的语音命令, 而

(完整版)基于单片机的语音控制开关设计毕业设计

题目基于单片机的语音控制开关设计所在学院物理与电信工程学院专业班级通信工程专业 1102 班指导教师郑争兵 完成地点物理与电信工程学院实验室 2015年 6月03日

毕业论文﹙设计﹚任务书 院(系) 物理与电信工程学院专业班级通信1102 学生姓名朱楠 一、毕业论文﹙设计﹚题目基于单片机的语音控制开关设计 二、毕业论文﹙设计﹚工作自_2015 _年_ 1__月_10_日起至_2015__年 6 月_ 10 日止 三、毕业论文﹙设计﹚进行地点: 物理与电信工程学院实验室 四、毕业论文﹙设计﹚的内容要求: 智能家居作为一个新生产业,目前处于一个导入期与成长期的临界点,随着智能家居市场推广普及的进一步落实,培育起消费者的使用习惯,智能家居市场的消费潜力必然是巨大的,产业前景光明。本课题设计语音智能控制开关,具体要求如下: 1. 掌握语音识别的工作原理,使用语音识别芯片完成硬件设计; 2.能实现语音控制开关的开启和关闭; 3. 系统集成,焊接电路板,调试。 成果形式:实验样机一套。 毕业设计进度安排: 1.10─3.20:查阅资料(参考文献不少于10篇),进行方案论证,完成开题报告。完成不少于3000字的外文翻译; 3.20─ 4.30:设计硬件电路,编写相关软件、完成电路仿真及样机调试; 5.1─5.20:完善系统调试,撰写论文,准备毕业设计验收等工作; 5.21- 6.10:整理资料,修改论文,准备毕业答辩。

指导教师系(教研室)通信教研室 系(教研室)主任签名批准日期 接受论文(设计)任务开始执行日期学生签名

基于单片机的语音智能开关设计 朱楠 (陕西理工学院物理与电信工程学院通信1102班,陕西汉中 723003) 指导教师:郑争兵 [摘要]语音识别是解决机器“听懂”人类语言的一项技术。随着语音识别理论研究的深入和数字信号处理软、硬件技术的发展,语音识别技术应用的研究越来越受到人们的关注。智能语音家电控制系统实质上就是一个替代传统手动开关的受声控制的电子开关。此系统以STC11L08XE和LD3320语音芯片为硬件核心,对语音芯片LD3320的信息进行处理,并对开关进行控制,通过LD3320外界的麦克风采集声音信号,再通过LD3320语音芯片进行频谱分析,在提取语音特征,之后和关键词语列表中的关键词进行对比匹配,最后找出得分最高的关键词作为识别结果输出给单片机,单片机进行处理后,再输出信号来控制继电器,再通过继电器来控制开关工作,开关又可实现对电器的控制。语音芯片的功能都是通过单片机控制实现的。最终实现对智能语音开关的控制 [关键词] STC11L08XE单片机语音芯片LD3320 语音识别 Design of intelligent voice switch based on MCU Zhu nan (Grade11,Class2,Major of Communication Engineering,School of Physics and Tutor:Zheng Zheng bing Abstract: Speech recognition is a technology to solve the machine to understand human language. Along with the research of speech recognition theory and the development of digital signal processing software and hardware technology, The research on the application of speech recognition technology is getting more and more attention.The intelligent speech appliance control system is essentially an electronic switch which replaces the traditional acoustic control with the manual switch. This system LD3320 voice chip and the stc11l08xe as hardware core and the voice chip ld3320 information for processing, and control the switch, through ld3320 external microphone audio signal acquisition, and then through the ld3320 voice chip spectrum analysis, key words in speech feature extraction, and the list of key words contrast matching, finally to find the highest score of the words as recognition results output to the MCU, MCU processing, then the output signal to control the relay, then through the relay to control of the switch, the switch can be to achieve control of the electric appliances. The function of the speech chip is realized by the MCU control. Control of the intelligent speech switch is realized finally. Key words : STC11L08XEMCU LD3320 voice chip Speech recognition

语音识别系统实验报告材料

语音识别系统实验报告 专业班级:信息安全 学号: 姓名:

目录 一、设计任务及要求 (1) 二、语音识别的简单介绍 2.1语者识别的概念 (2) 2.2特征参数的提取 (3) 2.3用矢量量化聚类法生成码本 (3) 2.4VQ的说话人识别 (4) 三、算法程序分析 3.1函数关系 (4) 3.2代码说明 (5) 3.2.1函数mfcc (5) 3.2.2函数disteu (5) 3.2.3函数vqlbg (6)

3.2.4函数test (6) 3.2.5函数testDB (7) 3.2.6 函数train (8) 3.2.7函数melfb (8) 四、演示分析 (9) 五、心得体会 (11) 附:GUI程序代码 (12) 一、设计任务及要求 实现语音识别功能。 二、语音识别的简单介绍

基于VQ的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所提取的特征参数进行分类,产生不同码字所组成的码本。在识别(匹配)阶段,我们用VQ方法计算平均失真测度(本系统在计算距离d时,采用欧氏距离测度),从而判断说话人是谁。 语音识别系统结构框图如图1所示。 图1 语音识别系统结构框图 2.1语者识别的概念 语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这就使得通过分析语音信号来识别说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有的特征,不会丢失或遗忘;语音信号的采集方便,系统设备成本低;利用电话网络还可实现远程客户服务等。因此,近几年来,说话人识别越来越多的受到人们的重视。与其他生物识别技术如指纹识别、手形识别等相比较,说话人识别不仅使用方便,而且属于非接触性,容易被用户接受,并且在已有的各种生物特征识别技术中,

单片机语音识别程序

最近想做语音识别玩玩,网上查了查,找到一个用Atmega32实现的语音识别机械车 地址是:https://www.360docs.net/doc/742029457.html,/e ... h8_css34/index.html 貌似是利用带通滤波取得频谱(或者叫功率谱?),看不太懂.我决定用DFT 算法,因为它节约内存 DFT程序借借鉴了 hendry 单片机 DTMF 软解码算法的实现 https://www.360docs.net/doc/742029457.html,/forum.php?m ... &highlight=dtmf //-------------------------------------------------- //DFT运算 //注意,ad是有符号数,无符号的AD值需减128 //返回值为1表示已经计算了功率谱 //-------------------------------------------------- U8 dft(S8 ad) { U8 i; U8 offset;//查表指针 U32 temp; //ad-=128;//去直流分量 for(i=0;i>8; offset+=PI2/4;//偏移1/4周期为cos表 s_dft_real += (S16)ad * sintab[offset];//>>8;//cos表 tabp+=tabinc;//指针下移 } s_dft_p ++; if (s_dft_p == NSAMP) //采样点已达到设定值,计算功率 { s_dft_p = 0; //点数清0 for (i = 0; i < NFREQ; i ++)//每个频点计算功率 { s_dft_real/=NSAMP*6; //除以合适的值能使得功率在一字节内 s_dft_image/=NSAMP*6; temp=s_dft_real*s_dft_real + s_dft_image*s_dft_image; if(temp>65535)temp=65535; s_dft_real = sqrt16(temp);

matlab语音识别系统(源代码)最新版

matlab语音识别系统(源代码)最新版

目录 一、设计任务及要求 (1) 二、语音识别的简单介绍 2.1语者识别的概念 (2) 2.2特征参数的提取 (3) 2.3用矢量量化聚类法生成码本 (3) 2.4VQ的说话人识别 (4) 三、算法程序分析 3.1函数关系 (4) 3.2代码说明 (5) 3.2.1函数mfcc (5) 3.2.2函数disteu (5) 3.2.3函数vqlbg (6) 3.2.4函数test (6) 3.2.5函数testDB (7) 3.2.6 函数train (8) 3.2.7函数melfb (8) 四、演示分析 (9) 五、心得体会 (11) 附:GUI程序代码 (12)

一、设计任务及要求 用MATLAB实现简单的语音识别功能; 具体设计要求如下: 用MATLAB实现简单的数字1~9的语音识别功能。 二、语音识别的简单介绍 基于VQ的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所提取的特征参数进行分类,产生不同码字所组成的码本。在识别(匹配)阶段,我们用VQ方法计算平均失真测度(本系统在计算距离d时,采用欧氏距离测度),从而判断说话人是谁。 语音识别系统结构框图如图1所示。 图1 语音识别系统结构框图 2.1语者识别的概念 语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这就使得通过分析语音信号来识别说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有的特征,不会丢失或遗忘;语音信号的采集方便,系统设备成本低;利用电话网络还可实现远程客户服务等。因此,近几年来,说话人识别越来越多的受到人们的重视。与其他生物识别技术如指纹识别、手形识别等相比较,说话人识别不仅使用方便,而且属于非接触性,容易被用户接受,并且在已有的各种生物特征识别技术中,是唯一可以用作远程验证的识别技术。因此,说话人识别的应用前景非常广泛:今天,说话人识别技术已经关系到多学科的研究领域,不同领域中的进步都对说话人识别的发展做出了贡献。说话人识别技术是集声学、语言学、计算机、信息处理和人工智能等诸多领域的一项综合技术,应用需求将十分广阔。在吃力语音信号的时候如何提取信号中关键的成分尤为重要。语音信号的特征参数的好坏直接导致了辨别的准确性。

基于语音识别的智能小车设计-毕设论文

基于语音识别的智能小车 摘要 随着计算机技术、模式识别和信号处理技术及声学技术等的发展,使得能满足各种需要的语音识别系统的实现成为可能。近二三十年来,语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。本设计是语音识别在控制领域的一个很好实现,它将原本需要手工操作的工作用语音来方便地完成。 语音识别按说话人的讲话方式可分为孤立词(Isolated Word)识别、连接词(Connected Word)识别和连续语音(Continuous Speech)识别。从识别对象的类型来看,语音识别可以分为特定人(Speaker Dependent)语音识别和非特定人(Speaker Independent)语音识别。本设计采用的识别类型是特定人孤立词语音识别。 本系统分上位机和下位机两大方面。上位机利用PC上MATLAB强大的数学计算能力,进行语音输入、端点监测、特征参数提取、匹配、串口控制等工作,根据识别到的不同语音通过PC串口向下位机发送不同的指令。下位机是单片机控制的一个小车,单片机收到上位机传来的指令后,根据不同的指令控制小车完成不同的动作。 该设计对语音识别的现有算法进行了验证和实现,并对端点检测和匹配算法进行了些许改进。本设计达到了预期目标,实现了所期望的功能效果。 关键词:MATLAB,语音识别,端点检测,LPC,单片机,电机控制

SMART CAR GASED SPEECH RECOGNITION ABSTRACT With the development of computer technology,pattern recognition,signal processing technology and acoustic technology etc, the speech recognition system that can meet the various needs of people is more possible to achieve.The past three decades, the voice recognition in the field of computer, information processing, communications and electronic systems, automatic control has increasingly wide range of applications. Speech recognition by the speaker's speech can be divided into isolated word (Isolated Word) identification, conjunctions (Connected Word) and continuous speech recognition (Continuous Speech) identification. Identifying the type of object from the point of view, the voice recognition can be divided into a specific person (Speaker Dependent) speech recognition and non-specific (Speaker Independent) speech recognition. This design uses the identification type is a specific person isolated word speech recognition. This design is of a good implementation of speech recognition in the control field, it does the work that would otherwise require manual operation by the voice of people easily.This system includes two major aspects:the host system and the slave system. The host system use the MATLAB on the computer which has powerful mathematical computing ability to do the work of voice input, endpoint monitoring, feature extraction, matching, identification and serial control,then it send different commands through the PC serial port to slave system according different recognised voice. The slave system is a car controlled by a single-chip micro-controller.It controls the car do different actions according different instructions received.

基于单片机的语音识别系统 毕业设计

基于单片机的语音识别系统毕业设计 目录 摘要..................................... 错误!未定义书签。Abstract ................................. 错误!未定义书签。目录..................................................... I 前言.. (1) 1 方案介绍及设计简介 (2) 1.1小车的控制要求及设计方案 (2) 1.1.1小车的控制要求 (2) 1.1.2方案设计与论证 (2) 1.2SPCE061A 简介 (3) 1.2.1SPCE061A单片机概述 (5) 1.2.2SPCE061A的介绍 (7) 1.2.3SPCE061A的结构 (7) 1.3SPCE061A 单片机强大的语音功能 (7) 1.3.1语音识别的原理 (8) 1.3.2系统的结构框图 (9) 1.4语音控制小车设计要求 (10) 1.4.1功能要求 (10) 1.4.2语音控制小车的主要功能 (10) 1.4.3参数说明 (10) 1.4.4注意事项 (10) 2电路设计及程序设计 (11) 2.1电路设计基础知识 (11) 2.2电路方框图及说明 (13) 2.3各部分电路设计 (13) 2.3.1电机的选择 (14)

2.3.2继电器驱动电路的设计 (14) 2.3.3行驶状态控制电路设计 (15) 2.3.4麦克录音输入及AGC电路 (16) 2.3.5语音播报电路 (18) 3软件设计 (19) 3.1软件流程图及设计思路说明 (19) 3.1.1程序设计 (20) 3.2模块设计 (20) 3.2.1中断流程图部分 (20) 3.2.2语音识别部分 (22) 4连接和操作说明 (25) 4.1硬件模块连接图 (25) 4.1.1功能说明 (25) 4.1.2代码下载 (26) 4.1.3训练小车 (27) 4.1.4声控小车 (28) 4.1.5重新训练 (28) 总结 (30) 致谢 (31) 参考文献 (32) 附件1 系统程序说明 (33)

语音识别系统调研报告

语音识别系统调研报告 姓名:罗小嘉学号:2801305018 1、摘要:本文简要的介绍了语音识别系统的原理,发展和在各个方面的应用前景。 2、关键词:语音识别;应用 3、引言:语音识别主要是指用机器在各种情况下,根据信息执行人的各种意图,有效地了解、识别语音和其它声音。它是近十几年来发展起来的具有理论价值和实用价值的新兴学科:从计算机大学科角度看,可视为智能计算机的智能接口;从信息处理学科来看,可视为信息识别的一个重要分支;从自动控制学科来看,又可视为模式识别的一个重要组成部分. 早在18 世纪,人们就对语音学进行了科学研究,但由于各种条件的限制,语音识别仅在计算机技术迅速发展之后,才成为一个非常活跃的研究领域. 60 年代末期,面对语音识别的种种困难,人们开始研究特定人、孤立词、小词汇量的识别,从而使语音识别的问题能够在当时的条件下得以开展;70年代后期,特定人、孤立词、小词汇量的语音识别取得较为满意的效果,语音识别的研究则沿着特定人向非特定人、孤立词向连续词、小词汇量向大词汇量方向扩展研究领域和目标;80 年代中期以来,计算机技术、信息技术及模式识别等技术的迅猛发展,极大地促进了语音识别技术的发展. 4、正文:语音识别系统要求能够实现实时语音识别。该语音识别系统的关键技术主要是语言实时识别技术、语音端点检测与声韵分割。如图: 对于语音端点检测与声韵分割的问题,从背景噪声中找出语音的开始和终止,这在语音处理中是很基本的问题,因为准确的端点检测,不仅可以提高识别精度,还可以避免计算噪声,减少计算量. 大多数语音处理系统采用过零率和能量两参数作端点检测. 但过零率受噪声影响较大,采用多门限过零率作语音起点检测,将能量信息直接反应在门限中,同时将分析窗长取小,使起点检测比较准确,效果较好. 语音识别技术的应用可以分为两个发展方向:一个方向是大词汇

基于MATLAB的语音信号分析及处理开题报告

基于MATLAB的语音信号分析及处理开题报告毕业设计开题报告 设计题目基于MATLAB的语音信号分析及处理 学生姓名系、专业指导教师选题目的和意义: 语音处理是最早采用数字信号处理技术的领域之一,本世纪50年代提出的语音形成数字模型,被广泛应用于语音编码、语音合成、语音识别、语音增强、说话人确认、语音邮件和语音存储等。因此研究语音信号的数字处理技术,有很大的工程意义,而实现的工程软件是MATLAB。利用MATLAB设计滤波器,可以随时对比设计要求和滤波器特性调整参数,直观简便,极大的减轻了工作量,有利于滤波器设计的最优化。利用MATLAB作为编程工具进行计算机实现,从而加深对所学知识的理解,建立概念。 本课题在国内外的研究状况及发展趋势: 数字处理技术已经成熟,正在获得广泛应用。目前在数字领域和通信领域正在发生一场数字化革命。DSP在其中扮演很重要的角色,它为新体制新算法和新原理提供了最佳的实现条件。 主要研究内容: MATLAB是主要适用于矩阵运算和信息处理领域的分析设计,它使用方便,输入简捷,运算高效,内容丰富,并且很容易由用户自行扩展.MATLAB当前已成为美国和其他发达国家在大学教学和教学研究中最常用而必不可少的工具.传统的数字滤波器的设计过程复杂,计算工作量大,滤波特性调整困难,影响了它的应用。本文介绍了利用MATLAB快速有效的设计由软件组成的常规数字滤波器的设计方法,综合运用数字信号处理的理论知识进行频谱分析和滤波器设计,通过理论推导得到相应结论,给出了使用MATLAB语言进行程序设计并进行界面设计的详细步骤。

实验设计: 录制一段自己的语音信号,并对录制的信号进行采样;画出采样后语音信号的时域波形和频谱图;给定滤波器的性能指标,采用窗函数法或双线性变换设计滤波器,并画出滤波器的频率响应;然后用自己设计的滤波器对采集的语音信号进行滤波,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化;回放语音信号;最后,用 MATLAB 设计一个信号处理系统界面。 完成设计的条件、方法及措施: 声音的导入、采样和频谱分析 采集语音信号利用计算机Windows下的录音机设备,可以采集语音信号并采样,得出数据文件'12.wav'保存在MATLAB的work路径下,在M文件中键入: “x1=wavread('I:\work\12.wav ');”读取语音信号的数据,赋给变量x1。并且播出声音,键入“sound(x1,22050);”。对声音型号进行采样和频谱分析:对信号做1024点FFT变换;然后在对型号做出时域波形图、FFT频谱图。 滤波器的选择和分析 数字滤波器是一种用来过滤时间离散信号的数字系统,通过对抽样数据进行数学处理来达到频域滤波的目的。根据其单位冲激响应函数的时域特性可分为两类:无限冲激响应(IIR)滤波器和有限冲激响应(FIR)滤波器。与FIR滤波器相比,IIR 的实现是非递归的。所以这次设计在MATLAB中设计的就是IIR数字滤波器。因此这次设计采用一个BUTTERWORTH的低通滤波器,并且我们采取双线性变换法来实现。 估算巴特沃思滤波器的阶数N和3dB截止频率Wn。输入参数是通带截止频率Wp,阻带截止频率Ws,通带波纹Rp,阻带波纹Rs。 回放语音信号

语音识别机器人实验报告

开放实验项目报告 项目名称:语音识别机器人 专业 学生姓名 班级学号 指导教师 指导单位 2012/2013学年第一学期 一.设计背景

在科学日新月异的今天,电子设备的便捷化,人性化,智能化已成为不可逆转的潮流,而语音控制智能,更是其中研究发展的热点。凌阳SPCE061以其便捷的操作,可靠的性能,成为了各位电子爱好者的首选。本实验采用凌阳61板和运动小车(迷你型)模组设计的语音控制小车。凌阳板嵌入小车模型顶部。语音处理技术不仅包括语音的录制和播放,还涉及语音的压缩编码和解码、语音的识别等各种处理技术。本设计的语音控制小车,借助于SPCE061A在语音处理方面的特色,不仅具有前进、后退、左转、右转、停止等基本程序控制功能,而且还具备语音控制功能。 二.总流程图

三.主要模块 1、凌阳SPCE061是继μ’nSP?系列产品SPCE500A等之后凌阳科技推出的又一款16 位结构的微控制器。与SPCE500A不同的是,在存储器资源方面考虑到用户的较少资源的需求以及便于程序调试等功能,SPCE061A里只内嵌32K字的闪存(FLASH )。较高的处理速度使μ’nSP?能够非常容易地、快速地处理复杂的数字信号。因此,与SPCE500A相比,以μ’nSP?为核心的SPCE061A 微控制器是适用于数字语音识别应用领域产品的一种最经济的选择。 其性能如下: A、16 位μ’nSP?微处理器; B、工作电压(CPU) VDD 为2.4~3.6V (I/O) VDDH 为2.4~5.5V C、CPU 时钟:0.32MHz~49.152MHz ; D、内置2K 字SRAM; E、内置32K FLASH; F、可编程音频处理; G、晶体振荡器; H、系统处于备用状态下(时钟处于停止状态),耗电仅为2μA@3.6V ; I、2 个16 位可编程定时器/计数器(可自动预置初始计数值); J、2 个10 位DAC(数-模转换)输出通道; K、32 位通用可编程输入/输出端口; L、14 个中断源可来自定时器A / B ,时基,2 个外部时钟源输入,键唤醒;

用单片机实现语音控制机器人

用单片机实现语音控制机器人 制作人:潘磊pb02023035 卢恒pb02006088 题目:用凌阳单片机实现语音识别功能并传递给PIC单片机信号,由PIC单片机控制机器人实现动作 关键字:PIC单片机,凌阳单片机,语音控制 单片机在现今生活中占有越来越重要的地位,用语音控制单片机实现控制更具有 广泛的应用价值。用语音控制舞蹈机器人做一些动作是我们这次实现的功能,虽然这 在语音控制方面仍处于起步阶段,但他体现了语音控制的原理和基本实现,也为更高 级的运用打下了基础。 原理: 1.语音识别原理 语音识别电路基本结构如上图所示:语音识别分为特定发音人识别(Speaker Dependent)和非特定发音人识别(Speaker Independent)两种方式。 特定发音人识别是指语音样板由单个人训练,对训练人的语音命令识别准确率较高,而其他人的语音命令识别准确率较低或不识别。非特定发音人识别:是指语音样板由不同年龄、不同性别、不同口音的人进行训练,可以识别一群人的命令。语音样板的提取非常重要。我们将标准模式的存储空间称之为“词库”,而把标准模式称之为“词条”或“样板”。所谓建立词库,就是将待识别的命令进行频谱分析,提取特征参数作为识别的标准模式。 识别过程首先要滤除输入语音信号的噪音和进行预加重处理,提升高频分量,然后用线性预测系数等方法进行频谱分析,找出语音的特征参数作为未知模式,接着与预先存储的标准模式进行比较,当输入的未知模式与标准模式的特征相一致时,便被机器识别,产生识别结果输出。如果输入的语音与标准模式的特征完全一致固然好,但是语音含有不确定因素,完全一致的条件往往不存在,事实上没有人能以绝对相同的语调把一个词说两遍,因此,预先制定好计算输入语音的特征模式与各特征模式的类似程度,或距离度的算法规则固化在ROM

文字识别开题报告

太原理工大学信息工程学院 本科毕业设计(论文)开题报告 毕业设计(论文)题目 基于边缘检测的文字图像识别 学生姓名导师姓名 专业信息 报告日期 班级07-1 指导教 师意见 签字年月日 专业(教 研室)主 任意见 年月日系主任 意见 年月日

1. 国内外研究现状及课题意义 文字图像信息是人类获取外界信息的主要来源,在近代科学研究、军事技术、工农业生产、医学、气象及天文学等领域中,人们越来越多的利用图像信息来识别和判断事物,解决实际问题。例如:由于空间技术的发展,人造卫星拍摄了大量地面和空间的照片,人们要分析照片,获得地球资源、全球气象和污染情况等;在医学上,医生可以通过X射线分析照像,观察到人体个部位的多次现象;在工厂,技术人员可以利用电视图像管理生产;生活中,交通管理部门也要利用文字图像识别技术确定违章车辆的牌照,对其进行监督管理,由此可见文字图像信息的重要性【1】。 获得文字图像信息非常重要,但更重要的是对文字图像进行处理,从中找到我们所需要的信息,因此在当今科学技术迅速发展的时代,对文字图像的处理技术提出了更高的要求,能够更加快速准确的获得有用信息。 1.1国内外研究现状 20世纪20年代文字图像处理首次得到应用。20世纪60年代中期,电子计算机的发展得到普遍应用,文字图像处理技术也不断完善,逐渐成为一个新兴的科学。从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理技术也向更高、更深的层次迈进。到了20世纪90年代,机器人技术已经成为工业的三大支柱之一,人们已经开始研究如何用计算机系统解释图像,实现类似人类视觉系统来理解外部世界,这被称为图像理解活计算机视觉。很多国家,特别是发达国家投入更多的人力、物力道这项研究,取得了不少重要的研究成果。 数字图像处理主要是为了修改图形,改善图像质量,或是从图像中提取有效信息,还有利用数字图像处理可以对图像进行体积压缩,便于传输和保存。目前,数字图像处理主要应用于通讯技术、宇宙探索遥感技术和生物工程等领域。数字图像处理因易于实现非线性处理,处理程序和处理参数可变,故事一项通用性强,精度高,处理方法灵活,信息保存、传送可靠的图像处理技术。主要用于图像变换、测量、模式识别、模拟以及图像产生。广泛应用在遥感、宇宙观测、影像医学、通信、刑侦及多种工业领域【2】。1.2文字图像识别面临的问题 文字图像识别的发展经历了三个阶段:文字识别、图像处理和识别、物体识别。现在对于文字图像识别技术的研究,还面临几个问题,一是图像数据量大,一般来说,要取得较高的识别精度,原始图像应具有较高的分辨率,至少应大于64×64。二是图像污

基于单片机的智能语音识别系统设计毕业设计论文

基于单片机的智能语音识别系统设计 (硬件部分) 系别: 专业班: 姓名: 学号: 指导教师:

基于单片机的智能语音识别系统设计 (硬件部分) The Design of Intelligent Speech Recognition System Based on Single-chip Computer (HardWare)

摘要 本文设计一个让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术的语音识别系统。本语音识别系统以LD3320语音识别芯片为核心部件,主控MCU选用STC10L08XE。主控MCU通过控制LD3320内部寄存器以及SPI flash实现语音识别和对话。通过麦克风将声音信息输入LD3320进行频谱分析,分析后将提取到的语音特征和关键词语列表中的关键词语进行对比匹配,找出得分最高的关键词语作为识别结果输出给MCU,MCU针对不同的语音输入情况通过继电器对语音命令所对应的电器实现控制。同时也可以通过对寄存器中语音片段的调用,实现人机对话。 设计中,电源模块采用3.3V供电,主要控制及识别部分采用LM1117-3.3稳压芯片,语音播放及继电器部分采用7812为其提供稳定的电流电压。寄存器采用一片华邦SPI flash芯片W25Q40AVSNIG,大小为512Kbyte。系统声音接收模块采用的传感器为一小型麦克风——驻极体话筒,在它接收到声音信号后会产生微弱的电压信号并送给MCU。另外系统还采用单片机产生不同的频率信号驱动蜂鸣器来完成声音提示,此方案能完成声音提示功能,给人以提示的可懂性不高,但在一定程度上能满足要求,而且易于实现,成本也不高。 关键词:语音识别 LD3320 STC10L08XE单片机频谱分析

语音信号处理实验报告11

实验一 语音信号的时域分析 一、 实验目的、要求 (1)掌握语音信号采集的方法 (2)掌握一种语音信号基音周期提取方法 (3)掌握语音信号短时能量和短时过零率计算方法 (4)了解Matlab 的编程方法 二、 实验原理 语音是一时变的、非平稳的随机过程,但由于一段时间内(10-30ms)人的声带和声道形状的相对稳定性,可认为其特征是不变的,因而语音的短时谱具有相对稳定性。在语音分析中可以利用短时谱的这种平稳性,将语音信号分帧。 10~30ms 相对平稳,分析帧长一般为20ms 。 语音信号的分帧是通过可移动的有限长度窗口进行加权的方法来实现的。几种典型的窗函数有:矩形窗、汉明窗、哈宁窗、布莱克曼窗。 语音信号的能量分析是基于语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。定义短时平均能量 [][]∑∑+-=∞-∞=-=-= n N n m m n m n w m x m n w m x E 122)()()()( 下图说明了短时能量序列的计算方法,其中窗口采用的是直角窗。 过零就是信号通过零值。对于连续语音信号,可以考察其时域波形通过时间轴的情况。而对于离散时间信号,如果相邻的取样值改变符号则称为过零。由此可以计算过零数,过零数就是样本改变符号的次数。单位时间内的过零数称为平

均过零数。 语音信号x (n )的短时平均过零数定义为 ()[]()[]()()[]()[]() n w n x n x m n w m x m x Z m n *--=---= ∑∞ -∞=1sgn sgn 1sgn sgn 式中,[]?sgn 是符号函数,即 ()[]()()()()???<-≥=01 01sgn n x n x n x 短时平均过零数可应用于语音信号分析中。发浊音时,尽管声道有若干个共振峰,但由于声门波引起了谱的高频跌落,所以其语音能量约集中干3kHz 以下。而发清音时.多数能量出现在较高频率上。既然高频率意味着高的平均过零数,低频率意味着低的平均过零数,那么可以认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。然而这种高低仅是相对而言,没有精确的数值关系。 短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的

语音识别开题报告

青岛大学 毕业论文(设计)开题报告 题目:孤立词语音识别的并行编程实现 学院:自动化工程学院电子工程系 专业:通信工程 姓名:李洪超 指导教师:庄晓东 2010年 3月22日

一、文献综述 语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。 广泛意义上的语音识别按照任务的不同可以分为4个方向:说话人识别、关键词检出、语言辨识和语音识别[1]。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术,本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一个方向,也是本文讨论的主要内容。 1.1 语音识别技术现状 1.1.1 语音识别获得应用 伴随着语音识别技术的不断发展,诞生了全球首套多语种交谈式语音识别系统E-talk。这是全球惟一拥有中英混合语言的识别系统,能听能讲普通话、广东话和英语,还可以高度适应不同的口音,因而可以广泛适用于不同文化背景的使用者,尤其是中国地区语言差别较大的广大用户。由于E-talk可以大大提高工作效率,降低运营成本,并为用户提供更便捷的增值服务,我们相信它必将成为电信、证券、金融、旅游等重视客户服务的行业争相引用的电子商务应用系统,并成为电子商务发展的新趋势,为整个信息产业带来无限商机。 目前,飞利浦推出的语音识别自然会话平台SpeechPearl和SpeechMania已成功地应用于国内呼叫中心,SpeechPearl中的每个识别引擎可提供高达20万字的超大容量词库,尤其在具有大词汇量、识别准确性和灵活性等要求的各种电信增值服务中有着广泛的应用。 1.1.2 语音合成信息服务被用户接受 语音合成技术把可视的文本信息转化为可听的声音信息,其应用的经济效益和社会效益前景良好。尤其对汉语语音合成技术的应用而言,全球有十几亿人使用中文,其市场需

相关文档
最新文档