语音识别机器人的设计—毕业论文

合集下载

智能语音助手的设计与实现

智能语音助手的设计与实现

智能语音助手的设计与实现在当今信息化社会,智能语音助手已成为人们生活中不可或缺的一部分。

从最初的简单语音识别到如今的智能对话,智能语音助手在前进着。

设计和实现一个高效、人性化的智能语音助手,是技术发展的重要方向之一。

一、智能语音助手的原理及发展历程智能语音助手是基于人工智能技术的产物,它的工作原理主要包括语音识别、自然语言理解和对话管理。

通过对用户输入的语音进行识别和分析,然后将结果转化为文字,并再通过自然语言理解技术对用户意图进行分析,最后根据结果给出相应的回复或操作。

智能语音助手的发展经历了从初始的简单响应到如今的多轮对话,在功能和服务上也越来越丰富。

二、智能语音助手的设计理念设计一个优秀的智能语音助手需要考虑用户体验、功能丰富性和数据安全性等方面。

首先,用户体验至关重要。

智能语音助手的回复应该简洁明了,回答问题要准确全面,而且对用户指令的识别速度也要快。

其次,功能丰富性是衡量一个智能语音助手的重要标准,它应该能够提供多种服务和功能,满足用户不同需求。

最后,数据安全性是设计中必须考虑的问题,用户的隐私信息要得到保护,数据传输要加密处理,避免信息泄露。

三、智能语音助手的实现技术实现一个智能语音助手需要运用多种技术,包括语音处理技术、自然语言处理技术和机器学习技术等。

语音处理技术包括声学模型和语言模型,用于对用户输入的语音信号进行识别和理解。

自然语言处理技术则是对语音转化成的文字进行分析处理,提取其中的信息。

机器学习技术则可以根据大量数据进行学习,不断优化智能语音助手的性能。

四、智能语音助手的应用场景智能语音助手已广泛应用在各个领域,如智能家居、物联网、医疗健康等。

在智能家居中,用户可以通过语音控制家用电器,实现智能化生活。

在物联网领域,智能语音助手可以与各类智能设备进行对接,实现信息的互通和控制。

在医疗健康方面,智能语音助手可以对医患进行交流,提供健康咨询和预约服务,方便患者就医。

五、智能语音助手的未来发展未来,智能语音助手将不断发展,成为智能生活的重要一环。

语音识别 毕业设计

语音识别 毕业设计

语音识别毕业设计语音识别毕业设计一、引言语音识别技术是当今信息领域的热门研究方向之一。

随着人工智能技术的迅猛发展,语音识别系统已经逐渐走入我们的生活,为我们提供了更加便捷和智能的交互方式。

在这个背景下,我选择了语音识别作为我的毕业设计课题,希望能够深入研究这一领域,探索其在实际应用中的潜力和挑战。

二、语音识别的基本原理语音识别是一种将人类语音转化为文字的技术。

其基本原理是通过采集和分析人类语音信号,提取其中的特征信息,然后利用机器学习算法进行模式匹配,最终将语音转化为文本。

语音识别系统的核心是语音信号的特征提取和模式匹配算法。

三、语音识别的应用领域语音识别技术在很多领域都有广泛的应用。

其中最为常见的是语音助手,如苹果的Siri、亚马逊的Alexa等。

这些语音助手能够根据用户的语音指令执行相应的操作,如播放音乐、查询天气等。

此外,语音识别还被应用于语音翻译、语音搜索、语音识别助听器等领域。

四、语音识别的挑战和难点尽管语音识别技术已经取得了很大的进展,但仍然存在一些挑战和难点。

首先,语音信号受到环境噪声的干扰,容易导致识别错误。

其次,不同人的发音习惯和口音差异也会对语音识别的准确性造成影响。

此外,语音识别系统对于长句子的处理和语义理解仍然存在一定的困难。

五、毕业设计的目标和内容在我的毕业设计中,我将致力于设计和实现一个基于深度学习的语音识别系统。

该系统将采用卷积神经网络(CNN)和长短时记忆网络(LSTM)等深度学习算法,以提高语音识别的准确性和鲁棒性。

同时,我还将研究如何解决语音信号的噪声干扰和口音差异等问题,以进一步提升系统的性能。

六、设计方案和实施步骤在设计方案上,我计划采用开源的语音数据集进行训练和测试。

首先,我将对语音信号进行预处理,包括去除噪声、归一化等操作。

然后,我将设计和训练深度学习模型,通过大量的语音数据进行迭代训练,以提高模型的准确性。

最后,我将评估系统的性能,并进行性能优化和调整。

基于Matlab的语音识别系统的设计本科毕业设计

基于Matlab的语音识别系统的设计本科毕业设计

摘要语音识别主要是让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息执行人的各种意图。

语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。

本文基于语音信号产生的数学模型,从时域、频域出发对语音信号进行分析,论述了语音识别的基本理论。

在此基础上讨论了语音识别的五种算法:动态时间伸缩算法(Dynamic Time Warping,DTW)、基于规则的人工智能方法、人工神经网络(Artificial Neural Network,ANN)方法、隐马尔可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。

重点是从理论上研究隐马尔可夫(HMM)模型算法,对经典的HMM模型算法进行改进。

语音识别算法有多种实现方案,本文采取的方法是利用Matlab强大的数学运算能力,实现孤立语音信号的识别。

Matlab 是一款功能强大的数学软件,它附带大量的信号处理工具箱为信号分析研究,特别是文中主要探讨的声波分析研究带来极大便利。

本文应用隐马尔科夫模型(HMM) 为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用Matlab图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统界面友好。

经过统计,识别效果明显达到了预期目标。

关键词:语音识别算法;HMM模型;Matlab;GUIABSTRACTSpeech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of people.Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the time domain,frequency domain proceeding,and discussed the basic theory of speech recognition technology.Five algorithm are discussed:Dynamic Time Warping(DTW)、Rule-based Artificial Intelligence,Artificial Neural Network(ANN),Hidden Markov Model(HMM),HMM combined with ANN.The focus is put in the theoretical studies of Hidden Markov(HMM) model algorithm,and the classical HMM algorithm is improved.Speech recognition algorithm is realized in various programs,this article taking the method is to use Matlab powerful mathematical operation ability to realize the recognition of speech signal isolation. Matlab is a powerful mathematic software with a mass of toolboxes dealing with signal processing. It gives a terrific shortcut to the research of signal processing,especially the wave analysis. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, hidden Markov model (HMM) recognition algorithm using MFCC (MELfrequency cepstral coefficients) as the main voice characteristic parameters, the establishment of a Chinese digital speech recognition system, including the preprocessing of the speech signal,the extraction of characteristic parameters the training of the recognition template,identifying matching algorithm;the same time,the use of Matlab graphical user interface development environment designed speech recognition system interface,is designed to be simple,easy to use,friendly interface. Besides,to have a simple exploration of the voice recognition is another target.After statistics,recognition result obviously is made out as the expected goal.Key words:Speech recognition algorithm;HMM model;Matlab;GUI目录一、前言 (1)1.1语音识别的发展历史 (1)1.2语音识别研究现状 (1)1.3语音识别系统的分类 (2)1.4语音识别系统的基本构成 (3)1.5语音识别技术难点 (3)1.6语音识别发展前景 (4)二、语音信号分析 (4)2.1语音学知识 (4)2.1.1音素和音节 (5)2.1.2汉语的声调 (5)2.1.3语音信号产生模型 (6)2.2语音信号数字化和预处理 (7)2.2.1数字化 (7)2.2.2预加重处理 (7)2.2.3防混叠滤波 (8)2.2.4加窗处理 (8)2.3语音信号的时域分析 (9)2.3.1短时能量分析 (9)2.3.2短时平均过零率 (11)2.3.3短时自相关函数和短时平均幅度差函数 (12)2.3.4语音端点检测 (13)2.4语音信号的频域分析 (14)2.4.1滤波器组法 (14)2.4.2傅立叶频谱分析 (14)2.5特征参数提取 (15)2.5.1 LPCC倒谱系数 (15)2.5.2 Mel频率倒谱系数 (16)三、语音识别主要算法 (17)3.1动态时间伸缩算法 (17)3.2基于规则的人工智能方法 (18)3.3人工神经网络方法 (19)3.4隐马尔可夫方法 (20)3.5 HMM和ANN的混合模型 (21)四、隐含马尔可夫模型算法 (23)4.1 HMM的基本理论和数学描述 (23)4.2 HMM的三个基本问题及解决算法 (24)4.3 HMM算法的改进 (31)4.4 HMM的结构和类型 (33)4.5 HMM算法实现的问题 (34)五、基于Matlab环境下的语音识别算法实现 (35)5.1识别系统平台介绍 (35)5.2在Matlab中HMM算法的实现 (36)5.2.1端点检测 (36)5.2.2特征参数提取 (36)5.2.3训练和识别 (37)5.3实验结论分析 (38)六、结束语 (39)6.1回顾 (39)6.2展望 (39)七、致谢 (40)参考文献 (40)一、前言1.1语音识别的发展历史作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。

基于单片机的智能语音识别系统设计毕业设计论文

基于单片机的智能语音识别系统设计毕业设计论文

基于单片机的智能语音识别系统设计(硬件部分)系别:专业班:姓名:学号:指导教师:基于单片机的智能语音识别系统设计(硬件部分)The Design of Intelligent SpeechRecognition System Based onSingle-chip Computer(HardWare)摘要本文设计一个让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术的语音识别系统。

本语音识别系统以LD3320语音识别芯片为核心部件,主控MCU选用STC10L08XE。

主控MCU通过控制LD3320内部寄存器以及SPI flash实现语音识别和对话。

通过麦克风将声音信息输入LD3320进行频谱分析,分析后将提取到的语音特征和关键词语列表中的关键词语进行对比匹配,找出得分最高的关键词语作为识别结果输出给MCU,MCU针对不同的语音输入情况通过继电器对语音命令所对应的电器实现控制。

同时也可以通过对寄存器中语音片段的调用,实现人机对话。

设计中,电源模块采用3.3V供电,主要控制及识别部分采用LM1117-3.3稳压芯片,语音播放及继电器部分采用7812为其提供稳定的电流电压。

寄存器采用一片华邦SPI flash芯片W25Q40AVSNIG,大小为512Kbyte。

系统声音接收模块采用的传感器为一小型麦克风——驻极体话筒,在它接收到声音信号后会产生微弱的电压信号并送给MCU。

另外系统还采用单片机产生不同的频率信号驱动蜂鸣器来完成声音提示,此方案能完成声音提示功能,给人以提示的可懂性不高,但在一定程度上能满足要求,而且易于实现,成本也不高。

关键词:语音识别 LD3320 STC10L08XE单片机频谱分析AbstractThis paper designs a hi-tech speech recognition system which enables machines to transfer speech signals into corresponding texts or orders by recognizing and comprehending. The centerpiece of the speech recognition system is LD3320 voice recognition chip,its master MCU is STC10L08XE. Master MCU achieve voice conversation by controlling the internal registers and SPI flash LD3320.The sound information is inputted into LD3320 by microphone to do spectrum analysis. After analyzing the voice characteristics extracted are compared and matched with the key words in the list of key words.Then the highest scores of key words found would be output to MCU as recognition results. MCU can control the corresponding electrical real of speech recognition for different voice input through the relays and can also achieve voice conversation through a call to voice clips in register.In the design,power module uses 3.3V.The main control and identification part adopt LM1117-3.3 voltage regulator chip,and 7812 is used to provide stable current and voltage for the part of voice broadcast and relay.Register uses chip SPI flash W25Q40A VSNIG which is 512Kbyte. The sensor used in the speech reception module of the design is microphone,namely electrit microphone.After receiveing the sound signal,it can produce a weak voltage signal which will be sent to MCU. In addition,the system also adopts a different frequency signals generated by microcontroller to drive the buzzer to complete the voice prompt, and this program can complete the voice prompt.The program gives a relatively poor intelligibility Tips.However, to some extent,it can meet the requirements and is easy to implement and the cost is not high.Key words:Speech Recognition LD3320 STC10L08XE Single-chip computer Spectrum Analysis目录摘要 (I)Abstract (II)绪论 (1)1设计方案 (5)1.1 系统设计要求 (5)1.2总体方案设计 (5)2 系统硬件电路设计 (6)2.1电源模块 (6)2.2 寄存器模块 (6)2.3 控制单元模块 (7)2.3.1 STC10L08XE单片机简介 (8)2.3.2 STC11/10xx系列单片机的内部结构 (10)2.4 声音接收器模块 (10)2.5 声光指示模块 (11)2.6 语音识别模块 (11)2.6.1 LD3320芯片简介 (11)2.6.2 功能介绍 (12)2.6.3 应用场景 (13)2.6.4 芯片模式选择 (15)2.6.5 吸收错误识别 (16)2.6.6 口令触发模式 (17)2.6.7 关键词的ID及其设置 (18)2.6.8 反应时间 (18)3 系统软件设计 (20)3.1 系统程序流程图 (20)3.2 系统各模块程序设计 (20)3.2.1 主程序 (20)3.2.2 芯片复位程序 (27)3.2.3 语音识别程序 (28)3.2.4 声音播放程序 (37)4 系统调试 (44)4.1 软件调试 (44)4.1.1 上电调试 (44)4.1.2 读写寄存器调试 (44)4.1.3 检查寄存器初始值 (44)4.2 硬件电路调试 (45)4.2.1 硬件检查 (45)4.2.2 硬件功能检查 (45)4.3 综合调试 (46)结论 (47)致谢 (48)参考文献 (49)附录1实物图片 (50)附录2系统电路图 (51)绪论课题背景及意义让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。

智能语音聊天毕业论文

智能语音聊天毕业论文

智能语音聊天毕业论文智能语音聊天毕业论文摘要随着人工智能技术的快速发展,语音识别和语音合成技术早已成为人工智能领域的重要研究方向。

智能语音聊天作为人工智能技术的一种重要应用之一,具有较高的研究和应用价值。

本文首先介绍了智能语音聊天的研究意义和应用价值,然后对语音识别和语音合成技术的相关研究进行了概述。

接着,本文重点分析了现有智能语音聊天系统的设计与实现,讨论了其存在的问题和局限性,并提出了优化建议和改进方案。

最后,我们对智能语音聊天的发展趋势进行了展望。

关键词:智能语音聊天,语音识别,语音合成,设计与实现,改进方案AbstractWith the rapid development of artificial intelligence technology, voice recognition and synthesis have become an important research direction in the field of artificial intelligence. Intelligent voice chatting, as an important application of artificial intelligence technology, has high research and application value. This paper first introduces the research significance and application value of intelligent voice chatting, and then gives an overview ofthe relevant research on speech recognition and synthesis technology. Next, this paper focuses on the design and implementation of existing intelligent voice chatting systems, discusses their existing problems and limitations, and proposes optimization suggestions and improvement schemes. Finally, we look forward to the development trend of intelligent voice chatting.Keywords: intelligent voice chatting, speech recognition, speech synthesis, design and implementation, improvement scheme一、研究背景和意义随着社交媒体和移动互联网的普及,人们对于语音聊天的需求越来越大。

浅谈语音识别技术论文

浅谈语音识别技术论文

浅谈语音识别技术论文语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务,对任何事都能够通过语音交互的方式。

小编整理了浅谈语音识别技术论文,欢迎阅读!浅谈语音识别技术论文篇一语音识别技术概述作者:刘钰马艳丽董蓓蓓摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的发展前景和应用。

关键词:语音识别;特征提取;模式匹配;模型训练Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to face.Then,the developing prospect ion and application of the speech-identification technology are discussed in the last part.Keywords:Speech identification;Character Pick-up;Mode matching;Model training一、语音识别技术的理论基础语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。

语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。

不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。

机器人的语音识别功能的实现与硬件设计

机器人的语音识别功能的实现与硬件设计

机器人的语音识别功能的实现与硬件设计摘要目前语音识别系统在机器人上的应用逐步得到了扩展,其主要的硬件基础是基于单机芯片的发展和完善。

因此,在机器人语音识别功能时,需要以单机芯片为核心,完善整个硬件系统设计,并以此达到连贯的语音控制。

关键词语音识别;硬件系统;硬件模块;系统设计1 语音智能识别原理概述语音识别是建立在对人类语言的交互与判断上的,这是一种多维度的识别过程,一般可以分为两个阶段,即信息汇集和识别。

具体的识别过程包括了语音信号的前期处理、语音特征提取、建立语音模型库、进行模型的匹配、后期处理等主要的环节。

机器人的语音识别实际上一种仿生式的模式,即将语音转化为一直可以对别的语音特征,然后与储存的信息进行对比,并形成对其含义的判断,人类对语音的含义的判断也是这样的过程,只不过人类使用的是大脑而机器人利用的是数据库和芯片,目前占有主导地位的语音识别技术的技术基础是统计模式的识别理论。

2 机器人语音识别系统的硬件设计2.1 硬件系统的整体构成语音识别的硬件系统中体的构成应当为了两个大系统构成,即发射端和接收端,即利用主要的芯片系统来接收语音信号,并进行计算和识别,然后利用信号输出端口将形成的指令传输给接收端的执行系统,并以此控制机器人的各个电机和肢体部件,来完成整个语音指令的执行。

在这个系统中主要的硬件系统有:微处理器、音频模块、电机驱动模块、避障系统、机器人系统、电源控制模块。

具体的系统构成如图1。

2.2 硬件系统的设计在具有语音识别功能的机器人硬件系设计中应当对前面提到的各种功能模块进行单独的设计和实现,然后利用线路和端口将整个系统连接起来,这样就实现了机器人硬件系统的搭建。

1)电子芯片(微处理器)。

在这里应用的是SPCE061A单机芯片。

这种语音识别的专业芯片来构建机器人的语音识别和控制系统可以实现机器人的自动运行。

这种语音系统的硬件基础就是SPCE061A控制器为核心的语音识别平台。

这种SPCE061A是一种具有语音特色的16位控制器,采用的是模块化的结构,内部集成了在线仿真处理器,闪存、静态内存、通用的端口、定时和计数器、中断控制器、通道转换器、电压监控等模块。

基于人工智能的智能语音助手设计

基于人工智能的智能语音助手设计

基于人工智能的智能语音助手设计在当今科技飞速发展的时代,智能语音助手已经逐渐成为我们生活中不可或缺的一部分。

从智能手机中的语音助手,到智能家居设备的语音控制,智能语音助手正在以各种形式为我们提供便捷的服务。

那么,如何设计一款出色的基于人工智能的智能语音助手呢?首先,我们需要明确智能语音助手的核心功能。

它的主要任务是能够准确理解用户的语音指令,并以高效、准确的方式给予回应。

这就要求它具备强大的语音识别技术和自然语言处理能力。

语音识别是智能语音助手的第一步。

它需要将用户说出的语音准确地转换为文字。

为了实现这一目标,需要建立庞大的语音数据库,涵盖各种口音、语速和语调。

同时,利用深度学习算法不断优化识别模型,提高识别的准确率。

而自然语言处理则是理解用户意图的关键。

这需要对语言的语法、语义和语用有深入的理解。

通过词法分析、句法分析和语义理解等技术,智能语音助手能够解析用户的话语,提取关键信息,并理解其真正的需求。

在设计智能语音助手时,交互设计也是至关重要的一环。

一个好的交互体验能够让用户感到舒适和便捷。

例如,智能语音助手的回应速度要快,不能让用户等待过长时间。

回应的语气和表达方式也要自然、亲切,仿佛在与朋友交流。

为了实现更加个性化的服务,智能语音助手还应该具备学习能力。

它能够根据用户的使用习惯和偏好,提供个性化的建议和服务。

比如,如果用户经常查询某一类信息,智能语音助手可以主动推送相关的内容。

在技术实现方面,硬件的支持也不能忽视。

高质量的麦克风和扬声器能够保证清晰的语音输入和输出。

同时,强大的计算能力也是快速处理语音数据的保障。

此外,智能语音助手的应用场景也在不断拓展。

在家庭中,它可以控制家电设备、查询天气、播放音乐等;在工作中,它可以协助处理邮件、安排日程、进行会议记录等;在出行中,它可以提供导航服务、查询路况等。

然而,智能语音助手的发展也面临一些挑战。

比如,在嘈杂的环境中,语音识别的准确率可能会下降。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

毕业论文(设计)题目语音识别机器人的设计系部电子信息工程专业电子信息工程年级 06级学生姓名学号指导教师语音识别机器人的设计【摘要】语音识别可划分为训练和识别两个过程。

在第一阶段,语音识别系统对人类的语言进行学习,把学习内容组成语音库存储起来,在第二阶段就可以把当前输入的语音在语音库中查找相应的词义或语义。

凌阳16位SPCE061A单片机内嵌32K字闪存,2K字SRAM,内置10位ADC、DAC,有多达14个的中断源。

它的CPU内核采用16位具有DSP功能的微处理器芯片, 而且CPU可最高工作在49MHz的主频下,能够非常容易地、快速地处理复杂的数字信号,因此与其他类型的单片机相比,在数字语音处理方面SPCE061A更具有优势。

基于SPCE061A设计了一个具有语音识别功能的机器人。

经过训练,训练人可使用各种命令让机器人完成许多有趣的动作,使得人机交互更具智能化。

【关键词】SPCE061A单片机语音识别机器人The Design of the Speech Recognition Robot【Abstract】The speech recognition is divided into two stages, namely, training and recognition. At the first stage, the speech recognition system learns about the language and stores what it a speech database. Then at the next stage, the meaning of each inputted speech can immediately be found in the speech database.Sunplus 16-bit SPCE061ASCM is embedded with 32K word Flash and 2K word SRAM, with built-in 10-bit ADC and DAC as well as more than 14 interrupt sources. The core of its CPU is a 16-bit microprocessor chip which of DSP. Besides, the CPU can work with a frequency up to 49 MHz, and process complex digital signals easily and quickly. Therefore, compared with other types of SCM, SPCE061A speech processing. Based on SPCE061A, a speech recognition robot designed. After training, the robot can complete many interesting actions according to the orders, which makes the -computer interaction more intelligent.【Key words】SPCE061A SCM Speech Recognition Robot目录绪论 (1)1 SPCE061A单片机 (1)1.1 SPCE061A简介 (1)1.2 芯片特性 (1)1.3 SPCE061A精简开发板 (2)2 所用语音算法 (2)2.1语音识别算法 (2)2.1.1 语音识别概述 (2)2.1.2 语音识别原理 (2)2.1.3 SPCE061A实现语音识别的步骤 (3)2.2 凌阳音频概述 (4)2.2.1音频压缩编码 (4)2.2.2 凌阳语音的播放、录制、合成和辨识 (5)2.2.3 常用的应用程序接口API的功能及应用 (5)3 系统总体设计方案 (8)4 系统的硬件设计 (9)4.1 SPCE061A最小系统 (9)4.2 SPCE061A的时钟 (10)4.2.1 时钟电路 (10)4.2.2 锁相环 (10)4.2.3 系统时钟 (11)4.3 电源模块 (13)4.4 语音录放 (13)4.4.1 录音 (13)4.4.2 放音 (14)4.5 机器人硬件驱动电路 (14)5 系统软件设计 (15)5.1 擦除FLASH模块 (16)5.2 位操作模块 (17)5.3 语音播放函数 (17)参考文献 (20)附录 (21)致谢 (22)绪论目前制造业市场上,工业机器人具有相当大的市场潜力,要使工业机器人真正应用于生产线上的各个方面,满足人们日益增长的需求,就离不开高性能的语音识别控制系统。

随着计算机软硬件技术、半导体技术、电子技术、通讯技术等的飞速发展人类已经进入后PC时代。

语音识别技术得到了迅猛发展, 支持语音识别的各种产品纷纷面世。

人类实现了语音命令控制空调、电视、灯光、自动窗帘等的使用,让人们的生活“随音所欲”,更加舒适,更加便捷。

基于凌阳16位SPCE061A单片机设计了一个具有语音识别功能的机器人。

在经过训练后使机器人对训练人的命令做出应答,完成跳两首舞曲、走步、转向、转头、发射飞盘等动作。

1 SPCE061A单片机本系统采用凌阳16位SPCE061A单片机作为控制中心,对输入的语音指令进行识别和处理,从而驱动机器人不同部位的直流电机,做出前进、后退、左传、右转等不同动作。

1.1 SPCE061A简介SPCE061A是凌阳科技研发生产的性价比很高的一款16位单片机,使用它可以非常方便灵活的实现语音的录放系统,该芯片拥有八路10位精度的ADC,其中一路为音频转换通道,并且内置有自动增益电路,用于录音。

两路10精度DAC,只需外接功放(SPY0030A)即可完成放音。

凌阳16位单片机所拥的一套指令系统和集成开发环境具有易学易用、效率高等特点。

在集成开发环境中,支持标准C语言编程,并可以实现C语言与凌阳汇编语言的相互调用,语音的录放只需调用相应的库函数就可实现。

SPCE061A片内还集成了一个ICE(在线仿真电路)接口,使得对芯片的编程和仿真变得非常方便,而且ICE接口不占用芯片上的硬件资源,结合凌阳科技提供的集成开发环境(unSP IDE)可以对芯片进行仿真;而程序的下载(烧写)也是通过该接口进行下载。

1.2 芯片特性SPCE061A 性能简介[1]:(1) 16位微处理器(2)工作电压(CPU)VDD 为3.0~3.6V,(IO)VDDH 为3.0~5.5V(3) CPU 时钟:0.32~49.152MHz(4)内置2K字SRAM(5)内置32K字FLASH(6)可编程音频处理(7)晶体振荡器(8)系统处于备用状态下(时钟处于停止状态),耗电仅为2uA3.6V(9) 2个16 位可编程定时器计数器(可自动预置初始计数值)(10) 2个10 位 DAC(数模转换)输出通道(11) 32位通用可编程输入输出通道(12) 14个中断源可来自定时器 AB、时基、2个外部时钟源输入和键唤醒(13)具备键唤醒的功能(14)使用凌阳音频编码SACM_S480可以播放压缩的语音资源(15)锁相环PLL振荡器提供系统时钟信号(16) 32768Hz实时时钟(17) 7通道10位电压模数转换器(ADC)和单通道声音模数转换器(18)声音模数转换器输入通道内置麦克风放大器,并具有自动增益控制(AGC)功能(19)具备串行设备接口(SIO)(20)具备低电压复位(LVR)功能和低电压检测(LVD)功能(21)内置ICE(在线仿真电路)接口(22)具有 WatchDog 功能1.3 SPCE061A精简开发板SPCE061A精简开发板(简称61板),是以凌阳16位SPCE061A单片机为核心的精简开发、仿真实验板。

61板除了具备单片机最小系统电路外,还包括电源电路、音频电路(含MIC输入部分和DAC音频输出部分)、复位电路等。

61板上有调试器接口(Probe接口)以及下载线接口(EZ_Probe接口),分别可接凌阳科技的在线调试器、简易下载器。

实现程序的下载、在线仿真调试只需配合unSP IDE 使用。

2 所用语音算法2.1语音识别算法2.1.1 语音识别概述根据对说话人的依赖程度,分为:(1)特定人语音识别(SD):只能辨认特定使用者的语音,训练→使用。

(2)非特定人语音识别(SI):可辨认任何人的语音,无须训练。

根据对说话方式的要求,分为:(1)孤立词识别:每次只能识别单个词汇。

(2)连续语音识别:用者以正常语速说话,即可识别其中的语句。

2.1.2 语音识别原理特征提取,抽取反应语音本质的特征参数,形成特征矢量序列。

语音模型库,从一个或多个讲话者多次重复讲话中提取的语音参数模板。

匹配检测,把输入语音的特征参数与语音模型库进行比较分析,得到识别结果。

语音识别原理参看图 2-1,如下:图 2-1 语音识别原理2.1.3 SPCE061A实现语音识别的步骤SPCE061A实现语音识别的步骤,分为训练部分与识别部分,以及在训练、识别过程中中断的情况,参看图 2-2,如下:图 2-2 SPCE061A实现语音识别2.2 凌阳音频概述我们所说的音频是指频率在20Hz~20KHz的声音信号,分为:波形声音、语音和音乐三种,其中波形声音就是自然界中所有的声音,是声音数字化的基础。

语音也可以表示为波形声音,但波形声音表示不出语言、语音学的内涵。

语音是对讲话声音的一次抽象,是语言的载体,是人类社会特有的一种信息系统,是社会交际工具的符号。

音乐与语音相对更规范一些,是符号化了的声音。

但音乐不能对所有的声音进行符号化。

为了让数字计算机更加便利处理音频信号,需要将模拟的(连续的)声音波形数字化(离散化),该过程主要包括采样和量化两个方面。

数字音频的质量取决于:采样频率和量化位数这两个重要参数。

此外,声道的数目、相应的音频设备也是影响音频质量的原因。

语音处理技术是建立在语言学和数字信号处理基础之上的综合学科,其过程大致可以分为AD采样输入、编码处理、存储、解码处理和DA等。

如今,要实现语音处理有多种渠道,可以选用专用语音芯片也可以选用单片机,二者区别参看表 2·1,如下:表 2·1 语音处理器件性能对照表[2]SPCE061A单片机具有八路10位ADC和两路10位DAC,两个16位可编程定时器计数器,内置MIC放大器和自动增益控制(AGC)电路,CPU时钟主频最高达49MHz且具有DSP 功能,有能力执行复杂压缩算法。

相关文档
最新文档