模式识别结课论文

合集下载

模式识别人工智能论文

模式识别人工智能论文

模式识别人工智能论文
本文研究的是基于模式识别的人工智能,旨在分析模式识别技术如何帮助实现人工智能。

它介绍了模式识别的基本概念,以及它在人工智能中的作用。

在模式识别技术的基础上,它给出了一些实际应用的示例,例如文本分析,图像识别和语音识别。

此外,它还探讨了模式识别在人工智能中的潜在挑战,并给出了解决方法。

首先,本文简单介绍了模式识别的基本概念。

模式识别是机器学习和人工智能的重要分支,它旨在分析数据,对输入数据进行有意义的分析,以确定它们的关系和结构。

它是人工智能中非常重要的一个技术,可以帮助机器学会从数据中提取特征,并建立模型来预测可能发生的结果。

其次,本文介绍了模式识别在人工智能中的作用。

它可以用来开发机器学习和计算机视觉系统,这些系统可以用于自动识别和分析文本,图像和视频等信息。

例如,使用模式识别技术,可以开发文本分析系统,该系统可以自动分析文本,从中提取有用的信息,从而节省人力。

此外,它还可以用来开发图像识别系统,可以快速识别不同类型的图片,比如动物、植物、自然场景等,并返回分析结果。

模式识别大作业

模式识别大作业

模式识别大作业引言:转眼之间,研一就结束了。

这学期的模式识别课也接近了尾声。

我本科是机械专业,编程和算法的理解能力比较薄弱。

所以虽然这学期老师上课上的很精彩,但是这学期的模式识别课上的感觉还是有点吃力。

不过这学期也加强了编程的练习。

这次的作业花了很久的时间,因为平时自己的方向是主要是图像降噪,自己在看这一块图像降噪论文的时候感觉和模式识别的方向结合的比较少。

我看了这方面的模式识别和图像降噪结合的论文,发现也比较少。

在思考的过程中,我想到了聚类的方法。

包括K均值和C均值等等。

因为之前学过K均值,于是就选择了K均值的聚类方法。

然后用到了均值滤波和自适应滤波进行处理。

正文:k-means聚类算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。

一般都采用均方差作为标准测度函数。

k-means 算法接受输入量k ;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。

聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。

k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。

均值滤波是常用的非线性滤波方法 ,也是图像处理技术中最常用的预处理技术。

它在平滑脉冲噪声方面非常有效,同时它可以保护图像尖锐的边缘。

均值滤波是典型的线性滤波算法,它是指在图像上对目标像素给一个模板,该模板包括了其周围的临近像素(以目标象素为中心的周围8个象素,构成一个滤波模板,即去掉目标象素本身)。

再用模板中的全体像素的平均值来代替原来像素值。

即对待处理的当前像素点(x,y),选择一个模板,该模板由其近邻的若干像素组成,求模板中所有像素的均值,再把该均值赋予当前像素点(x,y),作为处理后图像在该点上的灰度个g(x,y),即个g(x,y)=1/m ∑f(x,y)m为该模板中包含当前像素在内的像素总个数。

时间序列分析中模式识别方法的应用-模式识别论文

时间序列分析中模式识别方法的应用-模式识别论文

时间序列分析中模式识别方法的应用摘要:时间序列通常是按时间顺序排列的一系列被观测数据,其观测值按固定的时间间隔采样。

时间序列分析(Time Series Analysis)是一种动态数据处理的统计方法,就是充分利用现有的方法对时间序列进行处理,挖掘出对解决和研究问题有用的信息量。

经典时间序列分析在建模、预测等方面已经有了相当多的成果,但是由于实际应用中时间序列具有不规则、混沌等非线性特征,使得预测系统未来的全部行为几乎不可能,对系统行为的准确预测效果也难以令人满意,很难对系统建立理想的随机模型。

神经网络、遗传算法和小波变换等模式识别技术使得人们能够对非平稳时间序列进行有效的分析处理,可以对一些非线性系统的行为作出预测,这在一定程度上弥补了随机时序分析技术的不足。

【1】本文主要是对时间序列分析几种常见方法的描述和分析,并重点介绍神经网络、遗传算法和小波变换等模式识别方法在时间序列分析中的典型应用。

关键字:时间序列分析模式识别应用1 概述1.1 本文主要研究目的和意义时间序列分析是概率论与数理统计学科的一个分支,它是以概率统计学作为理论基础来分析随机数据序列(或称动态数据序列),并对其建立数学模型,即对模型定阶、进行参数估计,以及进一步应用于预测、自适应控制、最佳滤波等诸多方面。

由于一元时间序列分析与预测在现代信号处理、经济、农业等领域占有重要的地位,因此,有关的新算法、新理论和新的研究方法层出不穷。

目前,结合各种人工智能方法的时序分析模型的研究也在不断的深入。

时间序列分析已是一个发展得相当成熟的学科,已有一整套分析理论和分析工具。

传统的时间序列分析技术着重研究具有随机性的动态数据,从中获取所蕴含的关于生成时间序列的系统演化规律。

研究方法着重于全局模型的构造,主要应用于对系统行为的预测与控制。

时间序列分析主要用于以下几个方面:a 系统描述:根据观测得到的时间序列数据,用曲线拟合的方法对系统进行客观的描述;b 系统分析:当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理;c 未来预测:一般用数学模型拟合时间序列,预测该时间序列未来值;d 决策和控制:根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到偏离目标时便可进行控制。

模式识别人工智能论文【范本模板】

模式识别人工智能论文【范本模板】

浅谈人工智能与模式识别的应用一、引言随着计算机应用范围不断的拓宽,我们对于计算机具有更加有效的感知“能力”,诸如对声音、文字、图像、温度以及震动等外界信息,这样就可以依靠计算机来对人类的生存环境进行数字化改造.但是从一般的意义上来讲,当前的计算机都无法直接感知这些信息,而只能通过人在键盘、鼠标等外设上的操作才能感知外部信息。

虽然摄像仪、图文扫描仪和话筒等相关设备已经部分的解决了非电信号的转换问题,但是仍然存在着识别技术不高,不能确保计算机真正的感知所采录的究竟是什么信息。

这直接使得计算机对外部世界的感知能力低下,成为计算机应用发展的瓶颈。

这时,能够提高计算机外部感知能力的学科—-模式识别应运而生,并得到了快速的发展,同时也成为了未来电子信息产业发展的必然趋势。

人工智能中所提到的模式识别是指采用计算机来代替人类或者是帮助人类来感知外部信息,可以说是一种对人类感知能力的一种仿真模拟。

近年来电子产品中也加入了诸多此类的功能:如手机中的指纹识别解锁功能;眼球识别解锁技术;手势拍照功能亦或是机场先进的人耳识别技术等等.这些功能看起来纷繁复杂,但如果需要一个概括的话,可以说这都是模式识别技术给现代生活带来的福分.它探讨的是计算机模式识别系统的建立,通过计算机系统来模拟人类感官对外界信息的识别和感知,从而将非电信号转化为计算机可以识别的电信号.二、人工智能和模式识别(一)人工智能。

人工智能(Artificial Intelligence),是相对与人的自然智能而言的,它是指采用人工的方法及技术,对人工智能进行模仿、延伸及扩展,进而实现“机器思维"式的人工智能.简而言之,人工智能是一门研究具有智能行为的计算模型,其最终的目的在于建立一个具有感知、推理、学习和联想,甚至是决策能力的计算机系统,快速的解决一些需要专业人才能解决的问题。

从本质上来讲,人工智能是一种对人类思维及信息处理过程的模拟和仿真。

(二)模式识别。

模式识别试验(基于Fisher准则线性分类器设计)

模式识别试验(基于Fisher准则线性分类器设计)

模式识别实验(三)一、实验名称基于Fisher准则线性分类器设计二、实验目的:本实验旨在让同学进一步了解分类器的设计概念,能够根据自己的设计对线性分类器有更深刻地认识,理解Fisher准则方法确定最佳线性分界面方法的原理,以及Lagrange乘子求解的原理。

三、实验原理:线性判别函数的一般形式可表示成其中根据Fisher选择投影方向W的原则,即使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,用以评价投影方向W的函数为:上面的公式是使用Fisher准则求最佳法线向量的解,该式比较重要。

另外,该式这种形式的运算,我们称为线性变换,其中(m1-m2)式一个向量,Sw-1是Sw的逆矩阵,如(m1-m2)是d维,Sw和Sw-1都是d×d维,得到的也是一个d维的向量。

向量就是使Fisher准则函数达极大值的解,也就是按Fisher准则将d维X 空间投影到一维Y空间的最佳投影方向,该向量的各分量值是对原d维特征向量求加权和的权值。

以上讨论了线性判别函数加权向量W 的确定方法,并讨论了使Fisher 准则函数极大的d 维向量 的计算方法,但是判别函数中的另一项w0尚未确定,一般可采用以下几种方法确定w0如或者或当与已知时可用……当W 0确定之后,则可按以下规则分类,使用Fisher 准则方法确定最佳线性分界面的方法是一个著名的方法,尽管提出该方法的时间比较早,仍见有人使用。

四、实验内容:已知有两类数据1ω和2ω二者的概率已知=0.6,=0.4。

1ω中数据点的坐标对应一一如下:数据:x =0.2331 1.5207 0.6499 0.7757 1.0524 1.19740.2908 0.2518 0.6682 0.5622 0.9023 0.1333-0.5431 0.9407 -0.2126 0.0507 -0.0810 0.73150.3345 1.0650 -0.0247 0.1043 0.3122 0.6655 0.5838 1.1653 1.2653 0.8137 -0.3399 0.5152 0.7226 -0.2015 0.4070 -0.1717 -1.0573 -0.2099 y =2.3385 2.1946 1.6730 1.6365 1.7844 2.0155 2.0681 2.1213 2.4797 1.5118 1.9692 1.83401.87042.2948 1.7714 2.3939 1.5648 1.93292.2027 2.4568 1.7523 1.6991 2.4883 1.7259 2.0466 2.0226 2.3757 1.7987 2.0828 2.0798 1.9449 2.3801 2.2373 2.1614 1.9235 2.2604 z =0.5338 0.8514 1.0831 0.4164 1.1176 0.55360.6071 0.4439 0.4928 0.5901 1.0927 1.07561.0072 0.4272 0.4353 0.9869 0.4841 1.0992 1.0299 0.7127 1.0124 0.4576 0.8544 1.1275 0.7705 0.4129 1.0085 0.7676 0.8418 0.8784 0.9751 0.7840 0.4158 1.0315 0.7533 0.9548 数据点的对应的三维坐标为2x2 =1.4010 1.23012.0814 1.1655 1.3740 1.1829 1.7632 1.9739 2.4152 2.5890 2.8472 1.9539 1.2500 1.2864 1.2614 2.0071 2.1831 1.79091.3322 1.1466 1.7087 1.59202.9353 1.46642.9313 1.8349 1.8340 2.5096 2.7198 2.3148 2.0353 2.6030 1.2327 2.1465 1.5673 2.9414y2 =1.0298 0.9611 0.9154 1.4901 0.8200 0.93991.1405 1.0678 0.8050 1.2889 1.4601 1.43340.7091 1.2942 1.3744 0.9387 1.2266 1.18330.8798 0.5592 0.5150 0.9983 0.9120 0.71261.2833 1.1029 1.2680 0.7140 1.2446 1.33921.1808 0.5503 1.4708 1.1435 0.7679 1.1288z2 =0.6210 1.3656 0.5498 0.6708 0.8932 1.43420.9508 0.7324 0.5784 1.4943 1.0915 0.76441.2159 1.3049 1.1408 0.9398 0.6197 0.66031.3928 1.4084 0.6909 0.8400 0.5381 1.37290.7731 0.7319 1.3439 0.8142 0.9586 0.73790.7548 0.7393 0.6739 0.8651 1.3699 1.1458数据的样本点分布如下图:0.511.522.5五、实验要求:1. 可以选择二维的数据,或者选择三维的数据作为样本。

神经网络论文

神经网络论文

人工智能专题报告题目模式识别及人工神经网络概述姓名专业学号学院电脑科学与技术学院内容摘要:模式识别是一项极具研究价值的课题,随着神经网络和模糊逻辑技术的发展,人们对这一问题的研究又采用了许多新的方法和手段,也使得这一古老的课题焕发出新的生命力.目前国际上有相当多的学者在研究这一课题,它包括了模式识别领域中所有典型的问题:数据的采集、处理及选择、输入样本表达的选择、模式识别分类器的选择以及用样本集对识别器的有指导的训练。

人工神经网络为数字识别提供了新的手段。

正是神经网络所具有的这种自组织自学习能力、推广能力、非线性和运算高度并行的能力使得模式识别成为目前神经网络最为成功的应用领域。

关键词:模式识别,神经网络,人工智能,原理,应用Abstract:Pattern recognition is an extremely valuable project research, with neural network and fuzzy logic technology development, people on this subject, and adopted many new methods and means, also make the ancient subject coruscate gives new vitality. Current international has quite a number of scholars in the study of this topic, and it includes pattern recognition field of typical problems: the data acquisition, processing and selection, input data express choice, the choice of mode identification classifier and using samples of the reader has guidance training. Artificial neural network for digital recognition to provide a new way. It is neural network which has this kind of self-organization self-learning capability, generalization, nonlinear and computing highly parallel ability makes the pattern recognition become the neural network was the most successful application fields.引言具体的模式识别是多种多样的,如果从识别的基本方法上划分,传统的模式识别大体分为统计模式识别和句法模式识别,在识别系统中引入神经网络是一种近年来发展起来的新的模式识别方法。

模式识别人工智能论文

模式识别人工智能论文

模式识别人工智能论文
模式识别是计算机视觉(CV)领域中重要的研究内容,也是人工智能(AI)领域中关键技术之一、模式识别通过分析不同类型的数据,识别出
其中的模式,以便对输入的特征或材料进行分类和分析。

它被用于更广泛
的计算机视觉应用,如图像分割,图像检索,图像检测,图像建模,图像
深度学习,机器视觉,以及计算机自动控制等应用。

目前,深度学习技术在模式识别领域取得了重大进展。

深度学习模型
具有有效的表示学习能力,可以从大量复杂数据中学习特征,从而更加准
确地预测和分析出数据中的模式。

例如,深度学习模型可以用于图像识别,通过训练模型来学习图像中各个对象的特征,从而可以准确地识别和分类
图像中的对象。

另外,语音识别也可以借助深度学习模型,根据不同语音
的特征,识别出不同的语音。

此外,深度学习模型可以用于识别和分析文本,可以分析文本中的主题,情感,语义等信息。

随着计算机视觉和人工智能的快速发展,模式识别技术也在不断地演
进和创新,提高了视觉计算和人工智能的性能。

模式识别论文--结束版本

模式识别论文--结束版本

1判别函数分类器的设计与实现1 判别函数分类器1.1 判别函数概念直接用来对模式进行分类的准则函数。

若分属于ω1,ω2的两类模式可用一方程d (X ) =0来划分,那么称d (X ) 为判别函数,或称判决函数、决策函数。

如,一个二维的两类判别问题,模式分布如图示,这些分属于ω1,ω2两类的模式可用一直线方程 d (X )=0来划分。

0)(32211=++=w x w x w d X 式中: 21,x x 为坐标变量。

图1-1 两类二维模式的分布将某一未知模式 X 代入: 32211)(w x w x w d ++=X 若0)(>X d ,则1ω∈X 类; 若0)(<X d ,则2ω∈X 类;若0)(=X d ,则21ωω∈∈X X 或或拒绝 维数=3时:判别边界为一平面。

2x 1x2维数>3时:判别边界为一超平面。

1.2 判别函数正负值的确定判别界面的正负侧,是在训练判别函数的权值时确定的。

图1-2 判别函数正负的确定d (X ) 表示的是一种分类的标准,它可以是1、2、3维的,也可以是更高维的。

1.3 确定判别函数的两个因素1)判决函数d (X )的几何性质。

它可以是线性的或非线性的函数,维数在特征提取时已经确定。

已知三维线性分类 —— 判决函数的性质就确定了判决函数的形式:4332211)(w x w x w x w d +++=X非线性判决函数,其示意图如下图所示1x 03图1-3 非线性判决函数图示2)判决函数d (X )的系数,由所给模式样本确定的。

2感知器算法设计与实现对一种分类学习机模型的称呼,属于有关机器学习的仿生学领域中的问题,由于无法实现非线性分类而下马。

但“赏罚概念( reward-punishment concept )” 得到广泛应用。

2.1 感器算法原理及特点2.1.1 感知器算法原理两类线性可分的模式类 21,ωω,设X W X d T)(=其中,[]T 121,,,,+=n n w w w w W ,[]T211,,,,n x x x =X 应具有性质(2-1)对样本进行规范化处理,即ω2类样本全部乘以(-1),则有:2)-(2 0)(T>=X W X d ⎩⎨⎧∈<∈>=21T,0,0)(ωωX X X W X 若若d2x1x2x 1x4感知器算法通过对已知类别的训练样本集的学习,寻找一个满足上式的权向量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

模式识别论文
题目基于Matlab 的语音识别系统
Title: the voice recognition system based on matlab
摘要
语音是人的自然属性之一,是人类信息交流的基本手段。

语音中包含有多种信息,如语义信息、语言信息、说话人信息、情感信息等。

语音识别就是从语音信号中识别出这些信息。

按照任务的不同,语音识别可以分为四个方面:说话人识别、语种识别、关键词识别和连续语音识别。

语音识别是以声音作为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。

语音识别作为一门兼具理论价值与应用价值的研究课题,得到越来越多研究者的兴趣和关注,各种各样的语音识别方法层出不穷。

本次课程论文通过分析MFCC系数和语音识别的基本原理,应用Matlab 设计实验程序并结合VQ矢量量化模型完成语音识别的VQ实现。

本次课程论文通过语音识别的相关的背景、步骤以及原理,设计了一个mat lab语音识别实验,并包含了实验的流程和结果。

关键词:语音识别;Matlab;模式识别
一、引言:近年来,语音识别作为一门兼具理论价值与应用价值的研究课题,得到越来越多研究者的兴趣和关注,各种各样的语音识别方法层出不穷。

本次课程论文通过语音识别的基本原理,应用Matlab 设计实验程序。

语音识别是以声音作为研究对象它是语音信号处理的一个重要研究方向,是模式识别的一个分支涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。

二、.原理分析
1 语音识别系统的特征提取
语音识别系统中的特征提取即提出适合分类的某些信息特征(如说话人,或语言特征,或关键词特征),次特征应能有效地区分不同的模式,而且对同种方式的变化保持相对稳定。

目前的语音识别系统主要依靠较低层次的声学特征进行识
别。

语音识别特征大致可以分为3类:
(1)线性预测系数及其派生参数,如线性预测系数、线谱对系数、线性预测倒谱系数及其组合参数。

(2)由语音频谱直接导出的参数,如基音及其轮廓、美尔频率倒谱系数、感知线性预测参数、口音敏感倒谱系数。

(3)混合参数。

混合参数由以上不同的参数组成的矢量。

2 语音识别系统的分类模型
模型建立是指在训练阶段用合适的模型来表征这些参数,使得模型能够代表该语言的语音特性。

对模型的选择主要应从语音的类型、所期望的性能、训练和更新的难易程度以及计算量和存储量等方面综合考虑。

可分为以下四类:
(1)模板匹配模型:从每种模型的训练语句中提取相应的特征矢量,这些特征矢量称为模板。

识别时,从语音信号中按同样的处理法提取测试模板,并且与其相应的参考模板相比较。

模板匹配模型的不足之处在于不能全面地反映样本分布及统计特性,适应性较差。

典型的模板匹配模型有最邻近模型、动态时间规整模型和矢量量化模型。

(2)概率统计生成模型(又称参数模型):语音信号具有短时平稳性,通过对稳态特征如基音、声门增益、低阶反射系数的统计分析,可以利用均值、方差等统计量和概率密度函数进行分类判决。

概率统计生成模型采用某种概率密度函数来描述语音特性在特性空间的分布情况,并以该概率密度函数的一组参数作为语音模型。

概率统计生成模型由于考虑了语音的统计特性,能较全面地反映语音的统计信息,其优点是不用对特征参量在时域上进行规整。

典型的概率统计生成模型有隐马尔可夫模型和高斯混合模型。

(3)神经网络模型:人工神经网络在某种程度上模拟了生物的感知特性,它是一种分布式并行处理结构的网络模型,具有自组织和自学习能力、很强的复杂分类边界区分能力以及对不完全信息的稳健性,其性能近似理想的分类器。

其缺点是训练时间长,动态时间规整哪里弱。

目前常用的神经网络模型有多层次感知器、径向基函数网络、自组织映射网络和支持向量机网络等。

(4)融合模型:把以上分类方法与不同特征进行有机组合可显著提高语音识别的性能。

三、语音识别系统的结构
1 一个完整的语音识别系统包括预处理、特征提取、模型建立、模式匹配和判决规则等5个部分。

语音识别是属于人工智能领域中的一项技术,从本质上讲,语音识别技术是一个语音信号模式识别问题,它由训练(或注册)和识别(或测试)两个阶段完成。

从训练语音中提取语音特征、建立参考模型并储存的过程称为训练阶段;从待识别语音中提取语音特征,依据参考模型进行比较和判决的过程称为识别阶段。

.2 语音信号预处理
实际的语音信号是模拟信号,因此在对语音信号进行数字处理之前,首先要将模拟语音信号以采样周期采样,采样周期的选取应根据模拟语音信号的带宽来确定,以避免信号的频域混叠失真。

在对离散后的语音信号进行量化处理过程中会带来一定的量化噪声和失真。

语音信号的预处理包括预加重和加窗分帧处理。

3 语音识别的特征提取
语音线性预测的基本思想是:由于语言样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音信号的抽样值可以用过去若干个取样值得线性组合来逼近。

通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。

4 用矢量量化聚类法生成码本
将每个待识别的说话人看作是一个信源,用一个码本来表征。

码本是从该说话人的训练序列中提取的特征矢量聚类而生成。

只要训练的序列足够长,可认为这个码本有效地包含了说话人的个人特征,而与讲话的内容无关。

本系统采用基于分裂的算法设计码本。

4.实验设计
先读入原始语音信号,显示其波形,然后通过预加重滤波器,即可得到预加重语音信号,之后就可以对语音信号进行短时平均幅度和平均过零率分析,同时,也可以通过相应的计算得到语音信号的部分特征参数(LPC谱和LPC倒谱)
5 实验结果及总结
经试验,可以显示出应有的波形,得出预期实验结果。

经过本次课程论文学习,我已对语音识别有了一定的研究;本实验在matlab平台上基本实现了说话人的语音;虽然本次实验的结果比较理想,但是语音识别还有很多;本次设计中主要涉及到了语音识别的基本原理、系数的算法、矢量量化聚类法、说话人识别技术以及matlab编程知识。

本实验在matlab平台上基本实现了说话人的语音识别,从实验结果来看,基本上实现了预定的目的。

本实验的程序代码参考了部分参考书籍和网上资料,但它们的代码在matlab上运行均会出现一些错误,无法正常运行,本人通过多次修改调试并改进,终于使程序成功运行,并得到较为理想的结果。

当然,在这个过程中也碰到过很多各种各样的问题,一开始语音录入的时候,打算叫几个人
来录音,但是后来觉得太麻烦了,直接用一段音频(mp3音乐)就算了,但是问题来了,有时因为音频时间可能太长了导致程序运行的时间很长,或者电脑直接就死机了,后来想起酷我有个制作铃声的工具,然后就用这个工具将比较长的音频截成一段时间很短的音频,大概就是10秒钟,这样的话,我就只需找几个不同的歌手就可以达到不同说话人的目的了,还挺方便的。

用matlab程序实现相应的功能其实难度还是挺大的,语音识别的大概流程和理论算法我都有一定的了解,但是用matlab语言描述出来,用实现的话很多时候都是无从下手,尤其是涉及比较多的函数的时候,不过经过这次实验,我的matlab编程实现能力又得到了一定的提高。

调程序的时候也真的很需要耐心,因为这个问题解决了,再运行的时候,也继续会有下一个问题的出现,最怕的就是要验证问题是否解决的时候,程序需要运行很长的时间,程序运行完了,问题还没有解决,不断地修改,不断的等待,可能有时候真的会不耐烦,所以调程序需要耐心,我在调试生成码本那个程序的时候就是这样的,还好最终都能实现了。

虽然本次实验的结果比较理想,但是语音识别还有很多的模型、方法和技术。

本次实验只是模拟了说话人的识别,但是语音识别其实还有其它方面的任务,仍然有很大的空间值得去学习和提高。

6 参考文献
百度文库及matlab软件。

相关文档
最新文档