说话人识别中特征参数提取的一种新方法
gmm算法理解

gmm算法理解摘要:1.算法背景2.算法原理3.算法应用领域4.优缺点分析5.总结正文:【算法背景】GMM(Gaussian Mixture Model,高斯混合模型)算法是一种聚类方法,主要用于对由多个高斯分布组成的数据集进行建模。
该算法通过拟合数据集的混合分布,找到数据的最佳表示形式。
GMM算法广泛应用于语音识别、图像处理、自然语言处理等领域。
【算法原理】GMM算法基于高斯分布的性质,假设数据集是由多个高斯分布混合而成的。
每个高斯分布表示数据集中的一个子集,即一个聚类。
在训练过程中,算法通过迭代计算每个数据点的概率,从而得到每个数据点属于各个聚类的概率。
最终,根据这些概率,可以将数据点分为若干个聚类。
具体来说,GMM算法分为两个阶段:1.初始化阶段:随机选择K个中心点(均值点),作为K个高斯分布的初始均值。
2.训练阶段:对于每个数据点,计算其属于各个高斯分布的概率,即计算各高斯分布的参数(均值、协方差矩阵)与数据点之间的距离。
根据这些概率,更新各高斯分布的均值和协方差矩阵。
重复这一过程,直至收敛。
【算法应用领域】GMM算法在许多领域都有广泛应用,例如:1.语音识别:在语音信号处理中,GMM算法可以用于提取声道特征,用于后续的说话人识别和语音识别任务。
2.图像处理:GMM可以用于图像分割,将图像划分为多个区域,从而实现图像的分析和理解。
3.自然语言处理:在文本聚类和主题模型中,GMM算法可以用于对文本数据进行建模,挖掘文本数据中的潜在主题。
【优缺点分析】优点:1.GMM算法具有较好的聚类性能,尤其在处理高维数据时,表现优于一些传统的聚类算法。
2.GMM算法可以自动处理数据中的噪声,对于异常值具有一定的鲁棒性。
缺点:1.GMM算法对初始参数敏感,不同的初始参数可能导致不同的聚类结果。
2.算法计算复杂度较高,尤其是在大规模数据集上,计算量会随着数据量的增长而显著增加。
【总结】GMM算法是一种基于高斯分布的聚类方法,具有良好的聚类性能和鲁棒性。
一些常用的语音特征提取算法

⼀些常⽤的语⾳特征提取算法前⾔语⾔是⼀种复杂的⾃然习得的⼈类运动能⼒。
成⼈的特点是通过⼤约100块肌⾁的协调运动,每秒发出14种不同的声⾳。
说话⼈识别是指软件或硬件接收语⾳信号,识别语⾳信号中出现的说话⼈,然后识别说话⼈的能⼒。
特征提取是通过将语⾳波形以相对最⼩的数据速率转换为参数表⽰形式进⾏后续处理和分析来实现的。
因此,可接受的分类是从优良和优质的特征中衍⽣出来的。
Mel频率倒谱系数(MFCC)、线性预测系数(LPC)、线性预测倒谱系数(LPCC)、线谱频率(LSF)、离散⼩波变换(DWT)和感知线性预测(PLP)是本章讨论的语⾳特征提取技术。
这些⽅法已经在⼴泛的应⽤中进⾏了测试,使它们具有很⾼的可靠性和可接受性。
研究⼈员对上述讨论的技术做了⼀些修改,使它们更不受噪⾳影响,更健壮,消耗的时间更少。
总之,没有⼀种⽅法优于另⼀种,应⽤范围将决定选择哪种⽅法。
本⽂主要的关键技术:mel频率倒谱系数(MFCC),线性预测系数(LPC),线性预测倒谱系数(LPCC),线谱频率(LSF),离散⼩波变换(DWT),感知线性预测(PLP)1 介绍⼈类通过⾔语来表达他们的感情、观点、观点和观念。
语⾳⽣成过程包括发⾳、语⾳和流利性[1,2]。
这是⼀种复杂的⾃然习得的⼈类运动能⼒,在正常成年⼈中,这项任务是通过脊椎和颅神经连接的⼤约100块肌⾁协调运动,每秒发出⼤约14种不同的声⾳。
⼈类说话的简单性与任务的复杂性形成对⽐,这种复杂性有助于解释为什⼳语⾔对与神经系统[3]相关的疾病⾮常敏感。
在开发能够分析、分类和识别语⾳信号的系统⽅⾯已经进⾏了⼏次成功的尝试。
为这类任务所开发的硬件和软件已应⽤于保健、政府部门和农业等各个领域。
说话⼈识别是指软件或硬件接收语⾳信号,识别语⾳信号中出现的说话⼈,并在[4]之后识别说话⼈的能⼒。
说话⼈的识别执⾏的任务与⼈脑执⾏的任务类似。
这从语⾳开始,语⾳是说话⼈识别系统的输⼊。
⼀般来说,说话⼈的识别过程主要分为三个步骤:声⾳处理、特征提取和分类/识别[5]。
说话人识别中的HOCOR和改进的MCE

说话人识别中的HOCOR和改进的MCE
范小春;邱政权
【期刊名称】《科学技术与工程》
【年(卷),期】2008(008)012
【摘要】从线性预测(LP)残差信号中提出了一种新的特征提取方法,这种特征跟单个的说话人的声道密切相关.不是应用傅立叶技术,而是把HAAR小波变换应用于残差信号,而这种计算更简单.通过把HAAR变换运用于LP 残差而获得了一个新的特征HOCOR.为了进一步提高识别性能和训练速度,在识别阶段采用了改进的最大分类错误(MMCE).实验结果显示采用所提出的新的特征和MMCE取得了较好的识别效果.
【总页数】4页(P3159-3161,3174)
【作者】范小春;邱政权
【作者单位】湖南科技大学信息与电气工程学院,湘潭,411201;湖南科技大学信息与电气工程学院,湘潭,411201
【正文语种】中文
【中图分类】TN912.34
【相关文献】
1.利用MCE算法提高说话人识别性能 [J], 李晓宇;李虎生;刘加;刘润生
2.说话人识别中改进特征提取算法的研究 [J], 宋乐;白静
3.说话人识别中MFCC参数提取的改进 [J], 胡政权;曾毓敏;宗原;李梦超
4.改进MCE训练算法在说话人识别中的应用 [J], 吕洪艳;李荟
5.基于GMM与改进MCE训练的说话人识别研究 [J], 王松;孙传庆;朱正平
因版权原因,仅展示原文概要,查看原文内容请购买。
声学信号处理技术在语音识别中的应用

声学信号处理技术在语音识别中的应用近年来,随着科技的不断进步,声学信号处理技术在语音识别领域中发挥着越来越重要的作用。
语音识别是一种能够将人类语音信息转化为数据的技术,它在人工智能、语音控制等领域有着广泛的应用。
本文将探讨声学信号处理技术在语音识别中的应用以及对其发展的影响。
首先,声学信号处理技术在语音识别中的重要作用体现在语音特征提取方面。
通过对语音信号进行采样和频谱分析,可以将其转化为数字信号,进而提取出一系列的特征参数。
这些特征参数包括音频频率、声强、音素等等,它们能够准确地描述语音信号的特点。
而声学信号处理技术能够对特征参数进行分析和处理,从而提高语音识别的精确度和准确性。
其次,声学信号处理技术在语音识别中的应用还表现在语音增强和噪声抑制方面。
在实际环境中,语音信号往往伴随着各种噪声,例如机器噪音、人声干扰等。
这些噪声会干扰语音信号的识别,降低语音识别的准确性。
声学信号处理技术可以通过信号降噪算法,对语音信号进行预处理,去除噪声干扰,从而有效提高语音识别的质量。
此外,声学信号处理技术还在语音信号编码和压缩方面发挥重要作用。
在语音通信和存储过程中,对语音信号进行编码和压缩可以减少数据的存储和传输成本。
声学信号处理技术可以对语音信号进行采样和量化,提取出较小的数据包络,从而实现高效的语音编码和压缩。
这不仅节省了存储空间和传输带宽,还提高了语音通信的效率。
此外,声学信号处理技术在语音识别中的应用还包括说话人识别和情感识别等方面。
通过分析语音信号中的特征参数,可以识别不同的说话人,并实现对其身份的验证和辨认。
这对一些需要身份验证的应用来说具有重要意义,例如银行电话客服、语音门禁系统等。
同时,声学信号处理技术还能够通过分析语音信号的音调、频率和音素等特征,进行情感识别,从而判断说话人的情绪和心理状态。
然而,声学信号处理技术在语音识别中的应用还存在一些挑战和不足之处。
首先,语音信号的多样性和复杂性对声学信号处理算法提出了更高的要求。
特征识别算法

特征识别算法特征识别算法(Feature Recognition Algorithm)是一种通过对输入数据进行分析和处理,从中提取出具有特定意义的特征并进行识别的一种技术。
它可以应用于多个领域,如图像处理、语音识别、生物特征识别等。
在图像处理领域,特征识别算法被广泛应用于目标检测、物体识别等任务中。
通过提取图像的局部特征,比如边缘、纹理、颜色等,算法可以识别出图像中的目标物体,并进行分类或定位。
其中最常用的特征识别算法之一是SIFT(Scale-Invariant Feature Transform),它通过寻找图像中的关键点,并对这些关键点进行描述,从而实现图像特征的匹配和识别。
在语音识别领域,特征识别算法可以将语音信号转化为一系列特征向量,用于表示语音的特征。
常用的特征包括梅尔频率倒谱系数(MFCC)、线性预测编码(LPC)等。
这些特征可以用于语音识别任务中,比如说话人识别、语音指令识别等。
在生物特征识别领域,特征识别算法可以根据人体的生物特征进行身份识别。
常见的生物特征包括指纹、虹膜、面部等。
通过提取这些生物特征的特征向量,并与已知的特征进行比对,算法可以判断出一个人的身份。
特征识别算法的核心思想是将输入数据转化为一种可以被计算机处理的形式,并提取出具有特定意义的特征。
这些特征可以用于判断、分类或识别。
为了提取出有意义的特征,算法需要具备以下几个步骤:1. 数据预处理:对输入数据进行预处理,如去噪、归一化等。
这一步旨在减少数据中的噪声和冗余信息,提高特征的可靠性。
2. 特征提取:通过某种方法提取出数据中的特征。
常用的方法有统计分析、频域分析、小波变换等。
特征的选择应该具有一定的区分度和稳定性,能够准确地表达数据的特性。
3. 特征选择:根据特定的任务需求,选择出最相关的特征。
这一步旨在减少特征的维度,提高计算效率和准确性。
4. 特征匹配或分类:将提取到的特征与已知的特征进行比对,从而实现特征的匹配或分类。
mfcc 离散余弦变换

mfcc 离散余弦变换
MFCC,即Mel频率倒谱系数,是一种语音特征参数,常用于语音识别和语音编码等领域。
而离散余弦变换(DCT)是一种常用的信号处理技术,用于对信号进行有损数据压缩。
在语音信号处理中,DCT可以用于提取MFCC特征参数。
具体的实现过程是:首先对语音信号进行预加重和分帧处理,然后进行加窗操作,接着计算每个帧的离散余弦变换,得到DCT系数,最后对这些系数进行取对数、离散化和归一化处理,得到MFCC特征参数。
MFCC特征参数具有较好的稳定性和鲁棒性,能够有效地描述语音信号的韵律和音色等特征,因此在语音识别、语音合成、说话人识别等领域得到了广泛应用。
而离散余弦变换作为一种高效的信号处理技术,也广泛应用于信号压缩和特征提取等领域。
MFCC(Mel频率倒谱系数)和DCT(离散余弦变换)是两种不同的语音特征提取方法,它们在语音处理领域中都有应用。
MFCC主要用于语音识别和语音编码,通过将语音信号转化为频谱图,提取出与人类语音感知相关的特征参数,如音高、音强、共振峰等。
MFCC的优点在于能够有效地描述语音信号的韵律和音色等特征,并且在处理过程中相对稳定,抗干扰能力强。
DCT则是一种用于信号压缩和特征提取的常用技术,通过将信号从时域变换到频域,提取出信号中的主要成分和能量,从而实现数据压缩。
在语音处理中,DCT可以用于提取语音信号中的频率特征,如共振峰等。
DCT的优点在于其算法简单、快速,且在数据压缩方面效果较好。
总之,MFCC和DCT是两种不同的语音特征提取方法,MFCC 更适用于语音识别和语音编码,而DCT更适用于信号压缩和特征提取。
在实际应用中,可以根据具体需求选择合适的方法。
《基于i-vector的说话人识别的研究》范文

《基于i-vector的说话人识别的研究》篇一基于i-vector的说话人识别技术研究一、引言随着语音技术的不断发展,说话人识别技术逐渐成为人们关注的焦点。
说话人识别技术是一种通过分析语音信号中的特征信息,从而确定说话人身份的技术。
i-vector技术作为一种有效的语音特征提取方法,在说话人识别领域得到了广泛的应用。
本文旨在研究基于i-vector的说话人识别技术,探讨其原理、方法及优势,为相关领域的研究提供参考。
二、i-vector技术原理i-vector是一种基于高斯混合模型(GMM)的语音特征提取方法。
其基本原理是将语音信号中的特征信息通过高斯混合模型进行建模,然后通过统计方法得到一个能够描述语音特性的向量,即i-vector。
该向量包含了语音信号中的各种特征信息,如声学特征、音素特征等,可以有效地表征说话人的语音特性。
三、基于i-vector的说话人识别方法基于i-vector的说话人识别方法主要包括以下几个步骤:1. 语音信号预处理:对输入的语音信号进行预处理,包括去噪、归一化等操作,以便后续的特征提取。
2. 特征提取:利用i-vector技术对预处理后的语音信号进行特征提取,得到每个语音信号的i-vector向量。
3. 模型训练:采用高斯混合模型(GMM)对提取的i-vector 向量进行建模,训练得到说话人的模型参数。
4. 说话人识别:将待识别的语音信号进行同样的特征提取和模型训练,然后与已建立的说话人模型进行比对,从而确定说话人的身份。
四、i-vector技术的优势相比其他说话人识别技术,i-vector技术具有以下优势:1. 特征提取能力强:i-vector技术能够有效地提取语音信号中的各种特征信息,形成能够表征说话人特性的向量。
2. 鲁棒性高:i-vector技术对噪声、信道等干扰因素具有较强的鲁棒性,能够在不同的环境下实现稳定的说话人识别。
3. 计算效率高:i-vector技术的计算过程相对简单,能够快速地完成大量的语音数据处理。
语音识别的特征提取方法

语音识别的特征提取方法语音识别是指通过机器学习和信号处理技术将语音信号转换为文本或命令的过程。
在语音识别中,特征提取是至关重要的一步,它涉及到如何从原始语音信号中提取出表征语音的有用信息。
下面将介绍几种常用的语音识别特征提取方法。
1. 短时能量和过零率 (Short-Time Energy and Zero-Crossing Rate, STE/ZCR)短时能量表示语音每个小时间段内的能量大小,而过零率表示语音信号波形在每个小时间段内穿过零的次数。
短时能量和过零率可以提供一些声音的基本特征,如音强和频率信息。
2. 梅尔频率倒谱系数 (Mel-Frequency Cepstral Coefficients, MFCC)MFCC是一种广泛应用于语音识别的特征提取方法。
它采用一系列滤波器组对语音信号进行滤波,然后对每个滤波器输出结果进行离散余弦变换(DCT)得到系数。
MFCC特征具有良好的频率刻画能力,对音高和语音内容变化不敏感,且能有效地降低特征维度。
3. 线性预测编码系数 (Linear Predictive Coding, LPC)LPC是一种将语音信号建模为线性滤波器的方法,通过提取滤波器的参数来表示语音的特征。
LPC特征可以用于语音识别和说话人识别等任务,它能较好地刻画语音信号的时域特性。
4. 倒谱系数 (Cepstral Coefficients)倒谱系数是一种将功率谱转换到倒谱域的方法,它可以用来提取语音信号的频谱特征。
倒谱系数主要包括梅尔倒谱系数和线性倒谱系数,可以在一定程度上表征语音信号的谐波结构。
5. 高阶统计特征 (Higher-Order Statistics, HOS)高阶统计特征包括自相关函数、偏自相关函数和互相关函数等,它们可以描述语音信号的非线性特性,较好地刻画了语音信号的时域结构。
6. 短时傅里叶变换 (Short-Time Fourier Transform, STFT)STFT是一种将语音信号从时域转换到频域的方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[T] 杨行峻,迟惠生%语音信号数字处理[&]%北京:电子工业出版社,!>>"% ["] 边肇祺,张学工%模式识别[&]%北京:清华大学出版社,!>>>% [@] V/E749J-+,V4-/V%V43<-::/S:K,79/6/79/7:-6/2H/0,9/7:,8,;2:,47<-,7NC2<--,275,S:<0/-6/2H/0549/J-[F]%
! 收稿日期:#!!"%!$%!"
基作金者万项简方目介::数国汪据家自峥(然&(科E!学—基),金男资,硕助士项研目(究D!生&$;&!通)D讯,)联!)系$!人)(王#建)军副教授*
(DC
复 旦 学 报(自然科学版)
第@@卷
本文在使用傅立叶分析和小波分析计算特征参数的基础上,利用 !"#$%&准则构造了一种新的混合特 征参数’这种新的参数在不增加系统计算量的同时,结合了傅立叶分析和小波分析各自的优点,具有更好 的表征说话人特征的能力’实验结果也给出了证明’
=
语音库
! #
!&’(( >!%?@ ?A%AA
!)*( >A%BB ?$%"A
!&’*(( B>%?! ?!%"A
!’&( >"%"> B#%"A
本文介绍了一种说话人识别中特征参数提取的一种新方法,它所得到的特征参数有效地结合了傅立 叶分析和小波分析各自的优点%和其他特征参数相比,具有更好的分类能力和稳定性,而且不增加训练和 识别过程的计算量,具有很好的实用性%
种音素,可以 结 合 两 种 方 法 各 自 的 优 势 来 取 得 更 好 的
效果%如果直接将它们进行叠加,特征的维数即增加了 一倍,这样就增加了训练和识别时的计算量,不利于系 统的实时运行,另外各维的区分度并不相同,有时反而
图! 中心频率的比较 "#$%! &’()*+#,’-’./0-1+*2.+0340-/5
第&期
汪 峥等:说话人识别中特征参数提取的一种新方法
文章编号:!"#$%$&!"(#!!’)!&%!&($%!"
&($
! 说话人识别中特征参数提取的一种新方法
汪 峥,连 翰,王建军
(复旦大学 电子工程系 智能与图像实验室,上海 #!!")))
摘 要:提出了一种新的说话人识别中特征参数的提取方法*在分别使用傅立叶分析和小波分析得到两组特征 参数之后,进一步利用 +,-./0准则进行参数选取,构 造 了 一 种 新 的 混 合 特 征 参 数*在 不 增 加 训 练 和 识 别 时 计 算 量的同时,结合了傅立叶分析和小波分析两者的优点,具有更好的分类能力*实验结果显示,这种新的混合参数 有效地提高了说话人的识别率,能更好地表征说话人的特征*
从表!中可以看出,在语音库!和语音库#两种情况下,基于 ’,-./0比的混合参数都取得了最好的识 别率%它不仅在同期录音时能更好的区分各说话人,而且在说话人的状况随着时间发生变化时,依然能够 较好的表现各个说话人的特征%
表! 不同特征参数的识别正确率比较
123%! (45620,-4748,9/7:,8,;2:,4702:/489,88/0/7:8/2:<0/-
望最大化(I?)算法进行训练,计算简单,且分类效果优于其他分类器%实验中每个说话人由一个高斯混 合模型来表征,模型的阶数取为!>,并取对角化的协方差矩阵% *%* 实验结果
对同一期录音的干净语音进行说话人识别,现在可以达到非常高的识别率%而如果训练和识别的语 音不是同一期的话,由于说话人自身状况的改变,识别率会大为下降%为了更好的检验本文提出的混合特
参考文献:
[!] C4D9EFG,1<8/H;,I%&/JKL;2J/99,-;0/:/D2M/J/:;4/88,;,/7:-840-6//;.0/;4N7,:,47[OP/QR]%.::6:!,///SK 6J40/%,///%40N/,/!"/@>$>/!B@B?/AAB@!B#>%698,#AAAKA@KA!/#AATKA#KA@%
上的小波包子树分解,得到各子带系数 ,-%.,/;#计算每帧语音信号的各小波包子带的能量;
万方数据
1.
![,-%.,/ ]-
0. " /"( 1.
."(,-,…,+ ;
(4)
第=期
汪 峥等:说话人识别中特征参数提取的一种新方法
=FF
其中!为子带序号,"! 为第! 个子带中小波包分解系 数的个数;!将小波包各子带能量 #! 的对数进行离散 小波变换得到小波包系数 67&%
于小波包分析的语音特征’这里使用的听觉感知小波包[4]不同于一般的小波包分解,它为了利用人耳的
听觉感知特性,即 )%*频率和关键带,采用了固定分解树的方法,使它的子频带分布类似于 )%*域滤波器 组’小波包分解树和 )%*域滤波器组以及临界带的中心频率[@]之间的比较见图4’
小波包系数(AB+)的提取过程如下’!输入语音信号经过预加重后进行分帧;"对各帧信号进行如
两种参数在语音库=的训练集上的"#,80+比如图<所示,前面><维是 ?"&&,后面><维是 67&%选
取 "#,80+比最大的><维组成新的混合特征参数("?&)%这样既没有增加系统的计算量,同时结合了两种
参数各自的优势,能更好的表征说话人的特征,具有很好的分类能力%
> 实验与结论
*%! 实验数据和系统平台 实验中采用的语音共有两组,分别称为语音库=和语
征参数表万征方说话数人据的能力,用语音库=和>分别进行了两种情况下的说话人识别实验%
#AA
复 旦 学 报(自然科学版)
第TT卷
使用语音库!时,对每个说话人用"个文件进行训练,使用剩下的!"个文件进行测试;使用语音库# 时,用$个月前的语音进行训练,使用$个月后的语音进行测试%为了便于比较,计算了相应情况下分别 使用 &’((和 )*(,以及文献[!]中感知频率离散小波系数(&’+)()和文献[$]中小波包倒谱系数 ()*(()时系统的识别率!%实验结果如表!所示%
!"""1*’&.+--,3’&4564$+2*+,-..$&%,!>>",#(!):?#KB$%
$%%&’()*’+,+-)./0 1’2/34/)*56/’,7%/)8/6 93/,*’-’()*’+,
组的中心频率按 )%*频率均匀排列,每个滤波器三角形的两个底点是相邻滤波器的中心,相邻滤波器过
渡带的频率响应之和为(,图-为示意图’用三角形滤波器组在频域对能量谱进行带通滤波,滤波后得到
$ 个滤波器的输出,%(&),&3(,-,4,…,$ ’
图- )%*滤波器组 !"5’- )%*6"*7%&89/:#
( 特征参数的提取
!’! 基于傅立叶分析的特征参数 )%*频域倒谱系数()!++)是使用傅立叶分析提取的语音特征参数,它利用如下两个听觉机理来分
析语音频谱’ !人的主观感知频域划分不是线性的,而是类似于指数的形式,它和实际频域之间有下面的公式:
!,%*"((-.*/((#.!2021);
(()
式中 !,%*是以 )%*为单位的感知频域,!01是以 01为单位的实际频域’将语音信号的频谱变换到感知频
会影响整体的分类能力% 在模式识别中一个参数的可分离性可以用 "#,80+准则[9]来测定:
!"#,80+ $ "":0;1#1;80#0--,
(<)
其中!"#,80+称为 "#,80+比,某个参数对训练集样本的 "#,80+比越大,则这个参数的类别区分度越好%";#18#-
是这个参数对各个类的类内方差之和;":01;00-则是这个参数的类间方差和%
#将滤波器组的输出取对数,然后对它做离散余弦变换(;+<)得到 )!++,
[ ] ! $!’’(
"
$
*/%(&)=>#
&"(
$(&)2*?)( $
( "(,-,…,+;
这里 )!++的系数个数( 通常取小于等于$ ’
(-)
!’" 基于小波包分析的特征参数
由于语音信号的非平稳性,可以用小波包分析代替语音信号处理中的傅立叶分析和滤波器组,导出基
关键词:信号处理;傅立叶分析;小波分析;+,-./0比;说话人识别
中图分类号:12(&#*)"
文献标识码:3
说话人识别是利用语音信号和预先提取的说话人特征来确定或鉴别说话人身份的技术*由于每个人 独特的声道特性和发音特点,使其讲话具有区别于他人的特征,这就是说话人识别的基本依据*