基于支持向量机的说话人识别

合集下载

支持向量机在图像识别中的应用案例解析

支持向量机在图像识别中的应用案例解析

支持向量机在图像识别中的应用案例解析支持向量机(Support Vector Machine,简称SVM)是一种常用的机器学习算法,它在图像识别中有着广泛的应用。

本文将通过几个实际案例,解析支持向量机在图像识别中的应用。

案例一:人脸识别人脸识别是一项重要的生物特征识别技术,支持向量机在其中发挥了重要作用。

在训练阶段,我们可以使用SVM算法对许多人脸图像进行标记,将其转化为特征向量。

然后,通过SVM的分类器来学习和识别这些特征向量,从而实现对新的人脸图像的识别。

SVM算法通过构建一个最优的超平面来实现分类,使得不同人脸图像在特征空间中的距离最大化,从而提高了识别的准确性。

案例二:手写数字识别手写数字识别是机器学习中一个经典的问题。

支持向量机在手写数字识别中的应用也取得了显著的成果。

训练阶段,我们可以将大量的手写数字图像转化为特征向量,并使用SVM算法进行分类器的训练。

在测试阶段,通过将新的手写数字图像转化为特征向量,并使用训练好的SVM分类器进行识别,从而实现对手写数字的准确识别。

SVM算法通过寻找最优的超平面来实现分类,使得不同数字在特征空间中的距离最大化,从而提高了识别的准确性。

案例三:物体识别物体识别是计算机视觉中一个重要的研究领域,而支持向量机也在其中发挥了重要作用。

在物体识别中,我们可以将物体的图像转化为特征向量,并使用SVM算法进行分类器的训练。

通过训练好的SVM分类器,我们可以对新的物体图像进行识别,从而实现对不同物体的准确识别。

SVM算法通过构建一个最优的超平面来实现分类,使得不同物体在特征空间中的距离最大化,从而提高了识别的准确性。

总结:支持向量机在图像识别中的应用案例解析中,我们可以看到它的优势。

SVM算法通过构建最优的超平面来实现分类,使得不同图像在特征空间中的距离最大化,从而提高了识别的准确性。

无论是人脸识别、手写数字识别还是物体识别,SVM都能够发挥重要作用。

通过大量的训练数据和合适的特征向量,我们可以训练出准确率较高的SVM分类器,实现对图像的准确识别。

基于支持向量机的说话人辨认研究

基于支持向量机的说话人辨认研究
r s t how e good pe or an . e ulss d r m f ce K e w or :s k e d y ds pea ri entfc ton;s i ai i uppor t vecorm ac n t hi e;pa t n ec ter r ognii ton
Absr c : u p r v co c ie( VM )i n i o a t e r n to fs tsia an n h o y t a t S p o t e trma h n S sa mp rn anig meh d o t it le r i gt e r . t l a c l
Jn 0 2 u e2 o
;技术 告 i 报
‘ y y y y y y y
基 于 支 持 向量 机 的说 话 人 辨 认研 究
侯 风 雷 ,王 炳 锡
解 放 军 信 息 工 程 大 学 河 南 郑 州
400 ) 5 0 2

要 : 支 持 向 量 机 是 统 计 学 习 理 论 的 一 个 重 要 的 学 习 方 法 , 也 是 解 决 模 式 识 别 问 题 的 一 个 有 力
l 引 言
说 话 人 辨 认 技 术 是 指 通 过 说 话 人 测 试 语 音 来 判 断 该 说 话 人 是 训 练 集 合 Ⅳ 个 人 中 的 哪 个 人 ,在 司 法 、 安 全 和 国 防 领 域 都 有 着 广 泛 的应 用 。 目前 说 话 人 辨 认 系 统 多 是 采 用 基 于 贝叶 斯
p o e s A e ti d p n e ts e e d n i c t n s se ba e n S M s wa mp e r blm . t x —n e e d n p a r i e t a i y t m s d o V k i f o s i l me t d a d t e ne n h

基于子聚类约简支持向量机的说话人识别研究

基于子聚类约简支持向量机的说话人识别研究

e r a c n e t c l d s b cu t r e u e VM s p e e t dF rt ,h s a e u e k r e - a e u z u — l s r t i tr t e a , o c p al u - l se s r d c d S e i rs n e . i l t i sy p p r s s e n l b s d f z y s b cu t s o l h e f e
I si t f I f r t n S i n e a d E gn ei g C nr l S uh Un v ri , h n s a 4 0 8 , h n n t u e o n o ma i c e c n n i e r , e t o t ie st C a g h 1 0 3 C i a t o n a y
说话人识别是通过对 说话人语音信号的分析和特征提取 , 自动地确定说话人是否在所登记的说话人集合 中, 以及说 话人 是谁的过程 。 前 主要 的识别方法包括矢量量化技术 ( Q 、 目 V )高
t a h t a d tr g f c e c a e n a c d r ma k by b u i g t e r i i g a d d n i i g ag rtm , n h s se h tte i me n s a e e i n y c n b e h n e e r a l y sn h t n n n i e t y n lo h a d t e y t m o i a f i
论和实践表 明, 经过 两层 的约 简既保 留了充足支持 向量, 保证 了 S M 良好的泛化性能 , V 又提 高了系统的时间和空间效率。
关键词 : 支持向量机 ; 模糊核子聚类 ; 非边界聚类 区过 滤; 聚类区向量集约简

基于PCA和多约简SVM的多级说话人辨识

基于PCA和多约简SVM的多级说话人辨识
d t,t n t rg a e rd c d rma k by b sn u t o ,a d t e s se h sb t rrb sn s . aa i a d soa e c n b e u e e r a l y u i g o rmeh d n h y tm a et o u t e s me e
0 引 言
说话 人辨识就是判定待测说话人 的语音属于多个参考说
话人之中的某一个 , 一次辨识需要将 待测语音 去匹配所有 每 说话人的参考模型 , 出最相近模 型所 对应 的说话 人作为辨 找 识结果 , 这样必然导致 注册人数越 多, 花费 时间越长 , 当注册 人数达到一定数量后 , 系统很难做 到实时响 应。对此 一些 学
关键词 : 多约 简支持 向量机 ; 模糊核 聚类 ; 主成 分分析 变换 ; 多级说话人辨识
中图 分 类 号 : P 9 . 2 T 3 14 文 献 标 志 码 : A
Hir r h c l p a e d n i c t n b s d o CA n l - e u e VM e a c ia e k r i e tf a i a e n P s i o a d mu t r d c d S i
维普资讯
第2 8卷 第 1期 20 0 8年 1月
文章编号 : 0 9 8 ( 0 8 0 — 17— 4 1 1— 0 1 20 ) 1 0 2 0 0
计算机 应 用
Co u e p i ain mp tr Ap lc t s o
Vo . . 128 No 1
iet ct n i t e a c a ejd e b atSa fa e i ee p a e s g P A c sie,a d te e af a d ni ai .Fr t o s u g y a fs C o l r s rd s e k ru i C l s r n n g t n f o sg r n l gt n a f i h il

基于模糊核聚类和SVM的说话人辨识

基于模糊核聚类和SVM的说话人辨识

Z ANG Na K NG J n xa2 W A e g W A H ’ A , ~i , u n NG F n , NG Xi g, UN F n a  ̄S e g n (. 8 2 mi ; . 8 i s 3 6 0 4Amf s4 6 2 5A i . a z o 3 0 0 Chn) 1 6 0 6Ar e 2 6 1 7Amf ; . 9 6 i ; . 8 1 r e L n h u 7 0 0 , ia s 1 e e m s
话人 辨 识 就 是 通 过 语 音判 别 当前 说 话 人 是 谁 的 技 术 在 文本 无 关
本 文 选 择 径 向 基 核 函数 ( B ) R F
ep~ X( )

的说 话 人 辨 识 中常 用 的方 法 有 基 于混 合 高 斯 模 型 ( MM) 方 法 G 的 【,】基 于 隐 马尔 可 夫 模 型 ( 1 , 2 HMM) 的方 法 【】基 于 矢 量 量 化 ( Q) 3, V 的方 法 f]基 于人 工 神 经 网络 ( N 的方 法 f 以及 各 种 融 合 方 法 4, A N) 5 1 f,1 等 。 MM 方法 简单 , 能较 好 , 目前最 好 的说 话 人 识 别 模 6 等 7 G 性 是
c s m e on o p ig tm e wih als e h paa e es on u sl g c m utn i t l pe c r m tr.A r l a e uz y cu trn sp opo e O o r om elr e q ntte aa Ke ne—b sd f z l sei g wa r sd t vec a g ua i sofd t , i s e h paa ee sw e e slc e tb nd r fe c l se sSVs pe c rm tr r ee td a ou a y o a h cu tra .Thetanng daaa i ec n ber du e ini c nd t utd trortn rii t nd t a e c d sg f a y wiho ee m i i aig

基于支持向量机的中国人名的自动识别

基于支持向量机的中国人名的自动识别
本文采用 IBO2 的组块(chunk)表达方法来标识人名,即 将每个字分为 3 类:B—人名首字,I—人名中部,O—人名 外部,这里一个组块(BI 或 B)视为一个人名。对训练文本中 的每个字进行 IBO2 标注,即 yi∈{B,I,O} ,这样,用 SVM 识 别中文文本中的人名就是对文本中的每个字进行 B、I、O 分 类,如图 1 所示。
器的训练数据是第 i 类的数据作为正例,其它类的数据作为 负例,为每个类构造一个分类器,第 i 个分类器在第 i 类和其 他类之间构造一个超平面,在多个两类分类器中具有最大输 出的类别即是测试数据所属的类别。
2 中国人名的识别
本文首先对训练语料进行自动分词和词性标注,再按字 抽取特性建立训练集,通过选取合适的 Kernel 函数,建立用 SVM 识别人名的机器学习模型。 2.1 BIO 分类标记
汉语的自动分词是自动文摘、文本挖掘、语音处理和机 器翻译等语言工程中的基础课题之一,而未登录词的自动识 别是提高汉语分词系统正确率的关键技术,中文人名在未登 录词中占很大比重,因此中国人名的自动识别是未登录词识 别的关键因素。目前中文人名识别的方法主要是采用统计模 型,文献[1]采用 Viterbi 算法对切词结果进行标注并在此基础 上进行模式最大匹配,最终实现中国人名的识别,文献[2,3] 利用统计的方法识别人名,都取得了比较好的效果。采用传 统的统计方法依据概率识别在很大程度上依赖于训练语料的 大小,所以为了得到较高的识别精度,一般需较大规模的训 练语料。本文采用支持向量机(support vector machine,SVM) 方法进行中国人名自动识别。首先结合中文文本中人名的特 点,对训练语料中的每个字进行分类标注及词性标注,然后 抽取单字本身、词性、该字是否在姓氏表中、单字用作姓名 的概率及其上下文信息作为特征向量的属性,并将其转化为 二进制表示,在此基础上建立了训练集,并通过对不同阶数 多项式 Kernel 函数的测试,得到了用支持向量机进行姓名识 别的机器学习模型。

语音识别系统中的说话人识别技术研究

语音识别系统中的说话人识别技术研究近年来,随着人工智能的快速发展,语音识别技术得到了广泛应用。

而在语音识别系统中,说话人识别技术是一个重要的研究方向。

说话人识别技术旨在通过声音特征来识别不同个体的身份,具有广泛的应用价值,如语音助手、安全认证等领域。

本文将重点研究语音识别系统中的说话人识别技术,探讨其原理、方法和应用。

一、说话人识别技术原理说话人识别技术的原理基于人类语音信号中的个体差异,每个人的声音都有独特的频谱特征。

根据这一特点,说话人识别技术通过提取声音特征并进行比对,来判断不同个体的身份。

具体而言,其原理包括声纹提取、声纹匹配和分类识别三个关键步骤。

声纹提取是说话人识别技术的第一步,它通过特定的算法从语音信号中提取出能够代表说话人个体特征的声纹信息。

常用的声纹提取方法包括基于梅尔频率倒谱系数(MFCC)的特征提取、线性预测编码(LPC)和高斯混合模型(GMM)等。

声纹匹配是说话人识别技术的核心步骤,它通过对提取的声纹信息进行比对,计算不同声纹之间的相似度。

常见的声纹匹配方法有模板匹配、动态时间规整(DTW)和高斯混合模型(GMM-UBM)等。

这些方法可以通过计算相似度得到说话人之间的相似性分数,并进行身份识别。

分类识别是说话人识别技术的最后一步,它通过建立分类模型,将提取到的声纹信息与已知身份的声纹模板进行比对,判断说话人的身份。

常用的分类器包括支持向量机(SVM)、k近邻算法(k-NN)和多层感知机(MLP)等。

二、说话人识别技术方法在语音识别系统中,说话人识别技术可以根据特征提取方法和分类模型的不同,分为传统方法和深度学习方法两类。

1. 传统方法:传统的说话人识别方法主要基于统计模型,例如高斯混合模型(GMM)和隐马尔可夫模型(HMM)。

这些方法在声纹提取和声纹匹配中得到应用,通过建立模型对声音特征进行建模和比对,实现说话人身份的识别。

传统方法的优点是简单易懂、计算量小,但在面对高噪声环境和长时语音数据时效果较差。

支持向量机在图像识别中的应用案例分享

支持向量机在图像识别中的应用案例分享支持向量机(Support Vector Machine,简称SVM)是一种常用的机器学习算法,在图像识别领域有着广泛的应用。

本文将分享几个SVM在图像识别中的应用案例,展示其在不同领域的成功应用。

第一个应用案例是人脸识别。

人脸识别是计算机视觉领域的一个重要研究方向,具有广泛的应用前景。

在人脸识别中,SVM可以通过训练样本集来学习人脸的特征,然后根据这些特征对新的人脸图像进行分类。

通过对大量的人脸图像进行训练,SVM可以准确地识别人脸,具有较高的准确率和鲁棒性。

第二个应用案例是车牌识别。

车牌识别是交通管理和安全监控领域的重要任务。

传统的车牌识别方法需要依赖于复杂的图像处理算法和特征提取技术,但这些方法往往存在一定的局限性。

而使用SVM进行车牌识别可以有效地解决这些问题。

SVM可以通过训练样本集学习车牌的特征,然后根据这些特征对新的车牌图像进行分类。

实验证明,SVM在车牌识别中具有较高的准确率和鲁棒性。

第三个应用案例是病理图像分析。

病理图像分析是医学领域的一个重要研究方向,可以帮助医生进行疾病的诊断和治疗。

传统的病理图像分析方法需要依赖于专业的医学知识和经验,但这些方法往往存在主观性和误判的问题。

而使用SVM进行病理图像分析可以有效地解决这些问题。

SVM可以通过训练样本集学习病理图像的特征,然后根据这些特征对新的病理图像进行分类。

实验证明,SVM在病理图像分析中具有较高的准确率和鲁棒性。

第四个应用案例是文本分类。

文本分类是自然语言处理领域的一个重要任务,可以帮助人们对大量的文本数据进行自动分类和管理。

传统的文本分类方法需要依赖于复杂的特征工程和模型训练过程,但这些方法往往存在一定的局限性。

而使用SVM进行文本分类可以有效地解决这些问题。

SVM可以通过训练样本集学习文本的特征,然后根据这些特征对新的文本进行分类。

实验证明,SVM在文本分类中具有较高的准确率和鲁棒性。

基于VQ—MAP与LS—SVM融合的说话人识别系统

关 键 词 :最 大 后 验 概 率 ;矢 量 量 化 ;最 小 二 乘 支 持 向 量 机 ;说 话 人 识 别
中 图 分 类 号 :T 3 14 P 9 . 文 献 标 识 码 :A
Sekrrcgio yt ae nV MA n S S M pae eont n ss m bsdo Q- P ad L - V i e
Z HAN Ln i g,JNG n Xi g I Xi n ( fr t n & C m nct n C l g ,G in U i rt o l t nc T cn l y ul 4 0 4C ia I omao n i o mu i i ol e ul n es y fEe r i eh o g ,G in 5 10 ,hn ) ao e i v i co o i
而 达 到 对 说 话 人 进 行 辨 认 或 者 确 认 的 目的 。 可 以 分 为 它
两 个 范 畴 : 话 人 辨 认 和 说 话 人 确 认 。 说 话 人 辨 认 是 辨 说
认 出 待 识 别 的 语 音 是 来 自待 考 察 的 个 人 中 的 哪 一 个 ; 而 说 话 人 确 认 则 是 特 定 的 参 考 模 型 和 待 识 别 模 式 之 间 的
Ab ta t e tr e tr u e s te t iig smpe o h t dt n llats u r sp otv co c ie o s o ie e sr c :F aue v cos s d a h r nn a ls f te r i o a e s q ae u p r etr ma hn s d e n tgv - a a i
n u h n o ai n o ic i n t t e o c i s e k r e o n t n y tm . T s le h s rb e t i a e p o o e t e o g i fr t t d s rmi ae h v i e n p a e rc g i o s s m o i e o ov t i p o l m, s h p p r r p s s h meh d to

交叉验证KNN支持向量预选取算法在说话人识别上的应用

算 法 J 、 d e c o mp o s i n g算 法 和 s e q u e n t i a l mi n i ma l
o p t i mi z a t i o n ( S MO) 算法 。 。 。这 几种 方法 的 主要特 点 就是 在训 练集 的子 集 上应 用标 准 支 持 向量 机 算 法 , 通过 迭代 的方 式 获 得 在 原 始 训 练 集 上 的 解 。它 们
预选取支持 向量。然 而该方法 不能严 格保证支持
5 8 4 O







1 3卷
向量 总是 分 布 在 投 影 直 线 上 相 邻 的投 影 区域 。 因
而 有 时候 不 能精确 的预选取 支持 向量 。

2 0 1 3 S c i . T e c h . E n g r g .
交叉验证 K N N支持 向量预选取算法 在说话人 识别上 的应 用
陈 雪 芳 杨 继 臣
( 东莞理工学 院计算机学院 ,东莞 5 2 3 8 0 8; 仲恺农 业工程 学院计算机科学与工程学院 , 广州 5 1 0 2 2 5 )
广东 省 自然科学基金项 目( 9 1 5 1 0 0 9 0 0 1 0 0 0 0 4 3 ) 、 东莞市高校
科研机构科技计划项 目 ( 2 0 1 1 1 0 8 1 0 2 0 1 6 ) 资 助
下研 究 。 国 内学 者 李 青 等 提 出 了 一 种 基 于 向量
投影的支持向量预选取方法 , 该方法首先将原始样
向量机 最 终 的分 类 界 面仅 仅 取 决 于 训 练 样 本 集 中
2 0 1 3年4月 1 7 E t 收到 国家 自然科学基 金项 目( 6 1 1 0 1 1 6 0 ) 、
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

, 定义 CM h ( w ) ] }, = N
N
1 N 1 N , CM ( w ) = exp ] [ CM [ log( CM i ) g i N ∑ N ∑ i =1 i =1
{
∑ i = 1 CM i
1
其中: CM a 为算术平均; CM g 为几何平均; CM h 为调和平均; N 为是某个词中音子的总数; w 为音源中词所 …, O e[i]} 为时间帧的序列, b[i]和 e[i]分别代表第 i 个音子的帧的开始 包含的一系列相关音子; O i = { O b[i], 和结束. 因此, 经过时间长度归一化的统一时间长度为: T i = e[i] - b[i] + 1 . 因为不同的置信音子具有不同 的持续时间长度, 所以可以用时间长度归一化的方法来对某个词进行置信度综合 , 经过时间长度归一化处 理后的 3 个平均公式分别为: CM a n ( w ) = 1 N
针对每个合成后的置信度得分, 设置一个阈值 γ 作为临界值. 如果该置信度的综合得分大于该临界阈 值, 则接受; 否则, 则拒绝. 1. 2 基于支持向量机的置信度综合
[7 ] 支持向量机( support vector machine ,SVM) 的主体思想 是: 将用作训练的数据集采用非线性的形式
j
logp( H) = 0, 求解 λ ω ii - 1 - n +1
1
1 c( ω ii - -n + 1 ) j
1 ∑ c( ωii - -n + 1 ) ωi
i -1 λ ω ii - 1 P ML ( ω i | ω i -n + 1 ) -n + 1 i -1 i -1 λ ω ii - 1 P ML ( ω i | ω i -n + 1 ) + ( 1 - λ ω i - 1 ) P int erp ( ω i | ω i -n + 2 ) -n + 1 i -n + 1
O2 , …, O T ) 为观测序列. 式中: PH j 表示所有可能出现的音子; O = ( O1 , 在已有的中外文献中提及的从音子级别的置信度得分合成为词级别的置信度得分的方法 , 主要是通 过一些特定的平均方法来求得, 如算术平均、 几何平均、 调和平均等 CM a ( w ) =
[2 ]
1 1 1 P ML ( ω i | ω ii - ) P int erp ( ω i | ω ii - P int erp ( ω i | ω ii - -1 -1 - n + 1 ) = λ ωi - n + 1 ) + ( 1 - λ ωi -n +2) i - n +1 i - n +1
( 4)
第 11 卷 第 4 期 2013 年 12 月
南京 工 程 学 院 学 报 ( 自 然 科 学 版 )
Journal of Nanjing Institute of Technology( Natural Science Edition)
Vol. 11 , No. 4 2013 Dec. ,
文章编号: 1672 - 2558 ( 2013 ) 04 - 0052 - 06
[3 - 4 ]
, 此方法的置信度综
54
南京工程学院学报( 自然科学版)
2013 年 12 月
2 ) 为了与平均值法时间上统一, 这里采用同样的方法对置信度矢量进行归一化处理, 得到的矢量表 示为 V n ( ω) = C C , , …, ) , 其中 T 表示在第 i 个音子上的持续时间. (C T T T
说话人识别是语音在识别方面拓展 , 目的在于通过说话人的声源信息来确定说话人的身份 , 即不同的 人说同一句话通过系统来识别, 无论内容是什么, 系统都能识别出语料库中包含的人的身份. 与工业生产 部门、 政府系统部门以及其他管理部门的实时监控 , 以及医疗设施、 社会福利等方面的支援建设等社会的 诸多方面直接接轨
Speaker Recognition based on Support Vector Machine
ZHU Dawei1 , ZHANG Yue2
( 1. School of Communications Engineering, Nanjing Institute of Technology, Nanjing 211167, China; 2. College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China)
( 5)
式中: c( ω i ) 代表子词; ω i 代表其在训练集中出现的次数. 通过与最优解的乘积获得具有相同性质的矢量 . V s ( ω) ) . 在本文中通过线性插值获得具有相同维数的矢量记为 V p , 则形成矢量为 V p = F p ( L0 , 使用 SVM 进行置信度得分计 在具有相同音子数量 L( ω) 和具有相同维数 L0 的矢量的情况下, 因此, 算采用公式
信度矢量为基础, 分别采用支持向量机方法和平均值 方法对 音 子 的 置 信 度 进行 综 合, 通过 等 错误 率 方 面 的 研究 发 现, 采用支持向量机方法大大低于平均值方法所获得的等错误率, 等错误率大致可以从 28 % 降 至 23 % , 而 系统的 复杂度仅略微地提高. 关键词: 说话人识别; 置信度; 支持向量机 中图分类号: TP391. 41
Welch 算法估算得到, 对其计算一般采用 Baum对于某个测试集 H, 对其求极大似 其中 λ ω ii - 为插值系数, -1 n +1 然估计 logp( H) , 所对应的 λ ω ii - 因此可通过条件 当 logp( H) 取最大值时, 即为最优解, 1 - n +1 得到 λ ω ii - 的迭代公式为 1 - n +1 = λ ω ii -n -1 +1
基于支持向量机的说话人识别
1 朱大伟 , 张

2
( 1. 南京工程学院通信工程学院, 江苏 南京 211167 ; 2. 南京航空航天大学计算机科学与技术学院, 江苏 南京 211106 )
摘 要: 支持向量机的说话人识别采用对音子的置信 度 进行 综 合的 原 理 来 完成 对 说 话 人 身份 的 确 认. 以 音 子 的 置
第 11 卷第 4 期
朱大伟, 等: 基于支持向量机的说话人识别
53
1
1. 1
置信度综合与等错误率实现
基于平均值法的置信度综合 一般情况下, 通过全概率公式中的后验概率获得置信度 . 音子 PH i 的置信度 CM i 的置信度计算 ( 似然
比公式) 公式为 CM i = P ( PH i | O t ) = P ( O t | PH i ) P ( PH i ) [ P( Ot ) ∑ j | PH j] P ( PH j ) ( 1)
Abstract: The recognition of speakers'identity is based on the principle that speaker recognition supporting vector machines is integrated by the note confidence. Based on the note confidence vector, the note confidence is integrated by using support vector machine method and average method. The study of error rate shows that the error rate derived from support vector machine method decreases from 28 % to 23 % , a rate considerably lower than that derived from the average method. However, the complexity of the system is only slightly improved. Key words: speaker recognition; confidence; support vector machine
映 射 到 一 个 高 维 特 征 空 间 上. 一 般 对 于 矢 量 x 的 分 类 问 题,其 表 达 式 为 f( x)
S
=
sgn [ ∑ α i y i K ( x i , 式中: S 为支持向量集合( i 为支持向量序号) ; x i 为支持向量; y i 是对应于 x i 的 x) + b ] , 分类标注; α i 和 b 是常数项; K ( ·) 为核函数. 其目的是通过这一映射使线性不可分的数据在高维特征空 间中变为线性可分. 之后在此高维空间内衍生一个具有非线性特性的最优决边界 合如图 1 所示. 具体实现步骤: 1 ) 通过 连 续 状 态 下 的 隐 马 尔 可 夫 模 型 ( CHMM ) 获 得 最 佳 观 测 序 列 的 置 信 度 音 子 矢 量 V0 = C2 , …, CN ) , ( C1 , 式中 C i 是经过 CHMM 识别器获得第 i 个音子的置信度.
[∑
N i =1
CM i 1 , CM g n ( w ) = exp ∑ log ( CM T ) }
N i i =1 i
hn
( w) =
N
N
∑ i = 1 CM i
Ti
按照上述方法计算得出某个词的置信度综合得分 , 之后采用阈值来对假设接受或者拒绝进行最终的 判断, 即 CM f ( w ) = f( CM( w ) ) = 1 1 + exp( - αCM( w ) ) ( 2)
相关文档
最新文档