改进K_means算法在声纹识别中的应用_张彩娟

合集下载

一种改进的K-means聚类算法

一种改进的K-means聚类算法

一种改进的K-means聚类算法
王燕
【期刊名称】《计算机应用与软件》
【年(卷),期】2004(021)010
【摘要】本文提出了一种改进的K-means算法(FKM).此算法将传统算法任意选取初始聚类中心变为选取出现频率最高的一组颜色作为初始聚类中心,从而极大地提高了K-means的速度.通过实验证明了FKM较K-means有较低的时间复杂性及较低的颜色平均误差.
【总页数】2页(P122-123)
【作者】王燕
【作者单位】浙江警官职业学院信息管理系,杭州,310018
【正文语种】中文
【中图分类】TP3
【相关文献】
1.一种改进的面向差分隐私保护的k-means聚类算法 [J], 赵莉; 付世凤
2.一种改进的K-means聚类算法 [J], 宋明杰; 阎少宏
3.一种改进的K-means聚类算法 [J], 宋明杰;阎少宏
4.一种改进的简化均值粒子群K-means聚类算法 [J], 靳雁霞;齐欣;张晋瑞;程琦甫
5.基于Hadoop平台的一种改进K-means文本聚类算法 [J], 潘俊辉;王辉;张强;王浩畅
因版权原因,仅展示原文概要,查看原文内容请购买。

改进的K-means算法在电信客户细分中的应用

改进的K-means算法在电信客户细分中的应用

改进的K-means算法在电信客户细分中的应用
耿筱媛;张燕平;闫屹
【期刊名称】《计算机技术与发展》
【年(卷),期】2008(18)5
【摘要】在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的.针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度.采用改进后K-means聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,通过与统计分析的对比,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持.
【总页数】5页(P163-167)
【作者】耿筱媛;张燕平;闫屹
【作者单位】安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039;安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039;安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.改进的k-means算法在电子商务目标客户细分中的应用研究 [J], 夏同胜;黄雨辰
2.改进的K-means算法及其在铁路客户细分中的应用 [J], 邓程;杨壮英;古军杰;蔡志;李粤
3.改进K-means算法在B2C电子商务客户细分中的应用 [J], 时红军;韩兵
4.改进的k-means聚类算法在客户细分中的应用研究 [J], 杜巍;赵春荣;黄伟建
5.改进的K-Means算法在信用卡客户细分中的应用 [J], 朱艳丽; 王全蕊
因版权原因,仅展示原文概要,查看原文内容请购买。

基于粒子群优化的k-means改进算法实现Web日志挖掘

基于粒子群优化的k-means改进算法实现Web日志挖掘
Journal of Computer Applications
计 算机 应用,2016,36(S1):29—32,36
ISSN 10o1.9081 CODEN JYIIDU
2016.O6.10
http://www.joca.an
文章编号 :1001-9081(2016)S1—0029—04
YANG  ̄ong , REN Shuxia ,RAN Juan ,LI Chunqing (1.School of Computer Science& |s ware Engineering,Tianfin Polytechnic University,Tia n 300387, China;
摘 要 :针 对传统的 k-means算法对庞 大的 Web日志数 据进行挖 掘 处理 时,有 对初 始 聚类 中心的选择敏 感 等缺 点 ,容 易对聚类准确 率产 生一 定影响等问题 ,在 Hadoop云平 台基础 上结合 粒子群 优化 (PSO)提 出改进 的 k-means算 法。该算 法使得 k-means算 法不 受初 始聚类 中心的影响 ,并且在 Hadoop平 台上 实现 了算法的 MapReduce编程。数 学 分析和 实验结果证 明 :该改进算 法与传 统的 k-means算法相 比具有 更高的聚类准确率 ,与 串行 单机算 法相 比运行 效率 也 有 很 大的 提 升 。
关 键 词 :Hadoop; 一means;粒 子 群 优 化 ;日志 挖 掘 中 图 分 类 号 :TP311 文 献 标 志码 :A
Im proved k-m eans algorithm for W eb log mining based on particle swam optim ization

基于半监督的K-means聚类改进算法

基于半监督的K-means聚类改进算法

监 督机 制 的 s ge— as i l men 算法 ,以解决单 类 中心学 习问题 ;文献 [ ] 提 出 了一 种半监 督 K均值多关 系 n 3
数据聚类算法 。该算法在 K均值聚类算法的基础上扩展了其初始类簇 的选择方法和对象相似性度方法 ,
用 于多关 系数 据 的半监 督学 习 ;文献 [ ]将 数 据之 间 的关 联 限制应 用 到 K—m as 法 中 。 4 en 算
1 传 统 K均 值 算 法 描 述
给定 一个包 含 n个数 据 对象 的数 据集 ,并且 由用 户 给出参 数 k ,随机 挑选 k个数 据对 象 作 为初 始 聚 类 的中心 ,对 于剩下 的数 据对 象则 根据 相似 度最 近原则 ,分 配 给与其 最相 似 的聚类 ,然 后根 据现有 的 聚
相 似 ” 原 则一 步一 步 形 成数 据 集 , 然后 对 数据 集进 行 “ 噪 ” 与合 并 相 似 簇 , 最 后 ,利 用 少 量 的 标 记 信 息 指 去
导和修 正聚类结果。在 U I C 的多个数 据集上 测试 ,结果表 明改进 的算 法较原 始算 法在 准确率 上有较 大提 高,
并且 具 有 更好 的稳 定 性 。
关键词 :半监督 ;K—n aS算法 ;聚类改进 算法 ll el
中 图分 类 号 :T 3 16 P 0 . 文 献 标 识 码 :A 文 章 编 号 :10 0 1 (0 1 1— 0 9— 4 0 9— 3 2 2 1 )0 0 2 0
近 年来 ,数据 挖 掘技术 得 到迅速 发展 ,聚类 分 析作 为数 据挖掘 领域 最 为常用 的技 术之 一也 越来越 频 繁地 出现 在实 际应用 领 域 ,从 而越 来越 多地 引起 人们 的关 注 。半监 督 聚类 是 近几 年提 出 的一 种新 型聚类 方法 ,它综 合 了无监 督 学 习和有监 督学 习的特点 ,提 高 了聚类质 量 ,是 近年来 数 据挖 掘领域 的重 要研究

基于K-means算法改进的SOM神经网络调制识别分类器

基于K-means算法改进的SOM神经网络调制识别分类器

f r mo u a in r c g iin.I r e o d c e s r i i g t ft e n u a e wo k a d i r v e o n t n p o a i t o d lto e o n t o n o d r t e r a e t an n i o h e r l t r n mp o e r c g i o r b b l y,K- a  ̄ me n i i me n
cu t rn l o i m s u e O f d t l s e i g c n e s f r e c y e o h r c e itc p r me e s Att e s me t l s e i g a g rt h i s d t i wo c u t rn e t r o a h t p fc a a t rs i a a t r . n h a i me,t e t h wo cu t rn e t r r st e rg tweg t v l e v c o . l s e i g c n e s a e a h i h i h a u e t r KEYW ORDS mo u a i n r c g i o d l t e o n t n, s l o g n zn e t r p n u a e wo k, K— a sc u t rn l o ih o i ef r a ii g f a u e ma e r l t r — n me n l se i g ag r m t
基 于 K men 法 改 进 的 S M 神 经 网络 调 制 识 别 分 类 器 — as算 O
文 章 编 号 :0 3 5 5 ( 0 1 0 — 0 8 0 1 0— 8 02 1 )10 0- 3

传统的K_means聚类算法的研究与改进

传统的K_means聚类算法的研究与改进

初始中心, 它们分别代表了相似程度较大的数据集
合, 那么就找到了与数据在空间分布上相一致的初
始聚类中心。
为了找到与数据在空间分布上相一致且相似程
度较大的数据集合,采取下列步骤:
(1)计算数据对象两两之间的距离;
(2) 找 出 距 离 最 近 的 两 个 数 据 对 象 , 形 成 一 个 数
据对象集合 A1,并将它们从总的数据集合 U 中删除;
摘 要:K-means 算法是解决聚类问题的经典算法,在满足一定的条件情况下, 聚类的结果
比较好。 但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。 针对这种缺陷,
提出了一种新的基于数据样本分布选取初始聚类中心的算法。
关键词:数据挖掘;K-means 算法;聚类
中图分类号:TP312
文献标识码: A 文章编号:1672-2914(2010)04-0059-04
(3)计算 A 中每一个数据对象与数据对象集合
U 中每一个样本的距离,找出在 U 与 A1 中最近的数 据对象,将它并入集合 A1 并从 U 中删除,直到 A1 中 的数据对象个数到达一定的个数(N/K);
(4)再从 U 中找到样本两两间距离最近的两个
数据对象构成 A2,重复上 面 的 过 程 ,直 到 形 成 K 个 对象集合;
寻找最小的 D[Am,U];将样本数据 next 加入 Am;从集合 U 中删除 next
是 m<k 否
分别对 Am 取平均值,得到 K 个初始聚类中心
用 K-means 方法对样本进行聚类分析
表 1 聚类分析结果
准确率% 迭代次数 簇 1
簇1
80
2,3,5
1,2
3,4,5

改进的k-means算法在入侵检测中的应用

改进的k-means算法在入侵检测中的应用
张冬雯;张学杰;仇计清
【期刊名称】《微计算机信息》
【年(卷),期】2010(0)18
【摘要】针对k-means算法在聚类前必须给出聚类个数的不足,本文利用类内相异度和类间相异度对该算法进行改进,试图在初始输入条件只有初始数据集的基础上,得出较好的聚类结果.首先给出了类内相异度和类间相异度的定义,描述了改进k-means算法的定义和执行过程,最后使用KDD CUP99数据集对此改进算法进行了仿真实验,实验结果表明此改进的k-means算法相对于k-means算法在误报率方面有较好的检测效果.
【总页数】3页(P11-13)
【作者】张冬雯;张学杰;仇计清
【作者单位】050018,河北石家庄,河北科技大学理学院;050018,河北石家庄,河北科技大学信息科学与工程学院;050018,河北石家庄,河北科技大学理学院
【正文语种】中文
【中图分类】TP393.08
【相关文献】
1.基于改进K-means算法在电网企业网络入侵检测中的应用 [J], 孙章才;车勇波;姚莉;白彪;吴秋玫
2.基于K值改进的K-means 算法在入侵检测中的应用 [J], 王朔;顾进广
3.改进 k-means算法在网络入侵检测系统中的应用研究 [J], 易云飞;杨舰
4.改进的 K-means 算法在入侵检测中的应用 [J], 黎银环;张剑
5.改进的k-means算法在入侵检测中的应用 [J], 杨锴
因版权原因,仅展示原文概要,查看原文内容请购买。

基于k-means算法改进的短文本聚类研究与实现

643932489461得分数据变化趋势图?如图6所示?图6得分变化趋势图97由评分标准可知?每份数据评分满分是10分?只有在类目数确定情况下?得到分数才能超过6分?否则得到分数将只有3分以下?由图6看出?分层聚类效果最差?聚类效果波动太大?无法准确地确定聚类数目?其中有三份数据聚类错误?基于余弦距离和基于欧式距离的kmeans聚类算法效果相近?能够基本确定聚类数目?在同一份数据上出现聚类错误情况?效果最好的是改进算法?能够完全预测出正确聚类数目?并且聚类效果明显优于前面三种方法?图7算法总得分对比图由图7可以明显看到?基于kmeans改进的算法效果是最好的?接近于90分?而基于余弦距离和基于欧式距离的kmeans效果相近?表现一般分数在70到80分之间?表现最差的是分层聚类算法?分数仅有59分?实验结果表明?本文使用的基于kmeans改进算法的短文本聚类算法相较于传统kmeans算法有更高的准确率?4结束语本文对数据量少数据规模小的短文本聚类问题进行了进一步探讨?在小规模和小数据量的条件下?大型模型并不能够对这样的数据进行很好的分析?极易出现过拟合现象?因此只能选择传统的机器学习方法进行聚类研究?本文就此设计了基于kmeans的改进算法?相较于传统kmeans算法?本文算法在模型特征构建特征降维以及设计新的算法距离度量方法上进行了一些创新改进?本文提出的特征降维算法实现简单且高效?新的距离度量方法能够更明显地刻画这类特征之间的关系?在解决这类短文本聚类问题上?本文提出的基于kmeans改进算法能够提升聚类的准确率?参考文献
文章编号:1009 - 2552(2019)12 - 0076 - 05 DOI:10 13274 / j cnki hdzj 2019 12 016
基于 K ̄means 算法改进的短文本聚类研究与实现

基于深度学习的声纹识别算法改进研究

基于深度学习的声纹识别算法改进研究声纹识别是一种利用个体声音信息进行身份验证和识别的技术。

近年来,随着深度学习技术的快速发展,基于深度学习的声纹识别算法在提高识别准确度和鲁棒性方面取得了显著的进展。

然而,由于声音信号的多样性和噪声的影响,声纹识别仍然面临一些挑战。

因此,本文针对基于深度学习的声纹识别算法进行改进研究。

首先,我们可以考虑使用更加高效的深度神经网络结构。

目前,常用的声纹识别模型包括LSTM(长短期记忆网络)和CNN(卷积神经网络)。

我们可以尝试使用更加复杂和深层的网络结构,如DNN(深度神经网络)、RNN(循环神经网络)和Transformer等,以提高模型的特征提取和表示能力。

其次,为了增强模型的鲁棒性,我们可以引入数据增强技术。

数据增强是指根据已有数据生成新的训练样本,以增加数据的多样性和丰富性。

在声纹识别任务中,我们可以对音频数据进行随机扰动,如添加噪声、变换音调和速度等,从而减少模型对干扰的敏感性,提高识别的鲁棒性。

此外,特征选择和降维也是改进声纹识别算法的重要手段。

常用的特征选择方法包括MFCC(梅尔频率倒谱系数)、PLP(感知线性预测系数)和LFCC(线性频率倒谱系数)等。

我们可以尝试使用不同的特征选择方法,并通过对特征进行降维操作,如主成分分析(PCA)和线性判别分析(LDA),以提高声纹特征的表达和分类性能。

另外,模型的训练和优化也是影响声纹识别效果的关键因素。

我们可以尝试使用更加高效的优化算法,如Adam、RMSprop和Adagrad等,以加快模型的收敛速度和提高训练效果。

此外,为了防止模型的过拟合现象,我们可以引入正则化技术,如L1正则化和L2正则化等。

最后,数据集的规模和质量对声纹识别算法的训练和评估结果也有很大影响。

我们需要确保训练数据的覆盖范围广泛,且含有不同说话人的声音样本。

同时,我们还需要对数据集进行合理的划分,如将数据集划分为训练集、验证集和测试集,以进行模型的训练、调参和评估。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档