改进K_means算法在声纹识别中的应用_张彩娟

一种改进的K-means聚类算法

一种改进的K-means聚类算法
王燕
【期刊名称】《计算机应用与软件》
【年(卷),期】2004(021)010
【摘要】本文提出了一种改进的K-means算法(FKM).此算法将传统算法任意选取初始聚类中心变为选取出现频率最高的一组颜色作为初始聚类中心,从而极大地提高了K-means的速度.通过实验证明了FKM较K-means有较低的时间复杂性及较低的颜色平均误差.
【总页数】2页(P122-123)
【作者】王燕
【作者单位】浙江警官职业学院信息管理系,杭州,310018
【正文语种】中文
【中图分类】TP3
【相关文献】
1.一种改进的面向差分隐私保护的k-means聚类算法 [J], 赵莉; 付世凤
2.一种改进的K-means聚类算法 [J], 宋明杰; 阎少宏
3.一种改进的K-means聚类算法 [J], 宋明杰;阎少宏
4.一种改进的简化均值粒子群K-means聚类算法 [J], 靳雁霞;齐欣;张晋瑞;程琦甫
5.基于Hadoop平台的一种改进K-means文本聚类算法 [J], 潘俊辉;王辉;张强;王浩畅
因版权原因，仅展示原文概要，查看原文内容请购买。

改进的K-means算法在电信客户细分中的应用

改进的K-means算法在电信客户细分中的应用
耿筱媛;张燕平;闫屹
【期刊名称】《计算机技术与发展》
【年(卷),期】2008(18)5
【摘要】在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的.针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度.采用改进后K-means聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,通过与统计分析的对比,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持.
【总页数】5页(P163-167)
【作者】耿筱媛;张燕平;闫屹
【作者单位】安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039;安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039;安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.改进的k-means算法在电子商务目标客户细分中的应用研究 [J], 夏同胜;黄雨辰
2.改进的K-means算法及其在铁路客户细分中的应用 [J], 邓程;杨壮英;古军杰;蔡志;李粤
3.改进K-means算法在B2C电子商务客户细分中的应用 [J], 时红军;韩兵
4.改进的k-means聚类算法在客户细分中的应用研究 [J], 杜巍;赵春荣;黄伟建
5.改进的K-Means算法在信用卡客户细分中的应用 [J], 朱艳丽; 王全蕊
因版权原因，仅展示原文概要，查看原文内容请购买。

基于粒子群优化的k-means改进算法实现Web日志挖掘

ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＡｐｐｌｉｃａｔｉｏｎｓ
计算机应用，２０１６，３６（Ｓ１）：２９—３２，３６
ＩＳＳＮ１０ｏ１．９０８１ＣＯＤＥＮＪＹＩＩＤＵ
２０１６．Ｏ６．１０
ｈｔｔｐ：／／ｗｗｗ．ｊｏｃａ．ａｎ
文章编号：１００１－９０８１（２０１６）Ｓ１—００２９—０４
ＹＡＮＧ￣ｏｎｇ，ＲＥＮＳｈｕｘｉａ，ＲＡＮＪｕａｎ，ＬＩＣｈｕｎｑｉｎｇ（１．ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ＆｜ｓｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ，ＴｉａｎｆｉｎＰｏｌｙｔｅｃｈｎｉｃＵｎｉｖｅｒｓｉｔｙ，Ｔｉａｎ３００３８７，Ｃｈｉｎａ；
摘要：针对传统的ｋ－ｍｅａｎｓ算法对庞大的Ｗｅｂ日志数据进行挖掘处理时，有对初始聚类中心的选择敏感等缺点，容易对聚类准确率产生一定影响等问题，在Ｈａｄｏｏｐ云平台基础上结合粒子群优化（ＰＳＯ）提出改进的ｋ－ｍｅａｎｓ算法。该算法使得ｋ－ｍｅａｎｓ算法不受初始聚类中心的影响，并且在Ｈａｄｏｏｐ平台上实现了算法的ＭａｐＲｅｄｕｃｅ编程。数学分析和实验结果证明：该改进算法与传统的ｋ－ｍｅａｎｓ算法相比具有更高的聚类准确率，与串行单机算法相比运行效率也有很大的提升。
关键词：Ｈａｄｏｏｐ；一ｍｅａｎｓ；粒子群优化；日志挖掘中图分类号：ＴＰ３１１文献标志码：Ａ
Ｉｍｐｒｏｖｅｄｋ－ｍｅａｎｓａｌｇｏｒｉｔｈｍｆｏｒＷｅｂｌｏｇｍｉｎｉｎｇｂａｓｅｄｏｎｐａｒｔｉｃｌｅｓｗａｍｏｐｔｉｍｉｚａｔｉｏｎ

基于半监督的K-means聚类改进算法

监督机制的ｓｇｅ— ａｓｉｌｍｅｎ算法，以解决单类中心学习问题；文献［］提出了一种半监督Ｋ均值多关系ｎ３
数据聚类算法。该算法在Ｋ均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度方法，
用于多关系数据的半监督学习；文献［］将数据之间的关联限制应用到Ｋ—ｍａｓ法中。４ｅｎ算
１传统Ｋ均值算法描述
给定一个包含ｎ个数据对象的数据集，并且由用户给出参数ｋ，随机挑选ｋ个数据对象作为初始聚类的中心，对于剩下的数据对象则根据相似度最近原则，分配给与其最相似的聚类，然后根据现有的聚
相似 ” 原则一步一步形成数据集，然后对数据集进行 “ 噪 ” 与合并相似簇，最后，利用少量的标记信息指去
导和修正聚类结果。在ＵＩＣ的多个数据集上测试，结果表明改进的算法较原始算法在准确率上有较大提高，
并且具有更好的稳定性。
关键词：半监督；Ｋ—ｎａＳ算法；聚类改进算法ｌｌｅｌ
中图分类号：Ｔ３１６Ｐ０．文献标识码：Ａ文章编号：１００１（０１１— ０９— ４０９— ３２２１）００２０
近年来，数据挖掘技术得到迅速发展，聚类分析作为数据挖掘领域最为常用的技术之一也越来越频繁地出现在实际应用领域，从而越来越多地引起人们的关注。半监督聚类是近几年提出的一种新型聚类方法，它综合了无监督学习和有监督学习的特点，提高了聚类质量，是近年来数据挖掘领域的重要研究

基于K-means算法改进的SOM神经网络调制识别分类器

ｆｒｍｏｕａｉｎｒｃｇｉｉｎ．Ｉｒｅｏｄｃｅｓｒｉｉｇｔｆｔｅｎｕａｅｗｏｋａｄｉｒｖｅｏｎｔｎｐｏａｉｔｏｄｌｔｏｅｏｎｔｏｎｏｄｒｔｅｒａｅｔａｎｎｉｏｈｅｒｌｔｒｎｍｐｏｅｒｃｇｉｏｒｂｂｌｙ，Ｋ－ａ￣ｍｅｎｉｉｍｅｎ
ｃｕｔｒｎｌｏｉｍｓｕｅＯｆｄｔｌｓｅｉｇｃｎｅｓｆｒｅｃｙｅｏｈｒｃｅｉｔｃｐｒｍｅｅｓＡｔｔｅｓｍｅｔｌｓｅｉｇａｇｒｔｈｉｓｄｔｉｗｏｃｕｔｒｎｅｔｒｏａｈｔｐｆｃａａｔｒｓｉａａｔｒ．ｎｈａｉｍｅ，ｔｅｔｈｗｏｃｕｔｒｎｅｔｒｒｓｔｅｒｇｔｗｅｇｔｖｌｅｖｃｏ．ｌｓｅｉｇｃｎｅｓａｅａｈｉｈｉｈａｕｅｔｒＫＥＹＷＯＲＤＳｍｏｕａｉｎｒｃｇｉｏｄｌｔｅｏｎｔｎ，ｓｌｏｇｎｚｎｅｔｒｐｎｕａｅｗｏｋ，Ｋ— ａｓｃｕｔｒｎｌｏｉｈｏｉｅｆｒａｉｉｇｆａｕｅｍａｅｒｌｔｒ — ｎｍｅｎｌｓｅｉｇａｇｒｍｔ
基于Ｋｍｅｎ法改进的ＳＭ神经网络调制识别分类器 — ａｓ算Ｏ
文章编号：０３５５（０１０ — ０８０１０— ８０２１）１００－３

传统的K_means聚类算法的研究与改进

初始中心，它们分别代表了相似程度较大的数据集
合，那么就找到了与数据在空间分布上相一致的初
始聚类中心。
为了找到与数据在空间分布上相一致且相似程
度较大的数据集合,采取下列步骤：
（1）计算数据对象两两之间的距离；
（2）找出距离最近的两个数据对象，形成一个数
据对象集合 A1，并将它们从总的数据集合 U 中删除；
摘要：K-means 算法是解决聚类问题的经典算法，在满足一定的条件情况下, 聚类的结果
比较好。但这种算法对初始聚类中心敏感，聚类结果随不同的初始输入而波动。针对这种缺陷，
提出了一种新的基于数据样本分布选取初始聚类中心的算法。
关键词：数据挖掘；K-means 算法；聚类
中图分类号：TP312
文献标识码： A 文章编号：1672-2914（2010）04-0059-04
（3）计算 A 中每一个数据对象与数据对象集合
U 中每一个样本的距离，找出在 U 与 A1 中最近的数据对象，将它并入集合 A1 并从 U 中删除，直到 A1 中的数据对象个数到达一定的个数（N/K）；
（4）再从 U 中找到样本两两间距离最近的两个
数据对象构成 A2，重复上面的过程，直到形成 K 个对象集合；
寻找最小的 D[Am,U];将样本数据 next 加入 Am；从集合 U 中删除 next
是 m＜k 否
分别对 Am 取平均值，得到 K 个初始聚类中心
用 K-means 方法对样本进行聚类分析
表 1 聚类分析结果
准确率% 迭代次数簇 1
簇1
80
2，3，5
1,2
3，4，5

改进的k-means算法在入侵检测中的应用

改进的k-means算法在入侵检测中的应用
张冬雯;张学杰;仇计清
【期刊名称】《微计算机信息》
【年(卷),期】2010(0)18
【摘要】针对k-means算法在聚类前必须给出聚类个数的不足,本文利用类内相异度和类间相异度对该算法进行改进,试图在初始输入条件只有初始数据集的基础上,得出较好的聚类结果.首先给出了类内相异度和类间相异度的定义,描述了改进k-means算法的定义和执行过程,最后使用KDD CUP99数据集对此改进算法进行了仿真实验,实验结果表明此改进的k-means算法相对于k-means算法在误报率方面有较好的检测效果.
【总页数】3页(P11-13)
【作者】张冬雯;张学杰;仇计清
【作者单位】050018,河北石家庄,河北科技大学理学院;050018,河北石家庄,河北科技大学信息科学与工程学院;050018,河北石家庄,河北科技大学理学院
【正文语种】中文
【中图分类】TP393.08
【相关文献】
1.基于改进K-means算法在电网企业网络入侵检测中的应用 [J], 孙章才;车勇波;姚莉;白彪;吴秋玫
2.基于K值改进的K-means 算法在入侵检测中的应用 [J], 王朔;顾进广
3.改进 k-means算法在网络入侵检测系统中的应用研究 [J], 易云飞;杨舰
4.改进的 K-means 算法在入侵检测中的应用 [J], 黎银环;张剑
5.改进的k-means算法在入侵检测中的应用 [J], 杨锴
因版权原因，仅展示原文概要，查看原文内容请购买。

基于k-means算法改进的短文本聚类研究与实现

643932489461得分数据变化趋势图?如图6所示?图6得分变化趋势图97由评分标准可知?每份数据评分满分是10分?只有在类目数确定情况下?得到分数才能超过6分?否则得到分数将只有3分以下?由图6看出?分层聚类效果最差?聚类效果波动太大?无法准确地确定聚类数目?其中有三份数据聚类错误?基于余弦距离和基于欧式距离的kmeans聚类算法效果相近?能够基本确定聚类数目?在同一份数据上出现聚类错误情况?效果最好的是改进算法?能够完全预测出正确聚类数目?并且聚类效果明显优于前面三种方法?图7算法总得分对比图由图7可以明显看到?基于kmeans改进的算法效果是最好的?接近于90分?而基于余弦距离和基于欧式距离的kmeans效果相近?表现一般分数在70到80分之间?表现最差的是分层聚类算法?分数仅有59分?实验结果表明?本文使用的基于kmeans改进算法的短文本聚类算法相较于传统kmeans算法有更高的准确率?4结束语本文对数据量少数据规模小的短文本聚类问题进行了进一步探讨?在小规模和小数据量的条件下?大型模型并不能够对这样的数据进行很好的分析?极易出现过拟合现象?因此只能选择传统的机器学习方法进行聚类研究?本文就此设计了基于kmeans的改进算法?相较于传统kmeans算法?本文算法在模型特征构建特征降维以及设计新的算法距离度量方法上进行了一些创新改进?本文提出的特征降维算法实现简单且高效?新的距离度量方法能够更明显地刻画这类特征之间的关系?在解决这类短文本聚类问题上?本文提出的基于kmeans改进算法能够提升聚类的准确率?参考文献
文章编号:１００９－２５５２(２０１９)１２－００７６－０５ＤＯＩ:１０１３２７４ / ｊｃｎｋｉｈｄｚｊ２０１９１２０１６
基于Ｋ￣ｍｅａｎｓ算法改进的短文本聚类研究与实现

基于深度学习的声纹识别算法改进研究

基于深度学习的声纹识别算法改进研究声纹识别是一种利用个体声音信息进行身份验证和识别的技术。

近年来，随着深度学习技术的快速发展，基于深度学习的声纹识别算法在提高识别准确度和鲁棒性方面取得了显著的进展。

然而，由于声音信号的多样性和噪声的影响，声纹识别仍然面临一些挑战。

因此，本文针对基于深度学习的声纹识别算法进行改进研究。

首先，我们可以考虑使用更加高效的深度神经网络结构。

目前，常用的声纹识别模型包括LSTM（长短期记忆网络）和CNN（卷积神经网络）。

我们可以尝试使用更加复杂和深层的网络结构，如DNN（深度神经网络）、RNN（循环神经网络）和Transformer等，以提高模型的特征提取和表示能力。

其次，为了增强模型的鲁棒性，我们可以引入数据增强技术。

数据增强是指根据已有数据生成新的训练样本，以增加数据的多样性和丰富性。

在声纹识别任务中，我们可以对音频数据进行随机扰动，如添加噪声、变换音调和速度等，从而减少模型对干扰的敏感性，提高识别的鲁棒性。

此外，特征选择和降维也是改进声纹识别算法的重要手段。

常用的特征选择方法包括MFCC（梅尔频率倒谱系数）、PLP（感知线性预测系数）和LFCC（线性频率倒谱系数）等。

我们可以尝试使用不同的特征选择方法，并通过对特征进行降维操作，如主成分分析（PCA）和线性判别分析（LDA），以提高声纹特征的表达和分类性能。

另外，模型的训练和优化也是影响声纹识别效果的关键因素。

我们可以尝试使用更加高效的优化算法，如Adam、RMSprop和Adagrad等，以加快模型的收敛速度和提高训练效果。

此外，为了防止模型的过拟合现象，我们可以引入正则化技术，如L1正则化和L2正则化等。

最后，数据集的规模和质量对声纹识别算法的训练和评估结果也有很大影响。

我们需要确保训练数据的覆盖范围广泛，且含有不同说话人的声音样本。

同时，我们还需要对数据集进行合理的划分，如将数据集划分为训练集、验证集和测试集，以进行模型的训练、调参和评估。