改进K_means算法在声纹识别中的应用_张彩娟
一种改进的K-means聚类算法

一种改进的K-means聚类算法
王燕
【期刊名称】《计算机应用与软件》
【年(卷),期】2004(021)010
【摘要】本文提出了一种改进的K-means算法(FKM).此算法将传统算法任意选取初始聚类中心变为选取出现频率最高的一组颜色作为初始聚类中心,从而极大地提高了K-means的速度.通过实验证明了FKM较K-means有较低的时间复杂性及较低的颜色平均误差.
【总页数】2页(P122-123)
【作者】王燕
【作者单位】浙江警官职业学院信息管理系,杭州,310018
【正文语种】中文
【中图分类】TP3
【相关文献】
1.一种改进的面向差分隐私保护的k-means聚类算法 [J], 赵莉; 付世凤
2.一种改进的K-means聚类算法 [J], 宋明杰; 阎少宏
3.一种改进的K-means聚类算法 [J], 宋明杰;阎少宏
4.一种改进的简化均值粒子群K-means聚类算法 [J], 靳雁霞;齐欣;张晋瑞;程琦甫
5.基于Hadoop平台的一种改进K-means文本聚类算法 [J], 潘俊辉;王辉;张强;王浩畅
因版权原因,仅展示原文概要,查看原文内容请购买。
改进的K-means算法在电信客户细分中的应用

改进的K-means算法在电信客户细分中的应用
耿筱媛;张燕平;闫屹
【期刊名称】《计算机技术与发展》
【年(卷),期】2008(18)5
【摘要】在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的.针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度.采用改进后K-means聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,通过与统计分析的对比,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持.
【总页数】5页(P163-167)
【作者】耿筱媛;张燕平;闫屹
【作者单位】安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039;安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039;安徽大学,计算智能与信号处理教育部重点实验室,安徽,合肥,230039
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.改进的k-means算法在电子商务目标客户细分中的应用研究 [J], 夏同胜;黄雨辰
2.改进的K-means算法及其在铁路客户细分中的应用 [J], 邓程;杨壮英;古军杰;蔡志;李粤
3.改进K-means算法在B2C电子商务客户细分中的应用 [J], 时红军;韩兵
4.改进的k-means聚类算法在客户细分中的应用研究 [J], 杜巍;赵春荣;黄伟建
5.改进的K-Means算法在信用卡客户细分中的应用 [J], 朱艳丽; 王全蕊
因版权原因,仅展示原文概要,查看原文内容请购买。
基于粒子群优化的k-means改进算法实现Web日志挖掘

计 算机 应用,2016,36(S1):29—32,36
ISSN 10o1.9081 CODEN JYIIDU
2016.O6.10
http://www.joca.an
文章编号 :1001-9081(2016)S1—0029—04
YANG  ̄ong , REN Shuxia ,RAN Juan ,LI Chunqing (1.School of Computer Science& |s ware Engineering,Tianfin Polytechnic University,Tia n 300387, China;
摘 要 :针 对传统的 k-means算法对庞 大的 Web日志数 据进行挖 掘 处理 时,有 对初 始 聚类 中心的选择敏 感 等缺 点 ,容 易对聚类准确 率产 生一 定影响等问题 ,在 Hadoop云平 台基础 上结合 粒子群 优化 (PSO)提 出改进 的 k-means算 法。该算 法使得 k-means算 法不 受初 始聚类 中心的影响 ,并且在 Hadoop平 台上 实现 了算法的 MapReduce编程。数 学 分析和 实验结果证 明 :该改进算 法与传 统的 k-means算法相 比具有 更高的聚类准确率 ,与 串行 单机算 法相 比运行 效率 也 有 很 大的 提 升 。
关 键 词 :Hadoop; 一means;粒 子 群 优 化 ;日志 挖 掘 中 图 分 类 号 :TP311 文 献 标 志码 :A
Im proved k-m eans algorithm for W eb log mining based on particle swam optim ization
基于半监督的K-means聚类改进算法

监 督机 制 的 s ge— as i l men 算法 ,以解决单 类 中心学 习问题 ;文献 [ ] 提 出 了一 种半监 督 K均值多关 系 n 3
数据聚类算法 。该算法在 K均值聚类算法的基础上扩展了其初始类簇 的选择方法和对象相似性度方法 ,
用 于多关 系数 据 的半监 督学 习 ;文献 [ ]将 数 据之 间 的关 联 限制应 用 到 K—m as 法 中 。 4 en 算
1 传 统 K均 值 算 法 描 述
给定 一个包 含 n个数 据 对象 的数 据集 ,并且 由用 户 给出参 数 k ,随机 挑选 k个数 据对 象 作 为初 始 聚 类 的中心 ,对 于剩下 的数 据对 象则 根据 相似 度最 近原则 ,分 配 给与其 最相 似 的聚类 ,然 后根 据现有 的 聚
相 似 ” 原 则一 步一 步 形 成数 据 集 , 然后 对 数据 集进 行 “ 噪 ” 与合 并 相 似 簇 , 最 后 ,利 用 少 量 的 标 记 信 息 指 去
导和修 正聚类结果。在 U I C 的多个数 据集上 测试 ,结果表 明改进 的算 法较原 始算 法在 准确率 上有较 大提 高,
并且 具 有 更好 的稳 定 性 。
关键词 :半监督 ;K—n aS算法 ;聚类改进 算法 ll el
中 图分 类 号 :T 3 16 P 0 . 文 献 标 识 码 :A 文 章 编 号 :10 0 1 (0 1 1— 0 9— 4 0 9— 3 2 2 1 )0 0 2 0
近 年来 ,数据 挖 掘技术 得 到迅速 发展 ,聚类 分 析作 为数 据挖掘 领域 最 为常用 的技 术之 一也 越来越 频 繁地 出现 在实 际应用 领 域 ,从 而越 来越 多地 引起 人们 的关 注 。半监 督 聚类 是 近几 年提 出 的一 种新 型聚类 方法 ,它综 合 了无监 督 学 习和有监 督学 习的特点 ,提 高 了聚类质 量 ,是 近年来 数 据挖 掘领域 的重 要研究
基于K-means算法改进的SOM神经网络调制识别分类器

f r mo u a in r c g iin.I r e o d c e s r i i g t ft e n u a e wo k a d i r v e o n t n p o a i t o d lto e o n t o n o d r t e r a e t an n i o h e r l t r n mp o e r c g i o r b b l y,K- a  ̄ me n i i me n
cu t rn l o i m s u e O f d t l s e i g c n e s f r e c y e o h r c e itc p r me e s Att e s me t l s e i g a g rt h i s d t i wo c u t rn e t r o a h t p fc a a t rs i a a t r . n h a i me,t e t h wo cu t rn e t r r st e rg tweg t v l e v c o . l s e i g c n e s a e a h i h i h a u e t r KEYW ORDS mo u a i n r c g i o d l t e o n t n, s l o g n zn e t r p n u a e wo k, K— a sc u t rn l o ih o i ef r a ii g f a u e ma e r l t r — n me n l se i g ag r m t
基 于 K men 法 改 进 的 S M 神 经 网络 调 制 识 别 分 类 器 — as算 O
文 章 编 号 :0 3 5 5 ( 0 1 0 — 0 8 0 1 0— 8 02 1 )10 0- 3
传统的K_means聚类算法的研究与改进

初始中心, 它们分别代表了相似程度较大的数据集
合, 那么就找到了与数据在空间分布上相一致的初
始聚类中心。
为了找到与数据在空间分布上相一致且相似程
度较大的数据集合,采取下列步骤:
(1)计算数据对象两两之间的距离;
(2) 找 出 距 离 最 近 的 两 个 数 据 对 象 , 形 成 一 个 数
据对象集合 A1,并将它们从总的数据集合 U 中删除;
摘 要:K-means 算法是解决聚类问题的经典算法,在满足一定的条件情况下, 聚类的结果
比较好。 但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。 针对这种缺陷,
提出了一种新的基于数据样本分布选取初始聚类中心的算法。
关键词:数据挖掘;K-means 算法;聚类
中图分类号:TP312
文献标识码: A 文章编号:1672-2914(2010)04-0059-04
(3)计算 A 中每一个数据对象与数据对象集合
U 中每一个样本的距离,找出在 U 与 A1 中最近的数 据对象,将它并入集合 A1 并从 U 中删除,直到 A1 中 的数据对象个数到达一定的个数(N/K);
(4)再从 U 中找到样本两两间距离最近的两个
数据对象构成 A2,重复上 面 的 过 程 ,直 到 形 成 K 个 对象集合;
寻找最小的 D[Am,U];将样本数据 next 加入 Am;从集合 U 中删除 next
是 m<k 否
分别对 Am 取平均值,得到 K 个初始聚类中心
用 K-means 方法对样本进行聚类分析
表 1 聚类分析结果
准确率% 迭代次数 簇 1
簇1
80
2,3,5
1,2
3,4,5
改进的k-means算法在入侵检测中的应用
改进的k-means算法在入侵检测中的应用
张冬雯;张学杰;仇计清
【期刊名称】《微计算机信息》
【年(卷),期】2010(0)18
【摘要】针对k-means算法在聚类前必须给出聚类个数的不足,本文利用类内相异度和类间相异度对该算法进行改进,试图在初始输入条件只有初始数据集的基础上,得出较好的聚类结果.首先给出了类内相异度和类间相异度的定义,描述了改进k-means算法的定义和执行过程,最后使用KDD CUP99数据集对此改进算法进行了仿真实验,实验结果表明此改进的k-means算法相对于k-means算法在误报率方面有较好的检测效果.
【总页数】3页(P11-13)
【作者】张冬雯;张学杰;仇计清
【作者单位】050018,河北石家庄,河北科技大学理学院;050018,河北石家庄,河北科技大学信息科学与工程学院;050018,河北石家庄,河北科技大学理学院
【正文语种】中文
【中图分类】TP393.08
【相关文献】
1.基于改进K-means算法在电网企业网络入侵检测中的应用 [J], 孙章才;车勇波;姚莉;白彪;吴秋玫
2.基于K值改进的K-means 算法在入侵检测中的应用 [J], 王朔;顾进广
3.改进 k-means算法在网络入侵检测系统中的应用研究 [J], 易云飞;杨舰
4.改进的 K-means 算法在入侵检测中的应用 [J], 黎银环;张剑
5.改进的k-means算法在入侵检测中的应用 [J], 杨锴
因版权原因,仅展示原文概要,查看原文内容请购买。
基于k-means算法改进的短文本聚类研究与实现
文章编号:1009 - 2552(2019)12 - 0076 - 05 DOI:10 13274 / j cnki hdzj 2019 12 016
基于 K ̄means 算法改进的短文本聚类研究与实现
基于深度学习的声纹识别算法改进研究
基于深度学习的声纹识别算法改进研究声纹识别是一种利用个体声音信息进行身份验证和识别的技术。
近年来,随着深度学习技术的快速发展,基于深度学习的声纹识别算法在提高识别准确度和鲁棒性方面取得了显著的进展。
然而,由于声音信号的多样性和噪声的影响,声纹识别仍然面临一些挑战。
因此,本文针对基于深度学习的声纹识别算法进行改进研究。
首先,我们可以考虑使用更加高效的深度神经网络结构。
目前,常用的声纹识别模型包括LSTM(长短期记忆网络)和CNN(卷积神经网络)。
我们可以尝试使用更加复杂和深层的网络结构,如DNN(深度神经网络)、RNN(循环神经网络)和Transformer等,以提高模型的特征提取和表示能力。
其次,为了增强模型的鲁棒性,我们可以引入数据增强技术。
数据增强是指根据已有数据生成新的训练样本,以增加数据的多样性和丰富性。
在声纹识别任务中,我们可以对音频数据进行随机扰动,如添加噪声、变换音调和速度等,从而减少模型对干扰的敏感性,提高识别的鲁棒性。
此外,特征选择和降维也是改进声纹识别算法的重要手段。
常用的特征选择方法包括MFCC(梅尔频率倒谱系数)、PLP(感知线性预测系数)和LFCC(线性频率倒谱系数)等。
我们可以尝试使用不同的特征选择方法,并通过对特征进行降维操作,如主成分分析(PCA)和线性判别分析(LDA),以提高声纹特征的表达和分类性能。
另外,模型的训练和优化也是影响声纹识别效果的关键因素。
我们可以尝试使用更加高效的优化算法,如Adam、RMSprop和Adagrad等,以加快模型的收敛速度和提高训练效果。
此外,为了防止模型的过拟合现象,我们可以引入正则化技术,如L1正则化和L2正则化等。
最后,数据集的规模和质量对声纹识别算法的训练和评估结果也有很大影响。
我们需要确保训练数据的覆盖范围广泛,且含有不同说话人的声音样本。
同时,我们还需要对数据集进行合理的划分,如将数据集划分为训练集、验证集和测试集,以进行模型的训练、调参和评估。