快速HAC聚类算法的改进及应用于无监督语音分割

合集下载

无监督聚类原理-概念解析以及定义

无监督聚类原理-概述说明以及解释1. 引言1.1 概述概述：无监督聚类是一种机器学习方法，用于将数据集中的样本按照它们的相似性分组成不同的类别，而无需事先标注的类别信息。

这种方法的核心思想是通过计算样本之间的相似性度量，将相似的样本归为同一类别，从而实现数据的自动分类和聚类。

无监督聚类方法广泛应用于数据挖掘、模式识别、图像分割、生物信息学等领域。

本文将介绍无监督聚类的基本概念、常见的算法原理以及其在实际应用中的情况。

1.2 文章结构文章结构部分的内容可以包括对整篇文章的结构和内容进行简要介绍。

具体可以包括以下内容：“文章结构”部分将着重介绍本文的组织架构，说明了本文的主要篇章分类和各篇章内容的简明概要，以及各篇章之间的逻辑关系。

文章将依次介绍无监督聚类的概念、算法和应用，并对本文的目的和意义进行阐述。

通过对文章结构的介绍，读者可以更好地理解文章的内容和逻辑结构，有助于读者更好地把握全文脉络和重点。

1.3 目的本文的目的是深入了解无监督聚类原理，探讨无监督聚类在数据分析和机器学习中的重要性和应用。

通过对无监督聚类概念、算法和应用的介绍，使读者对无监督聚类有一个全面的了解，能够在实际问题中灵活运用，为相关领域的研究和应用提供理论指导和技术支持。

同时，本文也旨在展望无监督聚类在未来的发展趋势，希望能够为相关领域的研究者和从业者提供借鉴和启发，推动无监督聚类技术的不断创新与发展。

2. 正文2.1 无监督聚类概念在机器学习和数据挖掘领域，聚类是一种常见的数据分析方法，它的目标是将数据集中的样本划分为不同的组别，使得同一组内的样本彼此相似，而不同组之间的样本则尽可能地不相似。

无监督聚类与监督学习中的分类任务不同，它并不依赖于预先标记的训练数据，而是根据数据本身的特征进行分组。

无监督聚类的基本原理是基于样本之间的相似性和距离度量来完成的。

通常情况下，我们可以使用欧氏距离、曼哈顿距离、余弦相似度等指标来计算样本之间的相似性。

一种改进的基于说话者的语音分割算法

á
收稿日期： 2000-05-10; 修改日期： 2000-08-03 基金项目：国家自然科学基金资助项目(69903006;60073030) 作者简介：卢坚(1974 －),男,浙江东阳人, 博士生,主要研究领域为音频的分割、分类和检索; 毛兵(1975 －),男,江苏无锡人,硕士
1000-9825/2002/13(02)0274-06
©2002 Journal of Software
软件学报
Vol.13, No.2
一种改进的基于说话者的语音分割算法
卢坚, 毛兵, 孙正兴, 张福炎
(南京大学计算机科学与技术系,江苏南京 E-mail: jlu@ 210093); 210093) (南京大学计算机软件新技术国家重点实验室,江苏南京
1.1 1 0.9 0.8 0.7 0.6 0.5 0.4 Mean②( µ) 0 0.1 0.2 0.3 ①阈值,②均值. 0.4 0.5 Threshold ( θ)
①
(5)
有很好的特性, 即 GLR 距离在说话者的改变点具有高且窄的峰值, 并且同态的语音段中 GLR 距离的变化幅度比较平稳.因此我们采用 GLR 距离作为语音相似度的度量. 阈值的选取是基于距离的分割算法中的一个重要问题 ,而阈值的选取与语音数据, 通道和录音环境等多种因素有关.因此,本文提出一种基于 GLR 距离方差的自适应的阈值选取方法 , 其思想是采用函数拟合的方法建立语音数据 , 通道和录音环境等因素和阈值之间的非线性关系. 候选的分割点的选取规则是:GLR 距离的方差大于阈值的局部极大点被标记为候选分割点 . 根据距离方差选取候选分割点可以在一定程度上消除语音数据类型, 通道和录音环境等因素对阈值的影响 . 根据 GLR 距离的特性,即同态语音段其距离方差的变化幅度比较平稳 , 因此如果我们对距离方差做比 (6)

深度学习中的无监督学习方法与应用(Ⅰ)

深度学习中的无监督学习方法与应用在深度学习领域，无监督学习方法一直备受关注。

与监督学习不同，无监督学习不需要标记的训练数据，而是通过对数据的自动学习和聚类来发现数据中的模式和结构。

这种方法在处理大规模数据、自然语言处理、图像识别等领域有着广泛的应用。

本文将探讨无监督学习在深度学习中的方法和应用。

一、无监督学习方法无监督学习方法主要包括自编码器、生成对抗网络（GAN）、聚类等。

其中，自编码器是一种常见的无监督学习方法。

它通过将输入数据编码成潜在空间的表示，再将其解码成原始输入来学习数据的特征。

自编码器可以用于降维、特征提取和去噪等任务。

生成对抗网络是另一种重要的无监督学习方法，它由生成器和判别器组成，通过对抗训练来生成接近真实数据的样本。

聚类算法则是将数据分成不同的类别，常见的算法包括K均值、层次聚类等。

二、无监督学习在图像处理中的应用在图像处理领域，无监督学习方法有着广泛的应用。

自编码器可以用于图像去噪，通过学习数据的特征来去除图像中的噪声。

生成对抗网络可以用于图像生成，它可以生成逼真的图像样本，被广泛应用于风格迁移、图像修复等任务。

聚类算法可以用于图像分割，将图像分成不同的区域，有助于图像分析和理解。

三、无监督学习在自然语言处理中的应用在自然语言处理领域，无监督学习方法也有着重要的应用。

自编码器可以用于词嵌入，将词语映射到低维空间的表示，有助于语义分析和情感分类。

生成对抗网络可以用于文本生成，它可以生成逼真的语言模型，被广泛应用于对话系统、机器翻译等任务。

聚类算法可以用于文本聚类，将文本分成不同的类别，有助于信息检索和文本分类。

四、无监督学习在其他领域的应用除了图像处理和自然语言处理，无监督学习方法还在其他领域有着重要的应用。

在推荐系统中，自编码器可以用于推荐商品，通过学习用户的行为特征来提高推荐的准确性。

在金融领域，聚类算法可以用于风险管理，将客户分成不同的风险组，有助于个性化的金融服务。

五、未来展望随着深度学习技术的不断发展，无监督学习方法将会得到更广泛的应用。

基于深度学习的聚类算法研究及其在图像分割中的应用

基于深度学习的聚类算法研究及其在图像分割中的应用一、引言随着数字化时代的到来，图像分割技术作为图像处理领域中的一个重要分支，得到了广泛的研究和应用。

然而，由于图像中的信息量过大以及噪声和复杂背景的影响，传统的图像分割方法往往难以得到令人满意的结果。

因此，近年来，基于深度学习的聚类算法逐渐成为研究和应用图像分割领域的热点。

二、聚类算法介绍聚类算法是一种无监督学习方法，用于将数据集中的对象按照相似度或其他的准则分为不同的类别。

在深度学习方面，聚类算法可以帮助提取数据中的特征，进而进行图像分割。

目前，常用的聚类算法包括K-means、DBSCAN、层次聚类等，其中K-means 算法是应用最为广泛的一种。

K-means算法是一种基于距离的聚类算法。

该算法通过不断移动质心，将所有的样本分为K个类别。

在进行K-means算法之前，需要先确定聚类的数量K。

然后，该算法通过迭代计算每个样本点与K个质心的距离，将所有的数据对象划分到与其距离最近的质心所对应的类别中。

最后，根据每个类别中数据对象的均值计算出新的质心，直到质心不再移动。

三、基于深度学习的聚类算法在图像分割中的应用基于深度学习的聚类算法可以帮助提取图像数据中的特征，从而实现对图像的分割。

图像分割是将图像分为若干个子区域的过程。

这些子区域通常反映出图像中的不同目标、纹理、颜色或亮度等。

基于深度学习的聚类算法在图像分割领域中应用广泛，通常可以分为以下步骤：1. 输入图像进行数据预处理。

例如，可以进行图像的缩放、降噪和灰度化等操作，减少噪声和数据量，并更好地获取特征数据。

2. 制定聚类算法。

目前，常用的聚类算法包括K-means、DBSCAN、层次聚类等。

根据具体情况，可以选择合适的聚类算法进行分析。

3. 使用深度神经网络提取特征。

将图像数据输入深度神经网络中，通过多层网络进行特征提取，例如卷积层、池化层和全连接层等。

经过这一步，可以获得图像的更高级别的特征向量。

无监督学习中的聚类算法综述

无监督学习中的聚类算法综述聚类算法是无监督学习中的一种重要方法，其主要目的是发现数据中的相似性和分类结构。

本文将从算法的基本概念入手，综述目前常见的聚类算法及其应用。

一、基本概念聚类算法是一种将相似对象组合成簇的无监督学习方法，其目标是在不知道数据类别的情况下自动地将数据进行分类。

在聚类算法的过程中，每个簇代表一组相似的数据，而所有的簇组合起来则代表了整个数据集的结构。

聚类算法主要包括两类：基于原型的方法和基于分层的方法。

基于原型的方法假设存在k个原型，并通过调整原型，将所有数据分配到不同的簇中。

其中比较典型的算法有k-means算法和高斯混合模型；而基于分层的方法在不同的距离度量下，构建不同的层次结构，并将数据分配到相应的层次结构中。

其中比较典型的算法有层次聚类和DBSCAN。

二、常见聚类算法1. k-means算法k-means算法是一种基于原型的聚类算法，其核心思想是将n 个样本分为k个簇，使得目标函数最小化。

算法的过程主要包括初始化、样本分配和簇重心更新三个步骤。

k-means算法的优点是对大数据集的处理速度较快，但其缺点也显而易见，例如局限于欧式距离、对k的选择敏感等。

2. 高斯混合模型高斯混合模型是一种基于原型的聚类算法，兼顾了k-means算法的速度和高斯概率密度函数的统计特性。

其基本思想是将数据分为k个高斯分布，并通过最大化每个分布分别产生所有数据的概率，进行模型训练。

在实际应用中，高斯混合模型比k-means 算法更能够适应各种数据分布。

3. 层次聚类层次聚类是一种基于分层的聚类算法，其主要思想是将数据看作树形结构，并不断进行层次划分，直到满足预先设定的聚类条件。

在层次聚类中，两个簇的合并过程需要选择一个适当的距离度量，包括单链接（即最短距离法）、全链接（即最大距离法）、平均链接法等。

其优点是不需要先验知识，缺点则在于计算复杂度较高。

4. DBSCANDBSCAN是一种基于密度的聚类算法，其主要思想是将具有较高密度的样本组成一个簇，并将较低密度的样本作为噪声单独处理。

大数据挖掘中的混合差分进化K-Means无监督聚类算法

大数据挖掘中的混合差分进化K-Means无监督聚类算法吴雅琴;王晓东【摘要】K-Means无监督聚类算法是现有聚类算法中最为典型的划分算法.针对K-Means聚类算法初始参数依赖性较高且聚类结果稳定性较差的问题,提出了一种改进的混合差分进化算法,并将混合差分进化算法引入K-Means聚类中.通过个体适值函数把种群视为2个子种群的混合体,并按照不同的变异策略和参数对2个子种群分别进行动态更新,提高了获取全局最优的概率.实验结果表明:相比K-Means 聚类算法、基于差分进化的K-均值聚类算法,所提出方法能够有效提高聚类质量和收敛速度,较好地解决了K-Means聚类算法容易陷入局部最优陷阱的问题.【期刊名称】《重庆理工大学学报（自然科学版）》【年(卷),期】2019(033)005【总页数】6页(P107-112)【关键词】差分进化;聚类分析;大数据挖掘;K-Means;收敛速度;全局最优【作者】吴雅琴;王晓东【作者单位】内蒙古医科大学计算机信息学院,呼和浩特010110;内蒙古医科大学计算机信息学院,呼和浩特010110【正文语种】中文【中图分类】TP311.13近年来，随着计算机和互联网技术的快速发展，人们在工作和生活中产生了各种形式的数据，如文本、图像、音频、视频等，这些数据的存储量正变得越来越大。

如何准确和有效地从这些海量数据中抽取出隐藏的、有价值的信息成为计算机科学领域中的研究热点，由此数据挖掘技术应运而生[1-2]。

数据挖掘又称知识发现，即“从数据中挖掘知识”，可以看作信息技术自然进化的结果。

聚类分析作为大数据挖掘中最为重要的方法之一，已经得到了人们越来越多的关注[3]。

其中，K-Means无监督聚类算法是现有聚类算法中最为典型的划分算法。

目前，K-Means 聚类算法在情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等领域得到了广泛应用[4]。

K-Means聚类算法作为聚类分析中广泛应用的一种经典算法，具有算法结构简单、运行效率高且适用范围大等优点。

《基于改进K-means聚类和WKNN算法的WiFi室内定位方法研究》范文

《基于改进K-means聚类和WKNN算法的WiFi室内定位方法研究》篇一一、引言随着无线通信技术的快速发展，室内定位技术在诸多领域如智能建筑、物流管理、智慧城市等扮演着日益重要的角色。

其中，WiFi因其覆盖面广、布网方便和低成本等优势，已成为室内定位的主流技术之一。

然而，传统的WiFi室内定位方法在面对复杂多变的室内环境时，仍存在定位精度不高、稳定性差等问题。

因此，本文提出了一种基于改进K-means聚类和WKNN（加权k近邻）算法的WiFi室内定位方法，旨在提高定位精度和稳定性。

二、K-means聚类算法的改进K-means聚类算法是一种常用的无监督学习方法，通过迭代优化将数据划分为K个聚类，使得每个聚类内部的样本具有较高的相似性。

在WiFi室内定位中，我们可以将WiFi信号强度作为数据特征，利用K-means算法对不同位置点的WiFi信号强度进行聚类。

然而，传统的K-means算法在处理大规模数据时存在计算复杂度高、易陷入局部最优等问题。

因此，本文提出了一种改进的K-means算法。

该算法通过引入密度峰值检测技术，能够在迭代过程中自动识别并剔除噪声数据和异常值，从而提高聚类的准确性和稳定性。

此外，我们还采用了一种基于质心的初始化方法，以减少算法陷入局部最优的可能性。

三、WKNN算法的引入WKNN算法是一种基于距离度量的分类与回归方法，通过计算待测样本与已知样本之间的距离，并赋予不同的权重，以实现对未知样本的分类或预测。

在WiFi室内定位中，我们可以将WKNN算法应用于计算用户设备（UE）与各个接入点（AP）之间的距离，进而确定UE的位置。

相比传统的KNN算法，WKNN算法通过引入权重因子，能够更好地处理不同特征之间的差异性，提高定位精度。

此外，WKNN算法还可以通过调整权重的计算方式，灵活地适应不同的应用场景和需求。

四、基于改进K-means和WKNN的WiFi室内定位方法本文将改进的K-means聚类算法和WKNN算法相结合，提出了一种新的WiFi室内定位方法。

基于深度学习的无监督聚类算法研究与应用

基于深度学习的无监督聚类算法研究与应用摘要：无监督聚类是机器学习领域中的重要研究方向之一。

深度学习作为一种强大的机器学习技术，近年来在无监督聚类中取得了显著的进展。

本文将重点研究基于深度学习的无监督聚类算法，并探讨其在实际应用中的潜力和局限性。

1. 引言无监督聚类是一种将数据集中的样本划分为不同群体或簇的技术。

传统的无监督聚类算法，如K-means和层次聚类，通常基于统计和几何原理。

然而，这些传统方法在处理高维数据和复杂结构时存在局限性。

近年来，随着深度学习技术的发展，基于深度学习的无监督聚类算法逐渐成为热点。

2. 基于深度学习的无监督聚类算法2.1 自编码器自编码器是一种常用于特征提取和降维任务中的神经网络模型。

其主要思想是通过将输入数据映射到一个低维的隐藏层表示，并尽可能地将隐藏层表示重新映射回原始数据空间，从而实现数据的重构。

自编码器可以通过学习到的隐藏层表示来实现无监督聚类。

2.2 变分自编码器变分自编码器是一种基于概率图模型的无监督学习算法。

其主要思想是通过学习一个潜在变量模型来解释输入数据，并通过最大化潜在变量后验概率来实现聚类。

变分自编码器在处理高维数据和复杂结构时具有优势。

2.3 生成对抗网络生成对抗网络（GAN）是一种由生成器和判别器组成的对抗性模型。

生成器试图从随机噪声中生成逼真的样本，而判别器试图区分真实样本和生成样本。

GAN可以通过训练过程中不断优化生成器和判别器之间的对抗性目标函数来实现无监督聚类。

3. 基于深度学习的无监督聚类算法应用3.1 图像聚类基于深度学习的无监督聚类算法在图像聚类中具有广泛应用。

通过将图像映射到低维的隐藏层表示，可以实现对图像的有效聚类。

这种方法可以应用于图像检索、图像分类和图像生成等任务。

3.2 文本聚类文本聚类是自然语言处理中的重要任务之一。

基于深度学习的无监督聚类算法可以将文本映射到低维的语义空间，从而实现对文本的有效聚类。

这种方法可以应用于文档分类、情感分析和信息检索等任务。

改进的聚类分析算法及其性能分析

ＧＵＳｕｉ，ＷＵＸｉｏｘｎ，ＨＵＡＯｈ－ｅｊａ－ｉＮＧｉＪｅ（ｏａｄａｄＣｎｒｌＣｎｅｆＡｍ１５，Ｄｌｎｉｏｉ１０３ｈｎ）Ｃｍｍｎｎｏｔｅｔｒｏｒｙ９５０ａｉ，Ｌａｎｎ１６２，Ｃｉａｏａｇ
ＡｂｔａｔＡｎｉｒｖｄｌｓｅｉｇｎｌｉａｇｒｔｍｉｐｏｓｄＵｓｎｔｅｉｅｓｍｉｒｏｈｌ－ｎｓｅｃｕｔｒｎａｄｉｎｌｓｒｃ：ｍｐｏｅｃｕｔｒａａｙｓｓｌｏｉｈｎｓｒｐｏｅ．ｉｇｈｄａｉｌｔａｆｆｉｈｄｌｓｅｉｇｎｆａａｉｃｕｔｒｇｉｔｉｕｉｎ，ｔｅｌｒｈｉｒｔｃｕｔｒｃｎｅｔａｅｒｇｉｓｏｅＫｃｕｔｒ，ａｄｔｅｌｓｅｓｅａｉｅｙｃｔｒｄｒｅｌｓｅｉｄｓｒｂｔｏｎｈａｇｏｉｍｆｓｌｌｓｅｓｏｃｎｒｔｄｅｏｎｔｇｔｔｙｌｓｅｓｎｈｎｃｕｔｒｒｌｔｖｌｓａｔｅｆｅｅｄｔｉＫ— ｅｎｓａａｎｍａ，ｗｈｃｍａｅｃｕｔｒｎａａｙｉａｗａｓｏｌｗｏｔｍａｄｉｃｉｎｎｔｒｔｖｐｏｅｓｒｄｃｓｔｒｔｎｉｓｎｉｈｋｓｌｓｅｉｇｎｌｓｓｌｙｆｌｏｐｉｌｒｔｏｉｉｅａｉｅｒｃｓ，ｅｕｅｉａｉｔｍｅａｄｅｅｏｉｒｖｓｃｎｅｇｎｅｓｅｄ．Ｔｈａｇｏｉｍｉｔｇｒｔｓｔｅａａｔｇｅｏｇｉ — ａｅｃｕｔｒｎａｄＫａｓｃｕｔｒｎ，ａｄｍｐｏｅｏｖｒｅｃｐｅｅｌｒｔｈｎｅａｅｈｄｖｎａｓｆｒｄｂｓｄｌｓｅｉｇｎｍｅｎｌｓｅｉｇｎｉｔｏｕｅａｅｎｒｄｃｓｎｗａｇｒｔｍｏｐｒｉｏｉｇｒｄｎｎｗｆｎｔｏｏｆｃｍｐｔｎｄｎｓｔｔｒｓｏｄ．Ｔｅｈｏｅｉａａａｙｉａｄｌｏｉｈｆａｔｉｎｎｇｉａｄｅｔｕｃｉｎｏｕｉｇｅｉｙｈｅｈｌｈｔｅｒｔｃｌｎｌｓｓｎｅｐｒｍｅｔｐｏｅｈｔｔｅｃｕｔｒｎｏｅｓｆｔｅｍｐｏｅｌｏｉｍｃｉｖｓａｉｆｃｏｙｒｓｔ．ｘｅｉｎｓｒｖｔａｈｌｓｅｉｇｐｒｃｓｏｈｉｒｖｄａｇｒｔｈａｈｅｅｓｔｓａｔｒｅｕｌｓＫｅｒｓｃｕｔｒｎｌｓｓＫ— ｅｎａｇｒｔｍ；ｇｉ — ａｅｌｓｅｉｇ；ｆｓｏｌｓｅｉｇｙｗｏｄ：ｌｓｅｉａａｙｉ；ｎｇｍａｓｌｏｉｈｒｄｂｓｄｃｕｔｒｎｕｉｎｃｕｔｒｎ

聚类算法在图像分割中的应用

聚类算法在图像分割中的应用图像分割是图像处理领域中的一个非常重要的任务，其目的是将一幅图像分成若干个不同的区域，从而实现对图像中不同目标的分割及分析。

而聚类算法作为一种常用的图像分割方法，已经被广泛应用。

一、什么是聚类算法聚类算法是一种无监督学习算法，其主要目的是将具有相似特征的数据点归为一类，而将不同类别之间的数据点进行区分。

聚类算法可以用于解决许多问题，例如市场细分、图像分割，以及生物学上的分类等。

二、在图像分割中，聚类算法主要是基于像素点的相似性对图像进行分割处理。

具体来说，聚类算法将图像中的每一个像素点视为一个数据点，然后将这些数据点按照其像素灰度值和颜色属性进行聚类分析。

1. K-Means聚类算法K-Means聚类算法是一种常用的聚类算法，其主要思想是将样本分成K个簇，其中K是预先指定的参数。

这种算法可以用于图像分割，通过将图像中的所有像素点分成几个簇，从而实现对图像的分割。

该算法的具体流程是：首先，从图像中选择K个像素点作为聚类的中心点；然后将所有像素点分配到与其最近的聚类中心中；接下来，重新计算每个聚类中心的位置；重复以上步骤，直到算法收敛为止。

2. 基于密度聚类算法基于密度聚类算法是指将具有足够密度的区域划分为簇，从而实现对图像的分割。

与传统的K-Means聚类算法不同的是，基于密度聚类算法并不需要预先指定聚类簇的数量，而是通过计算每个样本点的密度来进行聚类分析。

这种算法可以用于图像分割，其具体流程是：首先，从图像中选择一个样本点，然后计算该样本点周围的密度；然后将具有足够密度的像素点划分为一个聚类簇；接着，重复以上步骤，直到完成聚类分析。

三、聚类算法在图像分割中的优势相较于其他图像分割方法，聚类算法有着很多优势，主要包括以下几点：1. 聚类算法可以自动确定聚类簇的数量，不需要手动设置。

2. 聚类算法可以提供比其他方法更加准确的图像分割结果。

3. 聚类算法可以快速、高效地处理大规模图像数据。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Computer Science and Application 计算机科学与应用, 2020, 10(8), 1464-1470Published Online August 2020 in Hans. /journal/csahttps:///10.12677/csa.2020.108153Improvement of Fast HAC ClusteringAlgorithm and Application to Unsupervised Speech SegmentationZhanjiang Wei, Yu LiangSchool of Software, Yunnan University, Kunming YunnanReceived: Jul. 26th, 2020; accepted: Aug. 10th, 2020; published: Aug. 17th, 2020AbstractHAC is a commonly used clustering method. According to the close relationship between pho-nemes and continuous time in speech features, the purpose of this paper is to improve the HAC fast algorithm to improve the unsupervised segmentation of speech signals to similar phoneme units. The algorithm is based on the fact that the similarity of the same segment feature is higher than that of the cross-segment feature. The similarity of features is to calculate the Euclidean dis-tance between adjacent features to obtain the adjacent distance double-linked list of input speech features. Each node in the linked list is composed of the distance of adjacent speech features and pointers pointing to the adjacent nodes before and after. The algorithm also traverses the linked list of adjacent distance nodes, finds the minimum distance, combines similar adjacent features, and iterates to the last class or satisfies a certain threshold. The whole process is completed com-pletely without supervision. This method is better than the fast HAC algorithm. Compared with the fast HAC algorithm, it can improve the clustering speed by more than 65 times, save more memory space, and can be applied to zero-resource speech segmentation.KeywordsUnsupervised, Phoneme, HAC Algorithm, Speech Segmentation, Adjacent快速HAC聚类算法的改进及应用于无监督语音分割韦占江，梁宇云南大学软件学院，云南昆明收稿日期：2020年7月26日；录用日期：2020年8月10日；发布日期：2020年8月17日韦占江，梁宇摘要HAC 是一种常用的聚类方法。

本文的目的是根据语音特征中的音素与连续时间的紧密关系，改进HAC 快速算法提高无监督分割语音信号到类似音素单位。

该算法是基于同一段特征相似度高于跨段特征的相似度。

特征的相似度是通过计算相邻特征间的欧式距离，来得到输入语音特征相邻的距离双链表，链表中的每个节点由语音相邻特征的距离和指向前后相邻节点的指针组成。

该算法也是通过遍历相邻距离节点链表，查找最小距离后，对相似的相邻特征进行合并，并重复迭代至最后一个类或满足某个阀值。

整个过程完全基于无监督下完成，该方法优于快速HAC 算法，与快速HAC 算法相比能提升65倍以上的聚类速度，节约更多的内存空间，可应用于零资源的语音分割。

关键词无监督，音素，HAC 算法，语音分割，相邻Copyright © 2020 by author(s) and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY 4.0). /licenses/by/4.0/1. 引言人工智能对输入的未知事物进行分类判别，很大程度依据聚类将数据点按照一定规则进行分群[1]。

根据距离或相似度对数据点聚类，是研究诸多自然和社会问题的有力工具。

而在各种聚类算法中，分层聚类具有特别的优势[2]。

聚类是一个把数据对象集划分成多个组或簇的过程，使得簇内的对象具有很高的相似性[2]。

但与其他簇中的对象很不相似。

数据间的距离通常使用距离度量。

数据对象的簇可以看成隐含的类[3]。

在这种意义下，聚类有时又称自动分类。

聚类过程中可自动地发现这些分组，这是聚类分类的突出优点。

也被称为无监督学习，因为在没有标签信息情况下，可实现自动分类。

由于这种原因，聚类是通过观察学习，而不是通过有标签的示例学习。

2. 引言语音信号可视为基本音素单元的序列。

现今很多自动语音识别系统依赖于这些基本单元准确识别。

当前成熟的百度搜索也是基于文字的检索，而基于语音对语音的搜索有巨大的市场需求。

但无监督的语音研究困难重重，语音分割是声学片段建模中至关重要的初始步骤，该步骤在音频搜索和无监督声学建模得到了广泛应用。

以语音分割成基本单位涉及声道系统从一种状态转换到另一种状态的时刻。

但是，过渡并不是突然发生的，而是连续发生的[4] [5] [6] [7]。

通常，聚类的方法有很多种常见的有K-means [8] [9]、层次聚类(Hierarchical clustering)、谱聚类(Spectral Clustering)、GMM 等方法[8]。

其中，ward’s method [10]是聚类中一种常用方法，该方法对不相邻的特征(样本)的距离都要一一计算，计算量大，内存开销大，需要好的算法来处理这个问题[7]。

尤其，当输入的语音序列比较大时，常规的凝聚型层次聚类Hierarchical methods (HAC)方法就变得很慢。

于是本文根据语音特征本身就具有相邻语音有较高的相似性，跨段语音差异更大的特点。

提出基于HAC 算法基础上相邻快速HAC 算法解决时间长、内存开销大等问题，并应用到语音分割中来。

韦占江，梁宇3. 层次聚类的原理及分类3.1. 层次法(Hierarchical methods)系统聚类也称层次聚类法。

该算法先计算特征之间的距离，如欧式距离。

在迭代过程中，每次查找到距离最近的点并合并到同一个类。

然后，再计算新类与剩余类之间的距离，继续将距离最近的类合并为一个大类。

不停的合并，直到合并到一个类或满足某个阀值。

其中类与类的距离的计算方法有：最短距离法，最长距离法，中间距离法，类平均法等。

比如最短距离法，将类与类的距离定义为类与类之间样本的最短距离[11]。

根据层次分解的顺序层次聚类算法可分为：自下向上和自上向下两种方法，即凝聚的层次聚类算法和分裂的层次聚类算法，也可以理解为自下而上法(bottom-up)和自上而下法(top-down)。

自下而上法的凝聚型层次聚类初始化时每个个体(object)都是一个类，然后根据linkage 寻找同类，最后形成一个“类”[12]。

而分裂型层次聚类采用自上而下法，就是反过来，初始化时所有个体都属于一个“类”，然后根据linkage 排除相似度不高的类，最后每个个体都成为一个“类”[11]。

3.2. 层次聚类的流程凝聚型层次聚类的策略是先将每个对象作为一个簇，然后合并这些原子簇为越来越大的簇，直到所有对象都在一个簇中，或者某个终结条件被满足。

绝大多数层次聚类属于凝聚型层次聚类，它们只是在簇间相似度的定义上有所不同。

这里给出采用最小距离的凝聚层次聚类算法流程[13] [14]如下：算法1 HAC 算法1) 将每个对象看作一个独立的类，计算两两之间的距离，并找出最小距离；2) 将距离最小的两个类合并成一个新类；3) 重新计算新类与所有类之间的距离；4) 重复(2)、(3)，直到所有类最后合并成一类。

从上面算法1可以看出凝聚的层次聚类并没有类似基本K 均值的全局目标函数，没有局部极小问题或是很难选择初始点的问题。

合并的操作往往是最终的，一旦合并两个簇之后就不会撤销。

当然其计算存储的代价是昂贵的。

3.3. 层次聚类的优缺点层次聚类算法的优点有：距离和规则的相似度容易定义，限制少；不需预设聚类数k ；可以发现类的层次关系；可以聚类成其它形状。

缺点有：计算复杂度太高，当特征(样本)数量很多就需要很多时间；奇异值也能产生很大影响；算法很可能聚类成链状。

这个方法其实效率比较低，特别是算cluster 的ESS 值还要先求均值点，然后算距离的平方再求和，不过有一个快速的计算方法叫Lance-Williams Algorithm [15] (快速HAC)可以大大简化ward method 的计算。

该算法可以不用ESS 的公式计算ESS ，直接套用下面的公(1)。

(),12k i j ki kj ki kj D D D D D +=+−− (1)其中，初始的ESS 由两点之间的距离决定，也就是说完全不需要算ESS 了。

但计算量和内存开销也大。

因此，根据语音特征分割所具有的特点，进一步改进HAC 算法有效解决语音特征分割面临的时间和空间的问题。