基于K均值动态聚类分析的土样识别_王同兴
K均值算法在农业生产中的应用方法(十)

K均值算法在农业生产中的应用方法随着科学技术的不断进步,农业生产也在向智慧化、高效化的方向迈进。
K均值算法作为一种经典的聚类分析方法,被广泛应用于各个领域,包括农业生产。
本文将探讨K均值算法在农业生产中的应用方法,并结合实际案例加以说明。
K均值算法是一种将n个对象划分成k个簇的方法,使得每个对象都属于离它最近的均值所对应的簇。
在农业生产中,K均值算法可以用于种植业、畜牧业和渔业等多个领域。
首先,我们来看种植业。
在种植业中,K均值算法可以帮助农民对不同地块的作物进行分类和管理。
通过对土壤、气候、水质等因素进行数据采集,并结合K均值算法的聚类分析,可以将种植地块分成若干个簇,便于农民有针对性地进行施肥、浇水等管理工作。
比如,对于土壤酸碱度、养分含量较接近的地块可以放在同一簇,统一施加相应的肥料,提高施肥的精准度和效果。
其次,K均值算法也可以在畜牧业中发挥作用。
在畜牧业中,可以利用K均值算法对不同牲畜进行分类,提高饲养管理的效率。
通过对牲畜的体重、体型、饲料摄入量等数据进行采集,并进行聚类分析,可以将牲畜分成不同的簇,便于畜牧场对不同簇的牲畜进行分区管理,制定不同的饲养计划和饲料配比,提高饲养效益。
最后,K均值算法还可以在渔业中应用。
在渔业中,K均值算法可以帮助渔民根据不同的水域、水温、水深等因素进行渔场划分和渔获预测。
通过对海洋环境数据的聚类分析,可以将渔场划分成不同的簇,渔民可以有针对性地选择渔场,提高捕捞效率和渔获量。
综上所述,K均值算法在农业生产中有着广泛的应用前景。
利用K均值算法对农业生产数据进行分析,可以帮助农民和渔民更好地管理土地、作物、牲畜和渔场,提高生产效率和经济效益。
随着科技的不断进步,相信K均值算法在农业生产中的应用会越来越广泛,为农业现代化发展提供更多的可能性。
K均值算法在农业生产中的应用方法

K均值算法在农业生产中的应用方法一、引言K均值算法是一种常用的无监督学习算法,它可以将数据集中的样本划分为K个不同的簇。
在农业生产中,K均值算法可以被用来进行土壤分类、作物生长状况分析、灾害预测等方面的应用。
本文将探讨K均值算法在农业生产中的具体应用方法。
二、土壤分类土壤是农业生产中至关重要的基础,不同类型的土壤对于不同植物的生长具有不同的影响。
利用K均值算法可以对土壤进行分类,根据土壤的PH值、有机质含量、氮磷钾含量等指标,将土壤划分为不同的类型。
通过这种分类方法,农民可以更好地选择适合特定土壤类型的作物种植,从而提高农作物的产量和质量。
三、作物生长状况分析通过K均值算法对农田中的作物生长状况进行分析,可以帮助农民及时发现作物的生长异常情况。
利用无人机或者传感器获取农田中的作物生长数据,然后通过K均值算法将这些数据进行聚类分析,将作物分为不同的生长状态。
这样的方法可以帮助农民及时调整施肥、灌溉等措施,保证作物的正常生长。
四、灾害预测农业生产中常常会遭受自然灾害的影响,例如洪涝、干旱、病虫害等。
利用K均值算法可以对历史灾害数据进行聚类分析,找出不同类型灾害的发生规律和特点。
通过这种方法,可以对未来可能发生的灾害进行预测,从而及时采取相应的防灾减灾措施,保障农业生产的稳定。
五、数据处理方法在实际应用中,K均值算法需要结合数据预处理、参数选择等步骤才能更好地发挥作用。
对于农业生产中的数据,通常需要进行数据清洗、特征选择、数据标准化等预处理操作,以确保数据的质量和准确性。
此外,K均值算法中K值的选择也需要谨慎,可以通过交叉验证等方法选择最优的K值。
六、结论K均值算法作为一种无监督学习算法,在农业生产中具有广泛的应用前景。
通过对土壤、作物生长状况、灾害预测等方面的数据进行分析和处理,可以为农民提供科学的决策支持,提高农业生产的效率和质量。
未来,随着信息技术的发展和数据采集手段的不断改进,K均值算法在农业生产中的应用将更加广泛和深入。
基于K -均值聚类的混合聚类算法

基于K -均值聚类的混合聚类算法刘明术【期刊名称】《安庆师范学院学报(自然科学版)》【年(卷),期】2016(000)001【摘要】K -均值聚类算法是聚类算法中比较典型的算法之一,在其各类改进算法中都受到了离群点、初质心、类个数等因素的干扰。
本文利用相似密度提出一种新的聚类初始质心选取和离群点判别方法,对 K -均值聚类算法进行了改进。
通过实验证明改进算法提高了聚类的有效性和稳定性。
%K-means is one of typical clustering algorithm, but it is easily affected by the outliers, the initial cluster center of mass, and the given cluster number and so on.In this paper, the method of similar density is used to determine the initial cluster center of mass, then to remove outliers through the outlier determine rules.Furthermore, we make an improvement on K-means clustering algorithm and improve effectiveness and stability of the clustering result by the experiment .【总页数】3页(P40-42)【作者】刘明术【作者单位】黄山职业技术学院,安徽黄山 245000【正文语种】中文【中图分类】TP301.6【相关文献】1.基于改进引力搜索的混合K-调和均值聚类算法研究 [J], 王彩霞2.基于混合距离学习的鲁棒的模糊C均值聚类算法 [J], 卞则康;王士同3.基于核模糊C-均值和EM混合聚类算法的遥感图像分割 [J], 王民;张鑫;贠卫国;卫铭斐;王静4.基于K-均值的混合高斯模型聚类算法研究 [J], 何爱华;郭有强;张自军;王硕5.基于K-均值的混合高斯模型聚类算法研究 [J], 何爱华;郭有强;张自军;王硕;;因版权原因,仅展示原文概要,查看原文内容请购买。
K均值算法在智能农业中的使用教程(十)

K均值算法在智能农业中的使用教程智能农业是一种结合了现代科技和农业生产的新型农业生产模式。
通过人工智能、物联网、大数据等技术手段的应用,智能农业能够提高农业生产效率、降低成本,同时实现节水、节能、环保等目标。
K均值算法作为一种经典的数据聚类算法,在智能农业中有着广泛的应用。
本文将介绍K均值算法在智能农业中的使用教程,帮助读者了解这一算法在农业领域的实际应用。
K均值算法是一种基于数据相似度的聚类算法,它可以将一组数据划分为K 个不同的类别,使得同一类别内部的数据相似度较高,而不同类别之间的数据相似度较低。
在智能农业中,K均值算法可以应用于土壤肥力评价、作物生长监测、病虫害预警等方面。
首先,K均值算法在智能农业中的应用之一是土壤肥力评价。
通过采集土壤样本的各项指标数据,如土壤pH值、有机质含量、氮、磷、钾等养分含量,可以利用K均值算法对这些数据进行聚类分析,将土壤样本划分为不同的肥力等级。
这样就能够根据土壤肥力的不同情况,有针对性地进行施肥,提高土壤肥力,提高作物产量。
其次,K均值算法还可以应用于作物生长监测。
通过监测作物生长过程中的各项指标数据,如叶面积指数、叶绿素含量、水分含量等,可以利用K均值算法对这些数据进行聚类分析,识别不同生长阶段的作物状态。
这样就可以实现对作物生长状态的实时监测和分析,及时采取相应的管理措施,为作物的良好生长提供科学依据。
另外,K均值算法还可以在智能农业中用于病虫害预警。
通过对病虫害监测数据进行聚类分析,可以识别出不同的病虫害发生规律和趋势,及时预警和防治。
同时,也可以根据不同地区、不同作物的病虫害情况,实现精准防治,减少农药的使用,降低环境污染。
总之,K均值算法在智能农业中的应用不仅可以提高农业生产效率,降低生产成本,还可以实现绿色、可持续的农业生产。
希望通过本文的介绍,读者能够更加深入地了解K均值算法在智能农业中的使用教程,进一步推动智能农业技术的发展和应用。
K均值算法中的动态聚类技术及使用教程(四)

K均值算法是一种常用的聚类算法,它能够将数据集中的样本根据它们的特征进行分组。
在实际应用中,有时候数据集会不断更新,因此需要一种动态的聚类技术来适应数据的变化。
本文将介绍K均值算法中的动态聚类技术,并提供使用教程。
K均值算法是一种迭代算法,它的基本思想是将数据集中的样本划分为K个簇,使得每个样本与其所属簇的中心最近。
算法的步骤如下:1. 选择K个初始中心点。
2. 将每个样本分配到最近的中心点所属的簇。
3. 更新每个簇的中心点为该簇所有样本的均值。
4. 重复步骤2和步骤3,直到中心点不再发生变化或者达到最大迭代次数。
K均值算法的静态聚类技术是在固定的数据集上运行,但在实际应用中,数据集可能会随着时间不断更新,因此需要一种动态的聚类技术来适应数据的变化。
动态聚类技术可以在新数据到来时,对已有的聚类结果进行增量更新,而不是从头开始重新运行整个聚类算法。
一种常用的动态聚类技术是采用增量式的K均值算法。
该算法的基本思想是,当新的样本到来时,首先计算它与当前簇中心的距离,然后将其分配到最近的簇中。
接着,更新受影响的簇的中心点,以反映新样本的加入。
这样就可以在不重新运行整个聚类算法的情况下,对已有的聚类结果进行增量更新。
除了增量式的K均值算法,还有一种常用的动态聚类技术是采用滑动窗口的方法。
该方法将数据集划分为若干个大小固定的窗口,当新的样本到来时,将其加入到最新的窗口中,并且从最旧的窗口中删除最早的样本。
然后,对每个窗口运行静态的K均值算法,得到每个窗口的聚类结果。
最后,将每个窗口的聚类结果合并起来,得到整个数据集的聚类结果。
下面将以一个简单的示例来说明K均值算法中的动态聚类技术的使用方法。
假设我们有一个数据集,其中包含了一些二维的样本点。
我们首先需要选择K个初始中心点,这里我们选择K=3,然后运行静态的K均值算法得到初始的聚类结果。
接着,当新的样本点到来时,我们可以使用增量式的K均值算法对已有的聚类结果进行增量更新。
基于K-均值聚类的绿洲农田管理分区提取的研究

第 6期
21 年 1 01 2月
石河子大学学报 ( 自然 科 学 版 ) J unl f hhz U i ri ( aua Si c) o ra o iei nv s y N trl c ne S e t e
Vo . 9 No 6 12 .
De . 2 1 c 01
摘 要 : 据 产量 数 据 的 空 间 变 异 划 分 管 理 分 区是 确 定 精 准 农 业 变 量 作 业 单 元 的 有 效 途 径 , 以 为 样 区 土 壤 管 理 提 根 可 供 科 学 的决 策 依 据 。本 研 究 以新 疆 绿 洲 农 田为 研 究 对 象 , 过 安装 在 J h er 90采 棉 机 上 的 Is h 产 量 监 测 通 o nD e 7 9 ni t g 系 统 获 取 棉 花 产 量 实 时 数 据 , 以之 为 数 据 源进 行 农 田精 准 管 理 分 区 的 研 究 。研 究 采 用 K 均 值 聚 类 算 法 提 取 管 理 并 ・ 分 区 , 以 方 差 减 少 率 的 变 化 来 评 价 管 理 分 区划 分 的 效 果 。结 果 表 明 : 并 当过 滤 窗 口 尺 度 为 1 ×1 管 理 分 区 数 8 m 8m, 为 4时 , 分 区 内 的 棉 花 产 量 变 异 较 小 且 分 区 间棉 花 产 量 变异 较 大 , 区尺 度 适 合 变 量 作 业 。 各 分
关 键 词 : 一 值 聚类 ; 理 分 区 ; 准农 业 ; 洲 农 田 K均 管 精 绿
中 图 分 类 号 : 2 1 S 2 ¥ 3 ; 16 文献标识码 : A
De i a i n o e ii n Ag i u t r a a e e ne n lne to f Pr c so r c lu e M n g m ntZo s i
k均值聚类算法实验报告
k均值聚类算法实验报告一. 引言k均值聚类算法是一种常用的无监督学习算法,广泛应用于数据分析和模式识别领域。
该算法能够将一组数据点划分为k个不同的簇(cluster),其中每个簇具有相似的特征。
本实验旨在通过实现k均值聚类算法并对其进行实验,深入理解该算法的原理和应用。
二. 算法原理k均值聚类算法的主要思想是通过迭代优化的方式将数据点划分为k 个簇。
算法的步骤如下:1. 随机选择k个初始中心点作为簇的质心。
2. 根据每个数据点与各个簇质心的距离,将数据点分配到距离最近的簇中。
3. 更新每个簇的质心,即计算每个簇中所有数据点的平均值并将其作为新的质心。
4. 重复步骤2和步骤3,直到质心的位置不再发生变化或达到设定的迭代次数。
三. 实验步骤1. 数据准备:选择适当的数据集,并进行数据预处理,如去除异常值、缺失值处理等。
2. 初始化:随机选择k个数据点作为初始质心。
3. 迭代:根据每个数据点与质心的距离,将其分配到距离最近的簇中。
然后更新每个簇的质心。
4. 终止条件:当质心的位置不再发生变化或达到设定的迭代次数时,停止迭代。
5. 结果分析:根据聚类结果,评估算法的性能,并进行可视化展示。
四. 实验结果我们选择了一个包含身高和体重两个特征的数据集作为实验数据。
通过实验,我们成功实现了k均值聚类算法,并得到了如下的聚类结果:- 簇1: 身高较高,体重较重的数据点。
- 簇2: 身高中等,体重较重的数据点。
- 簇3: 身高较低,体重较轻的数据点。
通过对聚类结果的分析,我们可以发现k均值聚类算法能够有效地将数据点划分为不同的簇,并且每个簇具有相似的特征。
这对于进一步的数据分析和决策制定具有重要的意义。
五. 结论与展望本实验中我们实现了k均值聚类算法,并成功应用于一个包含身高和体重两个特征的数据集。
通过实验结果的分析,我们可以得出以下结论:1. k均值聚类算法能够有效地将数据点划分为不同的簇,并且每个簇具有相似的特征。
K均值算法在环境监测中的使用方法(七)
K均值算法在环境监测中的使用方法在当今社会,人们越来越重视环境保护和监测。
环境监测技术的发展不仅有助于提高环境质量,还能为环境管理提供重要的数据支持。
K均值算法作为一种常用的聚类算法,在环境监测中有着广泛的应用。
本文将介绍K均值算法在环境监测中的使用方法,并探讨其在环境监测领域的重要性和作用。
K均值算法是一种基于距离的聚类算法,主要用于将数据集中的样本划分为K个簇。
在环境监测中,我们可以利用K均值算法对监测数据进行聚类分析,从而找出数据中的规律和特点。
首先,我们需要收集环境监测数据,例如空气质量监测数据、水质监测数据等。
然后,将这些监测数据作为输入,运用K均值算法进行聚类分析,找出数据中的簇群结构,以及各个簇群的特征。
在实际应用中,K均值算法在环境监测中有着广泛的应用。
比如,在空气质量监测领域,我们可以利用K均值算法对不同区域的空气质量监测数据进行聚类分析,找出不同区域的空气质量特点和规律。
这有助于环境管理部门制定针对性的空气治理措施,提高空气质量。
在水质监测领域,K均值算法也可以用来对不同水域的水质监测数据进行聚类分析,找出水质监测数据中的异常情况,为水质改善提供数据支持。
值得注意的是,K均值算法在环境监测中的使用需要注意一些问题。
首先,K 值的选择对聚类结果有着重要影响。
K值太小会导致簇群过于细化,K值太大则会导致簇群过于粗化,都会影响聚类结果的准确性。
因此,我们需要根据具体情况来选择合适的K值,以求得最优的聚类结果。
其次,K均值算法对初始聚类中心的选择比较敏感。
不同的初始聚类中心可能会导致不同的聚类结果,因此需要通过多次试验来选择最优的初始聚类中心。
除此之外,K均值算法在环境监测中还需要考虑的问题有很多。
例如,数据预处理、特征选择、异常值处理等都会对聚类结果产生影响。
因此,在应用K均值算法进行环境监测时,需要结合实际情况,综合考虑各种因素,以求得准确的聚类结果。
总之,K均值算法在环境监测中具有重要的应用价值。
基于K均值聚类地下水水化学特征的水文地质单元划分分析_0
基于K均值聚类地下水水化学特征的水文地质单元划分分析现阶段在国内对传统的水文地质单元进行划分的过程中,基于在方法欠缺一定全面的分析,因此进一步提出了以地下水的水化学特征来进行详细水文地质单元的划分方法,并且采用了比较传统的K 均值聚类法对实际的水文地质单元进行划分,最终取得了较为良好的划分效果,所以这种划分方法就为现阶段水文地质单元的划分提供了新型的理论与方法。
标签:水文地质单元水化学特征K 均值聚类划分分析影响因素0引言我國目前水文地质单元的划分,其根本上就是建立一套水文地质模型,实践中正式根据该模型进行区域性的水文地质研究并作为基础。
它就是将研究对象根据有关水文地质条件的具体差异性,详细分成了若干个较小的地质区域,并且就能够将这些将研究的对象进行进一步地详细分类,以便于可以找到这些研究与划分对象具备的某一些规律。
相较于传统的水文地质单元的划分工作,其主要就是根据特定研究对象的具体地质构造状况、岩石分类及性质、含水层结构以及隔水层中产状、分布状况以及在地表层面上的出露状况、地形地貌情况、气象情况以及水文因素等进行项针对性的划分。
并且在这其中,水文地质的构造也是最为核心与主要的因素。
因为地下条件与划分的复杂性,因此根本无法全面、详细地了解整个地质研究区域内部的地质条件以及水文条件,例如地质区域中局部的小断层状况以及小的溶洞的存在情况,那么这些均将会大大的改变了在该区域中的地下水供给、补给、径流以及排泄的条件。
因此,相对传统的划分方法还可能将会造成局部地区区域内划分方面的错误。
特别是对于地质结构中地下水的径流以及地下水的水质变化状况的研究和分析,比较传统的水文地质单元的划分手段就将会更显出了其局限性。
1传统水文地质单元划分方法的影响因素研究1.1对于地质构造的影响在研究地质构造中对于水文地质单元划分结果起到主要影响的因素就是断裂构造因素,因为其节理或者断层结构的广泛存在,导致节理或者是断层结构两端的地层径流通道变得畅通或者是堵塞,从而随之形成了多个不同的补给、径流以及排泄的地质结构区域,所以就可能逐渐演变成为若干个水文地质划分单元。
K均值算法在人脸识别中的应用技巧(五)
K均值算法在人脸识别中的应用技巧人脸识别技术在当今社会得到了广泛的应用,从手机解锁到安全监控系统都在使用这一技术。
而K均值算法作为一种常见的聚类算法,也在人脸识别领域发挥了重要作用。
本文将探讨K均值算法在人脸识别中的应用技巧。
首先,K均值算法是一种基本且经典的聚类算法。
它通过不断迭代优化来确定数据集中的K个簇,每个簇由其内部的数据点组成,而且每个数据点都属于离其最近的簇。
在人脸识别领域,K均值算法可以应用于对人脸图像进行聚类分析,帮助识别和分类不同的人脸特征。
其次,K均值算法在人脸识别中的应用需要考虑到一些关键技巧。
首先是特征提取。
在输入人脸图像数据之前,需要对人脸图像进行特征提取,以便将其转换为可以被算法处理的数据格式。
常见的特征提取方法包括主成分分析(PCA)和线性判别分析(LDA),可以有效地提取人脸图像中的重要特征。
另外,K均值算法在人脸识别中的应用还需要考虑到数据预处理的问题。
在进行聚类之前,需要对人脸图像数据进行预处理,包括去除噪声、调整图像大小和对比度,以及标准化图像的亮度和颜色等。
这些预处理步骤可以提高算法的准确性和稳健性。
此外,K均值算法在人脸识别中的应用还需要考虑到簇的选择和评估。
在确定K个簇的数量时,需要使用一些评估指标来选择合适的簇数,比如轮廓系数和肘部法则等。
同时,还需要对聚类结果进行评估,以确保簇内的数据点相似度高,簇间的差异性大。
最后,K均值算法在人脸识别中的应用还需要考虑到算法的优化和加速。
对于大规模的人脸图像数据集,K均值算法可能会面临计算复杂度高、收敛速度慢等问题。
因此,需要采用一些优化技巧,比如并行计算、局部搜索和初始化策略等,来加速算法的收敛过程。
总的来说,K均值算法在人脸识别中的应用是一项复杂而又重要的工作。
在实际应用中,需要考虑到特征提取、数据预处理、簇的选择和评估,以及算法的优化和加速等技巧。
通过不断的实践和研究,可以进一步提高K均值算法在人脸识别中的性能和效果,为人脸识别技术的发展做出贡献。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
每次迭代都要考察每个样本的分类是否正确: 若不正确则调整。 在 全 部 样 本 调 整 完 成 后,再 修 改 聚类中心,进入下 一 次 迭 代。 如 果 在 一 次 迭 代 计 算 过程中所有样本都 被 正 确 分 类,则 聚 类 中 心 就 不 再 改变。 2. 2 K 均值法计算步骤
①选取聚类个数 k; ②选定 k 个向量 C1 ,C2 ,…,Ck 作为初始聚类 中 心;
目前,聚类分析 已 经 在 各 领 域 中 得 到 了 不 同 程 度的应用。 孔 辉 等[2]根 据 聚 类 分 析 结 果 识 别 了 雷 达信号的载频模式;郭秀娟 和 战 冬 梅[3]使 用 K 均 值 聚 类 算 法 ,对 教 师 授 课 效 果 进 行 分 析 ,实 现 了 量 化 评 价与综合评价相结 合,为 确 定 评 价 指 标 提 供 了 可 靠 依据;石云平和辛大欣[4]对传 统 K 均 值 聚 类 算 法 进
王同兴,等:基于 K 均值动态聚类分析的土样识别
53
法的岩体结构面模糊 C 均值聚类方法;周玉新 等[10] 将模糊等价聚类方法和模糊软划分聚类方法结合起 来,实现了岩 体 结 构 面 产 状 的 分 类; 范 雷 等[11]采 用 改进的动态聚类分 析 方 法,实 现 了 节 理 岩 体 结 构 面 产状的分类;蔡国军等[12]将聚类 分 析 方 法 和 孔 压 静 力 触 探 方 法 相 结 合 ,对 地 质 土 层 进 行 了 划 分 ;曲 永 玲 和陈新民[13]以苏 州 南 通 大 桥 的 现 场 扁 铲 侧 胀 试 验 结 果 为 例 ,对 试 验 结 果 数 据 标 准 化 处 理 后 ,使 用 聚 类 分析方法确定了土的分层。
[收稿日期] 2009 -9-29 [基金项目] 国家 自 然 科 学 基 金 ( 40972191 ) ;上 海 市 教 委 科 研 创 新
项目(09 YZ39) [作者简介] 王同兴(1980 -) ,男,硕士生 [联系方式] raultx@ 163 . com
行 了 改 进 ,以 便 有 效 地 处 理 孤 立 点 数 据 ;范 留 明 和 李 宁[5]利用图像处理和 识 别 方 法,实 现 了 裂 隙 的 智 能 识别及定位;刘家远[6]根 据 不 同 地 质 体 在 不 同 波 段 上的光谱特征,对 主 要 地 物 进 行 了 分 类。 王 祝 文[7] 等依 据 不 同 岩 性 在 测 井 资 料 中 的 不 同 响 应,使 用 K 均值聚类算法区分了不同岩性。
n
∑∑ N =
xi - Cj = min
(3)
i = 1 xi∈Sj
式中,N = 1,2,…,k;Sj 是中心为 Cj 的聚类域。
3 土工试验数据
土样数据取自于某工程勘察的土工试验成果, 共有 49 组土样。为了讨论聚类结果与土样工程性 质的关系,每 个 土 样 选 取 七 个 工 程 性 质 参 数 ( 见 表 1) 组成 一 组 数 据 xi ( i = 1,2,…,49 ) ,这 七 个 反 映 样本特征的参数是:含水量 w0 、重度 γ0 、峰值 粘 聚 力 f、峰 值 内 摩 擦 角 φ、压 缩 系 数 a0. 1-0. 2 、压 缩 模 量 E s0. 1-0. 2 、比重 G。表 1 中,49 个 土 样 分 为 三 类 C k ( k = 1,2,3) :类 C1 表示粘质粉土,用 1 表示;类 C2 表 示粉质粘土,用 2 表示;类 C3 表示砂质粉土,用 3 表 示。
目 前 ,聚 类 分 析 方 法 虽 被 用 于 土 的 分 类 ,但 使 用 动态聚类分析法对土进行分类的研究还很少。本文 将使用动态聚类分析法—K 均值聚类分析法对土工 试验数据进行研究。
2 基本原理
聚类分析是在难以确定一批样品中每个样品的 类 别 时 ,把 样 品 特 征 作 为 分 类 依 据 、利 用 相 似 性 度 量 法将特征相同或相近样本归为一类的方法。聚类分 析方法有很多种,包 括 层 次 聚 类 法、动 态 聚 类 法 等。 动态聚类法是将样 品 按 聚 类 准 则 进 行 初 始 分 类、通 过反复修改分类来达到最满意分类结果的一种迭代 算 法 ,这 一 方 法 具 有 计 算 工 作 量 小 、占 用 计 算 机 内 存 少、方法简单等优点。本 次 研 究 使 用 K 均 值 动 态 聚 类分析方法。 2. 1 K 均值法
进行 K 均值动态聚类分析,通过比较样本聚类结果,分析了样本容量对聚类结果的影响,选取模糊 C 均值的 聚 类 结 果,验 证 了
K 均值动态聚类方法的可行性和有效性。结果表明,K 均值动态聚类法是一种简单有效的方法,可以用于土样的 识 别 和 分 类,
本文方法对工程勘察中的土样分类具有一定的参考价值。
DOI:10.13614/ki.11-1962/tu.2010.07.013
第 26 卷第 7 期 2010 年 7 月
[文 章 编 号 ]1002 -8528 ( 2010 ) 07 -0052 -05
建筑科学
BUILDING SCIENCE
Vol. 26,No. 7 Jul. 2010
基于 K 均值动态聚类分析的土样识别
( Department of Civil Engineering,Shanghai University,Shanghai 200072,China)
[Abstract] The cluster analysis is a statistical method for grouping the data sets. The K-means cluster technique is applied to the recognition of soil sample in this paper. After describing the basic concepts and calculation procedure of K-means cluster technique,49 soil samples from an engineering investigation field and seven engineering parameters of each sample are chosen to perform K-means dynamic cluster analysis. The sample size effect in the clustering results is analyzed based on the comparison of two clustering results. A clustering result of soil classification using fuzzy C-means cluster analysis method is chosen to verify the feasibility and effectiveness of K-means dynamic clustering. The results show that K-means dynamic clustering is a simple and effective method in classifying soil. The method developed in this paper could be used in the soil’s recognition and classification. And it is referable for classifying soil in the engineering investigation.
王同兴,郭骏杰,王 强( 上海大学 土木工程系,上海 200072)
[摘 要] 聚类分析是研究类型划分与类间关系的一种数 理 统 计 方 法。本 文 将 K 均 值 动 态 聚 类 分 析 方 法 应 用 于 土 样 识
别中。在介绍 K 均值聚类方法基本思想和计算步骤的基础上,选 取 某 工 程 勘 察 的 49 个 土 样、每 个 土 样 取 七 个 工 程 性 质 参 数
本次研究时,K 均 值 动 态 聚 类 分 析 的 过 程 使 用 MATLAB 平台编程实现,实现流程见图 1。
4 聚类结果分析与讨论
4. 1 聚类结果分析 各种 情 况 下 得 到 的 聚 类 结 果 分 别 见 表 2、表 3、
土样分类是岩 土 工 程 勘 察 的 重 要 工 作,也 是 工 程成功与否的重要影响因素。土样分类方法很多, 如按颗粒组成分 类、依 据 工 程 性 质 参 数 分 类 等。 根 据传统工程性质参数使用聚类分析对土样分类有较 大 应 用 前 景 。 聚 类 分 析 时 ,对 大 量 数 据 分 析 后 ,将 具 有相似特征的数据 进 行 归 类,并 达 到 对 样 品 聚 类 的 目的。
为了进 行 聚 类 分 析,将 编 号 为 1 ~ 49 的 土 样 试 验数据分成 49 组。一个样本对应一组数据和一个 初始类别,初始类 别 共 有 1 ~ 49 个 类 别。 每 个 样 本 的每组数据按矩阵 形 式 输 入,每 组 数 据 的 输 入 形 式 是 1 × 7 的矩阵,样 本 数 据 形 成 49 × 7 的 总 矩 阵,输 入矩阵后再确定聚类个数 k( k 取 3 ) ,然后进行聚类 分析。
将聚类分析法 应 用 到 岩 土 工 程 领 域,国 内 外 学 者 已 进 行 了 一 些 研 究。 Hegazy 等[8]将 孔 压 静 力 触 探测试资料用于土 层 划 分,提 出 了 一 个 类 似 于 聚 类 分析的统 计 方 法。 蔡 美 峰 等[9]提 出 了 基 于 遗 传 算