模糊聚类分析与模式识别v1
模糊模式识别

模糊模式识别1 模糊模式识别的原则(1) 最大隶属原则当模式是模糊的,被识别对象是明确的,问题可以描述如下:设有n 个模式,它们分别表示成某论域X (X 可以是多个集合的笛卡儿乘积集)的n 个模糊子集12,,,n A A A,而0x X ∈是一个具体被识别的对象,若有},2,1{n i ∈,使得12()m ax{(),(),,()}inA o A o A o A o x x x x μμμμ=则认为0x 相对属于模式i A。
对事物进行直接识别时,所依据的是最大隶属原则。
这种方法适合处理具有如下特点的问题:a 用作比较的模式是模糊的;b 被识别的对象本身是确定的。
(2) 贴近度原则当模式及被识别对象都是模糊的,问题可以描述如下:设论域X 的模糊子集12,,,n A A A代表n 个模糊模式,被识别的对象可以表示成X 的子集B,若有},2,1{n i ∈,使得12(,)max{(,),(,),,(,)}i n B A B A B A B A σσσσ=则认为B相对合于模式A。
在模糊模式识别的具体应用中,关键是模式或被识别对象的模糊集合的构造,即如何建立刻画模式或对象的模糊集合。
根据实际应用来看,通常有三种主要方法,简单模式的识别方法,语言模式的识别方法和统计模式的识别方法。
2 模糊模式识别方法(一)简单模式的模糊模式识别具体的模糊模式识别工作可分为如下三个步骤:1)选取模式的特征因子集合},,,{21n X X X =X,被识别的对象表示为nni i XXX X ⨯⨯⨯∆∏= 211上的向量(),,,21n x x x ,,1,2,,,i i x X i n ∈= 或者表示为∏=ni i X 1上的模糊子集;2)建立模糊模式的隶属函数()A X μ,1()ni i A F X =∈∏;3)利用最大隶属度原则或贴近度原则对被识别的对象进行归属判决。
特征因子(1,2,,)i X i n = 的选取直接影响识别的效果,它取决于识别者的知识和技巧,很难做一般性讨论,而模式识别中最困难的是建立模式的隶属函数,人们还没有从理论上彻底解决隶属函数的确定问题。
模式识别聚类分析

x1 ,
(
( x1
x2旳值。可用下列递推
k ) xi ) /( N1(k ) 1)
x(k 1) 2
(k)
x2
(k)
(x2
xi
)
/(
N
(k 2
)
1)
x1 (k ) , x2 (k )是第k步对分时两类均值,
x1(k 1) , x2(k 1)是下一次对分时把xi从G1(k )
划到G2(k)时的两类均值
所以x1 Z1(1)
再继续进行第二,第三次迭代… 计算出 E(2) , E(3) , …
次数 1 2 3 4 5 6 7 8 9
10 11
G1 G2
x21 x20 x18 x14 x15 x19
x11 x13 x12 x17 x16
E值 56.6 79.16 90.90 102.61 120.11 137.15 154.10 176.15 195.26 213.07 212.01
Ni为第i类的样本数.
离差平方和增量:设样本已提成ωp,ωq两类, 若把ωp,ωq合为ωr类,则定义离差平方:
Dp2q Sr (S p Sq )
其中S p , Sq分别为 p类于q类的离差平方和, S r为 r 类的离差平方和
增量愈小,合并愈合理。
聚类准则
Jw Min
类内距离越小越好 类间距离越大越好
体积与长,宽,高有关;比重与材料,纹理,颜 色有关。这里低、中、高三层特征都有了。
措施旳有效性
特征选用不当 特征过少 特征过多 量纲问题
主要聚类分析技术
谱系法(系统聚类,层次聚类法) 基于目旳函数旳聚类法(动态聚类) 图论聚类法 模糊聚类分析法
2.2模式相同度度量
五 模式识别——聚类

——聚类分析
田玉刚
信息工程学院
主要内容
数据预处理 距离与相似系数
算法分析
实例分析
2018年12月10日
第2页
聚类分析又称群分析,它是研究(样本/样品/模式)分类问题的一
种多元统计方法,所谓类,通俗地说,就是指相似元素的集合。严格的 数学定义是较麻烦的,在不同问题中类的定义是不同的。
2018年12月10日
第10
数据预处理
5、中心标准化
中心标准化是将原始数据矩阵中的元素减去该列的的平 均值,其商即为标准化数据矩阵的元素
6、对数标准化 对数标准化是将原始数据矩阵中的元素取常用对数后作 为标准化数据矩阵的元素
2018年12月10日
第11
数据预处理
由上述标准化方法可知,中心标准化法(方法 5 )和对数标准化法 (方法6)达不到无量纲目的。一个好的变换方法,应在实现无量纲的同 时,保持原有各指标的分辨率,即变异性的大小。现将方法1(标准差)、 方法2 (极大值) 、方法3 (极差)和方法4 (均值)变换后数据的特 征列于表1。
要求一个向量的n个分量是不相关的且具有相同的方差,或者说各坐标对
欧氏距离的贡献是同等的且变差大小也是相同的,这时使用欧氏距离才 合适,效果也较好,否则就有可能不能如实反映情况,甚至导致错误结
论。因ቤተ መጻሕፍቲ ባይዱ一个合理的做法,就是对坐标加权,这就产生了“统计距离”。
2018年12月10日
第18
距离与相似系数
比如设
2018年12月10日
第30
算法分析-层次聚类
2018年12月10日
第31
算法分析-层次聚类
火灾危险评估中的模糊决策方法有哪些

火灾危险评估中的模糊决策方法有哪些火灾是一种极其危险的灾害,给人们的生命财产安全带来了巨大的威胁。
为了有效地预防和控制火灾,对火灾危险进行准确的评估至关重要。
在火灾危险评估中,模糊决策方法因其能够处理不确定性和模糊性信息而得到了广泛的应用。
一、模糊综合评价法模糊综合评价法是一种基于模糊数学的综合评价方法。
它将多个因素对评价对象的影响进行综合考虑,通过建立模糊评价矩阵和确定权重,最终得出综合评价结果。
在火灾危险评估中,首先需要确定评价因素,如火源特性、可燃物分布、建筑结构、消防设施等。
然后,对每个评价因素划分不同的等级,并赋予相应的模糊隶属度。
例如,火源特性可以分为强、中、弱三个等级,分别对应不同的模糊隶属度。
接下来,通过专家打分或实际数据统计等方式确定各评价因素的权重。
最后,利用模糊运算规则计算出综合评价结果,从而判断火灾危险的程度。
这种方法的优点是能够全面考虑多个因素的影响,并且可以处理评价因素的模糊性和不确定性。
但它也存在一定的局限性,例如权重的确定可能存在主观性,评价结果的准确性依赖于评价因素和等级的划分是否合理。
二、模糊层次分析法模糊层次分析法是将层次分析法与模糊数学相结合的一种方法。
层次分析法通过将复杂问题分解为多个层次和因素,并进行两两比较,确定各因素的相对重要性。
而模糊层次分析法则在此基础上,引入了模糊数来表示两两比较的结果,从而更好地处理不确定性。
在火灾危险评估中,运用模糊层次分析法可以构建火灾危险评估的层次结构模型,包括目标层、准则层和指标层。
目标层即为火灾危险程度的评估;准则层可以包括火灾发生的可能性、火灾的危害程度等;指标层则是具体的评估指标,如火源类型、人员密度等。
通过专家判断或问卷调查等方式,对各层次因素进行两两比较,并用模糊数表示比较结果。
然后,利用模糊数的运算规则计算出各因素的权重。
最后,综合各因素的权重和评价结果,得出火灾危险的评估值。
模糊层次分析法在处理复杂系统的多因素决策问题时具有较好的效果,能够有效地降低主观因素的影响,但计算过程相对较为复杂。
模糊聚类分析方法

模糊聚类分析方法对所研究的事物按一定标准进行分类的数学方法称为聚类分析,它是多元统 计“物以类聚”的一种分类方法。
载科学技术、经济管理中常常要按一定的标准 (相似程度或亲疏关系)进行分类。
例如,根据生物的某些性状可对生物分类, 根据土壤的性质可对土壤分类等。
由于科学技术、经济管理中的分类界限往往不 分明,因此采用模糊聚类方法通常比较符合实际。
一、模糊聚类分析的一般步骤1、第一步:数据标准化[9](1)数据矩阵设论域U ={X i ,X 2,||l,X n }为被分类对象,每个对象又有m 个指标表示其性状,于是,得到原始数据矩阵为Xm 1X m2bI-Xnm」其中X nm 表示第n 个分类对象的第m 个指标的原始数据(2)数据标准化在实际问题中,不同的数据一般有不同的量纲,为了使不同的量纲也能进行 比较,通常需要对数据做适当的变换。
但是,即使这样,得到的数据也不一定在 区间[0,1]上。
因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据 压缩到区间[0,1]上。
通常有以下几种变换: ① 平移•标准差变换X i = {x i1, X i2,川,X m }X i 1X2 1X n2 IHxik -(i 一 1,21 n, k_;HL 2mS k其中-1 n1 n_ 2xkxi , 2(xik~'兀)。
n i 4: n i 4经过变换后,每个变量的均值为 0,标准差为1,且消除了量纲的影响。
但是,再用得到的x k 还不一定在区间[0,1]上。
② 平移•极差变换显然有0乞x ik 乞1,而且也消除了量纲的影响 ③ 对数变换xk- lg x ik (i = 1,n , k; l [L 2 m取对数以缩小变量间的数量级。
2、第二步:标定(建立模糊相似矩阵)设论域U ={为公2,川,人} , X i ={为1必2,川,心},依照传统聚类方法确定相似 系数,建立模糊相似矩阵,x i 与X j 的相似程度用=R(X j ,X j )。
模糊聚类算法(FCM)

模糊聚类算法(FCM)伴随着模糊集理论的形成、发展和深化,RusPini率先提出模糊划分的概念。
以此为起点和基础,模糊聚类理论和⽅法迅速蓬勃发展起来。
针对不同的应⽤,⼈们提出了很多模糊聚类算法,⽐较典型的有基于相似性关系和模糊关系的⽅法、基于模糊等价关系的传递闭包⽅法、基于模糊图论的最⼤⽀撑树⽅法,以及基于数据集的凸分解、动态规划和难以辨别关系等⽅法。
然⽽,上述⽅法均不能适⽤于⼤数据量的情况,难以满⾜实时性要求较⾼的场合,因此实际应⽤并不⼴泛。
模糊聚类分析按照聚类过程的不同⼤致可以分为三⼤类:(1)基于模糊关系的分类法:其中包括谱系聚类算法(⼜称系统聚类法)、基于等价关系的聚类算法、基于相似关系的聚类算法和图论聚类算法等等。
它是研究⽐较早的⼀种⽅法,但是由于它不能适⽤于⼤数据量的情况,所以在实际中的应⽤并不⼴泛。
(2)基于⽬标函数的模糊聚类算法:该⽅法把聚类分析归结成⼀个带约束的⾮线性规划问题,通过优化求解获得数据集的最优模糊划分和聚类。
该⽅法设计简单、解决问题的范围⼴,还可以转化为优化问题⽽借助经典数学的⾮线性规划理论求解,并易于计算机实现。
因此,随着计算机的应⽤和发展,基于⽬标函数的模糊聚类算法成为新的研究热点。
(3)基于神经⽹络的模糊聚类算法:它是兴起⽐较晚的⼀种算法,主要是采⽤竞争学习算法来指导⽹络的聚类过程。
在介绍算法之前,先介绍下模糊集合的知识。
HCM聚类算法⾸先说明⾪属度函数的概念。
⾪属度函数是表⽰⼀个对象x ⾪属于集合A 的程度的函数,通常记做µA(x),其⾃变量范围是所有可能属于集合A 的对象(即集合A 所在空间中的所有点),取值范围是[0,1],即0<=µA(x),µA(x)<=1。
µA(x)=1 表⽰x 完全⾪属于集合A,相当于传统集合概念上的x∈A。
⼀个定义在空间X={x}上的⾪属度函数就定义了⼀个模糊集合A,或者叫定义在论域X={x}上的模糊⼦集A’。
人工智能模式识别技术练习(习题卷1)

人工智能模式识别技术练习(习题卷1)第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]可视化技术中的平行坐标又称为( )A)散点图B)脸谱图C)树形图D)轮廓图答案:D解析:2.[单选题]描述事物的基本元素,称为( )A)事元B)物元C)关系元D)信息元答案:B解析:3.[单选题]下面不属于层次聚类法的是( )A)类平均法B)最短距离法C)K均值法D)方差平方和法答案:C解析:4.[单选题]核函数方法是一系列先进( )数据处理技术的总称。
A)离散B)连续C)线性D)非线性答案:D解析:5.[单选题]下面哪个网络模型是最典型的反馈网络模型?( )A)BP神经网络B)RBF神经网络C)CPN网络D)Hopfield网络答案:D解析:6.[单选题]粗糙集所处理的数据必须是( )的。
答案:B解析:7.[单选题]模糊聚类分析是通过( )来实现的。
A)模糊相似关系B)模糊等价关系C)模糊对称关系D)模糊传递关系答案:B解析:8.[单选题]模糊系统是建立在( )基础上的。
A)程序语言B)自然语言C)汇编语言D)机器语言答案:B解析:9.[单选题]在模式识别中,被观察的每个对象称为( )A)特征B)因素C)样本D)元素答案:C解析:10.[单选题]群体智能算法提供了无组织学习、自组织学习等进化学习机制,这种体现了群体智能算法的( )A)通用性B)自调节性C)智能性D)自适应性答案:C解析:11.[单选题]下面不属于遗传算法中算法规则的主要算子的是( )A)选择B)交叉C)适应D)变异答案:C解析:12.[单选题]下面不属于蚁群算法优点的是( )。
A)高并行性B)可扩充性C)不易陷入局部最优13.[单选题]只是知道系统的一些信息,而没有完全了解该系统,这种称为( )A)白箱系统B)灰箱系统C)黑箱系统D)红箱系统答案:B解析:14.[单选题]模式分类是一种______方法,模式聚类是一种_______方法。
模糊数学理论

2) 模糊矩阵
2.2模糊等价关系与模糊相似关系 模糊等价关系与模糊相似关系 1)模糊等价关系 )
2)模糊等价矩阵 )
3)模糊相似关系与模糊相似矩阵 )
2.3 截矩阵与传递矩阵 1)截矩阵 )
Байду номын сангаас
2)模糊传递矩阵 )
3 模糊聚类分析
所谓聚类分析,就是用数学的方法把事物按一定要求 和规律进行分类,它有广泛的实际应用。在模糊数学产生 之前,聚类分析已是是数理统计中研究“物以类聚”的一 种多元分析方法,它通过数学工具定量地确定、划分样品 的亲疏关系,从而客观地、合理地分型划类。由于客观事 物之间在很多情况下并没有一个截然区别的界限,又由于 分类时所依据的数据指标的变化也大都是连续的,同时许 多客观事物之间的界限往往不一定很清晰,使传统的基于 数理统计原理的聚类分析方法遇到了困难。因此用模糊数 学观点解决聚类分析问题,必然会更符合于实际情况。这 种基于建立模糊相似关系对客观事物进行分类的方法,称 为模糊聚类分析。
注明: 统计量确定满意分类 注明:用F统计量确定满意分类
• 3.1 模糊聚类分析理论:
1)
2)
3)
4)
3.2 基于模糊等价关系的动态聚类分析
例题
此例题可以用截矩阵的方法来实现
3.3 基于模糊相似关系的聚类分析 1)建立模糊相似矩阵 )
2)传递闭包法 )
此外,还有直接聚类法、最大树法、编网法等。 此外,还有直接聚类法、最大树法、编网法等。
3)模糊集的表示
4)模糊集的运算 ) 模糊集与普通集一样, 模糊集与普通集一样,有相同的运算和相应的运 算规律。 算规律。
A与B的并集、交集及 的补集定义如下: 与 的并集 交集及A的补集定义如下 的并集、 的补集定义如下:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
α
①Hamming距离 ②Euclid距离 ③Chebyshev距离
d ( xi , x j ) = ∑ xik − x jk
k =1
d ( xi , x j ) =
2 ( x − x ) ∑ ik jk k =1
m
d ( xi , x j ) = max xik − x jk
1≤ k ≤ n
19
别、图像处理、信道均衡、矢量量化编码、神经网络 的训练、参数估计、医学诊断、天气预报、食品分类、 水质分析等。
5
聚类分析的基本概念
• 常用的模糊聚类分析方法大致可分为两大类:其一是 基于模糊关系(矩阵)的聚类分析方法, 而作为其中核心 直接聚类法、最大树法和编网法; 其二是基于目标函 数的聚类分析方法 , 称为模糊 C 均值 (FCM) 聚类算法 ( 或 称 为 模 糊 ISODATA 聚 类 分 析 法 ) (Iterative SelfOrganizing Data Analysis Techniques Algorithm 迭代自 组织数据分析) 。
将R中≥0.7的元素改为1,其它元素改为0
⎛1 ⎜ ⎜0 = ⎜0 ⎜ ⎜0 ⎜0 ⎝ 0 0 0 0⎞ ⎟ 1 0 1 0⎟ 0 1 0 0⎟ ⎟ 1 0 1 0⎟ 0 0 0 1⎟ ⎠
23
R0.7
为R矩阵的λ截矩阵(λ≥0.7)
3.分类 由模糊等价矩阵的λ截矩阵可知,当rij=1时,i与j应 为同类,否则为异类。 让λ由大到小变化,可形成动态聚类图。
模糊聚类分析与模式识别
1
前言
模糊数学是用数学方法研究和处理具有“模糊性” 现象的数学。所谓的模糊性主要是指客观事物差异 的中间过渡界线的“不分明性”。如储层的含油气性、 油田规模的大小,成油地质条件的优劣,圈闭的形 态,岩石的颜色等。这些模糊变量的描述或定义是 模糊的,各变量的内部分级没有明显的界线。 1965年美国控制论专家 L.A.Zadeh 提出这一概 念后,模糊数学得到迅速发展并应用到各个领域。
6
步骤的模糊分类,有下述的主要方法:模糊传递闭包法、
§1 模糊聚类分析
模糊聚类分析是在模糊相似矩阵的基础上,对 分类对象进行定量分类的方法。 主要内容 数据标准化 建立模糊相似矩阵 动态聚类
7
一、数据标准化
1、建立数据矩阵
设论域U = { x1 , x2 ,
, xn }为被分类对象, , n)
每个对象又由 m 个指标表示其性状:
k =1 k =1 m m
(i, j = 1,2,
, n)
符号 ∧和∨分别表示两个元素取小和取大。 例如:
15
x1 = (0.1 0.2 0.3) x2 = (0.4 0.5 0.6)
∑(x ∑(x
k =1 m k =1 m
m
ik
∧ xjk ) = 0.1+ 0.2 + 0.3 = 0.6 ∨ xjk ) = 0.4 + 0.5 + 0.6 =1.5 r12 = 0.6 / 1.5 = 0.4
4
聚类分析的基本概念
• 模糊集理论的提出为软划分提供了有力的分析工具, 用 模糊数学的方法来处理聚类问题, 被称之为模糊聚类分 析。由于模糊聚类得到了样本属于各个类别的不确定 性程度, 表达了样本类属的中介性, 更能客观地反映现 实世界, 从而成为聚类分析研究的主流。 • 模糊聚类已经在诸多领域获得了广泛的应用, 如模式识
X = { x1 , x2 , x3 , x4 , x5 }按污染情况进行分类。设每个区
域包含空气、水分、土壤、作物 4 个要素,环境区域 的污染情况由污染物在 4 个要素中的含量超过的程度 来衡量。设这 5 个环境区域的污染数据为: x1 = (80,10,6,2), x2 = (50,1,6,4), x3 = (90,6,4,6),
ik
x1 = (0.1 0.2 0.3) x2 = (0.1 0.2 0.3)
∑(x ∑(x
k =1 k =1 m
ik
∧ xjk ) = 0.1+ 0.2 + 0.3 = 0.6 ∨ xjk ) = 0.1+ 0.2 + 0.3 = 0.6 r12 = 0.6 / 0.6 = 1.0
16
ik
(5)算术平均最小法
矩阵乘法运算 矩阵乘法运算
矩阵 矩阵○ ○运算 运算
21
相似性度量的相关、相似系数矩阵满足自反性和 对称性,但不一定满足传递性。 对于传递性,可先计算R○R(记作R2),然后看其是否 满足传递性。若不满足,经过R○R=R2, R2○R2=R4 …运 算,可将R改造成满足传递性的模糊等价矩阵。 2.模糊等价矩阵的λ截矩阵 设R=[rij]n×n是模糊等价矩阵,对任意λ∈[0,1],称 Rλ=[rij(λ)]n×n为R=[rij]n×n的λ截矩阵,其中:
3
世界就必须区别不同的事物并认识事物间的相似性。
聚类分析的基本概念
• 聚类分析是多元统计分析的一种, 它把一个没有类别 标记的样本集按某种准则划分成若干个子集(类分到不同的类中。 • 传统的聚类分析是一种硬划分, 它把每个待辨识的对 象严格地划分到某类中, 具有非此即彼的性质, 因此 这种类别划分的界限是分明的。而实际上大多数对 象并没有严格的属性, 它们在性态和类属方面存在着 中介性, 具有亦此亦彼的性质,因此适合进行软划分。
2
聚类分析的基本概念
• “ 聚类 ” 就是按照一定的要求和规律对事物进行区分 和分类的过程, 在这一过程中没有任何关于分类的先 验知识 , 仅靠事物间的相似性作为类属划分的准则, 属于无监督分类的范畴。 • “ 聚类分析 ” 是指用数学的方法研究和处理给定对象 的分类。 • “人以群分, 物以类聚”, 聚类是一个古老的问题,它伴 随着人类社会的产生和发展而不断深化, 人类要认识
11
矢量或点: Xj=(xj1 xj2 … xjm) Xi=(xi1 xi2 … xim) 1.相似系数法 (1)数量积法
⎧1 ⎪ rij = ⎨ 1 ⎪M ⎩
i=j
∑x
i =1
m
ik
m
⋅ x jk
i≠j
i , j=1,2,…,n
其中 M = max ( ∑ x ik ⋅ x jk )
i≠ j k =1
定理:设 R 是 n 阶模糊相似矩阵,则存在一
k 个最小的自然数 k ( k ≤ n) , 使得 R 为模糊等价矩
阵,且对一切大于 k 的自然数 l ,恒有 R l = R k .
R k 称为 R 的传递闭包矩阵,记为 t ( R ).
25
例:设有模糊相似矩阵
0.1 0.2 ⎞ ⎛1 ⎜ ⎟ R = ⎜ 0.1 1 0.3 ⎟ ⎜ 0.2 0.3 1 ⎟ ⎝ ⎠
m
ik
− xi | | xjk − xj |
2
∑(x
k =1
m
ik
− xi )
m
∑(x
k =1
m
jk
− xj )
m
2
1 其中 x i = m
∑
k =1
1 x ik , x j = m
∑x
k =1
jk
.
14
(4)最大最小法
rij = ∑ ( xik ∧ x jk ) / ∑ ( xik ∨ x jk )
xi = { xi 1 , xi 2 ,…, xim } ( i = 1,2,
则得到原始数据矩阵为 X = ( xij )n×m .
在实际问题中,不同的数据一般有不同 的量纲, 为了使有不同量纲的量能进行比较, 需要将数据规格化,常用的方法有:
8
(1)标准差标准化
对于第 i 个变量进行标准化,就是将 xij 换成
n
20
式中“○”表示矩阵的合成运算,类似矩阵乘法运 算,但要将元素的相乘改为求最小值、相加改为求 最大值。例如:
⎡1 2⎤ ⎡1 2 3⎤ ⎢ ⎡14 28⎤ ⎥ ⎢2 3 4⎥ ⋅ ⎢2 4⎥ = ⎢28 56⎥ ⎣ ⎦ ⎢3 6⎥ ⎣ ⎦ ⎣ ⎦
⎡1 2⎤ ⎡1 2 3⎤ ⎢ ⎡3 3⎤ ⎥ ⎢2 3 4⎥ ⋅ ⎢2 4⎥ = ⎢3 4⎥ ⎣ ⎦ ⎢3 6⎥ ⎣ ⎦ ⎣ ⎦
(1)模糊传递闭包法 步骤: ①求出模糊相似矩阵 R 的传递闭包 t ( R ) ;
②按 λ 由大到小进行聚类; ③画出动态聚类图。
24
定义:设 R = ( rij )n×n 是 n 阶模糊方阵, I 是 n 阶 单位方阵,若 R 满足 (1) 自反性: I ≤ R ; (2) 对称性: RT = R ; 则称 R 为模糊相似矩阵。
r
(λ ) ij
⎧ ⎪1 , rij ≥ λ =⎨ ⎪ ⎩ 0 , rij < λ
22
⎛ 1 ⎜ ⎜ 0.63 R = ⎜ 0.62 ⎜ ⎜ 0.63 ⎜ 0.53 ⎝
0.63 0.62 0.63 0.53 ⎞ ⎟ 1 0.62 0.70 0.53 ⎟ 0.62 1 0.62 0.53 ⎟ ⎟ 0.70 0.62 1 0.53 ⎟ 0.53 0.53 0.53 1 ⎟ ⎠
x4 = (40,5,7,3), x5 = (10,1,2,4).
试对 X 进行分类。
27
解:由题设知特性指标矩阵为
∑(x
k =1 m
m
ik
∧ xjk ) = 0.1+ 0.2 + 0.3 = 0.6
∑
k =1
xik ⋅ xjk = 0.1+ 0.2 + 0.3 = 0.6 r12 = 0.6 / 0.6 = 1.0
上述(4)、(5)、(6)三种方法要求xij≥0,否则,要进 行适当变换。
18
2 距离法
一般地,取 rij = 1 − c(d ( xi , x j )) ,其中 c ,α 为 适当选取的参数,它使得 0 ≤ rij ≤ 1.采用的距离有: