判别分析(2)费希尔判别

合集下载

费歇尔判别法

费歇尔判别法

费歇尔判别法费歇尔判别法(Fisher's Discriminant Analysis)是一种统计学中的方法,用于寻找两个或多个分类变量中最能有效区分它们的线性组合。

这种方法最初是由英国统计学家罗纳德·费歇尔(Ronald A. Fisher)在1936年所提出。

费歇尔判别法的目标是通过将数据投影到低维空间来确定样本类别之间最明显的分离平面。

这个方法假设所有数据员来自正态分布,这使得它的结果具有很高的概率。

此外,这种方法特别适用于小样本数据,在这种情况下,其它多变量方法往往受到数据不足或对角线矩阵估计的影响。

费歇尔判别法通过将多维数据投影到一维空间上,找到最能表示数据差异的线性变量。

具体步骤如下:1. 定义问题在进行费歇尔判别分析之前,首先需要定义问题。

这个问题可以是不同的变量之间的分类问题,或者是同一变量在不同条件下的分类问题。

例如,可以通过费歇尔判别分析找到两个组的区别,这两个组的特征可以用来预测其他类似两个组。

2. 构造分类变量在对数据进行投影之前,需要将分类变量定义为正态分布。

这种变量通常为两个或更多个。

3. 计算均值和方差计算每个分类变量的均值和方差,以用于后面的投影计算。

4. 计算类内离散度矩阵类内离散度矩阵是指每个类别内所有点与该类别均值之间的距离的累加和。

这个矩阵用来衡量类的内部分散程度,通常使用矩阵的矩阵乘法来进行计算。

5. 计算类间离散度矩阵类间离散度矩阵是指不同类别均值之间的距离的累加和。

这个矩阵用来衡量类别之间的分散程度,也通常使用矩阵的矩阵乘法来进行计算。

6. 计算特征值和特征向量计算类内离散度矩阵和类间离散度矩阵的特征值和特— 1 —征向量。

这些值可以使用线性代数中的方法计算。

一般来说,特征向量是正交(perpendicular)的。

7. 选取最大特征值从计算出的特征值中找到最大特征值,找到最大特征值所对应的特征向量。

这个特征向量就是数据的主要方向,也被称为“判别变量”。

判别分析公式Fisher线性判别二次判别

判别分析公式Fisher线性判别二次判别

判别分析公式Fisher线性判别二次判别判别分析是一种常用的数据分析方法,用于根据已知的类别信息,将样本数据划分到不同的类别中。

Fisher线性判别和二次判别是两种常见的判别分析方法,在实际应用中具有广泛的应用价值。

一、Fisher线性判别Fisher线性判别是一种基于线性变换的判别分析方法,该方法通过寻找一个合适的投影方向,将样本数据投影到一条直线上,在保持类别间离散度最大和类别内离散度最小的原则下实现判别。

其判别函数的计算公式如下:Fisher(x) = W^T * x其中,Fisher(x)表示Fisher判别函数,W表示投影方向的权重向量,x表示样本数据。

具体来说,Fisher线性判别的步骤如下:1. 计算类别内离散度矩阵Sw和类别间离散度矩阵Sb;2. 计算Fisher准则函数J(W),即J(W) = W^T * Sb * W / (W^T * Sw * W);3. 求解Fisher准则函数的最大值对应的投影方向W;4. 将样本数据投影到求得的最优投影方向上。

二、二次判别二次判别是基于高斯分布的判别分析方法,将样本数据当作高斯分布的观测值,通过估计每个类别的均值向量和协方差矩阵,计算样本数据属于每个类别的概率,并根据概率大小进行判别。

二次判别的判别函数的计算公式如下:Quadratic(x) = log(P(Ck)) - 0.5 * (x - μk)^T * Σk^-1 * (x - μk)其中,Quadratic(x)表示二次判别函数,P(Ck)表示类别Ck的先验概率,x表示样本数据,μk表示类别Ck的均值向量,Σk表示类别Ck的协方差矩阵。

具体来说,二次判别的步骤如下:1. 估计每个类别的均值向量μk和协方差矩阵Σk;2. 计算每个类别的先验概率P(Ck);3. 计算判别函数Quadratic(x);4. 将样本数据划分到概率最大的类别中。

判别分析公式Fisher线性判别和二次判别是常见的判别分析方法,它们通过对样本数据的投影或概率计算,实现对样本数据的判别。

判别分析(2)费希尔判别

判别分析(2)费希尔判别

两总体的Fisher判别法 判别法 两总体的
其中, 其中,S 即
jl
= ∑ ( x Aij − x Aj )( x Ail − x Al ) + ∑ ( x Bij − x Bj )( x Bil − x Bl )
i =1 i =1
na
nb
F = ∑ ∑ c j c l s jl
j =1 l =1
Fisher判别 判别
内容:
1、建立判别准则; 2、建立判别函数 3、回代样本; 4、估计回代的错误率; 5、判别新的样本。
Fisher判别 判别
y 是线性函数, 由于 ( X ) 是线性函数,一般可将 y( X )表示为
(4.2) ) 对于线性函数 y( X ) ,它的几何表示就是空间中 的一条直线或平面,或超平面, 的一条直线或平面,或超平面,如果我们把两 B 看成空间的两个点集, 总体 A、 看成空间的两个点集,该平面所起的 B 分开, 作用就是尽可能将空间两个点集 A 、 分开,如 所示。 图4.1所示。 所示
Fisher判别 判别
Fisher判别 判别
Fisher判别 判别
费希尔判别的基本思想是投影(或降维)
Fisher方法是要找到一个(或一组)投 影轴w使得样本投影到该空间后能 在保证方差最小的情况下,将不同 类的样本很好的分开。并将度量类 别均值之间差别的量称为类间方差 (或类间散布矩阵);而度量这些均值 周围方差的量称为类内方差(或类内 散布矩阵)。Fisher判决的目标就是: 寻找一个或一组投影轴,能够在最 小化类内散布的同时最大化类间布。
两总体的Fisher判别法 判别法 两总体的
两总体的Fisher判别法 判别法 两总体的
max I = max ( ya − yb )

Fisher判别分析

Fisher判别分析

Fisher判别分析对案例中小企业的破产模型做Fisher判别分析江义114113001059一问题:对企业的运行状态利用Fisher判别进行分类选取四个经济指标用于判断企业处于破产状态还是正常运行状态,具体数据如下,其中类别1表示破产状态,类别2表示正常运行状态X1总负债率X2收益率指标X3短期支付能力X4生产效率指标类别-0.45 -0.41 1.09 0.45 1 -0.56 -0.31 1.51 0.16 10.06 0.02 1.01 0.4 1-0.07 -0.09 1.45 0.26 10.38 0.11 3.27 0.55 20.19 0.05 2.25 0.33 20.32 0.07 4.24 0.63 20.04 0.01 1.5 0.71 2-0.06 -0.06 1.37 0.4 10.07 -0.01 1.37 0.34 2-0.13 -0.14 1.42 0.44 10.15 0.06 2.23 0.56 20.16 0.05 2.31 0.2 20.29 0.06 1.84 0.38 带测定0.54 0.11 2.33 0.48 带测定二、程序如下:(R语言)> data=read.table("E:/bac/qiye.txt",header=T)> data1=c(rep(1,6),rep(2,7))> data2=as.factor(data1)> data$class=data2> attach(data)> names(data)[1] "X1" "X2" "X3" "X4" "class"> library(MASS)> data.lda=lda(class~X1+X2+X3+X4)> data.ldaCall:lda(class ~ X1 + X2 + X3 + X4)Prior probabilities of groups:1 20.4615385 0.5384615Group means:X1 X2 X3 X41 -0.07500000 -0.105000000 1.763333 0.35833332 0.07857143 -0.002857143 2.062857 0.4685714Coefficients of linear discriminants:LD1X1 -7.9358690X2 15.8747840X3 0.1653748X4 5.0408074>newdata=data.frame(X1=c(0.29,0.54),X2=c(0.06,0.11),X3=c(1.84, 2.33),X4=c(0.38,0.48))> predict(data.lda,newdata=newdata)三、运行结果$class[1] 1 1Levels: 1 2$posterior1 21 0.6249180 0.37508202 0.7540681 0.2459319$xLD11 -0.69812362 -1.3032372四、$class显示,最后两组数据均属于第一类别,如下表:X1 X2 X3 X4 类别0.29 0.06 1.84 0.38 10.54 0.11 2.33 0.48 1四、总结判别分析是多元统计分析中较为成熟的一种分类方法,根据已知类别的若干样本数据,总结出客观事物分类的规律性。

FISHER判别

FISHER判别

判别分析——Fisher判别Fisher判别和CANDISC过程(典型判别过程)简介应用举例:例5.3.2:对表5.2中的胃癌检验的生化指标值用FISHER判别的方法进行判别归类。

先调用CANDISC(典型判别)过程求出2个典型变量,然后再使用DISCRIM过程对15个观测进行判别归类。

SAS程序如下:data d522;input group x1-x4 @@;cards;1 228 134 20 11 1 245 134 10 401 200 167 12 27 1 170 150 7 81 100 167 20 142 225 125 7 142 130 100 6 12 2 150 117 7 62 120 133 10 26 2 160 100 5 103 185 115 5 19 3 170 125 6 43 165 142 5 3 3 135 108 2 123 100 117 7 2;proc candisc data=d522 out=can532 ncan=2 distance;class group; var x1-x4;run;proc gplot data=can532;plot can2*can1 = group;run;proc discrim data=can532 distance list;class group; var can1 can2;run;proc discrim data=can532 pool=no distance list;class group; var can1 can2;run程序解释说明:(1)proc candisc调用candisc(典型判别)分析过程,“out=can532”定义一个输出数据集 can532,包括输入数据集及典型变量。

(2)“ncan=2”要求系统仅计算2个典型变量(典型变量的个数不能超过变量个数和分类个数减1的最小值);(3)Gplot过程要求绘制两个典型变量的散点图,以便了解分类情况;(4)第三、四个过程以典型变量can1 can2为变量建立判别函数。

fisher判别法

fisher判别法

fisher判别法Fisher判别分析的基本思想:选取适当的投影方向,将样本数据进行投影,使得投影后各样本点尽可能分离开来,即:使得投影后各样本类内离差平方和尽可能小,而使各样本类间的离差平方和尽可能大。

为了克服“维数灾难”,人们将高维数据投影到低维空间上来,并保持必要的特征,这样,一方面数据点变得比较密集一些,另一方面,可以在低维空间上进行研究。

fisher判别法是判别分析的方法之一,它是借助于方差分析的思想,利用已知各总体抽取的样品的p维观察值构造一个或多个线性判别函数y=l′x其中l= (l1,l2…lp)′,x= (x1,x2,…,xp)′,使不同总体之间的离差(记为B)尽可能地大,而同一总体内的离差(记为E)尽可能地小来确定判别系数l=(l1,l2…lp)′。

数学上证明判别系数l恰好是|B-λE|=0的特征根,记为λ1≥λ2≥…≥λr>0。

所对应的特征向量记为l1,l2,…lr,则可写出多个相应的线性判别函数,在有些问题中,仅用一个λ1对应的特征向量l1所构成线性判别函数y1=l′1x不能很好区分各个总体时,可取λ2对应的特征向量l′2建立第二个线性判别函数y2=l′2x,如还不够,依此类推。

有了判别函数,再人为规定一个分类原则(有加权法和不加权法等)就可对新样品x判别所属。

Fisher判别法是根据方差分析的思想建立起来的一种能较好区分各个总体的线性判别法,由Fisher在1936年提出。

该判别方法对总体的分布不做任何要求。

Fisher判别法是一种投影方法,把高维空间的点向低维空间投影。

在原来的坐标系下,可能很难把样品分开,而投影后可能区别明显。

一般说,可以先投影到一维空间(直线)上,如果效果不理想,在投影到另一条直线上(从而构成二维空间),依此类推。

每个投影可以建立一个判别函数。

判别分析--费希尔判别、贝叶斯判别、距离判别

判别分析--费希尔判别、贝叶斯判别、距离判别判别分析⽐较理论⼀些来说,判别分析就是根据已掌握的每个类别若⼲样本的数据信息,总结出客观事物分类的规律性,建⽴判别公式和判别准则;在遇到新的样本点时,再根据已总结出来的判别公式和判别准则,来判断出该样本点所属的类别。

1 概述三⼤类主流的判别分析算法,分别为费希尔(Fisher)判别、贝叶斯(Bayes)判别和距离判别。

具体的,在费希尔判别中我们将主要讨论线性判别分析(Linear Discriminant Analysis,简称LDA)及其原理⼀般化后的衍⽣算法,即⼆次判别分析(Quadratic Discriminant Analysis,简称QDA);⽽在贝叶斯判别中将介绍朴素贝叶斯分类(Naive Bayesian Classification)算法;距离判别我们将介绍使⽤最为⼴泛的K最近邻(k-Nearest Neighbor,简称kNN)及有权重的K最近邻( Weighted k-Nearest Neighbor)算法。

1.1 费希尔判别费希尔判别的基本思想就是“投影”,即将⾼维空间的点向低维空间投影,从⽽简化问题进⾏处理。

投影⽅法之所以有效,是因为在原坐标系下,空间中的点可能很难被划分开,如下图中,当类别Ⅰ和类别Ⅱ中的样本点都投影⾄图中的“原坐标轴”后,出现了部分样本点的“影⼦”重合的情况,这样就⽆法将分属于这两个类别的样本点区别开来;⽽如果使⽤如图8-2中的“投影轴”进⾏投影,所得到的“影⼦”就可以被“类别划分线”明显地区分开来,也就是得到了我们想要的判别结果。

原坐标轴下判别投影轴下判别我们可以发现,费希尔判别最重要的就是选择出适当的投影轴,对该投影轴⽅向上的要求是:保证投影后,使每⼀类之内的投影值所形成的类内离差尽可能⼩,⽽不同类之间的投影值所形成的类间离差尽可能⼤,即在该空间中有最佳的可分离性,以此获得较⾼的判别效果。

对于线性判别,⼀般来说,可以先将样本点投影到⼀维空间,即直线上,若效果不明显,则可以考虑增加⼀个维度,即投影⾄⼆维空间中,依次类推。

判别分析(2)费希尔判别共60页文档

55、 为 中 华 之 崛起而 读书。 ——周 恩来
判别分析(2)费希尔判别
6、法律的基础有两个,而且只有两个……公平和实用。——伯克 7、有两种和平的暴力,那就是法律和礼节。——歌德
8、法律就是秩序,有好的法律才有好的秩序。——亚里士多德 9、上帝把法律和公平凑合在一起,可是人类却把它拆开。——查·科尔顿 10、一切法律都是无用的,因为好人用不着它们,而坏人又不会因为它们而变得规矩起来。——常成 于困约 ,而败 于奢靡 。——陆 游 52、 生 命 不 等 于是呼 吸,生 命是活 动。——卢 梭
53、 伟 大 的 事 业,需 要决心 ,能力 ,组织 和责任 感。 ——易 卜 生 54、 唯 书 籍 不 朽。——乔 特

判别分析





经检验计算, F=33.18 > F0.01(7,16)=4.03,判别 函数有实际价值。
4. 费歇尔(Fisher)准则多级判别
4.1 概念

多总体Fisher判别法,与两总体Fisher判别法类似。 判别法类似 总样本容量为n、含m个变量的资料划分为G类,每 类的样本容量为n1, n2, … ,ng,且n=n1+n2+…+ ng。 线性判别函数基本表达式为:
z
费歇尔判别法基本特征:

线性判别 基本思路-类间距离最大、类内距离最小的原则确定 线性判别函数,再根据建立的线性判别函数判定待判 样品的类别。
z
Fisher判别法1936年提出,对总体的分布并无特 定要求。 费歇尔准则二级判别:只划分成两类的费歇尔判 别。
z
例:某气象站根据2个前期变量预报第二天是晴 天还是雨天。两个变量为:24小时的气压差 (x1)、温度露点差(x2)。 ① 据经验,当x1和x2大时,第二天晴天;当x1和x2小 时,第二天雨天。以线性组合函数y: y=c1x1 + c2x2

1.3 判别分析的种类
① 按判别的组数:两组判别和多组判别; ② 按区分不同总体所用的数学模型:线性判别和 非线性判别; ③ 按对参与分析变量的处理方法:逐步判别;非 逐步判别。 ④ 按判别准则不同:距离判别;费歇尔(Fisher)判 别;贝叶斯(Bayes)判别。
2 距离判别

基本思想
① 根据已知分类的数据,分别计算各类的重心即 分组(类)的均值 ② 判别准则是对任给的一次观测,若它与第i类的 重心距离最近,就认为它来自第i类。
所以判别函数为
判别函数为: y = 0.0815375 x1 + 0.001525 x2 + 0.00109125 x3

判别分析

培训大纲
一、概述 二、距离判别 三、贝叶斯判别 四、费希尔判别
概念:
判别分析是多元统计中用于判别样品所属类型 的一种统计分析方法。是一种在一些已知研究对象 用某种方法已经分成若干类的情况下,确定新的样 品的观测数据属于那一类的统计分析方法。
判别准则: 用于衡量新样品与各已知组别接近程度的思路原则。
距离判别样例:
data ds511; input id x1-x4 group $; cards;
1 13.85 2.79 7.80 49.60 A 2 22.31 4.67 12.31 47.80 A 3 28.82 4.63 16.18 62.15 A 4 15.29 3.54 7.50 43.20 A 5 28.79 4.90 16.12 58.10 A 6 2.18 1.06 1.22 20.60 B 7 3.85 0.80 4.06 47.10 B 8 11.40 0.00 3.50 0.00 B 9 3.66 2.42 2.14 15.10 B 10 12.10 0.00 5.68 0.00 B ; run; data d511test; input id x1-x4 group $ ; cards; 11 8.85 3.38 5.17 26.10 . 12 28.60 2.40 1.20 127.00 . 13 20.70 6.70 7.60 30.20 . 14 7.90 2.40 4.30 33.20 . 15 3.19 3.20 1.43 9.90 . 16 12.40 5.10 4.43 24.60 . 17 16.80 3.40 2.31 31.30 . 18 15.00 2.70 5.02 64.00 . ; run; proc discrim data=ds511
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(4.14) )
两总体的Fisher判别法 判别法 两总体的
β 在式( 无关, 在式(4.14)中, 与 j 无关,只对方程组的解起共同扩 ) 大倍数作用,对判别函数来讲没有影响, 大倍数作用,对判别函数来讲没有影响,故可令 β = 1 , 于是得
, c ,L , s11 c1 + s12 c 2 +cL + sc1m c m = d 1 s 21 c1 + s 22 c 2 + L + s 2 m c m = d 2 M L M M M s m 1 c1 + s m 2 c 2 + L + s mm c m = d m
1
∑(c x
i =1
+ L+ cm xAim − c1 xA1 − L− cm xAm) + ∑(c1 xBi1 + L+ cm xBim − c1 xB1 − L− cm xBm)2 Ai1
2 i =1
nb
(4.7) ) 显然式( 显然式(4.7)又可表为 )
max I (c1 , c 2 , L , c m )
Fisher判别 判别
Fisher判别 判别
Fisher判别 判别
费希尔判别的基本思想是投影(或降维)
Fisher方法是要找到一个(或一组)投 影轴w使得样本投影到该空间后能 在保证方差最小的情况下,将不同 类的样本很好的分开。并将度量类 别均值之间差别的量称为类间方差 (或类间散布矩阵);而度量这些均值 周围方差的量称为类内方差(或类内 散布矩阵)。Fisher判决的目标就是: 寻找一个或一组投影轴,能够在最 小化类内散布的同时最大化类间布。
) ( i = 1,2, L , na )(4.3) 的重心, 的重心,记为 (4.4) )
y( X )平面上投影点 y ai ( i = 1,2, L , na )
ya =
1 ( y a 1 + L + y ana ) = c1 x A1 + L + c m x Am na
两总体的Fisher判别法 判别法 两总体的
两总体的Fisher判别法 判别法 两总体的
Q = [ y a − y b ]2 对于式( ),令 对于式(4.7),令 ),
F = ∑ ( y ai − y a ) + ∑ ( y bi − y b ) 2
2 i =1 i =1 na nb
则 I=
Q F
∂I ∂ Q ( )= = ∂c j ∂ c j F F ∂Q ∂F −Q ∂c j ∂c j F2 =0
Fisher判别 判别
内容:
1、建立判别准则; 2、建立判别函数 3、回代样本; 4、估计回代的错误率; 5、判别新的样本。
Fisher判别 判别
y 是线性函数, 由于 ( X ) 是线性函数,一般可将 y( X )表示为
(4.2) ) 对于线性函数 y( X ) ,它的几何表示就是空间中 的一条直线或平面,或超平面, 的一条直线或平面,或超平面,如果我们把两 B 看成空间的两个点集, 总体 A、 看成空间的两个点集,该平面所起的 B 分开, 作用就是尽可能将空间两个点集 A 、 分开,如 所示。 图4.1所示。 所示
m ∂Q = 2( ∑ c j d j ) ⋅ d j ∂c j j =1
m
m
对式(4.10),有 有 对式 对式(4.11),有 , 对式
( j = 1,2,L , m )
(4.12) ) (4.13) )
m ∂F = 2∑ c l s il ∂c j j =1
将式(4.12)、式(4.13)代入式 、 代入式(4.9),有 将式 代入式 ,
2 y g ( X ) = c1 x1 + c 2 x 2 + c 3
两总体的Fisher判别法 判别法 两总体的
B 设已知两总体 A 和 B ,通过分析研究在 A、 两总体中分别提取了 m 个特征量 x1 , x 2 , L , x m , B B 次试验, 然后对A 、 两总体分别作na、nb次试验,得 A、 两总体的试验观测数据如下: 两总体的试验观测数据如下:
x A 11 x A 21 M x An a 1 x A 12 x A 22 M x An a 2 L L L L x A1m x A2m M x An a m x B 11 x B 21 M x Bn b 1 x B 12 x B 22 M x Bn b 2 L L L L x B 1m x B 2m M x Bn b m
第四章判别分析 Fisher判别 判别
Fisher判别 判别
在应用多元统计方法解决分类问题时,问题之一就是维数问题 维数问题。在 维数问题 低维空间里解析上或计算上行得通的方法,在高维空间里往往行不通。 因此,降低维数有时就成为处理实际问题的关键。 可以考虑把d维空间的样本投影到一条直线上,形成一维空间,这 在数学上是容易办到的。然而,即使样本在d维空间里形成若干紧凑的 d 相互分得开的集群,若把它们投影到一条任意的直线上,也可能使几类 样本混在一起而变得无法识别。但在一般情况下,总可以找到某个方向, 使在这个方向的直线上,样本的投影能分开得最好。问题是如何根据实 际情况找到这条最好的、最易于分类的投影线。这就是Fisher法则所要 解决的基本问题。
bi
( i = 1,2, L , nb )
b
以及 y( X )平面上投影点 y (i = 1,2,L, n ) 为 y b = c1 x B1 + L + c m x Bm
(4.5) ) 的重心, 的重心,记 (4.6) )
两总体的Fisher判别法 判别法 两总体的
其中, 其中,
x Bi 1 = nb
判别准则函数的矩阵形式
判别准则函数的矩阵形式
判别函数的显著性检验 判别函数数学模型的建立是在假定两组试验数 据取自不同的总体, 据取自不同的总体,但是如果两组试验数据的各 特征变量的平均值差异不显著, 特征变量的平均值差异不显著,从而所建的判别 函数数学模型就没有价值。为此, 函数数学模型就没有价值。为此,需要检验两总 体是否有显著差异。 体是否有显著差异。 检验所用的标准是以马氏( 检验所用的标准是以马氏(Mahalanobis) ) D2距离为基础所构成的统计量: 距离为基础所构成的统计量:
两总体的Fisher判别法 判别法 两总体的
其中, 其中,S 即
jl
= ∑ ( x Aij − x Aj )( x Ail − x Al ) + ∑ ( x Bij − x Bj )( x Bil − x Bl )
i =1 i =1
na
nb
F = ∑ ∑ c j c l s jl
j =1 l =1
y( X ) = c1 x 1 + c 2 x 2 + L + c m x m
Fisher判别 判别
要选择一个正确的投影方向, 要选择一个正确的投影方向, 正确的投影方向 使同类样品点沿该方向在直 上的投影点尽可能集中, 线 上的投影点尽可能集中, 不同类样品点尽可能分开, 不同类样品点尽可能分开, 这就是费歇提出的关于未知 样品归属于两类总体的模型 形成思想。 形成思想。
两总体的Fisher判别法 判别法 两总体的
m 1 m 2( ∑ c j d j )d j = 2∑ c l s jl I j =1 l =1
令 有 亦即
β=
∑c d
l =1 l
m
l
I
m
βd j = ∑ c l s jl
l =1
( j = 1,2,L , m )
s11 c1 + s12 c 2 + L + s1m c m = βd 1 s 21 c1 + s 22 c 2 + L + s 2 m c m = βd 2 M L M M M s m 1 c1 + s m 2 c 2 + L + s mm c m = βd m
m
a b
Q = [ y a − y b ] = [∑ c j x Aj − ∑ c j x Bj ]2
2
j =1 j
m
m
j
]2
(4.10) )
= ∑ [∑ c j ( x Aij − x Aj )] + ∑ [∑ c j ( x Bij − x Bj )]2
2 i =1 na j =1 i =1 j =1 m m ∑ c j ( x Aij − x Aj ) ⋅ ∑ c l ( x Ail − x Al ) = ∑ l =1 i =1 j =1 nb m m ∑ c j ( x Bij − x Bj ) ⋅ ∑ c l ( x Bil − x Bl ) + ∑ i =1 j =1 l =1 m m na nb
(4.8) ) (4.9) )
1 ∂Q ∂F = I ∂c j ∂c j
( j = 1,2,L , m )
两总体的Fisher判别法 判别法 两总体的
对于 j =1 j =1 d j = x Aj − x Bj Q = [∑ c d 令 ,则 n n 2 F = ∑ [ y ai − y a ] + ∑ [ y bi − y b ]2 对于 i =1 i =1
1 2 m
(4.15) ) 解线性方程组式( ),可求得判别函数系数 解线性方程组式(4.15),可求得判别函数系数 ), B c1 , c 2 ,L, c m 。于是建立起两总体 A 、 的判别分析数学 模型, 模型,即为 y( X ) = c1 x1 + c 2 x 2 + L + c m x m (4.16) )
F =[ na nb n + nb − m − 1 2 ][ a ]D ~ F ( m , na + nb − m − 1) ( na + nb )(na + nb − 2) m
相关文档
最新文档