多个总体距离判别法(DOC)

合集下载

多元统计分析填空和简答(一).doc

多元统计分析填空和简答(一).doc

1.多元分析研究的是多个随机变量及其相互关系的统计总体。

2.多元统计中常用的统计量有:样本均值、样本方差、样本协方差和样本相关系数。

3.协方差和相关系数仅仅是变量间离散程度的一种度量,并不能刻画变量间可能存在的关联程度。

4.人们通过各种实践,发现变量之间的相互关系可以分成相关和不相关两种类型。

5.总离差平方和可以分解为回归离差平方和和剩余离差平方和两个部分,各自的自由度为p 和n-p-1,其中回归离差平方和在总离差平方和中所占比重越大,则线性回归效果越显著。

7.偏相关系数是指多元回归分析中,当其他变量固定后,给定的两个变量之间的的相关系数。

8.Spss中回归方程的建模方法有一元线形回归、多元线形回归、岭回归、多对多线形回归等。

9.主成分分析是通过适当的变量替换,使新变量成为原变量的综合变量,并寻求相关性的一种方法。

10.主成分分析的基本思想是:设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。

11.主成分的协方差矩阵为对角矩阵。

12.主成分表达式的系数向量是相关系数矩阵的特征向量。

13.原始变量协方差矩阵的特征根的统计含义是原始数据的相关系数。

14.原始数据经过标准化处理,转化为均值为0 ,方差为1 的标准值,且其协方差矩阵与相关系数矩阵相等。

15.样本主成分的总方差等于1 。

16.变量按相关程度为,在相关性很强程度下,主成分分析的效果较好。

17.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为方差贡献度。

19.因子分析是把每个原始变量分解为两部分因素,一部分是公共因子,另一部分为特殊因子。

20.变量共同度是指因子载荷矩阵中第i行元素的平方和。

21.公共因子方差与特殊因子方差之和为 1 。

22.聚类分析是建立一种分类方法,它将一批样哂或变量按照它们在性质上的亲疏程度进行科学的分类。

23.Q型聚类法是按样品进行聚类,R型聚类法是按变量进行聚类。

判别分析-距离判别法

判别分析-距离判别法
判别规则为
x G1 , x G2 ,
如果 如果
x x
两个总体的距离判别法
(2) 当 μ1 μ 2 , Σ1 Σ 2 时,我们采用( 4.4)式作为判别 规则的形式。选择判别函数为
(1.1)
W * (X) D2 (X, G1 ) D2 (X, G2 ) 1 1 (X μ1 )Σ1 (X μ1 ) (X μ2 )Σ2 (X μ2 )
距离判别法例题
(6)对待样品判别归类结果如表4-5所示:
总结:回代率为百分之百,这与统计资料的结果相符,而待判的四 个样品的判别结果表明:中国、罗马尼亚为中等发展水平国家,即 第二类;希腊、哥伦比亚为高发展水平国家,即为第一类。这是符 合当时实际的,即与当时世界各国人文发展指数的水平相吻合。
SPSS运行结果
X i {x1 , x2 ,...,xm }T。令μ=E( X i)(i=1,2,
设X,Y是从总体G中抽取的两个样本,则X与Y之间的平方马 氏距离为: 2 d ( X , Y ) ( X Y )T 1 ( X Y ) 样本X与总体G的马氏距离的平方定义为:
d 2 ( X , G) ( X )T 1 ( X )
判别分析基本原理 判别函数 判别方法分类
引言
引 言
信息融合中的分析方法有三种,分别是:判别分析、聚类分 析、主成成分分析。 例如,某医院有部分患有肺炎、肝炎、冠心病、糖尿病等病 判别分析产生于 20 世纪 30 年代。近年来,在自然科学、社会 人的资料,记录了每个患者若干项症状指标数据。现在想利用现 学及经济管理学科中都有广泛的应用。 判别分析的特点是根据 有的这些资料找出一种方法,使得对于一个新的病人,当测得这 已掌握的、历史上每个类别的若干样本的数据信息,总结出客观 些症状指标数据时,能够判定其患有哪种病。这个问题可以应用 事物分类的规律性,建立判别公式和判别准则。然后,当遇到新 判别分析方法予以解决。 的样品时,只要根据总结出来的判别公式和判别准则,就能判别 该样品所属的类别。

判别分析(第1、2节_绪论、距离判别法)

判别分析(第1、2节_绪论、距离判别法)
按这种距离最近的判别准则:
x * , X G1 , * x , X G2 .
第二节 距离判别法
因为是单指标的问题,这时判别函数设为:Y Y ( x) x 此例中 * 79, 因 x0 78 * ,故判 X 0 G2 。
,在
下面给出对于 m元总体的这种相对距离 —即所谓的马氏距离 定义
2 更一般地,设总体G1的分布为 N (1 , 1 ) ,设总体G2的分布为
N (2 , 22 ) ,则利用统计距离,可以找出分界点 * ,且不妨设
1 2 ,所以若令 ( x 1 )2 ( x 2 )2 解出 1 2 2 1 * x , 12 22 1 2
d (X, Y) 2 ( X1 Y1 )2
( X p Yp )2 .
但在解决实际问题时,特别是针对多元数据的分析问题,欧氏 距离就显示出了它的一些缺陷。 譬 如 , 设 有 两 个 正 态 总 体 , X ~ N ( 1 , ) 和
2
Y ~ N ( 2 ,4 2 ) ,现有一个样品位于如图 5.1 所示的 A 点,距总 体 X 的中心的距离为 2 远,距总体 Y 的中心的距离为 3 远, 那么, A 点处的样品到底离哪一个总体近呢?
第一节 引言
判别分析内容很丰富,方法很多。①判断分析方法按判别的
总体个数来区分,有两个总体判别分析和多总体判别分析;②按
区分不同总体所用的数学模型来分,有线性判别和非线性判别; ③按判别时所处理的变量方法不同,有逐步判别和序贯判别等。
④判别分析可以从不同角度提出问题,因此有不同的判别准则,
如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平 方准则、最大似然准则、最大概率准则等等,按判别准则的不同

补充:判别分析

补充:判别分析
12
判别分析的适用场合

把这类问题用数学语言来表达,可以叙述如下: 设有n个样品,对每个样品测得p项指标的数据, 已知每个样品属于k个类别(或总体)G1, G2, …,Gk中的某一类。 我们希望利用这些数据,找出一种判别函数,使 得这一函数具有某种最优性质,能把属于不同类 别的样本点尽可能地区别开来。
它是原p维特征空间里的样本类内离散度矩阵,表示 两类均值向量之间的离散度大小,因此,越大越容易 区分。
25
将(6)
mi w M和(2) i
T
代入(4) S i2
式中:
x k X i
1 Mi ni
x k X i
x
k
Si2
( w T xk w T M i ) 2
x k X i
i i
Block(绝对距离): Si|xi-yi|
Pearson correlation
(相似系数2):
1 q
xi 2 yi 2
Chebychev: Maxi|xi-yi| Minkowski:
( xi yi ) i
q
C xy (2) rxy
( x x )( y y )
11

判别分析是用于判别个体所属群体的一种
统计方法,判别分析的特点是根据已掌握的、
历史上每个类别的若干样本的数据信息,总结
出客观事物分类的规律性,建立判别公式和判
别准则。然后,当遇到新的样本点时,只要根
据总结出来的判别公式和判别准则,就能判别 该样本点所属的类别。判别分析是一种应用性 很强的统计数据分析方法。
9
判别分析
引言 距离判别 Fisher判别 Bayes判别

多元统计第五章判别分析

多元统计第五章判别分析
第五章 判别分析
第一节 引言
在我们的日常生活和工作实践中,常常会遇到判别分析问题。
案例一:为了研究中小企业的破产模型,选定4个经济指标:总负债率、
收益性指标、短期支付能力、生产效率性指标。对17个破产企业(1类)和21
个正常运行企业(2类)进行了调查,得关于上述四个指标的资料。现有8个 未知类型的企业的四个经济指标的数据,判断其属于破产企业一类还是正 常运行企业一类? 案例二:根据经验,今天与昨天的湿度差x1及今天的压温差x2 (气压与温度
ˆ Σ
1 A , n 1
1,2,, k
三、判别分析的实质
设R1,R2,…,Rk是p维空间R p的k个子集,如果它们互
不 相交,且它们的和集为R p,则称R1,R2, …,Rk为R p的一 个划分。
在 两 个 总 体 的 距 离 判 别 问 题 中 , 利 用
W (X) (X μ)' α 可以得到空间 R p 的一个划分 R1 {X : W ( X) 0} R2 {X : W ( X) 0}
x2
-0.41 -0.31 0.02 -0.09 -0.09 -0.07 0.01 -0.06 -0.01 -0.14 -0.3 0.02 0 -0.23 0.05 0.11 -0.08 0.03 0 0.11 -0.27
x3
1.09 1.51 1.01 1.45 1.56 0.71 1.5 1.37 1.37 1.42 0.33 1.31 2.15 1.19 1.88 1.99 1.51 1.68 1.26 1.14 1.27
Σ 的一个联合无偏估计为
n
n2 1 和 X(2) Xi(2) n2 i 1 1 ˆ Σ ( A1 A2 ) n1 n2 2

判别分析-距离判别

判别分析-距离判别

= 2y′Σ −1 ( µ1 − µ 2 ) − ( µ1 + µ 2 )′Σ −1 ( µ1 − µ 2 )
( µ1 + µ 2 ) −1 = 2[y − ]′Σ ( µ1 − µ 2 ) 2 µ1 + µ 2 α = Σ −1 ( µ1 − µ2 ) = (a1 , a2 ,L, a p )′ 令µ = 2
利用这些数据找到一种判别函数,使得这一函数 具有某种最优性质,能把属于不同类别的样本点 尽可能的区别开来,并对同样测得 p项指标的新 样本进行归类.
关键:确定判别函数
判别准则: 判别准则: 用于衡量新样品与各已知组别接近程度的思路原则。 常用的有,距离准则、Fisher准则、贝叶斯准则。
判别函数: 判别函数: 基于一定的判别准则计算出的用于衡量新样品与各 已知组别接近程度的描述指标。
µ1 + µ 2
判别函数的常数项( 2 ′ ) Σ −1 ( µ1 − µ 2 )
(6)生成判别函数,将检验样本代入,判类。
三、多总体的距离判别法
设有 k 个 m元总体 G1,L, Gk ,分别有均值向量 µi和协方 差阵 Σi,对任给的 m元样品 X,判断它来自哪个总体 计算 X 到 k个总体的马氏距离,比较后,把 X 判归给 距离最小的那个总体,若
Y = (Y1 , Y2 ,..., Y p )',通常我们所说的两点间的距
离是指欧氏距离:
d 2 ( X , Y ) = ( X 1 − Y1 ) 2 + ... + ( X p − Yp ) 2
缺陷: 缺陷: 1、量纲的改变 2、数据的分散程度
1、设有量度重量和长度的两个变量 X和Y ,以单位 分别为kg和cm得到样本 A(0,5), B(10,0), C (1,0), D(0,10), 按照欧氏距离计算,有:

判别分析方法

判别分析方法

判别分析距离判别分析距离判别的最直观的想法是计算样品到第i类总体的平均数的距离,哪个跖离最小就将它判归哪个总体,所以,我们首先考虑的是是否能够构造一个恰当的距离函数,通过样本与某类别之间距离的大小,判别其所属类别。

设X=(s……以n)'和Y = O1,……,%)'是从期望为|1=(血,……川Q '和方差阵Y= (Ou)>0的总体G抽得的两个观测值,则称X与Y之间的马氏距离为:y mxmd2 =(X-Y)样本X与G,之间的马氏距离定义为X与类重心间的距离,即:9护=(乂一地)丫7(乂一&)i = 1,2・・.・・.,k附注:1、马氏距离与欧式距离的关联:为=1,马氏距离转换为欧式距离;2、马氏距离与欧式距离的差异:马氏距离不受计暈单位的影响,马氏距离是标准化的欧式距离两总体距离判别先考虑两个总体的情况,设有两个协差阵E相同的p维正态总体,对给定的样本Y,判别一个样本Y到底是来自哪一个总体,一个最直观的想法是计算Y到两个总体的距离。

故我们用马氏距离来给定判别规则,有:如/(y, J2(y, G2),<yeGp 如〃2(y, G2)<d2(y9 Gj待判,如=〃2(y,G2)沪(y,Gj=(y 2)' "(y 2)(y J' L(y J=y- 2y为一1角 + “;賞“2 -(y^1y-2y^1 + 冲?如) =2y 0一1 (" - 角)-("i + “2)尸(“i - “2)= 2[y —丫》-“2)2令"=1虽« = Z_1(//1-//2) = (a1,a2,-.-,a p yW(y) = (y - p)U = a f(y一p.)= a1(y1-/z1) + --- + a p(y p-/7p)= a'y _a'ji则前面的判别法则表示为y w Gp 如W (y) > 0,y e G2,如FT (y ) < 0o待判,如W(Y) = 0当忙“2和刀已知时, "1 2)是一个已知的P维向量,W (y)是y的线性函数,称为线性判别函数。

Fisher判别法距离判别法Bayes判别法逐步判别法

Fisher判别法距离判别法Bayes判别法逐步判别法
设有总体
又D1,D2,┅,Dk是R(p)的一个分划,判别法则为: 当样品X落入Di时,则判
i 1,2,3,, k X Di 关键的问题是寻找D1,D2,┅,Dk分划,这个分划 应该使平均错判率最小。
【定义】(平均错判损失函数)
用P(j/i)表示将来自总体Gi的样品错判到总体Gj的条件 概率。 p( j / i) P( X D j / Gi ) fi ( x)dx i j
P好人 P做好事 / 好人 P好人 P (做好事 / 好人) P (坏人) P (做好事 / 坏人)
P (好人 / 做好事)
0.5 0.9 0.82 0.5 0.9 0.5 0.2
P坏人P做好事 / 坏人 P好人P (做好事 / 好人) P (坏人) P (做好事 / 坏人)
办公室新来了一个雇员小王,小王是好人还是坏人大家 都在猜测。按人们主观意识,一个人是好人或坏人的概率均为 0.5。坏人总是要做坏事,好人总是做好事,偶尔也会做一件坏 事,一般好人做好事的概率为0.9,坏人做好事的概率为0.2, 一天,小王做了一件好事,小王是好人的概率有多大,你现在 把小王判为何种人。。
目录 上页 下页 返回 结束
7
§4.2
距离判别
2018/10/4
目录 上页 下页 返回 结束
8
§4.2
距离判别
2018/10/4
目录 上页 下页 返回 结束
9
§4.2
距离判别
2018/10/4
目录 上页 下页 返回 结束
10
4.2.2 多总体情况
§4.2
距离判别
1. 协差阵相同。
2018/10/4
目录 上页 下页 返回 结束
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多个总体距离判别法及其应用课程名:年级:专业:姓名:学号:目录一、摘要 (1)二、引言 (1)三、原理 (1)3.1定义 (1)3.2思想 (1)3.3判别分析过程 (1)四、具体应用 (3)4.1判别分析在医学上的应用 (3)4.2距离判别法在居民生活水平方面的应用 (9)4.3判别分析软件的使用 (12)五、参考文献 (14)六、附录 (15)一、 摘要近年来随着信息化社会的进行,数据分析对我们来说日趋重要,为了对数据的分类进行判别,本文介绍了数据分类判别的一种方法:距离判别法。

本文从多个总体距离判别法理论出发并结合例题详细介绍了多个总体距离判别法的在医学领域以及居民生活水平方面的应用,同时也简单介绍了spss 软件一般判别法的具体操作。

关键词: 距离判别法 判别分析 一般判别分析二、 引言随着科技的发展,判别分析在经济,医学等很多领域以及气候分类,农业区划,土地类型划分等有着重要的应用, 本文从多个总体距离判别分析理论出发,介绍了多个总体距离判别法在医学以及人民生活方面的应用,并介绍了spss 一般判别分析的应用。

三、 原理3.1 定义距离判别法:距离判别分析方法是判别样品所属类别的一应用性很强的多因素决方法,其中包括两个样本总体距离判别法,多个样本距离判别法。

多个总体距离判别法:多个总体距离判别法是距离判别法的一种,是两个总体距离判别法的推广,具有多个总体,将待测样本归为多个样本中的一类。

3.2 思想计算待测样本与各总体之间的距离,将待测样本归为与其距离最进的一类。

3.3 判别分析过程对于k 个总体k 21G G G ⋯,,,假设其均值分别为:k 21u u u ,,,⋯,协方差阵分别为:∑)(i ,(其中i=1,2,…k ),待测样本为),,,(p 21x x x X ⋯= ,其中p 21x x x ,,,⋯为样本X 的p 个检测指标,假设X 的均值为)x ,x ,x (X p 21,⋯=,协方差为∑,判断X属于哪个总体。

3.3.1 步骤:从k 21G G G ⋯,,,k 个总体中,取n 个样本,分别记为k 21G G G ⋯,,总体样本,再结合上面p 个指标,这k 个样本可以表述如下:第j 个总体样本(j=1,2…k)(1)当待测样本与各总体样本的均值相等时,即∑)(1 = ∑)(2……=∑)(k =∑;则相应的判别函数为:)()](21[]G X D -)G ([21X W )()(1')()(j2j 2ij 'j i j i u u u u X X D -+-==∑-),(,)( (其中i,j=1,2…k,)G (X,D j 2表示X 与j G 的马氏距离);判断准则:如果对所有i ≠j 有0W ij >成立,则i G X ∈,若存在i 和j 使得0W ij =成立,则待判。

当各样本总体的均值i u 和协方差阵∑未知时,可以从i G 中抽取)(n)(2)(1X ,X i i i X ⋯,i=1,2…k;则i u 和∑)(i 的无偏估计∑^i ^u ,可以表示为:∑===n j i j i i X n X1)()(^1u (i=1,2…,k ) ∑∑=-=^1n 1k i i S k (其中n=1+2+……+n ,)')((S )()(1j )()(i i i n ni i n X X X X --=∑=) (2)当各样本总体样本的均值不相等时,相应的判别函数为:)u -(X ][V )'u -(X -)u -(X ][V 'u -X X W (i)-1(i)(j)(j)-1(j)(j)ji )()(= 判别准则:若对所有i ≠j 有0W ij >则i G X ∈,若存在i 和j 使得0W ij =成立,则待判。

四、 具体应用4.1 判别分析在医学上的应用为了研究某地区人口死亡状况,已按某种方法将15个已知样品分为三类(如下表所示),指标及原始数据见下表,试建立判别函数并判定另外4个待判样品分别属于哪类。

我们假设两样本的协方差相等;本题中变两个数p=6,三类总体各有5个样本,故n1=n2=n3=5; 利用Matlab 软件并结合Excel 表格进行下列计算(具体计算见附录) 4.1.1 计算各组的样本的均值为:1X =(37.94 11.90 1.50 12.25 100.06 67.46)'2X =(39.54 11.50 2.94 27.83 151.02 66.05 )' 3X =(38.50 10.12 0.68 10.33 93.95 67.42)' 4.1.2 计算样本协方差:∑=--=n1k )1(1)1()1(1)1(k1)'(*S X X X X )(='*)(S 1k )2(2)2()2(2)2(2∑=--=nkkX X X X )(=')(*)(Sk )3(2)3()3(2)3(3∑=--=nk kX X X X= 从而222.23 197.4522.06 204.82 216.83 -78.73 197.45 184.16 19.95 189.14 202.76 -72.48 22.06 19.95 2.31 20.64 22.12 -7.70 204.82 189.14 20.64 194.65 208.18 -74.58 216.83 202.76 22.12 208.18 223.65 -79.32 -78.73 -72.48-7.70-74.58 -79.32 29.09根据公式:∑∑=-=^11ki i S k n 计算得:∑=^从而可求得其逆为:1-^∑=4.1.3 求判别函数)(X W ij,解线性方程组∑-=^)()()(j i X X a,得=1i a1-^∑=从而可以求得)](21[)(X W )2()1(111112X X X a X X a +-=-=)(52.23983.328.069.369.042.1x 62.3654321+---+-=x x x x x)](21[)()(W )3()1(121213X X X a X X a X +-=-=56.9297.115.084.050.012.2x 28.2-654321-+++-+=x x x x x)](21[)(X W )1()2(212121X X X a X X a +-=-=)(52.392-83.328.0x 69.3x 69.0-x 42.1x 62.3-654321x x ++++=)](21[)(X W )3()2(222223X X X a X X a +-=-=)(=332.08-79.543.053.419.153.3x 90.5-654321x x x x x +++-+)](21[)()(W )1()3(313131X X X a X X a X +-=-=56.9297.1-15.0-84.0-50.012.2-x 28.2654321++=x x x x x)](21[)()(W )2()3(323232X X X a X X a X +-=-==332.0879.5-43.0-53.4-19.153.3-x 90.5654321++x x x x x 从而:)(X W ij ==+ 4.1.4 对已知样本的回判:将题目中表格中个数据代入上述方程组中可得:从上表中可知判对率为100%。

4.1.5 对待测样本进行判断,通过EXcel 表格计算的下表从表格中可以看出待判样本1属于第3组,待判样本2属于第1组,带判样本3属于第3.62 -1.42 0.69 -3.69 -0.28 -3.83-2.28 2.12-0.50 0.84 0.15 1.97 -3.62 1.42 -0.69 3.69 0.28 3.83 -5.90 3.53 -1.19 4.53 0.43 5.79 2.28 -2.12 0.50 -0.84 -0.15 -1.97 5.90 -3.53 1.19 -4.53 -0.43 -5.79 654321X X X X X X239.52-92.56 -239.52 -332.08 92.56 332.082组,带判样本4属于第3组。

4.2距离判别法在居民生活水平方面的应用数据来源及说明:本例的数据来源于国家统计局网站,选择了全国20省市进行分析,数据为我国2010年城镇生活的6项重要指标,包括食品,衣着,燃料,住房及生活用品和文化生活。

由于数据未进行分类,故先对其进行聚类分析,我们选择前21个省市利用spss 进行K-均值聚类分析,为后面计算方便,将其分成3类,结果如下:建立表格如下:本例中变两个数为p=6;第一类有9个样本,第二类有8个样本,第三类有4个样本,即n1=9,n2=8,n3=4;4.2.1 三类地区个变量的均值:1X =(107.75 21.16 8.64 12.49 16.82 3.80)'; 2X =(142.98 24.30 14.45 17.04 20.41 5.13)'; 3X =(141.66 33.19 13.30 38.12 35.90 4.07)'; 4.2.2 计算样本协差阵:=∑^=∑-^14.2.3 求判别函数:=ij W4.2.4对已知样本进行回判:根据判别准则,并计算可的下表从上表中可知回判率为100%;故可对带判样本进行判别分析。

4.2.5对待判样本进行判别归类,计算结果如下从表中可以看出新疆属于第一组,湖南和黑龙江属于第二组,江苏属于第三组。

4.3判别分析软件的使用从上面的两个例子中可发现,对于3个样本的距离判别分析计算量很大,如果对于更多的样本的情况,计算将非常复杂,下面我们以例二为例简单介绍使用spss 进行一般判别分析4.3.1将数据输入spss数据视图中。

4.3.2一般判别分析spss操作选择菜单分析→分类→判别,出现下图(1),本例中将类别选入分组变量中,并定义其变量范围为1到3(下图(2)),将食品,衣着等其他变量选入自变量中,再按需要选择其他统计量和分类等,本题中这些选项选择默认,在单击保存,并勾选预测组成员(下图(3)).(1)(2)(3)单击确认就可得到本题的结果。

4.3.3结果分析:我们可以从数据视图中看到分类的结果:(即表格中最后一列)Wilks的Lambda检验结果可以用于检验各个判别函数有无统计学上的显著意义,由于本例中两个sig均小于0.05,说明判别函数的作用都是显著的。

从结果中还可以得到标准化函数的系数。

如下表所示其余的结果在这里不再详述,有兴趣的读者可以参阅《spss统计分析与数据挖掘》(谢龙汉尚涛)。

五、参考文献[1] 王静龙,梁小筠定性数据统计分析北京:中国统计出版社,2008.7[2] 任雪松,于秀林多元统计分析北京:中国统计出版社,2010.12[3] 谢龙汉,尚涛spss统计分析与数据挖掘北京:电子工业出版社,2012.1[4] 袁志发多元统计分析北京:科学出版社,2009.7[5] 朱建平应用多元统计分析北京:科学出版社,2012.6六、附录6.1均值计算如下表:S的计算计算:6.2i6.3系数矩阵a以及常数b求解的matlab程序:clear,clcA1=[-3.782 -4.46 -0.38 -4.376 -4.868 1.84;-4.882 -5.56 -0.42 -5.476 -5.978 2.24;-5.682 -2.66 -0.46 -3.276 -2.758 1.34;2.228 1.55 -0.07 1.634 1.142 -1.26;12.118 11.13 1.33 11.494 12.462 -4.16]';S1=A1*A1';A2=[-6.296 -5.256 -1.758 -4.93 8.986 -0.65;-7.316 -7.276 -1.878 -7.13 -26.324 2.65;1.614 -1.416 -0.618 5.01 21.036 -0.2;13.504 14.244 1.122 7.04 1.006 -2.55;-1.506 -0.296 3.132 0.01 -4.704 0.75]';S2=A2*A2';A3=[-4.47 -4.708 -0.614 -5.132 -3.846 2.08;-6.39 -7.098 -0.594 -7.192 -8.796 3.38;5.62 5.002 0.396 4.818 9.174 -2.62;15.67 14.912 1.426 14.818 16.194 -3.72;-10.43 -8.108 -0.614 -7.312 -12.726 0.88]';S3=A3*A3';S=S1+S2+S3;X1=(1/12)*S; %协方差X=inv(X1) ; %协方差的逆X1=[37.942 11.9 1.5 12.246 100.058 67.46]'; %X1的均值; X2=[39.536 11.496 2.938 27.83 151.024 66.05]'; %X2的均值; X3=[38.5 10.118 0.684 10.332 93.946 67.42]'; %X3的均值;a12=X*(X1-X2);b1=a12'*(-0.5*(X1+X2));a13=X*(X1-X3);b2=a13'*(-0.5*(X1+X3));a21=X*(X2-X1);b3=a21'*(-0.5*(X2+X1));a23=X*(X2-X3);b4=a23'*(-0.5*(X2+X3));a31=X*(X3-X1);b5=a31'*(-0.5*(X3+X1));a32=X*(X3-X2);b6=a32'*(-0.5*(X3+X2));A=[a12';a13';a21';a23';a31';a32'] %系数矩阵Ab=[b1;b2;b3;b4;b5;b6] %常数矩阵bF=[50.22 6.66 1.08 22.54 170.6 65.2;34.64 7.33 1.11 7.78 95.16 69.3; 33.42 6.22 1.12 22.95 160.31 68.3; 44.02 15.36 1.07 16.45 105.3 64.2;]'; B=[b b b b];W=A*F+B。

相关文档
最新文档