多个总体距离判别法

合集下载

多元统计分析的重点和内容和方法

多元统计分析的重点和内容和方法

一、什么是多元统计分析多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广。

多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律的一门统计学科。

二、多元统计分析的内容和方法1、简化数据结构(降维问题)将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。

(1)主成分分析(2)因子分析(3)对应分析等2、分类与判别(归类问题)对所考察的变量按相似程度进行分类。

(1)聚类分析:根据分析样本的各研究变量,将性质相似的样本归为一类的方法。

(2)判别分析:判别样本应属何种类型的统计方法。

例5:根据信息基础设施的发展状况,对世界20个国家和地区进行分类。

考察指标有6个:1、X1:每千居民拥有固定电话数目2、X2:每千人拥有移动电话数目3、X3:高峰时期每三分钟国际电话的成本4、X4:每千人拥有电脑的数目5、X5:每千人中电脑使用率6、X6:每千人中开通互联网的人数3、变量间的相互联系一是:分析一个或几个变量的变化是否依赖另一些变量的变化。

(回归分析)二是:两组变量间的相互关系(典型相关分析)4、多元数据的统计推断点估计参数估计区间估计统u检验计参数t检验推F检验断假设相关与回归检验卡方检验非参秩和检验秩相关检验1、假设检验的基本原理小概率事件原理小概率思想是指小概率事件(P<0.01或P<0.05等)在一次试验中基本上不会发生。

反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立;反之,则认为假设成立。

2、假设检验的步骤 (1)提出一个原假设和备择假设例如:要对妇女的平均身高进行检验,可以先假设妇女身高的均值等于 160 cm (u=160cm )。

这种原假设也称为零假设( null hypothesis ),记为 H 0 。

2.1 均值向量的检验1、正态总体均值检验的类型根据样本对其总体均值大小进行检验( One-Sample T Test ) 如妇女身高的检验。

两总体的面板数据的距离判别分析方法

两总体的面板数据的距离判别分析方法

其 中 ,α1,α2,… αT≥0 为 加 权 因 子 ,
i = 1
Σα =1, 当 α ,α ,…
t 1 2
αT>0 时 , 意味着所有时点数据都有价值 。
事实上如果采取加权平均法来处理非水平趋势的数据 序列的话 , 往往权重设置不同会导致得到的判定结果可能不 同 , 这时我们的权重就需要严格遵循我们研究的目的来郑重 设置了。 比如我们的研究目的更偏向于了解事物最近的情 况 , 甚 至 是 为 了 判 定 它 未 来 的 一 期 是 怎 么 样 的 , 这 时 如 果 dt (t=1,2 … T ) 是 非 水 平 趋 势 , 我 们 就 可 以 将 绝 大 多 数 的 权 重 赋 予最近的几期 。 则 dt 若具有非水平趋势 , 两总体面板数据的距离判别规 则为
赞 表示为给定样品 y 到第一个总体的距离与到第二 其 中d 赞 的贡献是 个总体的距离的差的估计值 。 这里 dt(t=1,2 … T ) 对 d
等权的 Ed=β,Vard=E(dt-β)2=Eεt , 。 则若 dt 具有水平趋势,两总体面板数据的距离判别规则为
2

3.2
赞 <0 y∈G1, 如 d 赞 ≥0 y∈G2, 如 d
知 识 丛 林
两总体的面板数据的距离判别分析方法
刘 兵 a, 刘 恒b
( 淮南师范学院 a. 经管系 ;b. 数学系 , 安徽 淮南 232038 )

要 : 提出了根据距离之差的时序数据的趋势特征来考虑进行面板数据的判别分 析 , 给 出 了
重复观察的各时点间隔相同的情况时两总体的面板数据距离判别规则 , 并给出了距离之差的时序数 据趋势特征的检验方法 , 最后分析了重复观察的各时点间隔并不相同时的距离判别分析方法 。 关键词 : 面板数据 ; 距离判别分析 ; 时间序列趋势 中图分类号 :F224 文献标识码 :A 文章编号 :1002-6487 (2010 )22-0153-02

判别分析-距离判别法

判别分析-距离判别法
判别规则为
x G1 , x G2 ,
如果 如果
x x
两个总体的距离判别法
(2) 当 μ1 μ 2 , Σ1 Σ 2 时,我们采用( 4.4)式作为判别 规则的形式。选择判别函数为
(1.1)
W * (X) D2 (X, G1 ) D2 (X, G2 ) 1 1 (X μ1 )Σ1 (X μ1 ) (X μ2 )Σ2 (X μ2 )
距离判别法例题
(6)对待样品判别归类结果如表4-5所示:
总结:回代率为百分之百,这与统计资料的结果相符,而待判的四 个样品的判别结果表明:中国、罗马尼亚为中等发展水平国家,即 第二类;希腊、哥伦比亚为高发展水平国家,即为第一类。这是符 合当时实际的,即与当时世界各国人文发展指数的水平相吻合。
SPSS运行结果
X i {x1 , x2 ,...,xm }T。令μ=E( X i)(i=1,2,
设X,Y是从总体G中抽取的两个样本,则X与Y之间的平方马 氏距离为: 2 d ( X , Y ) ( X Y )T 1 ( X Y ) 样本X与总体G的马氏距离的平方定义为:
d 2 ( X , G) ( X )T 1 ( X )
判别分析基本原理 判别函数 判别方法分类
引言
引 言
信息融合中的分析方法有三种,分别是:判别分析、聚类分 析、主成成分分析。 例如,某医院有部分患有肺炎、肝炎、冠心病、糖尿病等病 判别分析产生于 20 世纪 30 年代。近年来,在自然科学、社会 人的资料,记录了每个患者若干项症状指标数据。现在想利用现 学及经济管理学科中都有广泛的应用。 判别分析的特点是根据 有的这些资料找出一种方法,使得对于一个新的病人,当测得这 已掌握的、历史上每个类别的若干样本的数据信息,总结出客观 些症状指标数据时,能够判定其患有哪种病。这个问题可以应用 事物分类的规律性,建立判别公式和判别准则。然后,当遇到新 判别分析方法予以解决。 的样品时,只要根据总结出来的判别公式和判别准则,就能判别 该样品所属的类别。

补充:判别分析

补充:判别分析
12
判别分析的适用场合

把这类问题用数学语言来表达,可以叙述如下: 设有n个样品,对每个样品测得p项指标的数据, 已知每个样品属于k个类别(或总体)G1, G2, …,Gk中的某一类。 我们希望利用这些数据,找出一种判别函数,使 得这一函数具有某种最优性质,能把属于不同类 别的样本点尽可能地区别开来。
它是原p维特征空间里的样本类内离散度矩阵,表示 两类均值向量之间的离散度大小,因此,越大越容易 区分。
25
将(6)
mi w M和(2) i
T
代入(4) S i2
式中:
x k X i
1 Mi ni
x k X i
x
k
Si2
( w T xk w T M i ) 2
x k X i
i i
Block(绝对距离): Si|xi-yi|
Pearson correlation
(相似系数2):
1 q
xi 2 yi 2
Chebychev: Maxi|xi-yi| Minkowski:
( xi yi ) i
q
C xy (2) rxy
( x x )( y y )
11

判别分析是用于判别个体所属群体的一种
统计方法,判别分析的特点是根据已掌握的、
历史上每个类别的若干样本的数据信息,总结
出客观事物分类的规律性,建立判别公式和判
别准则。然后,当遇到新的样本点时,只要根
据总结出来的判别公式和判别准则,就能判别 该样本点所属的类别。判别分析是一种应用性 很强的统计数据分析方法。
9
判别分析
引言 距离判别 Fisher判别 Bayes判别

判别分析-贝叶斯判别

判别分析-贝叶斯判别

判归哪一类(取. q1
q2
q3
1 ,C( 3
j
|
i)
1,i 0,i
j) j
P(好人 / 做好事)
P好人P做好事 / 好人 P好人P(做好事 / 好人) P(坏人)P(做好事
/
坏人)
0.5 0.9
0.82
0.5 0.9 0.5 0.2
P(坏人 / 做好事)
P坏人P做好事 / 坏人 P好人P(做好事 / 好人) P(坏人)P(做好事
/
坏人)
0.5 0.2
0.18
0.5 0.9 0.5 0.2
D1,D2,… ,Dk是R(p)的一个分划,判别法则为:
当样品X落入Di时,判 X Di i 1,2,3,,k
关键的问题是寻找D1,D2,… ,Dk分划,这 个分划应该使平均错判率最小。
【定义】(平均错判损失)
用 p( j / i) 表示将来自总体Gi的样品错判到总体 Gj的条件概率。
p( j / i) P( X Dj / Gi ) fi (x)dx i j
1 (x μ(i) )Σ1(x μ(i) ) 2
1 [2 ln 2
qi
(x
μ(i)
)Σ 1 (x
μ(i) )]
令 Fi (x) 2ln qi (x μ(i) )Σ1(x μ(i))
2 ln qi x' Σ1x μ(i)' Σ1x x' Σ1μ(i) μ(i)' Σ1μ(i)
令 Pi (x) 2ln qi 2μ(i)Σ1x μ Σ μ (i) 1 (i)
D1
q1C(2 /1) q1C(2 /1) f1(x)dx
D1
q2C(1/ 2) f2 (x)dx

多元统计第五章判别分析

多元统计第五章判别分析
第五章 判别分析
第一节 引言
在我们的日常生活和工作实践中,常常会遇到判别分析问题。
案例一:为了研究中小企业的破产模型,选定4个经济指标:总负债率、
收益性指标、短期支付能力、生产效率性指标。对17个破产企业(1类)和21
个正常运行企业(2类)进行了调查,得关于上述四个指标的资料。现有8个 未知类型的企业的四个经济指标的数据,判断其属于破产企业一类还是正 常运行企业一类? 案例二:根据经验,今天与昨天的湿度差x1及今天的压温差x2 (气压与温度
ˆ Σ
1 A , n 1
1,2,, k
三、判别分析的实质
设R1,R2,…,Rk是p维空间R p的k个子集,如果它们互
不 相交,且它们的和集为R p,则称R1,R2, …,Rk为R p的一 个划分。
在 两 个 总 体 的 距 离 判 别 问 题 中 , 利 用
W (X) (X μ)' α 可以得到空间 R p 的一个划分 R1 {X : W ( X) 0} R2 {X : W ( X) 0}
x2
-0.41 -0.31 0.02 -0.09 -0.09 -0.07 0.01 -0.06 -0.01 -0.14 -0.3 0.02 0 -0.23 0.05 0.11 -0.08 0.03 0 0.11 -0.27
x3
1.09 1.51 1.01 1.45 1.56 0.71 1.5 1.37 1.37 1.42 0.33 1.31 2.15 1.19 1.88 1.99 1.51 1.68 1.26 1.14 1.27
Σ 的一个联合无偏估计为
n
n2 1 和 X(2) Xi(2) n2 i 1 1 ˆ Σ ( A1 A2 ) n1 n2 2

判别分析方法

判别分析方法

判别分析距离判别分析距离判别的最直观的想法是计算样品到第i类总体的平均数的距离,哪个跖离最小就将它判归哪个总体,所以,我们首先考虑的是是否能够构造一个恰当的距离函数,通过样本与某类别之间距离的大小,判别其所属类别。

设X=(s……以n)'和Y = O1,……,%)'是从期望为|1=(血,……川Q '和方差阵Y= (Ou)>0的总体G抽得的两个观测值,则称X与Y之间的马氏距离为:y mxmd2 =(X-Y)样本X与G,之间的马氏距离定义为X与类重心间的距离,即:9护=(乂一地)丫7(乂一&)i = 1,2・・.・・.,k附注:1、马氏距离与欧式距离的关联:为=1,马氏距离转换为欧式距离;2、马氏距离与欧式距离的差异:马氏距离不受计暈单位的影响,马氏距离是标准化的欧式距离两总体距离判别先考虑两个总体的情况,设有两个协差阵E相同的p维正态总体,对给定的样本Y,判别一个样本Y到底是来自哪一个总体,一个最直观的想法是计算Y到两个总体的距离。

故我们用马氏距离来给定判别规则,有:如/(y, J2(y, G2),<yeGp 如〃2(y, G2)<d2(y9 Gj待判,如=〃2(y,G2)沪(y,Gj=(y 2)' "(y 2)(y J' L(y J=y- 2y为一1角 + “;賞“2 -(y^1y-2y^1 + 冲?如) =2y 0一1 (" - 角)-("i + “2)尸(“i - “2)= 2[y —丫》-“2)2令"=1虽« = Z_1(//1-//2) = (a1,a2,-.-,a p yW(y) = (y - p)U = a f(y一p.)= a1(y1-/z1) + --- + a p(y p-/7p)= a'y _a'ji则前面的判别法则表示为y w Gp 如W (y) > 0,y e G2,如FT (y ) < 0o待判,如W(Y) = 0当忙“2和刀已知时, "1 2)是一个已知的P维向量,W (y)是y的线性函数,称为线性判别函数。

应用多元统计分析之判别分析

应用多元统计分析之判别分析

励志人生 好好学习
第二节 距离判别法
一 马氏距离的概念 二 距离判别的思想及方法
三 判别分析的实质
励志人生 好好学习

一、马氏距离的概念
励志人生 好好学习
图4.1
励志人生 好好学习
励志人生 好好学习
为此,我们引入一种由印度著名统计学家马哈拉诺比斯( Mahalanobis, 1936)提出的“马氏距离”的概念。
判别函数就有几个判别得分变量; Probabilities of group membership:存放样品属于各组的
Bayes后验概率值。
将对话框中的三个复选框均选中,单击Continue按钮返回。
励志人生 好好学习
图4.5 Save子对话框 6. 返回判别分析主界面,单击OK按钮,运行判别分析过程 。

励志人生 好好学习
励志人生 好好学习
第五节 实例分析与计算机实现
这一节我们利用SPSS对Fisher判别法和Bayes判别法进行计 算机实现。
为研究某地区人口死亡状况,已按某种方法将15个已知地区 样品分为3类,指标含义及原始数据如下。试建立判别函数 ,并判定另外4个待判地区属于哪类?
图4.4 Classify…子对话框
励志人生 好好学习
5. 单击Save按钮,指定在数据文件中生成代表判别分组结果 和判别得分的新变量,生成的新变量的含义分别为:
Predicted group membership:存放判别样品所属组别的值; Discriminant scores:存放Fisher判别得分的值,有几个典型
法就是为了解决这些问题而提出的一种判别方法。
励志人生 好好学习

一、Bayes判别的基本思想
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多个总体距离判别法及其应用课程名:年级:专业:姓名:学号:目录一、摘要 (1)二、引言 (1)三、原理 (1)3.1定义 (1)3.2思想 (1)3.3判别分析过程 (1)四、具体应用 (3)4.1判别分析在医学上的应用 (3)4.2距离判别法在居民生活水平方面的应用 (9)4.3判别分析软件的使用 (12)五、参考文献 (14)六、附录 (15)一、 摘要近年来随着信息化社会的进行,数据分析对我们来说日趋重要,为了对数据的分类进行判别,本文介绍了数据分类判别的一种方法:距离判别法。

本文从多个总体距离判别法理论出发并结合例题详细介绍了多个总体距离判别法的在医学领域以及居民生活水平方面的应用,同时也简单介绍了spss 软件一般判别法的具体操作。

关键词: 距离判别法 判别分析 一般判别分析二、 引言随着科技的发展,判别分析在经济,医学等很多领域以及气候分类,农业区划,土地类型划分等有着重要的应用, 本文从多个总体距离判别分析理论出发,介绍了多个总体距离判别法在医学以及人民生活方面的应用,并介绍了spss 一般判别分析的应用。

三、 原理3.1 定义距离判别法:距离判别分析方法是判别样品所属类别的一应用性很强的多因素决方法,其中包括两个样本总体距离判别法,多个样本距离判别法。

多个总体距离判别法:多个总体距离判别法是距离判别法的一种,是两个总体距离判别法的推广,具有多个总体,将待测样本归为多个样本中的一类。

3.2 思想计算待测样本与各总体之间的距离,将待测样本归为与其距离最进的一类。

3.3 判别分析过程对于k 个总体k 21G G G ⋯,,,假设其均值分别为:k 21u u u ,,,⋯,协方差阵分别为:∑)(i ,(其中i=1,2,…k ),待测样本为),,,(p 21x x x X ⋯= ,其中p 21x x x ,,,⋯为样本X 的p 个检测指标,假设X 的均值为)x ,x ,x (X p 21,⋯=,协方差为∑,判断X属于哪个总体。

3.3.1 步骤:从k 21G G G ⋯,,,k 个总体中,取n 个样本,分别记为k 21G G G ⋯,,总体样本,再结合上面p 个指标,这k 个样本可以表述如下:第j 个总体样本(j=1,2…k)(1)当待测样本与各总体样本的均值相等时,即∑)(1 = ∑)(2……=∑)(k =∑;则相应的判别函数为:)()](21[]G X D -)G ([21X W )()(1')()(j2j 2ij 'j i j i u u u u X X D -+-==∑-),(,)( (其中i,j=1,2…k,)G (X,D j 2表示X 与j G 的马氏距离);判断准则:如果对所有i ≠j 有0W ij >成立,则i G X ∈,若存在i 和j 使得0W ij =成立,则待判。

当各样本总体的均值i u 和协方差阵∑未知时,可以从i G 中抽取)(n)(2)(1X ,X i i i X ⋯,i=1,2…k;则i u 和∑)(i 的无偏估计∑^i ^u ,可以表示为:∑===n j i j i i X n X1)()(^1u (i=1,2…,k ) ∑∑=-=^1n 1k i i S k (其中n=1+2+……+n ,)')((S )()(1j )()(i i i n ni i n X X X X --=∑=) (2)当各样本总体样本的均值不相等时,相应的判别函数为:)u -(X ][V )'u -(X -)u -(X ][V 'u -X X W (i)-1(i)(j)(j)-1(j)(j)ji )()(= 判别准则:若对所有i ≠j 有0W ij >则i G X ∈,若存在i 和j 使得0W ij =成立,则待判。

四、 具体应用4.1 判别分析在医学上的应用为了研究某地区人口死亡状况,已按某种方法将15个已知样品分为三类(如下表所示),指标及原始数据见下表,试建立判别函数并判定另外4个待判样品分别属于哪类。

我们假设两样本的协方差相等;本题中变两个数p=6,三类总体各有5个样本,故n1=n2=n3=5; 利用Matlab 软件并结合Excel 表格进行下列计算(具体计算见附录) 4.1.1 计算各组的样本的均值为:1X =(37.94 11.90 1.50 12.25 100.06 67.46)'2X =(39.54 11.50 2.94 27.83 151.02 66.05 )' 3X =(38.50 10.12 0.68 10.33 93.95 67.42)' 4.1.2 计算样本协方差:∑=--=n1k )1(1)1()1(1)1(k1)'(*S X X X X )(='*)(S 1k )2(2)2()2(2)2(2∑=--=nkkX X X X )(=')(*)(Sk )3(2)3()3(2)3(3∑=--=nk kX X X X= 从而222.23 197.4522.06 204.82 216.83 -78.73 197.45 184.16 19.95 189.14 202.76 -72.48 22.06 19.95 2.31 20.64 22.12 -7.70 204.82 189.14 20.64 194.65 208.18 -74.58 216.83 202.76 22.12 208.18 223.65 -79.32 -78.73 -72.48-7.70-74.58 -79.32 29.09根据公式:∑∑=-=^11ki i S k n 计算得:∑=^从而可求得其逆为:1-^∑=4.1.3 求判别函数)(X W ij,解线性方程组∑-=^)()()(j i X X a,得=1i a1-^∑=从而可以求得)](21[)(X W )2()1(111112X X X a X X a +-=-=)(52.23983.328.069.369.042.1x 62.3654321+---+-=x x x x x)](21[)()(W )3()1(121213X X X a X X a X +-=-=56.9297.115.084.050.012.2x 28.2-654321-+++-+=x x x x x)](21[)(X W )1()2(212121X X X a X X a +-=-=)(52.392-83.328.0x 69.3x 69.0-x 42.1x 62.3-654321x x ++++=)](21[)(X W )3()2(222223X X X a X X a +-=-=)(=332.08-79.543.053.419.153.3x 90.5-654321x x x x x +++-+)](21[)()(W )1()3(313131X X X a X X a X +-=-=56.9297.1-15.0-84.0-50.012.2-x 28.2654321++=x x x x x)](21[)()(W )2()3(323232X X X a X X a X +-=-==332.0879.5-43.0-53.4-19.153.3-x 90.5654321++x x x x x 从而:)(X W ij ==+ 4.1.4 对已知样本的回判:将题目中表格中个数据代入上述方程组中可得:从上表中可知判对率为100%。

4.1.5 对待测样本进行判断,通过EXcel 表格计算的下表从表格中可以看出待判样本1属于第3组,待判样本2属于第1组,带判样本3属于第3.62 -1.42 0.69 -3.69 -0.28 -3.83-2.28 2.12-0.50 0.84 0.15 1.97 -3.62 1.42 -0.69 3.69 0.28 3.83 -5.90 3.53 -1.19 4.53 0.43 5.79 2.28 -2.12 0.50 -0.84 -0.15 -1.97 5.90 -3.53 1.19 -4.53 -0.43 -5.79 654321X X X X X X239.52-92.56 -239.52 -332.08 92.56 332.082组,带判样本4属于第3组。

4.2距离判别法在居民生活水平方面的应用数据来源及说明:本例的数据来源于国家统计局网站,选择了全国20省市进行分析,数据为我国2010年城镇生活的6项重要指标,包括食品,衣着,燃料,住房及生活用品和文化生活。

由于数据未进行分类,故先对其进行聚类分析,我们选择前21个省市利用spss 进行K-均值聚类分析,为后面计算方便,将其分成3类,结果如下:建立表格如下:本例中变两个数为p=6;第一类有9个样本,第二类有8个样本,第三类有4个样本,即n1=9,n2=8,n3=4;4.2.1 三类地区个变量的均值:1X =(107.75 21.16 8.64 12.49 16.82 3.80)'; 2X =(142.98 24.30 14.45 17.04 20.41 5.13)'; 3X =(141.66 33.19 13.30 38.12 35.90 4.07)'; 4.2.2 计算样本协差阵:=∑^=∑-^14.2.3 求判别函数:=ij W4.2.4对已知样本进行回判:根据判别准则,并计算可的下表从上表中可知回判率为100%;故可对带判样本进行判别分析。

4.2.5对待判样本进行判别归类,计算结果如下从表中可以看出新疆属于第一组,湖南和黑龙江属于第二组,江苏属于第三组。

4.3判别分析软件的使用从上面的两个例子中可发现,对于3个样本的距离判别分析计算量很大,如果对于更多的样本的情况,计算将非常复杂,下面我们以例二为例简单介绍使用spss 进行一般判别分析4.3.1将数据输入spss数据视图中。

4.3.2一般判别分析spss操作选择菜单分析→分类→判别,出现下图(1),本例中将类别选入分组变量中,并定义其变量范围为1到3(下图(2)),将食品,衣着等其他变量选入自变量中,再按需要选择其他统计量和分类等,本题中这些选项选择默认,在单击保存,并勾选预测组成员(下图(3)).(1)(2)(3)单击确认就可得到本题的结果。

4.3.3结果分析:我们可以从数据视图中看到分类的结果:(即表格中最后一列)Wilks的Lambda检验结果可以用于检验各个判别函数有无统计学上的显著意义,由于本例中两个sig均小于0.05,说明判别函数的作用都是显著的。

从结果中还可以得到标准化函数的系数。

如下表所示其余的结果在这里不再详述,有兴趣的读者可以参阅《spss统计分析与数据挖掘》(谢龙汉尚涛)。

五、参考文献[1] 王静龙,梁小筠定性数据统计分析北京:中国统计出版社,2008.7[2] 任雪松,于秀林多元统计分析北京:中国统计出版社,2010.12[3] 谢龙汉,尚涛spss统计分析与数据挖掘北京:电子工业出版社,2012.1[4] 袁志发多元统计分析北京:科学出版社,2009.7[5] 朱建平应用多元统计分析北京:科学出版社,2012.6六、附录6.1均值计算如下表:S的计算计算:6.2i6.3系数矩阵a以及常数b求解的matlab程序:clear,clcA1=[-3.782 -4.46 -0.38 -4.376 -4.868 1.84;-4.882 -5.56 -0.42 -5.476 -5.978 2.24;-5.682 -2.66 -0.46 -3.276 -2.758 1.34;2.228 1.55 -0.07 1.634 1.142 -1.26;12.118 11.13 1.33 11.494 12.462 -4.16]';S1=A1*A1';A2=[-6.296 -5.256 -1.758 -4.93 8.986 -0.65;-7.316 -7.276 -1.878 -7.13 -26.324 2.65;1.614 -1.416 -0.618 5.01 21.036 -0.2;13.504 14.244 1.122 7.04 1.006 -2.55;-1.506 -0.296 3.132 0.01 -4.704 0.75]';S2=A2*A2';A3=[-4.47 -4.708 -0.614 -5.132 -3.846 2.08;-6.39 -7.098 -0.594 -7.192 -8.796 3.38;5.62 5.002 0.396 4.818 9.174 -2.62;15.67 14.912 1.426 14.818 16.194 -3.72;-10.43 -8.108 -0.614 -7.312 -12.726 0.88]';S3=A3*A3';S=S1+S2+S3;X1=(1/12)*S; %协方差X=inv(X1) ; %协方差的逆X1=[37.942 11.9 1.5 12.246 100.058 67.46]'; %X1的均值; X2=[39.536 11.496 2.938 27.83 151.024 66.05]'; %X2的均值; X3=[38.5 10.118 0.684 10.332 93.946 67.42]'; %X3的均值;a12=X*(X1-X2);b1=a12'*(-0.5*(X1+X2));a13=X*(X1-X3);b2=a13'*(-0.5*(X1+X3));a21=X*(X2-X1);b3=a21'*(-0.5*(X2+X1));a23=X*(X2-X3);b4=a23'*(-0.5*(X2+X3));a31=X*(X3-X1);b5=a31'*(-0.5*(X3+X1));a32=X*(X3-X2);b6=a32'*(-0.5*(X3+X2));A=[a12';a13';a21';a23';a31';a32'] %系数矩阵Ab=[b1;b2;b3;b4;b5;b6] %常数矩阵bF=[50.22 6.66 1.08 22.54 170.6 65.2;34.64 7.33 1.11 7.78 95.16 69.3; 33.42 6.22 1.12 22.95 160.31 68.3; 44.02 15.36 1.07 16.45 105.3 64.2;]'; B=[b b b b];W=A*F+B。

相关文档
最新文档