判别分析-四种方法
数据分析知识:数据分析中的判别分析方法

数据分析知识:数据分析中的判别分析方法判别分析(Discriminant Analysis)是一种经典的统计分析方法,常用于解决分类问题。
通过对已知分类的数据进行学习,再对未知数据进行分类。
判别分析方法的主要目标是确定一个或多个变量的线性组合,这个线性组合在不同类别中能够最大化差异,最小化类内差异。
这篇文章将介绍判别分析的基本概念、方法和应用,并对判别分析和其他分类方法进行比较。
一、判别分析的基本概念1.1判别分析的基本思想判别分析的基本思想是找到一个或多个线性组合,使得不同类别之间的差异最大化,同一类别内的差异最小化。
这个线性组合可以被用来将数据投影到一个低维空间,从而实现分类。
比如,对于二分类问题,找到一条直线将两类数据分开。
1.2判别分析的应用场景判别分析广泛应用于生物医学、社会科学、市场营销等领域。
比如,利用判别分析对患者进行分类,预测其疾病的风险;对消费者进行分类,预测其购买行为等。
1.3判别分析的假设判别分析方法通常有一些假设,比如多元正态性、同方差性和无相关性等。
如果这些假设不成立,可能会影响判别分析的结果。
二、判别分析的方法2.1线性判别分析(LDA)线性判别分析是判别分析中最常用的方法之一。
它通过找到一个或多个线性组合,使得不同类别之间的差异最大化,同一类别内的差异最小化。
在实际应用中,常常利用LDA来降维,然后使用简单的分类器进行分类。
2.2二次判别分析(QDA)二次判别分析是判别分析的一种扩展,它允许类别内的协方差不相等。
相比于LDA,QDA的分类边界更加灵活,但是通常需要更多的参数。
2.3特征抽取判别分析通常需要找到一个或多个变量的线性组合,这些变量通常被称为特征。
特征抽取是判别分析的一个重要步骤,它可以通过一些算法比如主成分分析(PCA)来实现。
特征抽取的目标是尽可能多地保留原始数据的信息,在降低维度的同时尽可能减少信息损失。
三、判别分析的应用3.1医学领域在医学领域,判别分析被广泛应用于疾病诊断、治疗方案选择等方面。
统计学中的判别分析

统计学中的判别分析判别分析是统计学中一种常见的分析方法,旨在通过将样本数据归类到一个或多个已知的类别中,来识别和描述不同类别之间的差异。
它在很多领域中都有广泛的应用,例如医学、市场调研、金融等。
本文将介绍判别分析的基本原理、常见的判别分析方法以及其在实际应用中的一些例子。
一、判别分析的原理判别分析的目标是构建一个判别函数,通过输入变量的值来判别或预测样本所属的类别。
它的核心思想是通过最大化类别间的差异和最小化类别内部的差异,来建立一个有效的分类模型。
判别分析的基本原理可以用以下步骤来描述:1. 收集样本数据,包括已知类别的样本和它们的属性值。
2. 对每个样本计算各个属性的平均值和方差。
3. 计算类别内部散布矩阵和类别间散布矩阵。
4. 根据散布矩阵计算特征值和特征向量。
5. 选择最具判别能力的特征值和特征向量作为判别函数的基础。
二、判别分析的方法判别分析有多种方法可以选择,常见的包括线性判别分析(Linear Discriminant Analysis,简称LDA)和二次判别分析(Quadratic Discriminant Analysis,简称QDA)。
1. 线性判别分析(LDA)线性判别分析假设每个类别的样本数据满足多元正态分布,并且各个类别的协方差矩阵相等。
它通过计算最佳投影方向,将多维属性值降低到一维或两维来实现分类。
LDA在分类问题中被广泛应用,并且在特征选择和降维方面也有一定的效果。
2. 二次判别分析(QDA)二次判别分析不同于LDA,它允许每个类别具有不同的协方差矩阵。
QDA通常适用于样本数据的协方差矩阵不相等或不满足多元正态分布的情况。
与LDA相比,QDA在处理非线性问题时可能更有优势。
三、判别分析的应用实例判别分析在多个领域中都有广泛的应用,下面列举了一些实际的例子。
1. 医学领域在医学中,判别分析可以帮助诊断疾病或判断病情。
例如,可以利用病人的临床数据(如血压、血糖等指标)进行判别分析,来预测是否患有某种疾病,或者判断疾病的严重程度。
判别分析简介

于是, max max 2、计算判别界值
求得 ai 后,代入判别函数式即得判别函数。 求判别界值 Y0 :把类 1 、类 2 中各指标的均数分别代入判别函数式:
' Y1 a X 1 ' Y2 a X 2
然后以两均数的中点作为两类的界点:
Y0
Y1 Y2 2
3、建立判别标准
距离判别 线性判别 Fisher (属于确定性判别) 判别分析方法 非线性判别 典型判别 Bayes判别(属于概率性判别)
判别分析

(1) 1 n1 (1) X i X (1) n1 i 1
( 2)
X ( 2)
(1) ( 2) 1 X X ( (1) ( 2 ) ) , 2 2 1 ( S1 S2 ), n1 n2 2
其中Si ( X
数学建模培训课件
判别分析
邱国新
qiugx02@
Def :判别分析是在已知研究对象分成若干类型(或 组别)并已取得各种类型的一批已知样品观测 数据,在此基础上根据某些准则建立判别式, 然后对未知类型的样品进行分类.
判别分析和聚类分析往往联合起来使用,当 总体分类不清楚时,可先用聚类分析对原来的一批 样品进行分类,然后再用判别分析建立判别式以对 新样品进行判别. 按照判别准则的不同,判别方法又分为距离判别 法,Fisher判别法,Bayes判别法和逐步判别法.
(1)当 (1) ( 2 ) 时, D 2 ( X , G2 ) D 2 ( X , G1 ) 2[ X
1 (1) 令 ( ( 2 ) ), 2
(1) ( 2 )
2
] 1 ( (1) ( 2 ) )
W ( X ) ( X ) 1 ( (1) ( 2 ) )
G2总体
X 1( 2 ) (2) X2 (2) Xn 2
( 2) X 11 ( 2) X 21 ( 2) Xn 21 ( 2) X 12 ( 2) X 22 ( 2) Xn 22 ) X 1( 2 p ( 2) X2p ( 2) Xn 2p
1
15
where
n1
( 1) ( 2) d k xk xk ,
判别分析法

判别分析判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。
据此即可确定某一样本属于何类。
1:距离判别的判别准则和判别函数:设总体A 和B 的均值向量分别为1μ和2μ,协方差阵分别为1∑和2∑,今给一个样本x 要判断x 来自哪一个总体。
若协方差相同,即1212μμ∑∑∑≠==,计算x 到总体A 和B 的Mahalanobis 距离(,)d x A 和(,)d x B ,Mahalanobis 的计算有以下定义:定义5.1 设x 是从均值为μ,协方差为∑的总体A 中抽取的样本,则总体A 内两点x 与y 的Mahalanobis 距离(简称马氏距离)定义为:(,)d x y =定义样本x 与总体A 的Mahalanobis 距离为:(,)d x A =然后进行比较,若(,)(,)d x A d x B ≤,则判定x 属于A ;否则判定x 来自B 。
由此得到如下判别准则:,(,)(,),(,)(,)A d x A d x B x B d x A d x B ≤⎧∈⎨≥⎩令T 112()()()w x x μ∑μμ-=-- 称()w x 为两总体距离的判别函数,由此判别准则变为,()0,,()0.A w x x B w x ≥⎧∈⎨≤⎩在实际计算中,总体的均值和协方差阵都是未知的,由此总体的均值与协方差需要用样本的均值和协方差来代替,设1(1)(1)(1)12,,,nx x x ⋅⋅⋅是来自总体A 的1n 个样本点,2(2)(2)(2)12,,,n x x x ⋅⋅⋅是来自总体B 的2n 个样本,则样本的均值和协方差为 11ˆ,1,2in ii i j j iux x i n ====∑2()()()()T1211121211ˆ=()()()22in i i i i j ji j x x x x S S n n n n ==∑---++-+-∑∑ 其中()()()()T 1()(),1,2in i i i i i j j j S x x x x i ==--=∑对于待测样本x ,其判别函数定义为T 1(1)(2)ˆˆˆˆ()()()wx x x x x ∑-=-- 其中(1)(2)ˆˆˆ2x x x +=其判别准则为ˆ,()0,ˆ,()0.A wx x B wx ≥⎧∈⎨≤⎩ 2:若协方差不同,即1212μμ∑∑≠≠,对于样本x ,在方差不同的情况下,判别函数为 T -1T -1222111ˆˆ()()()()()W x x x x x μ∑μμ∑μ=----- 在实际计算中,总体的均值和协方差阵都是未知的,由此总体的均值与协方差需要用样本的均值和协方差来代替。
判别分析

判别分析判别分析是用以判别个体所属群体的一种统计方法。
最常用的判别方法:距离判别法、Bayes 判别法、Fisher 判别法。
1、距离判别法最为直观,其想法简单自然,就是计算新样品x 到各组的距离,然后将该样品判为离它距离最近的那一组。
定义:设组π的均值为μ,协方差矩阵为∑,x 是一个样品(样本),称()()μμπ-∑'-=-x x x d 1),(为x 到总体π的马氏距离或统计距离。
判别准则:不妨假设有k 组,记为k ππ...1,,均值分别为k μμ...1,,协方差矩阵分别为k ∑∑...,1,,若),(min ),(212i ki l x d x d ππ≤≤=,则判断x 来自第l 组。
注1:若k ∑==∑...1,上述准则可以化简,如果不确定是否相等,可两种情况都试试,那种规则误判概率小选哪种。
注2:实际中k μμ...1,以及k ∑∑...,1,均未知,用估计量代替。
2、Bayes 判别法(1)最大后验概率准则设有k 个组k ππ...1,,且组i π的概率密度为()x f i ,样品x 来自组i π的先验概率为,,...,1,k i p i =且.11=∑=ki i p 利用Bayes 理论,x 属于i π的后验概率(即当样品x 已知时,它属于i π的先验概率)为()().,...,2,1,)(1k i x f p x f p x P k j j j i i i ==∑=π最大后验概率法是采用如下的判别规则:()x P x P x l ji l l πππ≤≤=∈1max )(,若. (2)最小平均误判代价准则()()()()∑∑≠=≤≤≠==∈ki j j j j k i j k l j j j l j i c x f p j l c x f p x 111m i n ,若π,其中)(j i c 表示将来自j π的x 判为i π的代价。
例:设有321,,πππ三个组,欲判别某样品0x 属于何组,已知()()().4.2,63.0,10.0,30.0,65.0,05.0030201321======x f x f x f p p p 计算:()()004.04.230.063.065.010.005.010.005.0)(1111=⨯+⨯+⨯⨯==∑=k j j j x f p x f p x P π ()361.02=x P π()635.03=x P π假定误判代价矩阵为95.4110063.065.020010.005.0:305.36504.230.01010.005.0:239.51604.230.02063.065.0:1=⨯⨯+⨯⨯==⨯⨯+⨯⨯==⨯⨯+⨯⨯=l l l 3、Fisher 判别基本思想:先对原始数据进行降维,然后对新数据使用距离判别法进行判别。
判别分析方法及其应用效果评估

判别分析方法及其应用效果评估判别分析方法是一种常用的统计分析方法,用于确定分类系统中哪些变量最能有效地区分不同的组别。
它基于一组预测变量(或称为自变量)的输入值,以及一组已知类别(或称为因变量)的输出值,通过构建分类模型来判断新样本属于哪个组别。
本文将介绍判别分析方法的基本原理、常见的判别分析方法及其应用效果评估。
## 一、判别分析方法的基本原理判别分析方法基于贝叶斯决策理论,旨在通过最小化错判率来实现最优分类。
假设有K个已知的类别,以及p个预测变量。
判别分析方法假设预测变量满足多元正态分布,并利用已知类别的样本数据估计每个类别的均值向量和协方差矩阵。
根据这些参数,可以建立判别函数来判断新样本的分类。
判别函数的形式根据具体的判别分析方法而定。
常见的判别分析方法有线性判别分析(LDA)、二次判别分析(QDA)和最近邻判别分析(KNN)等。
这些方法使用不同的数学模型和算法来构建判别函数,具有不同的优势和适用范围。
## 二、常见的判别分析方法及其特点### 1. 线性判别分析(LDA)线性判别分析是一种最常用的判别分析方法。
它假设各类别的协方差矩阵相等,即样本来自同一多元正态分布。
LDA通过计算类别间散布矩阵和类别内散布矩阵的比值来确定最优的判别函数。
LDA的优点是计算简单、效果稳定,并且不受样本数量和维度的限制。
然而,它对样本的分布假设要求较高,如果样本不满足多元正态分布,LDA可能会出现较大偏差。
### 2. 二次判别分析(QDA)二次判别分析是一种放宽了协方差矩阵相等假设的判别分析方法。
QDA假设每个类别的协方差矩阵各不相同,通过计算类别间散布矩阵和类别内散布矩阵的比值来确定最优的判别函数。
相比于LDA,QDA更加灵活,可以适应更加复杂的数据分布。
然而,由于需要估计更多的参数,QDA的计算复杂度较高,并且对样本数量和维度的要求较高。
### 3. 最近邻判别分析(KNN)最近邻判别分析是一种基于样本距离的判别分析方法。
判别分析方法

判别分析距离判别分析距离判别的最直观的想法是计算样品到第i类总体的平均数的距离,哪个跖离最小就将它判归哪个总体,所以,我们首先考虑的是是否能够构造一个恰当的距离函数,通过样本与某类别之间距离的大小,判别其所属类别。
设X=(s……以n)'和Y = O1,……,%)'是从期望为|1=(血,……川Q '和方差阵Y= (Ou)>0的总体G抽得的两个观测值,则称X与Y之间的马氏距离为:y mxmd2 =(X-Y)样本X与G,之间的马氏距离定义为X与类重心间的距离,即:9护=(乂一地)丫7(乂一&)i = 1,2・・.・・.,k附注:1、马氏距离与欧式距离的关联:为=1,马氏距离转换为欧式距离;2、马氏距离与欧式距离的差异:马氏距离不受计暈单位的影响,马氏距离是标准化的欧式距离两总体距离判别先考虑两个总体的情况,设有两个协差阵E相同的p维正态总体,对给定的样本Y,判别一个样本Y到底是来自哪一个总体,一个最直观的想法是计算Y到两个总体的距离。
故我们用马氏距离来给定判别规则,有:如/(y, J2(y, G2),<yeGp 如〃2(y, G2)<d2(y9 Gj待判,如=〃2(y,G2)沪(y,Gj=(y 2)' "(y 2)(y J' L(y J=y- 2y为一1角 + “;賞“2 -(y^1y-2y^1 + 冲?如) =2y 0一1 (" - 角)-("i + “2)尸(“i - “2)= 2[y —丫》-“2)2令"=1虽« = Z_1(//1-//2) = (a1,a2,-.-,a p yW(y) = (y - p)U = a f(y一p.)= a1(y1-/z1) + --- + a p(y p-/7p)= a'y _a'ji则前面的判别法则表示为y w Gp 如W (y) > 0,y e G2,如FT (y ) < 0o待判,如W(Y) = 0当忙“2和刀已知时, "1 2)是一个已知的P维向量,W (y)是y的线性函数,称为线性判别函数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 判别分析§6.1 什么是判别分析判别分析是判别样品所属类型的一种统计方法,其应用之广可与回归分析媲美。
在生产、科研和日常生活中经常需要根据观测到的数据资料,对所研究的对象进行分类。
例如在经济学中,根据人均国民收入、人均工农业产值、人均消费水平等多种指标来判定一个国家的经济发展程度所属类型;在市场预测中,根据以往调查所得的种种指标,判别下季度产品是畅销、平常或滞销;在地质勘探中,根据岩石标本的多种特性来判别地层的地质年代,由采样分析出的多种成份来判别此地是有矿或无矿,是铜矿或铁矿等;在油田开发中,根据钻井的电测或化验数据,判别是否遇到油层、水层、干层或油水混合层;在农林害虫预报中,根据以往的虫情、多种气象因子来判别一个月后的虫情是大发生、中发生或正常; 在体育运动中,判别某游泳运动员的“苗子”是适合练蛙泳、仰泳、还是自由泳等;在医疗诊断中,根据某人多种体验指标(如体温、血压、白血球等)来判别此人是有病还是无病。
总之,在实际问题中需要判别的问题几乎到处可见。
判别分析与聚类分析不同。
判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。
对于聚类分析来说,一批给定样品要划分的类型事先并不知道,正需要通过聚类分析来给以确定类型的。
正因为如此,判别分析和聚类分析往往联合起来使用,例如判别分析是要求先知道各类总体情况才能判断新样品的归类,当总体分类不清楚时,可先用聚类分析对原来的一批样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。
判别分析内容很丰富,方法很多。
判别分析按判别的组数来区分,有两组判别分析和多组判别分析;按区分不同总体的所用的数学模型来分,有线性判别和非线性判别;按判别时所处理的变量方法不同,有逐步判别和序贯判别等。
判别分析可以从不同角度提出的问题,因此有不同的判别准则,如马氏距离最小准则、Fisher 准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等,按判别准则的不同又提出多种判别方法。
本章仅介绍四种常用的判别方法即距离判别法、Fisher 判别法、Bayes 判别法和逐步判别法。
§6.2 距离判别法基本思想:首先根据已知分类的数据,分别计算各类的重心即分组(类)的均值,判别准则是对任给的一次观测,若它与第i 类的重心距离最近,就认为它来自第i 类。
距离判别法,对各类(或总体)的分布,并无特定的要求。
1 两个总体的距离判别法设有两个总体(或称两类)G 1、G 2,从第一个总体中抽取n 1个样品,从第二个总体中抽取n 2个样品,每个样品测量p 个指标如下页表。
今任取一个样品,实测指标值为),,(1'=p x x X ,问X 应判归为哪一类?首先计算X 到G 1、G 2总体的距离,分别记为),(1G X D 和),(2G X D ,按距离最近准则判别归类,则可写成:⎪⎩⎪⎨⎧=>∈<∈),(),( ,),(),(,),(),(,21212211G X D G X D G X D G X D G X G X D G X D G X 当待判当当 G 1总体: G 2总体:记2,1,),,()()(1)(='=i x x Xi p i i如果距离定义采用欧氏距离,则可计算出1(,)D X G ==2(,)D X G ==然后比较),(1G X D 和),(2G X D 大小,按距离最近准则判别归类。
由于马氏距离在多元统计分析中经常用到,这里针对马氏距离对上述准则做较详细的讨论。
设)1(μ、)2(μ,)1(∑、)2(∑分别为G 1、G 2的均值向量和协方差矩阵。
如果距离定义采用马氏距离即2,1)()()(),()(1)()(2=-∑'-=-i X X G X D i i i i μμ这时判别准则可分以下两种情况给出: (1)当∑=∑=∑)2()1(时考察),(22G X D 及),(12G X D 的差,就有:)2(1)2()2(1112222),(),(μμμ-'--∑+∑'-∑'=-X X X X G X D G X D]2[)1(1)1()1(11μμμ-'--∑+∑'-∑'-X X X)()()(2)2()1(1)2()1()2()1(1μμμμμμ-∑'+--∑'=--X)()(212)2()1(1)2()1(μμμμ-∑'⎥⎦⎤⎢⎣⎡+-=-X 令)(21)2()1(μμμ+=)()()()2()1(1μμμ-∑'-=-X X W则判别准则可写成:⎪⎩⎪⎨⎧==<<∈>>∈),(),(D 0)(,),(),(D 0)(,),(),(D 0)(,12221222212221G X D G X X W G X D G X X W G X G X D G X X W G X 即当待判即当即当 当)2()1(,,μμ∑已知时,令),,()(1)2()1(1'∆-∑=-p a a a μμ则⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡--=-'='-=p p p x x a a X a a X X W μμμμ ),,()()()(111)()(111p p p x a x a μμ-++-=显然,W (X )是p x x ,,1 的线性函数,称W (X )为线性判别函数,a 为判别系数。
当)2()1(,,μμ∑未知时,可通过样本来估计。
设)()(2)(1,,,i ni i iX X X 来自G i 的样本,i =1,2。
∑===11)1()1(1)1(1ˆn i i X X n μ ∑===21)2()2(2)2(1ˆn i i XX n μ)(21ˆ2121S S n n +-+=∑其中 ∑='--=in t i i t i i t i X X X XS 1)()()()())(()(21)2()1(X X X +=线性判别函数为:)(ˆ)()()2()1(1X X X X X W -∑'-=- 当p =1时,若两个总体的分布分别为),(21σμN 和),(22σμN ,判别函数)(1)2()(21221μμσμμ-⎪⎭⎫ ⎝⎛+-=X X W ,不妨设21μμ<,这时W(X)的符号取决于μ>X 或μ<X 。
当μ<X 时,判1G X ∈;当μ>X 时,判2G X ∈。
我们看到用距离判别所得到的准则是颇为合理的。
但从下图又可以看出,用这个判别法有时也会得出错判。
如X 来自G 1,但却落入D 2,被判为属G 2,错判的概率为图中阴影的面积,记为)1/2(P ,类似有)2/1(P ,显然)1/2(P =)2/1(P =⎪⎭⎫⎝⎛-Φ-σμμ2121。
当两总体靠得很近(即|21μμ-|小),则无论用何种办法,错判概率都很大,这时作判别分析是没有意义的。
因此只有当两个总体的均值有显著差异时,作判别分析才有意义。
(2)当)2()1(∑≠∑时按距离最近准则,类似地有:⎪⎩⎪⎨⎧=>∈<∈),(),( ,),(),(,),(),(,21212211G X D G X D G X D G X D G X G X D G X D G X 当待判当当 仍然用),(),()(1222G X D G X D X W -=)()()()2(1)2()2(μμ-∑'-=-X X )()()()1(1)1()1(μμ-∑'---X X作为判别函数,它是X 的二次函数。
2 多个总体的距离判别法类似两个总体的讨论推广到多个总体。
设有k 个总体G 1, …, G k ,它们的均值和协方差阵分别为k i i i ,,1,,)()( =∑μ,从每个总体G i 中抽取n i 个样品,i =1,…,k ,每个样品测p 个指标。
今任取一个样品,实测指标值为),,(1'=p x x X ,问X 应判归为哪一类?G 1总体: … G k 总体:记向量k i x x x X p i ,,1 ),,,(21)( ='=(1)当∑=∑-=∑)()1(k 时此时k ,1,i )()(),()(1)(2 =-∑'-=-i i i X X G X D μμ判别函数为:)],(),([21)(22i j ij G X D G X D X W -=()k ,1,j i, )(21)()(1)()( =-∑'⎥⎦⎤⎢⎣⎡+-=-j i j i X μμμμ相应的判别准则为:⎪⎩⎪⎨⎧=≠>∈0)(W ,,0)(W ,ij ij X ij X G X i 若有某一个待判对一切当 当)1()1(,,μμ ,∑未知时可用其估计量代替,设从G i 中抽取的样本为k i X X i n i i,,1,,,)()(1=,则)(ˆi μ,∑ˆ的估计分别为 ∑====in a i aii i k i Xn X1)()()(,,11ˆ μ∑=-=∑ki iSkn 11ˆ其中 ∑='--=++=in a i i a i i ai i X X X XS n n n 1)()()()(1))((, 为G i 的样本离差阵。
(2)当)()1(,,k ∑∑ 不相等时此时判别函数为:)(][)()()(1)()(j j j ji X V X X W μμ-'-=-)(][)()(1)()(i i i X V X μμ-'---相应的判别准则为:⎪⎩⎪⎨⎧=≠>∈0)(W ,,0)(W ,ij ij X ij X G X i 若某一个待判对一切当 当),,1(,)()(k i i i =∑μ未知时,可用)()(,i i ∑μ的估计量代替,即)()(ˆi i X =μk i S n ii i ,,111ˆ)( =-=∑例1 人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的。
该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指示指标分别要用出生时的预期寿命、成人识字率和实际人均GDP ,将以上三个指示指标的数值合成为一个复合指数,即为人文发展指数。
资料来源:UNDP 《人类发展报告》1995年。
今从1995年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个作为两组样品,另选四个国家作为待判样品作距离判别分析。
数据选自《世界经济统计研究》1996年第1期本例中变量个数p =3,两类总体各有5个样品,即521==n n ,有4个待判样品,假定两总体协差阵相等。