SPSS判别分析
SPSS数据分析—判别分析

判别分析作为一种多元分析技术应用相当广泛,和其他多元分析技术不同,判别分析并没有将降维作为主要任务,而是通过建立判别函数来概括各维度之间的差异,并且根据这个判别函数,将新加入的未知类别的样本进行归类,从这个角度讲,判别分析是从另一个角度对数据进行归类。
判别分析由于要建立判别函数,因此和回归分析类似,也有因变量和自变量,并且因变量应为分类变量,这样才能够最终将数据进行归类,而自变量可以是任意尺度变量,分类变量需要设置为哑变量。
既然和回归分析类似,那么判断分析也有一定的适用条件,这些适用条件也和回归分析类似1.自变量和因变量的关系符合线性假定违反时,可以使用曲线直线化、二次判别分析等方法2.因变量取值是独立的,并且必须事先就已确定这个很好理解,既然最终要归类,就要实现确定归为哪几类3.自变量服从多元正态分布违反时影响不大4.自变量各组间方差齐性,协方差矩阵齐违反时,可使用经典判别分析、非参数判别分析、距离判别分析5.自变量间不存在共线性违反时可以采用类似于线性回归中对共线性的处理,如逐步判别分析,岭判别分析等,和线性回归一样,共线性可以使判别函数的系数发生变化,但是对于判别结果则影响不大判别分析根据不同的判别准则可以分为经典判别分析、贝叶斯判别分析、非参数判别分析等,SPSS中将其和聚类共用一个过程,下面我们来介绍这几种方法在SPPS中的应用一、经典判别分析收集了一些鸢尾花的数据,其中spno为类别,有三个水平,其余四个为变量,想通过此数据进行判别分析,建立判别函数以对花进行区分,数据组成如下分析—分类—判别二、贝叶斯判别分析贝叶斯体系的主要思想是根据先验概率去推证后验概率也就是实验结果,将其引入判别分析之后,就变成计算后验概率及错判率,用最大后验概率来进行判别,并使错判率最小。
在SPSS中,贝叶斯判别和经典判别只是设置上稍有不同。
spss教程_13-1(判别分析)

y
( ) i
ax
'
k n
( ) i
, 1,2, k , i 1,2, n ,
Hale Waihona Puke ( ) iS 总 ( y
1 i 1
K
y )( y
( ) i
y ) a Ta,
' '
S 类间 n ( y
1
k
( )
y )( y y
( )
( )
判别分析
分类: 1、按判别的组数来分,有两组判别分析和多 组判别分析 2、按区分不同总体所用的数学模型来分,有 线性判别和非线性判别 3、按判别对所处理的变量方法不同有逐步判 别、序贯判别。 4、按判别准则来分,有费歇尔判别准则、贝 叶斯判别准则
判别分析
判别分析和前面的聚类分析有什么不同呢? 主要不同点就是,在聚类分析中一般人们事 先并不知道或一定要明确应该分成几类,完 全根据数据来确定。 而在判别分析中,至少有一个已经明确知道 类别的“训练样本”,利用这个数据,就可 以建立判别准则,并通过预测变量来为未知 类别的观测值进行判别了。
费歇尔判别法
费歇尔判别方法是历史上最早提出的判别方 法之一,也叫线性判别法 费歇尔判别的思想是通过将多维数据投影到 某个方向上,投影的原则是将类与类之间尽 可能的分开,然后再选择合适的判别准则, 将待判的样本进行分类判别。
费歇尔判别法
一、判别原理 设有k个总体G1,G2,…,Gk,每类中含有样本数 分别为n1,n2,…,nk 假定所建立的判别函数为
ax ax (k ) ax ax (l )
则x属于第k组
逐步判别分析
一、逐步判别原理 逐步判别分析从模型没有变量开始,每一步 都对模型进行检验,把模型外对模型的判别 力贡献最大的变量加到模型中,同时考虑已 经在模型中但又不符合留在模型中条件的变 量从模型中剔除。
2024版SPSS判别分析方法案例分析

01 查看判别分析的结果输出,包括判别函数系数、 结构矩阵、分类结果等。
02 根据输出结果,解读判别分析的结果,如判别函 数的贡献、分类准确率等。
03 结合专业知识和实际背景,对结果进行合理解释 和讨论。
05
案例分析:某公司客户流失预测 模型构建
案例背景及问题描述
01
某大型电信公司面临客户流失问题,需要构建客户流失
04
SPSS判别分析操作过程
导入数据并建立数据集
1
打开SPSS软件,选择“文件”->“打开”>“数据”,导入需要分析的数据文件。
2
在数据视图中检查数据的完整性和准确性,确保 数据质量。
3
根据需要,对数据进行预处理,如缺失值处理、 异常值处理等。
选择合适的判别分析方法
根据研究目的和数据特点,选择合适 的判别分析方法,如线性判别分析、 二次判别分析等。
决策树与随机森林
基于贝叶斯定理和多元正态分 布假设,通过最大化类间差异 和最小化类内差异来建立线性 判别函数。适用于正态分布且 各类别协方差矩阵相等的情况。
放宽了LDA的假设条件,允许各 类别具有不同的协方差矩阵。 通过构建二次判别函数进行分 类。适用于更一般的数据分布 情况。
基于距离度量的方法,将新样 本分配给与其最近的K个已知样 本中最多的类别。适用于多类 别、非线性可分问题。
数据变换与标准化
数据变换
根据分析需求,对数据进行适当的变换,如对数变换、平 方根变换等,以改善数据的分布形态或满足分析要求。
数据标准化
对数据进行标准化处理,消除量纲和数量级的影响,使不 同变量具有可比性。常用的标准化方法包括Z分数标准化、 最小最大标准化等。
数据离散化
SPSS统计分析第八章聚类分析与判别分析

SPSS统计分析第八章聚类分析与判别分析聚类分析与判别分析是SPSS统计分析中非常重要的两个方法。
聚类分析是寻找数据之间的相似性,将相似的数据划分为一个簇,从而实现对数据的归类和分组。
判别分析则是寻找数据之间的差异性,帮助我们理解不同因素对于数据的影响程度,从而实现对数据的分类预测。
首先,我们来介绍聚类分析。
聚类分析是根据数据之间的相似性进行归类的一种方法,通过度量数据之间的相似性,将相似的数据归为一类。
它在寻找数据内在组织结构和特点上具有很大的作用。
在SPSS中进行聚类分析的步骤如下:1.载入数据集:在SPSS软件中,选择"文件"->"打开"->"数据",选择需要进行聚类分析的数据集。
2.选择聚类变量:在"分析"->"分类"->"聚类"中,选择需要进行聚类分析的变量。
可以选择一个或多个变量作为聚类变量,决定了聚类的维度。
3.设置聚类参数:在设置参数的对话框中,可以选择使用不同的距离测度和聚类算法。
距离测度可以选择欧氏距离、曼哈顿距离、切比雪夫距离等,而聚类算法可以选择层次聚类、K均值聚类等。
根据具体的数据特点,选择合适的参数。
4.进行聚类分析:点击"确定"按钮,SPSS会自动进行聚类分析,并生成聚类的结果。
聚类结果可以通过树状图、散点图等形式展示,便于我们对数据的理解和分析。
接下来,我们来介绍判别分析。
判别分析是一种通过建立数学模型,根据不同的预测变量对数据进行分类和预测的方法。
判别分析可以帮助我们理解不同因素对于数据分类的重要性,从而进行有针对性的分析和预测。
在SPSS中进行判别分析的步骤如下:1.载入数据集:同样,在SPSS软件中,选择"文件"->"打开"->"数据",选择需要进行判别分析的数据集。
spss判别分析

判别的思想
判别分析:根据一批分类明确的 样本在若干指标上的观察值,建 立一个关于指标的判别函数和判 别准则,然后根据这个判别函数 和判别准则对新的样本进行分类, 并且根据回代判别的准确率评估 它的实用性。
判别函数(discriminant function):指的是一 个关于指标变量的函数。每一个样本在指 标变量上的观察值代入判别函数后可以得 到一个确定的函数值。
2、判别方法
SPSS系统提供的判别方法有马氏距离判别法、贝 叶斯概率判别法以及费氏多类判别模型法。 ⑴马氏(Mahalamobis)距离判别法 马氏距离判别法的思想就是建立马氏距离,当被 判断个案距离哪个总体中的马氏距离最小,该个案就 隶属于这个总体。假定有A、B两个总体,则: X∈A 若d(x,A)<d(x,B) X∈B 若d(x,A)>d(x,B) 待判 若d(x,A)=d(x,B)
从聚类方法的选择上
1、看数据的类型,如果参与分类的变量是连续变 量,层次聚类法、K-均值聚类法、以及两步聚类法 都是适用的。如果变量中包括离散变量(计数变量), 则需要将先对离散变量进行连续化处理。当数据量 较少时(比如小于100),两种方法都可以选用,当数 据量较多时(比如大于1000),则应该考虑选用K-均 值聚类法 2、要看分类的对象。如果是对样本分类,两种方 法都可用;如果是对变量分类则应选择层次聚类法 (至少SPSS的程序是这样)
注意对分类结果的检验
分类结果是否合理取决于它是否 “有用”,但分类结果是否可靠和稳定, 则需要反复聚类和比较。 一般来说,在所分的类别中,各类 所包含的对象(样本或变量)的数量应该 大致相当。至少这从表面上看更漂亮一 些。
问题
1、什么时候用快速聚类? 2、什么时候用分层聚类?
spss--判别分析

选此项后,每聚类 一个样品,就会重
新计算类中心
类内各样品观测值的均 值作为新的凝聚点
2.Iterate子对话框
创建新变量, 说明每个样 品的聚类结 果,新变量 将出现在当 前数据集中
创建新变量,说 明每个样品和凝 聚点的欧式距离, 新变量将出现在
迭代更新聚类:是在初始 凝聚点基础上不断迭代聚 类,形成新的凝聚点,直 到前后凝聚结果没有变化 为止,系统默认
不用迭代聚类:是在初始凝聚点 基础上聚类,作为最终聚类结果。
1.K-means Cluster 过程主对话框
指定数据文件中的观察值作为初始凝聚点 将最终聚类的凝聚点坐标写入指定数据文件
指定最大迭代次 数,规定为1到 999之间的整数
SPSS中,用户可以选择样品聚类或变量聚类,也有多种相似性度量。 多种数据标准化的方式可供选择。系统给出聚类图,据此可直观地确定 适当的分类。
二 SPSS操作指南
例15-3 某研究院欲用气相色谱法分析细菌全细胞脂肪酸的含 量来研究细菌的分类和鉴定。采用被试菌株共24株,其中空 肠弯曲菌8株(标号CJ1~CJ8),结肠弯曲菌3株(标号 CC1~CC3),幽门螺杆菌(标号HP1~HP9)和其他肠道杆菌 4株(标号XX1~XX4)。分别用气相色谱法测得各菌株的12 种脂肪酸的百分含量(变量名X1~X12)。要求依据变量 X1~X12对24个菌株进行聚类分析。(原始数据见例153.sav)
表15-2
2.表15-3给出迭代聚类过程,可以看到,第11次迭 代后,聚类结果收敛。
3. 表15-14、表15-15给出最终的类中心坐标和最终类中心间 两两距离。可以看到,最终类中心坐标为各类中的变量均值。
判别分析实验报告SPSS
判别分析实验报告SPSS实验目的:判别分析(Discriminant Analysis)是一种经典的多元统计分析方法,用于解释和预测分类变量。
该实验旨在使用SPSS软件进行判别分析,探索一组变量对分类结果的贡献和预测能力。
实验步骤:1.数据收集:从一些公司的人力资源数据库中随机选择了200个员工作为样本,收集了以下变量:性别(男、女)、教育程度(本科、研究生、博士)、工龄(年)、绩效评分(0-5)、离职与否(是、否)。
2.数据清洗:检查数据中是否存在缺失值,并对缺失值进行处理。
删除离职与否变量中缺失值。
3.数据探索:使用SPSS进行描述性统计分析,了解样本的基本情况。
分别计算男女性别比例和各教育程度及离职状态的分布情况。
4. 变量选择:使用SPSS进行判别分析,将离职与否作为分类变量,性别、教育程度、工龄和绩效评分作为预测变量。
使用Wilks' Lambda检验选择预测变量,确定对分类结果的贡献。
5.判别函数计算:根据选择的预测变量,计算判别函数。
使用判别函数对样本进行分类,并计算分类结果的准确率。
实验结果:1.数据探索结果显示,样本中男女性别比例约为1:1,教育程度主要集中在本科和研究生,离职比例为14%。
2. 判别分析结果显示,Wilks' Lambda检验结果为0.632,p值小于0.05,说明选取的预测变量对分类结果有统计上显著的贡献。
3.计算得到的判别函数为D=-0.311(性别)+0.236(教育程度)+0.011(工龄)+0.585(绩效评分)。
4.使用判别函数对样本进行分类,分类准确率为81.5%。
其中,离职样本的分类准确率为75%,非离职样本的分类准确率为82%。
实验结论:通过判别分析实验,我们得出以下结论:1.性别、教育程度、工龄和绩效评分这四个变量对员工的离职与否有显著的预测能力。
2.预测变量中绩效评分对离职结果的贡献最大,说明绩效评分较低的员工更容易离职。
spss教程_13-1(判别分析)
具体操作 Save: 保存新变量 Predicted group membership : 建立新变量,表明预测的类成员 Discriminant score:建立新变量, 表明判别分数 Probabilities of group membership : 建立新变量.表明样品属于某一类的概率
Wilk’s λ最小法
U统计量 λ=组内平方和/总平方和,每一步都是统计量 最小的进入判别函数 容许度=1-Ri2 (Ri2为偏相关系数)
1 p F引 p 1 p
p 1
ng p g 1
p 1 1 p n g p F剔 p 1 g 1 p
判别分析
分类: 1、按判别的组数来分,有两组判别分析和多 组判别分析 2、按区分不同总体所用的数学模型来分,有 线性判别和非线性判别 3、按判别对所处理的变量方法不同有逐步判 别、序贯判别。 4、按判别准则来分,有费歇尔判别准则、贝 叶斯判别准则
判别分析
判别分析和前面的聚类分析有什么不同呢? 主要不同点就是,在聚类分析中一般人们事 先并不知道或一定要明确应该分成几类,完 全根据数据来确定。 而在判别分析中,至少有一个已经明确知道 类别的“训练样本”,利用这个数据,就可 以建立判别准则,并通过预测变量来为未知 类别的观测值进行判别了。
Casewise:逐步输出每个样品的分类结果 limit cases to:最大样品数 Summary table:分类概括表 Leave-one-out classification 剔除一个样品 后用其他样品得到的该样品的分类结果
具体操作
Plot: 输出统计图 Combined-groups:各类输出在同一张散点图中 Separate-groups:每类输出一张散点图中 Territorial mao:分类区域图
第六讲判别分析(SPSS应用)
2020/10/21
11 cxt
例4:股票持有者根据股票近期的变化情况判断此种 股票价格下一周是上升还是下跌?
❖ 刑事学: 例5:Smith先生被指控偷了邻居家的鸡。但Smith先
生宣称他家冰箱里的鸡是野鸡。
如何判定: Smith先生究竟是否偷了邻居的鸡呢??
2020/10/21
12 cxt
❖ 二、判别分析的基本要求: 1、分组类型在两组以上; 2、第一阶段每组样本(或案例)个数至少一个以上; 3、解释变量必须是可测量的
❖ 三、判别分析与聚类分析的比较:
1、判别分析是在已知研究对象分成若干类型并已取得各种类 型的一批已知样本的观测数据,在此基础上根据某些准则建 立判别式,然后对未知类型的样本进行判别分类。
类别 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2
.38
.11
3.27
.55
2பைடு நூலகம்
.19
.05
2.25
.33
2
.32
.07
4.24
.63
2
.31
.05
4.45
.69
2
.12
.05
2.52
.69
2
-.02
.02
2.05
.35
2
.22
.08
2.35
.40
2
.17
.07
1.80
2020/10/21
4 cxt
经济学: 例2:中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标:
X1总负债率(现金收益/总负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进行 了调查,得如下资料:
spss判别分析
判别分析1.基本理解判别分析用于处理已知分类情况的数据集,将未知分类数据归入已知的分类中。
判别分析过程基于对变量的函数组合,变量应能够充分地体现各个类别之间的差异。
从已知变量类别的样本中拟合判别函数,后根据判别函数将新样本进行类别归类。
在P维空间中,有K个相关已知类别的总体G1,G2,G3,....Gk,单个的预测样本记为Xi =(Xi1,Xi2,Xi3,....,Xip),i=1,2,3,....n,样本属于K个总体的一个,P个变量为判别指标,判别函数就是确定样本属于哪一类别。
判别函数的两种判别方法:(1)贝叶斯判别:是一种概率型的判别函数,开始需要知道各个类别的先验概率或分布密度,后计算每个样本属于某个类别的最大概率或最小错判损失,并以此归类。
类别概率计算公式:P(Gi|D)=P(D|Gi)P(Gi)/ΣP(D|Gi)P(Gi),其中P(Gi)为属于i类的先验概率,P(D|Gi)为在第i类中得D分的条件概率,而P(Gi|D)为在第i类中得D分的后验概率。
(2)Fisher判别:是一种依据方差分析原理建立的判别方法,基本思路为投影。
对P维空间中的点Xi =(Xi1,Xi2,Xi3, (X)in),i=1,2,3,....,n,找到一组线性函数Ym (Xi)=×B,m=1,2,3,....,m,一般m<p,依据组间均方差与组内均方差之比最大的原则,选择最优的线性函数。
判别分析的一般步骤:(1):依据已知类别的观测集建立分类规则或判别规则。
(2):运用所建规则对样本进行分类检验,得到各样本的判别准确率。
(3):选择拥有较高准确率的判别规则,应用于新样本的类别判断。
2.判别分析操作步骤判别函数第一步:首先将已确定分类情况的数据到spss软件中,点击分析、分类、判别式。
图1第一步第二步:进入判别分析勾选框后首先将变量列表中的变量放入右侧的变量框中,将因变量(已知分组情况变量)放入分组变量框并定义好范围,点击继续,将自变量放入自变量框中。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
得到的,所以要得到标准化的典型判别得分,代入该函数的自 变量必须是经过标准化的。
2. Canonical Discriminant Function Coefficients(给出未标 准化的典型判别函数系数)
未标准化的典型判别函数系数由于可以将实测的样品观测值直
F2 6202.2 164.7 X1 171.2 X 2 100.0 X3 62.5 X 4 12.1X 5 207.0 X 6
第三组:
F3 4982.9 134.9 X1 144.5 X 2 85.9 X 3 50.0 X 4 10.5 X 5 181.7 X 6
如表4.3所示,GROUP栏中的每一列表示样品判入相应列的
Bayes判别函数系数。在本例中,各类的Bayes判别函数如下: 第一组:
F 5317.2 143.9 X 1 153.1X 2 90.1 X3 53.0 X 4 11.0 X 5 189.3 X 6 1
第二组:
单击Continue按钮,返回主界面。
图4.3 Statistics子对话框
4. 单击Classify…按钮,定义判别分组参数和选择输出结果。 选择Display栏中的Casewise results,输出一个判别结果表, 包括每个样品的判别分数、后验概率、实际组和预测组编号 等。其余的均保留系统默认选项。单击Continue按钮。
图4.4 Classify…子对话框
5. 单击Save按钮,指定在数据文件中生成代表判别分组结果 和判别得分的新变量,生成的新变量的含义分别为:
Predicted group membership:存放判别样品所属组别的值; Discriminant scores:存放Fisher判别得分的值,有几个典型
ungrouped ungrouped ungrouped ungrouped
6. 由于我们在Save子对话框中选择了生成表示判别结果的新 变量,所以在数据编辑窗口中,可以观察到产生的新变量。 其中,变量dis-1存放判别样品所属组别的值,变量dis1-1和 dis2-1分别代表将样品各变量值代入第一个和第二个判别函 数所得的判别分数,变量dis1-2、dis2-2和dis3-2分别代表样 品分别属于第1组、第2组和第3组的Bayes后验概率值。
于第三组。
Classific ation Func tion Coefficie nts GROUP X1 X2 X3 X4 X5 X6 (Constant) 1.00 -143.851 153.137 -90.088 53.009 11.008 189.261 -5317.234 2.00 -164.691 171.185 -99.976 62.525 12.094 207.003 -6202.158 3.00 -134.862 144.462 -85.945 49.972 10.520 181.714 -4982.880iminant functions
表4.3 Bayes判别法的输出结果
5. Casewise Statistics(给出个案观察结果)
在Casewise Statistics输出表针对每个样品给出了了大部分的判
别结果,其中包括:实际类(Actual Group)、预测类 (Predicted Group)、Bayes判别法的后验概率、与组重心的 马氏距离(Squared Mahalanobis Distance to Centroid)以及 Fisher判别法的每个典型判别函数的判别得分(Discriminant Scores)。出于排版要求,这里给出结果表的是经过加工的, 隐藏了其中的一些项目,如表4.4所示。从表中可以看出四个 待判样本依次被判别为第三组、第一组、第二组和第三组。
将各样品的自变量值代入上述三个Bayes判别函数,得到三个
函数值。比较这三个函数值,哪个函数值比较大就可以判断该 样品判入哪一类。例如,将第一个待判样品的自变量值分别代 入函数,得到:
F1=3793.77, F2=3528.32,
F3=3882.48
比较三个值,可以看出最大,据此得出第一个待判样品应该属
第五节 实例分析与计算机实现
这一节我们利用SPSS对Fisher判别法和Bayes判别法进行计
算机实现。 为研究某地区人口死亡状况,已按某种方法将15个已知地区 样品分为3类,指标含义及原始数据如下。试建立判别函数, 并判定另外4个待判地区属于哪类? X1 : 0岁组死亡概率 X 2 :1岁组死亡概率 X 4 : 55岁组死亡概率 X5 : 80岁组死亡概率
X4
7.87 6.77 8.97 13.88 23.74 22.9 20.7 32.84 34.87 27.84 5.2 3.14 15.15 25.15 3.02 22.54 7.78 22.95 16.45
X5
95.19 94.08 97.3 101.2 112.52 160.01 124.7 172.06 152.03 146.32 90.1 85.15 103.12 110.14 81.22 170.6 95.16 160.31 105.3
Function 1 -2.177 -2.270 -2.741 -3.199 -2.582 9.674 8.332 10.128 8.342 9.491 -6.687 -7.163 -8.655 -4.766 -5.727 -20.714 -3.319 14.008 -7.595
Function 2 1.364 1.375 1.323 .638 .366 .231 -.613 -2.518 1.760 -.145 -.394 -.685 -1.823 -.608 -.270 -13.498 .831 2.086 -1.752
图4.2 判别分析主界面
2. 点击Define Range按钮,定义分组变量的取值范围。本例 中分类变量的范围为1到3,所以在最小值和最大值中分别输 入1和3。单击Continue按钮,返回主界面。 3. 单击Statistics…按钮,指定输出的描述统计量和判别函数 系数。选中Function Coefficients栏中的Fisher’s和 Unstandardized。这两个选项的含义如下:
这样,只要在前面计算出各观测值的具体坐标位置后,再计算 出它们分别离各重心的距离,就可以得知它们的分类了。
Func tions at G roup Centr oids Function GROUP 1.00 2.00 3.00 1 -2.594 9.194 -6.600 2 1.013 -.257 -.756
X2
7.44 6.34 9.24 13.45 23.03 6.24 4.22 10.08 25.74 11.2 5.41 3.02 15.02 25.03 2.01 6.66 7.33 6.22 15.36
X3
1.12 1.08 1.04 1.43 2.83 1.18 1.06 2.32 4.06 6.07 0.07 0.09 1.08 2.11 0.07 1.08 1.11 1.12 1.07
X6
69.3 69.7 68.8 66.2 63.3 65.4 68.7 65.85 63.5 66.8 69.5 70.8 64.8 63.7 68.3 65.2 69.3 68.3 64.2
类别 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 . . . .
(一) 操作步骤 1. 在SPSS窗口中选择Analyze→Classify→Discriminate,调 出判别分析主界面,将左边的变量列表中的“group”变量选 入分组变量中,将—变量选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进行判 别分析。
X 3 : 10岁组死亡概率
X6 : 平均预期寿命
表4.1 各地区死亡概率表
X1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 待判 待判 待判 待判 34.16 33.06 36.26 40.17 50.06 33.24 32.22 41.15 53.04 38.03 34.03 32.11 44.12 54.17 28.07 50.22 34.64 33.42 44.02
接代入求出判别得分,所以该系数使用起来比标准化的系数要 方便一些。见表4.2(a)。
由此表可知,两个Fisher判别函数分别为:
y1 74.99 1.861X1 1.656 X 2 0.877 X3 0.798 X 4 0.098 X 5 1.579 X 6 y2 29.482 0.867 X1 1.155 X 2 0.356 X 3 0.089 X 4 0.054 X 5 0.69 X 6
表4.4 个案观察结果表
Case wise Statistic s Highe st Group Squared Mahalanobis Dista nce to Centroid .297 .236 .117 .507 .418 .469 .868 5.985 4.793 .101 .139 .322 5.365 3.384 .998 361.567 .558 28.668 1.982 Disc riminant Sc ores
Unstanda rdized c anonica l discrim inant func tions e valuated at group m e ans
表4.2(b) 组重心处的Fisher判别函数值
4. Classification Function Coefficients(给出Bayes判别函数 系数)
Fisher’s:给出Bayes判别函数的系数。(注意:这个选项不是
要给出Fisher判别函数的系数。这个复选框的名字之所以为 Fisher’s,是因为按判别函数值最大的一组进行归类这种思想 是由Fisher提出来的。这里极易混淆,请读者注意辨别。) Unstandardized:给出未标准化的Fisher判别函数(即典型判 别函数)的系数(SPSS默认给出标准化的Fisher判别函数系 数)。