用SPSS软件来实现判别分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

哈尔滨商业大学

数学实验报告

实验题目:___用SPSS软件来实现判别分析___________ 姓名:__张彦琛_____ 学号:__2____

专业:____数学与应用数学_____________________ 日期:______2012-10-27_______________________

一、实验目的

用SPSS软件来实现判别分析及其应用。

二、实验内容

已知某研究对象分为3类,每个样品考察4项指标,各类观测的样品数分别为7,4,6;另外还有2个待判样品分别为

第一个样品:x1=-8,x2=-14,x3=16,x4=56

第二个样品:x1=92,x2=-17,x3=18,x4=3.0

三、实验步骤及结论

(一)实验步骤

把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中进行判别分析。执行菜单命令,单击“分析—>分类—>判别”,进行操作步骤……点击确定,即可得到实验结论。(二)实验结论

表一:

检验结果a

箱的 M 35.960

F 近似。 2.108

df1 10

df2 537.746

Sig. .022

对相等总体协方差矩阵的零假设进行检验。

a. 有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。将相对非奇异

组的汇聚组内协方差矩阵检验非奇异组。其行列式的对数为 18.794。

表一是box检验的结果。Box的检验结果是35.390,Sig.的值为0.0022<0.05,拒绝原假设,即每类的协差阵不完全相等。

表二:

表二是特征值。从表中知第一个特征值是3.116,方差贡献率为99.6%,累计贡献率为99.6%,判断率为99.6%,则第一判别函数有效。

表三:

表三给出了Fisher判别函数的有效性检验。由表三知第一个Sig.的值为0.022<0.05,拒绝原假设,检验是显著的,进而说明第一Fisher 判别函数是有效的。而第二个Sig.的值为0.985>0.05,第二Fisher 判别函数不显著,即不有效。

表四:

典型判别式函数系数

函数

1 2

x1 .010 .023

x2 .543 -.107

x3 .047 -.024

x4 -.068 .001

(常量) 9.240 -1.276

非标准化系数

表四是典则判别式函数系数。由表中可以写出第一Fisher判别函数是y1=9.240+0.010*x1+0.543*x2+0.047*x3-0.068*x4。

第一个待判样本:y1=-1.498;第二个待判样本:y1=1.571。表五:

组质心处的函数

类别号

函数

1 2

1.00 -1.846 -.032

2.00 .616 .178

3.00 1.744 -.081

在组均值处评估的非标准化典型

判别式函数

表五是组质心处的典则判别函数值。第一类的质心G1是-1.846,第二类的质心G2是0.616,第三类的质心G3是1.744。

第一个待判样本:|y1-G1|=0.348,|y1-G2|=2.114,|y1-G3|=3.242,由|y1-G1|<|y1-G2|<|y1-G3|,则应属于第一类。

第二个待判样本:|y2-G1|=3.417,|y1-G2|=0.955,|y1-G3|=0.173,由|y1-G3|<|y1-G2|<|y1-G1|,则应属于第三类。

表六:

由表四可知,每一类的先验概率均为0.333。

表七:

分类函数系数

类别号

1.00

2.00

3.00

x1 -.074 -.045 -.040

x2 -19.412 -18.097 -17.457

x3 4.549 4.661 4.720

x4 1.582 1.414 1.337

(常量) -223.516 -199.536 -190.099

Fisher 的线性判别式函数

表七是分类函数系数,即Fisher判别函数系数。由Fisher判别函数系数表可以确定3个类的贝叶斯线性判别函数分别是:

Y1=-223.516-0.074*x1-19.412*x2+4.549*x3+1.582*x4;

Y2=-199.536-0.045*x1-18.097*x2+4.661*x3+1.414*x4;

Y3=-190.099-0.040*x1-17.457*x2+4.720*x3+1.337*x4;

将待判样本的各变量值代入上述贝叶斯判别函数得:

对第一个待判样本:Y1=210.22,Y2=207.942,Y3=205.011,由Y1>Y2>Y3,则应属于第一类。

对第二个待判样本:Y1=186.308,Y2=192.113,Y3=191.961,由Y1

表八:

分类结果b,c

类别号

预测组成员

合计1.00 2.00 3.00

初始计数 1.00 6 1 0 7

2.00 0 4 0 4

3.00 1 0 5 6

% 1.00 85.7 14.3 .0 100.0

表八是预测分类结果,由表中可以看出判别率。在回代验证中,第一类正确率为85.7%,第二类的正确率为100%,第三类的正确率为83.3%。在交叉验证中,第一类正确率为85.7%,第二类的正确率为50%,第三类的正确率为66.7%。在整体中,对原始分组案例中的88.2%个进行了正确分类,对交叉验证分组案例中的70.6%个进行了正确分类。

四、心得体会

1. 通过这次上机实验,我学会了用SPSS软件来实现判别分析,用所学的来解决实际问题。

2.通过老师的讲解,学会了如何操作SPSS软件,知道如何分析所得到的实验结果,读懂实验表格。

3.实际生活中很多的问题都会用到多元回归分析模型,因此应该充分了解判别分析的思想,将实际问题进行数字化,建立正确的模型。

相关文档
最新文档