用SPSS软件来实现判别分析

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

哈尔滨商业大学

数学实验报告

实验题目：___用SPSS软件来实现判别分析___________ 姓名：__张彦琛_____ 学号：__2____

专业：____数学与应用数学_____________________ 日期：______2012-10-27_______________________

一、实验目的

用SPSS软件来实现判别分析及其应用。

二、实验内容

已知某研究对象分为3类，每个样品考察4项指标，各类观测的样品数分别为7，4，6；另外还有2个待判样品分别为

第一个样品:x1=-8,x2=-14,x3=16,x4=56

第二个样品:x1=92,x2=-17,x3=18,x4=3.0

三、实验步骤及结论

（一）实验步骤

把实验所用数据从Word文档复制到Excel，并进一步导入到SPSS数据文件中进行判别分析。执行菜单命令，单击“分析—>分类—>判别”，进行操作步骤……点击确定，即可得到实验结论。（二）实验结论

表一：

检验结果a

箱的 M 35.960

F 近似。 2.108

df1 10

df2 537.746

Sig. .022

对相等总体协方差矩阵的零假设进行检验。

a. 有些协方差矩阵是奇异矩阵，因此一般程序不会起作用。将相对非奇异

组的汇聚组内协方差矩阵检验非奇异组。其行列式的对数为 18.794。

表一是box检验的结果。Box的检验结果是35.390，Sig.的值为0.0022<0.05，拒绝原假设，即每类的协差阵不完全相等。

表二：

表二是特征值。从表中知第一个特征值是3.116，方差贡献率为99.6%，累计贡献率为99.6%，判断率为99.6%，则第一判别函数有效。

表三：

表三给出了Fisher判别函数的有效性检验。由表三知第一个Sig.的值为0.022<0.05,拒绝原假设，检验是显著的，进而说明第一Fisher 判别函数是有效的。而第二个Sig.的值为0.985>0.05，第二Fisher 判别函数不显著，即不有效。

表四：

典型判别式函数系数

函数

1 2

x1 .010 .023

x2 .543 -.107

x3 .047 -.024

x4 -.068 .001

(常量) 9.240 -1.276

非标准化系数

表四是典则判别式函数系数。由表中可以写出第一Fisher判别函数是y1=9.240+0.010*x1+0.543*x2+0.047*x3-0.068*x4。

第一个待判样本：y1=-1.498；第二个待判样本：y1=1.571。表五：

组质心处的函数

类别号

函数

1 2

1.00 -1.846 -.032

2.00 .616 .178

3.00 1.744 -.081

在组均值处评估的非标准化典型

判别式函数

表五是组质心处的典则判别函数值。第一类的质心G1是-1.846，第二类的质心G2是0.616，第三类的质心G3是1.744。

第一个待判样本：|y1-G1|=0.348,|y1-G2|=2.114,|y1-G3|=3.242,由|y1-G1|<|y1-G2|<|y1-G3|,则应属于第一类。

第二个待判样本：|y2-G1|=3.417,|y1-G2|=0.955,|y1-G3|=0.173，由|y1-G3|<|y1-G2|<|y1-G1|，则应属于第三类。

表六：

由表四可知，每一类的先验概率均为0.333。

表七：

分类函数系数

类别号

1.00

2.00

3.00

x1 -.074 -.045 -.040

x2 -19.412 -18.097 -17.457

x3 4.549 4.661 4.720

x4 1.582 1.414 1.337

(常量) -223.516 -199.536 -190.099

Fisher 的线性判别式函数

表七是分类函数系数，即Fisher判别函数系数。由Fisher判别函数系数表可以确定3个类的贝叶斯线性判别函数分别是：

Y1=-223.516-0.074*x1-19.412*x2+4.549*x3+1.582*x4；

Y2=-199.536-0.045*x1-18.097*x2+4.661*x3+1.414*x4；

Y3=-190.099-0.040*x1-17.457*x2+4.720*x3+1.337*x4；

将待判样本的各变量值代入上述贝叶斯判别函数得：

对第一个待判样本：Y1=210.22，Y2=207.942,Y3=205.011,由Y1>Y2>Y3,则应属于第一类。

对第二个待判样本:Y1=186.308,Y2=192.113,Y3=191.961,由Y1

表八：

分类结果b,c

类别号

预测组成员

合计1.00 2.00 3.00

初始计数 1.00 6 1 0 7

2.00 0 4 0 4

3.00 1 0 5 6

% 1.00 85.7 14.3 .0 100.0

表八是预测分类结果，由表中可以看出判别率。在回代验证中，第一类正确率为85.7%，第二类的正确率为100%，第三类的正确率为83.3%。在交叉验证中，第一类正确率为85.7%，第二类的正确率为50%，第三类的正确率为66.7%。在整体中，对原始分组案例中的88.2%个进行了正确分类，对交叉验证分组案例中的70.6%个进行了正确分类。

四、心得体会

1. 通过这次上机实验，我学会了用SPSS软件来实现判别分析，用所学的来解决实际问题。

2．通过老师的讲解，学会了如何操作SPSS软件，知道如何分析所得到的实验结果，读懂实验表格。

3.实际生活中很多的问题都会用到多元回归分析模型，因此应该充分了解判别分析的思想，将实际问题进行数字化，建立正确的模型。