用SPSS软件来实现判别分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
哈尔滨商业大学
数学实验报告
实验题目:___用SPSS软件来实现判别分析___________ 姓名:__张彦琛_____ 学号:__2____
专业:____数学与应用数学_____________________ 日期:______2012-10-27_______________________
一、实验目的
用SPSS软件来实现判别分析及其应用。
二、实验内容
已知某研究对象分为3类,每个样品考察4项指标,各类观测的样品数分别为7,4,6;另外还有2个待判样品分别为
第一个样品:x1=-8,x2=-14,x3=16,x4=56
第二个样品:x1=92,x2=-17,x3=18,x4=3.0
三、实验步骤及结论
(一)实验步骤
把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中进行判别分析。执行菜单命令,单击“分析—>分类—>判别”,进行操作步骤……点击确定,即可得到实验结论。(二)实验结论
表一:
检验结果a
箱的 M 35.960
F 近似。 2.108
df1 10
df2 537.746
Sig. .022
对相等总体协方差矩阵的零假设进行检验。
a. 有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。将相对非奇异
组的汇聚组内协方差矩阵检验非奇异组。其行列式的对数为 18.794。
表一是box检验的结果。Box的检验结果是35.390,Sig.的值为0.0022<0.05,拒绝原假设,即每类的协差阵不完全相等。
表二:
表二是特征值。从表中知第一个特征值是3.116,方差贡献率为99.6%,累计贡献率为99.6%,判断率为99.6%,则第一判别函数有效。
表三:
表三给出了Fisher判别函数的有效性检验。由表三知第一个Sig.的值为0.022<0.05,拒绝原假设,检验是显著的,进而说明第一Fisher 判别函数是有效的。而第二个Sig.的值为0.985>0.05,第二Fisher 判别函数不显著,即不有效。
表四:
典型判别式函数系数
函数
1 2
x1 .010 .023
x2 .543 -.107
x3 .047 -.024
x4 -.068 .001
(常量) 9.240 -1.276
非标准化系数
表四是典则判别式函数系数。由表中可以写出第一Fisher判别函数是y1=9.240+0.010*x1+0.543*x2+0.047*x3-0.068*x4。
第一个待判样本:y1=-1.498;第二个待判样本:y1=1.571。表五:
组质心处的函数
类别号
函数
1 2
1.00 -1.846 -.032
2.00 .616 .178
3.00 1.744 -.081
在组均值处评估的非标准化典型
判别式函数
表五是组质心处的典则判别函数值。第一类的质心G1是-1.846,第二类的质心G2是0.616,第三类的质心G3是1.744。
第一个待判样本:|y1-G1|=0.348,|y1-G2|=2.114,|y1-G3|=3.242,由|y1-G1|<|y1-G2|<|y1-G3|,则应属于第一类。
第二个待判样本:|y2-G1|=3.417,|y1-G2|=0.955,|y1-G3|=0.173,由|y1-G3|<|y1-G2|<|y1-G1|,则应属于第三类。
表六:
由表四可知,每一类的先验概率均为0.333。
表七:
分类函数系数
类别号
1.00
2.00
3.00
x1 -.074 -.045 -.040
x2 -19.412 -18.097 -17.457
x3 4.549 4.661 4.720
x4 1.582 1.414 1.337
(常量) -223.516 -199.536 -190.099
Fisher 的线性判别式函数
表七是分类函数系数,即Fisher判别函数系数。由Fisher判别函数系数表可以确定3个类的贝叶斯线性判别函数分别是:
Y1=-223.516-0.074*x1-19.412*x2+4.549*x3+1.582*x4;
Y2=-199.536-0.045*x1-18.097*x2+4.661*x3+1.414*x4;
Y3=-190.099-0.040*x1-17.457*x2+4.720*x3+1.337*x4;
将待判样本的各变量值代入上述贝叶斯判别函数得:
对第一个待判样本:Y1=210.22,Y2=207.942,Y3=205.011,由Y1>Y2>Y3,则应属于第一类。
对第二个待判样本:Y1=186.308,Y2=192.113,Y3=191.961,由Y1 表八: 分类结果b,c 类别号 预测组成员 合计1.00 2.00 3.00 初始计数 1.00 6 1 0 7 2.00 0 4 0 4 3.00 1 0 5 6 % 1.00 85.7 14.3 .0 100.0 表八是预测分类结果,由表中可以看出判别率。在回代验证中,第一类正确率为85.7%,第二类的正确率为100%,第三类的正确率为83.3%。在交叉验证中,第一类正确率为85.7%,第二类的正确率为50%,第三类的正确率为66.7%。在整体中,对原始分组案例中的88.2%个进行了正确分类,对交叉验证分组案例中的70.6%个进行了正确分类。 四、心得体会 1. 通过这次上机实验,我学会了用SPSS软件来实现判别分析,用所学的来解决实际问题。 2.通过老师的讲解,学会了如何操作SPSS软件,知道如何分析所得到的实验结果,读懂实验表格。 3.实际生活中很多的问题都会用到多元回归分析模型,因此应该充分了解判别分析的思想,将实际问题进行数字化,建立正确的模型。