判别分析案例

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

group 表示类别
数据展示
8个用来建立 判别标准的变量
•该数据disc.sav共有90个样本,其中30个属于 上升型,30个属于稳定性,30属于下降型。这 个已知类别的数据称为一个“训练样本”。
SPSS实现——数据读入
File → Open → Data → “Disc.sav”
SPSS实现——数据编辑
公司
徽标
多元统计分析——判别分析
统计
研一
苏旸
2007100196
判别分析——把对象归到已知类中
• 人们常说: ——“像诸葛亮那么神机妙算” ——“像泰山那么稳固” ——“像钻石那么坚硬” • 一些判别标准都是有原型的,虽然这些判 别的标准并不那么精确或严格,但大都是 根据一些现有的模型得到的。
判别分析的方法
在数据中 保存判别后 数据所属类别
在数据中保存 数据的判别分
结果分析
• 在判别分析主对话框中点击“OK”,生成 输出output文件。
Analysis Case Processing Summary Unweighted Cases Valid Excluded Missing or out-of-range group codes At least one missing discriminating variable Both missing or out-of-range group codes and at least one missing discriminating variable Total Total N 90 0 0 Percent 100.0 .0 .0
Use Covariance Matrix:使用协方差阵。
Within-groups:组内协方差阵。 Separate-groups:各组协方差阵。
SPSS实现——Classify模块
Plots:判别图。
Combined-groups:各类共同输出在一幅散点图中。 Separate-groups:每类单独输出一幅散点图。 Territorial map:分类区域图。 Replace missing values with mean:用均数替代缺失值。
逐步判别法
• 逐步判别法就是在前面的方法中加入变量选 择功能。有时,一些变量对于判别没有什么 作用,为了得到对判别最合适的变量,可以 使用逐步判别。 • 逐步判别的思想是先用少数变量进行判别, 然后一边判别,一边引进判别能力最强的变 量,同时淘汰判别能力不强的的变量。 • 主要利用一些检验来判断变量的判别能力。
变量描述
变量名称 group is se sa prr ms msr cp cs 涵义描述 表示类别。group-1代表上升,group-2代表稳 定,group-3代表下降。 表示企业规模。 表示服务。 表示雇员工资比例。 表示利润增长。 表示市场份额。 表示市场份额增长。 表示流动资金比例。 表示资金周转速度。
90个变量100%读 入,没有缺失值
0 0 90
.0 .0 100.0
结果分析
各自变量的方差分 析及λ统计量
Tests of Equality of Group Means Wilks' Lambda .190 .205 .179 .256 .256 .271 .441 .252 F 185.828 168.241 199.700 126.415 126.148 117.063 55.040 128.913 df1 2 2 2 2 2 2 2 2 df2 87 87 87 87 87 87 87 87 Sig. .000 .000 .000 .000 .000 .000 .000 .000
大纲
disc.sav, disc.txt
SPSS
实现
数据 介绍
结果 分析
R语言
实现
数据介绍——disc.sav
• 数据来源:吴喜之——《统计学:从数据到 结论》。 • 数据介绍:某专家编出一套打分体系来描绘 企业的状况。该体系对每个企业的一些指标 (变量)进行评分。共有8个指标,如下页 表格所示。 • 有一些企业已经被某杂志划分为上升企业、 稳定企业和下降企业。我们希望根据这些企 业的上述变量的打分和它们已知的类别,找 出分类标准,并对没分类的企业进行分类。
Fisher判别法
• 所谓Fisher判别法,就是一种先投影的方 法,把高维空间中的点向低维空间进行投 影。 • 主要思想是通过将多维数据投影到某个合 适的方向上。而投影的原则是将总体与总 体之间尽可能的分开,然后选择合适的判 别规则,进行分类判别。
Bayes判别法
• 当每个分类的观察值不同时,最好用Bayes 判别。因为每个分类的观察值不同时,每类 出现的机会是不同的,而Fisher判别法忽视 了这个问题。 • 具体方法是:对每一个样品先计算出判别分 数D,然后根据先验概率和D的条件概率, 计算出该样品被判为每一类的后验概率,哪 类的后验概率最大,则判为哪一类。
Variable View → “Group”变量Decimals:“2” → “0”; Label:添加变量名称,便于识别; “Group”变量Value:添加组别。
SPSS实现——数据分析ຫໍສະໝຸດ Baidu
Analyze → Classify → Discriminant
SPSS实现——模块介绍
Grouping Variable:选入分类变量“Group”,Define Range Define 被激活。点击弹出Range对话框,分别输入分类变量最小 值和最大值,本例为“1”和“3”。 Independents:选入自变量。本例选入变量“is—cs”。 Enter independents together:所有自变量同时进入方程。 Use stepwise method:逐步判别法。按自变量贡献大小, 逐个引入和剔出变量,直到没有新的有显著作用的自变量 可以引入,也没有无显著作用的自变量可以从方程内删除 为止。选此项后,激活Method Method按钮。 Select Variable:挑选观察单位。框内选入变量后(不能选 入分类变量和自变量中已选入的变量),Value Value按钮被激 活,填入数值。自己符合该数值的的观察单位才参与判别 分析;若不选此项,则所有观察单位都参与判别分析。
Fisher’s:Fisher函数系数——Bayes判别函数系数。 Unstandardized:非标准化函数系数——Fisher判别函数系数。
SPSS实现——Statistics模块
选择Means 进行均数估计 选择ANOVAs进行 各组均值相等检验
选择Box’s M 进行各组协方 差阵相等检验
结果分析——Fisher判别法
Structure Matrix Function 2 .413* .343 .400* -.007 .381* .068 -.332* -.314 .329* .219 -.217* .146 -.311 .618* -.326 .499* Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. *. Largest absolute correlation between each variable and any discriminant function 雇员工资比例 企业规模 服务 资金周转速度 市场份额 流动资金比例 市场份额增长 利润增长 1
企业规模 服务 雇员工资比例 利润增长 市场份额 市场份额增长 流动资金比例 资金周转速度
λ统计量在0-1之间。 越接近0组间差异越 显著;越接近1组间 差异越不显著。
说明在3类企业间, 各变量均有显著差异
结果分析
各组协方差阵 相等的检验
Test Results 207.175 Approx. 2.498 df1 72 df2 21089.679 Sig. .000 Tests null hypothesis of equal population covariance matrices. Box's M F
• • • • 距离判别法 Fisher判别法 Bayes判别法 逐步判别法
距离判别法
• 假设有两个总体G1和G2, 如果能够定义点x 到它们的距离D(x,G1)和D(x,G2), 则 ①如果D(x,G1) < D(x,G2),则 x∈G1 ②如果D(x,G2) < D(x,G1),则 x∈G2 ③如果D(x,G1) = D(x,G2),则待判。 • 距离判别法的不足之处: ① 判别方法与总体各自出现的的概率大小无 关; ② 判别方法与错判之后所造成的损失无关。
生成Bayes判别方程系数 和Fisher判别方程系数。
SPSS实现——Classify模块
Prior Probabilities:设定先验概率。
All groups equal:各组等概率。 Compute from group sizes:各组样本量的百分比为先验概率。
Display:输出。
Casewise result:每个观察单位判别分析后所属类别。 result Limit cases to first []:前若干观察单位判别分析后所属类别。 Summary table:判别符合率表。 Leave-one-out classification:以剔出某观察单位所建立的判别 函数判别该观察单位所属类别。
选择以样本量百 分比为先验概率 显示每个单位判别 分析后所属类别 显示判别符合率表 类别显示在 同一散点图中
以剔出某观察单位所建立的判别函数判别该观察单位所属类别
SPSS实现——Save模块
Save:存为新变量。
Predicted group membership:预测观察单位所属类别。 Discriminant scores:判别分。 Probabilities of group membership:观察单位属于某一类 的概率。
SPSS实现——选择变量的方法
两种变量选择方法
自变量同时 进入方程
逐步 判别法
SPSS实现——变量选择
group 选入分组变量 is-cs 选入自变量
选择自变量 同时进入方程 的方法
SPSS实现——Statistics模块
Descriptives:描述性统计量。
Means:均数估计。 Univariate ANOVAs:单变量方差分析。 Box’s M:组间协方差齐性检验。
Matrices:矩阵
Within-groups correlation:合并组内相关阵。 Within-groups covariance:合并组内协方差阵。 Separate-groups covariance:各组协方差阵。 Total covariance:总协方差阵。
Function Coefficients:函数系数。
标准化典型 判别函数系数
需要注意的是:这是标准化 后的判别函数,若要将变量 带入计算判别分,必须将变 量进行标准化处理(即减均 值除以标准差)。
得到2个标准化典型判别方程:
y1 = 0.415 x1 + 0.433x2 + 0.365 x3 − 0.334 x4 + 0.457 x5 − 0.355 x6 − 0.019 x7 − 0.435 x8 y2 = 0.065 x1 + 0.127 x2 + 0.426 x3 + 0.541x4 + 0.369 x5 + 0.634 x6 + 0.285 x7 − 0.193x8
说明拒绝协方差矩 阵相等的假设,即 不能认为各组间协 方差矩阵相等。
从一些统计实践的结 果来看,很少有碰到 检验不显著的情况。 而在一些实践中,比 如线性判别分析,即 使方差-协方差结构 不相等,对于结果的 影响也不会有非常大 的影响。
结果分析——Fisher判别法
Standardized Canonical Discriminant Function Coefficients Function 企业规模 服务 雇员工资比例 利润增长 市场份额 市场份额增长 流动资金比例 资金周转速度 1 .415 .433 .365 -.334 .457 -.355 -.019 -.435 2 .065 .127 .426 .541 .369 .634 .285 -.193
相关文档
最新文档