Fisher判别分析在城镇居民消费等级评估中的应用(定稿)

合集下载

Fisher判别分析及其应用

Fisher判别分析及其应用

Fisher判别分析及其应用田兵【期刊名称】《渭南师范学院学报》【年(卷),期】2014(000)023【摘要】判别分析法是根据所研究个体的观测值来构建一个综合标准用来推断个体属于已知种类中哪一类的方法。

Fisher判别分析法是一种非常重要而且应用极为广泛的判别分析法。

文章介绍了Fisher判别分析法的数学思想,详细阐述了在两个总体和多个总体情况下它的判别函数以及判别准则。

之后通过举例说明了Fisher判别分析法在解决实际问题中的具体应用。

%The method of discriminant analysis is a method that builds comprehensive standard according to individual observed value in order to distinguish individual belonging to a certain category.Fisher discriminant analysis is a very important and widely used method.The paper introduces the mathematics thought of Fisher discriminant analysis method, discriminant function and crite-rion.Then its application of specific problems is elucidated.【总页数】5页(P8-11,24)【作者】田兵【作者单位】包头师范学院《阴山学刊》编辑部,内蒙古包头014030【正文语种】中文【中图分类】O212.4【相关文献】1.荧光光谱法结合Fisher判别分析在西洋参鉴别中的应用 [J], 陈家伟;胡翠英;马骥2.Fisher判别分析法r在垦利M区块煤层识别中的应用 [J], 杨锋3.改进的正交边界Fisher判别分析及在人脸识别中的应用 [J], 盛诗曼4.Fisher判别分析法在渤中凹陷储层流体解释评价中的应用 [J], 马金鑫; 牛成民; 姬建飞; 袁胜斌5.Fisher判别分析在1型及2型糖尿病分类中的应用 [J], 司马明珠; 李全忠; 王延年因版权原因,仅展示原文概要,查看原文内容请购买。

多元统计分析课程设计--Fisher判别法的应用---spss分析

多元统计分析课程设计--Fisher判别法的应用---spss分析
分类函数系数
组别
高收入
次高收入
城镇居民家庭总收入
.025
.021
工资性收入
-.018
-.015
经营性收入
.014
.009
财产性收入
-.064
-.050
转移性收入
-.009
-.009
(常量)
-105.381
-55.554
Fisher的线性判别式函数
表2-2
由分析结果表2-2可知高收入组的Fisher线性判别函数为:
函数
1
城镇居民家庭总收入
2.940
工资性收入
-1.892
经营性收入
.943
财产性收入
-1.322
转移性收入
-.112
表2-1
得到分析结果如下:
如表2-1所示可知只有一个判别函数:
D1=2.94*城镇居民家庭总收入-1.892*工资性收入+0.943*经营性收入-1.322*财产性收入-1.112*转移性收入
本文利用Fisher判别法,将沿海11省市作为先验组得到Fisher判别函数
(其中 分别代表城镇居民家庭总收入、工资性收入、经营性收入、财产性收入、转移性收入)
然后将剩余未分组省市代入判别函数,与先验组的临界值比较进行分组。分组结果显示高收入组(北京、上海、天津、广东、浙江)都在沿海省市,内陆省市则都属于次高收入组,这与我国东部沿海地区省市的城镇居民家庭收入较中西部高的国情吻合。
图2-3
步骤三选择“组别”变量使之添加到group ariable框中。这时group ariable框下的define range按钮变为可用,单击,弹出discriminant analyze:difine对话框如图2-4所示,并在minium中输入1,在maximum中输入2.

Fisher判别-jing

Fisher判别-jing

i 1
综上(1),(2) Fisher最优判别准则为函数
L(l1 , l2 , l p ) ( y 0 y 1 )2
(y
i 1
s
0 i
y ) ( yi1 y 1 ) 2
0 2 i 1
t
越大越好。从而最优判别函数的系数 c1 , c2 , c p 为函数 L(l1 , l2 ,l p ) 的极大值点。由微分学可知, 1 , c2 , c p 为方 c 程组
编号 1 购 买 者 2 3 4 5 6
式样X1 包装X2 耐久 性X3
编号 8 非 9 购 买 10 者 11
式样X1 包装X2
耐久 性X3
0 0 ( x11 , x12 , x10p )
1 1 1 ( x11 , x12 , x1 p )
组A的数据
0 0 0 ( x21 , x22 , x2 p )

0 ( xs01 , xs02 , xsp )
组B的数据
( x1 , x1 , x1 p ) 21 22 2

1 ( xt11 , xt12 , xtp )
组B的数据矩阵
1 x11 1 1 x21 W 1 xt1
1 1 x12 x1 p x1 x1 p 22 2 1 1 xt 2 xtp
矩阵 W 和 W
0
1
的列平均数分别为 ( x10 , x20 , x p0 ) 和 ( x1 , x2 , x p )
判别分析分为两组判别分析和多组判别分析, 两组判别分析就是将要判别的对象分为两组,例 如,判别一个地区的消费者对某种产品的反应是 “喜欢”还是“不喜欢”,判别一种产品在某地 区是处于“饱和”状态还是“有需求”,多组判 别分析则是将要判别的对象分为三组或更多组, 例如某种产品的市场潜力可分为:“大”,“一 般”,“没有”三种。 判别分析的方法很多,我们这里只涉及 Fisher判别方法,且重点放在两组判别问题上。

数据挖掘——Fisher判别课件

数据挖掘——Fisher判别课件
B B x11 x 1 B x21 x1B Q xB xB t1 1 B B B x12 x2 x1Bp x p B B B B x22 x2 x2 p x p B B B B xt 2 x2 xtp x p
组A
A A ( x11 , x12 ,, x1Ap ) A A A ( x 21 , x 22 ,, x 2 p ) A A ( x sA , x , , x ) 1 s 2 sp
组B
B B B ( x11 , x12 ,, x1 p ) B B B ( x , x , , x ) 21 22 2p B B ( x tB , x , , x ) 1 t 2 tp
9 8.29 7 8.29 10 8.29 A 8 8.29 9 8.29 8 8.29 7 8.29 8 6.43 7 6.00 6 6.43 6 6.00 7 6.43 8 6.00 4 6.43 5 6.00 9 6.43 3 6.00 6 6.43 7 6.00 5 6.43 6 6.00
x2
X X X
X X X X o o o X X
X X X X o o o o o o

o o o o o o o
若我们能找到分界直线 C0+c1x1+c2x2=0 则可用其进行预测。即判断(价格, 收入)点落在什么区域。
x1
判别分析的基本思想
假设有p个预测因子
x1, x2 ,, x p
,有n组观测值,
A B c x x 1 0.128 1 1 c S 1 x A x B 0.072 2 2 2 A B 0.099 c x x 3 3 3

判别分析公式Fisher线性判别二次判别

判别分析公式Fisher线性判别二次判别

判别分析公式Fisher线性判别二次判别判别分析是一种常用的数据分析方法,用于根据已知的类别信息,将样本数据划分到不同的类别中。

Fisher线性判别和二次判别是两种常见的判别分析方法,在实际应用中具有广泛的应用价值。

一、Fisher线性判别Fisher线性判别是一种基于线性变换的判别分析方法,该方法通过寻找一个合适的投影方向,将样本数据投影到一条直线上,在保持类别间离散度最大和类别内离散度最小的原则下实现判别。

其判别函数的计算公式如下:Fisher(x) = W^T * x其中,Fisher(x)表示Fisher判别函数,W表示投影方向的权重向量,x表示样本数据。

具体来说,Fisher线性判别的步骤如下:1. 计算类别内离散度矩阵Sw和类别间离散度矩阵Sb;2. 计算Fisher准则函数J(W),即J(W) = W^T * Sb * W / (W^T * Sw * W);3. 求解Fisher准则函数的最大值对应的投影方向W;4. 将样本数据投影到求得的最优投影方向上。

二、二次判别二次判别是基于高斯分布的判别分析方法,将样本数据当作高斯分布的观测值,通过估计每个类别的均值向量和协方差矩阵,计算样本数据属于每个类别的概率,并根据概率大小进行判别。

二次判别的判别函数的计算公式如下:Quadratic(x) = log(P(Ck)) - 0.5 * (x - μk)^T * Σk^-1 * (x - μk)其中,Quadratic(x)表示二次判别函数,P(Ck)表示类别Ck的先验概率,x表示样本数据,μk表示类别Ck的均值向量,Σk表示类别Ck的协方差矩阵。

具体来说,二次判别的步骤如下:1. 估计每个类别的均值向量μk和协方差矩阵Σk;2. 计算每个类别的先验概率P(Ck);3. 计算判别函数Quadratic(x);4. 将样本数据划分到概率最大的类别中。

判别分析公式Fisher线性判别和二次判别是常见的判别分析方法,它们通过对样本数据的投影或概率计算,实现对样本数据的判别。

Fisher判别分析及其应用

Fisher判别分析及其应用

假设 0 和0 为 二维 总体 , 如图 1 所示 , “ ●” 为0 的点 , “ o”为 0 : 的点 , 按 照原来 的横坐标 . 和 纵坐 标 , , 很难 将这 两个 总体 的点 分开 , 但是 如果 将这 些点 朝直 线 Y上投 影 , 形 成一 维 空间 点 的集合 , 则能 比较
1 数 学 思 想
F i s h e r 判别法的数学思想是将多维空问中的点投影到一维直线 y 上, 使得由总体 . 和0 产生的Y 尽可 能分开, 然后再利用距离判别法建立判别准则 , 进而达到判别个体所属群体 的一种统计方法.
1 . 1 两个 总体 的 F i s h e r 判 别法
显然 , 使得 , 和 2 y 的距离越 大 的线 性组 合越好 , 所 以考察 以下 比值
( l 一 2 ) [ ( 1 一/ x 2 ) ]
— — — — — — - — — — — — — — — — —
: — - — 一
== 一
v a r ( y )

F i s h e r 判 别 分 析 及 其 应 用
田 兵
( 包 头师范学院 《 阴山学刊》 编辑部 , 内蒙古 包头 0 1 4 0 3 0 ) 摘 要: 判别分析法是根据所研究个 体 的观测值 来构 建一个 综合 标准 用来推 断个 体属 于 已知 种类 中哪一类 的方 法.
F i s h e r 判别分析法是一种非常重要而且应用极为广泛 的判 别分析 法. 文章介绍 了 F i s h e r 判别 分析法 的数学思 想 , 详细 阐述 了在 两个 总体 和多个 总体情 况下它的判别 函数 以及判别准则. 之后通过举 例说 明了 F i s h e r 判 别分析法在解决实 际问题 中的 具体 应用 . 关键 词 : 判别 函数 ; 判别准则 ; 协方差矩阵 中图分类号 : 0 2 1 2 . 4 收稿 日期 : 2 0 l 4 — 0 9 一 O 3 作者简介 : 田兵 ( 1 9 8 2 一) , 男, 山西五 台人 , 包头师范学院《 阴山学 刊》 编辑 部编辑 , 理学硕 士, 主要从事数理统计研究. 文献标 志码 : A 文章编号 : 1 0 0 9 — 5 1 2 8 ( 2 0 1 4 ) 2 3 - 0 0 0 8 — 0 4

fisher判别法

fisher判别法

fisher判别法Fisher判别分析的基本思想:选取适当的投影方向,将样本数据进行投影,使得投影后各样本点尽可能分离开来,即:使得投影后各样本类内离差平方和尽可能小,而使各样本类间的离差平方和尽可能大。

为了克服“维数灾难”,人们将高维数据投影到低维空间上来,并保持必要的特征,这样,一方面数据点变得比较密集一些,另一方面,可以在低维空间上进行研究。

fisher判别法是判别分析的方法之一,它是借助于方差分析的思想,利用已知各总体抽取的样品的p维观察值构造一个或多个线性判别函数y=l′x其中l= (l1,l2…lp)′,x= (x1,x2,…,xp)′,使不同总体之间的离差(记为B)尽可能地大,而同一总体内的离差(记为E)尽可能地小来确定判别系数l=(l1,l2…lp)′。

数学上证明判别系数l恰好是|B-λE|=0的特征根,记为λ1≥λ2≥…≥λr>0。

所对应的特征向量记为l1,l2,…lr,则可写出多个相应的线性判别函数,在有些问题中,仅用一个λ1对应的特征向量l1所构成线性判别函数y1=l′1x不能很好区分各个总体时,可取λ2对应的特征向量l′2建立第二个线性判别函数y2=l′2x,如还不够,依此类推。

有了判别函数,再人为规定一个分类原则(有加权法和不加权法等)就可对新样品x判别所属。

Fisher判别法是根据方差分析的思想建立起来的一种能较好区分各个总体的线性判别法,由Fisher在1936年提出。

该判别方法对总体的分布不做任何要求。

Fisher判别法是一种投影方法,把高维空间的点向低维空间投影。

在原来的坐标系下,可能很难把样品分开,而投影后可能区别明显。

一般说,可以先投影到一维空间(直线)上,如果效果不理想,在投影到另一条直线上(从而构成二维空间),依此类推。

每个投影可以建立一个判别函数。

用Fisher判别法进行综合效益分析

用Fisher判别法进行综合效益分析


19 6 3 5. 6
求交 叉 积和 :
∑ l2= 1 . X 1 2×9. 2 07+1 . 4 2 9×9. 02+
1 6. × 9 2 7 9

表 1 病房 各科原始观察值
71 81. 5 7 5
离 均 差积 和 :
∑ ( 一 ) 一- ) ( 2
维普资讯
IS 523 3 世 界今 日医学杂志 ( r Me oa) 2 0 ;3( ) SN 16 -10 WodJ dT dy 0 1 l 8 ・7 3 ・ 6
与 群众 的关 系等 。为 了满 足 就 诊 病 人 的需 求 , 院在 我
差 平方 和 随着 社 会 主义 市 场 经 济 深 入 发 展 , 院也 随着 社 医 会经 济 发展 进 场人 轨 , 改 过 去 由国 家 拨 款 而 变 成 自 一 收 自支单 位 。但 是 医 院 不 同于 其 他 生 产 部 门 , 院有 医 其 自身 特点 , 医 院进 行 效 益 评 价 必 须从 社 会 效 益 与 对 经 济 效 益 这 两 点 出发 , 者 缺 一 不 可 。 采 用 Fse 判 两 i r h 别 法 对我 院 1 3个科 室进 行 分类 评 价 , 着 简 约快 速 的 本 原则 从 众 多 指 标 中 筛 选 出床 位 利 用 率 ( 、 愈 率 x )治 ( 2、 济指标 完 成 计 划 百 分 比 ( 3三 项 指标 进 行 研 X )经 X) 究, 1 将 3个科 室 分为 两类 , 科室 工 作质 量 优者 为 A类 , 科 室工 作质 量 差 者 为 B类 ( 表 1 , 这 三 项 指 标 建 见 )由 立 判别 函数 , 以评价 各 科综 合 效益 。 用
务, 一是 分 流 病人 , 护 就 诊 秩 序 , 现 危 重 病 人 及 时 维 发
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

目录内容摘要 (1)关键词 (1)Abstract (1)Key words (1)1、引言 (2)2、Fisher判别的前提假设 (2)3、Fisher判别的一般理论分析 (3)3.1 建立线性判别函数 (3)3.2 fisher判别的规则及统计检验 (6)4、SPSS计算步骤及结果 (8)4.1 计算过程 (8)4.2 输出结果与判别分析 (10)5、总结及建议 (16)参考文献 (21)致谢 (22)附录A (23)附录B (24)Fisher判别分析在城镇居民消费等级评估中的应用内容摘要:Fisher判别法是多元统计判别法的典型代表。

本文根据已知数据中各地区消费的等级,用Fisher判别法的一般原理对城镇居民消费等级评估进行判别分析,建立各因素的线性判别函数,再通过对SPSS 统计软件的相关操作,得出判别函数系数,再将待判观测值代入函数,得到F值,最后比较F值即可得到判别结果。

对各地区城镇居民消费等级的评估进行的实例分析,分析结果表明该模型总的判别准确率为100%,与国内已有的研究成果相比是一致的。

对政府关于城镇居民消费调节方面具有重要的应用价值。

并根据论文的判别结果的分析,给政府关于城镇居民消费提供一些具体可行的建议。

关键词:Fisher判别;判别分析;马氏距离;城镇居民消费Abstract:The Fisher discrimination method is a typical representative of multi-variable discrimination method of statistic. Using the general principles of Fisher discrimination, the paper analyzes assessment of consumption level of urban residents in the basis of the level of consumption in all regions among the known data. Linear discriminate function of factors is established by it. Through the relevant operations of SPSS statistical software, it makes observations to be sentenced into the function and obtains F value. Finally the paper compares F value to get the discrimination results. The results indicate that this modes’ accurate rate is 100% in the analysis of the level. It is identical with other models ’results in China. And it is a useful and important tool for government regulation on the consumer side of urban residents and provides some specific recommendations to the government about consumption of urban residents after the analysis of results.Key words:Fisher discrimination; discrimination and analysis; Mahalanobis range; Consumption of urban residents.1、引言随着社会经济不断发展,科学技术的不断进步,人们已经进入了信息时代,要在大量的信息中获得有科学价值的结果,从而统计方法越来越成为人们必不可少的工具和手段。

多元统计分析是近年来发展迅速的统计分析方法之一,应用于自然科学和社会各个领域,成为探索多元世界强有力的工具。

判别分析是统计分析中的典型代表,判别分析的主要目的是识别一个个体所属类别的情况下有着广泛的应用。

潜在的应用包括预测一个公司是否成功;决定一个学生是否录取;在医疗诊断中,根据病人的多种检查指标判断此病人是否有某种疾病等等。

它是在已知观测对象的分类结果和若干表明观测对象特征的变量值的情况下,建立一定的判别准则,使得利用判别准则对新的观测对象的类别进行判断时,出错的概率很小。

而Fisher判别方法是多元统计分析中判别分析方法的常用方法之一,能在各领域得到应用。

通常用来判别某观测量是属于哪种类型。

在方法的具体实现上,采用国内广泛使用的统计软件SPSS(Statistical Product and Service Solutions),它也是美国SPSS公司在20世纪80年代初开发的国际上最流行的视窗统计软件包之一。

2、Fisher判别的前提假设◆假设1:各个判别变量服从正态分布,由各个判别变量的联合分布是多元正态分布。

只有在这个条件下,我们才可以进行有关的显著性检验;◆假设2:各个判别变量不能存在多重共线性,即每个判别变量不能是其他判别变量的线性组合。

◆ 假设3:每个变量在各类中的取值应存在显著差异。

只有在这个假设下才能通过变量建立有效地判别函数将各类区分开来。

◆ 假设4:预测变量应是连续不间断变量 ,判断类别或组别应是间断变量。

3、 Fisher 判别的一般理论分析3.1 建立线性判别函数费希尔判别法是判别分析中的一种,其思想是投影,将k 组(类)p 维数据投影到某一个方向,使得组与组之间投影尽可能的分开。

也就是说它是根据方差分析的思想,使母体间的组间差最大,而母体内的组内差最小,从而建立起一种能较好地区分各个母体的线性判别函数 。

设从k 个总体判别取得k 组p 维观测值:()()(){}()()(){}111111212:,,,;;:,,,.kkkkn kn G X X X G X X X12.k n n n n =+++ 令a 为任一p 维列向量,()T y X a X =为X 以a 为法线方向的投影,这时,上述数据的投影为:()()(){}()()(){}111111212:,,,;;:,,,.kk k k TTTTTTn kn G a X a X a X G aX a X a X则()()()()()12,,,,;Ti i i i pXX X X= ()12,,,,.Tm X X X X =(2.1.1) ()();i i TYa X= ;TY a X = ()1,2,,i k = (2.1.2)若a 取得好,则应使:(1)不同组之间的区分能力越大越好,组间平方和为()()()()22111()()()kkkTi i i i TTTTi i i i i i SSE n YY n a Xa X n a X X a XX ===⎡⎤⎡⎤⎡⎤=-=-=--⎣⎦⎣⎦⎣⎦∑∑∑()()1[()()]ki iTT T i i a n X X X X a a B a ==--=∑ (2.1.3)B 为组间离差阵,它反映了组间的差异。

(2)每个组中y 值离散程度越小越好,组内平方和为()()()()221111()iin n kk i i i i T Tjji j i j SSQ Y Ya Xa X====⎡⎤=-=-⎣⎦∑∑∑∑()()()()11in kTi i i i TT jjxx i j a X XX Xa a L a ==⎡⎤⎡⎤=--=⎣⎦⎣⎦∑∑(2.1.4) 其反映了组内的差异。

若k 组均值有显著差异,则()()()()()()/1/11T TxxSSE k n k n k SSE a BaF SSQ n k k SSQk a L a ---===---; 所以F 值应充分地大,或者 ()TT xx a Ba a a L aλ=; (2.1.5)达到极大值,经推导a 应满足 ()0xx B L a λ-= (2.1.6) 若1xx L -存在,则有 1()0xx L B I a λ--= (2.1.7) 求出1xx L B -的最大特征根1λ及它所对应的特征向量1a ∧;则第一判别函数为111Tpjj j y a X aX ∧===∑若(2.1.7)的非零正特征值为 ()12.r r m λλλ≥≥≥≤ 相应的特征向量依次为12,,,r a a a ∧∧∧,则就可得到多个判别函数 ()1,2,,t y t r = ,为方便计算,后面均记判别系数为a 。

假如令 ()TTa Ba a a Saλ=; (2.1.8)它和(2.1.5)式只相差一个常数,且S ∧=∑,其中的∑表示协方差阵。

即S 是∑的无偏估计,要使a 取得最恰当的值,让(2.1.8)达到极大和使(2.1.5)达到极大值是等效的。

(2.1.8)式分母是组内协方差阵。

由于a 是向量,令1Taa ∧=∑,并不影响a 的各分量比例,这样求a 归结为如下条件极值问题:1m axT Ta a Q a Ba ∧⎧⎪=⎨⎪==⎩∑(2.1.9)也可推导到,若1S -存在,则 1()0S B I a β--= (2.1.10) 不难证明,此式求出的最大特征值()11n k βλ=-,1β对应的特征向量和1λ对应的特征向量各分量间的比例是一样的。

特别的当k=2时,两个总体的共同协方差阵等于各总体协方差之和,即12=+∑∑∑;12+∑∑的估计可用两种方法估计:(1)()()1212121111xxxxL L n n ∧∧∧=+=+--∑∑∑(2.1.11)(2)121212xx L n n ∧∧∧=+=+-∑∑∑(2.1.12)其中,()()12xx xx xx L L L =+,一般常用第二种方法,特别是当1n 和2n 相差不大时,这时判别函数为()()12112(2)()Txx y a X n n XXL X -==+--(2.1.13) 3.2 fisher 判别的规则及统计检验先考虑两个总体的情况,假设有总体A 和B ;由上面可知,综合考虑满足费希尔准则的条件,各判别函数必须使得()()()()()()122211()()()n n iii i y A y B I y A y A y B y B ==-=-+-∑∑取得最大值,由数学分析的极值定理,可以推导出如下方程组:11112211211222221122p p p p p p pp p ps c s c s c d s c s c s c d s c s c s c d +++=+++=+++=解此方程组可求出12,,,p c c c 而得到线性判别函数1122p p y c x c x c x =+++ ;再由该线性判别函数计算出A 和B 两类的重心:()()1pkk k y A cx A ==∑;()()1pkk k y B cx B ==∑;对它们进行以所含样本数的权数的加权平均,得()()()AB A B A B n y A n y B y n n +⎡⎤⎣⎦=+;加权平均数AB y 称为两组判别的综合指标,得判别样本的判别分组方法如下:(1)如果()AB y A y >,且对待判别样本()12,,p x x x 使1122p p AB y c x c x c x y =+++> 成立,则该样本可判属于A 组,若()AB y A y ≤,则该样本判属于B 组。

相关文档
最新文档