上市公司业绩的组合主成份评价方法

上市公司业绩的组合主成份评价方法
上市公司业绩的组合主成份评价方法

上市公司业绩的组合主成份评价方法

张立华陈洁

(河北理工大学经济管理学院,唐山063009)

摘要:对上市公司业绩的评价一直是人们十分关注的焦点。而现行实务中所采用的评价方法又都存在一定的主观性,对此,本文提出另一种系统的评价方法一一上市公司业绩的组合主成份评价方法。对证券市场上30种股票进行综合评价,通过使统计软件SAS进行计算和分析,得到了这些股票2006年上半年财务状况的排列次序。

关键词:组合主成份;综合评价;财务指标

中图分类号:O212;F22 文献标识码:A

随着中国证券市场的不断壮大,上市公司的数量不断增加,证券市场在经济生活中的地位越来越重要。投资者进入股市之后面对的将是上千只不同行业,不同背景的股票。众多投资者除了进行政策分析外,还希望对这些股票进行客观的评价,特别是长线投资者更希望选择那些业绩优良的股票。另外,我国证券市场的日益规范化,上市公司的经营业绩成为股东、债权人、政府管理部门、证券分析人士乃至公司员工关心的主要问题。正确、公允地评价上市公司经营业绩的重要性也成为财务分析人员的共识。现行实务中经营业绩评价方法存在的一个缺陷是:评价体系中各财务指标的权重都是依据主观或经验判定事先设定好的,这难免会给评价结果带来一定的主观性。本文试运用组合主成份分析方法,提出一种依据财务指标内部结构关系来评价上市公司业绩的方法。

1.现行上市公司业绩的评价方法

目前,在国内上市公司业绩评价中享有较高声誉的评估机构是中国诚信证券评估有限公司。自1996年来,该公司与《中国证券报》合作,每年对上市公司的业绩进行综合评价。其评价的方法为综合指数法,选取的指标包括:净资产收益率、资产总额增长率、利润总额增长率、负债比率、流动比率和全部资本化比率[1]。这种评价方法的原理是:各上市公司的最后得分是在各单项指标考核评分的基础上,乘以每项指标的权数,然后相加得到总评分。其评价体系如下:

表1中国诚信公司业绩评价财务指标体系

指标净资产收

益率

资产总额

增长率

利润总额

增长率

负债比率流动比率

全部资产

优化率

权重55% 9% 13% 7% 7% 9% 此外,财政部、国家经济贸易委员会、人事部、国家发展计划委员会等四部委于1999年6月联合颁布了《国有资本金效绩评价规则》,其中,工商类竞争性企业绩效评价指标体系由基本指标、修正指标、评议指标三个层次构成,也采取综合评分的方法[2],该指标体系如下表2。

表2 财政部等四部委联合颁布的企业绩效评价体系

财政部等四部委颁布的这套绩效评价体系相对于原评价体系(1995年颁布)有相当大的改进,考核指标划分为三个层次,指标由原来的8项拓展为32项,意在增加新评价体系的适应性,并全面考虑各因素的影响。

可是,上述两个评价体系都是一种加权的加法合成法。这种方法要求各个评价指标之间相互独立,但从上述两个评价体系中所应用的财务指标看相关性较强。另外一个非常突出的问题是主观赋权。这样人为地给定权数,一方面会导致对某一个因素过高或过低的估计,使评价结果不能完全反映上市公司的真实情况,另一方面会诱使上市公司粉饰或片面追求权重较高的指标。本文下面提出的一种评价上市公司经营业绩的组合主成份评价方法将能很好地弥补这些缺陷。

2.上市公司业绩的组合主成份评价方法概要

现实生活中,人们常常遇到多指标问题。而在大多数情况下,不同指标之间具有一定的相关性,这就增加了分析处理问题的难度。于是统计学家们就设法将指标重新组合成一组相互独立的少数几个综合指标来代替原来指标,并且反映原指标的主要信息,这种将多指标化为少数独立的综合指标的方法称为组合主成份分析方法。下面我们将把这种分析方法运用于上市公司业绩评价之中。

该种评价方法的第一步要建立相应的模型。设有n 个样本,每个样本由p 个指标(),,,21ip i i x x x 表示,则原始数据构成一个p n ?维的矩阵。进而得到标准化矩阵

)(ij Z Z =,然后求Z 的相关矩阵p p ij r R R ?=)(,,最后求相关矩阵R 的特征值

021≥≥≥≥p λλλ 和对应的特征向量,按主成分法提取公因子。一般根据累计贡献率

%80/1

1

≥∑∑==p

j j

k j j λ

λ,提取前R 个主成分为公因子,也称为初始因子[3]。一般初始因子不

易解释,常作最大方差旋转,以便能够得到一个简单的结构。最理想的结构是每个变量只在一个因子上有较大的载荷,而其余因子载荷较小。各因子中具有较大载荷的变量作为一组,所有的变量都分别归于某一组中,每一个变量仅归于一个因子,各组间的变量也是线性无关

的[1]。最后分别对各组变量进行主成分分析。由于各组内的变量极其相关,故只取第一主成分也就是综合主成分即可代表,求出各组第一主成分的得分),2,1(k j C j =[4]。

通过上述步骤我们把p 个变量指标分为k 个组,以各组的第一主成分得分

),2,1(k j C j =为各组的得分,以(4)中因子旋转后各因子的方差贡献率为权重。 ),,2,1(1

k j W k

j j j

j ='

'=

∑=λλ,建立综合评价模型),2,1(,1

n i C W F j k

j j ==∑=,最后根据综

合得分的多少进行排序[5]。

根据上面的模型,本文把在上证指数中的前30只股票作为样本,将主营业务收入(X1)、主营业务利润(X2)、利润总额(X3)、净利润(X4)、总资产(X5)、净资产(X6)、净资产收益率(X7)、每股净资产(X8)、每股资本公积(X9)、每股收益(X10)。这样得到了30*10的原始数据阵(略),我们以样本的相关矩阵为依据,采用主成分法提取初始公因子,在采用最大方差旋转方法得到的因子载荷矩阵,见表3:

表3初始因子负荷系数 表4 最大方差旋转因子负荷系数

由表3可以看出初始因子载荷矩阵系数很难解释各个主成分,况且X8、X9的载荷系数为负,也就意味着每股净资产和每股资本公积金增加时,该公司的综合业绩得分就会下降,这与实际情况是不符的。所以通过最大方差旋转后在各因子中负荷系数较大的变量作为一组(表4),则分为以下三组。(X2,X3,X4,X5)、(X1, X6,X7)、(X8,X9,X10)。然后分别对这三组变量进行主成分分析,由于各组变量的第一主成分贡献率都达到80%以上,故各组都只取第一个主成分列于表5。

变量 初始因子负荷系数

PROC 1

PROC 2

PROC 3

X1 0.9361 -0.0858 0.0749 X2 0.8950 -0.0958 0.0686 X3 0.8989 -0.0589 -0.1446 X4 0.6980 0.3164 0.2288 X5 0.7831 -0.0479 -0.0624 X6 0.5554 -0.0509 0.5762 X7 0.2881 0.7784 -0.3474 X8 -0.1713 0.9052 0.2839 X9 -0.3029 0.3283 0.8122 X10 0.1099 0.8503 -0.3463 方差 4.9797 2.3862 1.3458 累计贡献 率(%)

49.7970

74.0616

90.6360

变量 最大方差旋转因子负荷系数 I 1

I 2

I 3

X1 0.1892 0.8795 0.1481 X2 0.8667 0.3058 0.0915 X3 0.9625 0.4035 -0.0230 X4 0.9005 0.2389 0.3994 X5 0.9662 -0.1744 -0.1359 X6 0.0085 0.9072 0.9894 X7 -0.2188 0.9437 -0.2067 X8 0.3132 -0.2270 0.9385 X9 0.2130 -0.5452 0.9544 X10 0.3579 0.5786 0.8957 方差 5.4870 2.2275

1.1277

累计贡献 率(%)

54.8710

77.1454 88.4228

由表4和表5我们建立如下综合评价模型

3

211277

.12275.24870.51277

.11277.12275.24870.52275.21277.12275.24870.54870.5C C C F ++++++++=

321,,C C C 分别为:

543214779.04773.05430.05247.0z z z z C +++= 76124857.05463.05078.0z z z C ++= 109833976.04988.05489.0z z z C ++=

注:这种评价方法不一定要求使各因子必须具有实际意义,而且只在用第一主成分进行

评价达不到理想效果时才使用。

将各评价单元的标准化后的数据代入上式就可求出各个上市公司的综合业绩的得分,见表6。

表6 按综合得分之值排序 股票名称 综合得分 股票名称 综合得分 股票名称 综合得分 民生银行 2.1064 上港集箱 0.0232 天津港 -0.3402 宝钢股份 1.7943 清华同方 0.0055 山东基建 -0.3599 招商银行 1.0035 中信证券 0.0021 南方航空 -0.3767 中国联通 0.7457 四川长虹 -0.0311 悦达投资 -0.4320 华能国际 0.4657 上海电力 -0.0994 东方明珠 -0.4978 山东铝业 0.4334 上海汽车 -0.1091 广电电子 -0.5304 XD 上海机 0.1404 福建高速 -0.2402 方正科技 -0.5616 长江电力 0.0662 广电信息 -0.2688 张江高科 -0.5817 武钢股份 0.0643 哈药集团 -0.2723 爱使股份 -0.6446 伊利股份

0.0508

原水股份

-0.3096

金杯汽车

-1.2462

综合得分为正代表这些上市公司的业绩处于所研究样本的整体平均水平;同理,这里的综合得分小于0并不代表综合业绩小于0,而是代表这些上市公司的综合业绩低于所研究的样本的整体平均水平,表现为综合得分小于0。

由以上分析结果可知,上证50指公司2006上半年经营业绩差距很大,如综合得分最高的和最低的相差3.3526。但是总体而言上证50指公司的综合得分呈相关区间内的正态分布,但由于上证50指涉及的都是效益历来较稳定的国有大中型或其它类型企业,且未考虑ST 公司(specical treat 公司)的情况,因此,上述分析结果还不足以代表整个上海股市2006上半年经营业绩情况。但在上证50指数公司范畴内部,这种分析是有意义的。一方面它可以为上证指数专家委员会进行成份股筛选的科学决策提供参考依据,另一方面也可为投资者进行投资决策提供参考。

3. 小结

从表6可以看出,面对上市公司财务报表中众多的指标,使用多元统计分析中的组合主成份分析法,可以计算出个股综合业绩的综合得分,结果可靠。这样投资者可以对各个上市公司的经营业绩的状况有比较清楚的了解。另外,上市公司业绩的组合成份评价方法应用广泛,可以结合聚类分析认识水平,将其运用于判定上市公司经营状况分布类别;也可以运用于公司破产预测等。希望我们提出的这种对上市公司财务业绩评价的方法能为今后研究中国股市规律及国有资本金绩效评价的同仁们提供一个有益的思路。

参考文献

[1] 中国诚信证券评估有限公司.中国上市公司基本分析[M] .北京:中国科学技术出版社,

1997.641.

[2] 财政部,国家经济贸易委员会,人事部,国家发展计划委员会.关于印发《国有资本金效绩评价规则洲国有资本金效绩评价操作细则》的通知[J].财务与会计,1999(8)37一44.

[3] 金浩. 经济统计分析与SAS应用[M]. 北京:经济科学出版社,2002.

[4] 侯文.对应用主成份进行综合评价的探讨[J].数理统计与管理,2006 25卷2期211-214.

[5] 江冬明.主成分分析在证券市场个股评析中的应用[J].数理统计与管理,2006 20卷3期28-31.

我国上市公司绩效评价的现状及存在的问题分析.docx

1绪论 1.1研究背景和意义 1.1.1研究背景 2011年底,国务院颁布了《关于推进国有资本调整和国有企业重组的指导意见》,请求推动国有本钱和财产会聚的紧张症结范畴,加速国有大型企业改革成股份公司,全体国有大型企业已逐渐成为公司的多元化股东结构调整,鼎力推动结构调整而国有企业的上市和全体上市。特别是上市的核心业务资产或资产品质企业的踊跃支撑《看法》,市场不停勉励国有控股公司增资,收买资产等方法,将主业资产注入上市公司。可以看出,中国的资本市场正在改善,上市国有企业的数量将不会继续增长,不断提高资本市场的有效性,上市公司一直处于重要的地位,因此,建立一个新的与绩效评价体系的公平适应机制,使公司的业绩评价体系上市进一步修改完善不可避免。在当今市场经济不断完善和发展,激烈的市场竞争面前,企业面临着严峻的考验,上市公司越来越多地主导市场的今天,其经营业绩的好坏,对国家的发展有直接影响作用。能否保证绩效评价工作的顺利进行,能否在最大程度上真实地反映公司的经营业绩,能否为国家监督、公众投资以及内部管理提供有价值的信息,取决于能否正确地选择上市公司绩效评价指标体系 1.1.2研究意义 上市公司已日益凸显的重要性,随着市场的逐步完善,人们已经开始建立市场信心,人们也越来越关注上市公司的业绩。在信息期间的提高使信息更快地流传,获得信息的人的疾速反应和适应能力比较强,对上市公司的事迹评估,好处相关者充足留意细节,敏捷做出调剂,以是市场也是绩效评估系统的指导下,以反应和增进市场的康健有序成长。在我国今朝并无构成一个完备的实践系统去对上市公司的事迹停止评估。我国当局只评估国有本钱资金的绩效环境,而由中介机构、学者和消息序言等对上市公司的绩效停止评估则,但是这些官方构造也是在国有本钱金的评估办法的基础上停止评估,有的乃至加倍简化,上市公司的实在绩效不克不及实在地展示。近几年,海内有关部门、研讨机构和专家学者们对企业事迹评估目的导向的蜕变,财政目的与非财政目的好坏的评论辩论,事迹评

主成分分析法总结

主成分分析法总结 在实际问题研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? 一、概述 在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。主成分分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点: ↓主成分个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓主成分能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓主成分之间应该互不相关 通过主成分分析得出的新的综合指标(主成分)之间互不相关,因子参与数据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题。 ↓主成分具有命名解释性 总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。 主成分分析的具体步骤如下: (1)计算协方差矩阵 计算样品数据的协方差矩阵:Σ=(s ij )p ?p ,其中 1 1()() 1n ij ki i kj j k s x x x x n ==---∑i ,j=1,2,…,p (2)求出Σ的特征值 i λ及相应的正交化单位特征向量i a Σ的前m 个较大的特征值λ1≥λ2≥…λm>0,就是前m 个主成分对应的方差,i λ对应的单 位特征向量 i a 就是主成分Fi 的关于原变量的系数,则原变量的第i 个主成分Fi 为:

基于主成分分析的经济发展水平综合评价

基于主成分分析的经济发展水平综合评价1 吴冲,王栋 哈尔滨工业大学管理学院,哈尔滨 (150001) E-mail:wuchong@https://www.360docs.net/doc/435245957.html, 摘要:衡量一个国家的经济发展程度,要从其社会生产的各个方面去考察,要看各项生产能力的综合效果。为了客观、科学地分析我国的经济发展状况,本文首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系,并通过SPSS分析软件进行上机计算,应用主成分分析方法对我国31个省、直辖市、自治区(不包括香港、澳门和台湾)的经济发展水平进行综合分析和评价,突出了各大省市经济发展进程的特点和优势,为我国实现均衡发展提供理论依据。 关键词:主成分分析,经济发展,综合评价 1. 引言 要描述和评价一个社会的经济发展状况,最理想的是找到一个总括性社会指标体系评价方法,其测度结果能够反映社会经济发展的全部或大部分信息。20世纪60年代以来一些国际性组织、国家和地区的职能部门以及研究学者曾经提出各种不尽完全相同的指标体系评价方法[1]。我国系统地研究社会发展指标体系评价方法起步较晚,但发展很快,20世纪80年代以来,国内一些政府部门、研究单位和个人先后设计了一些“社会指标体系评价方法”[2-4],如:唐晓东[5]采用了21个指标变量的函数模型来评价我国社会经济发展状况,然而此模型一个最大缺点,就是没有把所有反映经济情况的因素考虑在内,得不到预期效果。但到目前为止,还没有形成一套完善、客观的社会经济发展综合指标体系评价方法,为了更加全面、客观地反映我国各地区的社会发展水平,本文在借鉴国内外研究成果的基础上,通过对我国已有研究成果的修正和充实,首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系。 在实际经济问题中,不同的经济变量之间具有一定的相关性,如职工平均工资和消费水平必然有一定的关联性,这样势必增加分析问题的复杂性,因此需要有一种进行简化的方法。主成分分析法可以用较少的指标来代替原来较多的指标,并使这些较少的指标尽可能地反映原来指标的信息,从根本上解决了指标间的信息重叠问题,又大大简化了原指标体系的指标结构,用主成分分析法分析经济发展水平的优势主要体现在: (1)全面性(消除评价指标的相互影响),在满足n p f的条件下,不限制指标的个数,可以综合评价一国的经济发展状况,主成分分析的降维处理技术能较好地解决多指标评价的要求,在选择了() p个主成分后, m m p 仍能保留原是数据信息的85%以上,因此这一方法综合评价经济发展水平比较全面,可以克服片面追求个别经济指标而忽略全面经济发展指标的倾向;(2)可加性(数据标准化处理),在综合评价经济发展水平时,所建立的评价指标量纲往往不同,变差不能直接综合,主成分分析法避免了此现象的发生,因为在计算过程中,主成分分析法把各个指标进行了标准化处理,这就使得各个经济指标之间具有可比性即可加性;(3)客观性(科学的确定权重),在层次分析法计算过程中,通过专家打分来确定权重,也就是说在确定权重的问题上具有了人为因素,而主成分分析法在确定综合因子的权重时,克服了某些评价方法中人为确定权重的缺陷,使得综合评价结果唯一;(4)简单性(计算简介),随着电子计算机技术的发展,SPSS、SAS等计 1本课题得到高校博士点基金(20050213037)资助。

大学毕业设计_上市公司业绩评价分析

上市公司业绩评价分析 摘要 企业在成功上市前,机构及投资者需要了解企业的经营状况,而企业的经营状况分析来源于企业的业绩支撑,业绩的评价,作为企业与投资者共同关注的指标,表现出现代企业的价值所在。 科学地评价企业业绩,可以为出资人行使经营者的选择权提供重要依据;可以有效地加强对企业经营者的监管和约束;可以为有效激励企业经营者提供可靠依据;还可以为政府有关部门、债权人、企业职工等利益相关方提供有效的信息支持。 企业的经营状况,在了解完毕企业的业绩后,我们开始分析企业的经营情况,在企业成长的过程中,上市是企业面临重大改革的必经之路,成功上市后,经营者最关心之点是企业的收益性、安全性、效益性及成长性。对其进行经营分析的基本方法是:首先确定分析目标,然后对报表的实际数据采用比率法计算其数值,并与过去的业绩或同行业的标准统计数值进行比较,最终判断其结论。 在结合了财务指标与非财务指标后,我们通过了解各种评测方法的结合来了解企业的业绩和经营状况,从而通过了报表了解了上市公司的财务及经营状况,同时也为投资者提供了真实准确的企业经营情况信息,为企业未来的发展及管理打下了坚实的基础。 关键词业绩评价;财务指标;非财务指标

Abstract A successful public offering in the former, institutions and investors need to understand the operation of enterprises, and business analysis support from the enterprise's performance, performance evaluation, enterprises and investors as an indicator of common concern, the performance of the modern enterprise value. Scientific evaluation of enterprise performance, the investor can exercise the right to choose the operator to provide an important basis; can effectively strengthen the supervision of enterprise managers and constraints; can be an effective incentive for business operators to provide reliable basis; the relevant government departments can also , creditors, employees and other stakeholders to provide effective information support. Operating conditions of enterprises. Finished in understanding the performance of enterprises, we started analyzing the operation of enterprises in the process of growth, listed enterprises are facing a major reform is a must, after the successful listing, the operator is most concerned about the profitability of enterprises , safety, efficiency and growth. Analysis of its basic method of operation is: first of all, the goal to identify, analyze, and then the actual data on the statements of the application of a ratio method to calculate its value, and the past performance or with the industry standard statistical comparison of values, and ultimately to judge its conclusions. In a combination of financial indicators with non-financial indicators, we learn through a combination of a variety of evaluation methods to understand the business performance and operating conditions, resulting in the adoption of statements of listed companies understand the financial and operating conditions, at the same time provide investors with a true and accurate business information for business development and management of the future and lay a solid foundation. Key words performance evaluation; financial indicators; non-financial indicator

用主成分分析模型构造综合评价指数

用主成分分析模型构造中学考试综合评价指数 [摘要] 在中学考试的综合评价中,使用较多的指标进行描述使分析复杂化,难以对众多指标的影响作出正确的判断,需要少量几个“综合评价指标”。通过简单加权的合成方法,难以得到科学的结果。主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少量几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关,较好地解决了这一课题。 [关键词] 考试评价;主成分分析;数学模型;计算步骤,指数构造方法 一、问题的提出 在中学考试评价中,通常使用各学科的“平均分”、“优秀率”、“及格率”和“低分率”等指标。考虑到成绩的分布状况(“优秀率”与“及格率”之间的差距偏大,可能失去部分信息量),某些地区还使用了“良好率”指标。这样,k 个学科的考试评价的p 项指标将多达k ╳p 个。在对考试进行综合的评价时,使用较多的指标进行描述不仅会增加评价的工作量,而且会因评价指标间的相关性造成评价信息重叠,相互干扰,其结果使分析复杂化,难以对众多指标的影响作出正确的判断。因此,需要少数几个甚至一个“综合评价指标”来代替众多的且相互之间具有相关关系的指标,同时又需要不失去原有指标具有的信息量,这是考试评价中具有现实意义的课题。 某些地区采用一种“降维”的方法,较成功地把k ╳p 维指标降为p 维指标,即在使用“总分平均分”的同时,用“科平均╳╳率”取代各科的“╳╳率”(计算方法见备注1)。如何把p 维指标再合成为一个“综合评价指标”?采用一些简单加权的合成方法时,由于对各指标的影响不容易作出正确的定量化的判断,及权数产生的科学性等问题,往往难以得到令人信服的科学的结果。 主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少数几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关。较好地解决了这一课题。 二、主成分分析的数学模型 设有n 个样品,每个样品观测p 个指标(变量):X 1,X 2,…,X p , 得到原始数据矩阵: 用数据矩阵X 的p 个列向量(即p 个指标向量)作线形组合(即综合指标向量)为: 上述方程组要求: 且系数αij 由下列原则决定: ①、F i 与F j (i ≠j ,i ,j =1,…,p )不相关; ②、F 1是X 1,X 2,…,X p 的一切线性组合(系数满足上述方程组)中方差最大的,F 2是与F 1不相关的X 1,X 2,…,X p 的一切线性组合中方差最大的,…,F p 是是与F 1,F 2,…,F p-1都不相关的X 1,X 2,…,X p 的一切线性组合中方差最大的。 ?? ? ??? ? ???? ???=np n n p p x x x x x x x x x X 2122221 11211 ??? ?? ???????=ni i i i x x x X 2 1 ?? ???? ?+++=+++=+++=p pp p p p p p p p p X a X a X a F X a X a X a F X a X a X a F 22122221122122111111 2 2221=+++pi i i a a a

主成分分析法PCA的原理

主成分分析法原理简介 1.什么是主成分分析法 主成分分析也称主分量分析,是揭示大样本、多变量数据或样本之间内在关系的一种方法,旨在利用降维的思想,把多指标转化为少数几个综合指标,降低观测空间的维数,以获取最主要的信息。 在统计学中,主成分分析(principal components analysis, PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。 2.主成分分析的基本思想 在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 对同一个体进行多项观察时必定涉及多个随机变量X1,X2,…,X p,它们之间都存在着相关性,一时难以综合。这时就需要借助主成分分析来概括诸多信息的主要方面。我们希望有一个或几个较好的综合指标来概括信息,而且希望综合指标互相独立地各代表某一方面的性质。

主成分分析法及其在SPSS中的操作

一、主成分分析基本原理 概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。 思路:一个研究对象,往往是多要素的复杂系统。变量太多无疑会增加分析问题的难度和复杂性,利用原变量之间的相关关系,用较少的新变量代替原来较多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反应的信息,这样问题就简单化了。 原理:假定有n 个样本,每个样本共有p 个变量,构成一个n ×p 阶的数据矩阵, 记原变量指标为x 1,x 2,…,x p ,设它们降维处理后的综合指标,即新变量为 z 1,z 2,z 3,… ,z m (m ≤p),则 系数l ij 的确定原则: ①z i 与z j (i ≠j ;i ,j=1,2,…,m )相互无关; ②z 1是x 1,x 2,…,x P 的一切线性组合中方差最大者,z 2是与z 1不相关的x 1,x 2,…,x P 的所有线性组合中方差最大者; z m 是与z 1,z 2,……,z m -1都不相关的x 1,x 2,…x P , 的所有线性组合中方差最大者。 新变量指标z 1,z 2,…,z m 分别称为原变量指标x 1,x 2,…,x P 的第1,第2,…,第m 主成分。 从以上的分析可以看出,主成分分析的实质就是确定原来变量x j (j=1,2 ,…, p )在诸主成分z i (i=1,2,…,m )上的荷载 l ij ( i=1,2,…,m ; j=1,2 ,…,p )。 ?????? ? ???????=np n n p p x x x x x x x x x X 2 1 2222111211 ?? ??? ? ?+++=+++=+++=p mp m m m p p p p x l x l x l z x l x l x l z x l x l x l z 22112222121212121111............

如何有效利用主成分分析进行综合评价

如何有效利用主成分分析进行综合评价 摘要:由于主成分分析在多元统计分析中的降维作用,使之在社会、经济、医疗、生化等 各领域运用越来越广泛,但由于传统主成分分析方法的局限性导致了一些问题的产生。这些 问题吸引了许多领域专家的关注,并具有针对性的提出了一些不同的改进方法。本文介绍了 主成分分析的基本和性质,并整理了近年来主成分分析在综合评价应用中遇到的普遍问题并整理验证了认同率较强的一些改进方法,以供大家研究学习。 关键词:主成分分析;综合评价;均值化 1引言 1.1研究的背景和意义 随着生产力的不断进步,生产方式由外延式扩张转化为追求经济效益的内涵式发展,以 致在生产过程中必须考虑经济效益的各个方面,如生产力水平、技术进步、资源占用等情况, 并需要就综合各方面的因素进行综合评价。 评价是根据确定的目的来测定对象系统的属性,并将这种属性变为客观定量的计值或者主观效用行为,整个过程离不开评价者的参与,而综合评价作为评价的一种也需要评价者做出相应反应或指示,而很多综合评价过程易受到评价者的干预,使评价结果产生偏差。 主成分分析能将高维空间的问题转化到低维空间去处理【9】,使问题变得比较简单、直 观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。而且,伴 随主成分分析的过程,将会自动生成各主成分的权重,这就在很大程度上抵制了在评价过程 中人为因素的干扰,因此以主成分为基础的综合评价理论能够较好地保证评价结果的客观性,如实地反映实际问题。主成分综合评价提供了科学而客观的评价方法,完善了综合评价 理论体系,为管理和决策提供了客观依据,能在很大程度上减少了上述不良现象的产生。 所以在社会经济、管理、自然科学等众多领域的多指标体系中,如节约型社会指标体系、生态环境可持续型指标体系、和谐社会指标体系、投资环境指标体系等,主成分分析法常被应用于综合评价与监控【6】。 综上所述,对综合评价指标体系理论进行研究,既有理论上的必要性,更有实践中的迫 切性。 1.2研究的发展史

主成分分析计算方法和步骤

主成分分析计算方法和步骤: 在对某一事物或现象进行实证研究时,为了充分反映被研究对象个体之间的差异, 研究者往往要考虑增加测量指标,这样就会增加研究问题的负载程度。但由于各指标都是对同一问题的反映,会造成信息的重叠,引起变量之间的共线性,因此,在多指标的数据分析中,如何压缩指标个数、压缩后的指标能否充分反映个体之间的差异,成为研究者关心的问题。而主成分分析法可以很好地解决这一问题。 主成分分析的应用目的可以简单地归结为: 数据的压缩、数据的解释。它常被用来寻找和判断某种事物或现象的综合指标,并且对综合指标所包含的信息给予适当的解释, 从而更加深刻地揭示事物的内在规律。 主成分分析的基本步骤分为: ①对原始指标进行标准化,以消除变量在数量极或量纲上的影响;②根据标准化后的数据矩阵求出相关系数矩阵 R; ③求出 R 矩阵的特征根和特征向量; ④确定主成分,结合专业知识对各主成分所蕴含的信息给予适当的解释;⑤合成主成分,得到综合评价值。 结合数据进行分析 本题分析的是全国各个省市高校绩效评价,利用全国2014年的相关统计数据(见附录),从相关的指标数据我们无法直接评价我国各省市的高等教育绩效,而通过表5-6的相关系数矩阵,可以看到许多的变量之间的相关性很高。如:招生人数与教职工人数之间具有较强的相关性,教育投入经费和招生人数也具有较强的相关性,教工人数与本科院校数之间的相关系数最高,到达了0.963,而各组成成分之间的相关性都很高,这也充分说明了主成分分析的必要性。 表5-6 相关系数矩阵 本科院校 数招生人数教育经费投入 相关性师生比0.279 0.329 0.252 重点高校数0.345 0.204 0.310 教工人数0.963 0.954 0.896 本科院校数 1.000 0.938 0.881 招生人数0.938 1.000 0.893 教育经费投 0.881 0.893 1.000 入

主成分分析法介绍(高等教育)

主成分分析方法 我们进行系统分析评估或医学上因子分析等时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。 第一节 主成分分析方法的原理 主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n 样本,每个样本共有p 个变量描述,这样就构成了一个n×p 阶的数据矩阵: 111212122212.....................p p n n np x x x x x x X x x x ?? ? ?= ? ? ??? (1)

如何从这么多变量的数据中抓住事物的内在规律性呢?要解决这一问题,自然要在p 维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。 如果记原来的变量指标为p x x x ,,21 ,它们的综合指标——新变量指标为 21,z z ,m z (m≤p)。则 )2.........(..........22112222121212121111??? ??? ?+++=+++=+++=p mp m m m p p p p x l x l x l z x l x l x l z x l x l x l z 在(2)式中,系数l ij 由下列原则来决定: (1)z i 与 z j (i≠j;i ,j=1,2,…,m)相互无关; (2)z 1是x 1,x 2,…,x p 的一切线性组合中方差最大者;z 2是与z 1不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者;……;z m 是与z 1,z 2,……z m-1都不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者。

基于投资者视角的上市公司经营业绩评价

基于投资者视角的上市公司经营业绩评价本文是基于投资者视角构建上市公司经营业绩评价模型,并探索其应用。本论文中的投资者是指狭义的概念,即中小股东和潜在的投资者。在现时期从广大中小投资者的视角研究上市公司经营业绩评价,不仅具有显著的理论价值,而且具有重要的实践意义。随着我国证券市场的不断发展,上市公司业绩已成为证券投资者、政府管理部门、证券分析人士与基金经理共同关注的问题。 如何科学合理评价上市公司业绩已成为当前投资理论中的重要问题。目前关于上市公司业绩评价的理论模型非常多,如主成份评价模型(潘琰等,2000);因子分析模型(冯根福等,2001);突变级数法(朱顺泉,2002);模糊评价模型(吴润衡等,2004);复相关系数法(梅国平,2004)等。如果对这些理论模型进行深入分析,可以发现它们或多或少都存在着一些缺陷,主要体现在以下两个方面:第一,大多业绩评价理论模型的可操作性不强;第二,大多数业绩评价理论模型的科学性有待进一步考证。因此,建立一个科学的、具有可操作性的,能够指导投资者合理进行上市公司业绩评价的理论模型是十分重要而且迫切的任务。 站在中小投资者角度对上市公司经营业绩进行评价,简言之其实践意义就在于一方面能够有效保护中小投资者的利益,保护其投资热情,以保证资本市场资金充足;另一方面,使上市公司树立正确的经营理念,强化其为股东创造价值的观念,以便长期促进中国资本市场的健康发展。相关调查数据显示,我国股市中的中小投资者具有以下特点:数量庞大,影响能力较强;投资独立性、分散性强;整体素质偏低,投机行为严重;入市的资金少,信息来源渠道不灵通等。再加上上市公司的信息来源对于中小投资者来说相对有限(只能通过公开披露的财务报告信息获得),而且这些信息在很大程度上存在着虚假成分;另外大多中小投资者不具备专业财务知识,利用科学的信息分析结果支持决策的能力有限。因此数量上最为广大的中小投资者却往往是投资者中最为弱势的群体,其合法权益很难真正得到保护。 基于这样的需求,我国实务界近年来也陆续开发了一些上市公司经营业绩评价体系,具有代表性的包括诚信证券评价体系、《上市公司》评价体系、国有资本金绩效评价体系、《上海证券报》评价体系、《中国证券报》与上海亚商咨询公司评价体系、《新财富》评价模型等。这些众多的业绩评价实务方法都具有一定的

主成分分析法介绍教学文稿

主成分分析法介绍

主成分分析方法 我们进行系统分析评估或医学上因子分析等时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。 第一节 主成分分析方法的原理 主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n 样本,每个样本共有p 个变量描述,这样就构成了一个n×p 阶的数据矩阵: 11121212221 2 .....................p p n n np x x x x x x X x x x ?? ? ? = ? ? ??? (1)

如何从这么多变量的数据中抓住事物的内在规律性呢?要解决这一问题,自然要在p 维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。 如果记原来的变量指标为p x x x ,,21 ,它们的综合指标——新变量指标为 21,z z ,m z (m≤p)。则 )2.........(..........22112222121212121111??? ?? ? ?+++=+++=+++=p mp m m m p p p p x l x l x l z x l x l x l z x l x l x l z 在(2)式中,系数l ij 由下列原则来决定: (1)z i 与 z j (i≠j;i ,j=1,2,…,m)相互无关; (2)z 1是x 1,x 2,…,x p 的一切线性组合中方差最大者;z 2是与z 1不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者;……;z m 是与z 1,z 2,……z m-1都

中国上市公司业绩评价指标体系

二、中国上市公司业绩评价指标体系 由于我国上市公司法人治理不完善、股权割裂、法制不健全等原因,上市公司出于市场融资、配合二级市场炒作、避免亏损、管理层骗取激励基金及政治追求等特别目的,人为进行盈余操纵,甚至财务欺诈的行为时有发生。因此不能仅仅从实现利润情况评价上市公司的业绩,我们认为,上市公司的业绩应包括财务效益、资产质量、偿债风险、发展能力及市场表现等五个方面,对于每一方面,我们设置了若干财务指标反映其真实情况,具体分为基本指标和修正指标两个层次。只有五方面的有机结合,才能客观反映企业的真实业绩。 (一)中国上市公司业绩评价指标体系的设置原则 上市公司业绩评价指标体系的设置遵循以下几项原则:一是选定的指标应具有较强的横向、纵向可比性,尽可能排除异常事项的影响,如果不能完全剔除这些因素的干扰,则通过调整相关指标的权数以降低其对评价结果的影响程度;二是各项指标的设立在整体均衡的基础上应突出相互的制衡性,整个指标体系要具备“此消彼长”的内在机制,提高操控评分结果的难度;三是指标体系的确定要充分考虑上市公司特点,而且所有财务指标的计算、取值只局限在上市公司公告的数据资料内,不尝试获得每家上市公司进一步的内部消息资料,即在现行法规框架下,通过对部分必要信息的分析判断取得尽可能公平合理的评价结果。 (二)中国上市公司业绩评价指标体系的主要特点 第一,突出股东回报,企业的根本属性就是实现股东价值最大化,本评价体系已投入产出为核心,从股东价值和企业价值两个角度来反映企业的盈利能力,主要采用扣除非经常性损益后的净资产收益率和总资产报酬率两个财务指标来体现,占35%的权重,核心是突出股东回报,体现股东价值最大化。扣除非经常性损益后的净资产收益率剔除了企业盈利的偶然因素,反映企业持续盈利能力,总资产报酬率反映企业占用总资产创造的总价值,包括对股东的回报和对债权人的回报。当然,反映企业盈利能力的财务指标还有很多,我们重点从经营活动创造的利润、盈利是否有现金保障、投入资本获得的收益等多角度对企业的盈利能力进行修正,目的是更加全面、完整、真实的反映企业的盈利能力。 第二,关注公司成长。上市公司的发展不仅需要短期盈利,更需要长期持久的健康发展,本体系从规模增长的角度反映企业的成长性,采用的主要指标是销售增长率和资本扩张率,权重占20%。销售增长反映企业的市场占有和业务发展状况,资本扩张反映企业的盈利中用于扩大再生产的状况。同时,还采用三年营业收入增长、总资产增长、营业利润增长和盈余保留等项指标对成长性进行修正。 第三,体现资产质量。企业资产是创造财富的源泉,资产质量的高低间接反映企业盈利能力。本体系从资产效率的角度反映资产运营水平,采用的主要指标是总资产周转率和流动资产周转率,权重占15%。总资产周转率反应总资产创造产品和服务的能力,体现总资产的运营效率,流动资产周转率反映企业流动资产的运营效率。同时,还采用应收账款周转速度和存货周转速度进行修正。 第四,反映债务风险。企业在发展的同时要防范债务风险,防止出现债务危机,要做到收益和风险的平衡。本体系从负债和流动性角度反映企业的偿债能力,采用的主要指标是资产负债率和已获利息倍数,权重占15%。资产负债率是国际通行反映企业债务水平的指

主成分进行综合评价 综合评价主成分分析方法与因子分析方法的比较

主成分进行综合评价综合评价主成分分析方法 与因子分析方法的比较 统计研究 主成分分析方法和因子分析方法都是寻求从高维空间到低维空间的映射的方法,其目的是起到降维的效果,以便于用几个较少的综合指标来综合所研究总体各方面的信息,且这几个指标所代表的信息不重叠,也就是说从高维空间到低维空间的映射仍保持高维空间的“序”的结构。但这两种综合评价方法往往易混淆,本文从这两种方法的统计依据、数学模型、计算方法、综合指标的选取等方面比较它们的异同,以供初学者参考。 1、统计依据不同。主成分分析方法的统计问题:依P个指标戈l,x2,A,戈P的/7,个观察值矩阵X=G0帅,能否找到能较好地综合反映这个P 、二 指标的线性函数Y=乞atxt,即 i=1 找到这个主成分的方法就是主成分分析方法。 因子分析方法的统计问题仍 口由P个指标戈。,戈:,A,却的几个观钱道察信息阵X=GF)忡,用有限个不翠

可观测的潜在变量来解释原始变量间的相关性或协方差关系,寻求这几个公因子的方法就是因子缉含汗价士气分析劣珐乡图分奸劣珐的火仪 分析法。它的原理源于已知信息的指标向量戈=0。,戈:,A,菇P)’,总存在正交变换戈=Qy使得记x=Az,这里正交阵Q是X=G0。巾的 协方差阵y的特征向量排成的,y的各分量是不相关的,若茹的方差集中在少数几个变量三,,A,缸上,即y的特征值A,,A,A。较大,后几个特征值A㈨,A,A。很小几乎为零,于是就有因子模型算=4厂+s。寻求公因子、厂及因子载荷阵A的方法就是因子分析法。 , 2、数学模型不同。主成分分析的数学模型:Y=Eat、、ri, 1=1 即主成分是原始指标的线性函数。因子分析的数学模型:戈=4厂+£,A为因子载荷阵。厂为公因子向量,£为随机误差项,Vnroq=I。,Var=o,Var I30圈羹堑绻过丝Q丝生皇塑万 方数据=D。从形式上看二者的模型不同,但主成分分析又为因子分析中因子的寻求提供了一个有效的途径。主成分分析与因子分析法最易混淆的地方在于,将主成分分析方法与因子分析

主成分分析法概念及例题

主成分分析法 主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法 目录 [显示] 1 什么是主成分分析法 2 主成分分析的基本思想 3 主成分分析法的基本原理 4 主成分分析的主要作用 5 主成分分析法的计算步骤 6 主成分分析法的应用分析 o案例一:主成分分析法在啤酒风味评价分析中的应用[1] 1 材料与方法 2 主成分分析法的基本原理 3 主成分分析法在啤酒质量一致性评价中的应用 4 结论 7 参考文献 [编辑] 什么是主成分分析法 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。 在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。 [编辑] 主成分分析的基本思想

在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。 [编辑] 主成分分析法的基本原理 主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 [编辑] 主成分分析的主要作用

主成分分析在STATA中的实现以及理论介绍

主成分分析在S T A T A 中的实现以及理论介绍 文件编码(TTU-UITID-GGBKT-POIU-WUUI-0089)

第十二章 主成分分析 主成分分分析也称作主分量分析,是霍特林(Hotelling)在1933年首先提出。主成分分析是利用降维的思想,在损失较少信息的前提下把多个指标转化为较少的综合指标。转化生成的综合指标即称为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分互不相关。Stata 对主成分分析的主要内容包括:主成分估计、主成分分析的恰当性(包括负偏协方差矩阵和负偏相关系数矩阵、KMO(Kaiser-Meyer-Olkin)抽样充分性、复相关系数、共同度等指标测度)、主成分的旋转、预测、各种检验、碎石图、得分图、载荷图等。 p j n i b a y ij j i ij ,,2,1,,2,1,' ==+=ε 主成分的模型表达式为: p p j i i i i diag v v v v i p V V C λλλλλλλ≥≥≥=∧='' ==∧=∑ 2121),,,,(0 1 其中,a 称为得分,b 称为载荷。主成分分析主要的分析方法是对相关系数矩阵(或协方差矩阵)进行特征值分析。

Stata中可以通过负偏相关系数矩阵、负相关系数平方和KMO值对主成分分析的恰当性进行分析。负偏相关系数矩阵即变量之间两两偏相关系数的负数。非对角线元素则为负的偏相关系数。如果变量之间存在较强的共性,则偏相关系数比较低。因此,如果矩阵中偏相关系数较高的个数比较多,说明某一些变量与另外一些变量的相关性比较低,主成分模型可能不适用。这时,主成分分析不能得到很好的数据约化效果。 Kaiser-Meyer-Olkin抽样充分性测度也是用于测量变量之间相关关系的强弱的重要指标,是通过比较两个变量的相关系数与偏相关系数得到的。KMO介于0于1之间。KMO越高,表明变量的共性越强。如果偏相关系数相对于相关系数比较高,则KMO比较低,主成分分析不能起到很好的数据约化效果。根据Kaiser(1974),一般的判断标准如下:不能接受(unacceptable);非常差(miserable);,勉强接受(mediocre);可以接受(middling);,比较好(meritorious);非常好(marvelous)。 SMC即一个变量与其他所有变量的复相关系数的平方,也就是复回归方程的可决系数。SMC比较高表明变量的线性关系越强,共性越强,主成分分析就越合适。

相关文档
最新文档