基于主成分分析的经济发展水平综合评价

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于主成分分析的经济发展水平综合评价1

吴冲,王栋

哈尔滨工业大学管理学院,哈尔滨 (150001)

E-mail:wuchong@

摘要:衡量一个国家的经济发展程度,要从其社会生产的各个方面去考察,要看各项生产能力的综合效果。为了客观、科学地分析我国的经济发展状况,本文首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系,并通过SPSS分析软件进行上机计算,应用主成分分析方法对我国31个省、直辖市、自治区(不包括香港、澳门和台湾)的经济发展水平进行综合分析和评价,突出了各大省市经济发展进程的特点和优势,为我国实现均衡发展提供理论依据。

关键词:主成分分析,经济发展,综合评价

1. 引言

要描述和评价一个社会的经济发展状况,最理想的是找到一个总括性社会指标体系评价方法,其测度结果能够反映社会经济发展的全部或大部分信息。20世纪60年代以来一些国际性组织、国家和地区的职能部门以及研究学者曾经提出各种不尽完全相同的指标体系评价方法[1]。我国系统地研究社会发展指标体系评价方法起步较晚,但发展很快,20世纪80年代以来,国内一些政府部门、研究单位和个人先后设计了一些“社会指标体系评价方法”[2-4],如:唐晓东[5]采用了21个指标变量的函数模型来评价我国社会经济发展状况,然而此模型一个最大缺点,就是没有把所有反映经济情况的因素考虑在内,得不到预期效果。但到目前为止,还没有形成一套完善、客观的社会经济发展综合指标体系评价方法,为了更加全面、客观地反映我国各地区的社会发展水平,本文在借鉴国内外研究成果的基础上,通过对我国已有研究成果的修正和充实,首次把居民消费价格指数和商品零售价格指数引入评价指标体系中,提出一种新的社会发展水平综合指标体系。

在实际经济问题中,不同的经济变量之间具有一定的相关性,如职工平均工资和消费水平必然有一定的关联性,这样势必增加分析问题的复杂性,因此需要有一种进行简化的方法。主成分分析法可以用较少的指标来代替原来较多的指标,并使这些较少的指标尽可能地反映原来指标的信息,从根本上解决了指标间的信息重叠问题,又大大简化了原指标体系的指标结构,用主成分分析法分析经济发展水平的优势主要体现在: (1)全面性(消除评价指标的相互影响),在满足n p

f的条件下,不限制指标的个数,可以综合评价一国的经济发展状况,主成分分析的降维处理技术能较好地解决多指标评价的要求,在选择了()

p个主成分后,

m m p

仍能保留原是数据信息的85%以上,因此这一方法综合评价经济发展水平比较全面,可以克服片面追求个别经济指标而忽略全面经济发展指标的倾向;(2)可加性(数据标准化处理),在综合评价经济发展水平时,所建立的评价指标量纲往往不同,变差不能直接综合,主成分分析法避免了此现象的发生,因为在计算过程中,主成分分析法把各个指标进行了标准化处理,这就使得各个经济指标之间具有可比性即可加性;(3)客观性(科学的确定权重),在层次分析法计算过程中,通过专家打分来确定权重,也就是说在确定权重的问题上具有了人为因素,而主成分分析法在确定综合因子的权重时,克服了某些评价方法中人为确定权重的缺陷,使得综合评价结果唯一;(4)简单性(计算简介),随着电子计算机技术的发展,SPSS、SAS等计

1本课题得到高校博士点基金(20050213037)资助。

算机软件的推进与使用,使得主成分分析法在综合评价实践中的广泛应用成为现实。

2. 主成分分析的原理

主成分分析法 (Principal Components Analysis)也称主分量分析法,是由Hotelling 于1933年首先提出,它可以在力保原始数据信息丢失最少的情况下,对高维变量空间进行降维。用少数的变量来解释整个问题。

设有N 个样本,每个样本观测到P 个变量(记为,,,12x x x p L

),构成一个n p ×阶的地理数据

矩阵X : 111212122212x x x p x x x p X

x x x np n n =⎛⎞⎜⎟⎜⎟⎜⎟⎝⎠

L L L L L L L 主成分分析的目的在于利用p 个原始变量(,,,)12x x x p L 构造少数几个新的综合变量,使

得新变量为原始变量的线性组合,新变量互不相关,心变量包含p 个原始变量的绝大部分信息。这样定义,,,12x x x p L 为原变量指标,,()12z z z m p m ≤L 为新的综合变量指标,每一个新综合变量指标是p 个原始变量的线性组合:

11111221221122221122

z l x l x l x p p z l x l x l x p p z l x l x l x m mp p m m =+++=+++=+++⎧⎪⎨⎪⎩L L M L 同时要求满足以下几个条件:

(1)z i 与z j (; ,1,2,,)i j i j m ≠=L 相互无关;

(2)1z 是,,,12x x x p L 的一切线性组合中方差最大者;2z 是与1z 不相关的,,,12x x x p L 的所

有线性组合中方差最大者;……;z m 是与,121z z z m −L

都不相关的,,,12x x x p L 所有线性组合中方差最大者,则新变量,12z z z m L

分别称为原变量,,,12x x x p L 的第一,第二,……第M 主成

分。 从以上的分析可以看出,主成分分析的实质就是确定原来变量(1,2,,)x j

p j =L 在诸主成分(1,2,)z i m i =L 上的系数(1,2; 1,2)l i m j p ij ==L L 。从数学上可以证明,它们分别是p 个原始

变量(,,,)12x x x p L 相关矩阵的前m 个具有较大特征值所对应得特征向量,而各个综合变量Z i

的方差()Var Z i 恰好是相应的特征根i λ。各主成分的方差贡献率大小按特征根顺序排列,是依次递减的,即:01

2p λλλ≥≥≥≥L 。本文的整个计算求解过程采用SPSS 统计分析软件来进

行。 3. 指标确定

我们根据选取的指标要能够客观、系统地反映一个地区经济发展水平的原则,并根据数据获取情况,另外结合所研究的具体问题,本文选择反映经济情况的8项主要指标:地区生产总值(1X ),居民消费水平(2X ),基本建设投资(3X ),职工平均工资(4X ),居民消费价格

相关文档
最新文档