主成份分析法在甘肃省各城市综合实力评价中的应用
主成分分析用于多指标评价的方法研究主成分评价

主成分分析用于多指标评价的方法研究主成分评价一、本文概述本文旨在探讨主成分分析(PCA)在多指标评价中的应用及其方法研究。
主成分分析作为一种广泛使用的统计分析工具,其主要目的是通过降维技术,将多个相关变量转化为少数几个独立的综合指标,即主成分,以便更好地揭示数据的内在结构和规律。
在多指标评价体系中,由于指标间可能存在的信息重叠和相关性,直接分析往往难以得出清晰的结论。
因此,利用主成分分析进行降维处理,提取出关键的主成分,对于简化评价过程、提高评价效率和准确性具有重要意义。
本文首先介绍主成分分析的基本原理和步骤,包括数据标准化、计算协方差矩阵、求解特征值和特征向量、确定主成分个数以及计算主成分得分等。
然后,结合具体案例,详细阐述主成分分析在多指标评价中的应用过程,包括评价指标的选择、数据的预处理、主成分的计算和解释等。
对主成分分析方法的优缺点进行讨论,并提出相应的改进建议,以期为多指标评价领域的研究和实践提供参考和借鉴。
通过本文的研究,旨在加深对主成分分析在多指标评价中应用的理解,提高评价方法的科学性和实用性,为相关领域的研究和实践提供有益的启示和帮助。
二、主成分分析的基本原理和方法主成分分析(Principal Component Analysis,PCA)是一种广泛应用于多变量数据分析的统计方法。
其基本原理是通过正交变换将原始数据转换为一系列线性不相关的变量,即主成分。
这些主成分按照其解释的原始数据方差的大小进行排序,第一个主成分解释的方差最大,之后的主成分依次递减。
通过这种方式,主成分分析可以在不损失过多信息的前提下,降低数据的维度,从而简化复杂的多变量系统。
数据标准化:需要对原始数据进行标准化处理,以消除量纲和数量级的影响。
标准化后的数据均值为0,标准差为1。
计算协方差矩阵:然后,计算标准化后的数据的协方差矩阵,以捕捉变量之间的相关性。
计算特征值和特征向量:接下来,求解协方差矩阵的特征值和特征向量。
基于主成分分析法的沿海11省市综合经济实力评价

基于主成分分析法的沿海11省市综合经济实力评价作者:杨山力来源:《中国集体经济》2014年第08期摘要:利用2013年中国统计年鉴数据,选择8项经济指标,采用主成份分析对我国沿海11个省市的经济实力进行综合评价排序,并按照主成份分析得分值的高低进行进一步分类和阐释。
关键词:经济发展;综合实力;主成分分析;沿海一、引言辽宁、河北、天津、山东、江苏、上海、浙江、福建、广东、广西、海南是我国大陆的沿海省、市。
自20世纪80年代实施改革开放以来,沿海地区先后通过设立经济特区、沿海开放城市、开发开放上海浦东等重大政策,使该地区成为中国经济最活跃、吸引外资最多、经济总量最大、对国家贡献最大、对外影响力最大的区域。
但区域经济差异是经济发展过程中不可避免的现象,地区发展不平衡也是我国的基本特征之一。
沿海各省、市有着比较相似的自然环境和资源等客观条件,经济发展水平依然存在较大的差异。
沿海地区的经济发展对中国的经济发展起着领头羊的作用,是中华民族崛起不可缺少的强劲动力,只有客观、准确地评价沿海各省、市的综合经济实力,分析各地区经济发展的差异,然后提出有针对性的政策和意见,才最终实现推动沿海各省、市经济的协调稳定发展。
二、研究方法(一)主成分分析简介主成分分析方法(Principal Component Analysis)简称(PCA),是一种解决最终问题的“中间过程”。
在社会经济研究中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,使变量之间难以取舍,而且可能因多元线性而无法得出正确结论。
主成分分析的目的就是运用线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映母体信息的指标,从而在不丢掉主要信息的前提下,避开了变量之间共线性的问题,便于进一步分析。
在主成分分析中,提取出的每个主成分都是原来多个指标的线性组合,比如有两个原始变量x1和x2,则一共可提取出如下两个主成分:PCA1=a11x1+a21x2PCA2=a12x1+a22x2原则上如果有n个变量,则最多可提取出n个主成分,但如果将它们全部提取出来就失去了该方法简化指标的实际意义。
对主成分分析中综合得分方法的质疑(王学民)

对主成分分析中综合得分方法的质疑王学民原载于《统计与决策》,2007年第8期摘要:在作主成分分析时,国内近年来流行一种通过建立综合评价函数来对各样品进行综合排名的方法。
本文对这一方法的不科学性作了阐述,并指出在综合评价函数中对各主成分使用贡献率加权是错中加错。
关键词:主成分;信息量;综合评价函数;综合得分一、问题的提出在多元数据分析中,近年来国内流行一种通过建立综合评价函数来对所有样品进行综合排名的方法。
该方法是这样的:对p 个原始变量12,,,p x x x ,通过主成分分析,取前m 个主成分12,,,m y y y ,其方差分别为12,,,m λλλ ,以每个主成分i y 的贡献率1pi i i i αλλ==∑作为权数,构造综合评价函数1122m m F y y y ααα=+++计算出每个样品的(F )综合得分,然后依这个得分的大小对所有样品进行综合排名。
对这种用线性组合的方式来综合各主成分的方法,笔者从未在国外的有关多元统计分析的文献中见过。
该方法粗看起来似乎有一定道理且很有吸引力(似乎可以综合排名了),但仔细推敲之后就会发现这一方法是对主成分思想和方法的误解,是不科学的,没有什么理论和应用上的价值。
该综合排名方法在我国的多元数据分析应用中已得到了比较普遍的误用,笔者曾在参考文献[1]中的253页上简略地谈到过这一问题,现觉得很有必要针对这一问题作一具体阐述,谈谈自己的观点,供大家参考和讨论。
二、主成分的基本思想除了将主成分法用于聚类或回归分析或寻找变量之间的共线性关系等目的之外,主成分分析的一般目的由两点组成:(1)将多个有相关关系的变量压缩成少数几个不相关的主成分(综合变量),并保留绝大部分信息;(2)给出各主成分的具有实际背景和意义的解释。
这里我们只讨论主成分分析的这种一般目的。
主成分的价值就在于它的信息量(可用方差来度量)达到最大化,即使前少数几个主成分能使累计贡献率达到一个较大的百分数,这几个主成分能不能用还得看它们是否都能得到符合实际意义的解释。
浅谈统计综合评价中主成分分析法的应用

的方 法 . 简称 综合 评价方 法 。 其基
并 评 单位 “ 综合 状况 ” 的排 序 。 本思 想是 将 多个 指标 转化 成 为一 其 分 量 不相 关 的新 随 机 向量 , 个能 够反 映综 合情 况 的指 标来 进
行评价 。
以方 差作 为 信息 量 的测 度 ,对 新
构 成 综 合 评 价 的 要 素 主 要
. 法 。 由单 项 评价 值 计算 综合 评价 序 ,而 且还 可 根据 模糊 评 价集 上 3评价 指标 。评 价 指标 体 系 是 从
值 时一 般 采 用 加 权 算 术 平 均 法 . 所 以 ,各 种 常规 综合 评价 方 法 的 区别 主要 在 于单项 评 价值 的 计算 的值 按最 大 隶属 度 原则 去 评定 对 象 的等级 。
个方面: 一 , 第 各评 价 指标 无量 纲 做 出评价 与排 序 ,而且 还 可进 一 随 着综 合评 价 技术 理 论 的开展 与 实 践活 动 ,评 价 的领 域也 从最 初 化 的方 法 .也 是将 评 价指 标 的实
步分 析各决策 单元非D E有 效 的
际值转 化 为评 价值 或称 单项 得 分 原 因 及其 改进 方 向 ,从 而 为决策 的 各行 各业 经 济统 计 综合 评价 拓 生 的计算 方 法 。常见 的 消除 量纲 的 者 提供 重要 的管理 决策 信 息 。(1 展 到后 来 的技 术水 平 、 活质 量 、 3 社 环 方 法有 相 对化 处理 法 、函数化 处 模 糊 评价法 。模 糊评 价法 奠 基 于 小 康 水 平 、 会 发展 、 境 质 量 、 综合 国力 、 效 考评 等 绩 理法 和标 准化处 理法 。 二 , 第 由单 模 糊数 学 。它 不 仅可 对评 价 对象 竞争 能力 、 这些都 能构 成被 评价对 象 。 项 评 价 值 计 算 综 合 评 价 值 的 方 按 综 合分值 的大 小进 行评 价 和排 方 面 。
主成分分析方法在综合评价中的应用

理人 员针刺 伤 的发 生率还 会降低 。要建 立针刺伤报 告 管理 制度 , 定期对 已发 生 的针刺 伤 进行 追 踪调 查 。 医 务科 、 护理部 、 院感 科和病 区护士 长做好 护理人员 的培 训 和督察工 作 。
小 结
为一层 乳胶 或聚 乙烯手 套 , 能 减少 刺 伤 时 医务 人 员 可
标函数 , 骤如下 : 步
1 将 数据 标准化 : .
Xj= ( 一 ) , = 1 … , 和 S 表 示 样 / , P,
数 ( ) 病 死率 ( ) 日均 门 诊 人 次 ( ) 出院 病 人 x4 、 x5 、 x6 、 平 均费 用( ) 见 表 1 x, , 。为与 该文结 果 比较, 们沿用 我
维普资讯
ch n s o r a fHe l i e eJ u n l a t S o h
针头等 锐器过 程 中不 能徒 手 处理 ; 接 触病 人 体 液 等 ③ 项操 作时戴手 套 , 洗 污染 的 器械 时 戴双 层 手 套。 因 清
线性组 合 ; 而在 几何 上这 些 线性 组 合 代表 选 取一 个 新 坐标系 , 是 以 x1 x2 …, 它 , , x 为 坐 标 轴 的 原 坐 标 系 旋转后 得到 的【 。 l 】
) 其 中 m 为选择 的 主成 分个 数 。主 成分 个数 的 确 ,
定可 以借助 “ 底 碎 石 图” 个 有效 的视 觉工 具 确定 , 崖 这
北京师范大学数学科学学院统计与金融数学系(0 8 5 金 蛟 10 7 )
本 文用主 成分 分析 方法 对 某 医院 1 0年 不 同性 质 的 医疗质 量指标进 行综合评 价, 果如下 。 结 原理与方 法
( je)J , , P 表 示特征根 一特 征 向量对 。 ,j ( :1 2 …, ) 3 得到样 本主成 分 : J j , . Z =e X J=1 …, , P。X 的第 个主成 分解 释 的总 方 差所 占的 比例 ( 差 贡献 方 率) 为 / 。 P 4 得到综 合评 价的指标 函数 : .
甘肃省区域城市化水平综合测度研究

甘肃省区域城市化水平综合测度研究本文在建立区域城市化水平测度指标体系的基础上,运用主成分分析法,以甘肃省14个地州市为研究地域单元,对甘肃省区域城市化水平进行了综合测度,并通过聚类分析将其划分为4种梯度类型。
同时,分析了甘肃省城市化水平的地域差异特征、各类城市发展所面临的问题及发展方向。
标签:城市化;主成分分析;聚类分析;甘肃省城市化是因生产力的发展而使人们的生产方式、生活方式、和行为方式变化的过程,其内涵在于,它不仅是简单的城乡人口结构的转化,更重要的,它是一种产业结构及其空间颁布结构的转化,是传统生产方式、生活方式和行为方式向现代化生产方式、生活方式和行为方式的转化。
目前,我国已经进入快速城市化时期,各地区提出了加速城市化,以城市化推动区域经济快速发展的战略。
但相关战略提出的科学性仍有待进一步探讨,其主要表现是从城市人口数量上提高城市化水平,各地区之间存在城市化水平的相互攀比现象,有些地区不顾区域客观条件制约,热衷于搞城市化运动。
不少市县追求个人政绩,出现城市化过热现象。
这种现象的出现可能违背了城市化发展的客观规律,与当前以单一的人口城市化指标来衡量城市发展水平有密切的关系。
因此,如何科学有效地测度区域城市化水平是亟待解决的现实和理论问题。
一、区域城市化水平测度(一)測度指标体系构建对城市化水平的测度,学术界提出了多种方法。
归结起来,这些测度方法可分为主要指标方法和复合指标方法两类。
主要指标法是指通过几个最具本质意义、最具象征性,而且便于统计分析的个别指标来反映和描述城市化水平。
复合指标法是选用与城市化有关的一组指标来综合分析,以衡量城市化的水平。
城市化内涵十分丰富,不仅体现了一个地区人口结构的变化,还体现出该地区的经济发展水平、产业结构演变以及人民生活质量的提高。
因此,文章采用复合指标来衡量区域城市化水平。
结合上述城市化内涵分析,建立城市化水平测度指标体系(表1)。
(二)计算方法多指标综合指数法的计算方法有多种,文章拟采用线性加权求和法计算各城市的城市化水平,计算公式如下:式中:F表示某一省域城市化发展水平的综合指数;Wi表示该城市第i项指标的权重(同级指标取等权);Wij为第i市第j个指标的原始数据的标准化值。
利用主成会合析法分析我国35个中心城市的综合发展水平

所以选取 Y 为第一 主成分 , 2 】 Y 为第二 主成分 , 而且 这两个 主成 分之方 差和占全 部总方差的 鹞 .4 %. 5 8 即基本上保留了原来 指标 X 。 2 …, l 1 x , X O的信 息, 样由原来 这 的1 0个指标转化 为两个新指标 。起 到了降维的作用。 前两个主成分 y .2的线性组合为 : 1y
.
一
、
客观 准确地描速砸区社会经济现状是制定新的发展战略∞肇础和前提。因此. 分析评
价 3 个中心城 市的综合发展水平 . 论对城 市自身 的发展 . 5 无 还是对周边地 区的进 步. 都
有 十分 重 要 的意 义 。 二 、主 成 分 分 析 法 1 主成分分析法简介。主成分分析法 ( . .
其中 :1 x 代表年底总人 口, 2 x 代表国内生产总值 ,3 x 代表工业总产值 ,4 ) 代表客运 c 总量 .5 x 代表货运总量 。6 】 代表地方财政 预算 内收入 .7 c x 代表 固定资产投资总额 . 代 表城乡居民年底储 蓄额 .9代表在岗工人数 。1 ) c xn代表在岗职工工资总额 。
:一 l l 1 一 k一 1
性 即 可加 性 。
() 3 客观性( 科学的确定权重) 。在层次分析法计算得过程中. 其权重是通过专家打 分来 确定权重 的. 也就是说在确定权重的问题 上具 有了人为色彩 。而 在主成分分析法 的计算 过程 中, 在确定综合 因子的权 重时 , 克服 了某些 评价方法中人 为确 定权重的缺 陷。 使得综合评价结果唯一 。 () 4 简单性( 计算简介 . 方便 ) 。随着电子计算机技 术的发展 . P S S S等计算机 SS.A 软件的推与使用. 使得主成分分析法 在综合评价实践中的广泛应用成为现实 三、 主成分分析法在 3 个中, 城市发展水平分析中的应用 5 在城 市综 合发展水平评价中 , 及的指标往往很多。为 了简化系统结构 . 涉 抓住综合 发展水平的主要问题 . 我们可由原始数据矩阵 出发求主成分。在评价全围 3 个中心城 5 市的综合发展水平 中, 涉及到 1 O项指标 . 原始数据见下表 . 即样 品效 n 3 , = 5 变量效 p =
主成分分析法评价我国各地区循环经济发展水平

主成分分析法评价我国各地区循环经济发展水平摘要循环经济是基于系统生态原理和市场经济规律组织起来的,具有高效的资源代谢过程、完整的系统耦合结构及整体、协同、循环、自生功能的网络型、进化型复合生态经济。
我国地域辽阔,各地区在自然条件、资源禀赋、经济发展水平上存在着较大的差异,因而各地区循环经济发展水平存在较大的差异性,各地区发展循环经济的对策也应有所区别。
为全面评价分析我国2011-2012年各地区循环经济发展水平,根据我国地理位置和区域经济发展状况,在东部、中部和西部各选取3个省份作为评价对象,同时为了与全国平均水平比较也将全国平均作为一个评价对象。
使用主成分分析法对各地区循环经济发展情况进行分类与评价。
结果表明:甘肃省循环经济水平最差。
上海市循环经济水平最高。
上海、北京、广东、重庆、安徽五省市的循环经济水平位于全国前列,超过了全国的平均水平。
而山西、湖北、内蒙古、甘肃四省循环经济水平较差,低于全国平均水平。
关键词:主成分分析,循环经济,评价1.引言循环经济是基于系统生态原理和市场经济规律组织起来的,具有高效的资源代谢过程、完整的系统耦合结构及整体、协同、循环、自生功能的网络型、进化型复合生态经济。
作为一种新的经济发展模式,其推行和应用受到政策、经济实力、科技发展水平等方面的制约。
我国地域辽阔,各地区在自然条件、资源禀赋、经济发展水平上存在着较大的差异,因而各地区循环经济发展水平存在较大的差异性,各地区发展循环经济的对策也应有所区别。
为全面评价分析我国2011-2012年各地区循环经济发展水平,根据我国地理位置和区域经济发展状况,在东部、中部和西部各选取3个省份作为评价对象,如表1。
同时为了与全国平均水平比较也将全国平均作为一个评价对象。
使用主成分分析法对各地区循环经济发展情况进行分类与评价。
表1 原始数据省份单位GDP能耗(吨标煤/万元)万元GDP用水量(m3/万元)单位面积土地GDP产出(万元/km2)三废综合利用产品产值占工业产值比例%环境污染治理投资占GDP比例(%)北京 1.29 80.78 2610.02 0.37 1.53 上海 1.07 158.52 9042.69 0.22 0.94 广东0.96 289.79 892.29 0.38 0.70 山西 4.23 183.74 194.14 0.83 1.48 安徽 1.47 435.72 343.45 0.67 0.86湖北 1.42 384.63 339.45 1.45 0.71重庆 1.32 253.25 323.98 0.54 1.81内蒙古 2.43 632.36 23.68 0.61 1.63甘肃 2.70 781.31 38.58 0.76 1.06全国平均1.43 405.32 143.98 0.64 1.402.数据标准化由于影响各城市循环发展的各指标的浓度不同,需要将数据进行标准化。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主成份分析法在甘肃省各城市综合实力评价中的应用贾斌(地理科学1202 2012141234)摘要:本文采用客观赋值法中的主成分分析方法,通过建立一套包括4个方面26个指标的城市综合实力指标体系,对甘肃省14个中心城市和地区的综合发展水平进行研究。
通过SPSS12.0统计软件对相关原始数据进行标准化处理,并求出无量纲后数据的相关系数矩阵R及R的特征值、特征向量和贡献率。
在此基础上,确定作为初始因子的主成分变量,并计算出各主成分分值及综合分值。
最后根据综合分值对甘肃省14个中心城市的综合发展水平做出了评价。
关键词:主成分分析中心城市综合发展水平1. 引言甘肃地处我国的西北地区。
历史悠久,地域辽阔是中华文化的发祥地之一,甘肃作为我国东南部通向西北的交通要道、汉唐丝绸之路的必经之地,在地理位置上具有十分重要的地位。
由于甘肃省的自然条件差,经济发展落后,贫困面大,甘肃省又是少数民族广泛聚居的地区。
甘肃各中心城市的发展不仅直接关系到整个甘肃省的经济发展水平和西部大开发战略的成功实施,而且也关系到地区稳定与建立和谐社会等问题。
因此研究甘肃省中心城市的综合实力发展水平具有对于促进甘肃省和谐社会的发展有着深远的现实意义和历史意义。
所谓“中心城市”是指所处区域内经济比较发达、功能相对完善,对区域外的资本、技术、人力等资源具有吸纳力,对区域内其他城市及农村具有经济、政治、文化等方面的辐射力的城市[1]。
中心城市以其地理位置、规模大小、辐射范围、影响程度及吸纳能力等的不同,区分为世界级中心城市、国家级中心城市、省级中心城市等等[2]。
中心城市是区域经济的核心和区域开发的重要依托,是带动周边城市和地区经济发展的重要动力。
随着我国工业化进程的加快,中心城市经济发挥着越来越重要的作用。
中心城市的综合实力直接影响着它的区域带动力。
评价中心城市综合发展水平对于规划城市布局、确定城市等级、制定城市发展战略、构建城市产业链等具有基础意义。
目前对中心城市的评价方法主要有两类,一类是主观赋值法,如层次分析法、德尔非法、模糊综合评价法等:另一类是客观赋值法,如主成分分析、因子分析等主观赋值法是由相关专家根据主观经验评判给分或给出相关指标的权系数,然后加权计算总分的评价方法。
主观赋值法的特点是简单明了,易于操作,缺点是人为干扰因素多,尤其是在指标较多时,很难确定指标权重客观赋值法是根据客观对象构成要素的因果关系设计指标体系,根据指标体系采集原始数据,根据原始数据计算指标权重,然后加权计算总分的评价方法。
客观赋值法的优点是克服了主观赋值法人为因素的干扰,同时也可以在不损失有价值信息的情况下进行数据简化或结构简化。
近年来,国内学者在城市问题的研究中,更倾向于使用客观赋值法,本文采用客观赋值法中的主成分分析方法,通过对相关原始数据进行标准化处理,求出无量纲后数据的相关系数矩阵R及R的特征值、特征向量和贡献率;在此基础上,确定作为初始因子的主成分变量;并计算出各主成分分值及综合分值;根据综合分值对甘肃省中心城市的综合发展水平做出客观的评价。
以便客观而准确地衡量一个地区社会经济系统的发展水平。
2. 主成分分析原理和模型2.1 主成分分析原理主成分分析(Principal Components Analysis,PCA)也称为主分量分析,是一种通过降维来简化数据结构的方法:如何把多个变量(指标)化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息。
为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。
例如在评价企业的经营业绩时,要考虑许多指标,如利润、产值、产品数量、产品质量、固定资产、流动资产等等。
若要全部列出,也许可以有几十个变量。
因此用少量的几个综合变量代替原来的许多变量是有实际意义的。
由这几个综合变量出发还有可能得到一个总的指标,按此总指标来排序、分类,问题就可能简单多了。
通常数学上的处理就是将原来N个指标作线性组合,作为新的综合指标。
最经典的做法就是用F1的方差来表达,即VarF1越大,表示F1包含的信息越多。
因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分如果第一主成分不足以代表原来N个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第N个主成分[3]。
2..2 主成分分析数学模型F1=A11ZX1+ A21ZX2+……+A n1ZX nF2=A12ZX1+ A22ZX2+……+A n2ZX n……F n=A1m ZX1+ A2m ZX2+……+A nm ZX n其中A1i ,A2i,A ni(i=1,2,3……m)为X的协方差阵∑的特征值多对应的特征向量,ZX1,ZX2,……ZX n,是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响。
[注:本文指的数据标准化是指Z标准化]。
A=(a ij )n*m =(a1,a2,a m),Ra i=λi a i,R为相关系数矩阵,λi、a i是相应的特征值和单位特征向量,λ1≥λ2≥…≥λn≥0。
进行主成分分析主要步骤如下:1.根据研究问题选取指标与数据;2.进行指标数据标准化处理,以消除量纲不同的影响;3.求无量纲后的相关系数矩阵R,进行指标之间的相关性判定;4.求R的特征值、特征向量和贡献率;5.确定主成分的个数,本文按照特征值大于1以及和累积贡献率(即主成分解释的方差占总体方差的比例)大于85%的原则提取主成分因子;6.对主成分因子的经济意义作解释,一般由权重较大的几个指标的综合意义来确定;7.确定主成分F i表达式;8.计算各主成分和综合主成分值并进行评价与研究。
3. 指标体系的建立和选取地区综合实力反映了一个地区整体的经济实力和社会经济发展状况。
因此,应该全方位地从一个地区社会经济系统的各个领域去选择指标。
现也是多方而的。
本文在指标体系的建立上遵循了完备性、功能性、可比性和层次性原则。
选取了4个层次9个方面共26个指标以较为全而地反映各城市发展的实际情况。
(本文所用数据均来自2005年甘肃省统计年鉴)由于篇幅的原因原始数据在此未列出。
本文所选取的指标体系如表1所示:表1:指标体系44. 指标的主成分分析过程及结果本文运用著名统计分析软件SPSS12.0对上述26个指标进行计算处理。
首先对原始数据进行标准化处理,以消除观测量纲的差异及数量级的影响,使标准化后的变量均值为0方差为1然后运用SPSS12.0对标准化后的数据进行主成分分析,得到主成分的特征值和贡献率(表2)计算结果如下:表2:主成分的特征值和贡献率度。
在统计学中,一般认为主成分的累积贡献率达到85%即可保留有效信息[]从表2可以看出,本文选取的4个主成分的累积贡献率是88.297%,主成分F1、 F2、F3、 F4可以解释原始信息的能力分别是:58.894%、16.667%、8.002%、4.734%。
由表2可以看出4个主成分的累积贡献率为88.698% ,即保留了原始指标88.297%的信息,具有显著代表性。
主成分的载荷矩阵(正交旋转后的因子载荷矩阵)见表3,载荷系数代表各主成分解释指标变量方差的程度。
在主成分分析中,一般认为大于0. 3的载荷就是显著的,本文因为原始变量较多,所以选取大于0. 4的负载,使其能更好地解释原始变量。
由表2可知,第一主成分的方差贡献率最大,为58.894%,是最重要的影响因子。
由表3可知,第一主成分在国内生产总值、工业总产值、第三产业产值、财政收入、社会消费品零售总额、城乡居民存款额、各地区进出口商品总值、全社会固定资产投资、财政支出、各地区金融机构存款、邮电业务总量、公路货运量、各类专业技术人员、高中在校学生人数、公路客运量、每万人拥有公共汽车数、城镇低保人数、建筑业总产值等指标上载荷较大,该主成分既反映了社会、经济发展的总体状况,又反映了城市与国内外沟通的能力。
可以认为F1是社会、经济发展和对外开放因子。
第二主成分为16.667%,是次重要的影响因子。
该主成分在城镇人均可支配收入、农村居民人均纯收入、城市人口用自来水普及率、每千人口执业医师和执业助理医师指标上负载较大,可将F2定为社会实力因子,在分析时可针对具体指标逐个进行。
第三主成分为8.002% ,重要性与F2基本相当。
该主成分在农林牧副渔总产值、人均居住面积、城市人口用自来水普及率、公路客运量指标上载荷较大。
由于载荷最大的两项指标均代表居民的生活水平,可以认为是居民生活水平因子。
第四主成分方差贡献率为4.734%,在工业增加值率等上载荷较大,可以认为F4是经济发展速度因子。
表3:主成分负载矩阵SPSS已经计算出4个主成分的分值保存在FAC1_1~ FAC4_1种4个主成分的分值从不同的角度反映了中心城市综合发展水平其综合分值反映中心城市发展的总体水平。
以4个主成分对应的方差贡献率为权数计算综合分值:443214343213243212143211FF F F F λλλλλλλλλλλλλλλλλλλλ+++++++++++++++=运用上述公式计算各城市的综合分值F 如表4所示:表4:甘肃省各中心城市分值与排序5.结果分析从表4中的得分和排序情况看:在甘肃省的14个中心城市中综合实力最强的是兰州处于第一位。
兰州是甘肃省省会城市,是全省政治经济文化中心,近年来随着西部大开发的进行,甘肃省政府对城市社会经济的发展十分重视,不断发展经济科教事业,投资加强城市基础设施建设,人民生活水平不断提高使得城市综合实力不断加强,其综合实力排在全省第一位符合实际情况。
酒泉市,位于甘肃西北部,河西走廊西端。
酒泉是举世闻名的敦煌艺术的故乡,也是中国航天城的所在地。
国家每年都要投入大量资金建设航天城给当地的经济带来快速的发展;再加上酒泉钢铁工业的快速发展和敦煌市的莫高窟旅游业的发展。
因此,综合实力排名第二也是符合实际情况。
而临夏州和甘南州城市规模较小地处偏远山区是少数民族聚集的地区,交通不发达,因此经济基础比较薄弱故排名在后两位。
而位于中间的几个城市,在经济或者在环境方而都有这样或那样的不足,其综合实力也就不那么突出了。
6.结束语本文运用客观赋值法中的主成分分析方法对甘肃省14个中心城市的综合发展水平进行了测定,最终得出了个中心城市的综合排名。
研究发现,在我们选取的4个方面26个指标中,有14个指标对于评价城市综合发展水平具有决定性意义,这一发现的现实意义在于指出了提升一个城市综合发展水平的突破口与主攻方向。