广东各个城市竞争力分析——主成分分析与聚类分析
中国各省经济发展状况分析——基于聚类分析

中国产经CHINESE INDUSTRY &ECONOMY中国产经Chinese Industry &Economy摘要:近年来,我国经济快速发展,人民生活幸福感也不断提高,但不同地域的人民幸福感仍有较大差别。
经济的发展状况与人民幸福指数相关联,因此认清目前我国各省的经济发展状况显得尤为重要。
本文通过变量聚类法将搜集到的11个指标聚为知足充裕体验指数、公共服务体验指数和社会信心体验指数。
通过IML 计算3个类成分得分,对各省在3个类成分上分别排名,运用类成分进行系统聚类,将我国各省的经济发展水平划分为4类。
济发展水平最高的北京、上海归属第一类;经济发展水平较高的河北、天津等24个省份为第二类;经济发展水平一般的内蒙古、新疆等4个省为第三类;发展水平较低的西藏为第四类。
本文基于研究结果提出了相应的对策及建议,为进一步提高各省经济发展水平,提高人民幸福指数提供理论依据。
关键词:变量聚类;系统聚类;幸福指数一、问题背景(一)选题背景自改革开放至今,虽然我国的经济有了快速健康的发展,但各地区仍存有发展不平衡的态势。
党在十七大报告中明确指出:“逐步提高居民收入在国民收入分配中的比重,整顿分配秩序,逐步扭转收入分配差距扩大超势。
”为此,我们根据居民收入的不同种类,将收入状况趋同的地区进行了系统地分类,以找到解决当前面临的增加居民收入问题的突破口。
(二)选题意义为了更好地提高我国城乡居民的幸福感,清楚地认识我国各省的经济发展状况。
本文采用聚类分析法,对2017年我国31个省、市、自治区的经济发展状况进行了系统性的研究。
通过变量聚类法对我国各省的居民的可支配收入情况进行聚类。
通过选择合理的反应幸福指数的变量用主成分分析法进行排名,并用聚类分析法将幸福指数划分为生活质量与幸福、社会环境与幸福和自然环境与幸福三部分,合理地透视我国经济发展的区域性差异。
并基于研究结果,提出了相应的建议,为进一步提高人民生活幸福指数提供理论依据。
基于主成分类聚分析的区域物流规划——以广东省为例

区域物 流规 划 一 以 东 为 广 省 例
河海大学 江 苏 南 京 2 1 O 1 O 1
指 怀 1结 合 的原 『以 及 战略 性 原 则 五 大 原 、 I { l = ! f J 则 ,本 文选 取 了 以 卜 指标 来构 建 区 域 物 流 发辰 的 评价 指 标 体 系。① 会 经济 发展 类 : 综俞 反映 了 城 物 流发 眨 的社 会经 济基 础 , 包括 G P ( )和 人 均 G P ( 2 ;②牛 D x1 D X ) 产 消赀 流通 类 :分别 从 生 产 、 费 、 内 流 消 田 通 、对 外 贸易 等 不 问角 度 反 映 r区域 物 流 服 务的 需 求状 况和 规 模 ,包 括 农 、 生 产总 『 值 ( ) X3 、上业 总 产值 ( 4 、建 筑 总 产值 X ) ( 5 、社 会 消费 零售 总 值 ( 6 x) X )以及进 出 I总额 ( 7 。③文 通运 输 炎 :反 映 了 域 I x) 物 流 发 展 的物 呒基 础 ,包 括 全 社 会运 货 量 ( ) X8 ;港 [货 物 乔吐 帚 ( ) 』 X9 ;④ 人 力资
基 于 主 成 分 类 聚 分 析 的
翟方正
【 文章 摘 要 】 本 文 以广 东省 2 个 重要 城 市 为例 , 1 利 用主 成 分 分 析对 广 东各地 区的物 流 发 展 综合 实 力进 行 标 代 替 原 采较 多的评 价 指 标 ,对省 内各 地 区的物 流 发展 进 行 聚 类 分 析 ,最后 对 广 东省 区域 物 流 中心 做 出 了 译仕 柳 圳
体 观 了原来 P个 评 价指 标 的信 息 。 ⑤用 各 土 成分 的 方 差贡 献 率 作 为 权 苇 , 线性 加 权 求 千得到 综 合 评价 函 数 Yi u ,其 值 越高 ,说 明该地 区 物流 发展 综 合实 力 和竞争 力越 强 ,
基于主成分分析和聚类分析的各地区医疗水平状况研究

基于主成分分析和聚类分析的各地区医疗水平状况研究作者:李季来源:《软件》2020年第06期摘要:为了研究全国各地区医疗发展状况,本文以31个地区为主要研究对象,选取了医疗卫生机构数、三级医院数、卫生人员数、医疗卫生机构床位数、卫生总费用等10个指标,数据均来自2019中国卫生健康统计年鉴,基于主成分分析(PCA)和聚类分析,运用SPSS软件对评价指标进行标准化,降维和去相关,同时对多元数据进行合理的分类,最后对各地区的医疗建设和发展水平进行评价。
关键词:医疗水平;SPSS软件;主成分分析;聚类分析中图分类号: TP391.41 文献标识码: A DOI:10.3969/j.issn.1003-6970.2020.06.050本文著录格式:李季. 基于主成分分析和聚类分析的各地区医疗水平状况研究[J]. 软件,2020,41(06):242246【Abstract】: In order to study the situation of medical development in various regions of the country, this paper takes 31 regions as the main research objects, and selects 10 indicators such as the number of medical and health institutions, the number of tertiary hospitals, the number of health personnel, the number of beds in medical and health institutions, and the total health expenditure. The data is extracted from the 2019 China Health Statistics Yearbook. Based on principal component analysis (PCA) and cluster analysis, SPSS software is used to standardize the evaluation indicators, reduce the dimensions and decorrelate. At the same time, the multivariate data is reasonably classified. Finally, evaluation of the level of medical construction and development in different regions in China is carried out.【Key words】: Medical level; SPSS software; Principal component analysis; Cluster analysis0 引言醫疗卫生事业关系到人民群众的身体健康和生老病死,与人民群众切身利益密切相关,是社会高度关注的热点。
运用主成分分析对各地区城市的综合经济发展进行评价

学校贺州学院姓名黎于华学号 1310515013 班级 13统计指导老师韦师摘要改革开放以来,随着经济的高速发展,我国经济取得了举世瞩目的较快增长。
然而,不同地区之间的水平和支出结构仍存在较大差异。
本文通过选取反映城市发展的大部分主要指标,运用主成分分析方法对全国30个大城市进行比较和分析,用以反映出各地区经济综合发展方面存在的差异。
通过选取主成分对经济指标的累积贡献率保证在85%以上的变差信息体现在综合评分中,使评价结果真实可靠。
关键字:主成分分析;贡献率;经济指标评价1、研究背景近年来全国各大城市都在飞速发展,但是全国各地的发展存在较大差异,各地的人们生活水平直接反映了该地区的经济发展水平。
针对这个问题我们找到一组我国大城市的数据,并运用主成分分析法对这些数据进行了分析,以了解各地区的经济发展水平。
每个城市的经济发展结构都不同,那我们如何评价各大城市的发展成果呢?全国各地人均消费水平的统计至少应该有两方面的意义。
其一,是真实反映各地老百姓的生活水平;其二,了解各地区的经济发展水平,为相关部门制定政策作参考价值。
主成分分析是考察多个定量(数值)变量间相关性的一种多元统计方法。
它是研究如何通过少数几个主分量(即原始变量线性组合)来解释多变量的方差——协方差结构。
具体地说,是导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间不相关。
主成分分析常被用来寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地解释事物内在的规律。
2.模型的建立2.1、主成分分析的基本思想主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
主成分的数学模型一般为假设有n个样本,每个样本测得p项指标(p<n)。
由于这p项指标之间往往具有相关关系,且每个样本各指标取值的单位和数量大小不同,使我们较难利用这p 项指标的信息区别这n 个样本。
因此,如何从这p 项指标中找出少数几个综合指标,使它们尽可能多地反应各项指标的信息,而且彼此之间不相关,这就成为一个重要的问题。
全国30市自治区经济发展水平综合评价——基于因子分析和聚类分析

全国30市自治区经济发展水平综合评价——基于因子分析和聚类分析近年来,我国经济发展迅速,全国各地区也呈现出不同程度的经济发展水平。
为了对全国30个市自治区的经济发展水平进行综合评价,基于因子分析和聚类分析的方法被广泛应用。
首先,我们通过因子分析的方法对数据进行降维和综合评价。
因子分析将多个变量综合为少数几个因子,并可以解释这些因子与原始变量之间的关系。
我们选择了GDP总量、人均GDP、产业结构、基础设施建设、外资吸引等指标作为评价经济发展水平的变量。
通过因子分析,我们可以得到几个综合指标,用于评价各个市自治区的经济发展水平。
接着,我们可以利用聚类分析的方法进行分类。
聚类分析是将样本划分为几个相似的类别,每个类别内的样本相似度高,而类别间的相似度较低。
我们可以通过聚类分析得到若干个类别,这些类别可以代表不同的经济发展水平。
通过将市自治区进行分类,可以更加直观地展示各地区之间的差异,也可以为地方政府提供参考。
最后,我们可以将因子分析和聚类分析的结果进行综合。
通过对因子得分和聚类结果的比较,可以得到更加准确的综合评价。
在综合评价的过程中,我们可以进一步分析各个市自治区的优势和劣势,以及存在的问题和潜在的发展机会。
这些分析结果可以为地方政府提供经济发展策略和政策的参考。
在实施全国30市自治区经济发展水平综合评价的过程中,我们需要充分考虑指标的选择和权重的确定。
指标的选择应当代表经济发展的各个方面,权重的确定应当根据实际情况和专家意见综合考虑。
另外,我们需要注意数据的可靠性和准确性,以及分析方法的合理性和可操作性。
总之,基于因子分析和聚类分析的方法可以对全国30市自治区的经济发展水平进行综合评价。
这种方法能够降低数据的维度,提取出关键的因子,并对样本进行分类。
通过综合分析和评价,可以为决策者提供参考,促进经济发展水平的提高。
主成分分析和聚类分析的比较

主成分分析和聚类分析的比较摘要:主成分分析和聚类分析方多元统计中两种重要的分析方法,但却容易在使用中混淆。
本文从基本思想,应用的优缺点、应用实例中讨论两者的异同,并简述两种方法在实际问题中的应用。
关键词:主成分分析;聚类分析一、引言主成分分析是利用降维的思想,在缺失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法。
通常把转化生成的综合指标称为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能。
聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据进行分组归类以了解数据集的内在结构,并且对每一个数据集进行描述的过程。
其主要依据是聚到同一个数据集的样本应该性质相似,而属于不同组的样本应该足够不相似。
两种方法既有区别又有联系,本文将两者的异同进行比较,并举例说明两者在实际应用中的联系,以便更好地理解这两种统计方法而为实际所应用。
二、基本思想的异同相同点:主成分分析方法是用少数的几个变量来综合反映原始变量的主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85%以上,因此其可信度很高。
通过主成分分析,可以将事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,解释变量之间的内在关系。
因此主成分变量比原始变量少了很多,从而起到了降维的作用。
聚类分析的基本思想是采用多变量的统计值,定量的确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用。
按它们亲疏差异程度,归类不同的分类中的一元。
使分类更具有客观实际并能反映事物的内在必然联系。
聚类分析是通过一种大的对称矩阵来探索相关关系的一种数学分析方法。
对变量分类后,我们对数据的处理难度也降低,所以从某种意义上说,聚类分析也起到了降维的作用。
不同点:主成分分析是研究如何通过原来变量的少数几个变量组合来解释原来变量绝大多数信息的一种多元统计方法。
广东省城市竞争力研究

Vo . N . Au 2 0 16 o8 g 06
⑥ 2 0 c eh n . 0 6 S i c .I d .T
广东省城市竞争力研究
樊 长科 徐珊珊 刘 清 力
( 华南 理 工 大学 经 济 与 贸 易 学 院 , 州 5 0 0 ) 广 10 6 摘 要: 本文 利 用主 成 分 分 析 方 法和 聚 类 分 析 方 法对 广 东省 主要 城 市 进行 分 析 , 建 了一 个评 价 指 标 体 系 , 找 出影 响 城 市 差 异 构 并
增加 值 和商业 值 .组成 指标 体系 表 现城市竞 争 力 : 同 时又选 取 了一 些 构成指 标 , 采用 多指 标综合 评 价 的判
定 的相 关性 .就 必 然存在 着 起支 配作 用 的共 同 因素 , 根据 这一 点 . 过对 原始 变量 相关 矩 阵或 协方 差 矩 阵 通
要城 市 的竞 争 力分 析 , 用 因子 分析 方法对 长 江 三角 应 洲 l 个城 市发 展 的近况 进行 了定 量 分析 . 时把评 价 5 同 结果 和 19 年的情 况 进行对 比 , 图反 映各 城市 发 展 90 力 的最新 动态 。
1 文献概述
美 国哈佛 大 学 教 授 波特 指 出 :竞 争 力 在 国 家水 “ 平 上仅仅 有意义 的概念是 国家的生 产率 。” 推及 到城 市: 一个 城市竞 争力 乃是 指城 市 的生产 率 。 他认 为 : 城 市竞 争力 是指 城市 创造财 富 、 高 收入 的能力 。波特 提 认 为影 响产业竞 争 力 的因素有 六 : 包括 四大 直接 因素 即生 产要 素状 况 、 求状 况 、 关 及 辅 助产 业 的状 况 需 相
分 析城 市 竞争 力 时 . 取 了三 个 指标 即零 售额 、 造 选 制
基于主成分分析和聚类分析的城市经济发展研究

3 . 1 主成分分析 由于 R 软件 对变量进行 相关性分析 , 发现很 多指标是存在很 大程 度 的相关 的, 因此运 用降维的思想来减少变量的个数 , 从而能够更好 的 对我 国的经济进行分 析和评 价。采用主成分分析的方法来构造评价 函 数, 对我 国的经济 进行评 价 , 也 可 以对各 个城市 的经济进 行评价 和排
现均衡发展提供理论依据 。 [ 关键词 ] 经济发展 主成分分析 聚 类分析
1 、 引言
综合评价 X7 X 8 X 9 地方财政预算 内收入 ( 万元 ) 地方财政预算 内支出 ( 万元 ) 固定资产投资总额( 万元 )
1 . 1 背景 要描 述和评 价一个社会 的经济发展 状况 , 最理 想的是 找到一个总
P r o po r t i o n o f
Va r i a n e e
3 . 4 2 4 0 21 2 1 . 6 7 7 9 4 5 8 1 . 1 4 0 4 40 8 4 1 . 0 2 3 9 41 3 5 0 . 8l 3 8 7 0 8
括性 社会指标体 系评价方法 , 其测度结 果能够反 映社会经济发 展 的全 部或 大部 分信息 。2 0 世纪 6 O 年代 以来一些 国际性组织 、 国家和地 区的 职 能部 门以及研 究学 者提 出了各种 不尽完 全相 同的指标 体系评 价方 法 。我国系统 地研究社会 发展指标体 系评价方法 起步较晚 , 但 发展很 快。 2 O 世纪8 O年代以来 , 国内一些政府部 门、 研究单位和个人先后设计 了一些“ 社会指标 体系评价方法 ” , 如唐晓东采用 了 2 1 个指标变量 的函 数模 型来评价我 国社会经济发展状 况 , 然而此模型一个最大 的缺点 , 就 是 没有把所有 反映经济 情况 的因素考虑在 内 , 得不到预期 效果 。但 到 目 前 为止 , 还没有形成一套完善 、 客 观的社 会经济发展综合指标体 系评 价 方法 , 为了更加全 面 、 客观地反 映我 国各地 区的社会 发展 水平 , 本文 选取 包括 国内生产 总值 、 第一 、 二、 三产业生产总值 、 客运量 、 货运量 、 地 方财政收入 、 支出、 在 岗职工 工资等 2 0 个经济指标 , 全 面衡量一个省 ( 自 治 区或直辖市) 经济发展 的基本状况 , 并 以此 建立一种新 的评 价指 标体
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表1各பைடு நூலகம்标详情
指标
详解
经济
各市区地区生产总值增长速度
生产总值增长速度(%)=报告期可比价生产总值/基期可比价生产总值×100%-100%,生产总值的增长速度反映了一定时期内社会最终成果的实物量规模的变动情况.
各市建筑业企业总产值
建筑业在一定时期内完成的以价值表现的生产总量,是反映建筑业生产成果的综合指标。通过它可以了解建筑业的生产规模、发展速度、经营成果,并为国家制订经济建设计划提供依据。
由主成分分析后得到的贡献率(Proportion of Variance)可知(见 图4),Z1=0.58,Z2=0.19,Z3=0.09,前三个主成分的累积贡献率为86.0%,另六个主成分可舍去。
从第一主成分中可看出,城市的竞争力与各市地区生产总值的增长率成正相关,即各市地区生产总值的增长率越大,城市竞争力越大
生态
各市环境保护基本情况
通过环境污水处理率和城镇生活垃圾无害化处率的分析来描述各市的环境保护基本情况
各市“三废”排放及治理情况
社会
各市中等职业教育基本情况
中等职业教育是职业技术教育的一部分,包括普通中等专业学校、技工学校、职业中学教育及各种短期职业培训等。它为社会输出初、中级技术人员及技术工人,在整个教育体系中处于十分重要的位置
各市地区生产总值
指按市场价格计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果。国内(地区)生产总值有三种计算方法,即生产法、收入法和支出法。三种方法分别从不同的方面反映国内生产总值及其构成。
各市规模以上工业企业单位数和工业总产值
在统计学中,一般以年主营业务收入作为企业规模的标准,达到一定规模要求的企业就称为规模以上企业。规模以上企业也分若干类,如特大型企业、大型企业、中型企业、小型企业等。
2.结果分析
通过以上3种聚类分析的结果,我们可以把21个城市分成了三种类别:
ward聚类方法
第一类城市:广州、深圳、珠海、汕头、佛山
第二类城市:其他城市
第三类城市:惠州、江门、肇庆、揭阳
最大距离(complete)聚类法:
第一类城市:广州、深圳、珠海、佛山、东莞、中山
第二类城市:其他
第三类城市:汕尾
各市城镇人口占常住人口的比例
指城镇人口与同期总人口之比,反映该区域人口的城镇化水平。通常以百分比表示
各市学龄儿童入学情况
学龄儿童:尚未达到入学年龄的儿童。从世界范围看,各国对儿童入学年龄的规定各有不同,一般为5岁或6岁。因此,学龄前儿童的年龄界限也不尽相同。学龄儿童入学情况指的是入学儿童占该市学龄儿童的比例
所以各城市的城市竞争力得分函数为:y=(PC1*C1+PC2*C2+PC3*C3)/(C1+C2+C3)
y=0.58*PC1+0.19*PC2+0.09*PC3
输出得分
所以得到综合排名:
2.2.2
1.步骤
产生距离矩阵(这里用的是euclidean距离)
计算聚类(这里用的是ward聚类方法)
绘制谱系图
1.2
聚类分析(Cluster Analysis)又称群分析,是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的。聚类分析起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。随着人类科学技术的发展,对分类的要求越来越高,以致有时仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,之后又将多元分析的技术引入到数值分类学形成了聚类分析。
题目:广东省21个地级市竞争力分析
院系:
专业:
班级:
学生姓名:
2012年11月1号
内容摘要
城市竞争力是城市发展战略和城市管理中最为核心的内容之一,正逐渐成为国内外管理科学所研究的重要课题。城市竞争力理论经过几年的发展,在国内外形成了较为明显的几大流派。国内的一些知名大学、研究所、学者也对城市竞争力形成了自己较为系统的见解,并逐步与国外城市竞争力研究相结合,使中国城市竞争力评价方法和手段有了世界性标准,也为国内管理实践和学术研究提供了大量的理论和方法,本文通过主成分分析和聚类分析方法对广东21个城市进行分析,构建一个评价指标体系,同时对21个城市进行合理的分类。
产生三类分类结果
显示每个样本的归类
绘制红框显示3个分类
1)ward聚类方法
> aa.3pc=predict(aa.pr)[,1:3]
> distance=dist(aa.3pc,method="euclidean")
> ff=hclust(distance,method="ward")
> plot(ff)
2
2.1
城市竞争力是一个综合的概念,它既包括在某一时间段上吸引并集聚资金、人才、技术、品牌、市场的能力,同时又表现为在更长的时间里的发展潜力,后者决定了一个城市在较长时期内的发展地位和竞争水平。由于其衡量的指标中有一些无法得到的准确数据,只能是估算或者采用问卷调查的方法,所以到目前为止,国内尚无一套完整且全面的城市竞争力测度指标体系。因此,无论选用哪一些评价指标,都必须因地制宜。针对广东省的一些实际情况,本文把影响城市竞争力的因素划分为三大部分:经济、社会、生态。根据这些因素选取了八个指标即:各市城镇人口占常住人口的比例、各市建筑业企业总产值、各市地区生产总值、各市规模以上工业企业单位数和工业总产值、各市环境保护基本情况、各市中等职业教育基本情况、各市区地区生产总值增长速度、各市学龄儿童入学情况、各市“三废”排放及治理情况。具体指标见表1.
> ff=hclust(distance,method="complete")
> plot(ff)
> group=cutree(ff,k=3)
> rect.hclust(ff,k=3,border="red")
> group
[1] 1 1 1 2 1 2 2 2 2 3 1 1 2 2 2 2 2 2 2 2 2
3)绘制变量之间的散点图
目的是观察变量之间是否有一定的相关性,感性的了解是否需要进行主成分分析。
plot(agareas[,2:10])
图2
4)计算相关系数矩阵
目的是定量的考察各个变量是否有较显著地相关性
图3
5)进行主成分分析
> agareas.pca<-prcomp(agareas[,2:10],scale=TRUE)
> summary(agareas.pca)
图4
6)显示各个主成分系数
图5
7)计算各主成分和原变量的相关
agareas.load<-cor(agareas[,2:10],predict(agareas.pca))
图6
8)显示主成分得分
图7
2.结果分析
做主成分分析,命名第一主成分为Z1,第二主成分为Z2,第三主成分为Z3,依次类推,当前m个主成分的累积贡献率达到80%及以上,我们就说脑的大小与前m主成分有关。并求解转化后的iZ与jx之间的相关系数。
最小距离(single)聚类法
第一类城市:广州、深圳、佛山
第二类城市:其他
第三类城市:汕尾
3
通过主成分分析和聚类分析方法,我么了解了广东省各个城市的综合竞争力的排名,对以后城市的发展具有重要的指导意义。
对各城市竞争力的指标数值进行系统聚类得,广州、深圳综合得分排名比较靠前,并处于综合得分的第一个层次,说明广州、深圳经济比较发达,综合经济实力较强,属于广东省中心城市,对周围城市的发展起到很强的辐射带动作用;而汕尾的经济发展水平就有待提高,被聚类到第三个层次,需要政府给于一定的政策扶持。
关键词:城市竞争力;主成分分析;聚类分析
1
很多学者对全国的城市进行了竞争力研究,尤其是北京、上海等大城市,但针对广东省21个城市竞争力的研究则很少,本文通过主成分分析和聚类分析方法来建立模型,研究广东省21个城市间的差异,对城市的竞争力进行个综合的排名。
1.1
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
从第二主成分中可看出,城市的竞争力与各市城镇污水处理率(%)、各市学龄儿童入学率(%)、各市中等职业学生毕业率(%)、工业废水排放达标率(%)成正比。
3.计算主成分系数
计算主成分PC1,PC2,PC3,的系数C1,C2,C3;
由计算结果可知C1=0.5773554,C2=0.1918004,C3=0.0877
2.2
2.2.1
1.利用R进行主成分分析
各个变量如下:
各市城镇人口占常住人口的比例(%):通常是越大越好
各市建筑业企业总产值(亿元:通常是越大越好
各市地区生产总值(亿元):通常是越大越好
各市地区生产总值增长速度(%):通常是越大越好
各市规模以上工业企业单位数(个):通常是越大越好
各市城镇污水处理率(%):通常是越大越好
各市学龄儿童入学率(%):通常是越大越好