全国各省市居民生活水平的比较与分类
用spss分析我国各省城镇居民消费水平差异

用spss分析我国各省城镇居民消费水平差异分析文章结构1 研究背景及意义 (1)2 研究方法 (1)3 数据来源与数据处理 (2)4. 实证分析 (3)4.1因子分析 (3)4.2 聚类分析 (8)5 结论 (11)1 研究背景及意义我国地域广阔,各省份的经济发展很不平衡,各省之间的居民消费水平差距较大。
经济快速发展的同时我国居民收入稳步增加,各省居民的消费支出也强劲增长,消费结构发生了巨大变化。
为了正确引导消费,进一步改善消费结构,提高我国城市居民的消费水平和生活的质量,有必要对全国各省居民消费结构之间的异同进行考察并做比较研究,以期发现经济水平和城市居民的消费水平之间的关系.2 研究方法本文运用多元统计分析中的主成分分析方法和聚类分析方法,将描述各省份城镇居民全年现金消费支出的八个指标压缩成两个综合指标( 称为主成分) , 这两个主成分保留了原始八个指标的绝大部分信息,在指标压缩的同时能够最大限度地反映出各省份城镇居民消费水平差异。
在综合因子基础上进行层次聚类分析,根据消费差异将全国31个省分为四类。
因子分析模型是根据变量间的相关性大小,把变量分组,利用同组内的变量之间相关性较高而不同组的变量之间相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。
因子分析的出发点是用较少的相互独立的因子变量来代替原来变量的大部分信息,可以通过下面的数学模型来表示:X1=α11F1+α12F2+…+α1m Fm+α1ε1,X2=α21F1+α222+…+α2m Fm+α2ε2,…Xp=αp1F1+αp2F2+…+αpm Fm+αpεp,其中:x1,x2,x3,…,xp 为p 个原有变量,是均值为零、标准差为1 的标准化变量;F1,F2,F3,…,Fm 为m 个因子变量,m 小于p,表示成矩阵形式为X=AF+αε,其中:F=(F1,F2,…,Fm)为因子变量或公共因子;ε=(ε1,ε2,…,εp)为特殊因子;F 与ε均为不可观测的随机变量. A=(αij)p×m 为因子载荷矩阵,αj 称为第j 个因子对第i 个变量的载荷系数. 在模型中,特殊因子起着残差的作用,被定义为彼此不相关且与公因子也不相关。
多元统计分析案例分析(2)

一、对我国30 个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况发展考察。
因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。
现从2022年的调查资料中抽取30个样本,指标数据如下:农村居民生活消费支出合计〔元〕9254.84936.73844.93663.94460.84489.54147.44391.2 10210.56542.98928.94013.35498.33911.64807.23682.24090.84310.45515.63455.3农村私营企业就业人数〔万人〕153.98.080.951.718.499.521.242.8258.4569.8398.3105.9113.1173.2273.6137.766.4104.5124.489.0 农村居民家庭人均纯收入〔元〕132621007559584736553069086237621113978911811303528574275789699055245832562278904543农产品价格指数〔上年=100〕98.27 103.0399.70 100.4399.83 102.90 103.7798.07 102.2399.92 100.2599.0898.0496.81 101.2399.0796.3090.6194.9589.25耕地面积2022〔万公顷〕231.7441.16317.34055.87147.24085.35534.611830.1244.04763.81920.95730.21330.12827.17515.37926.44664.13789.42830.74217.5 农村居民消费水平〔元〕1288678143867450044865739466345361360981969878444768794397573340614758451358803561农村住宅投资〔亿元〕93.0448.31441.75168.7133.17162.0571.65126.452.12284.55513.75412.48176.35236.53566.90729.47210.06298.41337.44248.80地区XX XX XX XX XX XX XX XX XX XX XX XX XX XX XX XX XX XX XX数据来源: ?中国统计年鉴 2022?.2、将数据发展标准化变换:农村居民生活消费支出合计〔元〕2.53 0.15 -0.46 -0.56 -0.12 -0.10 -0.29 -0.153.06 1.04 2.35 -0.36 0.46 -0.42 0.08 -0.55 -0.32 -0.20 农村居民家庭人均纯收入〔元〕2.37 1.30 -0.07 -0.48 -0.21 0.25 0.02 0.01 2.60 0.98 1.71 -0.30 0.42 -0.13 0.27 -0.22 -0.11 -0.18农产品价格指数〔上年=100〕0.09 1.33 0.47 0.65 0.50 1.30 1.52 0.04 1.12 0.52 0.61 0.30 0.04 -0.28 0.86 0.30 -0.42 -1.89农村居民消费水平〔元〕2.82 0.92 -0.56 -0.33 -0.33 0.14 -0.26 -0.313.09 1.06 1.69 -0.35 0.57 -0.36 0.14 -0.49 -0.23 -0.32 农村私营企业就业人数〔万人〕 0.37 -0.78 -0.21 -0.44-0.70 -0.06 -0.68 -0.51 1.20 3.66 2.31 -0.01 0.05 0.52 1.32 0.24 -0.32 -0.02农村住宅投资〔亿元〕-0.67 -0.91 1.24 -0.25 -0.99 -0.29 -0.78 -0.48 -1.16 0.38 1.64 1.08 -0.21 0.12 1.93 2.82 -0.03 0.46耕地面积 2022 〔万公顷〕-1.36 -1.29 0.84 0.02 1.15 0.03 0.56 2.84 -1.36 0.28 -0.75 0.63 -0.97 -0.42 1.28 1.43 0.24 -0.07地区XX XX XX XX XX XX XX XX XX XX XX XX XX XX XX XX XXXX 101.91 26.22 3846 3446.2 5275 727.5 5.3 XX 88.99 80.12 3652 3624.6 5277 2235.9 36.7675 XX 96.94 456.10 4748 3897.5 5087 5947.4 140.3 XX 96.11 137.22 2926 2852.5 3472 4485.3 25.4 XX 96.50 158.97 3603 3398.3 3952 6072.1 41.3XX 95.83 151.79 3683 3793.8 4105 4050.3 1.7 XX 100.22 97.33 2975 2942.0 3425 4658.8 22.0 XX 94.61 63.63 3684 3863 542.7 10.5 11.4 XX 99.39 29.51 3894 4675 1107.1 43.6 16.7 XX 92.87 79.35 3590 3457.9 4643 4124.6 18.73、用K-均值聚类法对样本发展分类如下:聚类成员案例号地区聚类距离12 3 4 5 6 7 8 910111213141516171819 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX12343233121324333421069.193060.35920.651506.42577.122453.891487.955006.412094.382853.423015.141204.491612.461880.402088.551282.272230.152053.351119.98XX -0.77 0.67 0.19 0.47 0.57 -0.42 0.14 XX -2.24 0.19 -0.68 -0.67 -0.54 0.08 -0.14 XX 1.04 -1.03 -0.57 -0.68 -0.30 -1.18 -0.81 XX -2.31 -0.74 -0.64 -0.58 -0.30 -0.64 -0.56 XX -0.25 1.32 -0.23 -0.43 -0.36 0.71 0.26 XX -0.46 -0.42 -0.92 -1.00 -0.90 0.18 -0.65 XX -0.36 -0.31 -0.66 -0.70 -0.74 0.75 -0.52 XX -0.54 -0.34 -0.63 -0.48 -0.69 0.02 -0.83 XX 0.60 -0.64 -0.90 -0.96 -0.92 0.24 -0.67 XX -0.85 -0.83 -0.63 -0.45 -1.88 -1.44 -0.76 XX 0.39 -1.01 -0.55 0.00 -1.69 -1.43 -0.71 XX -1.30 -0.74 -0.67 -0.67 -0.51 0.05 -0.70分四类的情况下,最终分类结果如下:第一类:、XX、XX。
全国各地区居民生活水平综合评价

三、 实证 分 析
民人均 纯收入 、 村改 水 累计 受益 农
率、 人均生活用 电量 、 每百 户城镇居 民拥有 的家庭 电脑数 、 城镇 居 民恩 格尔 系 数 、 村 居 民恩 格 尔 系 数。 农 其 中城镇 居 民人 均居 住 面积 、 农村 改水 累 计 受 益 率 未 能 取得 相关 资
=
I ,
一 i
i 1 2 … , = ,, … 7 ’ ’
() 3 、
动态 权 数 的综 合 评 价 方 法 , 据 根
20 0 3年的数据 , 对全 国 3 个 省市 自 1
式 中, 为第 i 项指标 的权数 , 为第 i 项指标 的标
准差 系数 。 3 计算 总得 分 并进 行排 名 。先将 各 省市 自治 区的 .
料 , 指标 体 系 中剔 除。剩 下 7个 从 指标构成 评 价指 标 体 系, 别用 x 分 i
( =12 …… ,) i ,, 7 表示 , 前面 5个 为 正向指 标 , 2个 为逆 向指标 。本 后
应用上述方 法对全 国 3 个省 市 自治 区 的居 民生 活 1
澌汀统计 I06 2 1 0年 期 7 2
式 中, 为 指 标 原 值 , 为 无 量 纲 化 后 指 标 值 , ,( ) Ⅳ 为原指标值 中最小值 。
2 计算各指 标 的动 态权数 。计算 各项 指 标 的标 准 .
差, 与其平均值 对 比得到各指标 的标 准差 系数 , 并据 以计
算各指标 的权数 , 公式为 :
治区居 民生活水平进行 了排 序和分
析
一
各项指标 的无量纲化 指标值 乘 以该项指标 的权数 , 得到
2018年中国居民人均可支配收入、人均消费支出及各省市人均消费支出排行【图】

2018年中国居民人均可支配收入、人均消费支出及各省市人均消费支出排行【图】全国31省份前三季度居民人均可支配收入出炉。
上海、北京前三季度人均可支配收入跨过4万元大关,其中,上海最高达到48339元。
此外,9个省区市前三季度居民人均消费收入超过全国平均水平。
一、2018年前三季度全国居民收支情况分析国家统计局数据显示,2018年前三季度,全国居民人均可支配收入21035元,比上年同期名义增长8.8%,扣除价格因素,实际增长6.6%。
前三季度全国居民人均可支配收入增速和上半年持平,和经济增长速度也基本同步。
2018年前三季度,全国居民人均消费支出14281元,比上年同期名义增长8.5%,扣除价格因素,实际增长6.3%。
其中,城镇居民人均消费支出19014元,增长6.5%,扣除价格因素,实际增长4.3%;农村居民人均消费支出8538元,增长12.0%,扣除价格因素,实际增长9.8%。
数据来源:国家统计局,华经产业研究院整理数据来源:国家统计局,华经产业研究院整理数据来源:国家统计局,华经产业研究院整理数据来源:国家统计局,华经产业研究院整理2018年前三季度,全国居民人均可支配收入中位数18236元,增长8.7%,中位数是平均数的86.7%。
其中,城镇居民人均可支配收入中位数27227元,增长7.4%,是平均数的92.0%;农村居民人均可支配收入中位数9248元,增长9.2%,是平均数的86.9%。
数据来源:国家统计局,华经产业研究院整理二、居民收入来源及消费支出分布按收入来源分,前三季度,全国居民人均工资性收入11984元,增长8.8%,占可支配收入的比重为57.0%;人均经营净收入3437元,增长7.0%,占可支配收入的比重为16.3%;人均财产净收入1735元,增长10.6%,占可支配收入的比重为8.2%;人均转移净收入3879元,增长9.5%,占可支配收入的比重为18.4%。
数据来源:国家统计局,华经产业研究院整理前三季度,全国居民人均食品烟酒消费支出4063元,增长5.6%,占人均消费支出的比重为28.5%;人均衣着消费支出927元,增长4.2%,占人均消费支出的比重为6.5%;人均居住消费支出3269元,增长12.2%,占人均消费支出的比重为22.9%;人均生活用品及服务消费支出898元,增长9.4%,占人均消费支出的比重为6.3%;人均交通通信消费支出1931元,增长7.6%,占人均消费支出的比重为13.5%;人均教育文化娱乐消费支出1556元,增长5.8%,占人均消费支出的比重为10.9%;人均医疗保健消费支出1275元,增长17.4%,占人均消费支出的比重为8.9%;人均其他用品及服务消费支出361元,增长7.1%,占人均消费支出的比重为2.5%。
中国人均收入省份排名一览

中国人均收入省份排名一览中国人均收入省份排名一览中国人均收入省份排名一览据不完全统计,截至10月26日,全国至少已有25省份公布了前三季度居民人均可支配收入。
其中,上海、北京全体居民人均可支配收入分别达37568元、36047元,是目前仅有的人均可支配收入超过3万元大关的地区。
居民人均可支配收入:京沪超3万元国家统计局数据显示,前三季度全国居民人均可支配收入16367元。
按常住地分,城镇居民人均可支配收入23512元,扣除价格因素实际增长6.8%;农村居民人均可支配收入8297元,扣除价格因素实际增长8.1%。
在全国数据出炉后,各地前三季度经济运行情况也相继公布。
中新网记者梳理发现,截至10月26日,除了吉林、辽宁、黑龙江、内蒙古、山西、西藏外,其余25省份均已公布了当地的前三季度居民人均可支配收入数据。
所谓居民可支配收入,是指居民可用于最终消费支出和储蓄的总和,即居民可用于自由支配的收入,包括工资性收入、经营性净收入、转移性净收入和财产性净收入。
在全体居民人均可支配收入方面,位居前两位的为上海和北京,其人均收入均突破3万元。
其中,上海前三季度居民人均可支配收入为37568元,北京前三季度居民人均可支配收入为36047元,这两地也是目前全国仅有的居民人均可支配收入超过3万元大关的地区。
城乡居民收入差距:8地区超全国水平在城镇居民收入方面,上海、北京、浙江、江苏、广东、天津、福建、山东这8个地区的城镇居民人均可支配收入超过了全国平均水平。
在已公布数据的25个地区中,上海城镇居民人均可支配收入最高,达到了39686元;北京排第二,为39142元;浙江位列第三,为33464元,这三地也是目前全国仅有的城镇居民人均可支配收入突破3万元大关的地区。
而城镇居民人均可支配收入暂排在末位是甘肃省,仅为17638.5元。
在农村居民收入方面,上海、浙江、北京、天津、江苏、山东、辽宁、福建、海南、河北这10个地区的农村居民人均可支配收入超过了全国平均水平。
聚类分析在我国各地农村居民家庭生活水平的应用

聚类分析在我国各地农村居民家庭生活水平的应用[摘要]本文旨在通过spss软件中的聚类分析对我国2010年各地区农村居民家庭平均每人生活消费支出进行分析,首先对数据进行指标选取,然后用软件进行标准化处理,聚类分析中分别选择了3类4类5类进行分析,最后根据分类结果得出结论把中国31个省市分为四类,并对一些地方人民生活水平的提高提出了一些建议。
[关键词]聚类分析;指标选取;标准化中图分类号:f326.6 文献标识码:a 文章编号:1009-914x(2013)12-0138-01一、引言通过对人们消费支出的分类来定义人们生活水平的高低,通常把食物、衣着、住房、家庭设备等参数作为分类指标。
聚类分析是一种根据样本或指标进行分类的多元统计方法。
它将性质相近的个体归为一类,使得同一类中的个体具有高度的同质性,不同类之间的个体具有高度的异质性。
将该方法应用于各地农村人们生活水平的分类中,可以综合考虑多种分类指标,合理确定各地人们生活水平的不同,可以使人们和社会更多的关注那些生活水平较低的地区。
本文采用聚类分析方法,使用spss统计软件将2010年全国各地区农村生活水平按照不同方面消费支出的指标进行了分类。
以期能在经济不断发展的今天,找出一定的消费规律性,由此得出一些结论[1]。
二、数据的收集与整理(一)数据来源——《中国统计年鉴─2011》《中国统计年鉴—2011》系统收录了全国和各省、自治区、直辖市2010年经济、社会各方面的统计数据,以及多个重要历史年份和近年全国主要统计数据,是一部全面反映中华人民共和国经济和社会发展情况的资料性年刊。
(二)指标体系的选取由于反映一个地区居民家庭生活水平的消费支出指标很多,而分析时只能考虑有限个指标对主要食品消费量,因此所选的指标不仅要有普遍性,可比较性,而且能比较显著的反映地区农村居民家庭生活水平高低的情况,基于上面考虑,又根据《中国统计年鉴》的统计数据,选取了以下8个指标,分别是食物(x1),衣着(x2),居住(x3),家庭设备与服务(x4),交通和通讯(x5),文教娱乐用品及服务(x6),医疗保健(x7),其他商品及服务(x8)。
全国各省市常住人口、城镇化率、各省市离婚率TOP10、消费城市TOP10、主要城市常住人口及人口增量

全国各省市常住人口、城镇化率、各省市离婚率TOP10、消费城市TOP10、主要城市常住人口及人口增量分析一、2019年全国各省市常住人口及人口增量情况2019年年末全国大陆总人口140005万人,比上年末增加467万人。
广东、山东两省2019年常住人口均超1亿,分别为11521万人、10070.21万人。
河南位居第三,常住人口9640万人。
四川、江苏常住人口超8000万人,位居第四和第五。
与上年末相比,广东、浙江常住人口增量超百万,广东、浙江常住人口比2018年末分别增加175万、113万。
据悉,广东、浙江当地民营经济活跃,吸引大量劳动力就业。
安徽常住人口增加42.3万人。
此外,新疆、河北、河南、四川、广西、福建常住人口增量超30万人。
2019年北京、辽宁、吉林、黑龙江四地常住人口负增长。
2019年末,北京市常住人口为2153.6万。
2019年辽宁常住人口4351.7万人,比上年减少7.6万人;2019年吉林常住人口2690.73万人,比2018年减少13.33万人;2019年黑龙江常住人口3751.3万人,比2018年减少21.8万人。
东北三省常住人口累计减少42.73万人。
二、2019年全国主要城市常住人口增量2019年杭州常住人口突破千万,人口增量比深圳多14.18万,以55.4万人口增量全国第一,宁波常住人口增加34万,西安、武汉人口增量有所放缓。
深圳、广州常住人口增量依旧保持在40万左右。
宁波常住人口增量34万。
佛山、成都、长沙、重庆、郑州常住人口增量均在20万左右。
三、2019年全国各省市常住人口城镇化率2019年全国城镇常住人口84843万人,占总人口比重(常住人口城镇化率)为60.60%。
13省市常住人口城镇化率超全国平均水平,其中,上海、北京、天津、广东、江苏、浙江常住人口城镇化率超70%。
上海常住人口城镇化率最高达到88.10%,北京位居第二,常住人口城镇化率86.60%,天津以83.48%的城镇化率排名第三。
中国区域消费差异

中国区域消费差异中国作为一个庞大的国家,地域广阔,自然条件和经济发展水平十分不均衡,因此,中国区域消费差异十分明显。
首先,东部地区是中国经济发展的重要引擎,也是消费水平最高的地区之一。
大城市如北京、上海、广州等都聚集了大量的高收入人群,这些人群拥有较高的消费能力和消费需求。
东部地区的经济相对较为发达,商业发展也比较成熟,因此,这些地区的商品种类丰富,价格也较高。
人们在这些地区购买奢侈品、高档消费品、国际品牌等较为常见。
此外,东部地区人们的生活水平普遍较高,每月花费在餐饮、旅游和娱乐方面的支出也较大。
与之相比,中西部地区的消费水平较低。
由于经济发展相对滞后,这些地区的市场规模较小,商品种类较少,价格也相对较低。
人们在这些地区普遍购买日常生活所需的商品,如食品、衣物、家电等。
由于收入水平相对较低,人们在餐饮、旅游和娱乐等方面的支出相对较少。
此外,城乡差异也导致了中国消费的不均衡。
一般而言,城市地区消费水平较高,农村地区消费水平相对较低。
这是因为城市人口更多地受益于经济发展和城市化进程,他们更容易获得更高的收入和更丰富的就业机会。
相比之下,农村地区人口主要从事种植、养殖等传统农业活动,收入较低,消费能力有限。
然而,随着中国政府不断加大对中西部地区的扶持力度,这些差异正在逐渐减小。
中西部地区正面临着快速发展的机遇,经济增长速度也远远超过了东部地区。
这意味着这些地区人们的收入和消费能力将会逐渐提高,市场规模也将扩大。
中国区域消费差异的缩小将有助于促进全国范围内的消费均衡发展,推动经济的持续增长。
总的来说,中国区域消费差异是由经济发展不平衡、地理条件、城乡差异等多重原因共同决定的。
随着政府不断推动全国范围内的经济发展和消费均衡发展,这些差异也将逐渐减小。
中国区域消费差异的原因非常复杂,涉及到经济、地理、文化和制度等多个方面。
下面将从不同角度进一步分析这些原因,并探讨如何缩小区域消费差异。
首先,经济发展不平衡是中国区域消费差异的主要原因之一。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
全国各省市居民生活水平的比较与分类摘要:运用主成分分析方法对我国全国31地区2008年居民生活水平进行了评价,提取了3 个基本的主成分进行综合评分和排序。
按照基于绝对值距离的层次方法进行聚类,并按照居民生活水平的高低将全国各省市分为三类地区,第一类是上海市,第二类是北京、浙江等省市,第三类为西藏自治区。
关键词:全国;居民生活水平;主成分分析;聚类分析生活水平的评价问题与人民的切身利益息息相关,始终受到了社会学、统计学、经济学等众多领域的广泛关注,是重要的理论研究课题。
恩格尔系数通常作为衡量居民生活水平高低的重要指标。
它是根据经验数据提出的,是在假定其它一切变量都是常数的前提下才适用的。
因此,在以恩格尔系数衡量生活水平高低时与客观现实存在差异,有待改善。
鉴于此,本文在评价居民的生活质量时采用了一套综合的指标体系,利用主成分分析方法,对我国31个地区的居民生活水平进行了打分排名和聚类分析,最后对结果进行了比较和分析。
一、 生活水平评价指标体系本文采用12 项指标:1x 为城镇居民恩格尔系数(%) ,2x 为农村居民恩格尔系数(%),3x 为城镇居民可支配收入(元), 4x 为农民人均纯收入(元),5x 为城镇居民消费支出(元),6x 为农村居民消费支出(元),7x 为在岗职工平均工资(元),8x 为农村居民人均住房面积(2m ),9x 为平均每户家庭人口(人),10x 为平均每户就业者负担(人) ,11x 为人均日生活用水量(L) ,12x 为人均生活用电量(kW ·h) 。
采用这些指标有其必要的原因。
恩格尔系数可以较好的反映不同收入群体的生活水平差距。
本文将恩格尔系数设置为城镇居民恩格尔系数(1x )与农村居民恩格尔系数(2x ),符合指标的可比性原则; 居民收入的高低从很大程度上反映了居民生活水平, 因此设置了城镇居民人均可支配收入(3x )、农民人均纯收入(4x )和在岗职工平均工资(7x )3个指标, 对各省份居民的收入进行评价;居民消费直接反映了居民生活水平,设置城镇居民消费支出(5x )与农村居民消费支出(6x )2个指标, 基本上反映了各地省份的基本消费情况,客观评价了居民的生活消费水平;家庭人口直接影响到居民生活水平,因此设置了家庭人口(9x )与平均每户就业者负担(10x )2个指标来反映居民的生活压力;水、电和住房是居民正常生活的必需, 与居民的生活水平有着最直接联系, 因此设置城镇居民人均居住面积(8x )、人均日生活用水量(11x )和人均生活用电量(12x )3个指标。
二、 主成分分析(一)主成分分析原理主成分分析法是一种数据降维方法,它是将原来选取的多个指标利用线性变换的方法重新组合成尽可能少的且互不相关的几个综合性指标,并且使这几个指标能尽量多的反映原指标所包含的信息,从而达到简化数据和揭示变量间关系的目的。
利用SPSS12. 0软件可一次性进行主成分分析,其主要步骤如下:1.为排除量纲的影响,首先对原始数据进行标准化,使各指标的均值为0 ,方差为1。
2.计算标准化后的样本相关矩阵R ,求R 的特征值λ及特征向量T;并按1λ≥2λ≥L ≥0 排序。
3.计算累计贡献率,一般按累计贡献率≥80 %的原则确定主成分数。
4.由第3步所确定的主成分如果不能很好地解释现实问题,则对其进行旋转,直到能较好地说明问题为止。
计算旋转后的主成分负荷矩阵,即为标准化后的矩阵与主成分的相关系数。
5.计算主成分得分矩阵,形成一个新的矩阵。
6.以各主成分的信息贡献率为权数,计算各省市的综合评价值。
(二)分析过程对全国31个省市的数据分布进行统计分组,所有数据均来自《中国统计年鉴2009》。
首先将原始数据进行标准化,再对标准化数据(表1)进行主成分分析,提取特征值大于1 的因子,得到第一主成分到第三主成分的特征值分别为6.1512、2.2228、1.2964,累计贡献率分别为51.26%、18.52%、10.80%。
前3 个主成分的特征值都大于1 ,并且累积贡献率大于80% ,可反映原始数据的足够信息,因此确定主成分为3 个。
通过各主成分说明的方差(表2) ,可用这3 个主成分反映原始的12 项指标。
省市北京-1.173 -1.645 2.452 2.545 2.128 2.203 3.199 0.654 -1.625 -0.926 -0.749 0.742 天津-0.362 -0.493 1.123 1.288 1.014 0.011 1.338 -0.323 -0.553 -0.178 -0.784 0.941 河北-0.956 -0.955 -0.376 -0.135 -0.576 -0.432 -0.507 -0.098 0.178 -0.178 -0.596 0.072 山西-1.175 -0.827 -0.457 -0.454 -0.679 -0.450 -0.364 -0.492 0.178 -1.301 -0.846 0.608 内蒙古-1.397 -0.494 -0.127 -0.198 0.063 -0.120 -0.310 -0.966 -0.675 -0.272 0.399 1.360 辽宁0.029 -0.558 -0.137 0.222 0.211 0.004 -0.166 -0.504 -0.992 -0.646 -0.482 0.244吉林-1.125 -0.727 -0.529 -0.072 -0.340 -0.231 -0.622 -0.922 -0.528 -0.178 -0.372 -0.667 黑龙江-0.597 -1.798 -0.842 -0.107 -0.746 0.023 -0.802 -0.943 -0.992 -1.675 0.504 -0.708 上海-0.511 -0.509 2.941 2.901 3.205 3.365 2.762 2.873 -1.552 1.599 0.200 1.968 江苏-0.211 -0.440 0.937 1.035 0.484 0.963 0.317 1.157 -0.553 -0.459 0.400 0.738 浙江-0.561 -1.163 1.952 1.904 1.651 2.361 0.590 2.702 -1.065 -0.739 -0.274 1.035 安徽0.497 0.037 -0.489 -0.406 -0.416 -0.332 -0.339 -0.176 -0.504 -0.365 -0.253 -0.928 福建0.410 0.378 0.757 0.505 0.676 0.541 -0.357 1.352 -0.480 1.973 0.005 0.060 江西0.653 0.860 -0.520 -0.180 -0.711 -0.316 -0.939 0.546 0.690 1.412 -0.033 -1.027 山东-1.213 -0.972 0.342 0.252 0.128 0.171 -0.277 0.116 -0.699 1.693 -0.698 0.008 河南-0.927 -0.934 -0.429 -0.291 -0.667 -0.484 -0.488 -0.006 0.349 -0.272 -0.680 -0.496 湖北0.766 0.455 -0.448 -0.198 -0.433 -0.098 -0.729 0.686 -0.407 0.196 -0.165 -0.644 湖南0.247 1.158 -0.281 -0.264 -0.261 -0.002 -0.522 0.844 -0.041 -0.552 -0.091 -0.916 广东-0.248 0.808 1.201 0.598 1.786 0.674 0.550 -0.363 0.398 1.506 -0.140 0.494 广西0.823 1.521 -0.199 -0.640 -0.378 -0.521 -0.445 0.000 0.739 1.693 0.217 -0.825 海南 1.405 1.506 -0.585 -0.320 -0.458 -0.586 -0.801 -0.838 1.227 0.664 0.006 -0.912 重庆0.181 1.501 -0.144 -0.441 0.180 -0.585 -0.229 0.309 -0.894 0.851 -0.568 -0.736 四川 1.182 1.296 -0.578 -0.443 -0.359 -0.431 -0.454 0.300 -0.528 0.103 -0.651 -0.873 贵州0.981 1.241 -0.798 -1.048 -0.846 -1.040 -0.542 -0.609 0.861 -0.926 -0.619 -0.683 云南 1.901 0.900 -0.424 -0.908 -0.580 -0.518 -0.621 -0.405 0.934 -0.739 -0.467 -0.661 西藏 2.859 1.361 -0.616 -0.875 -0.856 -1.019 1.815 -0.731 3.298 0.851 1.695 -1.363 陕西-0.499 -1.072 -0.522 -0.893 -0.325 -0.525 -0.366 -0.258 -0.138 -0.552 -0.712 -0.626 甘肃-0.124 0.506 -0.995 -1.081 -0.861 -0.891 -0.582 -1.117 0.861 -0.552 -0.185 -0.190 青海0.375 -0.314 -0.827 -0.927 -0.904 -0.577 0.177 -1.125 1.032 -1.301 0.160 1.732 宁夏-0.874 -0.392 -0.504 -0.644 -0.403 -0.452 0.171 -0.817 0.788 -0.833 1.459 2.649 新疆-0.354 -0.236 -0.879 -0.725 -0.729 -0.707 -0.459 -0.843 0.690 0.103 4.320 -0.396表2 说明的总方差从相关矩阵表中可得出各公共因子与原始各个指标的相关系数R(表3) 。
其中公共因子1与3x、4x、5x、6x、7x和8x的相关系数大,主要反映居民的基本生活情况;公共因子2 与1x、2x、10x相关系数大;公共因子3 与11x相关系数大,主要反映居民的生活负担情况。