根据全局主成分分析法的

合集下载

主成分分析法的具体实施方法

主成分分析法的具体实施方法

主成分分析法1主成分分析法的含义及基本思想主成分分析法是利用降维的思想,通过线性组合把原来众多指标转化为少数几个互相无关的指标,而保持原指标大量信息的一种多元统计分析方法。

主成分分析即Principal Component Analysis(简称PCA),是由卡尔(Karl)和皮尔逊(Pearson)最早在1901年提出,只不过当时是应用于非随机变量,1933年霍蒂林(Hotelling)将这个概念推广到随机向量。

主成分分析法是将多个变量化为少数变量的一种多元分析方法,在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。

主成分分析法正是适应这一要求产生的。

主成分分析是一种数学变换的方法。

它把给定的一组变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。

在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。

依次类推,P 个变量就有P 个主成分。

简言之,主成分分析的基本原理就是主成分F 为各原始变量X 的线性组合,各主成分彼此不相关,且使方差达到顺序最大、次大……。

2 主成分分析法的数学模型设有n 个样品,每个样品观测p 项指标(变量):p X X X ,,21,得到原始数据资料库:),,(21212222111211p np n n p p X X X x x x x x x x x x X ∆=⎪⎪⎪⎪⎪⎭⎫⎝⎛=用数据矩阵X 的p 个向量(即p 个指标向量)p X X X ,,21作线性组合(即综合指标向量)为:p pi i i i X a X a X a F +++= 2211 p i ,,2,1 =上述方程组要求:p i a a a pi i i ,,2,1122221 ==+++ 且系数由下列原则决定:(1)i F 与j F (p j i j i ,2,1,,=≠)不相关;(2)1F 是p X X X ,,21的一切线性组合(系数满足上述方程)中方差最大的,2F 是与1F 不相关的p X X X ,,21的一切线性组合中方差最大的,…,p F 是与1F ,2F ,…1-p F 不相关的p X X X ,,21的一切线性组合中方差最大的。

主成分分析( principal components analysis,PCA )

主成分分析( principal components analysis,PCA )

主成分分析的主要作用
3.多维数据的一种图形表示方法。 我们知道当维数大于3时便不能画出几何图形,多元统 计研究的问题大都多于3个变量。要把研究的问题用图形 表示出来是不可能的。然而,经过主成分分析后,我们可 以选取前两个主成分或其中某两个主成分,根据主成分的 得分,画出n个样品在二维平面上的分布况,由图形可直 观地看出各样品在主分量中的地位,进而还可以对样本进 行分类处理,可以由图形发现远离大多数样本点的离群点。 4.由主成分分析法构造回归模型。即把各主成分作为 新自变量代替原来自变量x做回归分析。
主成分分析( PRINCIPAL COMPONENTS ANALYSIS,PCA )
主成分分析介绍 基本思想 基本原理 作用 计算 主成分个数选取原则 例题 SPSS操作

主成分分析介绍

在统计学中,主成分分析(principal components analysis, PCA)是一种简化数据集的技术。它是一个线 性变换。这个变换把数据变换到一个新的坐标系统中, 使得任何数据投影的第一大方差在第一个坐标(称为第 一主成分)上,第二大方差在第二个坐标(第二主成分)上, 依次类推。主成分分析经常用减少数据集的维数,同时 保持数据集的对方差贡献最大的特征。这是通过保留低 阶主成分,忽略高阶主成分做到的。这样低阶成分往往 能够保留住数据的最重要方面。但是,这也不是一定的, 要视具体应用而定。
x3

例题
1. 求样本均值和样本协方差矩阵
46.67 S 17.12 21.11 30.00 32.58 55.53 2. 求解协方差矩阵的特征方程 S I 0
46.67 17.12 30.00 17.12 30.00 21.11 32.பைடு நூலகம்8 0 32.58 55.53

主成分分析法

主成分分析法

四、主成份分析法旳环节
1)数据归一化处理:数据原则化(Z) 2)Βιβλιοθήκη 算有关系数矩阵R: 3)计算特征值;
特征值越大阐明主要程度越大。
4)计算主成份贡献率及方差旳合计贡献率; 5)计算主成份载荷与特征向量:
主成份旳负荷值大小反应了主成份因子对可测变量旳影响程 度;载荷值越大阐明此变量对主成份旳解释越多,及贡献越大。
• 因子分析 优点:第一它不是对原有变量旳取舍,而是根据原始变 量旳信息进行重新组合,找出影响变量旳共同因子,化简 数据;第二,它经过旋转使得因子变量更具有可解释性, 命名清楚性高。 缺陷 :在计算因子得分时,采用旳是最小二乘法,此法 有时可能会失效。
总之,主成份分析是因子分析旳一种特例。
谢 谢 观 看!
旋转后旳主成份因子载荷矩阵
景区满意度旋转前后成份矩阵图对比
5、碎石图分析
选用主成份旳个数,急转处是拟定主成份旳个数处。
景区满意度碎石图
八、与因子分析法旳区别
1、基本概念
➢ 主成份分析就是将多项指标转化为少数几项综合 指标,用综合指标来解释多变量旳方差- 协方差构 造。综合指标即为主成份。所得出旳少数几种主 成份,要尽量多地保存原始变量旳信息,且彼此 不有关。
注意:进行主成份旳变量之间必须要有有关性, 经过分析后变量之间独立。
二、主成份分析法基本原理
主成份分析就是设法将原来众多具有一定有关性 旳变量(如p个变量),重新组合成一组新旳相互无 关旳综合变量来替代原来变量。怎么处理?
一般数学上旳处理就是将原来p个变量作线性组合 作为新旳综合变量。怎样选择?
假如将选用旳第一种线性组合即第一种综合变量 记为F1,自然希望F1尽量多旳反应原来变量旳信 息。怎样反应?

主成分分析

主成分分析

主成分分析法主成分分析是多元统计分析的一个分支。

20世纪30年代,由于费希尔、霍特林、许宝禄及罗伊等人的一系列奠基工作,多元统计分析成为应用数学的一个重要分支。

主成分分析法是处理多元变量数据的一种数学方法,它从众多的观测变量中找出几个相互独立的因素来解释原有的变量,这些因素称为主成分。

通过主成分分析法的数学处理,可以将互相间有联系的多变量复杂系统简化成几个可以解释这些变量的综合因素,这样可以清楚的解释系统的本质及相互间的关系。

抽取抽取综合因素及如何定义要按综合因素与原变量的关系而定,即按综合和因素对变量的影响程度,称为变量在综合因素上的“负荷”。

最终还可以计算出受测样本在综合因素上的水平,称为主成分分析。

主成分分析发广泛应用于复杂系统的相互比较研究中。

设一个系统共有P个指标表示,而且这P个指标中可能有些指标互相有影响。

主成分分析法就是要用几个综合因素反映原来几个指标的信息,而且这些因素又是相互无关的。

一基本原理现实生活中,人们常常遇到多指标问题。

在大多数情况下,不同指标之间具有一定的相关性,这就增加了分析处理问题的难度。

于是统计学家们就设法将指标重新组合成一组相互独立的少数几个综合指标来代替原有指标,并且反映原有指标的主要信息。

这种将多指标化为少数独立的综合指标的方法就称为主成分分析法。

主成分分析(Principal Component Analysis,PCA),首先是由英国的皮尔生(Karl Pearosn)对非随机变量引入的,而后美国的数理统计学家霍特林在1933年将此法推广到随即向量的情形。

主成分分析法的降维思想从一开始就很好的为综合评价提供了有力的理论和技术支持。

主成分分析是研究如何将多指标问题转化为较少的综合指标的一种重要统计方法,它能将高维空间的问题转化到低维空间去处理,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。

主成分分析除了降低多变量数据系统的维度外,同时还简化了变量系统的统计数字特征。

主成分分析公式 主成分分析法实例

主成分分析公式 主成分分析法实例

主成分分析公式主成分分析法实例【转】主成分分析法概述、案例实例分析主成分分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。

在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。

这些涉及的因素一般称为指标,在多元统计分析中也称为变量。

因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。

在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。

主成分分析正是适应这一要求产生的,是解决这类题的理想工具。

主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。

在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。

依次类推,I个变量就有I个主成分。

这种方法避免了在综合评分等方法中权重确定的主观性和随意性,评价结果比较符合实际情况;同时,主成份分量表现为原变量的线性组合,如果最后综合指标包括所有分量,则可以得到精确的结果,百分之百地保留原变量提供的变差信息,即使舍弃若干分量,也可以保证将85,以上的变差信息体现在综合评分中,使评价结果真实可靠。

是在实际中应用得比较广的一种方法。

由于其第一主成份(因子)在所有的主成分中包含信息量最大,很多学者在研究综合评价问题时常采用第一主成分来比较不同实体间的差别。

综上所述,该方法的优点主要体现在两个方面:1.权重确定的客观性;2.评价结果真实可靠。

1(主成分分析的基本原理主成分分析:把原来多个变量划为少数几个综合指标的一种统计分析方法,是一种降维处理技术。

)记原来的变量指标为x1,x2,…,xP,它们的综合指标——新变量指标为z1,z2,…,zm(mp),则z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第一,第二,…,第m主成分,在实际问题的分析中,常挑选前几个最大的主成分。

主成分分析法总结

主成分分析法总结

主成分分析法总结在实际问题研究中,多变量问题是经常会遇到的。

变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。

因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?一、概述在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。

而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。

为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。

为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。

主成分分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。

主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点:↓主成分个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。

↓主成分能够反映原有变量的绝大部分信息因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。

↓主成分之间应该互不相关通过主成分分析得出的新的综合指标(主成分)之间互不相关,因子参与数据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题。

↓主成分具有命名解释性总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。

主成分分析PCA

主成分分析PCA
• 两个向量方向,u1和u2,哪个向量可以更好的 代表原始数据集?
基本思想
• 人们在对某一事物进行实证研究中,为了更全面、 准确地反映出事物的特征及其发展规律,通常 会考虑尽可能多的指标,以避免遗漏重要的信 息
• 但过多的指标,会给研究带来一定困难,并且 众多的指标之间可能存在一定的相关性,这样 就造成了信息的重叠,给研究结果带来影响
基于主成分分析法的洞庭湖水质评价
• 根据主成分分析法中主成分个数选取原则,从 表3 可见特征值λ>1 时有 3 个成分
• 图 2 分析特征根衰减的突变,可以确定应提取 3 个主成分
基于主成分分析法的洞庭湖水质评价
初始因子荷载矩阵计算,计算结果见 表4。从表4 中可知,铜、六价铬和 砷在第一主成分上荷载较大,说明第 一主成分基本反映了这些指标的信息 。从湖区实际污染来源看湖区水质受 工业废水污染最为严重。
表1 地区土地生态安全评价相关关系矩阵
运用实例
3、由相关系数矩阵计算特征值,以及各 个主成分的贡献率与累计贡献率。
由右表可知,前3项贡献率依次为 60.907%、12.963%、11.335%,其累计 贡献率85.205%,大于85%,表示前3项 主成分具有较高的可信度,能够基本涵 盖全部数据的信息,故将前三项作为主 成分分析因子
总结
地下水质量评价是一个复杂多变的系统,不能只简单依靠单一指标来确定污染程度。本文采用的主成 分分析法就是根据水质的污染情况,着重把地下水主要污染物进行类别分析,客观科学的确定权数。 主成分分析方法注重遵循原始数据, 尽量减少原始数据的损失, 实际客观的确定权数, 消除了指标选 择时因人为而造成的差异, 该评价方法科学严谨、体系完整, 有较高的可靠性 此次评价选择的 16 个评价指标存在一定的关联性,该方法的水环境质量分级标准还有待提高完善,导 致计算所得的综合主成分分值表现出的只是地下水质量的一种相对关系。

主成分分析确定权重方法

主成分分析确定权重方法

主成分分析确定权重方法主成分分析是一种常用的多元数据降维技术,它的基本思想是通过线性变换将原始数据转换为新的变量,使得这些变量间相互独立且包含原始数据的绝大部分信息。

在实际分析过程中,主成分分析需要对原始数据进行权重确定,以确保转换后的变量能够更好地反映原始数据的特征。

确定权重的方法有很多种,下面将介绍几种常用的方法。

1.方差最大化法方差最大化法是最常用的确定权重的方法之一、根据主成分分析的目标,我们希望新变量间的协方差尽可能地小,即新变量互相独立。

通过最大化新变量的方差,可以使新变量间的协方差最小。

权重的确定可以通过最大化新变量的方差来实现。

2.主成分负荷矩阵法主成分负荷矩阵法是另一种常用的确定权重的方法。

主成分分析的目标是将原始数据转换为相互独立的新变量,而这些新变量的线性组合就是主成分。

主成分负荷矩阵表示各个原始变量在主成分中的权重。

具体来说,主成分负荷矩阵的每一列代表一个主成分,矩阵的每个元素表示原始变量在相应主成分中的权重。

主成分分析的过程就是通过线性变换将原始变量转换为主成分,而这个变换的权重就是主成分负荷矩阵中的元素。

通过计算协方差矩阵的特征值和特征向量,可以得到主成分负荷矩阵。

3.最小平方负荷矩阵法最小平方负荷矩阵法是一种通过最小化原始变量和主成分之间的残差平方和来确定权重的方法。

这个方法可以使得主成分能够最好地拟合原始数据。

具体来说,最小平方负荷矩阵法通过最小化残差平方和的方式确定权重。

首先,通过特征值分解计算出主成分负荷矩阵。

然后,对于每个原始变量,通过线性变换计算出对应的主成分。

最后,计算原始变量和主成分之间的残差平方和,并通过最小化这个平方和来确定权重。

4.最大似然估计法最大似然估计法是一种统计方法,它通过最大化样本的似然函数来确定权重。

在主成分分析中,最大似然估计法可以用于确定主成分负荷矩阵的权重。

具体来说,最大似然估计法首先假设原始数据是来自多元正态分布。

然后,通过最大化样本的似然函数,确定主成分负荷矩阵的权重。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

,. 基于全局主成分分析法的

一、引 言 商贸流通业是国民经济的重要支柱,是区域竞争力的重要力量,已成为衡量一个国家或地区经济发展水平的重要因素[1]。作为引领经济发展的基础性产业和先导产业,充分发挥其在扩大消费、引导投资、促进生产的核心作用,对于长江上游地区在长江经济带、一带一路、西部大开发等国家战略实施的背景下实现跨越式发展具有重要战略意义。因此,研究长江上游地区商贸流通业发展情况极具现实价值。 目前国内学者在评价区域商贸流通业发展质效方面,多是从竞争力视角构建指标体系,如宋则[2](2003)、宗颖[3](2009)、王娟[4](2014)等,从评价方法选择上,多采取线性加权法,其区别在于权重的确定方法,包括主成分分析法、因子分析法、层次分析法和德尔菲法,如岳牡娟与孙敬水[5](2011)、刘根荣与付煜[6](2011)、曾艳[7](2014)、贺爱忠、杜静、唐宇[8](2013)等等。《中国城市流通竞争力报告(2013~2014)》指出,对商贸流通业发展水平的综合评价应包括商贸流通业发展水平和发展能力两个维度[9]。现有文献对于商贸流通业发展评价分析主要针对发展水平,较少涉及发展能力的考察;研究方法多基于某一地区某一时,. 刻的静态截面数据,难以对区域商贸流通产业发展的长期表现和动态趋势做出准确评价。基于此,本文拟采取全局主成分分析的统计方法,建立区域商贸流通业评价指标体系,采用长江上游地区2005~2013年商贸流通业的动态面板数据测算其发展水平,重点分析地区差异和动态演进趋势,并针对性提出推进各地区商贸流通业发展的政策建议。 二、区域商贸流通业综合评价指标体系构建 1.研究对象 本文研究选取样本省市主要包括长江上游地区经济腹地的重庆、四川、贵州、云南、西藏、青海6省市。商贸流通业主要包括批发零售贸易业、住宿餐饮业和交通运输、仓储及邮电业。考虑资料的准确性和可靠性,本文选取的统计指标原始数据均来源于2006~2014年中国统计年鉴及各地区统计年鉴和国民经济及社会发展统计公报。 2.综合评价指标体系构建 结合长江上游地区商贸流通业发展特点,根据现有相关研究和评价体系指标设计情况,本文从商贸流通业发展水平和发展能力两个维度构建综合评价指标体系。具体而言,从商贸流通规模、商贸流通密度、商贸流通设施、商贸流通效率4个视角考查商贸流通业发展水平,从商贸流通贡献率和商贸流通辐射力两个视角考查商贸流通业发展能力。15个具体指标见表1。 ,. 上述综合评价指标体系中的部分指标需要通过计算得出,现对指标的含义及计算予以说明: (1)社会消费品零售总额(X1)、商贸流通业增加值(X2)、商贸流通业从业人员(X3)、商贸流通业固定资产投资(X4)、货运总量(X5)。这5项指标反映了商贸流通业的发展规模,其中,社会消费品零售总额、商贸流通业增加值、货运总量反映了商贸流通业的产出规模,商贸流通业从业人员、商贸流通业固定资产投资反映了商贸流通业的投入规模。 (2)社会消费品零售总额人均密度(X6)、商贸流通业增加值人均密度(X7)、商贸流通业从业人员人均密度(X8)。这3项指标反映了商贸流通业的服务能力和服务强度,表明了商贸流通资源的人均占有量,数值越大,服务能力越强。各项人均密度指标用万人占有量表示。 (3)商贸流通法人企业数(X9)、运输车辆保有量(X10)。这两项指标反映了商贸流通设施情况。商贸流通法人企业主要指从事批发、零售、住宿、餐饮行业的限额以上法人企业,反映了商业网点的发展情况;运输车辆保有量反映了物流设施发展情况。 (4)商贸流通从业人员人均商贸流通增加值(X11)。该指标反映了商贸流通业的投入产出关系,从对经济直接贡献的角度反映了商贸流通业从业人员的效率,体现了商贸流通业运行效率情况。 ,. (5)商贸流通业对经济贡献率(X12)、商贸流通业对经济拉动率(X13)、商贸流通先导程度(X14)。这3项指标反映了商贸流通的贡献力,体现了商贸流通业对经济发展的贡献。其中,商贸流通业对经济贡献率是指商贸流通业产值占地区经济总量的比重,是反映商贸流通业对经济发展贡献最直观的指标;商贸流通业对经济拉动率是指地区生产总值增长速度与商贸流通业对经济贡献率的乘积,反映了商贸流通业对经济增长的拉动作用;商贸流通先导程度是指社会消费品零售总额增速与地区生产总值增速的差,反映了社会消费品零售总额增长比地区生产总值增长的先导程度。 (6)货源辐射力(X15)。该指标反映了商贸流通产业的辐射能力,体现了一个地区对其他地区商品参与本地商贸流通体系的吸引力以及本地商品对其他地区的辐射力。基于数据的可得性,选取进出口总额衡量货源辐射力,进出口商品的能力越强,表明产业集聚和发散货物的能力越强,商贸流通业的辐射力就越强。 三、全局主成分分析法 经典主成分分析只针对由样本和指标构成的平面数据表,并未加入时间序列。如果对每张平面数据表进行经典的主成分分析,由于不同数据表具有不同主平面,无法对同一样本不同时点的评价结果进行对比。为了保证系统分析统一性、整体性与可比性,需将不同时点平面数据表整合成统一,. 的立体时序数据表,然后用经典主成分方法进行分析。加入时间序列的主成分分析即为全局主成分分析,其数学表达如下: 设 K 是一组按时序排列的平面数据表 X 序列,所有的数据表具有完全同名的样本点和完全同名的变量指标,即有K={ Xt∈Rn×m,t=1,2,…,T },其中 Xt(t=1,2,…,T)均以e1, e2,…, en为样本点,以 x1,x2,…,xm 为变量指标。若以 x1,x2,...,xp 为变量指标,在 t 时刻数据表 Xt 中,样本点 e1,e2,…,en的取值分别为t 时刻的样本群点,N=UN t为全局样本群点,以N为样本群点的主成分分析即为全局主成分分析[10]。 按照上述思路,本文将建立立体时序数据表,采用15个指标对长江上游地区6省市9年的商贸流通发展情况进行比较分析,每一年度有一张6×15 的单年份数据表,将单年份数据表按时间先后顺排列得到6×15×9的立体时序数据表;进行经典主成分分析,对标准化的数据矩阵建立协方差矩阵,求特征值、主成分贡献率和累计方差贡献率,提取全局主成分;通过回归方法计算各全局主成分得分,并以各全局主成分贡献率为权重,加权计算得出商贸流通业发展综合得分。将各年度的截面数据矩阵按时间顺序排放得到立体时序数据表,选取15个指标基于2005~2013年9年的相关数据对长江上游地区6个省市的商贸流通业发展情况进行分析,设Xt(6×15),,. t=1,2,3,4,5,6,7,8,9分别表示2005~2013年度长江上游地区6省市的15个综合评价指标组成的数据矩阵,形成K={X1,X2,X3,X4,X5,X6,X7,X8,X9}的立体时序表。 四、实证分析 1.数据处理及分析 运用统计软件 SPSS 中的 Factor 过程对长江上游地区商贸流通业发展综合评价时序立体数据表中各变量的相关系数矩阵进行分析。采用方差最大正交旋转法,以使因子载荷值尽量向 0和1两极偏离,便于信息的提取和对主成分命名;经 6次迭代后,结果趋于收敛。如表2,根据特征值大于 1 的原则提取4个全局主成分,其方差贡献率分别为56.480%、17.051%、12.803%、7.892%,方差累积贡献率为94.226%,提取的4个全局主成分已足够替代原来的变量,几乎涵盖了原变量的全部信息,具有较强的解释性。 如表3,全局主成分F1对社会消费品零售总额、商贸流通业增加值、商贸流通业从业人员、商贸流通业固定资产投资、货运总量、商贸流通法人企业数、运输车辆保有量、货源辐射力8个指标具有较强的解释力,反映了商贸流通业的投入产出情况及商业设施和辐射能力,将其命名为商贸流通规模主成分;全局主成分F2对社会消费品零售总额人均密度、商贸流通业增加值人均密度、商贸流通业从业人员人均,. 密度3个指标具有较强的解释力,反映了商贸流通业的密度配置情况,将其命名为商贸流通密度主成分;全局主成分F3对商贸流通业对经济贡献率、商贸流通业对经济拉动率、商贸流通从业人员人均商贸流通增加值3个指标具有较强的解释力,反映了商贸流通业的效率和对经济发展的贡献情况,将其命名为商贸流通贡献主成分;F4对商贸流通先导程度指标具有较强的解释力,反映了商贸流通业先导性,将其命名为商贸流通先导主成分。各全局主成分构成见表4。 4个主成分分别代表了商贸流通业发展不同方面,保留了原始指标大部分信息,因此可以以4个主成分的特征值之和来代表它们表达的总信息量, 以其特征值(方差)占总特征值(总方差)的百分比为权重,将商贸流通业4个主成分的得分进行加权汇总;其计算公式为: (5) 根据公式(2)~公式(5)可计算长江上游地区6省市的商贸流通发展商贸流通业发展不同方面即细分指标得分,得分越高表明商贸流通业该方面发展水平越高,反之则越低。 2.长江上游地区各省市商贸流通业发展综合评价 依据公式(1)计算各省市综合得分,如表6和图1。在2005~2013年期间,各省市商贸流通业发展整体水平均不断提高,特别是四川、重庆、云南、贵州,上升趋势明显。从得分情况看,2005年仅有四川省综合得分为正值,至2013

相关文档
最新文档