主成分-论文

合集下载

Fisher 判别法及 主成分分析法 论文

Fisher 判别法及 主成分分析法 论文

地沟油的识别问题摘要本文要解决的问题是根据所给的油的成分,判断该油属于地沟油还是优质油,以及在保证一定的准确率的条件下,用最少的化验指标来判断该油的类别。

问题一模型的建立,通过fisher 算法,依次计算出了地沟油、优质油的样本均值,类内离散度矩阵和类间离散度矩阵,根据类间离散度矩阵与类内离散度矩阵的比值最大,求得最佳投影矩阵。

利用样本数据与最佳投影矩阵的乘积与阈值进行比较,得出判定油类别的判别式。

问题二根据第一问题中所建立的模型,通过matlab编写程序,与阈值进行比较后,得出最后的16组测试数据,前8组属于优质油,后8组属于地沟油。

问题三即需要减少化验指标。

因为影响油的类别的因素十分复杂,该题中给了7种判别油类别的成分,我们需要用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息。

本题中我们采用了主成份分析法,依次求解出相关系数矩阵、特征值、特征向量、贡献率和累计贡献率,最后通过对综合比重数据的分析,得出将第4种成分、第6种成分和第7种成分作为化验指标比较合理。

模型建立合理,结构清晰,逻辑性强,能够反映实际问题。

本文要解决的问题是根据所给的油的成分,判断该油属于地沟油还是优质油,以及在保证一定的准确率的条件下,用最少的化验指标来判断该油的类别。

关键字:fisher算法、主成分分析、地沟油、优质油一、问题重述1.1问题背景近年来,我国许多地方都存在一个令人发指的问题——“地沟油”问题,这个问题可以说已经成为一个公开的“秘密”。

有些人长期以倒卖“地沟油”为生,他们把这些地沟油经过化学处理后装入成品油流入餐桌,这些地沟油入餐桌严重威胁到我国公众的生命健康。

“地沟油”事件频频发生,已震惊全国,其涉及范围之广,生产规模之大,出乎人们的想象。

虽然我国有关部门经过严厉打击,但“地沟油”事件依然阴魂不散,据专家统计每年返回餐桌的地沟油达百万吨级。

在利益的驱使下,“地沟油”制售从小作坊升级到大工厂,产业分工细化为掏捞、粗炼、倒卖、深加工、批发、零售等多个环节,“地沟油”生意不但打不死,甚至越做越大。

SPSS主成分法在环境保护中应用论文

SPSS主成分法在环境保护中应用论文

浅谈SPSS主成分分析法在环境保护中的应用【摘要】本文在介绍主成成分分析方法的原理基础上,利用spss统计软件对徐州市1996年至2000年工业固体废物产生量进行主成分分析,建立主成分分析模型,得出主成分评价值,进行实例分析。

【关键词】spss;主成分分析法;工业固体废物产生量分析近年来附着经济的快速发展,徐州市的工业固体废物的产生种类及产生量都在不断发生变化,笔者借助 spss 软件的主成分分析功能 , 对1996年至2000年工业固体废物产生量变化进行分析对比 , 找出其中的主要影响指标,为徐州市的工业固体废物污染防治提供决策指导。

1.主成分分析基本原理主成分分析是一种数学变换的方法,它把给定的一组(比如k 个)相关变量通过线性变换转换成另外一组不相关的变量,这些新的变量按照方差依次递减的顺序排列,在数学变换中保持变量的总方差不变。

第一个变量具有最大的方差,称为第一主成分,第二个变量的方差次大,并且和第二个变量不相关,称为第二主成分,依次类推,k个变量就有k个主成分,最后一个主成分具有的方差最小,并且和前面的主成分都不相关[1]。

spss(statistical package forsocial science) 统计分析软件是由美国 spss 公司自 20 世纪 80 年代初开发的大型统计学软件包,具有主成分分析功能。

因此本文不再讨论相关的数学计算公式,本文所有操作均是在windows xp环境下使用spss 10.0版本完成的。

2.利用spss对徐州市工业固体废物产生量进行主成分分析本文采用的数据来自1996至2000年徐州统计年鉴和环境统计综合年报,主要指标gdp(万元)、工业固体废物产生量,有危险废物、冶炼废渣、粉煤灰、炉渣、煤矸石、尾矿(万吨)8个指标进行主成成分分析:2.1原始数据录入(图1)图1 原始数据录入2.2“因子分析”对话框参数设置从主菜单的“analyze→data reduction→factor”弹出factor analysis 对话框完成各项指标设置。

主成分分析 毕业论文

主成分分析 毕业论文

主成分分析毕业论文主成分分析(Principal Component Analysis,简称PCA)是一种常用的多变量数据分析方法,广泛应用于统计学、机器学习、图像处理等领域。

它的主要目的是通过线性变换将原始数据转换为一组新的变量,这些新变量被称为主成分,它们能够最大程度地保留原始数据的信息。

PCA的基本思想是通过寻找数据中的主要方向,将高维数据降维到低维空间中。

在降维的过程中,PCA会按照数据中的方差大小对各个方向进行排序,将方差较大的方向作为主要方向。

这样做的好处是可以减少数据的维度,提高计算效率,同时保留了数据的主要特征。

PCA的数学原理比较复杂,但是在实际应用中,我们只需要掌握它的基本步骤和使用方法即可。

下面我将简要介绍一下PCA的具体步骤。

首先,我们需要对原始数据进行标准化处理,使得各个变量具有相同的尺度。

这是因为PCA是基于协方差矩阵进行计算的,如果各个变量的尺度不一致,会影响到计算结果的准确性。

接下来,我们需要计算协方差矩阵。

协方差矩阵反映了各个变量之间的相关性。

通过计算协方差矩阵,我们可以得到各个变量之间的相关性大小,从而确定主要方向。

然后,我们需要对协方差矩阵进行特征值分解。

特征值分解可以将协方差矩阵分解为特征值和特征向量。

特征值表示了各个主成分的方差大小,特征向量表示了各个主成分的方向。

接下来,我们将特征值按照大小进行排序,选择前k个特征值对应的特征向量作为主成分。

这样就得到了一组新的变量,它们是原始数据在主要方向上的投影。

最后,我们可以利用主成分对原始数据进行降维。

降维的过程就是将原始数据用主成分表示,可以将高维数据转换为低维数据,提取出数据的主要特征。

PCA在实际应用中有很多优点。

首先,它能够减少数据的维度,提高计算效率。

其次,它能够提取出数据的主要特征,降低了数据的噪声和冗余信息。

此外,PCA还可以用于数据的可视化,将高维数据转换为二维或三维空间,方便我们对数据进行观察和分析。

主成分分析经济发展论文.doc

主成分分析经济发展论文.doc

主成分分析经济发展论文1数据分析过程1.1主成分的选择利用SPSS20.0对数据进行处理,首先对数据做标准化处理,计算相关系数矩阵,计算特征根和特征向量,方差贡献率,见表2。

一般取累计贡献率达到80%以上少数几个主成分就可以代表原来多个指标的绝大部分信息,由表2可见,取第一,第二个主成分的累计贡献率即可达到92%,且重庆库区的区县有很大一部分农业产业,所以选取代表农林牧渔产业总值的第二主成分也作为分析的目标,第一、第二主成分与其他成分之间的相关系数如表3。

由表3可知,第一主成分与财政收入(x1)、地区生产总值(x2)、工业生产总值(x3)、全社会固定资产投资(x5)、人均GDP(x6)、人均第三产业总值(x7)、社会消费品零售总额(x8)有很大的正相关,与农林渔牧产值(x4)呈负相关,而第二主成分与农林渔牧产值(x4)有显著的正相关性,达到0.97,与其他指标相关性较弱或呈负相关。

对于第一主成分z1,除了x4(农林渔牧产值)以外,其他的指标的系数都在0.35左右,而这几个指标包括了财政收入、地区生产总值、工业总产值等7个指标,这7个指标都是经济发展中的代表性指标,包括了第二产业和第三产业的综合水平、政府财政收入和人们消费能力和财富水平等。

所以第一主成分代表了一个地区的经济发展综合水平;第二主成分与x4的系数高达0.84,远远高于其他指标的系数,而与x7(人均第三产业总值)的系数也为0.36,也具有较高的相关性,而农林渔牧则代表了第一产业的发展综合情况,农林牧渔业广义包括了除第一产业的传统种植行业以及饲养业、林业之外,也包含了农用机械、农业服务、新型农业发展、农副产品加工等新型农业与第二和第三产业的结合,所以,第二主成分代表了以第一产业为主的农业及其新型第三产业。

根据以上两个主成分的线性组合以及标准化后的原始数据,可以得到两个主成分的得分,如表4。

在表4中,第一主成分得分最高的是渝北区,达到了5.49左右,第二是江北区,有4.02分,都远远高于其他城市,然后是南岸区、涪陵、万州等区县,经济发展的综合水平都比较高,得分最低的是巫溪县,只有-2.55分;第二主成分中得分最高的是江津区,其得分达到了2.21分,第二的是万州区,表明这两座城市的农林牧渔业较发达。

关于主成分分析的常用改进方法论文

关于主成分分析的常用改进方法论文

关于主成分分析的常用改进方法论文1. 核主成分分析(Kernel PCA)核主成分分析通过使用核技巧将线性PCA扩展到非线性情况。

它通过将数据从原始空间映射到一个高维特征空间,然后在高维空间中进行PCA,从而实现非线性降维。

核PCA可以更好地处理非线性关系,但计算复杂度较高。

2. 稀疏主成分分析(Sparse PCA)稀疏主成分分析是一种改进的PCA方法,旨在产生稀疏的主成分。

传统PCA生成的主成分是线性组合的数据特征,而稀疏PCA将主成分的系数限制在一定范围内,产生稀疏的解。

这样可以更好地捕捉数据的稀疏结构,提高降维效果。

3. 增量主成分分析(Incremental PCA)增量主成分分析是一种改进的PCA方法,用于处理大型数据集。

传统PCA需要一次性计算所有数据的协方差矩阵,如果数据量很大,计算复杂度就会很高。

增量PCA通过将数据分批进行处理,逐步计算主成分,从而减轻计算负担。

这样可以在处理大型数据集时实现更高效的降维。

4. 自适应主成分分析(Adaptive PCA)自适应主成分分析是一种改进的PCA方法,旨在处理具有时变性质的数据。

传统PCA假设数据的统计特性不会发生变化,但在现实世界中,许多数据集的统计特性会随着时间的推移而变化。

自适应PCA可以自动适应数据的变化,并更新主成分以适应新的数据分布。

5. 鲁棒主成分分析(Robust PCA)鲁棒主成分分析是一种改进的PCA方法,用于处理包含离群点或噪声的数据。

传统PCA对离群点和噪声十分敏感,可能导致降维结果出现严重偏差。

鲁棒PCA通过引入鲁棒估计方法,可以更好地处理异常值和噪声,提高降维结果的鲁棒性。

以上是常见的几种PCA的改进方法,每种方法都有其适用的场景和优缺点。

研究人员可以根据实际需求选择适合的方法,以实现更好的降维效果。

基于多元t分布的概率主成分分析及其应用

基于多元t分布的概率主成分分析及其应用

东南大学硕士学位论文摘要主成分分析(PCA)是一种常用的降维技巧,在图像处理、模式识别以及数据挖掘中都有很广泛的应用。

但是,作为一种全局线性投影,经典的PCA用于实际中经常出现的非线性数据时不可能令人满意。

于是,近年来人们提出了各种各样的非线rIiPCA及混合PCA其中,特别重要的是由[39,40]提出的概率PCA(本文称为Gaussian—PPcH).在此学位论文中,我们将Gaussian—PPCA推广为基于多元t分布的概率PCA(下文称为t—PPCA),从而得到了一类无论在理论上还是在实际应用中均具有较大意义的通用数据阵维算法。

具体说来,我们的主要工作包含以下内容:·理论方面:假设数据来自m个d元t分布的混合;而每个混合成分均满足迷向(iso,tropic)因子分析模型见§3.21)。

在第三、四两章,我们用EM型算法导出了模型参数的极大似然估计。

在此基础上,我们得到了一类新的数据投影及其重构的算法,即,t-PPCA.当f分布的自由度∥=oo时,t-PPCA就是Gaussian.PPCA当m=1时,t-PPCA定义的数据投影的确来自某个矩阵S’的主成分分解(见§3.1);但只有在”=OO时,S’才退化为样本协方差矩阵S这说明经典主成分分析仅适用于来自正态分布的数据。

·应用方面:我们用多元t分布的有限混合作为数据模型,保证了t-PPCA的稳健性,从而Gaussian.PPCA更具实用价值。

这在第五章的应用研究中得到了充分的证明。

在§5.1的手写英文字母识别的实验中,结果表明t-PPCA的错误率大大小于使用Gaussian—PPCA的错误率(见表5.1)。

同时,我们发现数据投影对于某些分类是必须的。

这一现象有待于进一步的研究。

在§5.2的图像压缩实验中,我们的图象重构质量明显优于使用Gaussian.PPCA的图象重构质量(比较图5.2及图5.3)。

关于主成分分析的常用改进方法论文

关于主成分分析的常用改进方法论文

关于主成分分析的常用改进方法论文主成分分析(PCA)是一种常用的无监督学习方法,用于降低数据的维度并发现主要的特征。

然而,PCA也存在一些限制,例如容易受到离群值和噪声的影响,以及解释性能较弱。

为解决这些问题,研究者提出了许多改进的方法。

本文将介绍其中一些常用的改进方法。

首先,从特征选择的角度来说,可以使用稀疏主成分分析方法。

该方法通过增加L1正则项来鼓励主成分系数的稀疏性,从而进一步减少数据的维度。

这种方法能够有效地过滤掉噪声和无关特征,提高PCA的鲁棒性和解释性能。

其次,为了处理数据中的离群值,可以使用鲁棒主成分分析。

这种方法引入了一个鲁棒度测量来代替传统的方差来度量数据的离散程度。

通过最小化鲁棒度测量和数据投影的距离,鲁棒主成分分析可以有效地减少离群值的影响,提高PCA的稳定性。

此外,还可以使用核主成分分析方法来处理非线性数据。

核主成分分析通过将数据映射到一个高维的特征空间,利用核技巧来计算主成分分析的结果。

这种方法能够处理非线性关系,提高PCA的适应性。

在实际应用中,还可以考虑使用增量主成分分析。

该方法可以在新数据到达时更新主成分分析结果,而无需重新计算整个数据集。

这种方法在处理大规模数据时非常高效,并且可以实时地对数据进行主成分分析。

最后,为了提高PCA的解释性能,可以采用自适应主成分分析方法。

这种方法通过考虑数据的局部结构和邻域信息来计算主成分分析结果。

与传统的PCA相比,自适应主成分分析可以更好地捕捉数据的分布特征,并提高主成分分析的解释性能。

综上所述,主成分分析的常用改进方法包括稀疏主成分分析、鲁棒主成分分析、核主成分分析、增量主成分分析和自适应主成分分析等。

这些方法能够有效地处理PCA的局限性,并提高其在实际应用中的性能。

研究者们会继续不断地进行改进和优化,以进一步完善主成分分析方法的性能。

主成分分析论文

主成分分析论文

主成分分析论文简介主成分分析(Principal Component Analysis, PCA)是一种常用的数据分析和降维技术。

它是一种线性变换技术,通过寻找数据集中的主要分量来简化数据集。

主成分分析能够将高维度数据降维到低维度数据,并尽可能的保留原始数据的信息。

PCA的应用1.数据可视化:由于 PCA 能够将高维数据降至二维或三维空间,因此它能够帮助我们更好地理解数据集,并将其可视化展示。

2.数据压缩:PCA 通过降维的方式减少数据的冗余信息,并将其转化为更少的维度。

因此,PCA 可以作为数据压缩 techniq ,以减少数据集的存储和传输成本。

3.特征选取/提取:在机器学习中,选择最优的特征是一个非常重要的任务。

通过 PCA,我们可以将原始数据转化为一组新的、具有更好可表示性的特征,以提高模型的性能。

PCA的实现以下为 PCA 的实现步骤:1.数据预处理:去除均值,并进行归一化处理,使得每列数据的平均值为0。

2.计算数据的协方差矩阵:协方差矩阵反映了数据之间的相关程度。

3.特征值分解(Covariance Matrix Decomposition):通过计算协方差矩阵的特征值和特征向量,来找到数据的主要成分。

4.选取主要成分:将特征值从大到小排序,并选取最大的k个特征值(也就是说,将数据降至k维)。

这些特征值所对应的特征向量便是 PCA 的主要成分。

5.将原始数据映射至新的低维度空间:使用所选的k个特征向量,将原始数据映射至新的低维度空间。

新的数据集将由选取特征向量所构成的矩阵和原始数据集相乘所得到。

PCA与其他降维方法的比较PCA和t-SNE的比较1.PCA 是一种线性方法,它假设数据之间具有线性关系。

而 t-SNE 则是一种非线性方法,它适用于非线性数据的降维。

2.PCA 可以更高效的计算,不同于 t-SNE 需要迭代多次。

当数据集的维度较高时,PCA 的运行速度优势更加明显。

3.PCA 是一种无监督 learning algorithm,而 t-SNE 则是一种有监督或半监督的算法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、我国各省经济发展现状我国是一个幅员辽阔但资源稀缺、经济发展极不平衡的发展中大国,经过20多年的对外开放,中国的整体经济实力有了明显的增强,并取得了举世瞩目的成就,但是东、中、西部地区的差距并没有缩小,反而仍然在逐步拉大,伴随着一系列不平衡、不协调的问题,东部省份已形成自我积累,自我发展能力,外来资本、民间资本充足,从产业结构升级迅速,制造业、服务业和外贸已成为拉动经济增长的主要力量;西部经济增长主要靠基础建设拉动投资,国有资本仍占主要地位,外资、民间资本不足,制造业、服务业发展落后,投资效益不高。

因此,东西部之间的经济总量、发展速度、人均收入水平的差距仍在继续扩大。

东西部经济发展差距的不断扩大及由此引起的地区经济的非协调发展,已成为社会各方面普遍关注的焦点问题。

随着区域发展不平衡问题的突出。

广大中西部省份与东部省份在城乡居民收入、消费水平、市场化程度,特别是基础设施、义务教育、基本医疗、社会保障等基本公共服务水平方面的差距在拉大。

针对各地统计数据分析,近年来人均GDP相对差距确实在逐步缩小,但在公共服务方面的差距还在拉大。

在农业和工业方面,传统强省依旧发展速度很快,可是产业调整和技术引进却有很大的差距,金融业在我国刚起步,上海和北京发展较快但不成熟,在我国经济发展的过程中金融业的作用会越来越明显,因此我国各省的金融业还需要很长的路要走。

因为经济的发展不平衡,造成财政收入的巨大差异,进而再影响各个省份经济的发展,因此,我国经济在近几年取得了很大的成就,但我们面临的问题同样突出,这需要我们的共同努力来克服所面临的严峻问题。

二、省域经济竞争力的内涵和意义省域经济竞争力是一国(地区)经济总量和经济综合实力的体现。

本研究是在区域经济竞争力的基础上首次提出省域经济综合竞争力的概念,它大大丰富了区域经济竞争力的理论,同时也为区域经济研究开辟了一个新的研究领域。

它运用马克思主义政治经济学、西方经济学、和政治学、社会学等多学科理论,首次对中国省域经济竞争力进行理论论证,深刻阐明在社会主义市场经济条件下,特别是在社会主义初级阶段中研究、评价、提升省域经济竞争力的重要性和必要性,初步形成了比较系统的关于中国省域经济竞争力的理论体系。

研究省域经济竞争力的现实意义主要有如下几点:(一)提升省域经济竞争力是社会主义市场经济发展的应有之义。

随着社会主义市场经济体制的日益完善,市场竞争日趋激烈,任何区域的经济发展都面临着一个如何吸引大区域中资源和争夺大区域市场来加速本区域经济发展的问题。

(二)提升省域经济竞争力是一个地区在经济全球化大潮中立于不败之地的必然选择。

在新世纪,省域经济只有不断增强和提升自身的经济综合竞争力,才能有效的利用经济全球化的机遇,克服经济全球化的难题,分享全球化的收益,促进经济加速发展。

(三)提升省域经济竞争力是增强综合国力,实现“中国和平崛起”的迫切需要。

省域经济竞争力是国家综合国力的重要组成部分之一,没有省域经济竞争力的提升,就没有综合国力的增强。

(四)提升省域经济竞争力是牢固树立和落实科学发展观、坚持“五个统筹发展”的内在要求。

省域经济是全国经济中承上启下的一个关键层次,科学发展观所提出的各项要求,都必须体现和落实在省域经济综合竞争力的提升上。

(五)提升省域经济竞争力是为了更好地适应“又好又快”经济增长要求的重要路径。

各级政府只有加强对省域经济综合竞争力的把握和预见,才能对宏观经济、中观经济和微观经济做出合理的决策。

三、经济竞争力评价指标体系介绍(一)瑞士洛桑国际管理开发学院(IMD)的定义是,一国或一个企业在世界市场上较其竞争对手获得更多财富的能力,模型将区域竞争力分解为八个方面,包括企业管理,经济实力,科学技术,国民素质,政府作用,基础设施和金融环境,其核心是企业竞争力,关键是可持续性。

世界经济论坛(WEF)的定义是,一国能获得经济(以人均GDP衡量)持续高速增长的能力.M波特在其《国家竞争力》一书中提出了区域竞争力模型,波特认为国家经济竞争力是指该国产业创新和升级能力,即该国获得生产力高水平及持续提高生产力的能力,影响产业竞争力的四大要素是企业战略,企业组织,企业群体内竞争对手及该国内的市场需求,1998年波特有进一步指出,在国家层面上,“竞争力”的唯一意义就是国家生产力.“三力体系”之说,该研究认为,国家竞争力=核心竞争力+基础竞争力+环境竞争力。

核心竞争力是指生产增值的竞争力。

其中包含两个方面的内容:一是三次产业范围下的全部公司或企业竞争力,二是产业结构的竞争力。

核心竞争力的水平取决于其竞争资本的水平,也取决于其竞争过程水平。

基础竞争力是指支持核心国际竞争力的基础设施和国民素质竞争力的基础,环境国际竞争力也是国际竞争力的重要组成部分,包括市场竞争环境与政府提供的社会组织和结构的环境,竞争力是一个整体的竞争水平的系统提高。

樊纲(1998)认为侠义的竞争力是一国商品在国际市场上所处的地位,商品在市场上是否具有竞争力来源于同样质量的商品具有较便宜的价格,或者说同样质量的产品具有较低的成本。

竞争力包含着制度(包括管理等软件技术)进步,技术进步。

要素成本和比较优势等三个环节,上述区域竞争力主要是将国家作为一个区域来研究。

阳国新(1995)认为区域竞争力是指各经济区域所提供的商品在某一特定区域市场中占领的市场份额,主要强调地区培养比较优势和竞争优势。

国家统计局严于龙(1998)认为地区经济竞争力是一个地区国民经济在国内竞争中表现出的综合实力的强度,国内外贸易,金融,投资的地位,强调一个地区提供基础设施,所达到的科技水平,社会发展水平和经济发展状况。

南京大学长江三角洲经济社会发展研究中心的(2003)经济综合竞争力的定义是,一个区域整个市场加强分工协作,创造以实现区域社会可能性持续发展的能力。

他的本质特征是对区域内全社会生产要素的整合和利用,实现产业的合理分工与协作,创造区域经济发展的最佳环境。

该研究中心通过三维模型将区域综合竞争力分为核心竞争力、基础竞争力和辅助竞争力,其中核心竞争力包括经济水平、科技水平、金融实力;基础竞争力包括基础条件、教育及居民素质;辅助竞争力包括政府作用和生活环境。

基于以上有关竞争力的不同论述,我们可以借鉴国家竞争力、地区竞争力的定义,省域经济竞争力应该定义为参与竞争的各个省份依据区位特点,通过实现产业的合理分工、协作以比较优势为基础不断形成竞争优势的能力。

根据省域经济竞争力的内涵可以将省域竞争力分解为八个分项竞争力:工业竞争力、农业竞争力、服务业竞争力、固定资产投资竞争力、金融竞争力、财政竞争力、科教竞争力和进出口竞争力。

其中工业、金融、科教、服务业竞争力为核心竞争力,农业、固定资产投资、财政为基础竞争力,进出口为辅助竞争力。

科教竞争力和服务业竞争力是省域经济竞争力的潜力所在。

四、省域经济竞争力多因素综合评价方法建立评价指标体系后,对于省域经济竞争力的评价关键也就变成了评价方法的选择。

各省经济竞争力评价工作的进行通常是建立在可定量化指标的基础之上,只有建立比较完善的指标评价体系,采取合理的评价方法进行评价,结果才具有说服力,才能为政府决策部门提供决策依据。

然而,由于影响一个国家或地区经济竞争力的因素很多,它不但包含上面所述的因素,还包括影响各省发展的社会、文化和环境等因素。

因此,尽管以前各省经济竞争力的评价工作早已进行过并且还在继续,使用的评价方法有很多,但至今还未形成一套相对统一或相对合理的评价方法。

从总体上可将目前国内外常用的系统评价方法分为:专家评价法、经济分析法、数据包络分析方法、层次分析法、模糊评价方法、数理统计方法和神经网络评价方法等。

其中数理统计方法主要是应用其中的聚类分析、判别分析、主成分分析、因子分析等统计方法来对一些对象进行分类和评价。

本文首先利用主成分分析的方法对全国31个省市的经济竞争力作出初步的简略的排名,得出广东省和甘肃省的综合竞争力的综合评价,然后再对广东省和甘肃省的情况做出具体的分析。

鉴于我国目前还未有比较系统的评价各省经济竞争力的统计指标体系, 数据采集较困难, 只能设置可利用现有的统计数据和易于收集统计资料的指标。

对于部分虽有价值但无法统计或难以取得数据资料的指标, 暂不纳入指标体系, 这样就保证了指标体系具有较强的可操作性。

省域经济竞争力的评价可以从总量指标、效率指标和结构指标等方面展开, 而我们选择从总量指标角度分析研究。

根据各省社会经济活动的自身特点和指标体系设置的基本原则,我们选择了如下八个指标作为评价标准:1x :工业(14-4);2x :农业(13-4);3x :建筑业(15-6)单位:万元;4x :固定(5-7);5x :金融(19-24);6x :财政(8-7); 7x :科教(20-28)(人); 8x :进出口(6-11)单位:万美元.五、主成分分析(一) 主成分分析模型主成分( Principal components ) 分析是一种数学变换方法。

它把给定的一组变量,,...,12k x x x , 通过线性变换, 转换为一组不相关的变量12,,...,k y y y 。

在这种变换中,保持变量的总方差(12,,...,k x x x 的方差之和) 不变, 同时使1y 具有最大方差, 称为第一主成分; 2y 具有最大方差, 称为第二主成分; 依此类推。

原来有k 个变量, 就可以转换成k 个主成分。

但在实际应用中, 为了简化, 通常不是找出k 个主成分, 而是找出q( q k )<个主成分就够了, 只要这q 个主成分反映出原来k 个变量的很大部分的方差就可以了。

设n 个样本在k 个指标下的数值, 就可以得到数据矩阵k n ⨯,现在的目的是要求出,,...,12k y y y ,使(1) 1111221...1k k y a x a x a x =+++1122...k k k kk k y a x a x a x =+++(2) y 的协方差矩阵cov ( y)为对角矩阵;(3) y 的方差尽可能大, 然后, 在,,...,12k y y y 中选出对方差贡献最大的部分指标就达到了主成分分析的目的。

(二) 在实际应用中主成分分析的具体步骤(1)将原始数据标准化; (2)建立变量的相关系数阵;(3)求R 的特征根为**1...0p λλ≥≥≥,相应的特征向量为***12,,...P T T T ;(4)由累积方差贡献率确定主成分的个数(M ),并写出主成分的具体形式。

(三) 利用主成分分析综合评价的原则对主成分进行加权综合。

我们利用主成分进行综合评价时,主要是将原有的信息进行综合,因此,要充分地利用原始变量提供的信息。

将主成分的权数根据它们的方差贡献率来确定,因为方差贡献率反映了各个主成分的信息含量多少。

相关文档
最新文档