聚类分析在经济学当中的一个应用
聚类分析在福建省经济研究中的应用

聚类分析在福建省经济研究中的应用摘要:本文论述聚类分析的基础知识,并以福建省9个市2014年的地区生产总值、金融机构人民币各项存款余额等十项综合经济指标为样本,利用SPSS 软件,对他们的综合发展水平进行类型划分及差异性程度分析.关键词:聚类分析 综合经济指标 福建省经济区划分一、引言:聚类分析(Cluster Analysis )又称群分析,是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的。
聚类分析起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。
随着人类科学技术的发展,对分类的要求越来越高,以致有时仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,之后又将多元分析的技术引入到数值分类学形成了聚类分析。
在中国,区域经济发展不平衡现象由来已久,区域经济差异更是不断的扩大。
本文以9个市的10个经济指标作为研究对象,来分析本省地域经济之间的差异性以及相似性,评价各地区的经济发展现状。
二、基础知识1.聚类分析的原理聚类分析是研究多要素事物分类问题的数量方法.基本原理是根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类. 常见的聚类分析方法有系统聚类法、K -均值法等. 2.样品间的距离和相似系数 (1)距离的计算描述样品间的亲疏程度最常用的是距离,设观测数据),,1;,,2,1(m j n i x xj ==列成下列X 矩阵的形式.设有n 个样品,每个样品测得p 个变量,原始资料阵为⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=np n n p p x x x x x x x x x X 212222111211,其中ij x 为i 个样品的第j 个变量的观测数据.用ij d 表示第i 个样品的第j 个样品之间的距离,其值越小表示两个样品接近程度越大.距离的一般要求:① ;0;,,0)()(j i ij ij X X d j i d =⇔=≥当对一切 ② ;,,j i d d ji ij 对一切=③ ).(,,,三角不等式对一切k j i d d d kj ik ij +≤ 常用的距离有以下几种:1)闵氏距离,其中常用的距离有绝对距离和欧氏距离.绝对距离)()1(1∑=-=pk jk ik ij X X d .欧氏距离.欧氏距离是常用的距离,但它也有不足之处,一是它没有考虑到总体的变异对“距离”远近的影响,显然一个变异程度大的总体可能与更多样品近些,即使它们的欧氏距离不一定最近;另外,欧氏距离受变量的量纲影响,这对多元数据的处理是不利的.通常我们需要先对数据近些标准化处理,然后用标准化后的数据计算距离.2)马氏距离qpk qjk ik ij X X q d 11)()(∑=-=2112)()2(∑=-=pk jk ik ij X X d设i X 与j X 是来自均值向量为μ,协方差为()∑>0的总体G 中的p 维样品,则两个样品间的马氏距离为)()()(1'2j i j i ij X X X X M d --=∑-.马氏距离又称为广义欧几里得距离,显然马氏距离与上述各种距离的主要不同就是考虑到了观测变量之间的相关性.如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵,对马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧几里得距离.马氏距离还考虑了观测变量之间的变异性,不再受各指标变量的影响,将原始数据作线性变换后,马氏距离不变.选择不同的距离,聚类结果会有所差异.在地理分区和分类研究中,往往采用几种距离进行计算、对比,选择一种较为合适的距离进行聚类. (2)相似系数在对多元数据进行分析时,相对于数据的大小,我们更好地对变量的变化趋势或方向感兴趣.因此,变量间的相似性,我们可以从它们的方向趋同性或“相关性”进行考察,我们用相似系数用来测量变量之间的距离,常用的相似系数有以下两种: 1)夹角余角变量i X 与j X 是来自均值向量为μ,协方差为()∑>0x 的总体G 在的p 维空间的两个向量,则这两个向量间的夹角余弦可表示为))((cos 12121∑∑∑====pk jk pk ikpk jkikij X X X Xθ.2)相关系数相关系数经常用来试题变量间的相似性.变量i X 与j X 的相关系数定义为∑∑==----=pk j jk i ikpk j jk i ikij X X X XX X X Xr 1221)()())((.在实际问题中,对样品分类常用距离,对变量分类常用相似系数,即Q 型聚类分析常用距离,R 型聚类分析常用相似系数.4系统聚类分析方法开始将样品或变量各视为一类,根据类与类之间的距离或相似程度将最近的类加以合并,再计算新类与其他类之间的相似程度,并选择最相似的加以合并,这样每合并一次就减少一类,不断继续这一过程,直至所有样品(或变量)合并为一类.系统聚类分析方法方法包括最短距离法、最长聚类法、类平均法、重心法、ward 法等八种不同的方法三、实例例表1给出了 2014年能反映福建省9个市的综合经济的十项指标分别为:X1 地区生产总值(亿元),X2金融机构人名币各项存款余额(亿元),X3农村居民人均可支配收入(元),X4 城镇居民人均可支配收入(元),X5 人口(万人),X6固定资产投资(亿元),X7规模以上工业固定资产(万元),X8 地方公共财政收入(万元),X9 公共财政支出(万元),X10城镇单位在岗职工平均工资(元).利用数据对福建省9个市的综合发展水平进行类型划分及差异性程度分析.数据来源于2014年福建省统计年鉴由于选用的数据在数量级以及单位上具有差别,不能直接进行比较,所以要对数据进行无量纲处理,在spss中可以通过“分析--描述统计--描述”得到标准化后的数据,这里得到的无量纲的数据为通过Z标准化方法得来的。
聚类分析在金融投资策略中的应用

聚类分析在金融投资策略中的应用随着人工智能和大数据技术的发展,聚类分析在金融投资策略中扮演着越来越重要的角色。
聚类分析是一种对数据进行分类的方法,它将相似的数据归为一类,不同的数据归为不同的类别。
在金融领域,聚类分析可以帮助投资者识别市场中的不同组别,发掘潜在的投资机会。
聚类分析的实现需要以下步骤:1、获取数据聚类分析需要大量的数据作为输入,这些数据可以从不同的来源获取,包括金融市场数据、经济数据、社会数据等。
在获取数据时,需要注意数据的质量和完整性,以确保分析结果的准确性。
2、数据预处理在对数据进行聚类分析之前,需要进行一些预处理操作。
这些操作包括数据清洗、变量选择、特征标准化等。
数据清洗可以去除无用信息和异常值,变量选择可以选取对聚类结果有影响的变量,特征标准化可以将数据转化为相似的量纲。
3、选择聚类算法选择聚类算法是聚类分析的核心。
常用的聚类算法包括K均值聚类、层次聚类、DBSCAN聚类等。
不同的算法适用于不同的数据类型和聚类需求。
选择适合的算法可以提高聚类结果的准确性和效率。
4、聚类结果分析聚类分析得到的结果通常是一组簇,每个簇包含一组相似的数据。
分析聚类结果可以帮助投资者了解市场中不同组别的特征和行为,从而制定相应的投资策略。
常用的聚类结果分析方法包括簇内异质性分析、簇间差异性分析、簇的可解释性分析等。
在金融投资领域,聚类分析可以应用于以下方面:1、资产组合优化聚类分析可以帮助投资者识别不同的资产组别。
投资者可以根据不同资产组别的特征和表现制定相应的投资策略,从而优化资产组合,提高投资收益。
2、股票选取聚类分析可以帮助投资者识别具有相似特征和表现的股票,从而筛选出符合投资需求的股票。
投资者可以根据股票的聚类结果制定相应的投资决策,从而降低投资风险,提高投资收益。
3、行业分析聚类分析可以帮助投资者识别市场中的不同行业组别,从而了解不同行业的表现和前景。
投资者可以根据行业的聚类结果制定相应的投资策略,从而把握市场机会,降低投资风险。
聚类分析的应用案例

聚类分析的应用案例聚类分析是一种常用的数据分析方法,它可以帮助我们对数据进行分类和分组,发现数据中的潜在模式和规律。
在现实生活和工作中,聚类分析有着广泛的应用,下面我们将介绍几个聚类分析的应用案例。
首先,聚类分析在市场营销领域有着重要的应用。
在市场营销中,我们常常需要对顾客进行分类,以便针对不同类别的顾客制定不同的营销策略。
通过聚类分析,我们可以根据顾客的消费行为、偏好等特征将顾客进行分类,从而更好地理解顾客群体的特点,并针对性地开展营销活动,提高营销效果。
其次,聚类分析在医学领域也有着重要的应用。
在医学研究中,我们常常需要对疾病患者进行分类,以便更好地了解不同类型患者的病情特点和治疗效果。
通过聚类分析,我们可以根据患者的临床表现、病情指标等特征将患者进行分类,从而更好地指导临床诊断和治疗方案的制定,提高治疗效果和患者生存率。
此外,聚类分析还在推荐系统中有着重要的应用。
在电子商务平台和社交媒体平台上,推荐系统可以根据用户的行为和偏好向其推荐商品、信息等内容。
而聚类分析可以帮助推荐系统对用户进行分类,从而更好地理解用户的兴趣和偏好,提高推荐的准确性和个性化程度,增强用户体验。
最后,聚类分析还在金融领域有着重要的应用。
在金融风控和信用评估中,我们常常需要对客户进行分类,以便更好地评估客户的信用风险和制定个性化的信贷方案。
通过聚类分析,我们可以根据客户的财务状况、信用记录等特征将客户进行分类,从而更好地了解客户的信用状况,提高风险控制的精准度和效果。
总之,聚类分析在各个领域都有着重要的应用,它可以帮助我们更好地理解数据和问题的本质,发现数据中的潜在规律和价值信息,为决策提供科学依据。
随着数据科学和人工智能技术的不断发展,相信聚类分析的应用领域会越来越广泛,对我们的生活和工作产生越来越大的影响。
经济统计学中的聚类分析方法

经济统计学中的聚类分析方法聚类分析是一种常用的数据分析方法,它在经济统计学中有着广泛的应用。
聚类分析的目标是将一组数据划分为若干个相似的子集,每个子集内的数据相似度高,而不同子集之间的数据相似度低。
这种方法可以帮助经济学家发现数据中的规律和模式,从而更好地理解经济现象。
聚类分析的基本原理是通过计算数据点之间的相似度或距离来确定数据的分组。
常用的相似度度量方法包括欧氏距离、曼哈顿距离和余弦相似度等。
欧氏距离是最常用的相似度度量方法,它计算两个数据点之间的直线距离。
曼哈顿距离则是计算两个数据点在坐标轴上的距离之和。
余弦相似度是通过计算两个向量之间的夹角来度量它们的相似度。
在经济统计学中,聚类分析可以用于多个方面的研究。
首先,它可以帮助经济学家对经济发展水平进行分类。
通过对不同国家或地区的经济指标进行聚类分析,可以将它们划分为不同的发展水平组别。
这有助于我们了解不同地区的经济特点和发展趋势,为政府制定相关政策提供参考。
其次,聚类分析可以用于市场细分。
市场细分是指将一个大市场划分为若干个小市场,每个小市场具有相似的需求和行为特征。
通过对消费者的购买行为和偏好进行聚类分析,可以将消费者划分为不同的群体,从而更好地满足他们的需求。
这对企业来说是非常重要的,可以帮助它们制定更精准的市场营销策略。
此外,聚类分析还可以用于金融风险管理。
金融市场中的数据非常庞大复杂,通过对金融市场数据进行聚类分析,可以将相似的金融资产或交易划分为同一类别。
这有助于金融机构更好地评估风险和制定风险管理策略,从而提高金融市场的稳定性和安全性。
聚类分析方法还可以与其他经济统计学方法相结合,如主成分分析和因子分析。
主成分分析可以用于降维,将高维数据转化为低维数据,而聚类分析可以在降维后的数据上进行分组。
因子分析可以用于提取数据的主要因素,而聚类分析可以将具有相似因素的数据进行分组。
这些方法的结合可以更全面地分析经济数据,提高分析的准确性和可解释性。
聚类分析在经济地理分区中的应用

聚类分析在江苏省经济区域划分中的应用摘要:本文探讨了如何运用SPSS中的聚类分析对江苏省十三个市按国民经济的相关指标进行经济区域的划分,以便对十三个市的经济发展分类指导,做到有的放矢,从而更好地带动江苏经济的发展。
首先阐述了聚类分析的相关原理及指标体系,然后根据相关原始数据,对其标准化后进行聚类分析,最后得出江苏省应划分苏南、苏中、苏北三个经济区。
关键字:聚类分析,经济区域,江苏省1 引言研究一个省的经济发展状况,通常需要对该省所有地级市根据不同国民经济发展状况进行经济区域的划分,以便进行分类指导。
江苏省共拥有十三个地级市,不同地级市的国民经济发展状况各不相同。
如何对这十三个地级市进行合理区分,从而从每个地区的经济情况做到有的放矢,这对整个江苏经济的发展有着十分重要的作用。
通常,描述一个地区的经济发展状况会有很多的指标,那么如何根据这些指标合理地进行区域的划分呢?利用世界著名的统计软件SPSS的聚类分析功能效果会比较理想。
本文对江苏省十三个地级市(南京、无锡、徐州、常州、苏州、南通、连云港、淮安、盐城、扬州、镇江、泰州、宿迁)经济区域的划分就利用了聚类分析的功能。
2 聚类分析的基本原理及其指标体系2.1 基本原理聚类分析的基本原理是:首先将一定数量的样本各自看成一类,然后根据样本之间的亲疏程度,将亲密程度最高的两类进行合并;然后考虑合并后的类与其他类之间的亲疏程度,再进行合并;重复这一过程,直至将所有的样本合并为一类。
聚类分析的实质是建立一种分类方法,它能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。
这个类指的是一个具有相似性个体的集合,不同类之间具有明显的区别。
聚类分析的方法主要有两种,一种是快速聚类,一种是层次聚类。
如果观察值的个数非常多(200个以上),则宜采用快速聚类的方法。
在本例中用到的是层次聚类,并且是层次聚类中的R型聚类,R型聚类是对研究对象的观察变量进行分类,使具有共同特点的变量聚集在一起。
聚类分析在金融投资分析中的应用

Finance金融视线0322017年7月 聚类分析在金融投资分析中的应用对外经济贸易大学国际经济贸易学院 宋洁摘 要:现阶段,随着我国经济的快速发展,金融领域的投资已经越来越受到人们的关注。
但是金融投资带来收益的同时,也会存在着一定的风险。
为了帮助投资者更好的了解市场趋势和投资方向,采取科学有效的分析方法是非常关键的。
聚类分析作为一种统计方法,在金融投资领 域得到了广泛的应用。
本文首先分析了聚类分析的定义和基本特征;其次,探讨了聚类分析方法在金融投资分析方面应用的意义;最后,详细讨论了聚类分析在金融投资分析方面的具体应用案例。
关键词:聚类分析 金融投资分析 应用中图分类号:F832 文献标识码:A 文章编号:2096-0298(2017)07(c)-032-02现阶段,随着我国经济的快速发展,社会主义市场经济的规模也日益扩大,人们对于金融投资的关注度也越来越高。
金融投资,有收益,必然也存在着一定的风险。
因此,采取适当的分析方法有效降低风险,获得最大收益一直是非常重要的课题之一。
在基础分析方法的前提下所建立的聚类分析法,对于股票的总体特征、变动趋势等能够做出更准确的判断,从而实现帮助投资者有效规避风险的目的。
因此,对于金融投资者而言,熟练掌握聚类分析方法,具有一定的实用价值。
1 聚类分析方法概述1.1 聚类分析的具体定义实际上,聚类分析法主要是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。
它实质上是一种重要的人类行为。
将数据分类到不同的类或者簇这样的过程就是聚类分析,因此,同一个簇中的对象具有很大的相似性,而不同簇间的对象却具有较大的差异性。
目前,聚类分析方法是在数据挖掘、机器学习、生物学以及统计学等领域进行研究而得到的一种有效方法。
通过将具有相似性的元素或者数据信息聚集成一个类,从而使得该类中的数据或者元素具有最小的相似性。
目前,聚类分析方法作为统计学的一个分支学科,已经广泛应用于数据分析、图像处理技术、数据库技术以及模糊识别等多个相关领域。
经济统计数据的聚类分析方法

经济统计数据的聚类分析方法引言:经济统计数据是经济研究和政策制定的重要基础,通过对经济数据的分析和解读,可以帮助我们了解经济的发展趋势、结构特征以及潜在问题。
而聚类分析作为一种常用的数据分析方法,可以将相似的经济指标归为一类,帮助我们更好地理解经济数据的内在联系和规律。
本文将介绍经济统计数据的聚类分析方法,探讨其在经济研究中的应用。
一、聚类分析的基本原理聚类分析是一种无监督学习方法,它通过对数据集进行分组,将相似的样本归为一类。
其基本原理是通过计算样本之间的相似性或距离,将相似性较高的样本划分为同一类别。
聚类分析可以帮助我们发现数据集中的内在结构,并将数据集划分为若干个互不重叠的类别。
二、经济统计数据的聚类分析方法在进行经济统计数据的聚类分析时,首先需要选择适当的指标。
常用的指标包括国内生产总值、消费者物价指数、劳动力参与率等。
接下来,我们可以使用不同的聚类算法对这些指标进行分析。
1. K-means聚类算法K-means是一种常用的聚类算法,它将数据集分为K个互不重叠的类别。
该算法首先随机选择K个初始聚类中心,然后通过计算每个样本与聚类中心的距离,将样本分配给距离最近的聚类中心。
接着,更新聚类中心的位置,并迭代上述过程,直到聚类中心的位置不再发生变化。
K-means算法对初始聚类中心的选择较为敏感,因此需要进行多次试验,选取最优的结果。
2. 层次聚类算法层次聚类算法是一种自底向上的聚类方法,它首先将每个样本视为一个独立的类别,然后通过计算样本之间的相似性,逐步将相似的样本合并为一类。
该算法可以生成一个聚类树状图,帮助我们观察不同层次的聚类结果。
层次聚类算法的优点是不需要预先指定聚类个数,但是计算复杂度较高。
3. 密度聚类算法密度聚类算法是一种基于样本密度的聚类方法,它将样本空间划分为具有高密度的区域和低密度的区域。
该算法通过计算每个样本周围的密度,并将密度较高的样本作为核心对象,进而将其邻近的样本归为一类。
聚类分析应用案例

聚类分析应用案例
简介
聚类分析是一种无监督研究方法,旨在将数据样本划分为具有相似特征的群组或类别。
在许多领域中,聚类分析被广泛应用于数据分析、模式识别和信息检索等任务。
本文将介绍聚类分析在实际应用中的一些案例。
零售行业中的市场细分
零售行业需要了解其客户群体的特征以制定有效的营销策略。
通过聚类分析,可以将顾客细分为不同的群组,例如消费惯相似的群体、购买力相近的群体等。
基于这些细分结果,零售商可以有针对性地开展宣传活动、提供个性化服务,从而提高市场竞争力。
医疗领域中的疾病分类
在医疗领域,聚类分析可以用于疾病分类和诊断。
通过对患者的症状、体征和病史等信息进行聚类,可以将患者群体划分为具有相似疾病特征的子群。
这有助于医生进行更精确的诊断和制定个性化的治疗方案。
社交媒体分析中的用户群体划分
在社交媒体分析中,聚类分析可用于划分用户群体,了解不同用户的兴趣、行为模式和需求。
以这些群体为基础,企业可以更好地理解目标用户,并设计出更精准的推广活动和产品策略。
金融领域中的风险管理
在金融领域,聚类分析可以用于风险管理。
通过对客户的财务信息、投资偏好和风险承受能力等进行聚类,可以将客户划分为不同的风险群体。
这可以帮助金融机构识别高风险客户,并采取相应的风险控制措施。
总结
聚类分析是一种强大而灵活的数据分析工具,在各个领域都有广泛的应用。
本文介绍了其在零售行业、医疗领域、社交媒体分析和金融领域中的应用案例。
聚类分析可以帮助我们理解数据的内在结构、找到相似的群体,并基于这些群体进行个性化的决策和策略制定。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
聚类分析在经济学当中的一个应用
作者:李世伟丁胜
来源:《商场现代化》2009年第09期
[摘要] 本文根据系统聚类分析的最小离差平方和法,利用SPSS软件,通过浙江省11个地市的国民经济主要指标,对处在不同经济发展水平的各个地市进行聚类分析,从而将浙江省划分为三个经济发展水平不同的经济区域,结果供有关决策部门参考。
[关键词] 最小离差平方和法主要经济指标聚类分析
聚类分析又称群分析,是多元统计分析中研究样本或指标的一种主要的分类方法,起源于考古分类学。
随着经济和社会的发展,结合了更为强大的数学工具的聚类分析方法已经越来越多应用到经济分析和社会工作分析中。
在经济领域中,主要是根据影响国家、地区乃至单个企业的经济效益、发展水平的各项指标进行聚类分析,然后根据分析结果进行综合评价,以便得出科学的结论。
聚类分析的方法主要有两种,一种是“快速聚类分析方法”(K-Means Cluster Analysis),另一种是“系统聚类分析方法”(Hierarchical Cluster Analysis)。
本文将根据2004年浙江省各市国民经济主要指标,利用系统聚类的Ward’s Method,对浙江省11个市进行分类。
一、聚类方法简介
系统聚类法(hierarchical clustering method)是使用最多的一种聚类方法。
它的基本思想是:
1.将全部n个样品各看成一类,即得到n类;
2.确定样品与样品和类与类之间的距离;
3.计算各类之间的距离,并将距离最近的两类合并为一类,形成一个新的类;
4.重复步骤3。
这样从有n类开始,每次合并一类,经过n-1次合并后,所有的样品成为一类;
5.将上述合并的全部聚类过程用一个直观图形画出来,即画出聚类图;
6.决定类的个数,并由上述步骤得到相应的聚类分析的结果。
以下我们用Gij表示第i个样品与第j个样品的距离,G1,G2,…表示类,GKL表示GK 与GL的距离。
本节介绍的系数聚类法中,类与类之间的距离与样品之间的距离相同,即DKL =dkl。
二、数据处理
(来源:2005浙江统计年鉴,见参考文献[13])。
:国内生产总值 GDP(亿元);:社会固定资产投资(亿元);
:全社会消费品零售总额(亿元);:城镇居民人均可支配收入(元);
:农村居民人均纯收入(元)。
1.原始数据标准化
标准化后的数据
2.SPSS软件处理结果
我们采用系统聚类分析法的Ward’s Method对标准化后的数据进行处理,下面对软件输出结果进行详细介绍。
使用SPSS的Classify→Hierarchical Cluste r程序进行聚类分析。
其中Method子对话框里,方法选择最小方差法(Ward’s Method),间距测度变量选择Squared Euclidean distance(欧氏距离的平方),然后得出如下结果:
(1)系统聚类分析的概要结果,
从表3中可以看出,11个样本都进入了聚类分析。
本表格的第一行表示,第4个样本和第6个样本最先进行了聚类,样本间的距离为
0.195,这个聚类的结果将在后面的第五步聚类中用到;第二行表示聚类的第二步中第8个样本和第11个样本进行了聚类,样本间的距离为0.653,这个聚类的结果将在后面的第八步聚类中用到。
其他行的含义和上面的类似。
可见,经过了10步聚类,11个样本聚成了一个大类。
该表格是样本系统聚类分析聚成3个类时,样本的类归属情况表。
从该表格可以看出,杭州市,宁波市2个市聚为一类;温州市,嘉兴市,绍兴市,台州市4个市聚为一类;湖州市,金华市,舟山市, 衢州市,丽水市5个市聚为一类。
(4)聚类图
这个图是系统聚类分析的谱系图(Dendrogram)。
从图中可以看出,各个类之间的距离在25的坐标内。
借此可以直观地显示整个聚类的过程。
3.通过以上的分类表和龙骨图(谱系图)可以清楚的看到,离差法聚类分析结果
(1)较发达城市:杭州市,宁波市;
(2)中等发达城市:温州市,嘉兴市,台州市,绍兴市;
(3)发展中城市:金华市,湖州市,舟山市,衢州市,丽水市。
三、结果分析
通过上面的聚类分析,根据2004年浙江省各市国民经济的主要指标,我们将目前浙江省各市县的经济发展水平划分为3个经济区域:
1.较发达城市:杭州市,宁波市
2.中等发达城市:温州市,嘉兴市,台州市,绍兴市,金华市,湖州市,舟山市
3.发展中城市:衢州市,丽水市
从聚类结果我们可以发现,发达城市杭州市和宁波市,由于城市发展历史悠久,基础建设比较完善,产业机构比较合理,城市规模较大,城市经济发展快,所以把它们归类为经济发达的城市。
而中等发达城市,湖州市、嘉兴市和舟山市由于靠近上海,与上海的社会经济关系比较密切,依托上海,大力发展外贸经济。
其他4个城市一般为沿海城市,对外贸易便利,而且这里有浙东两条黄金旅游线(杭州—绍兴—宁波—舟山;杭州—绍兴—台州),旅游业也很发达,因此经济达到中等发达水平,而金华市跟多个市比邻,所以跟其他市的经济贸易也比较频繁,经济方面相对来说也是比较发达的。
而衢州市,丽水市由于位于地理位置原因,基础建设相对滞后,产业结构不够合理,财政收入少,所以经济会相对比较落后。
当然,以上分析结果仅是根据一年的经济主要指标得出的结论,如果要想进行更准确合理的分析,还需要进一步结合其它的数据进行分析。
参考文献:
[1]张尧庭方开泰:多元统计分析引论[M].北京:科学出版社,1982
[2]王学仁王松桂:实用多元统计分析[M].上海:上海科学技术出版社,1990
[3]钱俊龙:概率论与应用统计[M].北京:中国统计出版社,1992
[4]何晓群:现代统计分析方法与应用[M].北京:中国人民大学出版社,1998
[5]于秀林任雪松:多元统计分析[M].北京:中国统计出版社,1999
[6]李双杰顾六宝:用聚类分析法评估区域经济[J].中国农村观察,2001
[7]苏金明:统计软件SPSS系列应用实战篇[M].北京:电子工业出版社,2002
[8]郝黎仁:SPSS实用统计分析[M].北京:中国水利水电出版社,2002
[9]吴明隆:SPSS统计应用实务[M].科学出版社,2003
[10]卢纹岱:SPSS for Windows统计分析[M].北京:电子工业出版社,2004
[11]何晓群:多元统计分析[M].北京:中国人民大学出版社,2004
[12]王学明:应用多元分析[M].上海: 上海财经大学出版社,2004
[13]浙江省统计局,2005浙江统计年鉴.中国统计出版社,2005。