基于因子分析和聚类分析的客户偏好探究
基于聚类分析因子分析企业信用评级的探索的步骤

基于聚类分析因子分析企业信用评级的探索的步骤1.数据收集:首先,需要收集企业的财务数据和其他相关信息,如负债比率、偿债能力、盈利能力、运营能力等。
这些数据可以从年度报告、财务报表和其他可靠的信息源中获取。
2.数据预处理:在进行聚类分析和因子分析之前,需要对数据进行预处理。
这包括处理缺失值、异常值和离群值,以及进行数据标准化或归一化,使得不同指标的数据具有可比性。
3.因子分析:在进行聚类分析之前,可以对数据进行因子分析。
因子分析可以帮助识别并提取最具代表性的因子,减少数据的维度,并提高模型的可解释性。
通过因子分析,可以将多个相关的指标归纳为少数几个无关的因子。
4. 聚类分析:在因子分析之后,可以使用聚类分析方法来将企业划分为不同的组别。
聚类分析是一种无监督学习方法,可以根据数据的相似性将样本划分为不同的簇。
常用的聚类算法包括K-means、层次聚类和DBSCAN等。
通过聚类分析,可以找出具有相似财务和经营特征的企业。
5.簇的质量评估:在完成聚类分析后,需要对每个簇的质量进行评估。
常用的质量评估指标包括簇内差异度和簇间差异度。
簇内差异度越小,簇间差异度越大,说明聚类的效果越好。
6.信用评级的划定:基于聚类分析的结果和簇的质量评估,可以确定不同簇的信用等级。
可以根据簇的质量评估指标和实际的信用违约情况来为每个簇划定相应的信用评级。
7.验证和调整:最后,需要对模型进行验证和调整。
可以通过历史数据的回测和实际信用违约情况的监测来评估模型的准确性和稳定性,并根据需要对模型进行调整和改进。
总结起来,基于聚类分析和因子分析的企业信用评级是一个多步骤的过程,包括数据收集、数据预处理、因子分析、聚类分析、簇的质量评估、信用评级的划定和验证、调整等。
这种方法可以帮助评估企业的信用风险,并为投资和决策提供重要的参考依据。
基于聚类分析的顾客细分研究

基于聚类分析的顾客细分研究近年来,为了更好地满足顾客的需求,企业开始着手进行顾客细分。
与传统的均匀分配资源方式相比,顾客细分可以使得资源的利用更为合理,也能够为企业提供更有针对性的营销方案。
其中,基于聚类分析的顾客细分成为了一种热门的方法。
聚类分析是一种数据挖掘技术,通过将一组顾客分为多个不同的子集(即簇)的过程来确定相似性和差异性。
聚类分析的簇是基于相似性统计的范畴来划分的。
相似性通常是基于多重变量计算得出的。
这些多重变量可能是顾客属性,行为或偏好等方面的指标。
聚类分析的目标是尽可能的将同一簇中顾客的差异性降至最小,同时尽可能地提高簇间的差异性。
基于聚类分析的顾客细分可以帮助企业进行更为精准的营销。
下面我们具体探讨一下方法实施的流程和步骤。
首先,企业需要收集尽可能多的数据。
这些数据可以包括顾客的年龄、性别、地域、收入、消费习惯等信息。
同时,企业还可以收集顾客的交互信息,如网站浏览量、购买次数、购买金额等。
其次,企业需要对这些数据进行处理和准备。
数据处理可以包括特征选取和缺失值填充等。
特征选取是指选择对于簇划分有意义的指标变量。
缺失值填充可以采用平均值、中位数等常见方法进行填充。
接着,企业需要确定簇的数量。
簇的数量取决于顾客的数量和细分的目的。
通常情况下,簇的数量应该比较少,以避免冗余和过度分析。
聚类分析可以依据不同的距离函数和聚类算法来进行。
企业可以根据自己的需求自行选择。
最后,企业需要对分析结果进行解释和应用。
具体来说,可以根据簇的不同特征对顾客进行分类和打标签,制定更为针对性的市场营销策略。
此外,企业还可以与顾客互动,进行更深入的了解,提高产品和服务的满意度。
需要注意的是,聚类分析并非是万能的。
企业还应该注意用数据说话,避免过度的主观判断,以达到更为客观有效的顾客细分目标。
综上所述,基于聚类分析的顾客细分是一种非常可行的方法。
通过聚类分析将顾客分为多个簇,企业可以更加了解顾客的需求和服务要求。
因子分析与聚类分析在消费者生活形态研究中的应用

因子分析与聚类分析在消费者生活形态研究中的应用因子分析与聚类分析在消费者生活形态研究中的应用我们都知道,消费者的生活方式与他们对商品的选择是密切相关的,根据生活方式将消费者进行分类,可以为产品的市场细分以及市场定位提供技术指导。
在现代消费者行为与心理研究中,评价消费者生活方式的方法有许多,比较广泛应用的细分系统如价值及生活方式系统(VALS: Value and Life System),根据消费者对生活的观点以及通常的行为方式将消费者分成几个不同方式的群体系统。
但由于各地区文化背景的差异,不同地区的消费者生活模式也存在较大的差异,消费者的分类也应考虑各地的具体情况。
下面本文主要介绍如何通过因子分析和聚类分析方法来对消费者进行分类。
一、研究的基本方法由于缺乏基础性的资料可以参考,考虑到对消费者进行分类时样本量的充足性,因此研究一般要求采取较为充足的样本(本例样本总量为3000个),样本的分布根据人口比例分布在A城市的14个城区。
本例中我们选定的样本对象为:15岁以上具有独立购买能力的消费者。
样本的抽取采用随机方法,采用Kish表(随机表)决定家庭中的受访者,以保证样本的代表性。
研究消费者的生活方式,我们通常采用心理描述测试法,即采用一系列关于对社会活动、价值观念等内容的陈述,请消费者根据自己的情况做出评价。
调查中采用7分评价法,1分表示“非常同意”,7分表示“非常不同意”。
经事先的小样本测试筛选,最终的测试语句为:我喜欢购买新潮的东西重新评估打分,然后根据这些评价进行聚类分析,根据统计原则以及在现实中容易解释的原则,确定最终采用的分类个数。
3.根据分类结果对每一样本判别其所属类别,然后对各类型消费者的背景进行交叉分析。
下面向读者介绍具体的分析方法:三、因子分析方法由于测试的语句实际上是一系列相关因素的陈述,很多语句之间存在一定的相关性,所以我们不能采用简单的回归方法进行分析。
通过因子分析则可以将系列相关因素综合为一个因子,因此,研究中我们首先采用因子分析来对20个陈述进行分析(因子分析的原理请参考有关数理统计书籍)。
基于因子分析和聚类分析的客户偏好探究

基于因子分析和聚类分析的客户偏好探究一文献综述二十世纪五十年代中期,美国学者温德尔史密斯提出了顾客细分理论。
该理论指出,顾客由于其文化观念、收入、消费习俗等方面的不同可以分为不同的消费群体。
企业在经营中应该针对不同的顾客提供针对性的服务,这样才能够利用有限资源进行有效的市场竞争。
对顾客的细分从方法上讲有根据人口特征和购买历史的细分和根据顾客对企业的价值即基于顾客的消费金额、消费频率的细分。
本文的细分是基于购买历史和人口特征的聚类分析。
饭店作为一个古老的服务行业,在现阶段的高度竞争市场下的发展趋势最重要的方面便是服务趋于个性化,所以针对饭店的消费群体特征的聚类可以对饭店进行定位,在此基础上通过分析目标客户群体对消费质量评价的最主要影响因素可以达到其服务个性化的目标。
波特把顾客的价值定义为买方感知性与购买成本的一种权衡。
对顾客的个性化服务增加了买方的感知度从而加大了他们愿意为此付出的成本,于是饭店便可以增加营业额。
聚类分析是把研究对象视作多维空间中的许多点, 并合理地分成若干类,即一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。
1故聚类算法是对顾客进行分析的一个有效方式。
在聚类分析的众多算法中因子分析是研究如何以最少的信息丢失, 将众多原始变量浓缩成少数几个因子变量, 以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。
2而典型的k-means算法以平方误差准则较好地实现了空间聚类,对于大数据集的处理效率较高。
3在对顾客细分相关文献的研究过程中,主要运用的方法有神经网络,分层聚类,因子分析等方法。
比如,在关于网络青少年用户的分类中,作者用层次聚类的方法,通过对青少年年龄,性别,民族,网络可得性,父母的观点等变量等变量定义不同的上网动机,在此基础上对其进行了分类。
而在研究人寿保险持有者未来购买基金支持寿险可能性的文章中,通过灰度聚类和神经网络利用消费者的基本信息,财产地位信息,风险承受程度将消费者分为了忠实客户和非忠实客户。
基于因子与聚类分析的商洛市乡村旅游游客满意度研究

2018年第 8期·总第 290期
游品牌、加强对乡村旅游从业人员的培养和规范化管理、 多渠道加大对乡村旅游投资的发展路径,指出通过加快 循环经济发展,促进乡村旅游规模化,加大基础设施建设 力度,加强管理提升服务质量,加大宣传力度突出旅游特 色等措施 来 实 现 商 洛 乡 村 旅 游 的 迅 速 发 展 。 [5-7] 张 红 霞、余劲对商洛市内 4个移民安置点和 4个乡村旅游示 范村进行实地调查,分析了目前乡村旅游业发展存在的 问题并提出了相应的对策[8]。张茜对朱家湾村进行实地 调研,分析了该村在美丽乡村建设的背景下,乡村旅游发 展现状与存在的问题,并对该村乡村旅游的可持续发展 提出了对策[9]。
【区域经济】
2018年第 8期·总第 290期
基于因子与聚类分析的商洛市 乡村旅游游客满意度研究
李粉红
(商洛学院 数学与计算机应用学院,陕西 商洛 726000)
[摘 要] 根据游客满意度测评方法,结合商洛市农村旅游的情况,设置商洛市乡村旅游满意度测评的 指标体系,设计调查问卷,通过发放纸质问卷和网络问卷,获得原始数据。运用描述性分析获得各指标的基 本特征,用因子分析建立综合评价模型,依据模型进行排序,分析商洛市乡村旅游的综合满意度,探究不同游 客满意度的差异。应用聚类分析对样本进行分类,结果表明纸质问卷和网络问卷内部一致性较好。并提出 对策建议,为商洛市乡村旅游规划提供一定的参考。 [关键词] 乡村旅游;因子分析;聚类分析;满意度 [中图分类号] F59 [文献标识码] A [文章编号]2095-3283(2018)08-0086-04
StudyontheSatisfactionofRuralTouristinShangluoBasedonFactorandClusterAnalysis LiFenhong
基于聚类分析的顾客细分研究

基于聚类分析的顾客细分研究一、引言在市场经济中,产品的生命周期愈来愈短,平均消费者注意力时限也随之缩短,企业要更好地获得客户忠诚度、了解客户需求和优先满足客户需求的方法,除了招募高质量的人才和展示各种吸引人的广告外,还需要对客户进行深度分析、分割及了解其属性,以便用最合适的方式与其互动,提高营销效果。
本文将以一些列基于聚类分析的顾客细分研究分析来探讨如何更好地将客户分组,以期提高企业的市场表现。
二、聚类分析聚类分析是一种用于将物体或事件划分为不同组的统计分析方法。
与分类分析不同,聚类分析不需要明确的条件,它会根据数据的属性将数据自动分组。
基于聚类分析的顾客细分研究就是用聚类方法把客户划分成不同的组别,每个组别内的客户共享某些特性,从而可以更好地理解客户需求及采取更针对性的营销策略。
在聚类分析中,有两种方法:层次聚类和非层次聚类。
层次聚类是指先形成小的集群,然后将集群合并成较大的集群,直到所有对象都聚在一起,也可逆转聚类的过程,从一堆数据开始将不同类别不断拆分出来。
非层次聚类指不从个体开始分类,而是从已知类别开始分类,如k-means、fuzzy c-means、k-medoids等方法。
三、聚类分析的优点1、不需要人为标注类别,自动分组。
2、可以分析海量数据,表现出突出类别,发掘出个体间的相似性和差异性。
3、聚类分析还可以为进一步的分析提供支持,使分析结果更加准确。
四、应用案例当我们可以纵观客户的数据时,就可以筛选出一些类别,然后为每个类别制定特定的销售策略。
下面介绍几种具体的应用案例,以便更好地理解聚类分析的应用。
1、网站定制个性化推荐根据不同的客户访问历史进行聚类分析,可大致得出各个类别;推荐那些最符合客户需求的网站内容,如商品、新闻、群组等。
2、消费行为分析消费者可以发现他们的消费行为中的共性,而商家可以利用聚类分析筛选客户群体,用更有效、有针对性的营销方案来吸引顾客的消费,以提高客户满意度和经济效益。
基于聚类分析的顾客细分研究

基于聚类分析的顾客细分研究在当今竞争激烈的市场中,企业要想保持竞争力,就必须深入了解顾客的需求和偏好,以便提供更加个性化的产品和服务。
而基于聚类分析的顾客细分研究正是一种有效的方法,可以帮助企业更好地理解不同类型的顾客,为他们量身定制营销策略。
聚类分析是一种无监督学习方法,旨在将相似的个体划分为一类,不同的个体划分为不同的类别。
在顾客细分研究中,聚类分析就是利用顾客的特征,将他们划分为不同的群组,以此来揭示他们之间的差异性和共性。
首先,进行顾客细分研究前,我们需要明确细分的目的和内容。
不同的企业可能有不同的目标,比如发现高价值顾客、寻找新兴市场、优化产品组合等。
明确细分的目的有助于我们在研究中更加关注重要的特征和变量。
接下来,我们需要准备数据并进行预处理。
数据是顾客细分研究的基础,我们需要收集和整理大量的顾客数据。
这些数据可能包括顾客的购买记录、个人信息、反馈和评价等。
在预处理阶段,我们需要对数据进行清洗、缺失值处理和标准化等操作,确保数据的质量和可用性。
然后,我们可以选择适当的聚类算法进行分析。
常见的聚类算法有K均值聚类、层次聚类和密度聚类等。
每个算法都有自己的优缺点和适用范围,选择合适的算法可以更好地揭示顾客之间的差异性。
通过对数据进行聚类分析,我们可以得到若干个不同的顾客群组,每个群组内部的顾客比较相似,而不同群组之间的顾客则相对不同。
在得到聚类结果后,我们可以对不同的顾客群组进行特征分析。
比如,我们可以比较不同群组之间顾客的平均消费金额、购买频率、购买产品种类等,以此来了解他们的购买行为和偏好。
进一步地,我们可以通过调研和访谈等方式获取更多的细节信息,比如顾客的年龄、性别、教育背景、职业等,以此来搭建更为立体的顾客画像。
最后,我们可以根据顾客细分研究的结果,制定相应的营销策略。
对于不同的顾客群组,我们可以量身定制不同的促销活动、产品定价、产品推荐等,以此来更好地满足他们的需求和期望。
同时,我们还可以通过追踪和监测的方式,不断调整和优化营销策略,以达到最佳的市场效果。
统计学中的因子分析与聚类分析

统计学中的因子分析与聚类分析统计学是一门重要的学科,它被应用于各种学术和商业领域。
在统计学中,因子分析和聚类分析是两种常见的数据分析方法。
这两种方法可以帮助人们理解和发现数据中的模式和结构,从而做出科学的决策。
一、因子分析因子分析是一种数据分析方法,它可以帮助人们识别数据中的潜在因素。
这些因素通常是无法直接观察到的,但它们对数据分布和相关性有着重要影响。
因子分析的目的是找出这些隐含的因素,并将它们组合成更小的集合,以便更好地解释和理解数据。
因子分析在市场研究中有着广泛的应用。
例如,当消费者对产品或服务进行评价时,他们可能会考虑多个方面,如价格、质量、信誉等。
通过因子分析,可以将这些多个方面归结为几个因素,如品质、价值等。
用这些因素来衡量产品的综合评价。
在因子分析中,最常用的方法是主成分分析。
主成分分析会在数据集中寻找最大的方差,然后将它们组合成不同的因素。
这些因素是适当排序的,第一个因素是方差最大的因素。
通过这种方法,可以将数据压缩成更小的集合,同时保留数据的关键信息。
二、聚类分析聚类分析是一种将数据集合成有意义的组别的方法,它通常用于数据挖掘和市场分析。
聚类分析可以将数据中的相似项归为一类,而将不同项归为不同类。
聚类分析可以应用于很多领域,例如,制造业可以将生产数据集成为相似生产线的组。
在营销领域,聚类分析可以帮助企业发现相似的客户类型和购买模式。
在聚类分析中,最常见的方法是K-Means算法。
该算法会在数据集中寻找到最优的K个簇心,并将数据分配到最近的簇心中。
这个过程会一直重复,直到满足终止条件。
通过使用K-Means算法,可以将数据划分成多个聚类组,并更容易地理解数据集的组织结构。
三、因子分析与聚类分析的联系和区别因子分析和聚类分析都是数据分析领域中常见的方法。
它们的目的都是帮助人们理解和发现数据中的模式和结构。
但二者还是有所不同。
因子分析主要是通过识别数据中的潜在因素,从而帮助人们更好地理解数据的组织结构。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于因子分析和聚类分析的客户偏好探究一文献综述二十世纪五十年代中期,美国学者温德尔史密斯提出了顾客细分理论。
该理论指出,顾客由于其文化观念、收入、消费习俗等方面的不同可以分为不同的消费群体。
企业在经营中应该针对不同的顾客提供针对性的服务,这样才能够利用有限资源进行有效的市场竞争。
对顾客的细分从方法上讲有根据人口特征和购买历史的细分和根据顾客对企业的价值即基于顾客的消费金额、消费频率的细分。
本文的细分是基于购买历史和人口特征的聚类分析。
饭店作为一个古老的服务行业,在现阶段的高度竞争市场下的发展趋势最重要的方面便是服务趋于个性化,所以针对饭店的消费群体特征的聚类可以对饭店进行定位,在此基础上通过分析目标客户群体对消费质量评价的最主要影响因素可以达到其服务个性化的目标。
波特把顾客的价值定义为买方感知性与购买成本的一种权衡。
对顾客的个性化服务增加了买方的感知度从而加大了他们愿意为此付出的成本,于是饭店便可以增加营业额。
聚类分析是把研究对象视作多维空间中的许多点, 并合理地分成若干类,即一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。
1故聚类算法是对顾客进行分析的一个有效方式。
在聚类分析的众多算法中因子分析是研究如何以最少的信息丢失, 将众多原始变量浓缩成少数几个因子变量, 以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。
2而典型的k-means算法以平方误差准则较好地实现了空间聚类,对于大数据集的处理效率较高。
3在对顾客细分相关文献的研究过程中,主要运用的方法有神经网络,分层聚类,因子分析等方法。
比如,在关于网络青少年用户的分类中,作者用层次聚类的方法,通过对青少年年龄,性别,民族,网络可得性,父母的观点等变量等变量定义不同的上网动机,在此基础上对其进行了分类。
而在研究人寿保险持有者未来购买基金支持寿险可能性的文章中,通过灰度聚类和神经网络利用消费者的基本信息,财产地位信息,风险承受程度将消费者分为了忠实客户和非忠实客户。
在对客户忠诚度的聚类中,作者用RFM的商业模型用DBI确定了Kmeans的最优K值,并最终用kmeans对客户忠诚度进行了聚类。
经过综合分析,我们选择了这两种方法处理顾客数据和饭店的基本资料。
即,通过k-means对客户进行聚类后通过因子分析分析不同类别客户的评价影响因素。
为分析每类客户倾向的饭店特征,本文根据客户聚类结果对饭店数据进行筛选。
由于饭店部分属性之间具有相关性,本文采用因子分析法挖掘其“根本属性”,之后对饭店数据进1李蓉, 李宇. 基与主成分分析与聚类分析方法的我国西部区域划分问题的研究. 科技广场,2李新蕊.主成分分析、因子分析、聚类分析的比较与应用. 山东教育学院学报.3杨善林.kmeans 算法中的k 值优化问题研究系统工程理论与实践行聚类,分析得到每类客户评价得分最高的饭店特征。
二方法论本文选取UCI上的数据(包括饭店、客户、评价得分等信息),旨在通过划分客户群体并分析每一类客户对不同饭店的评价得分,得出每一类顾客选择饭店的倾向,即特定类别客户的喜好和评价饭店时最看重的因素。
将结论应用于指导饭店发展路线与目标客户群间的战略匹配。
具体方法步骤如下:1 根据详细的客户信息对客户进行K-means聚类,总结出每一类客户的显著特点2 客户偏好的研究饭店的多个属性之间存在相互影响的关系,因此本文在研究饭店特点采用因子分析法,将相同本质的属性归入一个因子,既可减少变量的数目,又能得出能够表征饭店属性的影响因子。
在因子分析的基础上,对同类顾客所评价的饭店进行聚类分析,得到每类顾客所选饭店的种类。
然后分析比较各类饭店的特点,选出影响最大的因子(依据系数绝对值大小来判断),参照因子旋转矩阵后即可得到对顾客评分影响最大的饭店属性,从而分析出特定类别顾客在选择、评价一家饭店时的偏好。
Figure 1 研究框架三研究过程(一)顾客聚类分析:在顾客信息的属性中删去User ID,其余属性作为输入字段进行K均值聚类。
模型中的K 值默认为5,但是分类结果中不同类型间的差异较小,随即降低K值进行尝试。
考虑到顾客评分分为0,1,2三个等级,而且K=3时分类结果间的差异较显著,因此将顾客分为三类。
Cluster 1:此类顾客人数最多,出生日期在1986年之后,绝大多数人学生,其次是工作者,主要同家人一起就餐;基本不饮酒;兴趣点主要为technology;绝大多数未婚,性格为thrifty protector Catholic为主;基本不吸烟;公交Cluster 2:此类顾客人数最少,年龄最大,不愿多透漏个人信息(数据中有大量缺失值)。
Cluster 3:此类顾客人数居中,出生年份在1981左右,主要为学生、工作者多与朋友一起就餐,大多属于social drinker。
多数人是单身,但是单身比率高于类型1,性格为hard-worker,car-owner为主。
聚类分析结果如下图所示:Figure 2 顾客的聚类结果(二)顾客偏好分析本文通过分析每类顾客关注饭店的特征提取分析顾客的偏好,从而便于饭店把握顾客需求,指定差异化战略。
1.因子分析i.评价指标的选择及数据预处理影响顾客在饭店消费体验的影响性变量,本文主要筛选如下:alcohol,smoking_ area,dress_ code,accessibili1y,price,Rambience ,Franchise, area, parking, acceptance, other service。
由于因子分析需要数值型数据,本文对饭店数据中定性的变量量化处理。
统计学依据数据的计量尺度将数据划分为三类:定距型数据(Scale)、定序型数据(Ordinal)、定类型数据(Nominal)。
定距型数据通常是指诸如身高、体重、血压等的连续型数据,也包括诸如人数、商品件数等离散型数据;定序型数据具有内在固有大小或高低顺序,职称变量可以有低级、中级、高级三个取值,可以分别用1、2、3等表示,数据间却是不等距的。
测量数值不能直接比较大小,只能比较优先次序。
定类型数据是指没有内在固有大小或高低顺序,一般以数值或字符表示的分类数据。
如性别变量中的男、女取值。
本文采用的数据中,饭店的属性包含多个定序型变量,如other-variance包含none,Internet 和variety三类;Accessibility包括no_accessibility,completely和partially 三类。
本文采用0、1、2代表上述属性中的值,0、1、2代表依次递增,即0表示no_accessibility,1表示partially,2表示completely。
此外,数据集中还有定类型的数据,如franchise有True和false两种取值。
本文中将却是指用该属性取值的平均值替代。
ii.因子分析由于饭店的属性之间部分具有相关性,本文采用spss进行因子分析来消除这种相关性。
对饭店数据库中的影响性变量相关数据进行因子分析,所得结果见Figure 4。
从Figure 4中可以看出,前八个因子的累计方差贡献率已经达到86.028%。
根据累计方差贡献率>85%的标准,本文选择前八个作为因子进行分析。
Figure 4 初始特征矩阵为了更好地赋予所得因子以合理的解释意义,本文进行了因子旋转,因子载荷矩阵见Figure 5,从表中的因子载荷可以看出,第一个因子(F1)可以用来解释price,第二个因子(F2)可以用来解释alcohol,第三个因子(F3)可以用来解释smoking-area,第四个因子(F4)可以用来解释Franchise,第五个因子(F5)可以用来解释Rambience,第六个因子(F6)可以用来解释dress_code,第七个因子(F7)可以用来解释Cuisine,第八个因子(F8)可以用来解释Parking,八大因子的累计方差贡献率可以反映顾客对饭店的满意程度。
Figure 6 因子载荷矩阵根据表,可由因子方差贡献率计算得出因子解释贡献率(因子解释贡献率=因子方差贡献率/总方差贡献率),从而得到各饭店的因子得分数据,具体数据如附录所示。
Figure 7 提取平方和载入矩阵iii.饭店聚类分析为分析每类顾客偏好的饭店类型,本文针对每类顾客评价过的饭店进行聚类分析,希望找出具有不同评分的各类饭店的显著性特征。
本文采用K-means方法对各类顾客评价过的饭店数据进行聚类分析。
以cluster 1客户为例,筛选出cluster 1 客户评分过的饭店因子得分数据,对该部分数据进行聚类分析。
由于顾客对饭店的评分分为三类(0,1,2),此处对饭店聚类K值选取为3.计算每类饭店的客户评分平均值,可得出cluster 1客户最偏好的饭店类别。
通过分析该类饭店的显著性特征,可得出cluster 1客户最偏好的饭店特征。
判断cluster 1 偏好的饭店特征具体步骤如下:1)筛选出cluster 1 评价过的饭店因子得分数据。
2)对该数据应用k-means进行聚类分析,k取值为3.3)分析每类饭店的显著性特征4)计算每类饭店的平均客户评分并对三类饭店进行排名。
5)分析排名第一的饭店(cluster 1 客户最偏好的饭店)的显著性特征。
在解释聚类分析的结果时,本文采取每类累计方差解释度较高的因子解释每类饭店的特征。
综合考虑各类顾客各类饭店的数据分析结果我们可以看到,无论是哪类饭店F4、F5、F6均具有较高的方差解释度,因此可以看出无论是哪类顾客都是比较看重F4、F5、F6这三类因子的,结合Figure 6(因子载荷矩阵),可以分析得出Franchise、Rambience、dress_code 是所有饭店都考虑的普遍性因素。
考虑每类饭店除F4、F5、F6之外的因子影响程度,可分析得出不同顾客对饭店的差异化要求,便于饭店针对顾客指定差异化战略。
对cluster 1 参与评价的饭店评价因子得分数据进行聚类分析,其结果如Figure 8所示。
可以看出除F4、F5、F6之外聚类一饭店的特征还可用F2解释,结合Figure 6,可以分析得出除了cluster 1的顾客对alcohol是较为关注的。
同理聚类二的饭店特征除F4、F5、F6之外还可用F1进行解释,因此cluster 1 的顾客对Price是较为关注的。
聚类三的饭店特征还可用F7进行解释,因此cluster 1 的顾客对Cuisine是较为关注的。
计算三类饭店的客户评分平均值,得到cluster 1的客户对于聚类1的饭店评分是最高的,可以看出可分析得出该类客户是最看重的差异化服务是alcohol。
Figure 8 cluster 1 客户聚类分析结果为分析cluster 2客户的差异化要求,对cluster 2 参与评价的饭店评价因子得分数据进行聚类分析,其结果如Figure 9所示。