(整理)因子分析与聚类分析案例.
聚类和因子分析

一种是输出树形图(Dendrogram)
树形图以树的形式展现聚类分析的每一次合并过程, SPSS首先将各类之间的距离换到 0~25之间,然后再近似 地表示在图上。树形图可以粗略地表现聚类的过程。选中 Dendrogram项,即可输出树形图。
一种是输出冰柱图(Icicle)
冰柱图通过表格中的“X”符号显示,其样子很像冬天房 屋下的冰柱。SPSS默认输出聚类全过程的冰柱图(ALL clusters)。 选择Specified range of clusters项,并输入从第 几类开始显示 (Start:),到第几类结束显示(Stop),中间 几个几类(By:),则可以指定显示聚类中某一阶段的冰柱 图。如果选择None则不输出冰柱图。
在Measure框中选择计算样本距离的方法,选项如下: interval适合于连续性变量,系统提供8种方法供用户 选择 1 Euclidean distance,欧氏距离。 2 Squared Euclidean distance(系统默认方式),欧氏距 离平方。 3 Cosine:变量矢量的余弦,这是模型相似性的度量。 4 Pearson correlation:相关系数距离,适用于R型聚类。 5 Chebychev,Chebychev距离。 6 Block:City-Block或Manhattan距离。 7 Minkowski,Minkowski距离。 8 Customized, 362.1 1,156.1 1,440.0
绢云绿泥片岩
褐铁矿化片岩 绢云绿泥片岩 绢云绿泥片岩 绢云绿泥片岩
17
18 19 20 21
0.31
0.45 0.56 0.95 0.27
18.7
92.7 102.4 100.4 67.0
因子分析、聚类分析

主轴和主成分
正如二维椭圆有两个主轴, 正如二维椭圆有两个主轴 , 三维椭球 有三个主轴一样, 有几个变量, 有三个主轴一样 , 有几个变量 , 就有 几个主轴。 几个主轴。 和二维情况类似, 和二维情况类似 , 高维椭球的主轴也 是互相垂直的。 是互相垂直的。 这些互相正交的新变量是原先变量的 线 性 组 合 , 叫 做 主 成 分 (principal component)。 。
hi =
∑a
j =1
ij
成绩数据( 成绩数据(student.txt) )
100个学生的数学、物理、化学、语文、历史、 个学生的数学、物理、化学、语文、历史、 个学生的数学 英语的成绩如下表(部分) 英语的成绩如下表(部分)。
SPSS数据形式 数据形式
目前的问题是, 目前的问题是,能否把这个数据的 6 个变量用一两个综合变量来表示 呢? 这一两个综合变量包含有多少原来 的信息呢? 的信息呢? 能否利用找到的综合变量来对学生 排序或据此进行其他分析呢? 排序或据此进行其他分析呢?
空间的点
例中数据点是六维的; 例中数据点是六维的;即每个观测 值是6维空间中的一个点 维空间中的一个点。 值是 维空间中的一个点 。 希望把 6维空间用低维空间表示。 维空间用低维空间表示。 维空间用低维空间表示 先假定只有二维,即只有两个变量, 先假定只有二维,即只有两个变量, 由横坐标和纵坐标所代表; 由横坐标和纵坐标所代表; 每个观测值都有相应于这两个坐标 轴的两个坐标值; 轴的两个坐标值;
1 2 3
p
x2 = a21 f1 + a22 f 2 + ......a2 k f k + µ2 ..................................................... x p = a p1 f1 + a p 2 f 2 + ......a pk f k + µ p 用矩阵表示为X = AF + ε
因子分析教育学案例(3篇)

第1篇摘要:因子分析作为一种统计方法,在教育学研究中具有广泛的应用。
本文通过一个具体案例,展示了因子分析在教育学研究中的应用过程,包括研究背景、研究方法、数据分析、结果解释和结论等环节。
通过对某教育项目效果的评估,揭示了教育干预的关键因素,为教育实践提供了科学依据。
关键词:因子分析;教育学;教育项目;效果评估;关键因素一、研究背景随着教育改革的不断深入,教育项目层出不穷,如何评估教育项目的效果成为教育研究者关注的焦点。
传统的评估方法往往依赖于主观判断,难以全面、客观地反映教育项目的实际效果。
因子分析作为一种多变量统计分析方法,能够从众多变量中提取出少数几个公共因子,揭示变量之间的内在联系,为教育项目的效果评估提供科学依据。
二、研究方法本研究以某教育项目为例,运用因子分析的方法对该项目的效果进行评估。
研究步骤如下:1. 文献回顾与变量选择:通过查阅相关文献,确定影响教育项目效果的关键因素,如课程设置、教学方法、师资力量、学生参与度等。
2. 数据收集:采用问卷调查的方式,收集教育项目实施前后学生、教师和家长的反馈数据。
3. 数据整理:对收集到的数据进行整理和清洗,确保数据的准确性和可靠性。
4. 因子分析:运用统计软件(如SPSS)进行因子分析,提取影响教育项目效果的关键因子。
5. 结果解释:根据因子分析结果,解释关键因子的含义,分析其对教育项目效果的影响。
三、数据分析1. 样本描述:本研究共收集有效问卷300份,其中学生问卷200份,教师问卷100份。
2. 因子分析结果:(1)提取因子:通过主成分分析,提取了3个公共因子,累计方差贡献率为63.8%。
(2)因子命名:根据因子载荷,将3个公共因子命名为“课程与教学”、“师资力量”和“学生参与度”。
(3)因子解释:- “课程与教学”因子:包括课程设置、教学方法、教学资源等变量,表明课程与教学是影响教育项目效果的重要因素。
- “师资力量”因子:包括教师的专业素养、教学能力、敬业精神等变量,表明师资力量对教育项目效果具有显著影响。
实验 聚类分析与因子分析

实验聚类分析一、实验目的学习利用SPSS进行聚类分析。
二、实验内容及实验步骤(一)系统聚类法(Hierarchical Cluster过程)实验内容:29名儿童的血红蛋白(g/100ml)与微量元素(μg/100ml)测定结果如下表。
由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。
编号N0. 钙X1镁X2铁X3锰X4铜X5血红蛋白X61 2 3 4 5 6 7 8 910111213141516171819202122232425262728 54.8972.4953.8164.7458.8043.6754.8986.1260.3554.0461.2360.1769.6972.2855.1370.0863.0548.7552.2852.2149.7161.0253.6850.2265.3456.3966.1273.8930.8642.6152.8639.1837.6726.1830.8643.7938.2034.2337.3533.6740.0140.1233.0236.8135.0730.5327.1436.1825.4329.2728.7929.1729.9929.2931.9332.94448.70467.30425.61469.80456.55395.78448.70440.13394.40405.60446.00383.20416.70430.80445.80409.80384.10342.90326.29388.54331.10258.94292.80292.60312.80283.00344.20312.500.0120.0080.0040.0050.0120.0010.0120.0170.0010.0080.0220.0010.0120.0000.0120.0120.0000.0180.0040.0240.0120.0160.0480.0060.0060.0160.0000.0641.0101.6401.2201.2201.0100.5941.0101.7701.1401.3001.3800.9141.3501.2000.9181.1900.8530.9240.8171.0200.8971.1901.3201.0401.0301.3500.6891.15013.5013.0013.7514.0014.2512.7512.5012.2512.0011.7511.5011.2511.0010.7510.5010.2510.009.759.509.259.008.758.508.258.007.807.507.2529 47.31 28.55 294.70 0.005 0.838 7.00实验步骤:1.建立数据文件。
【免费下载】因子分析与聚类分析在消费者生活形态研究中的应用

对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行高中资料试卷调整试验;通电检查所有设备高中资料电试力卷保相护互装作置用调与试相技互术关,系电,力根通保据过护生管高产线中工敷资艺设料高技试中术卷资,配料不置试仅技卷可术要以是求解指,决机对吊组电顶在气层进设配行备置继进不电行规保空范护载高与中带资负料荷试下卷高问总中题体资,配料而置试且时卷可,调保需控障要试各在验类最;管大对路限设习度备题内进到来行位确调。保整在机使管组其路高在敷中正设资常过料工程试况中卷下,安与要全过加,度强并工看且作护尽下关可都于能可管地以路缩正高小常中故工资障作料高;试中对卷资于连料继接试电管卷保口破护处坏进理范行高围整中,核资或对料者定试对值卷某,弯些审扁异核度常与固高校定中对盒资图位料纸置试,.卷保编工护写况层复进防杂行腐设自跨备动接与处地装理线置,弯高尤曲中其半资要径料避标试免高卷错等调误,试高要方中求案资技,料术编试交写5、卷底重电保。要气护管设设装线备备置敷4高、调动设中电试作技资气高,术料课中并3中试、件资且包卷管中料拒含试路调试绝线验敷试卷动槽方设技作、案技术,管以术来架及避等系免多统不项启必方动要式方高,案中为;资解对料决整试高套卷中启突语动然文过停电程机气中。课高因件中此中资,管料电壁试力薄卷高、电中接气资口设料不备试严进卷等行保问调护题试装,工置合作调理并试利且技用进术管行,线过要敷关求设运电技行力术高保。中护线资装缆料置敷试做设卷到原技准则术确:指灵在导活分。。线对对盒于于处调差,试动当过保不程护同中装电高置压中高回资中路料资交试料叉卷试时技卷,术调应问试采题技用,术金作是属为指隔调发板试电进人机行员一隔,变开需压处要器理在组;事在同前发一掌生线握内槽图部内 纸故,资障强料时电、,回设需路备要须制进同造行时厂外切家部断出电习具源题高高电中中源资资,料料线试试缆卷卷敷试切设验除完报从毕告而,与采要相用进关高行技中检术资查资料和料试检,卷测并主处且要理了保。解护现装场置设。备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况,然后根据规范与规程规定,制定设备调试高中资料试卷方案。
SPSS管理统计 课程设计 因子分析和聚类分析

一:实验名:实验四二:实验要求:练习上课讲过(第10-12章)的例子。
(无需写实验报告)三:实验步骤:1、使用“网购数据”文件进行以下分析。
1.1 产生因子:商品感知风险、网页展示质量、网络安全、卖家信誉、服务质量、便捷性、所属平台质量、以往经验、网络购物意向。
实验步骤:1)读取数据“网购数据”,依次点击analyze--data reduction—factor,弹出小窗口,将“感知风险”以及以下的四列添加到Test Variable(s)中,如图1.11所示2)再点击score按钮,选择“save as variables”选项,如图1.12所示,点击continue 返回。
3)此时data view界面就会出现如图1.13所示列,用相同方法将其余的各组因子归类,如图1.14所示,使其增加了9列fac1_1..9 。
图1.11 因子分析主窗口图1.12 因子分析子窗口图1.13新增因子实验结果:图 1.14 ,如图所示,产生“商品感知风险、网页展示质量、网络安全、卖家信誉、服务质量、便捷性、所属平台质量、以往经验、网络购物意向”9项因子图1.141.2 分别对网络购物意向与商品感知风险、网页展示质量、网络安全、卖家信誉、服务质量、便捷性、所属平台质量、以往经验的相关分析。
实验步骤:1)依次点击analyze--data reduction—factor,弹出小窗口,将“fac_1”以及以下的9列因子添加到Test Variable(s)中,如图1.21所示2)点击descriptives按钮,弹出小窗口,选上“KMO and…sphericity ”选项,(即KMO 测度和巴特利特球体检验)如图1.22,点击continue返回。
3)点击extraction按钮,探出小窗口,在display框中选上scree plot(显示碎石图)如图1.23。
点击continue返回。
4)点击score按钮,选择“save as variables”选项,下面的method小框被激活,系统默认为regression选项(回归方法),如图1.24所示,点击continue返回。
因子分析和聚类分析实例解译

地球化学数据因子分析和聚类分析实例解译编写人:刘红杰QQ:498236930内蒙古第三地质矿产勘查开发院第*节元素组合(元素的共生组合特征)及分类特征元素组合是元素亲合性在地质体内的具体表现,而元素亲合性又与地质环境有关[16]。
确定成矿及伴生元素的组合特征是确定成矿最佳地球化学标志元素组合的前提,为了研究本区元素的共生组合规律和区域成矿的特点,我们对全区的样品进行了相关分析,聚类分析和因子分析。
具体结果如下:一、相关分析作为地质作用的微观结果,地球化学信息必然与地质信息相关连。
相关分析是一种简单而直接的研究元素亲合性的方法。
本次研究对所测13个元素进行了相关分析,用新疆金维软件计算了各元素之间的相关系数,计算之前首先对原始数据进行标准化,计算结果见表1。
表1 阿尔山市三十公里等三幅1:5万化探相关系数矩阵Pb Mn Cu Sn Mo Ag Zn Co W As Bi Hg AuPb 1 0.2786 0.0813 0.1417 0.191 0.358 0.4656 -0.0455 0.1938 0.047 0.1198 0.0616 0.0054 Mn 1 0.1315 0.1385 0.0768 0.195 0.4076 0.2994 0.098 0.0991 0.0339 0.0751 0.0012 Cu 1 -0.0189 0.0198 0.2198 0.2738 0.4897 -0.0296 0.0644 0.0413 0.0192 0.1754 Sn 1 0.2043 0.133 0.1401 -0.0795 0.3298 0.046 0.1488 0.0452 -0.0166 Mo 1 0.1883 0.067 -0.0397 0.2436 0.201 0.2649 0.1648 0.0788 Ag 1 0.2594 -0.0032 0.1693 0.1534 0.2909 0.2333 0.1169 Zn 1 0.2384 0.1364 0.0191 0.0784 0.0269 0.007 Co 1 -0.1361 0.0544 -0.0401 -0.0383 -0.0113 W 1 0.1694 0.1807 0.0779 0.0145 As 1 0.0331 0.0308 0.0638 Bi 1 0.7183 -0.0082 Hg 1 0.0275 Au 1由表1可知:Pb与Zn、Ag、Mn呈正强相关;W与Mo、Sn呈明显正相关. Bi与Mo、Ag 元素之间呈正相关, Hg、Bi元素呈显著正相关。
基于因子分析和聚类分析的城市竞争力综合评价研究——以广西为例

3.1 聚类分析方法的原理与步骤聚类分析是用于解决分类问题的多元统计分析方法,是根据事物本身的特性对被研究对象进行分类,使同一类中个体有较的相似性,不同类中的个体有较大的差异。
本文采用系统聚类分析方法,它是聚类分析中应用最为广泛的一种方法,具体步骤为:(1)选取每个城市的竞争力综合得分进行分类;(2)采用欧氏距离测度14个城市之间的样本距离;(3)选用组平法计算类间的距离,并对样本进行归类。
3.2 广西城市综合竞争力的聚类分析在因子分析的基础上,本文根据广西14个地级市的综合得分,采用系统聚类法对广西城市综合竞争力进行分析,根据系统聚类树状图及表3各地市因子综合得分,将广西城市综合竞争力水平从高到低划分为四个梯度类型区(表4),并按照四个梯度类型对每一个类型区各因子得分和综合得分的平均值进行计算。
类别城市均值F F F F F P第Ⅰ类型区南宁 3.348 -0.037 0.703 -0.080 1.153 1.781第Ⅱ类型区柳州、桂林0.173 0.669 1.647 1.451 0.256 0.564第Ⅲ类型区梧州、北海玉林-0.250 0.939 -0.197 0.932 0.732 -0.012第Ⅳ类型区贵港、钦州、百色、河池、来宾、贺州、防城港、崇左-0.368 -0.515 -0.275 -0.003 -0.479 -0.3513.3 广西城市综合竞争力空间格局特征分析从表5中可以看出广西城市综合竞争力水平空间差异明显,桂南的南宁城市综合竞争力水平最强,桂东北的桂林、柳州城市综合竞争力水平仅次于南宁,属于城市综合竞争力较强的区域中心城市,桂东的梧州和玉林、桂南的北海城市综合竞争力处于居中的地位,桂西部的城市综合竞争力水平普遍偏低,各个类型区域的特征如下:3.3.1 第Ⅰ类型区——城市综合竞争力较强的全区中心城市该类型区仅包括位于桂南的南宁一个城市。
南宁的城市综合竞争力位居全区首位,从表5可以知道,其F1的值为3.348,F5的值为1.153,远高于其它类型区的平均值,综合得分为1.781,排在第一位,但F2、F4的得分落后于Ⅱ、Ⅲ类型区的均值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 因子分析与聚类分析理论简介1.1 因子分析法因子分析法是一种通过分析多个变量间协方差矩阵(或相关系数矩阵)的内部依赖关系,找出能代表所有变量的少数几个随机变量的计量分析方法。
其中,找出的几个随机变量是不可测量的,将其称为公因子。
每个公因子之间是互不相关的,所有变量都可以由这几个公因子的线性表示。
因子分析通过减少变量的数目,用少数因子代替所有变量去分析整个经济问题,大大简化了现实分析过程。
假设有N 个样本,P 个指标,()TP X X X X ,,,21⋅⋅⋅=是随机向量,需要寻找的公因子是()Tm F F F F ,,,21⋅⋅⋅=,则将模型112121111ε++⋅⋅⋅++=m m F a F a F a X 222221212ε++⋅⋅⋅++=m m F a F a F a X...p m pm p p p F a F a F a X ε++⋅⋅⋅++=2211称为因子模型。
将矩阵()ij a A =称为因子载荷矩阵,将ij a 称为因子载荷(Loading ),因子载荷的实质是公因子Fi 与变量Xj 的相关系数。
其中,ε为特殊因子,代表公因子以外的影响因素,在实际分析时一般忽略不计。
对于需要求出的的公因子,其实际含义取决于该公因子在哪些变量上有较大的载荷。
但一般情况下,初始因子模型的因子载荷矩阵都比较复杂,不利于因子的解释。
因此可进一步通过因子旋转,给出对各公因子更加合理明显的解释。
公因子求出后,可以进一步用回归估计等方法求出各个公因子得分的数学模型,将其表示成变量的线性形式,从而计算求出得分。
模型如下:n in i i i X b X b X b F +⋅⋅⋅++=2211 (i = 1,2,...,m )1.2 层次聚类法聚类分析的实质是按照距离的远近将数据分为若干个类别,以使得类别内数据的“差异”尽可能小,类别间的“差异”尽可能大。
“差异”的描述是通过距离或相似性的方法来描述。
在统计学中最常用的是距离表达式欧几里得距离,对于两条数据),,(111z y x 和),,(222z y x ,欧几里得距离的计算公式是:221221221)()()()2,1(z z y y x x Euclid -+-+-=本文应用的是聚类分析法中的层次分析法,选用的是欧几里得距离的计算方法。
层次分析法通过把距离接近的数据一步一步归为一类,直到数据数据完全归为一个类别为止,再利用一些相应的指标来确定聚为几类的结果是最为合适的。
显然,这一系列的聚类结果存在着嵌套,或者说是层次的关系,由于这种结果上的层次关系,整个分析过程,特别是每一步中完成的合并或分割都可以用一张二维空间的图形来表示,这种图被称为“树状图”,是层次聚类法结果解释的重要工具。
本文也将利用这一工具对我国商业银行竞争力水平进行研究。
2 股份制商业银行竞争力的实证分析2.1 样本数据的选取和处理一、样本选取本文评价的是我国股份制商业银行的竞争力,以我国国有商业银行和城市商业银行的比较研究得出我国股份制商业银行竞争力的优势与劣势。
由于数据选取的局限性(在本文写作过程中,各家商业银行还未全部公布2009年年报),本文数据主要来自于各商业银行的年报数据[44]以及各家银行网站披露相关信息,因此鉴于数据搜集原因,本文采用了2008年的股份制商业银行、国有商业银行和城市商业银行的的数据。
同时由于无法获得中国光大银行、广东发展银行、恒丰银行、浙商银行和渤海银行等五家银行的财务报表(这五家股份制商业银行不是上市商业银行,非上市银行披露的数据一般不具有全面性和及时性,真实度也较差),所以本文最终研究的是7家股份制商业银行:中信银行、华夏银行、深圳发展银行、招商银行、上海浦东发展银行、兴业银行、民生银行。
同理,本文选取了4家国有商业银行1作为比较研究对象:中国工商银行、中国银行、中国建设银行和交通银行。
考虑到已上市城市商业银行也具有一定的竞争力,在某些方面有借鉴之处,且代表了城市商业银行的新兴力量,因此将已上市的3家城市商业银行纳入股份制商业银行竞争力对比研究当中,作为比较研究对象,这3家已上市城市商业银行为:北京银行、上海银行、南京银行。
二、指标的标准化在指标处理前,先要对原始数据标准化,标准化后的变量为X*i,j ,即第i 个银行的j 指标,具体的标准化如下:对于正指标:ij ij ij ij ij X manX X X X min min *--=对于逆指标:ijij ij ij ij X X X X X min max max *--=其中,正指标与银行竞争力得分呈正相关关系,相应的逆指标与竞争力得分成负相关关系。
标准化消除了正逆指标的影响,正指标原本越大,处理后也越大,逆指标情况则相反。
2.2 实证分析2.2.1 因子分析运用SPSS 软件对原始指标数据进行实证分析,可以得到相关系数矩阵及变量共同度表,见表 2.1,分析可得所有变量的共同度都比较大。
变量共同度说明了全部公因子反映出原变量信息的百分比,描述了全部公因子对变量X 的总方差所做的贡献。
较大的变量共同度说明变量空间转化为因子空间时,保留了比较多的信息。
12008年中国银监会我国银行业的最新分类将交通银行从股份制商业银行划转为国有商业银行。
所以进行因子分析是有依据的。
表 2.1 变量共同度表对SPSS软件产生的总方差分析表进行整理,可以得到表 2.2的各因子对原始指标数据的贡献率。
表 2. 2 因子分析特征值及方差贡献率表Tab. 2.2 Eigen value and variance contribution of factor analysis table 因子特征值方差贡献率(%)累计贡献率(%)F1 7.25827.916 27.916F2 4.93018.960 46.876F3 2.898 11.145 58.021F4 2.788 10.722 68.743F5 2.767 10.644 79.387F6 2.323 8.936 88.323 由上表2.2可知,因子F1~F6对原始指标数据的累计贡献率达到88.323%,超过了85%的标准,其特征值也较大,均超过1的标准;同时,因子中F1的方差贡献率最大,为27.916%,其次是F2,为18.960%,说明因子F1和F2是银行竞争力因素中更重要的因素。
通过SPSS软件产生的碎石图可以更直观的挑选出特征值较大的因子,从第F7开始,折线趋于平缓。
因此,我们选择Fl~F6作为决定商业银行竞争力的公因子。
图2.1 碎石图从SPSS 软件我们可以得到因子F1~F6的载荷矩阵()ij a A =。
因子载荷ij a 是实际上就是公因子Fi 和变量Xj 的相关系数,表示变量Xj 依赖因子Fi 的程度,反映变量Xj 对于公因子Fi 的重要性。
因此,因子载荷ija 的绝对值越大,表示变量Xj对公因子Fi 越重要。
通过正交旋转得到的因子载荷矩阵,即表 2.3,可以进一步明确因子的具体意义。
表 2.3 正交旋转后的因子载荷矩阵Tab. 2.3 Orthogonal rotated factor loading matrix指标因子1 2 3456资产利润率X1 0.220 0.741 0.167 0.500 0.046 0.016 净资产收益率X2 0.007 -0.074 -0.058 0.970 0.076 0.060 每股收益X3 -0.268 -0.052 0.185 0.862 -0.001 0.140 人均利润率X4 -0.308 0.593 0.016 0.563 -0.447 -0.051 营业费用率X5 0.471 0.603 0.049 0.031 -0.437 -0.123 资本充足率X6 0.020 0.962 -0.066 -0.153 -0.113 0.074 核心资本充足率X7 0.086 0.955 -0.014 -0.198 -0.064 0.011 不良贷款率X8 -0.672 -0.177 0.658 0.089 -0.137 0.133 贷款损失准备率X9 0.508 0.354 -0.692 0.297 -0.040 -0.028 最大客户贷款比率X10 0.110 -0.137 0.046 0.083 0.928 -0.049 十大客户贷款比率X11 0.355 -0.215 -0.015 0.017 0.823 -0.236 人民币流动性比率X12 -0.322 0.468 -0.156 0.095 -0.413 -0.319 外币流动性比率X13 -0.1180.8730.079 0.053 -0.107 0.303存贷比X14 0.757 0.469 0.006 -0.264 -0.157 0.142 现金资产比率X15 -0.429 0.013 -0.235 -0.175 0.452 -0.546 总资产X16 0.919 -0.047 -0.192 -0.088 0.179 -0.191 机构网点数X17 0.919 -0.047 -0.192 -0.088 0.179 -0.191 存款份额X18 0.935 -0.132 -0.180 0.004 0.193 -0.091 贷款份额X19 0.925 -0.159 -0.198 0.014 0.204 -0.118 存款增长率X20 -0.169 0.161 0.896 0.102 0.113 0.079 贷款增长率X21 -0.487 0.310 0.667 0.084 0.004 0.233 股权集中程度X22 -0.507 0.011 0.204 0.015 -0.156 0.789 股东集中程度X23 -0.137 0.220 0.006 0.108 -0.004 0.876 流通股占比X24 -0.583 -0.316 0.269 0.179 -0.204 0.336 非利息收入占比X25 0.234 0.109 -0.507 -0.392 0.388 -0.001 本科以上学历员工占比X26-0.856-0.2520.2470.1640.098-0.175根据上表,得到因子模型:X1 = 0.220 F1 + 0.741 F2 + …… + 0.046 F5 + 0.016 F6 X2 = 0.007 F1 — 0.074 F2 + ……+ 0.076 F5 + 0.060 F6 ……X24 = 0.234 F1 + 0.109 F2 + ……+ 0.388 F5 — 0.001 F6 X25 = -0.856 F1 — 0.252 F2 + ……+ 0.098 F5 — 0.175 F6从因子模型可以看出,因子F1的总资产、机构网点数、存款份额、贷款份额、本科学历以上员工占比、存贷比的系数分别为0.919、0.919、0.935、0.925、0.856、0.757,远大于其他变量的系数,所以因子F1主要是代表银行规模、市场占有率、人力资源以及流动性的因子;因子F2的资本充足率、核心资本充足率、外币流动性比率、资产利润率、人均利润率、营业费用率的系数分别为0.962、0.955、0.873、0.741、0.593、0.603,大于其他变量的系数,所以因子F2主要代表的是资本充足度、流动性和盈利性因子;因子F3的存款增长率、贷款增长率、不良贷款率、贷款损失准备率、非利息收入占比的系数分别为0.896、0.667、0.658、0.692、0.507,远大于其他变量的系数,所以F3主要反映银行的市场份额增长率、资产质量以及创新能力;因子F4的净资产收益率、每股收益的系数分别为0.970、0.862,显著大于其他变量的系数,所以F4主要反映银行的盈利性;因子F5的最大客户贷款比例、十大客户贷款比例的系数分别为0.928、0.823,远大于其他变量的系数,所以F5主要代表银行的贷款集中度;因子F6的股权集中程度、股东集中程度的系数分别为0.789、0.876,远大于其他变量的系数,所以F6主要反映银行公司治理情况。