14 SAS中对应分析(含因子分析、典型相关分析作业解答)

合集下载

SAS学生智力因子分析

SAS学生智力因子分析

学生智力因子分析摘要:因子分析是指研究从变量群中提取共性因子的统计技术。

最早由英国心理学家C.E.斯皮尔曼提出。

他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。

因子分析可在许多变量中找出隐藏的具有代表性的因子。

将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

本文通过对40名学生的12项智力指标进行因子分析,找出潜在的因子。

关键词:因子分析,潜在因子,智力一、背景分析二、研究目标某研究收集了40名学生的12项智力指标。

这12项指标分别为常识(x1)、类同(x2)、计算(x3)、词汇(x4)、理解(x5)、数字广度(x6)、填图(x7)、图片排列(x8)、积木(x9)、拼图(x10)、译码(x11)和迷津(x12)。

将原始数据经过标准化处理后,计算其相关系数矩阵,结果列在下表中,试进行探索性因子分析,找出潜在因子,并找出其支配的指标。

三、数据描述1.sas程序data ex17_2 (type=corr);infile cards missover; input _name_ $3. x1-x12; _type_='Corr';if _n_=1 then _type_='N'; else _type_='Corr';cards;df 40 40 40 40 40 40 40 40 40 40 40 40x1 1.000 . . . . . . . . . . .X2 0.6904 1.000 . . . . . . . . . .X3 0.4115 0.4511 1.000 . . . . . . . . .X4 0.4580 0.7068 0.4018 1.000 . . . . . . . .X5 0.5535 0.6620 0.4122 0.7119 1.000 . . . . . . .X6 0.3923 0.6317 0.4520 0.4583 0.5299 1.000 . . . . . .X7 0.1415 0.3009 0.2025 0.2665 0.2480 0.1590 1.000 . . . . . X8 0.0077 0.0344 0.1855 0.1065 0.0003 0.1100 0.3595 1.000 . . ..X9 0.2385 0.3523 0.3646 0.3644 0.3388 0.3982 0.5004 0.3314 1.000 .. .x10 0.0333 0.1726 0.1311 0.1757 0.1998 0.0342 0.5758 0.1420 0.28081.000 . .x11 0.0898 0.3878 0.2041 0.3191 0.3186 0.2914 0.2537 0.2025 0.39710.1468 1.000 .x12 0.2215 0.2427 0.4124 0.2169 0.1459 0.0985 0.4222 0.2156 0.50160.2286 0.0776 1.000;run;proc factor data=ex17_2 rotate=varimax reorder;var x1-x12;run;2.输出结果这是用主成分分析法提取初始公因子的第一部分结果,相关矩阵特征值总和为12 (指标数),前4个特征值都大于1,下面将根据这4个较大的特征值提取4个相应的初始公因子.含有4个公因子的初始公因子模型为:X1=0.63945F1-0.39857F2-0.30050F3-0.14330F4…X12=0.47558F1+ 0.44754F2 -0.58084F3+ 0.00825F4第1~第4个公因子能解释的方差分别为4.5719767、1.8813496、1.0527141和1.0214560。

SAS使用学习笔记(对应分析)

SAS使用学习笔记(对应分析)

SAS使用学习笔记(对应分析)1对应分析是不仅研究变量之间的关系、还要研究样品之间的关系。

它通过在同一个直角坐标系内同时表达出变量与样品两者之间的相互关系。

2对应分析例子下面是某研究者收集到的资料,试分析各种基因频率与民族之间的关系。

各民族下面的小数是44种基因出现的频率。

基因型(JY)藏族(Z) 尼泊尔(N) 印度(Y) 汉族(H)。

程序:DATA b;INPUT jy $ 1-3 z 6-11 n 14-19 y 22-27 h 30-35;cards;A1 0.0308 0.01800.11900.0149A2 0.3333 0.10700.14800.3492A3 0.0204 0.01900.10100.0176A9 0.3037 0.27900.15600.1414A100.0409 0.01800.03900.0313A110.1354 0.42200.12600.2977A280.0000 0.01800.08300.0094A300.0413 0.00000.00000.0217A310.0518 0.03700.02200.0121A320.0000 0.01900.03900.0013A330.0000 0.06700.08300.0608B5 0.2828 0.11800.13400.0825B7 0.0000 0.01900.08000.0244B8 0.0102 0.01180.04500.0094B120.0102 0.03700.06600.0121B130.0102 0.07700.00600.0650B140.0000 0.00000.00600.0013B150.1923 0.25400.09600.1092B180.0050 0.02800.02200.0000B270.1067 0.00000.02600.0204B350.0626 0.05700.14800.0342B370.0102 0.01800.00900.0067B380.04650.0470 0.00300.0015B390.01020.0000 0.00900.0176B460.01020.00900.00000.1813B480.05720.15000.00300.0108B500.01020.01800.03700.0000B530.00500.0000 0.00600.0000B540.01530.00000.00000.0176B550.05720.02800.02600.0217B560.01020.00900.00600.0040B570.00500.01800.03900.0341B580.00000.06700.03300.0139B600.06260.02800.02200.0723B610.08990.00000.08300.1080B700.00500.00000.00800.0000C1 0.08990.03700.02300.1716C2 0.02040.00000.07300.0397C3 0.17980.10700.08300.3269C4 0.16510.07700.13400.0495C5 0.00000.00900.01600.0054C6 0.02560.24500.04500.0081C7 0.17120.21800.11900.1152C8 0.00500.00000.00400.0027;run;PROC CORRESP data=b OUTC=ccc;VAR z n y h;LABEL z='藏族'n='尼泊尔'y='印度'h='汉族';ID jy;RUN;DATA ccc;SET ccc;X=dim1;Y=dim2;XSYS ='2';YSYS ='2';TEXT =jy;SIZE =2;LABEL X='Dimension 1'Y='Dimension 2';keep X Y TEXT XSYS YSYS SIZE;RUN;PROC GPLOT DATA=ccc;SYMBOL1V=#;AXIS1LENGTH=5 IN ORDER=-1.3 TO 1.3 BY 0.2;AXIS2LENGTH=5 IN ORDER=-1.3 TO 1.3 BY 0.2;PLOT Y*X=1 / ANNOTATE=ccc FRAME HAXIS=AXIS1VAXIS=AXIS2 HREF=0VREF=0;RUN;输出:The CORRESP ProcedureInertia and Chi-Square DecompositionSingular Principal Chi- CumulativeValue Inertia Square Percent Percent 8 16 24 32 40----+----+----+----+----+---0.42302 0.17895 1.83072 41.61 41.61 **************************0.39266 0.15418 1.57736 35.85 77.46 **********************0.31137 0.09695 0.99184 22.54 100.00 **************Total 0.43007 4.39992 100.00Degrees of Freedom = 129SAS 系统 2008年05月04日星期日下午02时39分56秒 The CORRESP ProcedureRow CoordinatesDim1 Dim2A1 0.5878 0.8300A2 -0.4233 0.1209A3 0.5708 0.7845A9 0.0741 -0.1562A10 -0.0466 0.2818A11 0.0191 -0.3738A28 0.8269 0.8844A30 -0.7954 0.0516A31 0.1126 -0.1366A32 0.9506 0.5206A33 0.2931 0.1666B5 -0.0085 0.0766B7 0.5508 0.7576B8 0.5282 0.6647B12 0.6453 0.3736B13 -0.1439 -0.5749B14 0.6310 1.2240B15 0.1193 -0.3016B18 0.8250 -0.1198B27 -0.3381 0.2782B35 0.4306 0.4728B37 0.2494 -0.2481B38 0.1990 -0.6104B46 -1.2499 0.0376B48 0.4093 -0.9132B50 0.7714 0.4510B53 0.3664 0.8090B54 -0.9706 0.0684B55 -0.0427 0.0207B56 0.1278 -0.1051B57 0.0754 0.3742B58 0.6482 -0.3801B60 -0.4505 0.0137B61 -0.3745 0.4819B70 0.4748 0.9100C1 -0.7041 0.0091C2 0.0968 0.8397C3 -0.5193 0.0178C4 0.1452 0.2307C5 0.5711 0.3791C6 0.7305 -0.8444C7 0.1169 -0.1805C8 -0.1612 0.5353SAS 系统 2008年05月04日星期日下午02时39分56秒 The CORRESP ProcedureSummary Statistics for the Row PointsQuality Mass InertiaA1 0.9966 0.0179 0.0431A2 0.9583 0.0916 0.0431A3 0.9744 0.0154 0.0347A9 0.3838 0.0860 0.0156A10 0.8715 0.0126 0.0027A11 0.6324 0.0959 0.0494A28 0.9068 0.0108 0.0406A30 0.5695 0.0062 0.0160A31 0.1562 0.0120 0.0056A32 0.9073 0.0058 0.0174A33 0.2820 0.0206 0.0193B5 0.0274 0.0603 0.0304B7 0.7996 0.0121 0.0308B8 0.9666 0.0075 0.0129B12 0.9043 0.0122 0.0175B14 0.9031 0.0007 0.0035B15 0.8864 0.0637 0.0176B18 0.9645 0.0054 0.0090B27 0.1832 0.0150 0.0364B35 0.9998 0.0295 0.0281B37 0.9998 0.0043 0.0012B38 0.5599 0.0096 0.0164B39 0.9636 0.0036 0.0040B46 0.6708 0.0196 0.1062B48 0.9847 0.0216 0.0511B50 0.9990 0.0064 0.0118B53 0.7205 0.0011 0.0027B54 0.9637 0.0032 0.0073B55 0.0150 0.0130 0.0045B56 0.3142 0.0029 0.0006B57 0.3852 0.0094 0.0083B58 0.7578 0.0111 0.0193B60 0.9902 0.0181 0.0086B61 0.9992 0.0275 0.0238B70 0.8576 0.0013 0.0036C1 0.9447 0.0314 0.0383C2 0.9242 0.0130 0.0234C3 0.9069 0.0681 0.0471C4 0.3959 0.0416 0.0182C5 0.6915 0.0030 0.0047C6 0.9669 0.0316 0.0949C7 0.9160 0.0609 0.0072C8 0.7360 0.0011 0.0011SAS 系统 2008年05月04日星期日下午02时39分56秒 The CORRESP ProcedurePartial Contributions to Inertia for the Row PointsDim1 Dim2A1 0.0345 0.0798A2 0.0918 0.0087A3 0.0281 0.0616A9 0.0026 0.0136A10 0.0002 0.0065A11 0.0002 0.0869A28 0.0412 0.0547A30 0.0218 0.0001A31 0.0009 0.0015A32 0.0293 0.0102A33 0.0099 0.0037B5 0.0000 0.0023B7 0.0204 0.0449B8 0.0116 0.0214B12 0.0285 0.0111B13 0.0018 0.0332B14 0.0016 0.0069B15 0.0051 0.0376B18 0.0204 0.0005B27 0.0096 0.0075B35 0.0306 0.0428B37 0.0015 0.0017B38 0.0021 0.0231B39 0.0059 0.0040B46 0.1711 0.0002B48 0.0202 0.1168B50 0.0212 0.0084B53 0.0008 0.0046B54 0.0169 0.0001B55 0.0001 0.0000B56 0.0003 0.0002B57 0.0003 0.0085B58 0.0261 0.0104B60 0.0205 0.0000B61 0.0215 0.0414B70 0.0016 0.0068C1 0.0871 0.0000C2 0.0007 0.0595C3 0.1026 0.0001C4 0.0049 0.0144C5 0.0054 0.0028C6 0.0944 0.1463C7 0.0047 0.0129C8 0.0002 0.0021SAS 系统 2008年05月04日星期日下午02时39分56秒 The CORRESP ProcedureIndices of the Coordinates that Contribute Most to Inertia for the Row PointsDim1 Dim2 BestA1 2 2 2 A2 1 0 1 A3 2 2 2 A9 0 0 2 A10 0 0 2 A11 0 2 2 A28 2 2 2 A30 1 0 1 A31 0 0 2 A32 1 0 1 A33 0 0 1 B5 0 0 2 B7 0 2 2 B8 0 0 2 B12 1 0 1 B13 0 2 2 B14 0 0 2 B15 0 2 2 B18 0 0 1 B27 0 0 1 B35 2 2 2 B37 0 0 2 B38 0 0 2 B39 0 0 1 B46 1 0 1 B48 0 2 2 B50 0 0 1 B53 0 0 2 B54 0 0 1 B55 0 0 1 B56 0 0 1 B57 0 0 2 B58 1 0 1 B60 0 0 1 B61 2 2 2 B70 0 0 2 C1 1 0 1 C2 0 2 2 C3 1 0 1 C4 0 0 2 C5 0 0 1 C6 2 2 2 C7 0 0 2C8 0 0 2SAS 系统 2008年05月04日星期日下午02时39分56秒 The CORRESP ProcedureSquared Cosines for the Row PointsDim1 Dim2A1 0.3329 0.6637A2 0.8860 0.0723A3 0.3373 0.6371A9 0.0705 0.3133A10 0.0232 0.8483A11 0.0016 0.6307A28 0.4230 0.4838A30 0.5671 0.0024A31 0.0632 0.0931A32 0.6979 0.2094A33 0.2131 0.0689B5 0.0003 0.0270B7 0.2765 0.5231B8 0.3742 0.5924B12 0.6773 0.2270B13 0.0341 0.5446B14 0.1896 0.7135B15 0.1198 0.7666B18 0.9445 0.0199B27 0.1092 0.0739B35 0.4533 0.5465B37 0.5025 0.4972B38 0.0538 0.5061B39 0.6037 0.3599B46 0.6702 0.0006B48 0.1647 0.8200B50 0.7445 0.2545B53 0.1227 0.5979B54 0.9589 0.0048B55 0.0122 0.0029B56 0.1874 0.1268B57 0.0150 0.3701B58 0.5639 0.1939B60 0.9893 0.0009B61 0.3762 0.6230B70 0.1835 0.6741C1 0.9445 0.0002C2 0.0121 0.9121C3 0.9058 0.0011C4 0.1123 0.2836C5 0.4801 0.2115C6 0.4139 0.5530C7 0.2707 0.6453C8 0.0612 0.6748SAS 系统 2008年05月04日星期日下午02时39分56秒 The CORRESP ProcedureColumn CoordinatesDim1 Dim2藏族 -0.2025 0.0083尼泊尔 0.3658 -0.5460印度 0.4529 0.5754汉族 -0.5915 0.0430Summary Statistics for the Column PointsQuality Mass Inertia藏族 0.1413 0.2629 0.1777尼泊尔 0.9737 0.2630 0.2713印度 0.9815 0.2274 0.2888汉族 0.7697 0.2468 0.2622Partial Contributions to Inertia for the Column PointsDim1 Dim2藏族 0.0602 0.0001尼泊尔 0.1967 0.5086印度 0.2606 0.4883汉族 0.4825 0.0030Indices of the Coordinates that Contribute Most to Inertia for the Column PointsDim1 Dim2 Best藏族 0 0 1尼泊尔 2 2 2印度 2 2 2汉族 1 0 1 Squared Cosines for the Column PointsDim1 Dim2藏族 0.1411 0.0002尼泊尔 0.3016 0.6721印度 0.3754 0.6060汉族 0.7657 0.0040说明:根据Column CoordinatesDim1 Dim2藏族 -0.2025 0.0083尼泊尔 0.3658 -0.5460印度 0.4529 0.5754汉族 -0.5915 0.0430,我们可以得到:藏族=-0.202490Dim1+0.008300Dim2尼泊尔= 0.365818Dim1-0.546045Dim2印度= 0.452903Dim1+0.575439Dim2汉族=-0.591500Dim1+0.042981Dim2在以dim1与dim2作为横轴与纵轴的直角坐标系内,每个变量就是1个点,如Z(藏族)点的坐标为(-0.202490,0.008300)。

SAS典型相关分析

SAS典型相关分析
第九章 典型相关分析 §9.1 引言 典型相关分析是研究两组变量之间相关关系的一种统计分析方法,它能够真正反映两 组变量之间的相互线性依赖关系。 例如,F.V.Waugh(1942)研究了美国 1921 年至 1940 年每年牛肉、猪肉的价格与按人 口平均的牛肉和猪肉的消费量之间的相互关系, 可归结为研究这两组变量之间的相互依赖关 系。采用典型相关分析,可由第一组变量构造一种价格指数,由第二组变量构造一种消费量 指数, 这两种指数分别为这两组变量的典型变量, 而后研究这两种指数间的相互关系。 又如, 在工厂里常常要研究产品的 q 个质量指标( y1 , y 2 ,L , y q )与原材料的 p 个质量指标
5
S S12 S S 21 a i = S S12 S S 21S a i
-1 11 -1 22 -1 11 -1 22 1 1 1 - æ ö -1 2 2 ÷ = S112 ç S S S S S a 11 12 22 21 11 i ç ÷ è ø
1 2 11 -
= S112 r i2a i æ -1 ö 2 ÷ = r i2 ç S a 11 i ç ÷ è ø 2 = r i ai
¢
1 2 11
1 2 22
1
1
1
1
= =
1 ¢ -2 -1 S12 S 222 b 1 b 1 S 22 S 21 S11 r1
1
1
1 1 ö 1 ¢æ -2 -1 2 ÷ S S S S S b1 ç 22 21 11 12 22 b 1 ÷ ç r1 è ø 1 ¢ 2 = b1 r1 b1 r1
(9.1.10)
(
)
1 æ 1 -1 ö 2 2 ÷ = r i2 ç S S S ç r 11 12 22 b i ÷ è i ø 2 = ri ai

SPSS软件中对应分析

SPSS软件中对应分析

对应分析当A 与B 的取值较少时,把所得的数据放在一张列联表中,就可以很直观的对A 与B 之间及它们的各种取值之间的相关性作出判断,当ij P 较大时,则说明属性变量A 的第i 状态与B 的第j 状态之间有较强的依赖关系.但是,当A 或者B 的取值比较多时,就很难正确的作出判断,此时就需要利用降维的思想简化列联表的结构.几个基本定义:我们此处讨论因素A 有n 个水平,因素B 有p 个水平。

行剖面:当变量A 的取值固定为i 时(i=1,2,…,n ),变量B 的各个状态相对出现的概率情况,即:可以方便的把第i 行表示成在p 维欧氏空间中的一个点,其坐标为:),,,(..2.1i ip i i i i rip p p p p p p = ,i=1,2,… , n ,实际上,该坐标可以看成p 维超平面121=+++p x x x 上的点。

记n 个行剖面的集合为n(r)。

由于列联表行与列的地位是对等的,由上面行剖面的定义方法,可以很容易的定义列剖面。

列剖面:),,,(..2.1j njj j j j cjp p p p p p p = ,j=1,2,… , p,实际上,该坐标可以看成n 维超平面121=+++n x x x 上的点。

记p 个列剖面的集合为p(c)。

定义了行剖面和列剖面之后,我们看到属性变量A 的各个取值情况可以用p 维空间的n 个点来表示,而B 的不同取值情况可以用n 维空间上的p 个点来表示。

而对应分析就是利用降维思想,把A 的各个状态表现在一张二维图上,又把B 的各个状态表现在一张二维图上,且通过后面的分析可以看到,这两张二维图的坐标有着相同的含义,即可以把A 的各个取值与B 的各个取值同时在一张二维图上表示出来。

距离:通过行剖面与列剖面的定义,A 的不同取值可以利用P 维空间中的不同点表示,各个点的坐标分别为ri P (i=1,2,…,n )。

而B的不同取值可以用n 维空间中的不同点表示,各个点的坐标分别为cj P (j=1,2,…,p )。

对应分析与典型相关分析

对应分析与典型相关分析

17
对应分析基本思想
v λ ... v λ 1m m 11 1 O M = ( λ1 v1 ,..., λm vm ), AR = M v λ L v p1 1 pm λm
u11 λ1 ... u1m λm AQ = M O M = ( λ1 u1,..., λm um ), un1 λ1 L unm λm
由于SR和 具有相同的非零特征值 具有相同的非零特征值, 由于 和SQ具有相同的非零特征值,而这些特征值又正好是各个 公共因子的方差,因此可以用相同的因子轴 相同的因子轴同时表示变量点和样品 公共因子的方差,因此可以用相同的因子轴同时表示变量点和样品 即把变量点和样品点同时反映在具有相同坐标轴的因子平面上, 点,即把变量点和样品点同时反映在具有相同坐标轴的因子平面上, 以便对变量点和样品点一起考虑进行分类。 以便对变量点和样品点一起考虑进行分类。
如果SR的特征值 如果 的特征值 λ i 对应的标准化特征向量为 vi , 则SQ的特征值 λi 对应的标准化特征向量: 的特征值 对应的标准化特征向量: 1 ui = Zv i
λi
由此可以方便地由R型因子分析而得到 型因子分析的结果 由此可以方便地由 型因子分析而得到Q型因子分析的结果。由SR的特征值和 型因子分析而得到 型因子分析的结果。 的特征值和 特征向量即可以写出R型因子分析的因子载荷矩阵 记为AR) 型因子分析的因子载荷矩阵( 特征向量即可以写出 型因子分析的因子载荷矩阵(记为 )和Q型因子分析的 型因子分析的 因子载荷矩阵(记为AQ): 因子载荷矩阵(记为 ):
3
引例1. 引例1.
下表为2006年年底我国 个省市按照行业(这里仅列出12 年年底我国31个省市按照行业 这里仅列出12 下表为 年年底我国 个省市按照行业( 个行业)城镇单位就业人数, 个行业)城镇单位就业人数,在一定程度上可以反映该地 区的经济结构。 区的经济结构。 我国地域辽阔,东西南北发展不平衡,是否按照地域划分 我国地域辽阔,东西南北发展不平衡,是否按照地域划分 就合理了呢? 就合理了呢? 自然地理位置对经济结构的影响固然重要,但是数据分析 自然地理位置对经济结构的影响固然重要,但是数据分析 显然更有说服力。 显然更有说服力。

SAS入门对应分析

SAS入门对应分析

一. 对应分析
在因子分析中,或者只对变量(列中的变量)进 行分析,或者只对样品(观测值或行中的变量) 进行分析;而且利用载荷图来描述各个变量之间 的接近程度。
典型相关分析也只研究列中两组变量之间的关 系。
然而,在很多情况下,所关心的不仅仅是行或 列本身变量之间的关系,而是行变量和列变量各 水平间的相互关系;这就是因子分析等方法所没 有说明的了。
§9.1 行轮廓和列轮廓
• 一、列联表 • 二、对应矩阵 • 三、行、列轮廓
一、列联表
• 其中, n i j 是第 i 行、第 j 列类别组合的频数,
q
i 1 ,2 ,,p ,j 1 ,2 ,,q ;n i n ij为第i 行的频数之 j1
p
和,i1,2, ,p; n j nij 为第 j 列的频数之和, i1
三、行点和列点相近的意涵
• 如果一个行点和一个列点相近,则表明行、列两 个变量的相应类别组合发生的频数会高于这两个 变量相互独立情形下的期望值。
例9.4.1
• 在例9.1.1中,经计算,奇异值、主惯性以及贡献 率等的计算结果列于表9.4.1中。总惯量的94.75% 可由第一维来解释,前二维解释了高达99.76%的 总惯量,几乎解释了列联表数据的所有变差。
0.174 0.180
0.234 0.213
0.161 0.149
0.118 0.149
0.221 0.154 0.242 0.201 0.183
列轮廓矩阵为
0.239 0.199 0.188 0.136 0.097
CPDc100..327211
0.366 0.226
0.367 0.201
0.366 0.204
Inertia and Chi-Square Decomposition

SAS统计之第十章-因子分析

SAS统计之第十章-因子分析

正交旋转
正交旋转是一种比较简单的方法, 它将因子矩阵进行正交变换,使 得每个因子只与一个原始变量的 相关性较高,与其他变量的相关 性较低。
斜交旋转
斜交旋转是一种更复杂的方法, 它可以使得一个因子与多个原始 变量的相关性较高,但与其他变 量的相关性较低。
因子的解释
因子的解释
因子的解释是根据实际背景和专业知 识,对每个因子的含义进行解释。解 释时需要综合考虑原始变量的含义和 因子的相关性。
03
解释性。
实例分析
01
为了更好地理解PROC Factor过程,我们将通过一个实例来演示其应 用。
02
假设我们有一个包含多个变量的数据集,并且我们想要提取两个公因 子来解释这些变量之间的相关性。
03
我们将使用PROC Factor过程进行因子分析,并选择适当的选项来提 取两个公因子。
04
分析结果将包括因子载荷表、因子图和轮廓图等输出,以帮助我们理 解公因子和变量之间的关系。
04 因子分析的注意事项
因子分析的前提假设
因子分析的前提假设是数据应具有相关 性。在进行因子分析之前,需要检查变 量之间的相关性,以确保分析的有效性。
因子分析的前提假设是变量应具有共同因子。 共同因子是指多个变量之间存在的共同因素, 这些因素反映了变量之间的共同变化趋势。
因子分析的前提假设是变量应具有 可解释性。在进行因子分析之前, 需要对变量进行解释性分析,以确 定变量之间的潜在关系和共同因素。
因子命名
根据解释结果,可以对每个因子进行 命名,使其更加符合实际背景和专业 知识。命名时需要简洁明了,能够准 确地反映因子的含义。
03 因子分析的SAS实现
Байду номын сангаас

因子分析及对应分析

因子分析及对应分析

2012-12-13 2012-12-13
5 5
在满足以上假定的条件下,就有:
cov( X i , X j ) E (ai F gi )(a j F g j ) ai a j var F ai a j
于是,有
cov( X i , X j ) cov( X i , X k )

aj ak
2012-12-13 2012-12-13
6 6
因为 a i 是一个常数,与 gi 相互独立且 F 与 X i 的方差均被假定为1。 F 于是有 1 ai2 var( gi )
因此,常数a i 的意义就在于其平方表示了公共因子F 解释X i 的方 2 差的比例,因此被称之为因子载荷,而 a i 被称作共同度。 对Spearman的例子进行推广,假定每一门科目的考试成绩都受 到 m个公共因子的影响及一个特殊因子的影响,于是上式就变 成了如下因子分析模型的一般形式:
x* a 1 1 f 1 a 1 2 f 2 a 1 p f p c 1 g 1 1 * x 2 a 2 1 f 1 a 2 2 f 2 a 2 p f p c 2 g2 x* a f a f a f c g , m1 1 m2 2 m p p m m m where E ( f j ) 0 , D( f j ) 1, E ( g i ) 0 , D( g i ) 1
X i ai 1 F1 ai 2 F2 aim Fm gi
2012-12-13 2012-12-13
7 7
X 式中, i为标准化后的第 i 门科目的考试成绩,均值为0,方差为 1。F1 , F2 , , Fm 是彼此独立的公共因子,都满足均值为0,方差 为1。gi为特殊因子,与每一个公共因子均不相关且均值为0。 则ai 1 , ai 2 , , aim 为对第 i 门科目考试成绩的因子载荷。对该模型, 有: 2 2 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档