典型相关分析及其应用实例
摘要
典型相关分析是多元统计分析的一个重要研究课题.它是研究两组变量之间相关的一种统计分析方法,能够有效地揭示两组变量之间的相互线性依赖关系.它借助主成分分析降维的思想,用少数几对综合变量来反映两组变量间的线性相关性质.目前它已经在众多领域的相关分析和预测分析中得到广泛应用.
本文首先描述了典型相关分析的统计思想,定义了总体典型相关变量及典型
相关系数,并简要概述了它们的求解思路,然后深入对样本典型相关分析的几种算法做了比较全面的论述.根据典型相关分析的推理,归纳总结了它的一些重要性质并给出了证明,接着推导了典型相关系数的显著性检验.最后通过理论与实例分析两个层面论证了典型相关分析的应用于实际生活中的可行性与优越性.
【关键词】典型相关分析,样本典型相关,性质,实际应用
ABSTRACT
The Canonical Correlation Analysis is an important studying topic
of the Multivariate Statistical Analysis. It is the statistical analysis method which studies the correlation between two sets of variables. It can work to reveal the mutual line dependence relation availably between two sets of variables. With the help of the thought about the Principal Components, we can use a few comprehensive variables to reflect the linear relationship between two sets of variables. Nowadays It has already been used widely in the correlation analysis and forecasted analysis.
This text describes the statistical thought of the Canonical Correlation Analysis firstly, and then defines the total canonical correlation variables and canonical correlation coefficient, and sum up
their solution method briefly. After it I go deep into discuss some algorithm of the sample canonical correlation analysis thoroughly. According to the reasoning of the Canonical Correlation Analysis, sum up some of its important properties and give the identification, following it, I infer the significance testing about the canonical correlation coefficient. According to the analysis from the theories and the application, we can achieve the possibility and the superiority from canonical correlation analysis in the real life.
【Key words】Canonical Correlation Analysis,Sample canonical correlation,Character,Practical applications
目录
前言 1
第1章典型相关分析的数学描述 2
第2章典型变量与典型相关系数 3
2.1 总体典型相关 3
2.2 样本典型相关 4
2.2.1 第一对典型相关变量的解法 4
2.2.2 典型相关变量的一般解法 9
2.2.3 从相关矩阵出发计算典型相关 9
第3章典型相关变量的性质 12
第4章典型相关系数的显著性检验 16
第5章典型相关分析的计算步骤及应用实例 19
5.1 典型相关分析的计算步骤 19
5.2 实例分析 20
结语 27
致谢 28
参考文献 29
附录 29
前言
典型相关分析(Canonical Correlation Analysis ,CCA)作为多元统计学的一个重要部分,是相关分析研究的一个主要内容.典型相关分析不仅其方法本身具有重要的理论意义,而且它还可以作为其他分析方法,如多重回归、判别分析和相应分析的工具,因此在多元分析方法中占有特殊的地位.
典型相关的概念是在两个变量相关的基础上发展起来的.我们知道,两个随机变量的相关关系可以用它们的简单相关系数来衡量;一个随机变量与一组随机变量之间的相关关系可以用复相关系数来衡量.但考虑一组随机变量与另一组随机变量的关系时,如果运用两个变量的相关关系,分别考虑第一组每个变量和第二组中每
个变量的相关,或者运用复相关关系,考虑一组变量中的每个变量和另一组变量的相关,这样做比较繁琐,抓不住要领.因此,为了用比较少的变量来反映两组变量之间的相关关系,一种考虑的思路就是类似主成分分析,考虑两组变量的线性组合,从这两个线性组合中找出最相关的综合变量,通过少数几个综合变量来反映两组变量的相关性质,这样便引出了典型相关分析.
典型相关分析的基本思想是首先在每组变量中找出变量的线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与第一对线性组合不相关,而第二对本身具有最大的相关性,如此继续下去,直到两组变量之间的相关性被提取完毕为止.有了这样线性组合的最大相关,则讨论两组变量之间的相关,就转化为只研究这些线性组合的最大相关,从而减少研究变量的个数.
典型相关分析是由Hotelling于1936年提出的.就目前而言,它的理论己经比较完善,计算机的发展解决了典型相关分析在应用中计算方面的困难,成为普遍应用的进行两组变量之间相关性分析技术.如在生态环境方面,用典型相关理论对预报场与因子场进行分析,实现了短期气象预测;借助典型相关,分析了植被与环境的关系;在社会生活领域,应用典型相关分析了物价指标和影响物价因素的相关关系等等.
第1章典型相关分析的数学描述
一般地,假设有一组变量
与另一组变量
,我们要研究这两组变量之间的相关关系,如何给两组变量之间的相关性以数量的描述.
当
1时,就是我们常见的研究两个变量
与
之间的简单相关关系,其相关系数是最常见的度量,定义为:
当
(或
)时,
维随机向量
,设
,
,其中,
是第一组变量的协方差阵,
是第一组与第二组变量的协方差阵,
是第二组变量的协方差阵.则称
为
与
的全相关系数,全相关系数用于度量一个随机变量
与另一组随机变量
的相关系数.
当
时,利用主成分分析的思想,可以把多个变量与多个变量之间的相关化为两个新的综合变量之间的相关.也就是做两组变量的线性组合即
其中,
和
为任意非零向量,于是我们把研究两组变量之间的问题化为研究两个变量
之间的相关问题,希望寻求
,
使
,
之间最大可能的相关,我们称这种相关为典型相关,基于这种原则的分析方法就是典型相关分析.
第2章典型变量与典型相关系数
2.1 总体典型相关
设有两组随机变量
,
,分别为
随机向量,根据典型相关分析的思想,我们用
和
的线性组合
和
之间的相关性来研究两组随机变量
和
之间的相关性.我们希望找到
,使得
最大.由相关系数的定义
易得出对任意常数
,均有
这说明使得相关系数最大的
并不唯一.因此,为避免不必要的结果重复,我们在求综合变量时常常限定
,
于是,我们就有了下面的定义:设有两组随机变量
,
,
维随机向量
的均值向量为零,协方差阵
(不妨设
).如果存在
和
,使得在约束条件
,
下,
则称
是
的典型相关变量,它们之间的相关系数称为典型相关系数;其他典型相关变量定义如下:定义了前
对典型相关变量之后,第
对典型相关变量定义为:如果存在
和
,使得
⑴
和前面的
对典型相关变量都不相关;
⑵
,
;
⑶
的相关系数最大,
则称
是
的第
对(组)典型相关变量,它们之间的相关系数称为第
个典型相关系数(
).
2.2 样本典型相关
以上是根据总体情况已知的情形进行,而实际研究中,总体均值向量
和协方差阵
通常是未知的,因而无法求得总体的典型相关变量和典型相关系数,首先需要根据观测到的样本数据阵对
进行估计.
2.2.1 第一对典型相关变量的解法
设总体
,已知总体的
次观测数据为:
(
),
于是样本数据阵为
若假定
则由参考文献【2】中定理2.5.1知协方差阵
的最大似然估计为
其中
=
,样本协方差矩阵
为:
典型相关分析(CCA)附算法应用及程序演示教学
典型相关分析(C C A)附算法应用及程序
典型相关分析
摘要 利用典型相关分析的思想,提出了解决了当两组特征矢量构成的总体协方差矩阵奇异时,典型投影矢量集的求解问题,使之适合于高维小样本的情形,推广了典型相关分析的适用范围.首先,探讨了将典型分析用于模式识别的理论构架,给出了其合理的描述.即先抽取同一模式的两组特征矢量,建立描述两组特征矢量之间相关性的判据准则函数,然后依此准则求取两组典型投影矢量集,通过给定的特征融合策略抽取组合的典型相关特征并用于分类.最后,从理论上进一步剖析了该方法之所以能有效地用于识别的内在本质.该方法巧妙地将两组特征矢量之间的相关性特征作为有效判别信息,既达到了信息融合之目的,又消除了特征之间的信息冗余,为两组特征融合用于分类识别提出了新的思路.
一、典型相关分析发展的背景 随着计算机技术的发展,信息融合技术已成为一种新兴的数据处理技术,并已取得了可喜的进展.信息融合的3个层次像素级、特征级、决策级。 特征融合,对同一模式所抽取的不同特征矢量总是反映模式的不同特征的有效鉴别信息,抽取同一模式的两组特征矢量,这在一定程度上消除了由于主客观因素带来的冗余信息,对分类识别无疑具有重要的意义 典型相关分析(CanoniealComponentAnalysis:CCA)是一种处理两组随机变量之间相互关系的统计方法。它的意义在于:用典型相关变量之间的关系来刻画原来两组变量之间的关系!实现数据的融合和降维!降低计算复杂程度。 二、典型相关分析的基本思像 CCA 的目的是寻找两组投影方向,使两个随机向量投影后的相关性达到最大。具体讲,设有两组零均值随机变量 () T c ...c c p 21x ,,= 和 () T d ...d d q 21y ,,= CCA 首先要找到一对投影方向1α和1β,使得投影y v 11T β= 和x u 11 T α=之间具有最大的相关性,1u 和1v 为第一对典型变量;同 理,寻找第二对投影方向2α和2β,得到第二对典型变量2u 和2v ,使其与第一对典型变量不相关,且2u 和2v 之间又具有最大相关性。这样下去,直到x 与y 的典型变量提取完毕为止。从而x 与y 之
一次函数经典例题大全
一.定义型 例1. 已知函数是一次函数,求其解析式。 解:由一次函数定义知 , ,故一次函数的解析式为y=-6x+3。 注意:利用定义求一次函数y=kx+b解析式时,要保证k≠0。如本例中应保证m-3≠0。 二. 点斜型 例2. 已知一次函数y=kx-3的图像过点(2, -1),求这个函数的解析式。 解:一次函数的图像过点(2, -1), ,即k=1。故这个一次函数的解析式为y=x-3。 变式问法:已知一次函数y=kx-3 ,当x=2时,y=-1,求这个函数的解析式。 三. 两点型 例3.已知某个一次函数的图像与x轴、y轴的交点坐标分别是(-2, 0)、(0, 4),则这个函数的解析式为_____。 解:设一次函数解析式为y=kx+b,由题意得 ,故这个一次函数的解析式为y=2x+4 四. 图像型 例4. 已知某个一次函数的图像如图所示,则该函数的解析式为__________。 解:设一次函数解析式为y=kx+b由图可知一次函数的图像过点(1, 0)、(0, 2) 有故这个一次函数的解析式为y=-2x+2 五. 斜截型 例5. 已知直线y=kx+b与直线y=-2x平行,且在y轴上的截距为2,则直线的解析式为___________。 解析:两条直线;。当k1=k2,b1≠b2时,
直线y=kx+b与直线y=-2x平行,。 又直线y=kx+b在y轴上的截距为2,故直线的解析式为y=-2x+2 六. 平移型 例6. 把直线y=2x+1向下平移2个单位得到的图像解析式为___________。 解析:设函数解析式为 y=kx+b, 直线y=2x+1向下平移2个单位得到的直线y=kx+b与直线y=2x+1平行 直线y=kx+b在y轴上的截距为 b=1-2=-1,故图像解析式为 七. 实际应用型 例7. 某油箱中存油20升,油从管道中匀速流出,流速为0.2升/分钟,则油箱中剩油量Q(升)与流出时间t(分钟)的函数关系式为___________。 解:由题意得Q=20-0.2t ,即Q=-0.2t+20 故所求函数的解析式为 Q=-0.2t+20()注意:求实际应用型问题的函数关系式要写出自变量的取值范围。 八. 面积型 例8. 已知直线y=kx-4与两坐标轴所围成的三角形面积等于4,则直线解析式为__________。 解:易求得直线与x轴交点为,所以,所以|k|=2 ,即 故直线解析式为y=2x-4或y=-2x-4 九. 对称型 若直线与直线y=kx+b关于 (1)x轴对称,则直线的解析式为y=-kx-b (2)y轴对称,则直线的解析式为y=-kx+b (3)直线y=x对称,则直线的解析式为 (4)直线y=-x对称,则直线的解析式为 (5)原点对称,则直线的解析式为y=kx-b 例9. 若直线l与直线y=2x-1关于y轴对称,则直线l的解析式为____________。 解:由(2)得直线l的解析式为y=-2x-1 十. 开放型 例10. 已知函数的图像过点A(1, 4),B(2, 2)两点,请写出满足上述条件的两个不同的函数解析式,并简要说明解答过程。 解:(1)若经过A、B两点的函数图像是直线,由两点式易得y=-2x+6 (2)由于A、B两点的横、纵坐标的积都等于4,所以经过A、B两点的函数图像还可以 是双曲线,解析式为 (3)其它(略)
函数概念典型例题
函数概念及其表示---典例分析 例1.下列各组函数中,表示同一函数的是( C ). 选题理由:函数三要素。 A. 1,x y y x == B. 11,y x y = += C. ,y x y == D. 2||,y x y == 点评:有利于理解函数概念,强化函数的三要素。 变式: 1.函数f (x )= 2(1)x x x ??+? ,0,0x x ≥< ,则(2)f -=( ). A. 1 B .2 C. 3 D. 4 例2.集合{}22M x x =-≤≤,{}02N y y =≤≤,给出下列四个图形,其中能表示以M 为定义域,N 为值域的函数关系的是( B ). 选题理由:更好的帮助学生理解函数概念,同时也体现函数的重要表示法图像法,图形法是数形结合思想应用的前提。 变式: 1.下列四个图象中,不是函数图象的是(B ). 2.设集合A ={x |0≤x ≤6},B ={y |0≤y ≤2},从A 到B 的对应法则f 不是映射的是( ). A. f :x →y = 1 2x B. f :x →y = 1 3x C. f :x →y =1 4x D. f :x →y =1 6 x A. B. C. D.
函数的表达式及定义域—典例分析 【例1】 求下列函数的定义域: (1)1 21 y x = +-;(2 )y = . 选题理由:考查函数三要素,定义域是函数的灵魂。 解:(1)由210x +-≠,解得1x ≠-且3x ≠-, 所以原函数定义域为(,3)(3,1)(1,)-∞----+∞. (2 )由30 20 x -≥??≠,解得3x ≥且9x ≠, 所以原函数定义域为[3,9)(9,)+∞. 选题理由:函数的重要表示法,解析式法。 变式: 1 .函数y =的定义域为( ). A. (,1]-∞ B. (,2]-∞ C. 11(,)(,1]22-∞-- D. 1 1(,) (,1]2 2 -∞-- 2.已知函数()f x 的定义域为[1,2)-,则(1)f x -的定义域为( ). A .[1,2)- B .[0,2)- C .[0,3)- D .[2,1)- 【例2】已知函数1( )1x f x x -=+. 求: (1)(2)f 的值; (2)()f x 的表达式 解:(1)由121x x -=+,解得13x =-,所以1 (2)3f =-. (2)设11x t x -=+,解得11t x t -= +,所以1()1t f t t -=+,即1()1x f x x -=+. 点评:此题解法中突出了换元法的思想. 这类问题的函数式没有直接给出,称为抽象函数的研究,常常需要结合换元法、特值代入、方程思想等. 变式: 1.已知()f x =2x +x +1,则f =______;f [(2)f ]=______. 2.已知2(21)2f x x x +=-,则(3)f = . 【例 2】 已知f (x )=33x x -+?? (,1) (1,)x x ∈-∞∈+∞,求f [f (0)]的值. 选题理由:分段函数生活重要函数,是考察重点。 解:∵ 0(,1)∈-∞ , ∴ f 又 ∵ >1, ∴ f )3)-3=2+ 12=52,即f [f (0)]=5 2 . 点评:体现了分类讨论思想。 2.某同学从家里到学校,为了不迟到,先跑,跑累了再走余下的路,设在途中花的时间为 t ,离开家里的路程为d ,下面图形中,能反映该同学的行程的是( ).
典型相关分析及其应用实例
摘要 典型相关分析是多元统计分析的一个重要研究课题.它是研究两组变量之间相关的一种统计分析方法,能够有效地揭示两组变量之间的相互线性依赖关系.它借助主成分分析降维的思想,用少数几对综合变量来反映两组变量间的线性相关性质.目前它已经在众多领域的相关分析和预测分析中得到广泛应用. 本文首先描述了典型相关分析的统计思想,定义了总体典型相关变量及典型 相关系数,并简要概述了它们的求解思路,然后深入对样本典型相关分析的几种算法做了比较全面的论述.根据典型相关分析的推理,归纳总结了它的一些重要性质并给出了证明,接着推导了典型相关系数的显著性检验.最后通过理论与实例分析两个层面论证了典型相关分析的应用于实际生活中的可行性与优越性. 【关键词】典型相关分析,样本典型相关,性质,实际应用 ABSTRACT The Canonical Correlation Analysis is an important studying topic of the Multivariate Statistical Analysis. It is the statistical analysis method which studies the correlation between two sets of variables. It can work to reveal the mutual line dependence relation availably between two sets of variables. With the help of the thought about the Principal Components, we can use a few comprehensive variables to reflect the linear relationship between two sets of variables. Nowadays It has already been used widely in the correlation analysis and forecasted analysis. This text describes the statistical thought of the Canonical Correlation Analysis firstly, and then defines the total canonical correlation variables and canonical correlation coefficient, and sum up
函数·典型例题精析
2.2 函数2例题解析 【例1】判断下列各式,哪个能确定y 是x 的函数?为什么? (1)x 2+y =1 (2)x +y 2=1 (3)y =11 --x x 解 (1)由x 2+y =1得y =1-x 2,它能确定y 是x 的函数. (2)x y 1y y x 2由+=得=±.它不能确定是的函数,因为对1-x 于任意的x ∈{x|x ≤1},其函数值不是唯一的. (3)y y x =的定义域是,所以它不能确定是的函数.11 --?x x 【例2】下列各组式是否表示同一个函数,为什么? (1)f(x)|x|(t)(2)f(x)g(x)(x)2=,==,=?t x 2 2 (3)f(x)g(x)(4)f(x)g(x)=2,==2,=x x x x x x +--+--111 11122 解 (1)中两式的定义域部是R ,对应法则相同,故两式为相同函数. (2)、(3)中两式子的定义域不同,故两式表示的是不同函数. (4)中两式的定义域都是-1≤x ≤1,对应法则也相同,故两式子是相同函数. 【例3】求下列函数的定义域: (1)f(x)2 (2)f(x)(3)f(x)=++==x x x x x x x --+----145 3210215 2||
(4)f(x)(4x 5)(1)x 10 4x 0 1x 4{x|1x 4}(2)3x 20x {x|x }=+-由-≥-≥得≤≤.∴定义域是≤≤由->,得>,∴定义域是>812323|| x -???解 (3)10x x 210 |x|503x 7x 5{x|3x 7x 5} 2由--≥-≠得≤≤且≠,∴定义域是≤≤,且≠??? (4)10 |x|0 4x 508x 00x x 8[80)(0)()由-≥≠-≠解得-≤<或<<或<≤∴定义域是-,∪,∪,854545454 8||x ?????? ??? 【例4】已知函数f(x)的定义域是[0,1],求下列函数的定义域: (1)y f (2)y f(2x)f (3)y f ==+=()()()123 2x x x a + 解(1)01x 1x 1f(){x|x 1x 1}由<≤,得≤-或≥,∴的定义域是≤-或≥1 122x x
典型相关分析SPSS例析
典型相关分析 典型相关分析(Canonical correlation )又称规则相关分析,用以分析两组变量间关系的一种方法;两个变量组均包含多个变量,所以简单相关和多元回归的解惑都是规则相关的特例。典型相关将各组变量作为整体对待,描述的是两个变量组之间整体的相关,而不是两个变量组个别变量之间的相关。 典型相关与主成分相关有类似,不过主成分考虑的是一组变量,而典型相关考虑的是两组变量间的关系,有学者将规则相关视为双管的主成分分析;因为它主要在寻找一组变量的成分使之与另一组的成分具有最大的线性关系。 典型相关模型的基本假设:两组变量间是线性关系,每对典型变量之间是线性关系,每个典型变量与本组变量之间也是线性关系;典型相关还要求各组内变量间不能有高度的复共线性。典型相关两组变量地位相等,如有隐含的因果关系,可令一组为自变量,另一组为因变量。 典型相关会找出一组变量的线性组合**=i i j j X a x Y b y =∑∑与 ,称 为典型变量;以使两个典型变量之间所能获得相关系数达到最大,这一相关系数称为典型相关系数。i a 和j b 称为典型系数。如果对变量进 行标准化后再进行上述操作,得到的是标准化的典型系数。 典型变量的性质 每个典型变量智慧与对应的另一组典型变量相关,而不与其他典型变量相关;原来所有变量的总方差通过典型变量而成为几个相互独立的维度。一个典型相关系数只是两个典型变量之间的相关,不能代
表两个变量组的相关;各对典型变量构成的多维典型相关,共同代表两组变量间的整体相关。 典型负荷系数和交叉负荷系数 典型负荷系数也称结构相关系数,指的是一个典型变量与本组所有变量的简单相关系数,交叉负荷系数指的是一个典型变量与另一组变量组各个变量的简单相关系数。典型系数隐含着偏相关的意思,而典型负荷系数代表的是典型变量与变量间的简单相关,两者有很大区别。 重叠指数 如果一组变量的部分方差可以又另一个变量的方差来解释和预测,就可以说这部分方差与另一个变量的方差之间相重叠,或可由另一变量所解释。将重叠应用到典型相关时,只要简单地将典型相关系数平方(2 CR),就得到这对典型变量方差的共同比例,代表一个典型变量的方差可有另一个典型变量解释的比例,如果将此比例再乘以典型变量所能解释的本组变量总方差的比例,得到的就是一组变量的方差所能够被另一组变量的典型变量所能解释的比例,即为重叠系数。 例1:CRM(Customer Relationship Management)即客户关系管理案例,有三组变量,分别是公司规模变量两个(资本额,销售额),六个CRM实施程度变量(WEB网站,电子邮件,客服中心,DM 快讯广告Direct mail缩写,无线上网,简讯服务),三个CRM绩效维度(行销绩效,销售绩效,服务绩效)。试对三组变量做典型相关分析。
高中数学 函数知识点总结与经典例题与解析
函数知识点总结 知识点一、平面直角坐标系 1、平面直角坐标系 在平面内画两条互相垂直且有公共原点的数轴,就组成了平面直角坐标系。 其中,水平的数轴叫做x 轴或横轴,取向右为正方向;铅直的数轴叫做y 轴或纵轴,取向上为正方向;两轴的交点O (即公共的原点)叫做直角坐标系的原点;建立了直角坐标系的平面,叫做坐标平面。 为了便于描述坐标平面内点的位置,把坐标平面被x 轴和y 轴分割而成的四个部分,分别叫做第一象限、第二象限、第三象限、第四象限。 注意:x 轴和y 轴上的点,不属于任何象限。 2、点的坐标的概念 点的坐标用(a ,b )表示,其顺序是横坐标在前,纵坐标在后,中间有“,”分开,横、纵坐标的位置不能颠倒。平面内点的坐标是有序实数对,当b a ≠时,(a ,b )和(b ,a )是两个不同点的坐标。 知识点二、不同位置的点的坐标的特征 1、各象限内点的坐标的特征 点P(x,y)在第一象限0,0>>?y x 点P(x,y)在第二象限0,0>?y x 2、坐标轴上的点的特征 点P(x,y)在x 轴上0=?y ,x 为任意实数 点P(x,y)在y 轴上0=?x ,y 为任意实数 点P(x,y)既在x 轴上,又在y 轴上?x ,y 同时为零,即点P 坐标为(0,0) 3、两条坐标轴夹角平分线上点的坐标的特征 点P(x,y)在第一、三象限夹角平分线上?x 与y 相等 点P(x,y)在第二、四象限夹角平分线上?x 与y 互为相反数 4、和坐标轴平行的直线上点的坐标的特征 位于平行于x 轴的直线上的各点的纵坐标相同。 位于平行于y 轴的直线上的各点的横坐标相同。5、关于x 轴、y 轴或远点对称的点的坐标的特征 点P 与点p ’关于x 轴对称?横坐标相等,纵坐标互为相反数 点P 与点p ’关于y 轴对称?纵坐标相等,横坐标互为相反数
如何在SPSS中实现典型相关分析
如何在SPSS中实现典型相关分析? SPSS 11.0 15.1 典型相关分析 15.1.1方法简介 在相关分析一章中,我们主要研究的是两个变量间的相关,顶多调整其他因素的作用而已;如果要研究一个变量和一组变量间的相关,则可以使用多元线性回归,方程的复相关系数就是我们要的东西,同时偏相关系数还可以描述固定其他因素时某个自变量和应变量间的关系。但如果要研究两组变量的相关关系时,这些统计方法就无能为力了。比如要研究居民生活环境与健康状况的关系,生活环境和健康状况都有一大堆变量,如何来做?难道说做出两两相关系数?显然并不现实,我们需要寻找到更加综合,更具有代表性的指标,典型相 关(CanonicalCorrelation)分析就可以解决这个问题。 典型相关分析方法由Hotelling提出,他的基本思想和主成分分析非常相似,也是降维。即根据变量间的相关关系,寻找一个或少数几个综合变量(实际观察变量的线性组合)对来替代原变量,从而将二组变量的关系集中到少数几对综合变量的关系上,提取时要求第一对综合变量间的相关性最大,第二对次之,依此类推。这些综合变量被称为典型变量,或典则变量,第1对典型变量间的相关系数则被称为第1典型相关系数。一般来说,只需要提取1~2对典型变量即可较为充分的概括样本信息。 可以证明,当两个变量组均只有一个变量时,典型相关系数即为简单相关系数;当一组变量只有一个变量时,典型相关系数即为复相关系数。故可以认为典型相关系数是简单相关系数、复相关系数的推广,或者说简单相关系数、复相关系数是典型相关系数的特例。 15.1.2引例及语法说明 在SPSS中可以有两种方法来拟合典型相关分析,第一种是采用Manova过程来拟合,第二种是采用专门提供的宏程序来拟合,第二种方法在使用上非常简单,而输出的结果又非常详细,因此这里只对它进行介绍。该程序名为Canonical correlation.sps,就放在SPSS的 安装路径之中,调用方式如下: INCLUDE 'SPSS所在路径\Canonical correlation.sps'. CANCORR SETl=第一组变量的列表 /SET2=第二组变量的列表. 在程序中首先应当使用include命令读入典型相关分析的宏程序,然后使用cancorr名称调用,注意最后的“.”表示整个语句结束, 不能遗漏。 这里的分析实例来自曹素华教授所著《实用医学多因素统计分析方法》第176页:为了研究兄长的头型与弟弟的头型间的关系,研究者随机抽查了25个家庭的两兄弟的头长和头宽,资料见文件canoncor.sav,希望求得两组变量的典型变量及典型相关系数。显然,代表兄长头形的变量为第一组变量,代表弟弟头形的变量为第二组变量,这里希望求得的是两组变量间的相关性,在语法窗口中键入的程 序如下: INCLUDE 'D:\SpssWin\Canonical correlation.sps'. 请使用时改为各自相应的安装目录 CANCORR SETl=longlwidthl 列出第一组变量 /SET2=long2width2. 列出第二组变量 选择菜单Run->All,运行上述程序,结果窗口中就会给出典型相关分析的结果。 15.1.3 结果解释 NOTE:ALL OUTPUT INCLUDING ERROR MESSAGES HAVE BEEN TEMPORARILY SUPPRESSED.IF YOU EXPERIENCE UNUSUAL BEHAVIOR THEN RERUN THIS
函数的基本性质(考点加经典例题分析)
函数的基本性质(考点加经典例题分析)