统计学专业基础课与专业课之间的典型相关分析
大学本科基础课和专业课关系的相关分析法研究

・2 ・ 2 9
大学 本 科基础课 和专业课关 系 的相 关分析 法研究
刘宏 亮 伊广丽
( 尔滨师范大学 数 学科 学学院, 哈 黑龙江 哈 尔滨 10 0 ) 5 0 0 摘 要: 针对 大学本科 的基础课 和专业课 相关关 系问题 , S S系统 支持 下, 在 A 运用相 关分析 法分析 了大学基础课 和专业课的定量 关 系, 出了基础课 中相 对重要 的课程 因素 。 找 关键词 : 相关分析 ; 显著性检验 ;A 系统 SS
9 9
B 6 B 6 , 7 8 6
l 曲
B B l ∞ , 7 9 , ‘i 孵 咒 鹤
a 2
8, 3 ‘ 02 81 t, #
0
,l
B 8
7 i
5l 3{ 7i ‘2 5‘ e6
4 0
一
关键 词 : 流 ; 河 防洪 ; 治理
6 . m~18 9 设 计流量 4 . ~ 9 m 。主要建 设规 模为 : 防 48 2 0 . m, 5 8m 8 17  ̄ 堤 1 社 会经 济状况 . 1 加固工程 6 . m, 3 k 其中小黄河堤防长 4 . m, 9 7 k 回水堤总长 1. m, 9 6 k 新建 0 集贤县地处黑龙江省东北部 , 区划面积 2 8. 23 4平方公里, 5 3 上堤 引道 7 , 道 3 。总工程量 为 : 方 18 4 0m。 辖 镇 处 错车 0处 总土 3. ×1 8 乡 ,5 19个行 政村 , 两个 同营农 场 , 总人 口 3 万 人 , 2 是全 国产粮 大 县 、 黑 3结论 龙 江 省重 要 的 商品粮 基地 之 一 , “ 有 中国大 豆浸 油 之 乡 ” 的美 誉 。2 0 07 集贤县小黄河河近期治理工程除有一定的经济效益外,还具有社 年, 在黑龙江省 6 个县( 社会经济指标综合排名第 l 位。2 0 年 , 会 、 6 市) 3 08 环境效益和促进地区经济发展等综合效益。 伞县地区生产总值预计实现 4 -亿元, 6 8 同比噌长 1%。 7 3 经济效 益 . 1 集贤县地处三江平原腹地 , 网络密集 , 交通 同三、 、 依饶 双桦等高等 该工程总投资 2 8. 万元, 44 0 6 国家投资 19 . 万元(O , 贤县 40 6 7 6 %) 集 级公路贯穿全境,铁路客货运输通达全国各地 ,空运距佳木斯机场仅 自 9 3 4万元(0 。 筹 9. 8 4 %)国民经济评价的影子投资应扣除计划利润和税 4k , 0 i 水运毗邻佳木斯 、 、 、 n 同江 富锦 饶河等对俄 贸易 口岸 , 是三江平原 金 、工程 占地税费,调整后的影子总投资为 2 0. 3 5 2万元 ,年运行费 0 的交通枢纽和双鸭山市的门户。集贤县是农业大县 ,耕地总面积 13 9 . 万元 , 9. 3 9 8 8 流动资金为 1 . 万元 , 7 88 多年平均效益为 3 7 5万元 , 8. 5 经济 万亩, 盛产大豆、 、 、 玉米 水稻 烤烟、 甜菜和白瓜籽等。 内部收益率为 1. 大于 8 经济效益费用比为 2 8大于 1 , 6 %, 8 %, ., 0 . 经济净 0 l 丁程现 状 - 2 现 值为 3 8 万元 。 48 自1 8 年开始, 99 集贤县升昌镇在小黄河中游修建堤防 3 k ,9 9 . i 19 6n 32社会效 益 . 年二道河小f农业综合开发项 目上马, , N- 游修建堤防长 3 . m, ) c d ̄' F 9k 4 堤防设计标准下保护居民 8 0 2 0人, 耕地面积 1.X14卣, 8 0 1 因此堤 直接入黑鱼泡。小黄河堤防现状长 4 . i,平均堤高 1 0 7k 9n . m,堤顶宽 防达标后对保护区内的社会安定 、 7 人民安居乐业 、 国民经济持续稳定发 2 一 m, m 6 现状防御洪水能力为十年一遇标准。 该段堤防断面单薄, 险工隐 展起着重要的作用。主要表现在以下几个方面: 患多, 同时还有多处堤防缺 口没有堵死 , 一遇洪水沿线耕地就受灾。目 前 防洪工程避免了大量人 口伤亡及对其亲友造成的精神痛苦 ; 避免大 小黄河防洪能力薄弱 , 主要存在的问题是 : 一是现有堤防断面防洪标准 量灾 民流离失所给社会带来的动荡, 避免或减轻大洪水防汛抢险救灾给 低, 防御洪水能力差 ; 二是在大兴村附近有部分堤防已经冲毁, 已无 防御 社会正常生产、 生活造成的影响 ; 减少贫困人 口; 对促进人民安居乐业和 洪水能力 ; 三是中游大兴村以上段河道冲刷严重, 两侧经常踏岸 , 造成土 文化、 教育、 科学事业的发展及推进精神文明建设起积极的作用。 地 流失 。 3 环境效 益 _ 3 1 31程建设的必要 减轻或免除洪灾 , 为人民提供稳定生产 、 生活的环境 ; 避免洪水泛滥 洪水灾害比较频繁 , 洪水造成的损失相当严重 , 每次防汛抢险都消 可能产生的瘟疫流行、 水质恶化 、 生态环境恶化的严重危害。 耗国家及人民大量的人力 、 物力和财力; 本次小黄河堤防防护 区以乡村 综上所述 , 集贤县小黄河近期治理工程有显著的经济效益和社会及 为主, 防护 总面积 3 .万卣, 中耕地面积 1.万亩。因此 , 2 3 其 8 1 本次小黄 生态环境效益 , 并具有一定的抗风险能力, 该项 目经济上是合理可行的。 河堤防近期治理工程不仅保护集贤县腰屯乡人 民的生命财产安全, 而且 而且小黄河近期治理规划项 目实施后 ,可使小黄河防洪能力得到增强 , 对集贤县经济的可持续发展也有着举足轻重的作用。 洪涝灾害得到有效防范 , 流域内人民生命财产和经济社会发展的防洪安 2工程 规模与布 置 全保障问题得到初步解决。 对保护耕地, 保障粮食生产 , 改善当地人民群 本次集 贤县小黄河近期治理工程拟对小黄河堤防提高防洪标准 、 众的生产条件, 提高其生活质量 , 都将起到巨大作用。 『高培厚 , J l j 堤防现状堤线 、 堤距布置合理 , 因此本次设计维持现状小黄河 作 者简 介 : 闫冬 (9 9 , ~ , , 江 省富 锦 市人 , 程 师 , 1751 )男 黑龙 1 工 主要 堤线 、堤距不变。丁程实施后 防洪标准达到二十年一遇 ,设计水位 从事农田水利工程设计。
统计学相关分析实训报告

一、实训背景统计学作为一门应用广泛的学科,在各个领域都发挥着重要作用。
为了更好地掌握统计学知识,提高实际应用能力,我们组织了本次统计学相关分析实训。
通过本次实训,我们能够将理论知识与实际操作相结合,提高统计分析的技能。
二、实训目的1. 熟悉相关分析的基本概念和原理;2. 掌握相关分析的方法和步骤;3. 学会运用相关分析方法解决实际问题;4. 提高统计学在实际工作中的应用能力。
三、实训内容1. 相关分析的基本概念和原理(1)相关分析的定义:相关分析是研究两个或多个变量之间是否存在关系以及关系密切程度的一种统计分析方法。
(2)相关系数:相关系数是衡量两个变量之间相关程度的指标,其取值范围为-1到1。
当相关系数为1时,表示两个变量完全正相关;当相关系数为-1时,表示两个变量完全负相关;当相关系数为0时,表示两个变量无相关关系。
2. 相关分析方法(1)皮尔逊相关系数法:适用于两个变量均为连续变量,且数据呈正态分布的情况。
(2)斯皮尔曼等级相关系数法:适用于两个变量均为连续变量,但数据不满足正态分布的情况。
(3)肯德尔等级相关系数法:适用于两个变量均为等级变量或名义变量的情况。
3. 实际案例分析本次实训选取了某城市居民收入与消费支出两个变量作为研究对象,通过相关分析探究两者之间的关系。
(1)数据收集:收集了该城市1000户居民的年收入和消费支出数据。
(2)数据预处理:对收集到的数据进行整理,剔除异常值和缺失值。
(3)相关分析:运用相关分析方法,计算居民收入与消费支出之间的相关系数。
(4)结果分析:根据相关系数的大小和正负,判断居民收入与消费支出之间的相关关系。
四、实训过程1. 熟悉相关分析的基本概念和原理,掌握相关分析方法。
2. 收集实际数据,进行数据预处理。
3. 运用相关分析方法,计算相关系数。
4. 分析结果,得出结论。
五、实训结果与分析1. 计算得出居民收入与消费支出之间的相关系数为0.8,说明两者之间存在较强的正相关关系。
统计学中常用的数据分析方法10典型相关分析与ROC分析

统计学中常用的数据分析方法
典型相关分析
相关分析一般分析两个变量之间的关系,而典型相关分析是分析两组变量(如3个学术能力指标与5个在校成绩表现指标)之间相关性的一种统计分析方法。
典型相关分析的基本思想和主成分分析的基本思想相似,它将一组变量与另一组变量之间单变量的多重线性相关性研究转化为对少数几对综合变量之间的简单线性相关性的研究,并且这少数几对变量所包含的线性相关性的信息几乎覆盖了原变量组所包含的全部相应信息。
R0C分析
R0C曲线是根据一系列不同的二分类方式(分界值或决定阈).以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线
用途:
1、R0C曲线能很容易地査出任意界限值时的对疾病的识别能力用途;
2、选择最佳的诊断界限值。
R0C曲线越靠近左上角,试验的准确性就越高;
3、两种或两种以上不同诊断试验对疾病识别能力的比较,一股用R0C曲线下面积反映诊断系统的准确性。
统计学学科统计学学科课程总结模板统计方法与数据分析

统计学学科统计学学科课程总结模板统计方法与数据分析统计学学科课程总结模板:统计方法与数据分析一、引言在这门统计学学科的学习过程中,我通过学习统计方法和数据分析的理论知识,掌握了基本的统计分析方法和技巧。
本文将对我在这门课程中学到的知识和经验进行总结和归纳,以便在今后的研究和应用中能够更好地运用统计学的原理和方法。
二、概述统计学学科统计学是一门研究收集、整理、分析和解释数据的学科,它在各个领域中都扮演着重要的角色。
统计学的主要任务是通过收集样本或整体数据,运用概率论和数理统计的方法对数据进行分析,从而获得有关总体特征的推断。
三、统计学基础知识1. 数据的搜集和整理数据的搜集和整理是统计学中的第一步,要保证数据的准确性和完整性。
在本课程中,我学习了如何制定合适的调查问卷和实验设计,以及如何进行数据的收集和整理。
2. 描述统计学方法描述统计学是统计学的基础,通过对数据进行总结和描述,可以获得数据的基本特征。
在本课程中,我学习了如何计算数据的中心趋势和离散程度,并掌握了绘制直方图、饼图和箱线图等图表的技巧。
3. 概率和概率分布概率是统计学的核心概念,它描述了事件发生的可能性。
我学习了如何计算概率并应用概率论的基本原理进行推断。
此外,我还学习了一些常见的概率分布,如正态分布、泊松分布和二项分布等。
4. 参数估计与假设检验参数估计和假设检验是统计学中的两个重要内容。
参数估计是根据样本数据推断总体参数的过程,假设检验用于判断统计推断的可靠性。
我学习了最大似然估计和置信区间的计算方法,以及显著性水平和p值的概念。
5. 数据分析方法和技巧统计学的最终目标是利用数据进行分析和解释。
在本课程中,我学习了回归分析、变量选择、方差分析和卡方检验等数据分析方法和技巧。
这些方法和技巧可以帮助我在实际问题中进行数据挖掘和决策支持。
四、实践应用与案例分析在统计学学科课程中,我不仅学习了理论知识,还通过实践应用和案例分析,将所学的知识与实际问题相结合。
统计学课程分析报告-韩大平

《统计学》课程分析报告一、课程定位(一)课程地位《统计学》是收集、处理、分析、解释数据并从数据中得出结论的科学。
《统计学》课程属于专业基础课,是教育部确定的高等院校经济、管理类各专业的必修核心课程之一,也是我校国际经济与贸易专业确定的专业基础课。
(二)课程性质课程性质专业基础课,也是必修课程开设学期第四学期学时学分 72学时,3学分(三)关联课程前置课程高等数学微观经济学宏观经济学概率论与数理统计后续课程计量经济学数理统计尽管强调应用性,但是它本身还是一门数学学科,重在应用方法的数理基础的研究;统计学更侧重于对解决社会、经济等现实问题数量分析方法的研究与应用(四)课程作用有助于分析研究社会经济现象总体的数量特征和数量关系有助于分析研究社会经济现象发展变化规律,为预测未来和科学决策提供依据为后续课程的学习奠定基础(五)课程目标通过系统地介绍统计学的基本思想、基本方法及其在经济管理领域中的应用,通过本课程的学习,使学生能够掌握统计学的基本理论与基本方法,树立定量分析的基本观念,理论联系实际,培养学生运用统计方法解决实际问题的能力,同时为今后进一步学习相关课程奠定基础。
二、教材选择和参考资料(一)教材选择中国人民大学出版社《统计学》贾俊平何晓群金勇进(二)参考资料第一章1.孙静娟,统计学.清华大学出版社.2009年2.中华人民共和国统计局。
.3.莫日达《中国古代统计思想史》统计出版社 2012年。
第二章1.金勇进《抽样技术》中国人大出版社 2015年2.郑章元《应用概率统计》南京市大出版社 1999年3.柯惠新《调查研究中的统计分析方法》中国传媒大学出版社 2014年4.[美]L.Kish 《Survey Sampling》中国统计出版社 1997年第三章1.《中国统计》2.《统计教育》第四章1.《新中国五十年统计统计资料汇编》中国统计出版社2. 李国岚《教育评价与统计》科学出版社3. 中华人民共和国统计局。
统计学类专业复习重点梳理与分析

统计学类专业复习重点梳理与分析统计学是一门具有广泛应用领域的学科,涵盖了许多重要的知识点和技能。
为了帮助同学们更好地进行复习,本文将系统地梳理和分析统计学类专业的复习重点。
通过对不同主题和内容的梳理和分析,希望能帮助同学们更好地理解和掌握统计学的核心知识。
一、描述统计学描述统计学是统计学的基础,包括对数据的收集、整理、汇总和可视化等技巧。
其中,收集数据的方法包括随机抽样、问卷调查等;整理数据的方法包括数据清洗、处理异常值等;汇总数据的方法包括计算平均数、中位数、众数等;可视化数据的方法包括绘制直方图、散点图、箱线图等。
同学们在复习时,应注意理解和掌握这些技巧的具体操作方法,并能够根据实际情况进行数据的处理和分析。
二、概率论与数理统计概率论与数理统计是统计学的核心内容,包括了概率的基本概念、随机变量及其分布、多个随机变量之间的关系等。
在复习时,同学们应重点关注以下几个方面的内容:1. 概率计算:理解和掌握概率的基本计算方法,包括加法原理、乘法原理、条件概率等。
2. 随机变量:了解随机变量的概念和性质,掌握常见离散型和连续型随机变量的分布特征,如二项分布、正态分布等。
3. 多个随机变量:理解和掌握多个随机变量之间的关系,包括相互独立、相关性等概念,以及相关系数、协方差等的计算方法。
4. 统计推断:了解统计推断的基本思想和方法,包括参数估计、假设检验等。
掌握常见的估计方法,如最大似然估计、置信区间等。
三、统计计算与建模统计计算和建模是统计学的实践部分,包括了使用计算机软件进行数据分析和建立统计模型等。
在复习时,同学们应注重以下几个方面的内容:1. 统计软件:熟悉并掌握常用的统计软件,如R、SPSS等。
了解软件的基本操作方法,包括数据导入、变量命名、运算和图形绘制等。
2. 数据分析:了解常用的数据分析方法,如方差分析、回归分析等。
理解和掌握不同方法的应用场景和具体计算步骤。
3. 统计建模:理解统计建模的基本原理和步骤,包括变量选择、模型拟合和模型评估等。
统计学相关分析

统计学相关分析统计学是一门研究数据收集、分析与解释的学科。
它的目标是通过系统和科学的方法研究数据,以便能够对各种现象进行描述、理解和预测。
统计学的应用非常广泛,涵盖了自然科学、社会科学、医学、工程、经济学等各个领域。
其中,相关分析是统计学的一个重要工具,可以用来研究两个或多个变量之间的关系。
相关分析是指研究两个或多个变量之间的关系的统计方法。
它可以用来确定这些变量之间是否存在其中一种关联性,并且可以量化这种关联性的强度和方向。
相关分析中常用的指标是相关系数,它可以衡量两个变量之间的线性关系。
相关系数是一个介于-1到+1之间的数值,它表示着两个变量之间的关联程度。
如果相关系数为-1,表示两个变量呈现完全负相关,即一个变量的增加导致另一个变量的减少;如果相关系数为+1,表示两个变量呈现完全正相关,即一个变量的增加导致另一个变量的增加;如果相关系数为0,表示两个变量之间没有线性关系。
相关分析有很多应用,尤其在社会科学和市场研究领域。
例如,在经济学中,相关分析可以用来研究不同经济指标之间的关系,进而预测经济发展的趋势。
在市场研究中,相关分析可以用来研究产品销售量与广告投入之间的关系,从而为企业制定营销策略提供支持。
在医学研究中,相关分析可以用来研究药物治疗效果与患者病情之间的关系,以便优化治疗方案。
进行相关分析的步骤通常包括以下几个方面:1.收集数据:首先需要收集两个或多个变量的相关数据。
这些数据可以通过实验、调查或观察来获取。
2.计算相关系数:根据收集到的数据,可以使用相关系数来度量变量之间的关系。
最常用的是皮尔逊相关系数,它适用于连续性变量。
如果变量是分类变量,可以使用斯皮尔曼相关系数。
3.判断关联性:计算出相关系数之后,就可以判断变量之间的关联性。
一般来说,绝对值大于0.7的相关系数被视为强相关,绝对值在0.3到0.7之间的相关系数被视为中等相关,而绝对值小于0.3的相关系数被视为弱相关。
4.分析结果:根据相关系数的大小和方向,可以对变量之间的关系进行解释。
统计学基本知识与数据分析

统计学基本知识与数据分析教案主题:统计学基本知识与数据分析导语:统计学是一门研究数据收集、分析、解释和应用的学科。
它在现代社会生活中具有重要意义,能够帮助我们更好地理解和应对各类数据。
本节课将介绍统计学的基本知识和数据分析方法,以帮助学生培养数据思维和数据分析能力。
一、统计学基本概念及应用(约500字)1. 数据的产生和分类- 介绍数据的来源和分类(定量数据和定性数据)- 举例说明不同类型数据的应用场景2. 统计学的定义和作用- 介绍统计学的定义和作用- 分析统计学在日常生活、科学研究、商业决策等方面的应用案例3. 数据收集方法- 介绍主要的数据收集方法(观察、实验、调查)- 分析各种方法的优劣和适用场景二、描述统计学方法(约500字)1. 数据的整理和展示- 介绍数据的整理方法(频数、比例、百分比等)- 举例说明数据展示方法(表格、图表等)2. 数据的中心趋势测度- 介绍数据的中心趋势测度方法(均值、中位数、众数) - 分析各种测度方法的特点和适用场景3. 数据的离散程度测度- 介绍数据的离散程度测度方法(范围、方差、标准差) - 分析各种测度方法的意义和应用三、概率与统计推断(约500字)1. 概率基本概念- 介绍概率的基本概念(随机事件、样本空间、概率分布) - 举例说明概率在实际问题中的应用2. 统计推断基本原理- 介绍统计推断的基本原理(参数估计、假设检验)- 分析统计推断在科学研究、市场调查等方面的应用案例3. 抽样方法与抽样分布- 介绍抽样方法的类型(简单随机抽样、系统抽样、分层抽样等) - 分析抽样分布的概念和作用四、数据分析与应用(约500字)1. 相关分析方法- 介绍相关分析的定义和作用- 分析相关分析方法的应用场景和解读方式2. 回归分析方法- 介绍回归分析的基本原理和方法- 举例说明回归分析在实际问题中的应用3. 统计软件与数据分析- 介绍常见的统计软件(SPSS、R、Python等)- 分析统计软件在数据分析中的作用和应用案例五、课堂练习与案例分析(约500字)1. 统计学基本知识练习- 设计合适的习题,帮助学生巩固统计学基本概念和计算方法- 引导学生运用所学知识解决实际问题2. 数据分析案例分析- 选取一个实际问题案例,引导学生运用统计学知识进行数据分析 - 分组讨论,分享分析结果和结论六、课堂总结与作业布置(约200字)1. 课堂总结- 概括本节课的主要内容和学习收获- 强调统计学在现实生活中的重要性和应用价值2. 作业布置- 布置相关的课后作业,巩固和拓展学生对统计学的理解和应用能力- 鼓励学生积极参与实际数据分析项目,并撰写分析报告以上为本次统计学基本知识与数据分析教案的大致框架,通过多种形式和内容的展开,旨在帮助学生全面理解统计学的基本概念和方法,提高他们的数据思维和数据分析能力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学专业基础课与专业课之间的典型相关分析摘要本文基于统计学系0301-0302两个班的66名学生17门课程(包括专业基础课和专业课)的考试成绩,运用典型相关分析法研究了统计学系基础课和专业课的相关程度。
通过运用统计分析软件SAS运行得到变量间的相关系数以及标准化后的典型相关系数,进而求出典型相关变量。
最后结合分析结果和实际情况对教学提了一点小小的建议。
关键词:基础课;专业课;典型相关分析;典型相关系数Canonical Correlation Analysis Between The Major and BasicSubjects of The Statistics MajorAbstractWith the method of canonical correlation analysis,I study about the correlation between the major and basic subjects of the statistics major.The research is based on the examination scores of66students of classes0301and0302who are in the major of statistics,including only17 subjects,the major and basic subjects.The article then gives the standard canonical correlations between the variables from which we can know the canonical correlative variables.In the end,I give some suggestions about education,according to the output of the analysis and the matter of fact.Key word:basic subject,major,canonical correlation,canonical coefficients1引言对于统计学系的学生来说,对数学理论的理解和掌握要求比较高,而且更重要的是要做到融会贯通,举一反三,学会理论联系实际,并利用统计分析的方法来解决日常生产生活中的问题,因而专业基础课程(如数学分析和高等代数等)的学习无疑是相当重要的,因为它直接关系到后续专业课的学习效果。
本文通过对部分学生各个学科的成绩进行相关分析,来体现学科间的联系。
运用典型相关分析法来分析基础课(数学分析和高等代数等)和后续的专业课(如多元统计分析等)的相关程度,只希望由此能够对今后的教学提出有价值性的建议。
数据来源于统计学系03级学生的成绩,共66人17门课程(仅包括专业基础课和专业课)的成绩。
2理论背景知识2.1典型相关分析典型相关分析(Canonical Correlation Analysis)又称正则相关分析或典则分析,是研究两组指标(变量)之间相关关系的一种多元统计方法。
大家知道,两个随机变量间的相关关系通常是用相关系数来衡量的,而复相系数则被用来研究一个随机变量和多个随机变量的线性相关关系。
在实际研究问题时,也常常需要知道两个随机变量之间的相关关系。
例如:在研究组织结构对“职业满意度“的影响时,需要分析职业特性变量(用户反馈、任务重要性、任务多样性、任务特权、自主权)和职业满意度变量(主管满意度、事业前景满意度、财政满意度、工作强度满意度、公司地位满意度、工种满意度、总体满意度)的相关程度;医学上要研究(抑郁症、健康状况)与(性别、年龄、教育程度、收入)是否具有某种相关性等。
典型相关分析的目的是识别并量化两组变量之间的联系,其研究焦点是一组变量的线性组合和另一组变量的线性组合之间的相关关系。
基本思想是:首先在每组变量中找出变量的线性组合,使得两者之间的相关达到最大(即两组典型变量的相关达到最大值),这两组指标多半是相同研究对象有关系的两组不同指标。
这两组典型变量彼此之间的最大相关就是第一个典型相关,而线性组合的系数称为典型相关系数。
然后再在和最初挑选的这对线性组合不相关的线性组合配对中,选取相关系数最大的一对,如此反复迭代,直到两组变量之间的相关性被提取完毕(即配对的典型变量的个数等于两组原始变量中个数较少的那一个数)为止。
由于典型相关分析以对两组指标的每一组指标作为整体考虑,比一般相关分析仅考虑一个指标与一个指标间的关系或一个指标与多个指标间的关系,向前迈了一大步,更能反映现象的本质联系。
因此,典型相关分析广泛应用于变量群之间的相关分析研究,在经济学,生物学,医药卫生以及教育统计中都有广泛的应用。
2.2典型变量和典型相关系数计算设随机向量来代表第一组个变量,随机向量代表第二组的个变量。
对于()1X p ()2X q 随机向量,,令设随机向量来代表第一组p 个变量,随机向量代表第二()1X ()2X ()1X ()2X 组的q 个变量。
对于随机向量,,令()1X ()2X ()()()11E X µ=()()111COV X =Σ()()()22E X µ=()222)(∑=X COV ()()T X X COV 211221),(∑=∑=()()()()()1122X E X E X µµµ⎛⎞⎛⎞===⎜⎟⎜⎟⎜⎟⎜⎟⎝⎠⎝⎠()()()()()()()()111211221222p p p p q X X X X X X X X X +++⎛⎞⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎛⎞⎜⎟==⎜⎟⎜⎟⎜⎟⎝⎠⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎝⎠M M ⎟⎟⎠⎞⎜⎜⎝⎛∑∑∑∑=−−=∑22211211))((T X X E µµ协方差是第一组变量与第二组变量的协方差,个元素量度了两组变量之间的12∑p q ×联系。
当p 和q 较大时,整体地解释中的元素基本上是不可能的。
线性组合可以提12∑供对一组变量简单扼要的度量,为此,作两组变量的线性组合,设()1T U a X =()2T V b X =()111var()cov()T T U a X a a a==Σ()b b b X b V T T 222)cov()var(∑==()()ba b X X T 1221T ),cov(a V)cov(U, ∑==bb a a b a V U corr T T T 221112),(∑∑∑=第一对典型变量,或第一典型变量配对是具有单位方差的线性组合U 和V 的配对,11它使对应的相关系数最大化。
第二对典型变量,或第二对典型变量配对是具有单位方差的线性组合U 和V 的配对,22且在与第一对典型变量不相关的所有配对中,其对应的相关系数最大。
第K 对典型变量,或第K 对典型变量配对是具有单位方差的线性组合U 和V 的配k k 对,且在第K -1个典型变量配对都不相关的所有配对中,其相关系数最大。
易见:我们希望寻找使相关系数达到最大的向量a ,b ,由于随机向量乘以常数时并不改变它们的相关系数,所以,为防止结果的重复出现,令:,1)var(11=∑=a a U T ,1)var(22=∑=b b V T ba V U corr T 12),(∑=问题就成为在上述约束条件下,求使达到最大的系数向量a 和b 。
b a V U corr T 12),(∑=根据数学分析中极值的求法引入Lagrange 乘数,将问题转化为求的极大值。
由极值条件)1(2)1(2),(221112−∑−−∑−∑=b b a a b a b a T T T µλϕ(1)0022211112=∑−∑=∂∂=∑−∑=∂∂b a ba b a µϕλϕ求解得λ恰好是线性组合U ,V 之间的相关系数。
(2)002121112112222112212111=−∑∑∑∑=−∑∑∑∑−−−−b b a a λλ由式②求得:特征根,相应单位特征向量a ,a a ,b ,b b 222120p λλλ≥≥≥L ()1()2L ()p ()1()2L ()q P 对线性组合:,()()111T U a X =()()121;T V b X =,()()212T U a X =()()222;T V b X =M()()1,p T p U a X =()()2p T p V b X =3典型相关分析的应用通过编程运行SAS 统计软件得到以下结果:表1给出了各个学科成绩的均值和标准差,从表2表3表4则可以看出两组变量各门课程之间的相关系数,表5表6分给出了相关系数的假设检验结果,而表7-8和表9-10则分别给出了标准化前后的典型相关系数。
注:表1-表6见附录,表7-表10如下。
表7基础课变量的典型相关系数表8专业课变量的典型相关系数1V 2V 3V 4V 5V 6V 7V 1X 0.66270.464-0.333-0.4164-0.0755-0.2323-0.03912X 0.84810.0546-0.0479-0.05150.1162-0.42280.28383X 0.7422-0.0357-0.2141-0.34270.49980.0544-0.17814X 0.7301-0.071-0.2428-0.2424-0.24130.26670.46355X 0.75720.49760.12410.33020.12650.19620.00796X 0.6962-0.17660.4279-0.089-0.41370.0222-0.34857X 0.75450.0806-0.480.3501-0.1533-0.1916-0.10461W 2W 3W 4W 5W 6W 7W 8X 0.8574-0.0568-0.2073-0.2057-0.10010.0699-0.32139X 0.67720.31420.3828-0.0145-0.34060.01730.140810X 0.84320.1684-0.10230.20150.0131-0.05950.1342表9标准化后的基础课变量的典型相关系数表10标准化后的专业课变量的典型相关系数11X 0.77350.18030.35410.14120.37310.0559-0.246212X 0.80540.20290.09580.1498-0.17680.20140.190913X 0.50180.1677-0.01210.5371-0.16060.20530.012114X 0.77730.04190.18220.1684-0.0739-0.40210.029115X 0.41570.7321-0.22480.04360.0636-0.2993-0.203216X 0.27370.36450.204-0.24460.26830.20640.44917X 0.2650.1934-0.41070.29260.464-0.23720.11121V 2V 3V 4V 5V 6V 7V 1X -0.12311.0909-0.2719-0.8589-0.5215-0.3251-0.31492X 0.2671-0.28090.65060.13520.4047-1.25390.88013X 0.2706-0.5401-0.2659-0.32550.97620.4348-0.56034X 0.1988-0.3007-0.2989-0.2509-0.4230.84710.80275X 0.2160.88850.50230.52560.30310.60630.14276X 0.3112-0.33390.6141-0.1942-0.5679-0.0253-0.60247X 0.1708-0.4038-1.01240.8171-0.3281-0.1376-0.52541W 2W 3W 4W 5W 6W 7W 8X 0.4759-0.3968-0.6457-0.8505-0.07430.218-0.3906(1)由表9——标准化后的第一组变量的典型相关系数可以求出:专业基础课的第一对典型相关变量是:112345670.12310.26710.27060.19880.21600.31120.1708Z X X X X X X X =−++++++同样由表10——标准化后的第二组变量的典型相关系数求出专业课的典型相关变量是:18910111213141516170.47590.13170.30970.09790.12040.08010.17980.21280.06630.1495W X X X X X X X X X X =++++−+−++在第一基础课变量中,各个学科所起的作用大致相当,稍微显著一点的是数学分析常微分方程和运筹学。