第十二章相关与回归分析
第12章-多重线性回归分析

6 因变量总变异的分解
P
(X,Y)
Y
(Y Y) (Y Y)
(Y Y)
Y X
Y
Y
9
Y的总变异分解
Y Y Yˆ Y Y Yˆ
Y Y 2 Yˆ Y 2 Y Yˆ 2
总变异 SS总
回归平方和 剩余平方和
SS回
SS剩
10
Y的总变异分解
病程 (X2)
10.0 3.0 15.0 3.0 4.0 6.0 2.9 9.0 5.0 2.0 8.0 20.0
表 12-1 脂联素水平与相关因素的测量数据
空腹
回归模空型腹 ?
瘦素
脂联 BMI 病程 瘦素
脂联
(X3)
血糖 (X4)
素(Y)
(X1)
(X2)
(X3)
血糖 素(Y) (X4)
5.75 13.6 29.36 21.11 9.0 4.90 6.0 17.28
H 0: 1 2 3 4 0 ,即总体中各偏回归系数均为0; H 1:总体中各偏回归系数不为0或不全为0;
= 0.05。
2 计算检验统计量: 3 确定P值,作出推断结论。
拒绝H0,说明从整体上而言,用这四个自变量构成 的回归方程解释糖尿病患者体内脂联素的变化是有统 计学意义的。
的平方和 (Y Yˆ)2为最小。
只有一个自变量
两个自变量
例12-1 为了研究有关糖尿病患者体内脂联素水平的影响因 素,某医师测定30例患者的BMI、病程、瘦素、空腹血糖, 数据如表12-1所示。
BMI (X1)
24.22 24.22 19.03 23.39 19.49 24.38 19.03 21.11 23.32 24.34 23.82 22.86
第十二章 线性回归分析

回归是回归分析中最基本、最简单的一种,
回归方程
一、直线回归方程的一般表达式为
ˆ a bX Y
(12 1)
ˆ Y 为各X处Y的总体均数的估计。
回归方程的应用
一、线性回归的主要用途 1.研究因素间的依存关系 自变量和应变 量之间是否存在线性关系,即研究一个或多个 自变量对应变量的作用,或者应变量依赖自变 量变化而变化的规律。
否存在实际意义。 3.两变量间存在直线关系时,不一定
表明彼此之间就存在因果关系。
4.建立回归方程后,须对回归系数
进行假设检验。
5. 使用回归方程进行估计与预测时,
一般只适用于原来的观测范围,即自变量
的取值范围,不能随意将范围扩大。
6. 在线性回归分析时,要注意远离
群体的极端值对回归效果的影响。
表12-1 12只大白鼠的进食量(g)与体重增加量(g)测量结果
序号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合计
X 进食量(g)
(2) 305.7 188.6 277.2 364.8 285.3 244.7 255.9 149.8 268.9 247.6 168.8 200.6 2957.9 (Σ X)
目前,“回归”已成为表示变量 之间某种数量依存关系的统计学术语, 并且衍生出“回归方程”“回归系数”
等统计学概念。如研究糖尿病人血糖
与其胰岛素水平的关系,研究儿童年 龄与体重的关系等。
两相关变量的散点图
一、直线回归的概念
目的:研究应变量Y对自变量X的数量依 存关系。
特点:统计关系。 X值和Y的均数的关系,
不同于一般数学上的X 和Y的函数 关系。
为了直观地说明两相关变量的线性 依存关系,用表12-1第(2)、(3)
12章多重线性回归与相关

一、自变量筛选的标准与原则
2.残差均方缩小与调整决定系数增大 MS残=SS残/(n-p-1) MS残缩小的准则可以看做是在SS残缩小准则的基础上 增加了(n-p-1)-1因子,该因子随模型中自变量个数 p的增加而增加,体现了对模型中自变量个数增加而 施加的“惩罚”。 调整决定系数Ra2越大越好,与MS残等价。
包含汽车流量、气温、气湿与风速这四个自变量的回
归方程可解释交通点空气NO浓度变异性的78.74%
2.复相关系数R (multiple correlation coefficient)
定义为确定系数的算术平方根,
R SS回 SS总
表示变量Y与k个自变量的线性相关的密切程度。 对本例R=0.8837,表示交通点空气NO浓度与汽车流量、
表12-5 空气中NO浓度与各自变量的相关系数与偏相关系数
自变量 车流X1 相关系数 0.80800 偏相关系数 0.6920 偏相关系数P值 0.0005
气温X2
气湿X3 风速X4
0.1724
0.2754 -0.67957
0.47670
-0.00218 -0.59275
0.0289
0.9925 0.0046
第十二章
第一节 第二节 第三节 第四节
多重线性回归与相关
多重线性回归的概念与统计描述 多重线性回归的假设检验 复相关系数与偏相关系数 自变量筛选
一、整体回归效应的假设检验(方差分析)
表12-2 检验回归方程整体意义的方差分析表
变异来源 回归模型
残差 总变异
SS
0.0639 6 0.0172 7 0.0812 3
风速
(X4) 2.00 2.40 3.00 1.00 2.80 1.45 1.50 1.50 0.90 0.65 1.83 2.00
(完整版)第十二章相关和回归分析练习试题

第十二章相关与回归分析一、填空1.如果两变量的相关系数为0,说明这两变量之间_____________。
2.相关关系按方向不同,可分为__________和__________。
3.相关关系按相关变量的多少,分为______和复相关。
4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
6.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。
7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值cY是服从();(2)分布中围绕每个可能的cY值的()是相同的。
7.已知:工资(元)倚劳动生产率(千元)的回归方程为xyc8010+=,因此,当劳动生产率每增长1千元,工资就平均增加 80 元。
8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。
这种分析方法,通常又称为(回归分析)。
9.积差系数r是(协方差)与X和Y的标准差的乘积之比。
二、单项选择1.欲以图形显示两变量X和Y的关系,最好创建(D )。
A 直方图 B 圆形图 C 柱形图 D 散点图2.在相关分析中,对两个变量的要求是( A )。
A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数3. 相关关系的种类按其涉及变量多少可分为( )。
A. 正相关和负相关B. 单相关和复相关C. 线性相关和非线性相关D. 不相关、不完全相关、完全相关4.关于相关系数,下面不正确的描述是( B )。
第十二章 分层回归分析--Hierarchy Regression

分层回归其实是对两个或多个回归模型进行比较。
我们可以根据两个模型所解释的变异量的差异来比较所建立的两个模型。
一个模型解释了越多的变异,则它对数据的拟合就越好。
假如在其他条件相等的情况下,一个模型比另一个模型解释了更多的变异,则这个模型是一个更好的模型。
两个模型所解释的变异量之间的差异可以用统计显著性来估计和检验。
模型比较可以用来评估个体预测变量。
检验一个预测变量是否显著的方法是比较两个模型,其中第一个模型不包括这个预测变量,而第二个模型包括该变量。
假如该预测变量解释了显著的额外变异,那第二个模型就显著地解释了比第一个模型更多的变异。
这种观点简单而有力。
但是,要理解这种分析,你必须理解该预测变量所解释的独特变异和总体变异之间的差异。
一个预测变量所解释的总体变异是该预测变量和结果变量之间相关的平方。
它包括该预测变量和结果变量之间的所有关系。
预测变量的独特变异是指在控制了其他变量以后,预测变量对结果变量的影响。
这样,预测变量的独特变异依赖于其他预测变量。
在标准多重回归分析中,可以对独特变异进行检验,每个预测变量的回归系数大小依赖于模型中的其他预测变量。
在标准多重回归分析中,回归系数用来检验每个预测变量所解释的独特变异。
这个独特变异就是偏相关的平方(Squared semi-partial correlation)-sr2(偏确定系数)。
它表示了结果变量中由特定预测变量所单独解释的变异。
正如我们看到的,它依赖于模型中的其他变量。
假如预测变量之间存在重叠,那么它们共有的变异就会削弱独特变异。
预测变量的独特效应指的是去除重叠效应后该预测变量与结果变量的相关。
这样,某个预测变量的特定效应就依赖于模型中的其他预测变量。
标准多重回归的局限性在于不能将重叠(共同)变异归因于模型中的任何一个预测变量。
这就意味着模型中所有预测变量的偏决定系数之和要小于整个模型的决定系数(R2)。
总决定系数包括偏决定系数之和与共同变异。
第十二章 回归分析

回归分析
如果我们将存在相关的两个变量,一个作为自变 量,另一个作为因变量,并把两者之间不十分稳 定的、准确的关系,用数学方程式来表达,则可 利用该方程由自变量的值来估计、预测因变量的 估计值,这一过程称为回归分析。 相关表示两个变量之间的双向相互关系,回归表 示一个变量随另一个变量做不同程度变化的单向 关系。
• 线性回归的基本假设
– – – – 线性关系 正态分布 独立性假设 误差等分散性假设
• 回归方程的建立
– 步骤:1)作散点图;2)设直线方程;3)选定具体方 法,计算表达式中的a和b;4)将a和b代入表达式,得 到回归方程。 – 方法:1)平均数法;2)最小二乘法。 • 最小二乘法:在配置回归线时,回归系数b的确定原则是 使散布图上各点距回归线上相应点的纵向距离平方和为最 小,这种求b的方法即最小二乘法。
• 回归分析与相关分析的关系
– 理解: • 同属相关分析; • 对称设计与不对称设计。 – 回归系数与相关系数的关系 • 相关系数是两个回归系数的几何平均数。
第二节 一元线性回归方程的检验
• 估计误差的标准差
某一X值相对应的诸Y 值,是以Y的平均数YX 为中 ˆ 心呈正态分布的。而与某一X值相对应的回归值 Y 就是与该X值相对应的那些诸Y值的平均数YX的估 ˆ 计值。由 Y 估计YX 会有一定的误差。误差大小 与X值相对应的诸Y值分布范围有关,范围大,误 差大,估计的准确性、可靠性小,范围小,误差小, 估计的准确性、可靠性大。 ˆ 我们需要一个用来描述由Y 估计YX 时误差大小的 指标,即估计误差的标准差。平均数与标准差未知, 样本的无偏估计量为:
a YX Y bYX X
• 列回归方程式(见教材)
第十二章回归分析

-141-第十二章 回归分析前面我们讲过曲线拟合问题。
曲线拟合问题的特点是,根据得到的若干有关变量的一组数据,寻找因变量与(一个或几个)自变量之间的一个函数,使这个函数对那组数据拟合得最好。
通常,函数的形式可以由经验、先验知识或对数据的直观观察决定,要作的工作是由数据用最小二乘法计算函数中的待定系数。
从计算的角度看,问题似乎已经完全解决了,还有进一步研究的必要吗?从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些系数,只是它们的一个(点)估计,应该对它们作区间估计或假设检验,如果置信区间太大,甚至包含了零点,那么系数的估计值是没有多大意义的。
另外也可以用方差分析方法对模型的误差进行分析,对拟合的优劣给出评价。
简单地说,回归分析就是对拟合问题作的统计分析。
具体地说,回归分析在一组数据的基础上研究这样几个问题:(i )建立因变量y 与自变量m x x x ,,,21 之间的回归模型(经验公式); (ii )对回归模型的可信度进行检验;(iii )判断每个自变量),,2,1(m i x i =对y 的影响是否显著;(iv )诊断回归模型是否适合这组数据;(v )利用回归模型对y 进行预报或控制。
§1 多元线性回归回归分析中最简单的形式是x y 10ββ+=,y x ,均为标量,10,ββ为回归系数,称一元线性回归。
它的一个自然推广是x 为多元变量,形如m m x x y βββ+++= 110 (1)2≥m ,或者更一般地)()(110x f x f y m m βββ+++= (2)其中),,(1m x x x =,),,1(m j f j =是已知函数。
这里y 对回归系数),,,(10m ββββ =是线性的,称为多元线性回归。
不难看出,对自变量x 作变量代换,就可将(2)化为(1)的形式,所以下面以(1)为多元线性回归的标准型。
1.1 模型在回归分析中自变量),,,(21m x x x x =是影响因变量y 的主要因素,是人们能控制或能观察的,而y 还受到随机因素的干扰,可以合理地假设这种干扰服从零均值的正态分布,于是模型记作⎩⎨⎧++++=),0(~2110σεεβββN x x y m m (3) 其中σ未知。
第十二章相关与回归分析

第十二章相关与回归分析四、名词解释1 •消减误差比例变量间的相关程度,可以用不知Y与X有关系时预测Y的误差E0,减去知道Y与X有关系时预测Y的误差E i,再将其化为比例来度量。
将削减误差比例记为PRE。
2 •确定性关系当一个变量值确定后,另一个变量值夜完全确定了。
确定性关系往往表现成函数形式。
3 •非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。
4 •因果关系变量之间的关系满足三个条件,才能断定是因果关系。
1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的; 3 )两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。
5 .单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。
三个或三个以上的变量之间的相关关系则称为复相关,又称多兀相关。
6 •正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。
7 .散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。
8 .皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。
9 .同序对在观察X序列时,如果看到X i X j ,在Y中看到的是Y i : Y j,则称这一配对是同序对。
10. 异序对在观察X序列时,如果看到X i X j,在Y中看到的是Y i>Y j,则称这一配对是异序对。
11. 同分对女口果在X序列中,我们观察到X i=X j (此时Y序列中无Y i二Y j),则这个配对仅是X 方向而非Y方向的同分对;如果在Y序列中,我们观察到Y j二Y j (此时X序列中无X i=X j), 则这个配对仅是Y方向而非X方向的同分对;我们观察到X i=X j,也观察到Y i二Y j,则称这个配对为X与Y同分对。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章 相关与回归分析四、名词解释1.消减误差比例变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关系时预测Y 的误差1E ,再将其化为比例来度量。
将削减误差比例记为PRE 。
2. 确定性关系当一个变量值确定后,另一个变量值夜完全确定了。
确定性关系往往表现成函数形式。
3.非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。
4.因果关系变量之间的关系满足三个条件,才能断定是因果关系。
1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。
5.单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。
三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。
6.正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。
7.散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X 与Y 的相互关系,即得相关图,又称散点图。
8.皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X 、Y 的标准差乘积的比率。
9.同序对在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y Y <,则称这一配对是同序对。
10.异序对在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y >Y ,则称这一配对是异序对。
11.同分对如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i jY =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。
六、计算题1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。
对于民族音乐的态度(Y)年岁(X)Σ老中青喜欢不喜欢38 38 30 15 33 46Σ2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。
身高(cm)171 167 177 154 169体重(kg)53 56 64 49 55身高(cm)175 163 152 172 162体重(kg)66 52 47 58 50 【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X】3.假定有不同文化程度的35~45岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。
序号一二三四五育龄妇女人数20 20 20 20 20文化程度(年)平均生育数4.7463.3193.08122.41161.944.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。
环境名次 3 9 7 5 12 8 10 2 11 4 1 6体质名次 5 9 6 7 12 8 11 1 10 3 2 4【斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】5.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数τc。
文化程度婚姻美满大学中学小学美满9 16 5一般8 30 18不美满 3 4 7【τc=0.18】6.以下为两位评判员对10名参赛人名次的打分。
试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。
参赛人 A B C D E F G H I J评判员1 评判员2 1122433455866778991010【斯皮尔曼相关系数:0.95】7.某原始资料为:X 65 73 91 88 76 53 96 67 82 85Y 5 7 13 13.5 7 4.5 15 6.7 10 11 要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;(4)用积差法求相关系数。
【Y=-11.48+0.27X】【正相关】【相关系数r=0.95】8.两变量X、Y之间的关系如下表,X 2 4 6 8 10 12Y 14 10 9 7 5 4(1)求回归方程;(2)求相关系数。
【Y=-0.957X+14.867】【r=0.98】9.试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。
N0身高(厘米)体重(千克)12345678910 16016116516516717017217417618051565966637069738065【r=0.77】10.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。
选手名A B C D E F G H I J演唱水平(X ) 综合素质(Y ) 1 2 3 4 5 6 7 8 9 10 3 1 5 2 7 4 10 8 6 9 【肯德尔系数:0.56,斯皮尔曼系数:0.76】11.青年歌手大奖赛,假设五位评委对10名决赛选手的演唱水平进行排序,他们的有关评价结果列于下表,试通过计算肯德尔和谐系数,检验专家意见的一致性和相关程度。
五位评委 10名决赛选手A B C D E F G H I J A B C D E 1 2 3 4 5 6 7 8 9 10 3 2 1 4 5 8 9 7 10 6 1 3 2 4 8 7 6 5 9 10 4 2 1 5 3 10 8 6 7 9 5 2 1 9 3 8 4 6 10 7【0.76】12.某地区失业率与通货膨胀率之间的资料如下表所示,试求:(1)拟合指数回归方程c Y =x ab ;(2)失业率与通货膨胀率之间的相关系数。
失业率(%) 1.0 1.6 2.0 2.5 3.1 3.6 4.0 4.5 5.1 5.6 6.0 6.5 通胀率(%) 1.6 1.5 1.1 1.3 0.6 0.9 0.8 0.8 0.7 0.6 0.6 0.6【()xe y 1803.0717.1-=】【相关系数0.76】13.试就下表所示资料,求算员工工作满足感高与归属感之Gamma 系数,并解释Gamma 系数具有削减误差比例PRE 性质。
工作满足感与归属感归属感(Y ) 工作满足感(X ) Y F低(1) 中(2) 高(3) 低(1) 中(2) 高(3) 8 4 3 6 5 1 4 4 5 15 12 13 Fx18 13 940【G=0.092】14.已知相关系数r =0.6,估计标准误差XY S =8,样本容量为62。
求:1)剩余变差值;2)剩余变差占总变差的百分比; 3)求总变差值。
15.在相关和回归分析中,已知下列资料:2X S =16,2Y S =25,2XY S =-19,a =30。
要求:1)计算相关系数r ,说明相关程度;2)求出直线回归方程。
16.在相关和回归分析中,已知下列有关资料:X S =5,Y S =10,n =20,r =0.9,2)(∑-Y Y =2000。
试计算:1)回归系数b ;2)回归变差和剩余变差; 3)估计标准误差XY S 。
17.根据下述假设资料求回归方程。
X 1 2 3 4 5 6 7 Y 23.023.424.125.226.126.927.318.某10户家庭样本具有下列收入(元)和食品支出(元/周)数据: 收入(X ) 20 30 33 40 15 13 26 38 25 43 支出(Y )7981154810910要求:1)写出最小平方法计算的回归直线方程;2)在95.46%把握下,当X =45时,写出Y 的预测区间。
19.根据下述假设资料,试用积差法求相关系数。
输出X (亿元)12106168910输出Y (亿元) 12 8 6 11 10 8 1120.对40个企业的横截面样本数据进行一元回归分析,因变量与其平均数的离差平方和为6000,而回归直线拟合的剩余变差为2000,求:1)变量间的相关指数R ; 2)该方程的估计标准误差。
七、问答题1.简述积差系数的特性。
2.简述回归分析和相关分析之间的密切联系。
部分计算参考:(见计算题六)2. 已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。
皮尔逊相关系数与回归方程 编号 身体重编号 身高(cm ) 体重(kg )1 171 532 167 563 177 644 154 495169 55 6 175 66 7 163 52 8 152 47 9 172 58 10162502x 2y高(cm )x (kg )yxy1 171 53 292412809 9063 2 167 56 27889 3136 9352 3 177 64 31329 4096 11328 4 154 49 23716 2401 7546 5 169 55 28561 3025 9295 6 175 66 30625 4356 11550 7 163 52 26569 2704 8476 8 152 47 23104 2209 7144 9 172 58 29584 3364 9976 10 162 5026244 2500 8100 合计 1662550 27686230600918302222n xy x y r 0.89n x (x)n y (y)-==--∑∑∑∑∑∑∑22n xy x y b 0.659n x (x)y x a=b 54.479n ny=a+bx=-54.479+0.659x-==--=-∑∑∑∑∑∑∑斯皮尔曼相关系数 编号 身高(cm )次序体重(kg ) 次序 d1 171 4 53 6 -2 4 2 167 6 56 4 2 43 177 1 64 2 -1 1 4 154 9 49 9 0 05 169 5 55 5 0 06 175 2 66 1 1 17 163 7 52 7 0 08 152 10 47 10 0 09 172 3 58 3 0 0 10 16285080 合计102s 26d r 1-0.94n(n -1)==∑2d4. 某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结 果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。