第十二章 相关与回归分析

合集下载

第12章-多重线性回归分析

第12章-多重线性回归分析
8
6 因变量总变异的分解
P
(X,Y)

Y
(Y Y) (Y Y)

(Y Y)
Y X

Y
Y
9
Y的总变异分解
Y Y Yˆ Y Y Yˆ
Y Y 2 Yˆ Y 2 Y Yˆ 2
总变异 SS总
回归平方和 剩余平方和
SS回
SS剩
10
Y的总变异分解
病程 (X2)
10.0 3.0 15.0 3.0 4.0 6.0 2.9 9.0 5.0 2.0 8.0 20.0
表 12-1 脂联素水平与相关因素的测量数据
空腹
回归模空型腹 ?
瘦素
脂联 BMI 病程 瘦素
脂联
(X3)

血糖 (X4)
素(Y)
(X1)
(X2)
(X3)
血糖 素(Y) (X4)
5.75 13.6 29.36 21.11 9.0 4.90 6.0 17.28
H 0: 1 2 3 4 0 ,即总体中各偏回归系数均为0; H 1:总体中各偏回归系数不为0或不全为0;
= 0.05。
2 计算检验统计量: 3 确定P值,作出推断结论。
拒绝H0,说明从整体上而言,用这四个自变量构成 的回归方程解释糖尿病患者体内脂联素的变化是有统 计学意义的。
的平方和 (Y Yˆ)2为最小。
只有一个自变量
两个自变量
例12-1 为了研究有关糖尿病患者体内脂联素水平的影响因 素,某医师测定30例患者的BMI、病程、瘦素、空腹血糖, 数据如表12-1所示。
BMI (X1)
24.22 24.22 19.03 23.39 19.49 24.38 19.03 21.11 23.32 24.34 23.82 22.86

第十二章 线性回归分析

第十二章  线性回归分析

回归是回归分析中最基本、最简单的一种,
回归方程
一、直线回归方程的一般表达式为
ˆ a bX Y

(12 1)
ˆ Y 为各X处Y的总体均数的估计。
回归方程的应用
一、线性回归的主要用途 1.研究因素间的依存关系 自变量和应变 量之间是否存在线性关系,即研究一个或多个 自变量对应变量的作用,或者应变量依赖自变 量变化而变化的规律。
否存在实际意义。 3.两变量间存在直线关系时,不一定
表明彼此之间就存在因果关系。
4.建立回归方程后,须对回归系数
进行假设检验。
5. 使用回归方程进行估计与预测时,
一般只适用于原来的观测范围,即自变量
的取值范围,不能随意将范围扩大。
6. 在线性回归分析时,要注意远离
群体的极端值对回归效果的影响。
表12-1 12只大白鼠的进食量(g)与体重增加量(g)测量结果
序号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合计
X 进食量(g)
(2) 305.7 188.6 277.2 364.8 285.3 244.7 255.9 149.8 268.9 247.6 168.8 200.6 2957.9 (Σ X)
目前,“回归”已成为表示变量 之间某种数量依存关系的统计学术语, 并且衍生出“回归方程”“回归系数”
等统计学概念。如研究糖尿病人血糖
与其胰岛素水平的关系,研究儿童年 龄与体重的关系等。
两相关变量的散点图
一、直线回归的概念
目的:研究应变量Y对自变量X的数量依 存关系。
特点:统计关系。 X值和Y的均数的关系,
不同于一般数学上的X 和Y的函数 关系。
为了直观地说明两相关变量的线性 依存关系,用表12-1第(2)、(3)

(完整版)第十二章相关和回归分析练习试题

(完整版)第十二章相关和回归分析练习试题

第十二章相关与回归分析一、填空1.如果两变量的相关系数为0,说明这两变量之间_____________。

2.相关关系按方向不同,可分为__________和__________。

3.相关关系按相关变量的多少,分为______和复相关。

4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。

自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。

5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。

6.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。

7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值cY是服从();(2)分布中围绕每个可能的cY值的()是相同的。

7.已知:工资(元)倚劳动生产率(千元)的回归方程为xyc8010+=,因此,当劳动生产率每增长1千元,工资就平均增加 80 元。

8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。

这种分析方法,通常又称为(回归分析)。

9.积差系数r是(协方差)与X和Y的标准差的乘积之比。

二、单项选择1.欲以图形显示两变量X和Y的关系,最好创建(D )。

A 直方图 B 圆形图 C 柱形图 D 散点图2.在相关分析中,对两个变量的要求是( A )。

A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数3. 相关关系的种类按其涉及变量多少可分为( )。

A. 正相关和负相关B. 单相关和复相关C. 线性相关和非线性相关D. 不相关、不完全相关、完全相关4.关于相关系数,下面不正确的描述是( B )。

第十二章 回归分析

第十二章 回归分析
第十二章 回归分析
回归分析
如果我们将存在相关的两个变量,一个作为自变 量,另一个作为因变量,并把两者之间不十分稳 定的、准确的关系,用数学方程式来表达,则可 利用该方程由自变量的值来估计、预测因变量的 估计值,这一过程称为回归分析。 相关表示两个变量之间的双向相互关系,回归表 示一个变量随另一个变量做不同程度变化的单向 关系。
• 线性回归的基本假设
– – – – 线性关系 正态分布 独立性假设 误差等分散性假设
• 回归方程的建立
– 步骤:1)作散点图;2)设直线方程;3)选定具体方 法,计算表达式中的a和b;4)将a和b代入表达式,得 到回归方程。 – 方法:1)平均数法;2)最小二乘法。 • 最小二乘法:在配置回归线时,回归系数b的确定原则是 使散布图上各点距回归线上相应点的纵向距离平方和为最 小,这种求b的方法即最小二乘法。
• 回归分析与相关分析的关系
– 理解: • 同属相关分析; • 对称设计与不对称设计。 – 回归系数与相关系数的关系 • 相关系数是两个回归系数的几何平均数。
第二节 一元线性回归方程的检验
• 估计误差的标准差
某一X值相对应的诸Y 值,是以Y的平均数YX 为中 ˆ 心呈正态分布的。而与某一X值相对应的回归值 Y 就是与该X值相对应的那些诸Y值的平均数YX的估 ˆ 计值。由 Y 估计YX 会有一定的误差。误差大小 与X值相对应的诸Y值分布范围有关,范围大,误 差大,估计的准确性、可靠性小,范围小,误差小, 估计的准确性、可靠性大。 ˆ 我们需要一个用来描述由Y 估计YX 时误差大小的 指标,即估计误差的标准差。平均数与标准差未知, 样本的无偏估计量为:

a YX Y bYX X
• 列回归方程式(见教材)

第十二章相关与回归分析

第十二章相关与回归分析

第十二章 相关与回归分析四、名词解释1.消减误差比例变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关系时预测Y 的误差1E ,再将其化为比例来度量。

将削减误差比例记为PRE 。

2. 确定性关系当一个变量值确定后,另一个变量值夜完全确定了。

确定性关系往往表现成函数形式。

3.非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。

4.因果关系变量之间的关系满足三个条件,才能断定是因果关系。

1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。

5.单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。

三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。

6.正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。

7.散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X 与Y 的相互关系,即得相关图,又称散点图。

8.皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X 、Y 的标准差乘积的比率。

9.同序对在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y Y <,则称这一配对是同序对。

10.异序对在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y >Y ,则称这一配对是异序对。

11.同分对如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i jY =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。

第十二章直线相关与回归

第十二章直线相关与回归

第十二章直线相关与回归A型选择题〔、若计算得一相关系数r=0.94,则()A、x与y之间一定存在因果关系B、同一资料作回归分析时,求得回归系数一定为正值C、同一资料作回归分析时,求得回归系数一定为负值D求得回归截距a>0E、求得回归截距a^ 02、对样本相关系数作统计检验(H o =0),结果r r°.05(v),统计结论是()。

A、肯定两变量为直线关系B、认为两变量有线性相关C、两变量不相关B. 两变量无线性相关E、两变量有曲线相关3、若A「0.05(如」2血。

^),则可认为()。

A. 第一组资料两变量关系密切B. 第二组资料两变量关系密切C. 难说哪一组资料中两变量关系更密切D两组资料中两变量关系密切程度不一样E、以上答案均不对4、相关分析可以用于()有无关系的研究A、性别与体重B、肺活量与胸围C、职业与血型D国籍与智商E、儿童的性别与体重5、相关系数的假设检验结果,则在〉水平上可认为相应的两个变量间()A、有直线相关关系B、有曲线相关关系C、有确定的直线函数关系D有确定的曲线函数关系E、不存在相关关系6根据样本算得一相关系数r,经t检验,P v 0.01说明()A、两变量有高度相关B、r来自高度相关的相关总体C、r来自总体相关系数p的总体D r来自卩工0的总体E、r来自p>0的总体7、相关系数显著检验的无效假设为()A、r有高度的相关性B、r来自p工0的总体C、r来自p = 0的总体D r与总体相关系数p差数为0E、r来自p>0的总体8、计算线性相关系数要求()A. 反应变量Y呈正态分布,而自变量X可以不满足正态分布的要求B. 自变量X呈正态分布,而反应变量丫可以不满足正态分布的要求C. 自变量X和反应变量丫都应满足正态分布的要求D. 两变量可以是任何类型的变量E. 反应变量Y要求是定量变量,X可以是任何类型的变量9、对简单相关系数r进行检验,当检验统计量t r>t 0.05(V)时,可以认为两变量x 与丫间()A. 有一定关系B. 有正相关关系C. 无相关关系D. 有直线关系E. 有负相关关系10、相关系数反映了两变量间的()A、依存关系B、函数关系C、比例关系D相关关系E、因果关系11、|r| “0.05/2,(2)时,则在G =0.05水准上可认为相应的两变量X、丫间()。

第十二章相关与回归分析

第十二章相关与回归分析

第十二章相关与回归分析四、名词解释1 •消减误差比例变量间的相关程度,可以用不知Y与X有关系时预测Y的误差E0,减去知道Y与X有关系时预测Y的误差E i,再将其化为比例来度量。

将削减误差比例记为PRE。

2 •确定性关系当一个变量值确定后,另一个变量值夜完全确定了。

确定性关系往往表现成函数形式。

3 •非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。

4 •因果关系变量之间的关系满足三个条件,才能断定是因果关系。

1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的; 3 )两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。

5 .单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。

三个或三个以上的变量之间的相关关系则称为复相关,又称多兀相关。

6 •正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。

7 .散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。

8 .皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。

9 .同序对在观察X序列时,如果看到X i X j ,在Y中看到的是Y i : Y j,则称这一配对是同序对。

10. 异序对在观察X序列时,如果看到X i X j,在Y中看到的是Y i>Y j,则称这一配对是异序对。

11. 同分对女口果在X序列中,我们观察到X i=X j (此时Y序列中无Y i二Y j),则这个配对仅是X 方向而非Y方向的同分对;如果在Y序列中,我们观察到Y j二Y j (此时X序列中无X i=X j), 则这个配对仅是Y方向而非X方向的同分对;我们观察到X i=X j,也观察到Y i二Y j,则称这个配对为X与Y同分对。

第十二章 回 归 分 析

第十二章 回 归 分 析

求截距: ya b a y bx x aYX y bYX x a XY y bXY x
回归系数的几种算法:

1、原始数据计算:
bYX
XY ( X )( Y ) / n (由X估计Y ) 2 2 X ( X ) / n
XY ( X )( Y ) / n b XY (由Y估计X ) 2 2 Y (Y ) / n
b XY
XY n X Y (由Y估计X ) 2 (n - 1)S Y
2
2
X ( X ) / n 其中: S x n 1
4、用两个标准差及相关 系数计算 ( )、用两个样本的标准 差及相关系数计算 1
y b yx r (由X估计Y) x x b xy r (由Y估计X) y



x
也就是说,回归线上的某一点就是与某一X值相对 ˆ 应的诸Y值的代表 y 这时,X与 y 的对应关系就可 ˆ 以用一条直线来表示 即当两个变量间存在线性相关关系时,常常希望建 立二者间的定量关系表达式,这便是两个变量间的 ˆ y 一元线性回归方程。 假定x是自变量,y是因变量,y对x的一元线性回归 方程的表达式为:ˆ =a+bx (其中a为常数,b称为y y 对x的回归系数。 对给定的n对数据(Xi Yi) ,i=1,2,3,……n,根据这些 ˆ 数据去估计a 和 b,于是y也是一个估计值,就用 y 来 表示区别。 因此字母头上加个“^”表示回归值,表 示真实值的一种预测,实际的观测值与回归值是存 在偏差的
相关关系
(correlation)
1.
2.
3.
4.
变量间关系不能用函数关系 精确表达 一个变量的取值不能由另一 个变量唯一确定,即当一个 或若干个变量X取一定值时, 与之相对应的另一个变量Y的 值虽然不确定,但却按某种 规律在一定范围内变化。 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十二章 相关与回归分析第一节 变量之间的相关关系相关程度与方向·因果关系与对称关系 第二节 定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数第四节 定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线)一、填空1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。

2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。

3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。

4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。

自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。

5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。

这种分析方法,通常又称为( 回归分析 )。

6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。

二、单项选择1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。

A 直线正相关B 直线负相关C 曲线正相关D 曲线负相关2.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示( C )。

A 无相关B 低度相关C 中等相关D 高度相关3.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有( D )。

A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。

4.关于相关系数,下面不正确的描述是( B )。

≤r1时,表示两变量不完全相关;A当0≤B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。

5.欲以图形显示两变量X和Y的关系,最好创建( D )。

A 直方图B 圆形图C 柱形图D 散点图6.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为( C )。

A 0.50B 0.80C 0.64D 0.907.在完成了构造与评价一个回归模型后,我们可以( D )。

A 估计未来所需样本的容量B 计算相关系数和判定系数C 以给定的因变量的值估计自变量的值D 以给定的自变量的值估计因变量的值8.两变量的线性相关系数为0,表明两变量之间( D )。

A 完全相关B 无关系C 不完全相关D 不存在线性相关9.身高和体重之间的关系是( C )。

A 函数关系B 无关系C 共变关系D 严格的依存关系10.在相关分析中,对两个变量的要求是( A )。

A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数11.在回归分析中,两个变量( D )。

A 都是随机变量B 都不是随机变量C 自变量是随机变量D 因变量是随机变量12.一元线性回归模型和多元线性回归模型的区别在于只有一个( B )。

A 因变量B 自变量C 相关系数D 判定系数13.以下指标恒为正的是( D )。

A 相关系数rB 截距aC 斜率bD 复相关系数14.下列关系中,属于正相关关系得是( A )。

A 身高与体重B 产品与单位成本C 正常商品的价格和需求量D 商品的零售额和流通费率三、多项选择1.关于积差系数,下面正确的说法是(ABCD )。

A 积差系数是线性相关系数B 积差系数具有PRE性质C 在积差系数的计算公式中,变量X和Y是对等关系D 在积差系数的计算公式中,变量X和Y都是随机的2.关于皮尔逊相关系数,下面正确的说法是()。

A 皮尔逊相关系数是线性相关系数B 积差系数能够解释两变量间的因果关系C r公式中的两个变量都是随机的D r的取值在1和0之间E 皮尔逊相关系数具有PRE性质,但这要通过r2加以反映3.简单线性回归分析的特点是(ABE )。

A 两个变量之间不是对等关系B 回归系数有正负号C 两个变量都是随机的D 利用一个回归方程,两个变量可以互相推算E 有可能求出两个回归方程4.反映某一线性回归方程y=a+bx好坏的指标有(ABD )。

A 相关系数B 判定系数C b的大小D 估计标准误E a的大小5.模拟回归方程进行分析适用于(ACDE )。

A 变量之间存在一定程度的相关系数B 不存在任何关系的几个变量之间C 变量之间存在线性相关D 变量之间存在曲线相关E 时间序列变量和时间之间6.判定系数r2=80%和含义如下(ABC )。

A 自变量和因变量之间的相关关系的密切程度B 因变量y的总变化中有80%可以由回归直线来解释和说明C 总偏差中有80%可以由回归偏差来解释D 相关系数一定为0.64E 判定系数和相关系数无关7.回归分析和相关分析的关系是(ABE )。

A 回归分析可用于估计和预测B 相关分析是研究变量之间的相互依存关系的密切程度C 回归分析中自变量和因变量可以互相推导并进行预测D 相关分析需区分自变量和因变量E 相关分析是回归分析的基础8.以下指标恒为正的是(BC )。

A 相关系数B 判定系数C 复相关系数D 偏相关系数E 回归方程的斜率9.一元线性回归分析中的回归系数b可以表示为(BC)A 两个变量之间相关关系的密切程度B 两个变量之间相关关系的方向C 当自变量增减一个单位时,因变量平均增减的量D 当因变量增减一个单位时,自变量平均增减的量E 回归模型的拟合优度10.关于回归系数b ,下面正确的说法是( )。

A b 也可以反映X 和Y 之间的关系强度。

; B 回归系数不解释两变量间的因果关系; C b 公式中的两个变量都是随机的;D b 的取值在1和-1之间;E b 也有正负之分。

四、名词解释1.消减误差比例变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关系时预测Y 的误差1E ,再将其化为比例来度量。

将削减误差比例记为PRE 。

2. 确定性关系当一个变量值确定后,另一个变量值夜完全确定了。

确定性关系往往表现成函数形式。

3.非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。

4.因果关系变量之间的关系满足三个条件,才能断定是因果关系。

1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。

5.单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。

三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。

6.正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。

7.散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X 与Y 的相互关系,即得相关图,又称散点图。

8.皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X 、Y 的标准差乘积的比率。

9.同序对在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y Y <,则称这一配对是同序对。

10.异序对在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y >Y ,则称这一配对是异序对。

11.同分对如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i jY =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。

五、判断题1.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。

(√)2.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关。

(√)3.不管相关关系表现形式如何,当r=0时,变量X和变量Y都是完全不相关。

(×)4.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。

而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数边际分布相同。

(×)5.如果众数频数集中在条件频数分布列联表的同一行中, 系数便会等于0,从而无法显示两变量之间的相关性。

(√)6.从分析层次上讲,相关分析更深刻一些。

因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。

(×)六、计算题1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。

2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。

3.假定有不同文化程度的35~45岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。

4.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。

【斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】5.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma 【τc =0.18】6.以下为两位评判员对10名参赛人名次的打分。

相关文档
最新文档