第10章 简单线性回归分析案例辨析及参考答案
回归分析考试试题及答案

回归分析考试试题及答案一、单项选择题(每题2分,共20分)1. 回归分析中,自变量和因变量之间的关系是()。
A. 确定性关系B. 函数关系C. 相关关系D. 因果关系答案:C2. 简单线性回归模型中,回归系数的估计值是通过()方法得到的。
A. 最小二乘法B. 最大似然法C. 贝叶斯方法D. 决策树方法答案:A3. 在多元线性回归分析中,如果自变量之间存在完全相关关系,则会导致()。
A. 多重共线性B. 异方差性C. 自相关D. 非线性答案:A4. 回归分析中,残差平方和(SSE)是用来衡量()的。
A. 模型的拟合优度B. 模型的预测能力C. 模型的解释能力D. 模型的预测误差答案:D5. 回归方程的显著性检验中,F检验的零假设是()。
A. 所有回归系数都等于0B. 所有回归系数都不等于0C. 至少有一个回归系数等于0D. 至少有一个回归系数不等于0答案:A6. 回归分析中,调整后的R平方(Adjusted R-squared)用于()。
A. 调整模型的复杂性B. 调整样本量的大小C. 调整自变量的数量D. 调整因变量的范围答案:C7. 在回归分析中,如果自变量的增加导致因变量的增加,则称自变量和因变量之间存在()。
A. 正相关B. 负相关C. 无相关D. 完全相关答案:A8. 回归分析中,残差的标准差(S)是用来衡量()的。
A. 模型的拟合优度B. 模型的预测能力C. 模型的解释能力D. 模型的预测误差答案:D9. 在多元线性回归中,如果一个自变量的t统计量显著,那么我们可以得出结论()。
A. 该自变量对因变量有显著影响B. 该自变量对因变量没有显著影响C. 该自变量对因变量的影响不明确D. 该自变量对因变量的影响是正的答案:A10. 回归分析中,Durbin-Watson统计量用于检测()。
A. 多重共线性B. 异方差性C. 自相关D. 非线性答案:C二、多项选择题(每题3分,共15分)11. 以下哪些因素可能导致回归模型中的异方差性?()A. 模型中遗漏了重要的解释变量B. 模型中包含了不应该包含的变量C. 模型中的误差项不是独立同分布的D. 模型中的误差项具有非恒定的方差答案:CD12. 在回归分析中,以下哪些方法可以用来处理多重共线性问题?()A. 增加样本量B. 移除相关性高的自变量C. 使用岭回归D. 增加更多的自变量答案:BC13. 以下哪些是回归分析中常用的诊断图?()A. 残差图B. 正态Q-Q图C. 散点图D. 杠杆值图答案:ABD14. 在回归分析中,以下哪些因素可能导致模型的预测能力下降?()A. 模型过拟合B. 模型欠拟合C. 模型中的误差项具有自相关性D. 模型中的误差项具有异方差性答案:ABCD15. 以下哪些是回归分析中常用的模型选择标准?()A. AIC(赤池信息准则)B. BIC(贝叶斯信息准则)C. R平方D. 调整后的R平方答案:ABCD三、简答题(每题10分,共30分)16. 简述简单线性回归模型的基本形式。
专题01 线性回归方程(解析版)

【解析】解: x 0 1 2 3 3 , y m 3 5.5 7 m 15.5 ,
4
2
4
4
这组数据的样本中心点是 ( 3 , m 15.5) , 24
关于 y 与 x 的线性回归方程 yˆ 2.1x 0.85 ,
m 15.5 2.1 3 0.85 ,解得 m 0.5 ,
x (次数 / 分
20
30
40
50
60
钟)
y( C)
25
27.5
29
32.5
36
A. 33 C
B. 34 C
C. 35 C
【解析】解:由题意,得 x 20 30 40 50 60 40 , 5
y 25 27.5 29 32.5 36 30 , 5
则 k y 0.25x 30 0.25 40 20 ;
故答案为:10.
例 7.已知一组数据点:
x
x1
x2
x8
y
y1
y2
y8
8
用最小二乘法得到其线性回归方程为 yˆ 2x 4 ,若数据 x1 , x2 , , x8 的平均数为 1,则 yi i 1
16 .
3
原创精品资源学科网独家享有版权,侵权必究!
【解析】解:由题意, x 1 ,设样本点的中心为 (1, y) , 又线性回归方程为 yˆ 2x 4 ,则 y 2 1 4 2 ,
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用 Y (单位:万元)的分布列为:
Y
30
20
70
120
P
0.3
0.4
0.2
0.1
E(Y ) 30 0.3 20 0.4 70 0.2 120 0.1 25 (万元)
回归分析练习题与参考标准答案

回归分析练习题与参考答案————————————————————————————————作者:————————————————————————————————日期:1 下面是7个地区2000年的人均国内生产总值(GDP)与人均消费水平的统计数据:地区人均GDP/元人均消费水平/元北京辽宁上海江西河南贵州陕西 224601122634547485154442662454973264490115462396220816082035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05α=)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间与预测区间。
解:(1)可能存在线性关系。
(2)相关系数:系数a模型非标准化系数标准系数t Sig.相关性B 标准误差试用版零阶偏部分1 (常量) 734.693 139.540 5.265 .003人均GDP .309 .008 .998 36.492 .000 .998 .998 .998 a. 因变量: 人均消费水平有很强的线性关系。
(3)回归方程:734.6930.309y x=+系数a模型非标准化系数标准系数t Sig.相关性B 标准误差试用版零阶偏部分1 (常量) 734.693 139.540 5.265 .003人均GDP .309 .008 .998 36.492 .000 .998 .998 .998 a. 因变量: 人均消费水平回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
回归分析练习题(有标准答案)

回归分析练习题(有答案)作者:日期:1.1回归分析的基本思想及其初步应用一、选择题1.某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为均值为2,数据y 的平均值为3,则()A .回归直线必过点(2,3)C 点(2,3)在回归直线上方B.回归直线一定不过点(2,3)D 点(2,3)在回归直线下方y bx a ,已知:数据x 的平2.在一次试验中,测得(x, y)的四组值分别是A (1,2),B(2,3),C(3,4),D(4,5),则丫与X 之间的回归直线方程为()A.$x1B .$ x 2C$2x1D.$ x 13.在对两个变量x ,y 进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;③求线性回归方程;④求未知参数;②收集数据(X j 、y i ),i 1,2,…,n ;⑤根据所搜集的数据绘制散点图)如果根据可行性要求能够作岀变量A.①②⑤③④Bx, y 具有线性相关结论,则在下列操作中正确的是(C.②④③①⑤D .②⑤④③①.③②④⑤①4.下列说法中正确的是()B人的知识与其年龄具有相关关系D 根据散点图求得的回归直线方程都是有意义的A.任何两个变量都具有相关关系C.散点图中的各点是分散的没有规律5.给出下列结论:2 2(1)在回归分析中,可用指数系数R 的值判断模型的拟合效果,R 越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,较合适带状区域的宽度越窄,说明模型的拟合精度越高.A.y 平均增加1.5个单位B.A. 1B )个..2r 越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比y 平均增加2个单位C.y 平均减少1.5个单位C.3DD.y 平均减少2个单位.4以上结论中,正确的有(6.已知直线回归方程为y7.2 1.5x ,则变量x 增加一个单位时()下面的各图中,散点图与相关系数r 不符合的是()\ 1V ||一1,— 1 < r<(>■r?■* ■■■■* ■..* .**打4X(7UV1)D.'8.一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归直线方程为据此可以预测这个孩子10岁时的身高,则正确的叙述是(A.身高一定是145.83cm C.身高低于145.00cm BD)7.19x 73.93,.身高超过146.00cm身高在145.83cm左右9.(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x轴上,预报变量在y轴上(C)(D)在画两个变量的散点图时,下面哪个叙述是正确的()可以选择两个变量中任意一个变量在x轴上可以选择两个变量中任意一个变量在y轴上10.两个变量y与x的回归模型中,通常用R2来刻画回归的效果,则正确的叙述是(22)A.R越小,残差平方和小2B.R越大,残差平方和大2c.R于残差平方和无关D.R越小,残差平方和大211.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.802 2C.模型3的相关指数R为0.50 D.模型4的相关指数R为0.2512.回归直线上相应位置的差异的是A.总偏差平方和B.C.回归平方和13.回归直线方程为残差平方和D.相关指数R2在回归分析中,代表了数据点和它在()工人月工资(元)依劳动生产率(千元)变化的60 90x,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元14.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② E.①②③ C.①②④ D.①②③④15.已知回归直线的斜率的估计值为中心为(4,5),则回归直线方程为()1.23,样本点的A.$ 1.23x 4B.$ 1.23x 5C.$ 1.23x 0.08D.y 0.08x 1.2316.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数果好的模型是 __________.17.在回归分析中残差的计算公式为 ____________.18.线性回归模型y bx a e(a和b为模型的未知参数)中,e称为_________________.19.若一组观测值(X1,yJ(X2,y2)…(Xn,y“)之间满足yi=bXi+a+e(i=1、2.…n)若恒为0,则氏为______________R2的值分别约为0.96和0.85,则拟合效20.调查某市出租车使用年限x 和该年支出维修费用y (万元),得到数据如下:使用年限x 维修费用y(求线性回归方程;n22.233.845.556. 567.0(2)由(1)中结论预测第10年所支出的维修费用.i 1(X i x) (y iy).n(X ii 1x)2bx21.以下是某地搜集到的新房屋的销售价格闵屋面积Ey 和房屋的面积x 的数据:11524.Q1102 1. CIB-413G29.21口丘22t 肖年愉梧(1)画岀数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格(4)求第2个点的残差。
【精品课件】新教材一轮复习北师大版第10章第3讲变量间的相关关系、统计案例课件

求得回归方程^y=0.67x+54.9.
零件数 x(个) 10 20 30 40 50
加工时间 y(min) 62
75 81 89
现发现表中有一个数据看不清,请你推断出该数据的值为__6_8__.
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
[解析] 由-x =30,得-y =0.67×30+54.9=75. 设表中的“模糊数字”为 a, 则 62+a+75+81+89=75×5,∴a=68.
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
返回导航
5.(2019·高考全国Ⅰ卷)某商场为提高服务质量,随机调查了 50 名 男顾客和 50 名女顾客,每位顾客对该商场的服务给出满意或不满意的评 价,得到下面列联表:
满意 不满意 男顾客 40 10 女顾客 30 20
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
考点一
相关关系的判断——自主练透
(1)(2021·四 川 资 阳 模
拟)在一次对人体脂肪含量和年龄关
系的研究中,研究人员获得了一组样
本数据,并制作成如图所示的人体脂
肪含量与年龄关系的散点图.根据该
图,下列结论中正确的是 ( )
返回导航
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
积相近的 200 个地块,从这些地块中用简单随机抽样的方法抽取 20 个作
为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中 xi 和 yi 分别表 示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计
20
20
20
算得xi=60,yi=1 200,
线性回归方程.附答案docx

线性回归方程一、考点、热点回顾一、相关关系:1、⎩⎨⎧<=1||1||r r 不确定关系:相关关系确定关系:函数关系2、相关系数:∑∑∑===-⋅---=ni ini ini iiy y x x y y x x r 12121)()())((,其中:(1)⎩⎨⎧<>负相关正相关00r r ;(2)相关性很弱;相关性很强;3.0||75.0||<>r r3、散点图:初步判断两个变量的相关关系。
二、线性回归方程:1、回归方程:a x b yˆˆˆ+= 其中2121121)())((ˆxn x yx n yx x x y yx x bn i i ni ii n i i ni ii--=---=∑∑∑∑====,x b y aˆˆ-=(代入样本点的中心) 2、残差:(1)残差图:横坐标为样本编号,纵坐标为每个编号样本对应的残差。
(2)残差图呈带状分布在横轴附近,越窄模型拟合精度越高。
(3)残差平方和∑=-ni i iyy12)ˆ(越小,模型拟合精度越高。
3、相关指数:∑∑==---=n i ini i iy yyyR 12122)()ˆ(1(1)其中:∑=-ni i iyy12)ˆ(为残差平方和;∑=-ni i y y 12)(为总偏差平方和。
(2))1,0(2∈R ,越大模型拟合精度越高。
二、典型例题+拓展训练典型例题1:在一组样本数据),,,2)(,(),,(),,(212211不全相等n n n x x x n y x y x y x ≥的散点图中,若所有样本点),2,1)(,(n i y x i i =都在直线121+-=x y 上,则样本相关系数为( ) 21.21.1.1.--D C B A典型例题2:设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据)2,1)(,(n i y x i i =,用最小二乘法建立的回归方程为71.8585.0ˆ-=x y ,则不正确的是( )A.y 与x 具有正的线性相关关系;B.回归直线过样本点的中心),(y xC.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg扩展2.一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试(1)对变量y 与x 进行相关性检验;(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?典型例题3.为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好.52211521()155110.8451000()i i i ii y y R yy ==-=-=-=-∑∑,221R =-521521()18010.821000()ii i ii yy y y ==-=-=-∑∑,84.5%>82%,所以甲选用的模型拟合效果较好.扩展1.下列说法正确的是( )(1)残差平方和越小,相关指数2R 越小,模型拟合效果越差; (2)残差平方和越大,相关指数2R 越大,模型拟合效果越好; (3)残差平方和越小,相关指数2R 越大,模型拟合效果越好; (4)残差平方和越大,相关指数2R 越小,模型拟合效果越差;A.(1)(2)B.(3)(4)C.(1)(4)D.(2)(3)扩展2.关于某设备的使用年限x (年)和所支出的维修费用y (万元)有下表所示的资料:若由资料知,y 对x 呈线性相关关系,求:(1)线性回归方程a x b yˆˆˆ+=中的回归系数b a ˆ,ˆ; (2)残差平方和与相关指数2R ,作出残差图,并对该回归模型的拟合精度作出适当判断; (3)使用年限为10年时,维修费用大约是多少?三、典型例题4.非线性回归模型:某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费和年销售量(i=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值。
第10章 简单线性回归分析案例辨析及参考答案

,=0.698。经检验,贫血患者治疗后的血红蛋白增加量与治疗有 关。
正常人均数:=20.21+7.78×0=20.21 患 者均数:=20.21+7.78×1=27.99 截距与两样本均数的差值相等。分别进行回归方程的方差分析与回 归系数的t检验,得F=17.112,t=4.137。回归系数的t检验结果与两样 本均数的t检验结果完全一致。以上结果说明,t检验的结果可以转化为
Quadratic .9941206.902 2 14.000 60.78810.805-.292
Cubic
.9982575.942 3 13.000 81.857 3.490 .447-.023
Growth .924 182.200 1 15.000 4.539 .034
The independent variable is 年龄。
上述曲线类型依次为线性、二次、三次多项式曲线和生长曲线,由 拟合结果可知,曲线拟合效果较好,进一步得到曲线图(案例图101):
(3)选择合理的模型,列出回归方程。以女孩身高二次曲线为
例,方程如下: 多项式曲线: (4)统计预测:预测19岁女孩身高为60.788+10.805×18-
0.292×182=160.7,与实际趋势相符。其他预测方法相同。
案例10-2 贫血患者的血清转铁蛋白研究。第6章例6-1中,为研究 某种新药治疗贫血患者的效果,将20名贫血患者随机分成两组,一组用 新药,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表6-1。 问新药与常规药治疗贫血患者后的血红蛋白增加量有无差别?
张医生用检验比较新药与常规药治疗贫血患者后的血红蛋白增加 量,计算得:
计量经济学答案简单线性回归模型PPT教案

10.2
10
0
2
4
6
8
10
35 30 25 20 15 10
5 0
0
5
10
15
相关关系(非线性)
没有关系
4
第3页/共104页
相关关系的类型
● 从涉及的变量数量看
简单相关 多重相关(复相关)
● 从变量相关关系的表现形式看
线性相关——散布图接近一条直线 非线性相关——散布图接近一条曲线
● 从变量相关关系变化的方向看
剩
余不Y项i完或全ˆ残1等差于ˆ项2样:X本i 条e件i
均值
,
则
或
21
第20页/共104页
样本回归函数的特点
●样本回归线随抽样波动而变化:
每次抽样都能获得一个样本,就可以拟合一条样
本回
Y
归线,(SRF不唯一)
SRF1 SRF2
●样本回归函数的函数形式
X
应与设定的总体回归函数的
函数形式一致。
22
第21页/共104页
释变量X的线性函数,可表示为:
Y
E(Y Xi )
E(Yi Xi ) f (Xi ) 1 2 Xi Yi
PRF
• •
ui
•
●个别值表现形式(随机设定形式)
Xi
X
对于一定的 X i,Y的各个别值 Y并i 不一定等于条件期望,而
是分布在 E(Y X的i ) 周围,若令各个 与Yi 条件期望
偏差为 u i,显然 u是i 个随机变量
4500
2277 2388 2526 2681 2887 3050 3189 3353 3534 3710 3834
3039
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
针对以上分析结果,请考虑: (1)分析过程是否符合回归分析的基本规范? (2)回归模型能反映数据的变化规律吗? (3)拟合结果和依据回归方程而进行的预测有问题吗? (4)男孩生长速度快于女孩的生长速度的推断是否有依据? 案例辨析 未绘制散点图,盲目进行简单线性回归分析;若实际资 料反映两变量之间呈现某种曲线变化趋势,用简单线性回归方程去描述 其变化规律就是不妥当的。
=27.99,=20.21,=4.137。
王医生认为,可以作线性回归分析。在该数据中涉及了两个变量,
一是观察效应变量(连续性),即血红蛋白增加量,将之作为回归分析中 的因变量;另外一个变量为处理因素(二分类变量),即影响因素,将 之作为自变量,其中新药组=1,常规药组=0。数据转换为双变量资料形 式(教材表10-7),经分析得回归方程,=4.137。
5.5 111.6 110.8 11.0 142.3 144.1 17.0 170.6 158.9
6.0 116.2 115.1 12.0 147.2 150.0 18.0 170.7 158.9
7.0 122.5 121.1 13.0 156.3 155.1
数据文件:data10-2.sav。
采用SPSS对身高与年龄进行回归分析,结果如表教材10-5和教材表 10-6所示。
案例10-2 贫血患者的血清转铁蛋白研究。第6章例6-1中,为研究 某种新药治疗贫血患者的效果,将20名贫血患者随机分成两组,一组用 新药,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表6-1。 问新药与常规药治疗贫血患者后的血红蛋白增加量有无差别?
张医生用检验比较新药与常规药治疗贫血患者后的血红蛋白增加 量,计算得:
教材表10-5 男孩身高对年龄的简单线性回归分析结果
估计值 标准误
P
Constant 83.736 3 1.882 4 44.483 9 0.000 0
AGE 5.274 8 0.167 6 31.479 8 0.000 0 =990.98 =98.5% 教材表10-6 女孩身高对年龄的简单线性回归分析结果
Linear
.985 990.980 1 15.000 83.7365.275
Quadratic .9931051.826 2 14.000 71.2708.103-.132
Cubic
.9961023.177 3 13.000 89.6091.735 .512-.020
Growth .973 535.145 1 15.000 4.514 .039
直线回归方程分析。当分组因素为k个组(样本)时,可以设置为k-1个 指示变量,采用第11章的多重线性回归分析,这在多因素分析中是最常 采用的办法。
教材表10-7 两种药物治疗贫血患者结果
编
编号
编
编
号
号
号
1 19.5 0 6 22.0 0 11 30.5 1 16 32.5 1
2 19.0 0 7 19.0 0 12 21.4 1 17 29.5 1
3 13.0 0 8 15.5 0 13 25.0 1 18 25.5 1
4 24.7 0 9 24.5 0 14 34.5 1 19 24.4 1
第10章 简单线性回归分析 案例辨析及参考答案
案例10-1 年龄与身高预测研究。某地调查了4~18岁男孩与女孩
身高,数据见教材表10-4,试描述男孩与女孩平均身高与年龄间的关
系,并预测10.5岁、16.5岁、19岁与20岁男孩与女孩的身高。
教材表10-4 某地男孩与女孩平均身高与年龄的调查数据
年
平均身高
年 龄
平均身高
年 龄
平均身高
龄 男孩 女孩
男孩 女孩
男孩 女孩
4.0 102.1 101.2 8.0 126.8 126.3 14.0 162.5 157.1
4.5 105.3 104.5 9.0 132.2 131.8 15.0 166.1 157.7
5.0 108.6 107.6 10.0 136.6 137.9 16.0 169.0 158.7
5 21.5 0 10 23.4 0 15 33.0 1 20 23.6 1 数据文件:data10-3.sav。
请考虑: (1)王医生的分析方法对不对? (2)回归分析能代行两样本均数t检验的任务吗?
(3)通过这个案例的实践,你得到哪些启发?
案例辨析 王医生的分析方法是对的;回归分析能代行两样本均 数t检验的任务。其理由如下。
上述曲线类型依次为线性、二次、三次多项式曲线和生长曲线,由 拟合结果可知,曲线拟合效果较好,进一步得到曲线图(案例图101):
(3)选择合理的模型,列出回归方程。以女孩身高二次曲线为
例,方程如下: 多项式曲线: (4)统计预测:预测19岁女孩身高为60.788+10.805×18-
0.292×182=160.7,与实际趋势相符。其他预测方法相同。
估计值 标准误
P
Constant 88.432 6
3.280 0
26.961 1
0.000 0
AGE
4.534 0 0.292 0 15.529 0.000 0 0
=241.15 =94.1%
经拟合简单线性回归模型,检验结果提示回归方程具有统计学意
义。结果提示,拟合效果非常好,故可认为:
(1)男孩与女孩的平均身高随年龄线性递增,年龄每增长1岁,男 孩与女孩身高分别平均增加5.27 cm与4.53 cm,男孩生长速度快于女孩 的生长速度。
Quadratic .9941206.902 2 14.000 60.78810.805-.292
Cubic
.9982575.942 3 13.000 81.857 3.490 .447-.023
Growth .924 182.200 1 15.000 4.539 .034
The independent variable is 年龄。
(2)选择曲线类型,进行统计分析,几种曲线方程拟合结果如下。
Model Summary and Parameter Estimates Dependent Variable: 男孩身高
Model Summary
Parameter Estimates
R
Equation Square F df1df2 Sig. Constant b1 b2 b3
The independent variable is 年龄。
Dependent Variable: 女孩身高
Model SuBiblioteka maryParameter Estimates
R
Equation Square F df1df2 Sig. Constant b1 b2 b3
Linear
.941 241.151 1 15.000 88.433 4.534
正确做法 两样本合并后,总例数为=20。进行直线回归分析,结 果如下:
,=0.698。经检验,贫血患者治疗后的血红蛋白增加量与治疗有 关。
正常人均数:=20.21+7.78×0=20.21 患 者均数:=20.21+7.78×1=27.99 截距与两样本均数的差值相等。分别进行回归方程的方差分析与回 归系数的t检验,得F=17.112,t=4.137。回归系数的t检验结果与两样 本均数的t检验结果完全一致。以上结果说明,t检验的结果可以转化为
正确做法 分析策略:作散点图,选择曲线类型,合理选择模型,
统计预测。
(1)作散点图(案例图10-1)。 案例图10-1 儿童身高对年龄的散点图 (a)男孩身高;(b)女孩身高
由案例图10-1可见,随着年龄的增加,身高也增加,但呈曲线变化 趋势,15~16岁后,增加趋势逐渐趋于平缓。因此适合于拟合曲线回归 方程。