第九章 相关与回归分析习题
《统计学》第9章课后习题参考答案

第9章习题参考答案
9.1
解:(1)长度Y(厘米)与重量X(克)之间的散点图如下所示:
由Y与X的散点图可以大致推测长度Y关于重量X是线性相关,且二者呈正相关关系。
(2)首先,先分别求出平均重量和平均长度:
;;
其次,计算回归参数,其计算表如下:
表1:回归方程参数的计算表
(X-(Y-
最后,根据公式(9.6)计算相应的回归参数:
;
所以,Y关于X的一元线性回归方程为:
9.5
解:总变差,回归平方和,残差平方和的计算如下:
表2:总变差,回归平方和,残差平方和的计算表
∴残差平方和:;
回归平方和:
9.6
解:由表2得:
判定系数
又∵习题9.1的散点图显示Y与X是呈正相关关系
∴相关系数
显著性检验:
(1)回归方程的显著性检验:
原假设H0:该回归方程不显著;备择假设H1:该回归方程显著
计算F统计量:
∵在α=0.05的显著性水平下,有4454.79>F0.05(1,4)=7.71
∴拒绝原假设,认为该回归方程式显著的。
(2)回归参数的假设检验:
原假设H0:备择假设H1:
计算t统计量:;
[其中] ∵在α=0.05的显著性水平下,有15.98>t0.05(4)=2.776
∴拒绝原假设,即认为自变量X对因变量Y有显著性影响。
(3)相关关系的显著性检验:
原假设H0:ρ=0;备择假设H1:ρ
计算t统计量:;
∵在α=0.05的显著性水平下,有66.64> t0.05(4)=2.776
∴拒绝原假设,认为总体相关系数不为0。
统计学原理第九章(相关和回归)习题答案

第九章相关与回归一.判断题部分题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。
()答案:X题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1 时,说明两个变量不相关。
()答案:V题目3:只有当相关系数接近+1 时,才能说明两变量之间存在高度相关关系。
()答案:X题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。
()答案:X题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。
()答案:X题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。
()答案:V题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
()答案:X题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。
()答案:X题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。
()答案:V题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
()答案:X题目11:完全相关即是函数关系,其相关系数为± 1。
()答案:V题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。
()答案X二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A. 相关关系B. 函数关系C. 回归关系D. 随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即()。
A. 相关关系和函数关系B. 相关关系和因果关答案: C题目 5:相关系数的取值范围是 ( ) 。
-1<r <0 答案: CC. 越接近于 0D. 在 0.5 和 0.8 之间答案: C题目 7: 若物价上涨 ,商品的需求量相应减少 , 则物价与商品需求量之间的 关系为 ( ) 。
统计学课后习题答案-相关分析与回归分析

、 单项选择题1. 相关分析是研究变量之间的 A. 数量关系 C •因果关系2. 在相关分析中要求相关的两个变量3. 下列现象之间的关系哪一个属于相关关系?A. 播种量与粮食收获量之间关系 C •圆半径与圆面积之间关系 D. 单位产品成本与总成本之间关系 4. 正相关的特点是A •两个变量之间的变化方向相反 C. 两个变量之间的变化方向一致 5. 相关关系的主要特点是两个变量之间A. 存在着确定的依存关系 C. 存在着严重的依存关系 B. 存在着不完全确定的关系 D. 存在着严格的对应关系6.当自变量变化时 , 因变量也相应地随之等量变化 ,则两个变量 之间存在着A. 直线相关关系B.负相关关系C.曲线相关关系 D.正相关关系 7. 当变量 X 值增加时 ,变量 Y 值都随之下降 ,则变量 X 和 Y 之间存 在着 A. 正相关关系 C.负相关关系D.曲线相关关系8. 当变量 X 值增加时 ,变量 Y 值都随之增加 ,则变量 X 和 Y 之间存 在着 A. 直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系9. 判定现象之间相关关系密切程度的最主要方法是 A. 对现象进行定性分析 B.计算相关系数C.编制相关表 D.绘制相关图10. 相关分析对资料的要求是A. 自 变量不是随机的,因变量是随机的B. 两个变量均不是随机的C. 自变量是随机的,因变量不是随机的D. 两个变量均为随机的 11. 相关系数第七章相关分析与回归分析B.变动关系D. 相互关系的密切程度 A. 都是随机变量C. 都不是随机变量B. 自变量是随机变量 D. 因变量是随机变量B •圆半径与圆周长之间关系B.两个变量一增一减 D. 两个变量一减一增 B.直线相关关系A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为C. 不相关D.负相关B.-1w rw 0 D. r=0 ,则相关系数 B.愈趋近于0D. 愈小于 1 ,则相关系数 B.愈趋近于0D. 愈小于116. 相关系数越接近于- 1,表明两变量间C. 负相关关系越强 D.负相关关系越弱17. 当相关系数 r=0 时 , A. 现象之间完全无关 B.相关程度较小 B. 现象之间完全相关D.无直线相关关系18. 假设产品产量与产品单位成本之间的相关系数为 -0.89,则说明这两个变量之间存在A.高度相关 B.中度相关 C. 低度相关D.显著相关19. 从变量之间相关的方向看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关20. 从变量之间相关的表现形式看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关21. 物价上涨 ,销售量下降 ,则物价与销售量之间属于 A. 无相关 B.负相关 C.正相关D.无法判断22. 配合回归直线最合理的方法是 A.随手画线法 B.半数平均法 C.最小平方法D.指数平滑法A.单相关B.复相关 13. 相关系数的取值范围是 A.-1W r < 1C.OW rw 114. 两变量之间相关程度越强 A.愈趋近于1 C.愈大于115. 两变量之间相关程度越弱 A.愈趋近于1 A. 没有相关关系B. 有曲线相关关系23.在回归直线方程y= a+ bx 中 b 表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时,x的平均增加量24.计算估计标准误差的依据是A.因变量的数列C.因变量的回归变差25.估计标准误差是反映A.平均数代表性的指标B.因变量的总变差D.因变量的剩余变差B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中 ,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程 y=10+70x, 这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为 1000件时,其生产成本为 30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数G剩余变差B.回归参数D.估计标准误差、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系2.直线相关分析的特点是A.相关系数有正负号C.只有一个相关系数E.年龄与血压之间的关系B.两个变量是对等关系D. 因变量是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量 x 与 y 之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加 5.6元D.产量为 1 千件时,单位成本为 79.4 元E.产量每增加1千件,单位成本平均减少 5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关16用最小平方法配合的回归直线 A . (y-y c )=最小值 C. (y-y c )2=最小值 E.(y-y c )2=最大值D.计算相关系数 8•当现象之间完全相关的A.0B.— 1E.计算估计标准误差 ,相关系数为C.1D.0.5E. — 0.59•相关系数r =0说明两个变量之间是 A •可能完全不相关 B •可能是曲线相关 C.肯定不线性相关 D.肯定不曲线相关E. 高度曲线相关 10下列现象属于正相关的有A. 家庭收入愈多,其消费支出也愈多B. 流通费用率随商品销售额的增加而减少D. 生产单位产品耗用工时,随劳动生产率的提高而减少E. 工人劳动生产率越高,则创造的产值就越多 11直线回归分析的特点有 A •存在两个回归方程 B •回归系数有正负值C. 两个变量不对等关系D. 自变量是给定的,因变量是随机的E. 利用一个回归方程,两个变量可以相互计算 12直线回归方程中的两个变量C. 必须确定哪个是自变量,哪个是因变量D. 一个是随机变量,另一个是给定变量E. 一个是自变量,另一个是因变量13. 从现象间相互关系的方向划分,相关关系可以分为 A.直线相关 B.曲线相关 D. 负相关 E.单相关14. 估计标准误差是A. 说明平均数代表性的指标B. 说明回归直线代表性指标C. 因变量估计值可靠程度指标D. 指标值愈小,表明估计值愈可靠C.正相关Ar D.r(x x)(y y)B rL xyC.rL xyL yyL xy LXX(X X)(y y) Er■(X X)2 (y y)2n xy x y、n x 2 ( x)2 、n y 2 ( y)217 方程 y c=a+bx,必须满足以下条件B. (y-y c)=02A.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E.其数值大小受计量单位的影响19相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值一致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.__________________________________________________ 研究现象之间相关关系称作相关分析。
第9章 一元线性回归练习题

第9章一元线性回归练习题一.选择题1.具有相关关系的两个变量的特点是()A.一个变量的取值不能由另一个变量唯一确定B.一个变量的取值由另一个变量唯一确定C.一个变量的取值增大时另一个变量的取值也一定增大D.一个变量的取值增大时另一个变量的取值肯定变小2.下面的各问题中,哪个不是相关分析要解决的问题A.判断变量之间是否存在关系B.判断一个变量数值的变化对另一个变量的影响C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系3.根据下面的散点图,可以判断两个变量之间存在()A.正线性相关关系B. 负线性相关关系C. 非线性关系D. 函数关系4.下面的陈述哪一个是错误的()A. 相关系数是度量两个变量之间线性关系强度的统计量B.相关系数是一个随机变量C.相关系数的绝对值不会大于1D.相关系数不会取负值5.根据你的判断,下面的相关系数取值哪一个是错误的()A. -0.86B. 0.78C. 1.25D. 06.如果相关系数r=0,则表明两个变量之间()A.相关程度很低B. 不存在任何关系C.不存在线性相关关系D.存在非线性关系7.下列不属于相关关系的现象是()A.银行的年利息率与贷款总额B.居民收入与储蓄存款C.电视机的产量与鸡蛋产量D.某种商品的销售额与销售价格8.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着()A. 高度相关B.中度相关C.低度相关D.极弱相关9.在回归分析中,被预测或被解释的变量称为()A.自变量B.因变量C.随机变量D.非随机变量10.对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是()A.2ˆ()yy∑-最小B.2)(ˆyy∑-最大C.2ˆ()yy∑-最大D.2)(ˆyy∑-最小11. 下列哪个不属于一元回归中的基本假定()A.误差项i ε服从正态分布B. 对于所有的X ,方差都相同C. 误差项i ε相互独立D. 0)ˆ=-i i yy E ( 12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( )A.x y75.025ˆ-= B. x y 86.0120ˆ+-= C. x y 5.2200ˆ-= D. x y 74.034ˆ--= 13.对不同年份的产品成本拟合的直线方程为,75.1280ˆx y-=y 表示产品成本,x 表示不同年份,则可知( )A.时间每增加一个单位,产品成本平均增加1.75个单位B. 时间每增加一个单位,产品成本平均下降1.75个单位C.产品成本每变动一个单位,平均需要1.75年时间D. 产品成本每减少一个单位,平均需要1.75年时间 14.在回归分析中,F 检验主要是用来检验( )A .相关关系的显著性 B.回归系数的显著性 C. 线性关系的显著性D.估计标准误差的显著性15.说明回归方程拟合优度的统计量是( )A. 相关系数B.回归系数C. 判定系数D. 估计标准误差16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( ) A.97.08% B.2.92% C.3.01% D. 33.25% 17. 判定系数R2值越大,则回归方程( )A 拟合程度越低B 拟合程度越高C 拟合程度有可能高,也有可能低D 用回归方程进行预测越不准确 18. 居民收入与储蓄额之间的相关系数可能是( ) A -0.9247 B 0.9247 C -1.5362 D 1.536219.在对一元回归方程进行显著性检验时,得到判定系数R 2=0.80,关于该系数的说法正确的是( )A. 该系数越大,则方程的预测效果越好B. 该系数越大,则由回归方程所解释的因变量的变差越多C. 该系数越大,则自变量的回归对因变量的相关关系越显著D. 该回归方程中自变量与因变量之间的相关系数可能小于0.8 20.下列方程中肯定错误的是( )A. x y48.015ˆ-=,r=0.65 B. x y 35.115ˆ--=, r= - 0.81 C. x y85.025ˆ+-=, r=0.42 D. x y 56.3120ˆ-=, r= - 0.96 21. 若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R 2的取值范围是( )A.【0,1】B. 【-1,0】C. 【-1,1】D.小于0的任意数二. 填空题1.当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为0.8时,我们是否可认为这两个变量存在着强相关性(不能 ) ,理由是(因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验 )。
9 第九章 回归与相关

估计。
一)、加权最小二乘估计 假定各观测值的权重为Wi,求解回归方 程就要使得以下加权后的残差平方和最小
ss残W Wi Yi aw bw X
2
bw
aW
WX WY WXY W l l WX WX W WY b WX Y b W
二、直线回归方程的求法 直线方程为: a为Y轴上的截距;b为斜率,表示X 每改变一个单位,Y的变化的值,称为回 归系数; 表示在X值处Y的总体均数 估计值。为求a和b两系数,根据数学上 的最小二乘法原理,可导出a和b的算式 如下:
例9-1 某地方病研究所调查了8名正常 儿童的尿肌酐含量(mmol/24h)如表91。估计尿肌酐含量(Y)对其年龄(X) 的关系。
表14,rs界值表,P<0.01,故可认为当地居 民死因的构成和各种死因导致的潜在工作损 失年数WYPLL的构成呈正相关。 二、相同秩次较多时rs的校正 当X及Y中,相同秩次个数多时,宜用下式校 正
第四节
加权直线回归
在一些情况下,根据专业知识考虑 并结合实际数据,某些观察值对于估计 回归方程显得更“重要”,而有些不 “重要”,此时可以采用加权最小二乘
lYY的分析 如图9-4,p点的纵坐标被回归直线与均数 截成三个线段:
图9-4
平方和划分示意图
第一段 第二段
第三段
上述三段代数和为:
移项:
p点是散点图中任取一点,将所有的点子都
按上法处理,并将等式两端平方后再求和,
则有:
它们各自的自由度分别为: 可计算统计量F:
SS回 SS 残
2
F
回 残
表9-3某省1995年到1999年居民死因构成与WYPLL构成
《统计分析与SPSS的应用(第五版)》课后练习答案(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第9章SPSS的线性回归分析1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析。
请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。
选择fore和phy两门成绩体系散点图步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex导入设置标记→确定。
接下来在SPSS输出查看器中,双击上图,打开图表编辑在图表编辑器中,选择“元素”菜单→选择总计拟合线→选择线性→应用→再选择元素菜单→点击子组拟合线→选择线性→应用。
分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。
但回归直线的拟合效果都不是很好。
2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。
相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。
只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。
如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。
与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。
线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。
3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量的影响显著、哪些不显著。
应用技术回归分析第九章部分完整答案
第9章 非线性回归9.1 在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。
如:(1) 乘性误差项,模型形式为e y AK L αβε=, (2) 加性误差项,模型形式为y AK L αβε=+。
对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。
一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。
9.2为了研究生产率与废料率之间的关系,记录了如表9.14所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。
表9.14生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%)5.26.56.88.110.2 10.3 13.0解:先画出散点图如下图:5000.004000.003000.002000.001000.00x12.0010.008.006.00y从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。
(1)二次曲线 SPSS 输出结果如下:Mode l Sum mary.981.962.942.651R R SquareAdjusted R SquareStd. E rror of the E stim ateThe independent variable is x.ANOVA42.571221.28650.160.0011.6974.42444.2696Regression Residual TotalSum of Squares dfMean SquareF Sig.The independent variable is x.Coe fficients-.001.001-.449-.891.4234.47E -007.0001.4172.812.0485.843 1.3244.414.012x x ** 2(Constant)B Std. E rror Unstandardized Coefficients BetaStandardizedCoefficientstSig.从上表可以得到回归方程为:72ˆ 5.8430.087 4.4710yx x -=-+⨯ 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。
相关和回归分析练习题
课本例题:对某10户居民家庭的年可支配收入和消费支出进行调查,得到的原始资料如下, 单位:千元居民家庭编号1 2 3 4 5 6 7 8 9 10 可支配收入25 18 60 45 62 88 92 99 75 98 消费支出 20 15 40 30 42 60 65 70 53 78 (1) 计算居民可支配收入与消费支出之间的相关系数,判断这两个变量之间是否显著相关;(P223)(2) 建立居民消费支出对居民可支配收入的一元线性回归方程,并解释回归系数的经济意义;(P227)(3) 计算拟合系数2R , 解释其意义;(P230)(4) 当居民可支配收入为120千元时,利用回归方程预测相应的消费支出。
(P232)相关系数的计算222222()()()()()()i i i i XX Y Y XY nXY r X n X Y n Y X X Y Y ---==⋅---⋅-∑∑∑∑∑∑ 参数1ˆβ和0ˆβ的估计122ˆXY nXY X nX β-=-∑∑ 01ˆˆY X ββ=- 拟合系数的计算2222222211222ˆˆˆ()()](()[)ii i i X n X Y n Y y x R y y ββ===--∑∑∑∑∑∑2,,X XX ∑∑ 2,,Y Y Y ∑∑ XY ∑ 1、 解:22()()()()i i i i X X Y Y r XX Y Y --=-⋅-∑∑∑ 21025,152711,128.125Y Y Y ===∑∑,129559.16ni i i X Y ==∑2195.56,5822.3334,24.445X X X ===∑∑变量X 的离差平方和2222()1041.86()92i i X X X n x X -==-=∑∑∑, 变量Y 的离差平方和2222()21382.8()75i i Y Y Y n y Y -==-=∑∑∑变量X 和Y 离差乘积项的和()()4503.305i i i i X x y X X Y Y Y nXY =--=-=∑∑∑ 22()()4503.3050.95401041.869221382.875()()i i i i XX Y Y r X X Y Y --===⨯-⋅-∑∑∑ 2.解:(1) 2199.5,7667.15,24.9375Y YY ===∑∑,1107610.4ni i i X Y ==∑ 22670,1587328,333.75X XX ===∑∑ 12241027.275ˆ0.0589696215.5XY nXY X nX β-===-∑∑ 00ˆˆ24.93780.0589333.75 5.2700Y X ββ=-=-⨯= 样本回归方程为ˆ 5.27000.0589i iY X =+ (2)变量X 的离差平方和222696215.5,i i x X nX =-=∑∑ 变量Y 的离差平方和2222692.1188i i y Y nY =-=∑∑22221ˆˆ()0.0589696215.52415.3178i i yx β==⨯=∑∑ 222ˆ2415.31780.89812692.1188ii y R y ===∑∑,表明自变量能解释因变量89.81%左右的变动,模型的拟合效果较好。
(完整word版)应用回归分析,第9章课后习题参考答案
第9章 含定性变量的回归模型思考与练习参考答案9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0—1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。
出现这种情况的原因是什么?答:假如这个含有季节定性自变量的回归模型为:t t t t kt k t t D D D X X Y μαααβββ++++++=332211110其中含有k 个定量变量,记为x i 。
对春夏秋冬四个季节引入4个0—1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然,(X ,D)中的第1列可表示成后4列的线性组合,从而(X ,D)不满秩,参数无法唯一求出。
这就是所谓的“虚拟变量陷井",应避免。
当某自变量x j 对其余p —1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型.称Tol j =1—2j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0。
0001。
也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。
而在这个模型中出现了完全共线性,所以SPSS 软件计算的结果中总是自动删除了其中的一个定性自变量。
⎪⎪⎪⎪⎪⎭⎫⎝⎛=k βββ 10β⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=4321ααααα9。
2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?答:原因有两个,以例9.1说明。
一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。
方差分析与回归分析习题答案精修订
方差分析与回归分析习题答案SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#第九章 方差分析与回归分析习题参考答案1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显着影响.(0.05(2,9) 4.26F =,0.01(2,9)8.02F =)解:r=3,12444n n 321=++=++=n n ,T=120 ,12001212022===n T C 计算统计值?7228.53,38A A A e e SS f F SS f ==≈……方差分析表结论:由于0.018.53(2,9)8.02,A F F ≈>=故果树品种对产量有特别显着影响.2.2700=10.523.56=≈结论: 由以上方差分析知,进器对火箭的射程有特别显着影响;燃料对火箭的射程有显着影响. 3.为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据:2231,58,147,112,410.5,i i i i i i x y x y x y =====∑∑∑∑∑(1)求需求量Y 与价格x 之间的线性回归方程; (2)计算样本相关系数;(3)用F 检验法作线性回归关系显着性检验. 解:引入记号10, 3.1,5.8n x y ===∴需求量Y 与价格x 之间的线性回归方程为(2)样本相关系数32.80.955634.3248l r-==≈≈- 在0H 成立的条件下,取统计量(2)~(1,2)Ren S FF n S -=-计算统计值22(32.8)15.967.66,74.167.66 6.44R xy xx e yy R S l l S l S ==-≈=-≈-=故需求量Y 与价格x 之间的线性回归关系特别显着.4. 随机调查10个城市居民的家庭平均收入(x)与电器用电支出(y)情况得数据(单位:千元)如下:(1) 求电器用电支出y 与家庭平均收入x 之间的线性回归方程; (2) 计算样本相关系数; (3) 作线性回归关系显着性检验;(4) 若线性回归关系显着,求x =25时, y 的置信度为的预测区间. 解:引入记号10,27,1.9n x y ===∴电器用电支出y 与家庭平均收入x 之间的线性回归方程为(2)样本相关系数 0.9845l r==≈在0H 成立的条件下,取统计量(2)~(1,2)Rn S FF n S -=-e计算统计值2243.6354 5.37,5.54 5.370.17xy xx yy s l l s l s ==≈=-≈-=R e R故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. 相关系数检验法 01:0;:0H R H R =≠故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. (4) 因为0xx =处,0y 的置信度为1α-的预测区间为其中00.025垐 1.42640.123225 1.6536,(8) 2.31,0.1458y t σ=-+⨯====代入计算得当x =25时, y 的置信度为的预测区间为。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章相关与回归分析习题一、填空题1.现象之间的相关关系按相关的程度分为、和;按相关的形式分为和;按影响因素的多少分为和。
2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量,这种相关称为负相关。
3.相关系数的取值范围是。
4.完全相关即是关系,其相关系数为。
5.相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。
6.直线相关系数等于零,说明两变量之间;直线相关系数等1,说明两变量之间;直线相关系数等于—1,说明两变量之间。
7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为。
8.回归方程y=a+bx中的参数a是,b是。
在统计中估计待定参数的常用方法是。
9. 分析要确定哪个是自变量哪个是因变量,在这点上它与不同。
10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过化成来解决。
11.用来说明回归方程代表性大小的统计分析指标是。
12.判断一条回归直线与样本观测值拟合程度好坏的指标是。
二、单项选择题1.下面的函数关系是( )A销售人员测验成绩与销售额大小的关系B圆周的长度决定于它的半径C家庭的收入和消费的关系D数学成绩与统计学成绩的关系2.相关系数r的取值范围( )A -∞<r<+∞B -1≤r≤+1C -1<r<+1D 0≤r≤+13.年劳动生产率z(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元B减少70元C增加80元D减少80元4.若要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于( )A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关B正相关还是负相关C完全相关还是不完全相关D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程y =a+b x。
经计算,方程为y c=200—0.8x,该方程参数的计算( )cA a值是明显不对的B b值是明显不对的C a值和b值都是不对的 C a值和6值都是正确的7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )A 8B 0.32C 2D 12.58.进行相关分析,要求相关的两个变量( )A都是随机的B都不是随机的C一个是随机的,一个不是随机的D随机或不随机都可以9.下列关系中,属于正相关关系的有( )A合理限度内,施肥量和平均单产量之间的关系B产品产量与单位产品成本之间的关系C商品的流通费用与销售利润之间的关系D流通费用率与商品销售量之间的关系10.相关分析是研究( )A变量之间的数量关系B变量之间的变动关系C变量之间的相互关系的密切程度D变量之间的因果关系11.在回归直线y c=a+bx,b<0,则x与y之间的相关系数( )A r=0B r=lC 0<r<1D -1<r<012.在回归直线yc=a+bx中,b表示( )A当x增加一个单位,,y增加a的数量B当y增加一个单位时,x增加b的数量C当x增加一个单位时,y的均增加量D当y增加一个单位时,x的平均增加量13.当相关系数r=0时,表明( )A现象之间完全无关B相关程度较小C现象之间完全相关D无直线相关关系14.下列现象的相关密切程度最高的是( )A某商店的职工人数与商品销售额之间的相关系数0.87B流通费用水平与利润率之间的相关关系为-0.94C商品销售额与利润率之间的相关系数为0.51D商品销售额与流通费用水平的相关系数为-0.8115.估计标准误差是反映( )A平均数代表性的指标B相关关系的指标C回归直线的代表性指标D序时平均数代表性指标三、多项选择题1.下列哪些现象之间的关系为相关关系( )A家庭收入与消费支出关系B圆的面积与它的半径关系C广告支出与商品销售额关系D单位产品成本与利润关系E在价格固定情况下,销售量与商品销售额关系2.相关系数表明两个变量之间的( )A线性关系B因果关系C变异程度D相关方向E相关的密切程度3.对于一元线性回归分析来说( )A两变量之间必须明确哪个是自变量,哪个是因变量B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值C可能存在着y依x和x依y的两个回归方程D回归系数只有正号E 确定回归方程时,尽管两个变量也都是随机的,但要求自变量是给定的。
4.可用来判断现象相关方向的指标有( )A相关系数B回归系数C回归方程参数a D估计标准误 E x、y的平均数5.单位成本(元)依产量(千件)变化的回归方程为y c=78- 2x,这表示( )A产量为1000件时,单位成本76元B产量为1000件时,单位成本78元C产量每增加1000件时,单位成本下降2元D产量每增加1000件时,单位成本下降78元E当单位成本为72元时,产量为3000件6.估计标准误的作用是表明( )A回归方程的代表性B样本的变异程度C估计值与实际值的平均误差D样本指标的代表性E总体的变异程度7.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于( )AlE相关B单相关C负相关D复相关E完全相关8.在直线相关和回归分析中( )A据同一资料,相关系数只能计算一个B据同一资料,相关系数可以计算两个C据同一资料,回归方程只能配合一个D据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个E回归方程和相关系数均与自变量和因变量的确定无关9.相关系数r的数值( )A可为正值B可为负值C可大于1 D可等于-1 E可等于110.从变量之间相互关系的表现形式看,相关关系可分为( )A正相关B负相关C直线相关D曲线相关E不相关和完全相关11.确定直线回归方程必须满足的条件是( )A现象间确实存在数量上的相互依存关系B相关系数r必须等于1Cy与x必须同方向变化D现象间存在着较密切的直线相关关系E相关系数r必须大于012.当两个现象完全相关时,下列统计指标值可能为( )A r=1B r=0C r=-1D S yx=0E S yx =113.在直线回归分析中,确定直线回归方程的两个变量必须是( )A一个自变量,一个因变量B均为随机变量C对等关系D一个是随机变量,一个是可控制变量E不对等关系14.配合直线回归方程是为了( )A确定两个变量之间的变动关系B用因变量推算自变量C用自变量推算因变量D两个变量相互推算E确定两个变量间的相关程度15.在直线回归方程中( )A在两个变量中须确定自变量和因变量B一个回归方程只能作一种推算C回归系数只能取正值D要求两个变量都是随机变量E要求因变量是随机的,而自变量是给定的。
16.相关系数与回归系数( )A回归系数大于零则相关系数大于零B回归系数小于零则相关系数小于零C回归系数大于零则相关系数小于零D回归系数小于零则相关系数大于零E回归系数等于零则相关系数等于零四、判断题1.相关关系和函数关系都属于完全确定性的依存关系。
( )2.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。
( ) 3.假定变量x与y的相关系数是0.8,变量m与n的相关系数为—0.9,则x与y 的相关密切程度高。
( )4.当直线相关系数r=0时,说明变量之间不存在任何相关关系。
( )5.相关系数r有正负、有大小,因而它反映的是两现象之间具体的数量变动关系。
( ) 6.在进行相关和回归分析时,必须以定性分析为前提,判定现象之间有无关系及其作用范围。
( )7.回归系数b的符号与相关系数r的符号,可以相同也可以不相同。
( )8.在直线回归分析中,两个变量是对等的,不需要区分因变量和自变量。
( )9.相关系数r越大,则估计标准误差S xy值越大,从而直线回归方程的精确性越低。
( ) 10.进行相关与回归分析应注意对相关系数和回归直线方程的有效性进行检验。
( ) 11.工人的技术水平提高,使得劳动生产率提高。
这种关系是一种不完全的正相关关系( )12.正相关指的就是两个变量之间的变动方向都是上升的( )13.回归分析和相关分析一样所分析的两个变量都一定是随机变量( )14.相关的两个变量,只能算出一个相关系数( )15.一种回归直线只能作一种推算,不能反过来进行另一种推算( )五、计算题(2)建立直线回归方程;(3)计算估计标准误差;(4)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。
(2)建立直线回归方程;(3)计算估计标准误差。
(2)建立直线回归方程;(3)指出产量每增加1000件时,单位成本平均下降了多少元?(2)计算估计标准误差。
(2)计算有关指标,判断这三种经济现象之间的相关紧密程度。