第8章相关与回归分析课后习题答案

合集下载

统计学 第8章 相关与回归分析

统计学 第8章 相关与回归分析

2
-1 1 0 -1 -2 0 1 -2
4
1 1 0 1 4 0 1 4 20
6 * 20 r 1 2 1 0.8788 2 n(n 1) 10 * (10 1)
6 d 2
8.3
8.3.1 8.3.2 8.3.3 8.3.4 8.3.5
一元线性回归
一元线性回归模型 参数的最小二乘估计 回归直线的拟合优度 显著性检验 利用回归方程进行预测
共计
325
462 77
445 89
707 101
685 137
1043 149
E(Y|X) 65
Y
X=X1时Y 的分布
X=X2时Y 的分布 X=X3时Y 的分布
b0
X=X1时的E(Y)
b0+ b 1X
X=X2时的E(Y) X=X3时的E(Y)
X1=80
X2=100
X3=120
X
总体回归函数
(population regression function)
相关系数的显著性检验
(检验的步骤)
1. 检验两个变量之间是否存在线性相关关系 2. 利用样本的相关系数对总体相关系数进行 检验 3. 采用R.A.Fisher提出的 t 检验 4. 检验的步骤为



提出假设:H0: ;H1: 0
n2 计算检验的统计量: tr ~ t (n 2) 2 1 r 确定显著性水平,并作出决策
2
2
或化简为 r
n x x n y y
2 2 2
n xy x y
2
例 产品产量与单位成本相关系数
产 月 量 份 x 1 2 2 3 3 4 4 3 5 4 6 5 合 21 计 单位 成本 y 73 72 71 73 69 68

第八章 相关分析与回归分析

第八章 相关分析与回归分析
第8章 回归分析
下一页
返回本节首页
19
③在数据区域中输入B2:C11,选择“系列产 生在—列”,如下图所示,单击“下一步” 按钮。
上一页
第8章 回归分析
下一页
返回本节首页
20
④打开“图例”页面,取消图例,省略标题,如 下图所示。
上一页
第8章 回归分析
下一页
返回本节首页
21
⑤单击“完成”按钮,便得到XY散点图如下图 所示。
n 8, x 36.4, x 207.54 , y 104214 y 880, . xy 4544 6
2 2
r
n xy x y n x2 x 2 n y2 y 2 8 4544 6 36.4 880 .
第8章 回归分析
40
(二)回归分析的种类: 1、按自变量 x 的多少,分为一元回归和多 元回归; 2、按 y 与 x 关系的形式,分为线性回归和 非线性回归。
第8章 回归分析
41
二、一元线性回归分析
x y 62 86 80 110 115 132 135 160
42
(一)一元线性回归方程:
2、非线性相关:当一个变量变动时, 另一个变量也相应发生变动,但这种变 动是不均等的。
第8章 回归分析
9
㈢根据相关关系的方向 1、正相关:两个变量间的变化方向一 致,都是增长趋势或下降趋势。 2、负相关:两个变量变化趋势相反。
上一页
第8章 回归分析
下一页
返回本节首页
10
(四)根据相关关系的程度 1、完全相关:两个变量之间呈函数关系 2、不相关:两个变量彼此互不影响,其 数量的变化各自独立

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案一、单选题1.相关分析研究的是( A )A、变量间相互关系的密切程度B、变量之间因果关系C、变量之间严格的相依关系D、变量之间的线性关系2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A )。

A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。

A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零表明两变量(B)。

A.是严格的函数关系B.不存在相关关系C.不存在线性相关关系D.存在曲线线性相关关系5.相关关系的主要特征是(B)。

A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存在着不确定的直线关系6.时间数列自身相关是指( C )。

A、两变量在不同时间上的依存关系B、两变量静态的依存关系C、一个变量随时间不同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间(D)。

A、不存在相关关系B、相关程度很低C、相关程度很高D、完全负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。

A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9.相关分析对资料的要求是(A)。

A.两变量均为随机的B.两变量均不是随机的C、自变量是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.回归分析中简单回归是指(D)。

A.时间数列自身回归B.两个变量之间的回归C.变量之间的线性回归D.两个变量之间的线性回归11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为10 00时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A )A. y=6000+24xB. y=6+0.24xC. y=24000+6xD. y=24+6000x12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关B.表明现象负相关C.表明相关程度很弱D.不能说明相关方向和程度二、多项选择题1.下列属于相关关系的有(ABD )。

统计学第八章练习题

统计学第八章练习题

第八章相关与回归分析一、填空题8.1.1客观现象之间的数量联系可以归纳为两种不同的类型,一种是_____________ ,另一种是__________________ 。

8.1.2回归分析中对相互联系的两个或多个变量区分为__________________ 和___________ 。

8.1.3 _____________ 是指变量之间存在的严格确定的依存关系。

8.1.4 变量之间客观存在的非严格确定的依存关系,称为_____________________ 。

8.1.5按 ____________ 的多少不同,相关关系可分为单相关、复相关和偏相关。

8.1.6两个现象的相关,即一个变量对另一个变量的相关关系,称为。

8.1.7在某一现象与多个现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为____________________________ 。

8.1.8按变量之间相关关系的 _______________ 不同,可分为完全相关、不完全相关和不相关。

8.1.9按相关关系的 ____________________ 不同可分为线性相关和非线性相关。

8.1.10 线性相关中按_________________ 可分为正相关和负相关。

8.1.11 研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法,称为__________________ 。

8.1.12当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为。

8.1.13当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为。

8.1.14 当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为__________________ 。

8.1.15根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法,称为_____________________ 。

第八章 相关分析与回归分析习题答案

第八章 相关分析与回归分析习题答案

第八章 相关分析与回归分析习题参考答案一、名词解释函数关系:函数关系亦称确定性关系,是指变量(现象)之间存在的严格确定的依存关系。

在这种关系中,当一个或几个相互联系的变量取一定的数值时,必定有另一个且只有一个变量有确定的值与之对应。

相关关系:是指变量(现象)之间存在着非严格、不确定的依存关系。

在这种关系中,当一个或几个相互联系的变量取一定的数值时,可以有另一变量的若干数值与之相对应。

这种关系不能用完全确定的函数来表示。

相关分析:相关分析主要是研究两个或者两个以上随机变量之间相互依存关系的方向和密切程度的方法,直线相关用相关系数表示,曲线相关用相关指数表示,多元相关用复相关系数表示。

回归分析:回归分析是研究某一随机变量关于另一个(或多个)非随机变量之间数量关系变动趋势的方法。

其目的在于根据已知非随机变量来估计和预测随机变量的总体均值。

单相关:单相关是指仅涉及两个变量的相关关系。

复相关:复相关是指一个变量对两个或者两个以上其他变量的相关关系。

正相关:正相关是指两个变量的变化方向是一致的,当一个变量的值增加(或减少)时,另一变量的值也随之增加(或减少)。

负相关:负相关是指两个变量的变化方向相反,即当一个变量的值增加(或减少)时,另一个变量的值会随之减少(或增加)。

线性相关:如果相关的两个变量对应值在直角坐标系中的散点图近似呈一条直线,则称为线性相关。

非线性相关:如果相关的两个变量对应值在直角坐标系中的散点图近似呈现出某种曲线形式,则为非线性相关。

相关系数:相关系数是衡量变量之间线性相关密切程度及相关方向的统计分析指标。

取值在-1到1之间。

两个变量之间的简单样本相关系数的计算公式为:()()niix x y y r --∑二、单项选择1.B;2.D;3.D;4.C;5.A;6.D 。

三、判断题(正确的打“√”,错误的打“×”) 1.×; 2.×; 3.√; 4.×; 5.×; 6.×; 7.×; 8.√. 四、简答题1、什么是相关关系?相关关系与函数关系有什么区别?答:相关关系,是指变量(现象)之间存在着非严格、不确定的依存关系。

第八章 相关分析与回归分析

第八章 相关分析与回归分析

第八章相关分析与回归分析一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。

)1.根据散点图8-1,可以判断两个变量之间存在( )。

A.正线性相关关系B.负线性相关关系C.非线性关系D.函数关系[答案] A2.假设某品牌的笔记本市场需求只与消费者的收入水平和该笔记本的市场价格水平有关。

则在假定消费者的收入水平不变的条件下,该笔记本的市场需求与其市场价格水平的相关关系就是一种( )。

A.单相关B.复相关C.偏相关D.函数关系[答案] C[解析] 在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。

在假定消费者的收入水平不变的条件下,该笔记本的市场需求与其市场价格水平的关系就是一种偏相关。

3.相关图又称( )。

A.散布表B.折线图C.散点图D.曲线图[答案] C[解析] 相关图又称散点图,是指把相关表中的原始对应数值在乎面直角坐标系中用坐标点描绘出来的图形。

4.下列相关系数取值中错误的是( )。

A.-0.86 B.0.78 C.1.25 D.0[答案] C[解析] 相关系数r的取值介于-1与1之间。

5.如果相关系数r=0,则表明两个变量之间( )。

A.相关程度很低B.不存在任何关系C.不存在线性相关关系D.存在非线性相关关系[答案] C[解析] 相关系数r是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

如果相关系数r=0,说明两个变量之间不存在线性相关关系。

6.当所有观测值都落在回归直线上,则两个变量之间的相关系数为( )。

A.1 B.-1C.+1或-1 D.大于-1,小于+1[答案] C[解析] 当所有观测值都落在回归直线上时,说明两个变量完全线性相关,所以相关系数为+1或-1。

即当两个变量完全正相关时,r=+1;当两个变量完全负相关时,r=-1。

7.对于回归方程,下列说法中正确的是( )。

A.只能由自变量x去预测因变量yB.只能由因变量y去预测自变量xC.既可以由自变量x去预测因变量y,也可以由变量因y去预测自变量xD.能否相互预测,取决于自变量x和变量因y之间的因果关系[答案] A[解析] 回归方程中,只能由自变量x去预测因变量y,而不能由因变量y不能预测自变量x。

应用回归分析,第8章课后习题参考答案讲解

应用回归分析,第8章课后习题参考答案讲解

第8章 非线性回归思考与练习参考答案8.1 在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。

如:(1) 乘性误差项,模型形式为e y AK L αβε=, (2) 加性误差项,模型形式为y AK L αβε=+对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。

一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。

8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。

表8.15生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%)5.26.56.88.110.2 10.3 13.0解:先画出散点图如下图:5000.004000.003000.002000.001000.00x12.0010.008.006.00y从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。

(1)二次曲线 SPSS 输出结果如下:Model Summ ary.981.962.942.651R R SquareAdjusted R SquareStd. E rror of the EstimateThe independent variable is x.ANOVA42.571221.28650.160.0011.6974.42444.2696Regression Residual TotalSum of Squares dfMean SquareF Sig.The independent variable is x.Coe fficients-.001.001-.449-.891.4234.47E -007.0001.4172.812.0485.843 1.3244.414.012x x ** 2(Constant)B Std. E rror Unstandardized Coefficients BetaStandardizedCoefficientstSig.从上表可以得到回归方程为:72ˆ 5.8430.087 4.4710yx x -=-+⨯ 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。

统计学原理第八章相关与回归分析

统计学原理第八章相关与回归分析
பைடு நூலகம்
答案: 9x ? 17 ? kx 可以转化为 (9 ? k)x ? 17 即: x ? 17 ,x 为正整数 ,则 k ? 8或-8 9? k
测一测 3: 【中】 m 为整数,关于 x 的方程 x ? 6 ? mx 的解为正整数,求 m ? _____ 答案: 由原方程得: x ? 6 , x 是正整数,所以 m ? 1 只能为 6 的正约数,
a ? ____ b ? ____
答案: ?2a ? 12?x ? 5 ? ab . 要使 x 有无穷多个解,则 2a ? 12 ? 0 ab ? 5 ? 0
得到 a ? 6;b ? 5 6
测一测 2: 【中】
已知关于 x 的方程 2a ?x ? 1?? ?5 ? a?x ? 3b 有无数多个解,那么
m?1 m ? 1 ? 1,2,3,6 所以 m ? 0,1, 2,5
2. 两个一元一次方程同解问题
例题 2:⑴ 【易】若方程 ax ? 2x ? 9 与方程 2x ? 1 ? 5 的解相同,则 a 的值为 _________
【答案】 D
第一个方程的解为 x ? 1 ,将 x ? 1 代入到第二个方程中得: 2 ? a ? 1 =0 ,解得 a ? 5 2
答案:原方程可以转化为 ?3 ? m?x ? 4 ? n
⑴ 当 m ? 3,n为任意值时,方程有唯一解;
⑵ 当 m ? 3,n ? 4时,方程有无数解;
⑶ 当 m ? 3, n ? ? 4时,无解
测 一 测 1 :【 中 】 若 关 于 x 的 方 程 a ?2x ? b?? 12x ? 5 有 无 穷 多 个 解 。 求
a 当 a ? 0,b ? 0时,方程无解
当 a ? 0, b ? 0. 方程的解为任意数 .
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第8章相关与回归分析课后习题答案
8.1(1)利用Excel计算结果可知,相关系数为0.948138
XY
r=,说明相关程度较高。

(2)计算t统计量
2.681739
8.436851
0.317859
t====
给定显著性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值tα为2.306,显然2
t t
α
>,表明相关系数r在统计上是显著的。

8.2 利用Excel中的”数据分析”计算各省市人均GDP和第一产业中就业比例的相关系数为:-0.34239,这说明人均GDP与第一产业中就业比例是负相关,但相关系数只有-0.34239,表明二者负相关程度并不大。

相关系数检验:
在总体相关系数0
=
ρ的原假设下,计算t统计量:
0.34239
1.9624
r
t
-⨯
===-
查t分布表,自由度为31-2=29,当显著性水平取05
.0
=
α时,2αt=2.045;当显著性水平取0.1
α=时,2αt=1.699。

由于计算的t统计量的绝对值1.9624小于α
t
=2.045,所以在05
.0
=
α的显著性水平下,不能拒绝相关系数0
=
ρ的原假设。

即是说,在05
.0
=
α的显著性水平下不能认为人均GDP与第一产业中就业比例有显著的线性相关性。

但是计算的t统计量的绝对值1.9624大于2α
t
=1.699,所以在0.1
α=的显著性水平下,可以拒绝相关系数0
=
ρ的原假设。

即在0.1
α=的显著性水平下,可以认为人均GDP与第一产业中就业比例有一定的线性相关性。

8.3设当年红利为Y,每股账面价值为X
建立回归方程12
i i i
Y X u
ββ
=++
估计参数为
^
0.4797750.072876
i i
Y X
=+
参数的经济意义是每股账面价值增加1元时,当年红利将平均增加0.072876元。

序号6的公司每股账面价值为19.25元,增加1元后为20.25元,当年红利可能为:^
0.4797750.07287620.25 1.955514
i
Y=+⨯=(元)
8.4(1)数据散点图如下:
(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。

(3)设投诉率为Y ,航班正点率为X
建立回归方程 12i i i Y X u ββ=++
估计参数为 ^
6.01780.07i i Y X =-
(4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。

(5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为:
4187.08007.00178.6ˆ=⨯-=i Y (次/10万)
8.5 由Excel 回归输出的结果可以看出: (1)回归结果为
^
23332.993090.0716190.1687270.179042
i i i i Y X X X =+++ (2)由Excel 的计算结果已知:1234,,,ββββ对应的 t 统计量分别为0.51206、4.853871、
4.222811、3.663731 ,其绝对值均大于临界值0.025(224) 2.101t -=,所以各个自变量都对Y 有明显影响。

由F=58.20479, 大于临界值0.05(41,224) 3.16F --=,说明模型在整体上是显著的。

8.6 (1)该回归分析中样本容量是14+1=15; (2)计算RSS =66042-65965=77;
ESS 的自由度为k-1=2,RSS 的自由度 n -k =15-3=12;
(3)计算:可决系数 2
65965/660420.9988
R ==
修正的可决系数
2
1511(10.9988)
0.9986
153
R -=-
⨯-=-
(4)检验X 2和X 3对Y 是否有显著影响 /(1)65965/2329825140.11
/()
77/12
6.4166
ESS k F RSS n k -=
=
==-
(5) F 统计量远比F 临界值大,说明X 2和X 3联合起来对Y 有显著影响,但并不能确定
X 2和X 3各自对Y 的贡献为多少。

8.7
8.8(1)用Excel 输入Y 和X 数据,生成2X 和3X 的数据,用Y 对X 、2X 、3
X 回归,估计参数结果为
^
2
3
1726.737.8796468740.00895 3.7124906i i Y X X
E X =-+-+-
t =(-1.9213) (2.462897) (-2.55934) (3.118062) 2
0.973669R = 2
0.963764R =
(2)检验参数的显著性:当取0.05α=时,查t 分布表得0.025(124) 2.306t -=,与t 统计量对比,除了截距项外,各回归系数对应的t 统计量的绝对值均大于临界值,表明在这样的显著性水平下,回归系数显著不为0。

(3)检验整个回归方程的显著性:模型的2
0.973669R =,2
0.963794R =,说明可决系数较高,对样本数据拟合较好。

由于F =98.60668,而当取0.05α=时,查F 分布表得0.05(41,124) 4.07F --=,因为F =98.60668>4.07,应拒绝0234:0H βββ===,说明X 、2X 、3
X 联合起来对Y 确有显著影响。

(4)计算总成本对产量的非线性相关系数:因为2
0.973669R =因此总成本对产量的非线性相关系数为2
0.973669R =或R =0.9867466
(5)评价:虽然经t 检验各个系数均是显著的,但与临界值都十分接近,说明t 检验只是勉强通过,其把握并不大。

如果取0.01α=,则查t 分布表得0.005(124) 3.3554t -=,这时各个参数对应的t 统计量的绝对值均小于临界值,则在0.01α=的显著性水平下都应接受0:0
j H β=的原假设。

8.9 利用Excel 输入X 、y 数据,用y 对X 回归,估计参数结果为
i i x y
314.073.5ˆ-= t 值=(9.46)(-6.515) 794.02
=R 775.02
=R
整理后得到:x y 314.0e 9693.307ˆ-⨯=。

相关文档
最新文档