回归分析课后习题

合集下载

最新应用回归分析-第6章课后习题参考答案

最新应用回归分析-第6章课后习题参考答案

第6章多重共线性的情形及其处理思考与练习参考答案6.1 试举一个产生多重共线性的经济实例。

答:例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。

由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。

再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。

6.2多重共线性对回归参数的估计有何影响?答:1、完全共线性下参数估计量不存在;2、近似共线性下OLS估计量非有效;3、参数估计量经济含义不合理;4、变量的显著性检验失去意义;5、模型的预测功能失效。

6.3 具有严重多重共线性的回归方程能不能用来做经济预测?答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。

但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。

6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。

当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。

6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?答:请参考第三次上机实验题——机场吞吐量的多元线性回归模型,注意利用二手数据很难避免多重共线性的出现,所以一般利用逐步回归和主成分回归消除多重共线性。

如果进行自己进行试验设计如正交试验设计,并收集数据,选择向量使设计矩阵X 的列向量(即X 1,X 2, X p )不相关。

6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。

第11章回归分析习题解答

第11章回归分析习题解答
A. 是一个尚不知晓的确定的数.
B. 是随机变量,且有 y0 N (β0 + β1x0 ,σ 2 ) .
C. 当 β0 , β1 确知时等于 β0 + β1x0 .
D. 等于 βˆ0 + βˆ1x0 .
6. 在回归分析中,检验线性相关显著性常用的三种检验方法,不包含(
A. 相关系数显著性检验法.
B. t 检验法.
; 若 新 保 单 数 x0 = 1000 , 给 出 Y 的 估 计 值 为
yˆ0 = 0.118129 + 0.003585×1000 = 3.703129 .
16. 下表是 16 只公益股票某年的每股帐面价值 x 和当年红利 y ,利用 Excel 的数据分
析功能得到的统计分析结果如下:
方差分析
过 10 周时间,收集了每周加班工作时间的数据和签发的新保单数目, x 为每周签发的新保
单数目,Y 为每周加班工作时间(小时).利用 Excel 的数据分析功能得到统计分析如下表.
Coefficients
标准误差
Intercept X Variable 1
0.118129 0.003585
0.355148 0.000421
15.1
15.1
228.01
228.01
18
15.1
14.5
228.01
210.25
列和
270.1
265
计算可得:
4149.39
3996.14
∑ Syy =
y2 i

ny 2
=94.75
∑ Sxx =
x2 i

nx 2
=96.39
∑ Sxy = xi yi − nxy = 95.24

《应用回归分析》课后题答案解析

《应用回归分析》课后题答案解析
.
.
《应用回归分析》部分课后习题答案
第一章 回归分析概述
1.1 变量间统计关系和函数关系的区别是什么? 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量 唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另 外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么? 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a. 在回归分析中,变量 y 称为因变量,处在被解释的特殊地位。在相关分析中,变 量 x 和变量 y 处于平等的地位,即研究变量 y 与变量 x 的密切程度与研究变量 x 与变量 y 的密切程度是一回事。b.相关分析中所涉及的变量 y 与变量 x 全是随机 变量。而在回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量也可以 是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的 密切程度。而回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归 方程进行预测和控制。
1 3
即为:(2.49,11.5)
33,7+2.353 1 3
33)
0
N
(0
,
(
1 n
(x)2 Lxx
)
2
)
t
0 0
0 0
(
1
(
x)2
)
2
1 (x)2
n Lxx
n Lxx
服从自由度为 n-2 的 t 分布。因而
P |
0 0
1 (x)2
| t /2 (n 2) 1
n Lxx页脚源自 ..1330 6.1
3
(5)由于 1
N
(1,

回归分析练习题(有答案)

回归分析练习题(有答案)

回归分析练习题(有答案)1.1回归分析的基本思想及其初步应用一、选择题1.某同学由某与均值为2,数据y之间的一组数据求得两个变量间的线性回归方程为yb某a,已知:数据某的平y的平均值为3,则()A.回归直线必过点(2,3)B.回归直线一定不过点(2,3)C.点(2,3)在回归直线上方D.点(2,3)在回归直线下方2.在一次试验中,测得(某,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y与某之间的回归直线方程为()A.y某1B.y2某1某2C.yD.y某13.在对两个变量某,y进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(某i、,2,i1yi),…,n;③求线性回归方程;④求未知参数;⑤根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量某,y具有线性相关结论,则在下列操作中正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①4.下列说法中正确的是()A.任何两个变量都具有相关关系B.人的知识与其年龄具有相关关系C.散点图中的各点是分散的没有规律D.根据散点图求得的回归直线方程都是有意义的5.给出下列结论:(1)在回归分析中,可用指数系数R的值判断模型的拟合效果,R 越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.以上结论中,正确的有()个.A.1B.2C.3D.46.已知直线回归方程为A.7.下面的各图中,散点图与相关系数r不符合的是()22y21.5某,则变量某增加一个单位时()D.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位y平均减少2个单位8.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为据此可以预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cmB.身高超过146.00cmC.身高低于145.00cmD.身高在145.83cm左右9.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在某轴上,解释变量在7.19某73.93,yy轴上(B)解释变量在某轴上,预报变量在y轴上(C)可以选择两个变量中任意一个变量在某轴上(D)可以选择两个变量中任意一个变量在10.两个变量22y轴上y与某的回归模型中,通常用R2来刻画回归的效果,则正确的叙述是()22A.R越小,残差平方和小B.R越大,残差平方和大C.R于残差平方和无关D.R越小,残差平方和大11.两个变量y与某的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果2222最好的模型是()A.模型1的相关指数R为0.98B.模型2的相关指数R为0.80C.模型3的相关指数R为0.50D.模型4的相关指数R为0.2512.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R213.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为y6090某,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元14.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②15.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程为()A.y1.23某4B.y1.23某5C.y1.23某0.08D.y0.08某1.23二、填空题16.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R的值分别约为0.96和0.85,则拟合效果好的模型是.17.在回归分析中残差的计算公式为.18.线性回归模型yb某ae(a和b为模型的未知参数)中,e称为.19.若一组观测值(某1,y1)(某2,y2)…(某n,yn)之间满足yi=b某i+a+ei(i=1、2.…n)若ei恒为0,则R为_____2B.①②③C.①②④D.①②③④2三、解答题20.调查某市出租车使用年限某和该年支出维修费用y(万元),得到数据如下:n(某i)(yi))(2)由(1)中结论预测第10年所支出的维修费用.(bi1 (某i)2i1a21.以下是某地搜集到的新房屋的销售价格y和房屋的面积某的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m时的销售价格.(4)求第2个点的残差。

应用回归分析,第3章课后习题参考答案

应用回归分析,第3章课后习题参考答案

第3章 多元线性回归思考与练习参考答案3.2 讨论样本容量n 与自变量个数p 的关系,它们对模型的参数估计有何影响?答:在多元线性回归模型中,样本容量n 与自变量个数p 的关系是:n>>p 。

如果n<=p 对模型的参数估计会带来很严重的影响。

因为: 1. 在多元线性回归模型中,有p+1个待估参数β,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。

2. 解释变量X 是确定性变量,要求()1rank p n =+<X ,表明设计矩阵X 中的自变量列之间不相关,即矩阵X 是一个满秩矩阵。

若()1rank p <+X ,则解释变量之间线性相关,1()X X -'是奇异阵,则β的估计不稳定。

3.3证明随机误差项ε的方差σ2的无偏估计。

证明:22122222111112221111ˆ(),111()()(1)(1)()(1)1ˆ()()1n i i n n nnnii ii iiii i i i i i ni i SSE e e e n p n p n p E e D e h h n h n p E E e n p σσσσσσσ======='===------∴==-=-=-=--∴==--∑∑∑∑∑∑∑3.4 一个回归方程的复相关系数R=0.99,样本决定系数R 2=0.9801,我们能判断这个回归方程就很理想吗? 答:不能断定这个回归方程理想。

因为:1. 在样本容量较少,变量个数较大时,决定系数的值容易接近1,而此时可能F 检验或者关于回归系数的t 检验,所建立的回归方()1ˆ2--=p n SSE σ程都没能通过。

2. 样本决定系数和复相关系数接近于1只能说明Y 与自变量X1,X2,…,Xp 整体上的线性关系成立,而不能判断回归方程和每个自变量是显著的,还需进行F 检验和t 检验。

3. 在应用过程中发现,在样本容量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得 R 2往往增大,因此增加解释变量(尤其是不显著的解释变量)个数引起的R 2的增大与拟合好坏无关。

应用回归分析第四版课后习题答案-全-何晓群-刘文卿精选全文完整版

应用回归分析第四版课后习题答案-全-何晓群-刘文卿精选全文完整版

可编辑修改精选全文完整版实用回归分析第四版第一章回归分析概述1.3回归模型中随机误差项ε的意义是什么?答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数,即n>p.第二章一元线性回归分析思考与练习参考答案2.1一元线性回归有哪些基本假定?答:假设1、解释变量X是确定性变量,Y是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性:E(εi)=0 i=1,2, …,nVar (εi)=σ2i=1,2, …,nCov(εi,εj)=0 i≠j i,j= 1,2, …,n假设3、随机误差项ε与解释变量X之间不相关:Cov(X i, εi)=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0, σ2) i=1,2, …,n2.3 证明(2.27式),∑e i =0 ,∑e i X i=0 。

证明:∑∑+-=-=niiiniXYYYQ12121))ˆˆ(()ˆ(ββ其中:即: ∑e i =0 ,∑e i X i =02.5 证明0ˆβ是β0的无偏估计。

证明:)1[)ˆ()ˆ(1110∑∑==--=-=ni i xxi ni i Y L X X X Y n E X Y E E ββ)] )(1([])1([1011i i xx i n i i xx i ni X L X X X n E Y L X X X n E εββ++--=--=∑∑==01010)()1(])1([βεβεβ=--+=--+=∑∑==i xxi ni i xx i ni E L X X X n L X X X n E 2.6 证明 证明:)] ()1([])1([)ˆ(102110i i xxi ni i xx i n i X Var L X X X n Y L X X X n Var Var εβββ++--=--=∑∑==222212]1[])(2)1[(σσxx xx i xx i ni L X n L X X X nL X X X n +=-+--=∑=2.7 证明平方和分解公式:SST=SSE+SSR证明:2.8 验证三种检验的关系,即验证: (1)21)2(r r n t --=;(2)2221ˆˆ)2/(1/t L n SSE SSR F xx ==-=σβ 证明:(1)01ˆˆˆˆi i i i iY X e Y Y ββ=+=-())1()1()ˆ(222122xx ni iL X n X XX nVar +=-+=∑=σσβ()()∑∑==-+-=-=n i ii i n i i Y Y Y Y Y Y SST 1212]ˆ()ˆ[()()()∑∑∑===-+--+-=ni ii ni i i i ni iY Y Y Y Y Y Y Y 12112)ˆˆ)(ˆ2ˆ()()SSE SSR )Y ˆY Y Y ˆn1i 2i i n1i 2i+=-+-=∑∑==0100ˆˆQQββ∂∂==∂∂ˆt======(2)2222201111 1111ˆˆˆˆˆˆ()()(())(()) n n n ni i i i xxi i i iSSR y y x y y x x y x x Lβββββ=====-=+-=+--=-=∑∑∑∑2212ˆ/1ˆ/(2)xxLSSRF tSSE nβσ∴===-2.9 验证(2.63)式:2211σ)L)xx(n()e(Varxxii---=证明:0112222222ˆˆˆvar()var()var()var()2cov(,)ˆˆˆvar()var()2cov(,())()()11[]2[]()1[1]i i i i i i ii i i ii ixx xxixxe y y y y y yy x y y x xx x x xn L n Lx xn Lβββσσσσ=-=+-=++-+---=++-+-=--其中:222221111))(1()(1))(,()()1,())(ˆ,(),())(ˆ,(σσσββxxixxiniixxiiiniiiiiiiiLxxnLxxnyLxxyCovxxynyCovxxyCovyyCovxxyyCov-+=-+=--+=-+=-+∑∑==2.10 用第9题证明是σ2的无偏估计量证明:2221122112211ˆˆ()()()22()111var()[1]221(2)2n ni ii in niii i xxE E y y E en nx xen n n Lnnσσσσ=====-=---==----=-=-∑∑∑∑第三章1.一个回归方程的复相关系数R=0.99,样本决定系数R2=0.9801,我们能2ˆ22-=∑neiσ判断这个回归方程就很理想吗? 答:不能断定这个回归方程理想。

回归分析习题及答案.doc

回归分析习题及答案.doc

1.1回归分析的基本思想及其初步应用例题:1.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在X轴上,预报变量在y轴上(0可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上解析:通常把自变量X称为解析变量,因变量y称为预报变量.选B2,若一组观测值(xi, yi) (x2, y2) ••- (x…, y n)之间满足 y-bxi+a+e;(i=l> 2. •••!!)若巳恒为0,则仁为_____________解析:e』亘为0,说明随机误差对方贡献为0.答案:1.3.假设关于某设备的使用年限x和所支出的维修费用y (万兀),有如下的统计资料:X 2 3 4 5 6y 22 38 55 65 70若由资料可知y对x呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?解:(1)列表如下:i 1 2 3 4 5X] 2 3 4 5 622 38 55 65 70时•44 114 220 325 420X; 4 9 16 25 36_ _ 5 5x = 4, y = 5,»;=9o, »,北=112.3z'=l z'=l5 ___况一5xy干旱,仃112.3-5x4x5 …c十正方= ------------- = ------------ -- = 1.23,S,厂2 90 —5x42小「- 5x<=|a = y -bx = 5-1.23x4 = 0.08线性回归方程为:y =bx + a = 1.23x + Q.QS ( 2 )当 x=10 时,y = 1.23x10 + 0.08 = 12.38 (万兀)即估计使用10年时维修费用是1238万元课后练习:1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7. 19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145. 83cm;B.身高在145. 83cm以上;C.身高在145. 83cm以下;D.身I W J在 145. 83cm 左右.2.两个变量y与x的回归模型中,分别选择了 4个不同模型,它们的相关指数人2如下,其中拟合效果最好的模型是()A.模型1的相关指数人2为0. 98B.模型2的相关指数R2为。

第四版应用回归分析课后习题第八章

第四版应用回归分析课后习题第八章

第8章 非线性回归思考与练习参考答案8.1 在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。

如:(1) 乘性误差项,模型形式为, (2) 加性误差项,模型形式为。

对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。

一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。

8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。

表8.15生产率x (单位/周) 1002000 3000 3500 400045005000废品率y (%)5.26.56.88.110.2 10.3 13.0解:先画出散点图如下图:e y AK L αβε=y AK L αβε=+从散点图大致可以判断出x和y之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。

(1)二次曲线SPSS输出结果如下:从上表可以得到回归方程为:72ˆ 5.8430.087 4.4710yx x -=-+⨯ 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。

由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。

(2)指数曲线从上表可以得到回归方程为:0.0002t ˆ 4.003ye = 由参数检验P 值≈0<0.05,得到回归方程的参数都非常显著。

从R2值,σ的估计值和模型检验统计量F值、t值及拟合图综合考虑,指数拟合效果更好一些。

8.3 已知变量x与y的样本数据如表8.16,画出散点图,试用αeβ/x来拟合回归模型,假设:(1)乘性误差项,模型形式为y=αeβ/x eε(2)加性误差项,模型形式为y=αeβ/x+ε。

表8.16解:散点图:(1)乘性误差项,模型形式为y=αeβ/x eε线性化:lny=lnα+β/x +ε令y1=lny, a=lnα,x1=1/x .做y1与x1的线性回归,SPSS输出结果如下:从以上结果可以得到回归方程为:y1=-3.856+6.08x1F检验和t检验的P值≈0<0.05,得到回归方程及其参数都非常显著。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章习题1.1变量间统计关系和函数关系的区别是什么?1.2回归分析与相关分析的区别和联系是什么?1.3回归模型中随机误差项的意义是什么?1.4线性回归模型中的基本假设是什么?1.5回归变量设置的理论依据是什么?在设置回归变量时应注意哪些问题?1.6收集、整理数据包括哪些基本内容?1.7构造回归理论模型的基本依据是什么?1.8为什么要对回归模型进行检验?1.9回归模型有哪几个方面的应用?1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?第二章 习题2.1一元线性回归模型有哪些基本假定? 2.2 考虑过原点的线性回归模型1,1,,i i i y x i n βε=+=误差1,,n εε仍满足基本假定。

求1β的最小二乘估计。

2.3证明(2.27)式,10nii e==∑,10ni i i x e ==∑。

2.4回归方程01Ey x ββ=+的参数01,ββ的最小二乘估计与极大似然估计在什么条件下等价?给出证明。

2.5 证明0ˆβ是0β的无偏估计。

2.6 证明(2.42)式 ()()222021,i x Var n x x βσ⎡⎤=+⎢⎥-⎢⎥⎣⎦∑成立 2.7 证明平方和分解式SST SSR SSE =+2.8 验证三种检验的关系,即验证:(1)t ==(2)2212ˆ1ˆ2xx L SSR F t SSE n βσ===-2.9 验证(2..63)式:()()221var 1i i xx x x e n L σ⎡⎤-=--⎢⎥⎢⎥⎣⎦2.10 用第9题证明()2211ˆˆ2n i ii y y n σ==--∑是2σ的无偏估计。

2.11* 验证决定系数2r 与F 值之间的关系式 22Fr F n =+-以上表达式说明2r 与F 值是等价的,那么我们为什么要分别引入这两个统计量,而不是只使用其中的一个。

2.12* 如果把自变量观测值都乘以2,回归参数的最小二乘估计0ˆβ和1ˆβ会发生什么变化?如果把自变量观测值都加上2,回归参数的最小二乘估计0ˆβ和1ˆβ会发生什么变化? 2.13 如果回归方程01ˆˆˆy x ββ=+相应的相关系数r 很大,则用它预测时,预测误差一定较小。

这一结论成立吗?请说明理由。

2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y (万元)和广告(1) 画散点图(2) X 与y 之间是否大致成线性关系 (3) 用最小二乘估计求出回归方程(4)求回归标准误差ˆσ(5) 给出0ˆβ与1ˆβ的置信度为95%的区间估计 (6) 计算x 与y 的决定系数(7) 对回归方程作方差分析 (8) 做回归系数1β显著性的检验(9) 做相关系数的显著性检验(10) 对回归方程做残差图并作相应的分析(11) 求当广告费用为4.2万元时,销售收入将达到多少,并给出置信度95%的置信区间 2.15 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。

经过10周时间,收集了每周加班工作时间的数据和签发的新保单数目,x 为每周签发的新保单数目,(1) 画散点图(2) X 与y 之间是否大致成线性关系? (3) 用最小二乘估计求出回归方程(4)求回归标准误差ˆσ(5) 给出0ˆβ与1ˆβ的置信度为95%的区间估计 (6) 计算x 与y 的决定系数(7) 对回归方程作方差分析 (8) 做回归系数1β显著性的检验 (9) 做相关系数的显著性检验(10) 对回归方程做残差图并作相应的分析(11)该公司预计下一周签发新保单01000x ,需要的加班时间是多少。

(12)给出y的置信度为95%的精确预测区间和近似预测区间。

(13)给出Ey的置信度为95%的区间估计。

2.16* 表2.8 是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和对学生的人均经费收入x(美元)。

(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?(2)建立y对x的线性回归。

(3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。

第三章 习题3.1 写出多元线性回归模型的矩阵表示形式,并给出多元线性回归模型的基本假设。

3.2 讨论样本量n 与自变量个数p 的关系,它们对模型的参数估计有何影响?3.3 证明21ˆ1SSE n p σ=--是误差项方差2σ的无偏估计。

3.4 一个回归方程的复相关系数R=0.99,样本决定系数20.9801R =,我们能判断这个回归方程就很理想吗?3.5 如何正确理解回归方程显著性检验拒绝0H 或接受0H ? 3.6 数据中心化和标准化在回归分析中的意义是什么? 3.7 验证(3.52)式*ˆˆ,1,,jjj p ββ==3.8 利用(3.60)式证明(3.61)式成立,即12;3r =3.9 证明y 与自变量j x 的偏决定系数与(3.42)式的偏F 检验值j F 是的等价的。

3.10* 验证决定系数与F 值之间的关系式 ()21FR F n p p=+--3.11 研究货运总量y (万吨)与工业总产值1x (亿元)、农业总产值2x (亿元)、居民非商品支出3x (亿元)的关系。

数据见表3.9。

(1)计算出y ,1x ,2x ,3x 的相关系数矩阵。

(2)求y 关于1x ,2x ,3x 的三元线性回归方程。

(3)对所求得的方程作拟合优度检验。

(4)对回归方程作显著性检验。

(5)对每一个回归系数作显著性检验。

(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验。

(7)求出每一个回归系数的置信水平位95%的置信区间。

(8)求标准化回归方程。

(9)求当01020375,42, 3.1x x x ===时的0ˆy,给定置信水平为95%,用SPSS 软件计算精确置信区间,用手工计算近似预测区间。

(10)结合回归方程对问题做一些基本分析。

3.12* 用表 3.10的数据,建立GDP 对1x ,2x 的回归。

对得到的二元回归方程12ˆ2914.60.607 1.709yx x =++,你能够合理的解释两个回归系数吗?如果现在不能给出合理的解释,不妨在学过第6章多重共线性后再来解释这个问题,在学过第七章岭回归后再来改进这个问题。

第四章 习题4.1 试举例说明产生异常差的原因。

4.2 异常差性带来的后果有哪些?4.3 阐述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。

4.4 阐述用加权最小二乘法消除多元线性回归中异常差性的思想与方法。

4.5 验证(4.5)式一元加权最小二乘回归系数估计公式。

4.6 验证(4.8)式多元加权最小二乘回归系数估计公式。

4.7 有同学认为当数据存在异常差时,加权最小二乘回归方程与普通最小二乘回归方程之间必然有很大的差异,异常差越严重,两者之间的差异就越大。

你是否同意这位同学的观点?说明原因。

4.8 对例4.3的数据,用公式iw iw e '=计算出加权变换残差iwe ',绘制加权变换残差图,根据绘制出的图形说明加权最小二乘回归估计的效果。

4.9 参见参考文献[2],表4.11是用电高峰每小时用电量y 与每月总用电量x 的数据。

(1)用普通最小二乘法建立y 与x 的回归方程,并画出残差散点图。

(2)诊断该问题是否存在异常差。

(3)如果存在异常差,用幂指数型的权函数建立加权最小二乘回归方程。

(4)用方差稳定性变换y '=4.10 试举一可能产生随机误差项系列相关的经济例子。

4.11 序列相关性带来的严重后果是什么? 4.12 总结DW 检验的优缺点。

4.13 表4.12中是某软件公司月销售额数据,其中,x 为总公司的月销售额数据(万元);y 为某分公司的月销售额(万元)。

(1)用普通最小二乘法建立y 与x 的回归方程。

(2)用残差图及DW 检验诊断序列的自相关性。

(3)用迭代法处理序列相关,并建立回归方程。

(4)用一阶差分法处理数据,并建立回归方程。

(5)比较以上各方法所建回归方程的优良性。

4.14* 某乐队经理研究其乐队CD 盘的销售额(y ),两个有关的影响变量是每周演出场次1x 和乐队网站的周点击率2x ,数据见表4.13.(1)用普通最小二乘法建立y 与1x ,2x 的回归方程,用残差图及DW 检验诊断序列的自相关性。

(2)用迭代法处理序列相关,并建立回归方程 (3)用一阶差分法处理数据,并建立回归方程。

(4)比较以上各方法所建回归方程的优良性。

4.15 说明引起异常值的原因和消除异常值的方法。

4.16 对第三章思考与练习第11题做异常值检验。

5.1 自变量选择对回归参数的估计有何影响? 5.2 自变量选择对回归预测有何影响?5.3 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣? 5.4 试述前进法的思想、方法。

5.5试述后退法的思想、方法。

5.6 前进法、后退法各有哪些优缺点? 5.7 试述逐步回归法的思想、方法。

5.8 在运用逐步回归法时,α进与α出的赋值原则是什么?如果希望回归方程中多保留一些自变量,α进应如何赋值?5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。

为了建立国家财政收入回归模型,我们以财政收入y (亿元)为因变量,自变量如下:1x 为农业增加值(亿元);2x 为工业增加值(亿元);3x 为建筑业增加值(亿元);4x 为人口数(万人);5x 为社会消费总额(亿元);6x 为受灾面积(万公顷)。

据《中国统计年鉴》获得1978-1998年共21个年份的统计数据,见表5.5。

由定性分析知,所选自变量与变量y 有较强的相关性,分别用后退法和逐步回归法做自变量选元。

5.10* 表5.6的数据时1968-1983年间美国与电话线制造有关的数据,各变量的含义如下:1x ——年份;2x ——国民生产总值(10亿美元); 3x ——新房动工数(单位:1000); 4x ——失业率(%);5x ——滞后6个月的最惠利率; 6x ——用户用线增量(%);y ——年电话线销量(百万尺双线);(1) 建立y 对的线性回归方程。

(2) 用后退法选择自变量。

(3) 用逐步回归法选择自变量。

(4) 根据以上计算结果分析后退法与逐步回归法的差异。

6.1 试举一个产生多重共线性的经济实例。

6.2 多重共线性对回归参数的估计有何影响?6.3 具有严重多重共线性的回归方程能否用来作经济预测?6.4 多重共线性的产生与样本量的个数n、自变量个数p有无关系?6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?6.6 对第5章思考与练习第9题财政收入的数据,分析数据的多重共线性,并根据多重共线性剔除变量,将所得结果与用逐步回归法所得的选元结果相比较。

相关文档
最新文档