应用回归分析 第三章课后习题整理汇编

合集下载

《应用回归分析》课后题答案.

《应用回归分析》课后题答案.

《应用回归分析》部分课后习题答案第一章回归分析概述1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。

1.2 回归分析与相关分析的联系与区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。

区别有 a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。

在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。

b.相关分析中所涉及的变量y与变量x全是随机变量。

而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。

1.3 回归模型中随机误差项ε的意义是什么?答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数,即n>p.1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。

应用回归分析第三版·何晓群-第三章所有习题答案

应用回归分析第三版·何晓群-第三章所有习题答案

应用回归分析第三章习题 3.1y x =β基本假定:(1) 诸1234n x ,x x ,x x ……非随机变量,rank (x )=p+1,X 为满秩矩阵(2) 误差项()()200i i j E ,i j cov ,,i j⎧ε=⎪⎧δ=⎨εε=⎨⎪≠⎩⎩(3)()20i i j ~N ,,⎧εδ⎪⎨εε⎪⎩诸相互独立3.2()10111ˆX X X X |rank(X X )p rank(X )p n p -'β'≠'=+≥+≥+存在,必须使存在。

即|则必有故3.3()()()()()22111221222211111111n nn i i ii i i i nii i ni i E e D e h n h n p ˆE E e n p n p n p =====⎛⎫==-δ ⎪⎝⎭⎛⎫=-δ=--δ ⎪⎝⎭⎛⎫∴δ==--δ=δ ⎪----⎝⎭∑∑∑∑∑3.4并不能这样武断地下结论。

2R 与回归方程中的自变量数目以及样本量n 有关,当样本量n 与自变量个数接近时,2R 易接近1,其中隐含着一些虚假成分。

因此,并不能仅凭很大的2R 就模型的优劣程度。

3.5首先,对回归方程的显著性进行整体上的检验——F 检验001230p H :β=β=β=β==β=……接受原假设:在显著水平α下,表示随机变量y 与诸x 之间的关系由线性模型表示不合适 拒绝原假设:认为在显著性水平α下,y 与诸x 之间有显著的线性关系第二,对单个自变量的回归系数进行显著性检验。

00i H :β=接受原假设:认为i β=0,自变量i x 对y 的线性效果并不显著3.6原始数据由于自变量的单位往往不同,会给分析带来一定的困难;又由于设计的数据量较大,可能会以为舍入误差而使得计算结果并不理想。

中心化和标准化回归系数有利于消除由于量纲不同、数量级不同带来的影响,避免不必要的误差。

3.71122011122201122ppp p p p p ˆˆˆˆˆy x x x ˆˆˆˆˆˆy y (x x )(x x )(x x )ˆˆˆˆy x x )x x )x x )y =β+β+β++β-=β+β-+β-++β--ββ=-+-++-=对最小二乘法求得一般回归方程:……对方程进行如下运算:…………*jjˆ+β=……即3.812132123313221231221233131231123233213231313*********111r r r r r r r r rr r r r r r r r r r r r ⎛⎫ ⎪= ⎪ ⎪⎝⎭∆==-∆==-∆==-即证3.9()()()()()1211121121211111j jj j j p j j j p yj j j p SSR /SSE F SSE /n p SSE /n p SSE x ,x ,,x ,x x SSE x ,x ,,x ,x ,x x r SSE x ,x ,,x ,x x -+-+-+∆∆==-----=……,?………,?…而……,?…由上两式可知,其考虑的都是通过j SSE ∆在总体中所占比例来衡量第j 个因素的重要程度,因而j F 与2yj r 是等价的。

应用回归分析课后答案

应用回归分析课后答案

应用回归分析课后答案第二章一元线性回归2.14 解答:EXCEL结果:SUMMARY OUTPUT回归统计Multiple R0.944911R Square0.892857Adjusted R Square0.857143标准误差0.597614观测值5方差分析df SS MS F Significance F回归分析18.9285718.928571250.015392残差3 1.0714290.357143总计410Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限95.0%上限95.0% Intercept-0.214290.6962-0.307790.778371-2.4299 2.001332-2.4299 2.001332 X Variable 10.1785710.03571450.0153920.0649130.292230.0649130.29223RESIDUAL OUTPUT观测值预测Y残差1 1.571429-0.571432 1.5714290.4285713 3.357143-0.357144 3.3571430.6428575 5.142857-0.14286SPSS结果:(1)散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=1330 6.13σ∧=≈ (5)由于211(,)xxN L σββ∧1112()/xxxxL t L ββσσ∧∧-==服从自由度为n-2的t 分布。

《应用回归分析》课后题答案

《应用回归分析》课后题答案

《使用回归分析》部分课后习题答案第一章回归分析概述1.1变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。

1.2回归分析和相关分析的联系和区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。

区别有 a.在回归分析中,变量y 称为因变量,处在被解释的特殊地位。

在相关分析中,变量x 和变量 y 处于平等的地位,即研究变量 y 和变量 x 的密切程度和研究变量 x 和变量 y 的密切程度是一回事。

b. 相关分析中所涉及的变量 y 和变量 x 全是随机变量。

而在回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。

1.3回归模型中随机误差项ε的意义是什么?答:ε 为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究 y 和 x1,x2 ⋯..xp 的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4线性回归模型的基本假设是什么?答:线性回归模型的基本假设有: 1. 解释变量 x1.x2 ⋯.xp 是非随机的,观测值xi1.xi2 ⋯..xip 是常数。

2. 等方差及不相关的假定条件为 {E( εi)=0 i=1,2 ⋯. Cov(εi,εj)= {σ^23.正态分布的假定条件为相互独立。

4. 样本容量的个数要多于解释变量的个数,即 n>p.1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。

应用回归分析课后习题

应用回归分析课后习题
使用其中的一个。
2.12* 如果把自变量观测值都乘以 2,回归参数的最小二乘估计 ˆ0 和 ˆ1 会发生什么变化?
#;
.
如果把自变量观测值都加上 2,回归参数的最小二乘估计 ˆ0 和 ˆ1 会发生什么变化?
2.13 如果回归方程 yˆ ˆ0 ˆ1x 相应的相关系数 r 很大,则用它预测时,预测误差一定较小。
2.15 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过 10
周时间,收集了每周加班工作时间的数据和签发的新保单数目,x 为每周签发的新保单数目,
y 为每周加班工作时间(小时)。见表
周序 1
2
3
4
5
6
7
8
9
10

X
825 215 1070 550 480 920 1350 325 670 1215
(8) 做回归系数 1 显著性的检验
(9) 做相关系数的显著性检验 (10) 对回归方程做残差图并作相应的分析
#;
. (11) 该公司预计下一周签发新保单 x0 1000 ,需要的加班时间是多少。 (12) 给出 y0 的置信度为 95%的精确预测区间和近似预测区间。 (13) 给出 Ey0 的置信度为 95%的区间估计。
(9)求当 x01 75, x02 42, x03 3.1 时的 yˆ0 ,给定置信水平为 95%,用 SPSS 软件计算精
#;
.
确置信区间,用手工计算近似预测区间。 (10)结合回归方程对问题做一些基本分析。
3.12* 用 表 3.10 的 数 据 , 建 立 GDP 对 x1 , x2 的 回 归 。 对 得 到 的 二 元 回 归 方 程 yˆ 2914.6 0.607x1 1.709x2 ,你能够合理的解释两个回归系数吗?如果现在不能给出

应用回归分析,第3章课后习题参考答案

应用回归分析,第3章课后习题参考答案

第3章 多元线性回归思考与练习参考答案3.2 讨论样本容量n 与自变量个数p 的关系,它们对模型的参数估计有何影响?答:在多元线性回归模型中,样本容量n 与自变量个数p 的关系是:n>>p 。

如果n<=p 对模型的参数估计会带来很严重的影响。

因为: 1. 在多元线性回归模型中,有p+1个待估参数β,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。

2. 解释变量X 是确定性变量,要求()1rank p n =+<X ,表明设计矩阵X 中的自变量列之间不相关,即矩阵X 是一个满秩矩阵。

若()1rank p <+X ,则解释变量之间线性相关,1()X X -'是奇异阵,则β的估计不稳定。

3.3证明随机误差项ε的方差σ2的无偏估计。

证明:22122222111112221111ˆ(),111()()(1)(1)()(1)1ˆ()()1n i i n n nnnii ii iiii i i i i i ni i SSE e e e n p n p n p E e D e h h n h n p E E e n p σσσσσσσ======='===------∴==-=-=-=--∴==--∑∑∑∑∑∑∑3.4 一个回归方程的复相关系数R=0.99,样本决定系数R 2=0.9801,我们能判断这个回归方程就很理想吗? 答:不能断定这个回归方程理想。

因为:1. 在样本容量较少,变量个数较大时,决定系数的值容易接近1,而此时可能F 检验或者关于回归系数的t 检验,所建立的回归方()1ˆ2--=p n SSE σ程都没能通过。

2. 样本决定系数和复相关系数接近于1只能说明Y 与自变量X1,X2,…,Xp 整体上的线性关系成立,而不能判断回归方程和每个自变量是显著的,还需进行F 检验和t 检验。

3. 在应用过程中发现,在样本容量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得 R 2往往增大,因此增加解释变量(尤其是不显著的解释变量)个数引起的R 2的增大与拟合好坏无关。

应用回归分析 课后习题

=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛yn y y M 21⎝⎛111M 12111xn x x M 22212xn x x MΛΛΛ ⎪⎪⎪⎪⎪⎭⎫xnp p x p x M 21 ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛p βββM 10 +⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n εεεM 21即y=x β+ε基本假定(1)解释变量x1,x2...,xp 是确定性变量,不是随机变量,且要求rank(X)=p+1<n,表明设计矩阵X 中自变量列之间不相关,样本量的个数应大于解释变量的个数(2)随机误差项具有零均值和等方差,即高斯马尔柯夫条件 (3)对于多元线性回归的正态分布假定条件的矩阵模型为ε~N (0,n I 2σ) 随即向量y~N(X n I 2,σβ)当(1)-X X T存在时,回归参数的最小二乘估计为Y X X X T T 1)(-∧=β,要求出回归参数∧β,即要求X X T 是一个非奇异矩阵,0≠X X T ,所以可逆矩阵X X T 为p+1阶的满秩矩阵,又根据两个矩阵乘积的秩不大于每一因子的秩rank(X)≥p+1,而X 为n ⨯(p+1)阶矩阵,于是应有n ≥p+1结论说明,要想用最小二乘法估计多元线性回归模型的未知参数,样本量n 必须大于模型自变量p 的个数。

1)())1((11)1(11)1(11)(11]))(()([11)(11)(11)11()(21)(122211121121121222222+===⨯+-⨯--=---=---=--=+--=--=--=--=++=-=∑∑∑∑∑∑∑∑∑========∧=∧p h H tr p n p n h p n h p n e D p n e E e D p n e E p n e E p n SSE p n E E en e e y y SSE nnn nn n nn nτττττττττττττττττττττσσσσσ注Λ 不能断定这个方程一定很理想,因为样本决定系数与回归方程中自变量的数目以及样本量n 有关,当样本量个数n 太小,而自变量又较多,使样本量与自变量的个数接近时,2R 易接近1,其中隐藏一些虚假成分。

应用回归分析(第三版)何晓群 刘文卿 课后习题答案 完整版

资料范本本资料为word版本,可以直接编辑和打印,感谢您的下载应用回归分析(第三版)何晓群刘文卿课后习题答案完整版地点:__________________时间:__________________说明:本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容第二章一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答:假设1、解释变量X是确定性变量,Y是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性:E(εi)=0 i=1,2, …,nVar (εi)=s2 i=1,2, …,nCov(εi, εj)=0 i≠j i,j= 1,2, …,n假设3、随机误差项ε与解释变量X之间不相关:Cov(Xi, εi)=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0, s2 ) i=1,2, …,n2.2 考虑过原点的线性回归模型Yi=β1Xi+εi i=1,2, …,n误差εi(i=1,2, …,n)仍满足基本假定。

求β1的最小二乘估计解:得:2.3 证明(2.27式),Sei =0 ,SeiXi=0 。

证明:其中:即: Sei =0 ,SeiXi=02.4回归方程E(Y)=β0+β1X的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。

答:由于εi~N(0, s2 ) i=1,2, …,n所以Yi=β0 + β1Xi + εi~N(β0+β1Xi , s2 )最大似然函数:使得Ln(L)最大的,就是β0,β1的最大似然估计值。

同时发现使得Ln(L)最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。

值得注意的是:最大似然估计是在εi~N(0, s2 )的假设下求得,最小二乘估计则不要求分布假设。

所以在εi~N(0, s2 ) 的条件下,参数β0,β1的最小二乘估计与最大似然估计等价。

应用回归分析第三章课后习题整理

3.1=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛yn y y 21 ⎝⎛111 12111xn x x 22212xn x x ⎪⎪⎪⎪⎪⎭⎫xnp p x p x 21 ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛p βββ 10 +⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n εεε 21即y=x β+ε基本假定(1)解释变量x1,x2...,xp 是确定性变量,不是随机变量,且要求rank(X)=p+1<n,表明设计矩阵X 中自变量列之间不相关,样本量的个数应大于解释变量的个数(2)随机误差项具有零均值和等方差,即高斯马尔柯夫条件nE ,2,1,0)(==τετ⎩⎨⎧=0)cov(2,σεεγτγτγτ≠=n 2,1,=γτ(3)对于多元线性回归的正态分布假定条件的矩阵模型为 ε~N (0,n I 2σ) 随即向量y~N(X n I 2,σβ) 3.2当(1)-X X T存在时,回归参数的最小二乘估计为Y X X X T T 1)(-∧=β,要求出回归参数∧β,即要求X X T 是一个非奇异矩阵,0≠X X T ,所以可逆矩阵X X T 为p+1阶的满秩矩阵,又根据两个矩阵乘积的秩不大于每一因子的秩rank(X)≥p+1,而X 为n ⨯(p+1)阶矩阵,于是应有n ≥p+1 结论说明,要想用最小二乘法估计多元线性回归模型的未知参数,样本量n 必须大于模型自变量p 的个数。

3.31)())1((11)1(11)1(11)(11]))(()([11)(11)(11)11()(21)(122211121121121222222+===⨯+-⨯--=---=---=--=+--=--=--=--=++=-=∑∑∑∑∑∑∑∑∑========∧=∧p h H tr p n p n h p n h p n e D p n e E e D p n e E p n e E p n SSE p n E E en e e y y SSE nnn nn n nn nτττττττττττττττττττττσσσσσ注 3.4不能断定这个方程一定很理想,因为样本决定系数与回归方程中自变量的数目以及样本量n 有关,当样本量个数n 太小,而自变量又较多,使样本量与自变量的个数接近时,2R 易接近1,其中隐藏一些虚假成分。

《应用回归分析》课后题答案[整理版]

《应用回归分析》课后题答案[整理版] 《应用回归分析》部分课后习题答案第一章回归分析概述 1.1 变量间统计关系和函数关系的区别是什么, 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。

1.2 回归分析与相关分析的联系与区别是什么, 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。

区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。

在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。

b.相关分析中所涉及的变量y与变量x全是随机变量。

而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而回归分析不仅可以揭示变量x 对变量y的影响大小,还可以由回归方程进行预测和控制。

1.3 回归模型中随机误差项ε的意义是什么, 答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么,答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2….Cov(εi,εj)=,σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数,即n>p.1.5 回归变量的设置理论根据是什么,在回归变量设置时应注意哪些问题,答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.1=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛yn y y 21 ⎝⎛111 12111xn x x 22212xn x x ⎪⎪⎪⎪⎪⎭⎫xnp p x p x 21 ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛p βββ 10 +⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n εεε 21即y=x β+ε基本假定(1)解释变量x1,x2...,xp 是确定性变量,不是随机变量,且要求rank(X)=p+1<n,表明设计矩阵X 中自变量列之间不相关,样本量的个数应大于解释变量的个数(2)随机误差项具有零均值和等方差,即高斯马尔柯夫条件nE ,2,1,0)(==τετ⎩⎨⎧=0)cov(2,σεεγτγτγτ≠=n 2,1,=γτ(3)对于多元线性回归的正态分布假定条件的矩阵模型为 ε~N (0,n I 2σ) 随即向量y~N(X n I 2,σβ) 3.2当(1)-X X T存在时,回归参数的最小二乘估计为Y X X X T T 1)(-∧=β,要求出回归参数∧β,即要求X X T 是一个非奇异矩阵,0≠X X T ,所以可逆矩阵X X T 为p+1阶的满秩矩阵,又根据两个矩阵乘积的秩不大于每一因子的秩rank(X)≥p+1,而X 为n ⨯(p+1)阶矩阵,于是应有n ≥p+1 结论说明,要想用最小二乘法估计多元线性回归模型的未知参数,样本量n 必须大于模型自变量p 的个数。

3.31)())1((11)1(11)1(11)(11]))(()([11)(11)(11)11()(21)(122211121121121222222+===⨯+-⨯--=---=---=--=+--=--=--=--=++=-=∑∑∑∑∑∑∑∑∑========∧=∧p h H tr p n p n h p n h p n e D p n e E e D p n e E p n e E p n SSE p n E E en e e y y SSE nnn nn n nn nτττττττττττττττττττττσσσσσ注 3.4不能断定这个方程一定很理想,因为样本决定系数与回归方程中自变量的数目以及样本量n 有关,当样本量个数n 太小,而自变量又较多,使样本量与自变量的个数接近时,2R 易接近1,其中隐藏一些虚假成分。

3.5当接受H 0时,认定在给定的显著性水平α下,自变量x1,x2, xp 对因变量y 无显著影响,于是通过x1,x2, xp 去推断y 也就无多大意义,在这种情况下,一方面可能这个问题本来应该用非线性模型去描述,而误用了线性模型,使得自变量对因变量无显著影响;另一方面可能是在考虑自变量时,把影响因变量y 的自变量漏掉了,可以重新考虑建模问题。

当拒绝H 0时,我们也不能过于相信这个检验,认为这个回归模型已经完美了,当拒绝H 0时,我们只能认为这个模型在一定程度上说明了自变量x1,x2, xp 与自变量y 的线性关系,这时仍不能排除排除我们漏掉了一些重要的自变量。

3.6中心化经验回归方程的常数项为0,回归方程只包含p 个参数估计值p ∧∧∧βββ ,,21比一般的经验回归方程减少了一个未知参数,在变量较多时,减少一个未知参数,计算的工作量会减少许多,对手工计算尤为重要。

在用多元线性回归方程描述某种经济现象时,由于自变量所用的单位大都不同,数据的大小差异也往往很大,这就不利于在同一标准上进行比较,为了消除量纲不同和数量级的差异带来的影响,就需要将样本数据标准化处理,然后用最小二乘法估计未知参数,求得标准化回归系数。

3.7对p p x x x y ττττββββ∧∧∧∧∧++++= 22110进行中心化处理得)()()(222111p p p x x x x x x y y -++-+-=-∧∧∧∧ττττβββ 再将等式除以因变量的样本标准差yy L 则有*τ∧y ==-++-+-=-∧∧∧∧)()()(222111p p yypyy yy yy x x L x x L x x L L y y ττττβββ ppp p yypp p yyyyL x x L L L x x L L L x x L L )()()(22222221111111-++-+-∧∧∧τττβββ =******2211p p x x x τττβββ∧∧∧+++所以=∧*j βp j L L yyjjj ,2,1,=∧β3.8 (ij ∆为相关阵(ij r )p p ⨯第i 行,第j 列的代数余子式)2211123;12∆•∆∆-=r =11)1(11)1(1)1(13312223321123312121r r r r r r r +++-⨯---)1)(1(221323312321r r r r r ---=3.9F j =)1()1()11()1()()1()()1()1()1()1(12222)()()()()()()()()()()(yjyj yj yj j j j j j j j j j j j r r p n r r p n SSE SSE SSE SSE SSE p n SSE SSE SSE SSE p n SSE SSE p n SSE SSR p n p n SSE SSR -⨯--=-⨯⨯--=∆-⨯∆⨯--=⨯∆⨯--=∆⨯--=∆⨯--=--∆2yjr 小于1,F j 与2yj r 一一对应,所以F j 与2yj r 等价 3.10=--+--⨯--⨯=--+pp n SSE p n p SSR SSEp n p SSR p p n F F 111)1(2)1(11R SSTSSR SST SSE SSE SSR SSESSE SSR SSE SSR SSE SSR p p n SSE SSR p p n ==⨯=+=+⨯--⨯--证得pp n F FR )1(2--+=3.11(1)N 10 10 10 10 *. 在 0.05 水平(双侧)上显著相关。

模型汇总模型R R 方调整 R 方标准估计的误差1 .898a.806 .708 23.44188a. 预测变量: (常量), x3, x1, x2。

Anova b模型平方和df 均方 F Sig.1 回归13655.370 3 4551.790 8.283 .015a残差3297.130 6 549.522总计16952.500 9a. 预测变量: (常量), x3, x1, x2。

b. 因变量: y系数a模型非标准化系数标准系数t Sig.B 标准误差试用版1 (常量) -348.280 176.459 -1.974 .096x1 3.754 1.933 .385 1.942 .100x2 7.101 2.880 .535 2.465 .049x3 12.447 10.569 .277 1.178 .284 a. 因变量: y1回归方程为y= -348.280+3.754x1+7.101x2+12.447x32复相关系数R=0.898,决定系数为0.806,拟合度较高。

3方差分析表,F=8.283,P值=0.015<0.05,表明回归方程高度显著,说明x1,x2,x3,整体上对y 有高度显著的线性影响4回归系数的显著性检验x1工业总产值的P值=0.100X2农业总产值的P值=0.049X3居民非产品支出的P值=0.284在0.1的显著性水平上,x3未通过检验,应将其剔除掉1回归方程为y= -459.624+4.676x1+8.971x22复相关系数R=0.872,决定系数为0.761,由决定系数看回归方程接近高度相关3方差分析表,F=11.117,P值=0.007,表明回归方程高度显著说明x1,x2,整体上对y有高度显著的线性影响4回归系数的显著性检验x1工业总产值的P值=0.037X2农业总产值的P值=0.008在0.05的显著性水平上,自变量x1,x2对y均有显著影响( 8 ) 标准化回归方程y=0.479x1+0.676x2(9)把x01=75,x02=42带入y= -459.624+4.676x1+8.971x2得y=267.86y置信水平95%的区间估计为(211.09492 , 324.57506)y置信水平95%的近似区间估计为(219.6978 , 316.0222)E(y)置信水平95%的区间估计为(245.00541 ,290.66457) (10)由于X3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好。

3.12VIF的值都大于10,所以变量之间存在多重共线性表中第三行x0(常数项),x1,x2的系数分别为0.73,1.00,0.97,说明x0(常数项),x1,x2之间存在多重共线性。

回归方程为y=2914.646+0.607x1+1.709x2,第一产业的增加值x1的P值=0.065第二产业的增加值x2的P值=0.000 在0.05的显著性水平上x1对y无显著影响。

相关文档
最新文档