应用回归分析-第3章课后习题参考答案

合集下载

2020年智慧树知道网课《应用回归分析》课后章节测试满分答案

第一章测试1【多选题】(2分)当一个经济问题的回归模型通过了各种统计检验，且模型具有合理的经济意义时，该回归模型就可用于A.经济变量的因素分析B.模型的显著性检验C.进行经济预测D.给定被解释变量值来控制解释变量值2【判断题】(2分)常用的样本数据有时间序列数据和横截面数据。

A.错B.对3【多选题】(2分)随机误差项主要包括以下哪些因素的影响？A.其他随机因素B.样本采集过程中的测量误差C.由于人们认识的局限性或时间、费用、数据质量等的约束未引入回归模型但又对回归被解释变量有影响的因素D.理论模型的设定误差4【判断题】(2分)变量间具有密切关联而又不能由某一个或某一些变量确定另外一个变量的关系称为变量间的统计关系。

A.对B.错5【单选题】(2分)进行回归分析时，假定相关的两个变量（）。

A.都不是随机变量B.一个是随机变量，一个不是随机变量C.都是随机变量D.随机或非随机都可以第二章测试1【单选题】(2分)总体平方和SST、残差平方和SSE、回归平方和SSR三者之间的关系是（）。

A.SSE=SSR-SSTB.SST=SSR+SSEC.SSR=SST+SSED.SSE=SSR+SST2【单选题】(2分)反映由模型中解释变量所解释的那部分离差大小的是（）。

A.残差平方和B.总体平方和C.回归平方和D.样本平方和3【多选题】(2分)古典线性回归模型的普通最小二乘估计量的特性有（）。

A.无偏性B.不一致性C.最小方差D.线性4【判断题】(2分)一元线性回归分析中的回归平方和SSR的自由度是1。

A.错B.。

应用回归分析课后题答案

《应用回归分析》部分课后习题答案第一章回归分析概述1.1 变量间统计关系和函数关系的区别是什么？答：变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系，而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。

1.2 回归分析与相关分析的联系与区别是什么？答：联系有回归分析和相关分析都是研究变量间关系的统计学课题。

区别有 a.在回归分析中，变量y称为因变量，处在被解释的特殊地位。

在相关分析中，变量x和变量y处于平等的地位，即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。

b.相关分析中所涉及的变量y与变量x全是随机变量。

而在回归分析中，因变量y是随机变量，自变量x可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而回归分析不仅可以揭示变量x对变量y的影响大小，还可以由回归方程进行预测和控制。

1.3 回归模型中随机误差项ε的意义是什么？答：ε为随机误差项，正是由于随机误差项的引入，才将变量间的关系描述为一个随机方程，使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系，由于客观经济现象是错综复杂的，一种经济现象很难用有限个因素来准确说明，随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么？答：线性回归模型的基本假设有：1.解释变量x1.x2….xp是非随机的，观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)=｛σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数，即n>p.1.5 回归变量的设置理论根据是什么？在回归变量设置时应注意哪些问题？答：理论判断某个变量应该作为解释变量，即便是不显著的，如果理论上无法判断那么可以采用统计方法来判断，解释变量和被解释变量存在统计关系。

应用回归分析课后习题

2.16* 表 2.8 是 1985 年美国 50 个州和哥伦比亚特区公立学校中教师的人均年工资 y（美元）和对学生的人均经费收入 x（美元）。（1）绘制 y 对 x 的散点图，可以用直线回归描述两者之间的关系吗？（2）建立 y 对 x 的线性回归。（3）用线性回归的 Plots 功能绘制标准残差的直方图和正态概率图，检验误差项的正态性假设。
使用其中的一个。
2.12* 如果把自变量观测值都乘以 2，回归参数的最小二乘估计 ˆ0 和 ˆ1 会发生什么变化？
#;
.
如果把自变量观测值都加上 2，回归参数的最小二乘估计 ˆ0 和 ˆ1 会发生什么变化？
2.13 如果回归方程 yˆ ˆ0 ˆ1x 相应的相关系数 r 很大，则用它预测时，预测误差一定较小。
#;
.
第三章习题
3.1 写出多元线性回归模型的矩阵表示形式，并给出多元线性回归模型的基本假设。 3.2 讨论样本量 n 与自变量个数 p 的关系，它们对模型的参数估计有何影响？
3.3 证明ˆ 2 1 SSE 是误差项方差 2 的无偏估计。 n p 1
3.4 一个回归方程的复相关系数 R=0.99，样本决定系数 R2 0.9801 ，我们能判断这个回归
2.15 一家保险公司十分关心其总公司营业部加班的程度，决定认真调查一下现状。经过 10
周时间，收集了每周加班工作时间的数据和签发的新保单数目，x 为每周签发的新保单数目，
y 为每周加班工作时间（小时）。见表
周序 1
2
3
4
5
6
7
8
9
10
号
X
825 215 1070 550 480 920 1350 325 670 1215

【分析】应用回归分析课后习题参考答案全部版何晓群刘文卿

【关键字】分析第一章回归分析概述1.2 返回分析与相关分析的联系与区别是什么？答：联系有返回分析和相关分析都是研究变量间关系的统计学课题。

区别有a.在返回分析中，变量y称为因变量，处在被解释的特殊地位。

在相关分析中，变量x和变量y处于平等的地位，即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。

b.相关分析中所涉及的变量y与变量x全是随机变量。

而在返回分析中，因变量y是随机变量，自变量x可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而返回分析不仅可以揭示变量x对变量y的影响大小，还可以由返回方程进行预测和控制。

1.3 返回模型中随机误差项ε的意义是什么？答：ε为随机误差项，正是由于随机误差项的引入，才将变量间的关系描述为一个随机方程，使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系，由于客观经济现象是错综复杂的，一种经济现象很难用有限个因素来准确说明，随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性返回模型的基本假设是什么？答：线性返回模型的基本假设有：1.解释变量x1.x2….xp是非随机的，观测值xi1.xi2…..xip 是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)=｛σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数，即n>p.第二章一元线性返回分析思考与练习参考答案2.1 一元线性返回有哪些基本假定?答：假设1、解释变量X是确定性变量，Y是随机变量；假设2、随机误差项ε具有零均值、同方差和不序列相关性：E(εi)=0 i=1,2, …,nVar (εi)= 2 i=1,2, …,nCov(εi, εj)=0 i≠j i,j= 1,2, …,n假设3、随机误差项ε与解释变量X之间不相关：Cov(Xi, εi)=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0, 2 ) i=1,2, …,n2.3 证明（2.27式），ei =0 ，eiXi=0 。

第三章多元线性回归模型习题答案

&第三章多元线性回归模型一、单项选择题1、C2、A3、B4、A5、C6、C7、A8、D9、B 10、D一、单项选择题1、在模型0112233t t t t t Y X X X ββββμ=++++的回归分析结果中，有462.58F =，0.000000F p =的值，则表明（ C ） A 、解释变量2t X 对t Y 的影响不显著B 、解释变量1t X 对t Y 的影响显著】C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量2t X 和1t X 对t Y 的影响显著2、设k 为回归模型中的实解释变量的个数，n 为样本容量。

则对回归模型进行总体显著性检验(F 检验)时构造的F 统计量为（ A ）A 、(1)ESS k F RSS n k =--B 、(1))ESS k F RSS n k -=- C 、ESS F RSS = D 、1RSS F TSS=- 3、已知二元线性回归模型估计的残差平方和为2800i e =∑，估计用样本容量为23n =，则随机误差项t μ的方差的OLS 估计值为（ B ）!A 、B 、 40C 、D 、4、在多元回归中，调整后的决定系数2R 与决定系数2R 的关系为（ A ）A 、22R R <B 、22R R >C 、22R R =D 、2R 与2R 的关系不能确定5、下面说法正确的有（ C ）A 、时间序列数据和横截面数据没有差异B 、对回归模型的总体显著性检验没有必要C 、总体回归方程与样本回归方程是有区别的：D 、决定系数2R 不可以用于衡量拟合优度6、根据调整的可决系数2R 与F 统计量的关系可知，当21R =时，有（ C ）A 、F=0B 、F=－1C 、F →+∞D 、F=-∞7、线性回归模型的参数估计量ˆβ是随机向量Y 的函数，即1ˆ()X X X Y β-''=。

ˆβ是（ A ）A 、随机向量B 、非随机向量C 、确定性向量D 、常量8、下面哪一表述是正确的（ D ）A 、线性回归模型01i i i Y X ββμ=++的零均值假设是指110ni i n μ==∑ ；B 、对模型01122i i i i Y X X βββμ=+++进行方程显著性检验（即F 检验），检验的零假设是0012:0H βββ===C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时，说明被解释变量与解释变量之间为函数关系9、对于01122ˆˆˆˆi i i k ki iY X X X e ββββ=+++++…，如果原模型满足线性模型的基本假设则在零假设0j β=下，统计量ˆˆ()j j s ββ（其中ˆ()js β是j β的标准误差）服从（ B ）A 、()t n k -B 、(1)t n k --C 、(1,)F k n k --D 、(,1)F k n k --10、下列说法中正确的是（ D ）。

应用回归分析(第三版)何晓群_刘文卿_课后习题答案_完整版

（8）做回归系数β1 的显著性检验 H0: β1=0
t ˆ1 / Sˆ1 7 / 1.915 3.656
t 值=3.656>t0.05/2(3)=3.182,所以拒绝原假设，说明 x 对 Y 有显著的影响。
（8）做相关系数 R 的显著性检验
R R2 SSR 0.817 0.904 SST
4
100
20
6
（-14）2 （-4）2
2 10
1
100
10
13
（-7）2
（3）2
3 20
0
0
4 20
1
0
5 40
4
400
0
20
0
0
0
27
72
72
40
34
142
（-6）2
和 15 100 和 Lxx=10 Lyy=600
和 Lxy=70
和 100 SSR=490
SSE=110
均 3 均 20
均 20
ˆ1
var( yi ) var(ˆ0 ˆ1xi ) 2 cov( yi , y ˆ1(xi x ))
2 2[ 1 (xi x )2 ] 2 2[ 1 (xi x )2 ]
n
Lxx
n
Lxx
[1 1 (xi x )2 ] 2
n
Lxx
word 文档可自由复制编辑
Cov( yi , y ˆ1 ( xi x)) Cov( yi , y) Cov( yi , ˆ1 ( xi x))
word 文档可自由复制编辑
同时发现使得 Ln（L）最大就是使得下式最小，
n
n
Q (Yi Yˆi )2 (Yi (ˆ0 ˆ1 X i )) 2

应用回归分析课后习题参考答案_全部版__何晓群_刘文卿

第一章回归分析概述1.2 回归分析与相关分析的联系与区别是什么？答：联系有回归分析和相关分析都是研究变量间关系的统计学课题。

区别有 a.在回归分析中，变量y称为因变量，处在被解释的特殊地位。

在相关分析中，变量x和变量y处于平等的地位，即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。

b.相关分析中所涉及的变量y与变量x全是随机变量。

而在回归分析中，因变量y是随机变量，自变量x可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而回归分析不仅可以揭示变量x对变量y的影响大小，还可以由回归方程进行预测和控制。

1.3回归模型中随机误差项ε的意义是什么？答：ε为随机误差项，正是由于随机误差项的引入，才将变量间的关系描述为一个随机方程，使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系，由于客观经济现象是错综复杂的，一种经济现象很难用有限个因素来准确说明，随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么？答：线性回归模型的基本假设有：1.解释变量x1.x2….xp是非随机的，观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)=｛σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数，即n>p.第二章一元线性回归分析思考与练习参考答案2.1一元线性回归有哪些基本假定?答：假设1、解释变量X是确定性变量，Y是随机变量；假设2、随机误差项ε具有零均值、同方差和不序列相关性：E(εi)=0 i=1,2, …,nVar (εi)=σ2i=1,2, …,nCov(εi,εj)=0 i≠j i,j= 1,2, …,n假设3、随机误差项ε与解释变量X之间不相关：Cov(X i, εi)=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0, σ2) i=1,2, …,n2.3 证明（2.27式），∑e i =0 ，∑e i X i =0 。

应用回归分析第三版·何晓群-第三章所有习题答案

应用回归分析第三章习题 3.1y x =β基本假定：（1）诸1234n x ,x x ,x x ……非随机变量，rank （x ）=p+1，X 为满秩矩阵（2）误差项()()200i i j E ,i j cov ,,i j⎧ε=⎪⎧δ=⎨εε=⎨⎪≠⎩⎩（3）()20i i j ~N ,,⎧εδ⎪⎨εε⎪⎩诸相互独立3.2()10111ˆX X X X |rank(X X )p rank(X )p n p -'β'≠'=+≥+≥+存在，必须使存在。

即|则必有故3.3()()()()()22111221222211111111n nn i i ii i i i nii i ni i E e D e h n h n p ˆE E e n p n p n p =====⎛⎫==-δ ⎪⎝⎭⎛⎫=-δ=--δ ⎪⎝⎭⎛⎫∴δ==--δ=δ ⎪----⎝⎭∑∑∑∑∑3.4并不能这样武断地下结论。

2R 与回归方程中的自变量数目以及样本量n 有关，当样本量n 与自变量个数接近时，2R 易接近1，其中隐含着一些虚假成分。

因此，并不能仅凭很大的2R 就模型的优劣程度。

3.5首先，对回归方程的显著性进行整体上的检验——F 检验001230p H :β=β=β=β==β=……接受原假设：在显著水平α下，表示随机变量y 与诸x 之间的关系由线性模型表示不合适拒绝原假设：认为在显著性水平α下，y 与诸x 之间有显著的线性关系第二，对单个自变量的回归系数进行显著性检验。

00i H :β=接受原假设：认为i β=0，自变量i x 对y 的线性效果并不显著3.6原始数据由于自变量的单位往往不同，会给分析带来一定的困难；又由于设计的数据量较大，可能会以为舍入误差而使得计算结果并不理想。

中心化和标准化回归系数有利于消除由于量纲不同、数量级不同带来的影响，避免不必要的误差。

3.71122011122201122ppp p p p p ˆˆˆˆˆy x x x ˆˆˆˆˆˆy y (x x )(x x )(x x )ˆˆˆˆy x x )x x )x x )y =β+β+β++β-=β+β-+β-++β--ββ=-+-++-=对最小二乘法求得一般回归方程：……对方程进行如下运算：…………*jjˆ+β=……即3.812132123313221231221233131231123233213231313*********111r r r r r r r r rr r r r r r r r r r r r ⎛⎫ ⎪= ⎪ ⎪⎝⎭∆==-∆==-∆==-即证3.9()()()()()1211121121211111j jj j j p j j j p yj j j p SSR /SSE F SSE /n p SSE /n p SSE x ,x ,,x ,x x SSE x ,x ,,x ,x ,x x r SSE x ,x ,,x ,x x -+-+-+∆∆==-----=……,?………,?…而……,?…由上两式可知，其考虑的都是通过j SSE ∆在总体中所占比例来衡量第j 个因素的重要程度，因而j F 与2yj r 是等价的。

应用回归分析,第3章课后习题参考答案

第3章多元线性回归思考与练习参考答案3.2 讨论样本容量n 与自变量个数p 的关系，它们对模型的参数估计有何影响？答：在多元线性回归模型中，样本容量n 与自变量个数p 的关系是：n>>p 。

如果n<=p 对模型的参数估计会带来很严重的影响。

因为： 1. 在多元线性回归模型中，有p+1个待估参数β，所以样本容量的个数应该大于解释变量的个数，否则参数无法估计。

2. 解释变量X 是确定性变量，要求()1rank p n =+<X ，表明设计矩阵X 中的自变量列之间不相关，即矩阵X 是一个满秩矩阵。

若()1rank p <+X ，则解释变量之间线性相关，1()X X -'是奇异阵，则β的估计不稳定。

3.3证明随机误差项ε的方差σ2的无偏估计。

证明:22122222111112221111ˆ(),111()()(1)(1)()(1)1ˆ()()1n i i n n nnnii ii iiii i i i i i ni i SSE e e e n p n p n p E e D e h h n h n p E E e n p σσσσσσσ======='===------∴==-=-=-=--∴==--∑∑∑∑∑∑∑3.4 一个回归方程的复相关系数R=0.99，样本决定系数R 2=0.9801，我们能判断这个回归方程就很理想吗？答：不能断定这个回归方程理想。

因为：1. 在样本容量较少，变量个数较大时，决定系数的值容易接近1，而此时可能F 检验或者关于回归系数的t 检验，所建立的回归方()1ˆ2--=p n SSE σ程都没能通过。

2. 样本决定系数和复相关系数接近于1只能说明Y 与自变量X1,X2,…,Xp 整体上的线性关系成立，而不能判断回归方程和每个自变量是显著的，还需进行F 检验和t 检验。

3. 在应用过程中发现，在样本容量一定的情况下，如果在模型中增加解释变量必定使得自由度减少，使得 R 2往往增大，因此增加解释变量（尤其是不显著的解释变量）个数引起的R 2的增大与拟合好坏无关。

第三章(多元线性回归模型)3-3答案(可编辑修改word版)

ESS kRSS (n - k -1) n3.3 多元线性回归模型的检验一、判断题1、在线性回归模型中，为解释变量或者被解释变量重新选取单位（比如，元变换成千元），会影响 t 统计量和 R 2 的数值。

（ F ）2、在多元线性回归中，t 检验和 F 检验缺一不可。

（ T） 3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零。

（ F ）4、多元线性回归中，可决系数 R 2 是评价模型拟合优度好坏的最佳标准。

（F ）二、单项选择1、在模型Y t = 0 + 1 X 1t + 2 X 2t + 3 X 3t + t 的回归分析结果中，有 F = 462.58 ，F 的p 值= 0.000000 ，则表明（C ）A 、解释变量 X 2t 对Y t 的影响不显著B 、解释变量 X 1t 对Y t 的影响显著C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量 X 2t 和 X 1t 对Y t 的影响显著2、设k 为回归模型中的实解释变量的个数， n 为样本容量。

则对回归模型进行总体显著性检验( F 检验)时构造的 F 统计量为（A ）A 、 F =B 、 F =C 、 F =ESS RSSD 、 F = 1-RSS TSS3、在多元回归中，调整后的可决系数 R 2与可决系数 R 2 的关系为（ A ）A 、 R 2 < R 2 C 、 R 2= R 2B 、 R 2 > R 2D 、 R 2 与 R 2 的关系不能确定4、根据调整的可决系数 R 2 与 F 统计量的关系可知，当 R 2 = 1 时，有（C ） A 、F=0B 、F=－1C 、F→+∞D 、F=-∞5、下面哪一表述是正确的（D ）1 nA 、线性回归模型Y i = 0 + 1 X i + i 的零均值假设是指∑i= 0i =1ESS (k -1)RSS (n - k )0 1 1i 2 2ik ki i B 、对模型Y i = 0 + 1 X 1i + 2 X 2i + i 进行方程显著性检验（即 F 检验），检验的零假设是 H 0 : 0 = 1 = 2 = 0C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时，说明被解释变量与解释变量之间为函数关系5、对于Y i = ˆ +ˆ X +ˆ X+… +ˆ X + e ，如果原模型满足线性模型的基本假设则在零假设 j = 0 下，统计量 ˆj （B ） s (ˆj ) （其中 s (ˆj ) 是 j 的标准误差）服从A 、t (n - k )B 、t (n - k -1)C 、 F (k -1, n - k )D 、 F (k , n - k -1)6、在由 n = 30 的一组样本估计的、包含 3 个解释变量的线性回归模型中，计算得多重可决系数为 0.8500，则调整后的多重可决系数为（ D ）A 、8603B 、 0.8389C 、0.8655D 、0.8327 7、可决系数 R 2=0.8，说明回归直线能解释被解释变量总变差的：（ A ）A 、 80%B 、 64%C 、 20%D 、 89%8、线性回归模型 y t= b 0 + b 1 x 1t + b 2 x 2t + ...... + b k x kt + u tH 0 : b t = 0(i = 0,1, 2,...k ) 时，所用的统计量服从(C )中，检验A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)三、多项选择题1、对模型满足所有假定条件的模型Y i = 0 + 1 X 1i + 2 X 2i + i 进行总体显著性检验，如果检验结果总体线性关系显著，则很可能出现（ BCD ）A 、1 = 2 = 0 C 、1 ≠ 0,2 ≠ 0 E 、1= 0,2 = 0B 、1 ≠ 0,2 = 0 D 、1= 0,2 ≠ 02、设 k 为回归模型中的参数个数（包含截距项）则总体线性回归模型进行显著性检验时所用的 F 统计量可以表示为（ BC ）∑(Y ˆ - Y )2/(n - k )∑(Y ˆ - Y )2/(k - 1)A 、 ii 2 ( ) B 、 ii 2 ( ) ∑e i / k- 1 ∑e i/ n- k R 2 /(k - 1)C 、(1 - R 2 )/(n - k )(1 - R 2 )/(n - k )D 、R 2/(k - 1)R2/(n -k )E、(1 -R2)/(k -1)3、在多元回归分析中，调整的可决系数R2与可决系数R2之间（AD ）A、R2<R2B、R2≥R2C、R2只可能大于零D、R2可能为负值E、R2不可能为负值四、简答题1.在多元线性回归分析中，为什么用修正的可决系数衡量估计模型对样本观测值的拟合优度？答：因为人们发现随着模型中解释变量的增多，多重可决系数R2的值往往会变大，从而增加了模型的解释功能。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第3章多元线性回归
思考与练习参考答案
3.1 见教材P64-65
3.2 讨论样本容量n 与自变量个数p 的关系，它们对模型的参数估计有何影响？
答：在多元线性回归模型中，样本容量n 与自变量个数p 的关系是：n>>p 。

如果n<=p 对模型的参数估计会带来很严重的影响。

因为： 1. 在多元线性回归模型中，有p+1个待估参数β，所以样本容量的个数应该大于解释变量的个数，否则参数无法估计。

2. 解释变量X 是确定性变量，要求()1rank p n =+<X ，表明设计矩阵X 中的自变量列之间不相关，即矩阵X 是一个满秩矩阵。

若
()1rank p <+X ，则解释变量之间线性相关，1()X X -'是奇异阵，则β
的估计不稳定。

3.3证明随机误差项ε的方差s 2的无偏估计。

证明:
2
21
2
2
2
2
21
1
1
1
1
2
22
1
111
ˆ(),111()()(1)(1)()(1)1
ˆ()()1n
i i n n n
n
n
i
i ii ii
ii i i i i i n
i i SSE e e e n p n p n p E e D e h h n h n p E E e n p σσσ
σ
σσσ======='===------∴==-=-=-=--∴==--∑∑∑∑∑∑∑Q
3.4 一个回归方程的复相关系数R=0.99，样本决定系数R 2
=0.9801，我们能断定这个回归方程就很理想吗？
答：不能。

复相关系数R 与样本决定系R 2
数都是用来表示回归方程对原始数据拟合程度的好坏。

样本决定系数取值在【0,1】区间内，一
()1ˆ2--=p n SSE σ
般来说，R2越接近1，即R2取值越大，说明回归拟合的效果越好。

但由于R2的大小与样本容量n和自变量个数p有关，当n与p的值接近时，R2容易接近1，说明R2中隐含着一些虚假成分。

而当样本容量n较小，自变量个数p较大时，尽管R2很大，但参数估计效果很不稳定。

所以该题中不能仅仅因为R2很大而断定回归方程很理想。

3.5 如何正确理解回归方程显著性检验拒绝H0，接受H0？
答：一般来说，当接受假设H0时，认为在给定的显著性水平α之下，自变量x1,x2,…,x p对因变量y无显著性影响，则通过x1,x2,…,x p去推断y就无多大意义。

此时，一方面可能该问题本应该用非线性模型描述，我们误用线性模型描述了，使得自变量对因变量无显著影响；另一方面可能是在考虑自变量时，由于认识上的局限性把一些影响因变量y的自变量漏掉了，这就从两个方面提醒我们去重新考虑建模问题。

当拒绝H0时，也不能过于相信该检验，认为该模型已经很完美。

其实当拒绝H时，我们只能认为该回归模型在一定程度上说明了自变
量x1,x2,…,x p与因变量y的线性关系。

因为这时仍不能排除我们漏掉了一些重要自变量。

此检验只能用于辅助性的，事后验证性的目的。

（详细内容可参考课本P95～P96评注。

）
3.6 数据中心化和标准化在回归分析中的意义是什么？
答：原始数据由于自变量的单位往往不同，会给分析带来一定的困难；又由于设计的数据量较大，可能会以为舍入误差而使得计算结果并不理想。

中心化和标准化回归系数有利于消除由于量纲不同、数量级不
同带来的影响，避免不必要的误差。

3.7
验证ˆˆ,1,2,,j
j
j p ββ*==L 证明：多元线性回归方程模型的一般形式为：
01122p p y x x x ββββε
=+++++L
其经验回归方程式为
01122ˆˆˆˆˆp p
y x x x ββββ=++++L ，
又01122ˆˆˆˆp p
y x x x ββββ=----L ，故111222ˆˆˆˆ()()()p p p
y y x x x x x x βββ=+-+-++-L ，中心化后，则有111222ˆˆˆˆ()()()i p p p
y y x x x x x x βββ-=-+-++-L ，
=
令21
(),1,2,,n
jj ij j i L x x i n ==-=∑L ，1,2,,j p =L
12()ˆˆˆp x x y x x βββ-=++L
样本数据标准化的公式为
1,2,,ij i x x y x y i n **-=
=
=L ，1,2,,j p =L
则上式可以记为
1
1
2
2
1122ˆˆˆˆˆˆi i i p
ip
i i p ip
y x x x x x x ββββββ*
*
*
*******=+++=⨯+⨯++⨯L L
则有
ˆ
ˆ,
1,2,,jj j
j
yy
L j p L ββ*==L 3.8 验证
3.9 验证决定系数R 2与F 值之间的关系式：p
p n F F
R /)1(2--+=
3.10 验证决定系数R 2与F 值之间的关系式：p
p n F F
R /)1(2--+=
证明：
2/,
/(1)1
1
1(1)/1
SSR p
F SSE n p F SSE
SSR p
n p F SSE
p
SSR SSR F p F n p R F SSE SST SSR SSE F p n p F n p p
p SSE n p =
--⋅∴=⨯--⋅⨯⨯--∴=====
⋅+⨯+--+--⨯+--Q。