应用回归分析课后答案

合集下载

最新应用回归分析-第6章课后习题参考答案

最新应用回归分析-第6章课后习题参考答案

第6章多重共线性的情形及其处理思考与练习参考答案6.1 试举一个产生多重共线性的经济实例。

答:例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。

由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。

再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。

6.2多重共线性对回归参数的估计有何影响?答:1、完全共线性下参数估计量不存在;2、近似共线性下OLS估计量非有效;3、参数估计量经济含义不合理;4、变量的显著性检验失去意义;5、模型的预测功能失效。

6.3 具有严重多重共线性的回归方程能不能用来做经济预测?答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。

但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。

6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。

当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。

6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?答:请参考第三次上机实验题——机场吞吐量的多元线性回归模型,注意利用二手数据很难避免多重共线性的出现,所以一般利用逐步回归和主成分回归消除多重共线性。

如果进行自己进行试验设计如正交试验设计,并收集数据,选择向量使设计矩阵X 的列向量(即X 1,X 2, X p )不相关。

6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。

《应用回归分析》课后习题部分答案-何晓群版

《应用回归分析》课后习题部分答案-何晓群版

第二章 一元线性回归2.14 解答:(1)散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=6.1σ∧=(5)由于211(,)xxN L σββ∧t σ∧==服从自由度为n-2的t 分布。

因而/2||(2)1P t n αασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(p t t ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为(7-2.3537+2.353 即为:(2.49,11.5)2201()(,())xxx Nn L ββσ-∧+t ∧∧==服从自由度为n-2的t 分布。

因而/2|(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1p βσββσα∧∧∧∧-<<+=- 可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x 与y 的决定系数22121()490/6000.817()ni i nii y y r y y ∧-=-=-==≈-∑∑(7)由于(1,3)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。

(8)t σ∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 7 3.661==≈/2 2.353t α= /23.66t t α=>∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。

应用回归分析,第4章课后习题参考答案

应用回归分析,第4章课后习题参考答案

第4章违背基本假设的情况思考与练习参考答案4.1 试举例说明产生异方差的原因。

答:例4.1:截面资料下研究居民家庭的储蓄行为Y i=β0+β1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。

由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。

例4.2:以某一行业的企业为样本建立企业生产函数模型Y i=A iβ1K iβ2L iβ3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。

由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。

这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。

4.2 异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。

4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。

答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。

其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。

在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。

然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。

由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。

所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。

《应用回归分析》课后题标准答案

《应用回归分析》课后题标准答案

3
(5)由于 1
N
(1,
2 Lxx
)
t
1 1 2 / Lxx
(1
)
Lxx
服从自由度为 n-2 的 t 分布。因而
P
|
(
1
)
Lxx
|
t
/
2
(n
2)
1
也即: p(1 t /2
Lxx
1 1 t /2
) =1 Lxx
可得
ቤተ መጻሕፍቲ ባይዱ
1
的置信度为95%的置信区间为(7-2.353
1 3
33,7+2.353 1 3
1
第二章 一元线性回归
2.14 解答:(1)散点图为:
(2)x 与 y 之间大致呈线性关系。
(3)设回归方程为 y 0 1 x
n
xi yi n x y
1=
i 1 n
7
xi2 n(x)2
i 1
0 y 1 x 20 7 3 1
可得回归方程为 y 1 7x
2
(4)
1 n-2
1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题? 答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判 断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。应注意 的问题有:在选择变量时要注意与一些专门领域的专家合作,不要认为一个回归 模型所涉及的变量越多越好,回归变量的确定工作并不能一次完成,需要反复试 算,最终找出最合适的一些变量。
t /2
0
0
1 n
( x)2 Lxx
t
/
2
)
1
可得 1的置信度为95%的置信区间为( 7.77,5.77)

应用回归分析-第9章课后习题答案

应用回归分析-第9章课后习题答案

应⽤回归分析-第9章课后习题答案第9章含定性变量的回归模型思考与练习参考答案9.1 ⼀个学⽣使⽤含有季节定性⾃变量的回归模型,对春夏秋冬四个季节引⼊4个0-1型⾃变量,⽤SPSS 软件计算的结果中总是⾃动删除了其中的⼀个⾃变量,他为此感到困惑不解。

出现这种情况的原因是什么?答:假如这个含有季节定性⾃变量的回归模型为:tt t t kt k t t D D D X X Y µαααβββ++++++=332211110其中含有k 个定量变量,记为x i 。

对春夏秋冬四个季节引⼊4个0-1型⾃变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到⼀次观测值,则样本设计矩阵为:=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然,(X,D)中的第1列可表⽰成后4列的线性组合,从⽽(X,D)不满秩,参数⽆法唯⼀求出。

这就是所谓的“虚拟变量陷井”,应避免。

当某⾃变量x j 对其余p-1个⾃变量的复判定系数2j R 超过⼀定界限时,SPSS 软件将拒绝这个⾃变量x j 进⼊回归模型。

称Tol j =1-2j R 为⾃变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0.0001。

也就是说,当2j R >0.9999时,⾃变量x j 将被⾃动拒绝在回归⽅程之外,除⾮我们修改容忍度的默认值。

=k βββ 10β=4321ααααα⽽在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是⾃动删除了其中的⼀个定性⾃变量。

9.2对⾃变量中含有定性变量的问题,为什么不对同⼀属性分别建⽴回归模型,⽽采取设虚拟变量的⽅法建⽴回归模型?答:原因有两个,以例9.1说明。

⼀是因为模型假设对每类家庭具有相同的斜率和误差⽅差,把两类家庭放在⼀起可以对公共斜率做出最佳估计;⼆是对于其他统计推断,⽤⼀个带有虚拟变量的回归模型来进⾏也会更加准确,这是均⽅误差的⾃由度更9.3 研究者想研究采取某项保险⾰新措施的速度y对保险公司的规模x1和保险公司类型的关系(参见参考⽂献【3】)。

应用回归分析,第3章课后习题参考答案

应用回归分析,第3章课后习题参考答案

第3章 多元线性回归思考与练习参考答案3.2 讨论样本容量n 与自变量个数p 的关系,它们对模型的参数估计有何影响?答:在多元线性回归模型中,样本容量n 与自变量个数p 的关系是:n>>p 。

如果n<=p 对模型的参数估计会带来很严重的影响。

因为: 1. 在多元线性回归模型中,有p+1个待估参数β,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。

2. 解释变量X 是确定性变量,要求()1rank p n =+<X ,表明设计矩阵X 中的自变量列之间不相关,即矩阵X 是一个满秩矩阵。

若()1rank p <+X ,则解释变量之间线性相关,1()X X -'是奇异阵,则β的估计不稳定。

3.3证明随机误差项ε的方差σ2的无偏估计。

证明:22122222111112221111ˆ(),111()()(1)(1)()(1)1ˆ()()1n i i n n nnnii ii iiii i i i i i ni i SSE e e e n p n p n p E e D e h h n h n p E E e n p σσσσσσσ======='===------∴==-=-=-=--∴==--∑∑∑∑∑∑∑3.4 一个回归方程的复相关系数R=0.99,样本决定系数R 2=0.9801,我们能判断这个回归方程就很理想吗? 答:不能断定这个回归方程理想。

因为:1. 在样本容量较少,变量个数较大时,决定系数的值容易接近1,而此时可能F 检验或者关于回归系数的t 检验,所建立的回归方()1ˆ2--=p n SSE σ程都没能通过。

2. 样本决定系数和复相关系数接近于1只能说明Y 与自变量X1,X2,…,Xp 整体上的线性关系成立,而不能判断回归方程和每个自变量是显著的,还需进行F 检验和t 检验。

3. 在应用过程中发现,在样本容量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得 R 2往往增大,因此增加解释变量(尤其是不显著的解释变量)个数引起的R 2的增大与拟合好坏无关。

应用回归分析第5章课后习题答案

第5章自变量选择与逐步回归思考与练习参考答案5.1 自变量选择对回归参数的估计有何影响?答:回归自变量的选择是建立回归模型得一个极为重要的问题。

如果模型中丢掉了重要的自变量, 出现模型的设定偏误,这样模型容易出现异方差或自相关性,影响回归的效果;如果模型中增加了不必要的自变量, 或者数据质量很差的自变量, 不仅使得建模计算量增大, 自变量之间信息有重叠,而且得到的模型稳定性较差,影响回归模型的应用。

5.2自变量选择对回归预测有何影响?答:当全模型(m元)正确采用选模型(p元)时,我们舍弃了m-p个自变量,回归系数的最小二乘估计是全模型相应参数的有偏估计,使得用选模型的预测是有偏的,但由于选模型的参数估计、预测残差和预测均方误差具有较小的方差,所以全模型正确而误用选模型有利有弊。

当选模型(p元)正确采用全模型(m 元)时,全模型回归系数的最小二乘估计是相应参数的有偏估计,使得用模型的预测是有偏的,并且全模型的参数估计、预测残差和预测均方误差的方差都比选模型的大,所以回归自变量的选择应少而精。

5.3 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣?C统计量达到最小的准则来衡量回答:如果所建模型主要用于预测,则应使用p归方程的优劣。

5.4 试述前进法的思想方法。

答:前进法的基本思想方法是:首先因变量Y对全部的自变量x1,x2,...,xm建立m个一元线性回归方程, 并计算F检验值,选择偏回归平方和显著的变量(F值最大且大于临界值)进入回归方程。

每一步只引入一个变量,同时建立m-1个二元线性回归方程,计算它们的F检验值,选择偏回归平方和显著的两变量变量(F值最大且大于临界值)进入回归方程。

在确定引入的两个自变量以后,再引入一个变量,建立m-2个三元线性回归方程,计算它们的F检验值,选择偏回归平方和显著的三个变量(F值最大)进入回归方程。

不断重复这一过程,直到无法再引入新的自变量时,即所有未被引入的自变量的F检验值均小于F检验临界值Fα(1,n-p-1),回归过程结束。

应用回归分析-第8章课后习题参考答案

|第8章 非线性回归思考与练习参考答案在非线性回归线性化时,对因变量作变换应注意什么问题答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。

如:(1)乘性误差项,模型形式为e y AK L αβε=, (2)加性误差项,模型形式为y AK L αβε=+。

对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。

一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。

"为了研究生产率与废料率之间的关系,记录了如表所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。

表生产率x (单位/周) 1000 2000 3000 3500 4000·45005000废品率y (%),解:先画出散点图如下图:从散点图大致可以判断出x和y之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。

(1)二次曲线SPSS输出结果如下:]从上表可以得到回归方程为:72ˆ 5.8430.0874.4710yx x -=-+⨯ 由x 的系数检验P 值大于,得到x 的系数未通过显著性检验。

由x 2的系数检验P 值小于,得到x 2的系数通过了显著性检验。

(2)指数曲线—从上表可以得到回归方程为:0.0002t ˆ 4.003ye = 由参数检验P 值≈0<,得到回归方程的参数都非常显著。

从R2值,σ的估计值和模型检验统计量F值、t值及拟合图综合考虑,指数拟合效果更好一些。

已知变量x与y的样本数据如表,画出散点图,试用αeβ/x来拟合回归模型,假设:(1)乘性误差项,模型形式为y=αeβ/x eε(2)加性误差项,模型形式为y=αeβ/x+ε。

"表y序号x y序号x y序号`x16^1127《1238< 134、1495? 1015解:散点图:;Array(1)乘性误差项,模型形式为y=αeβ/x eε线性化:lny=lnα+β/x +ε令y1=lny, a=lnα,x1=1/x .做y1与x1的线性回归,SPSS输出结果如下:从以上结果可以得到回归方程为:y1=+F 检验和t 检验的P 值≈0<,得到回归方程及其参数都非常显著。

应用回归分析,第5章课后习题参考答案

第5章自变量选择与逐步回归思考与练习参考答案自变量选择对回归参数的估计有何影响答:回归自变量的选择是建立回归模型得一个极为重要的问题。

如果模型中丢掉了重要的自变量, 出现模型的设定偏误,这样模型容易出现异方差或自相关性,影响回归的效果;如果模型中增加了不必要的自变量, 或者数据质量很差的自变量, 不仅使得建模计算量增大, 自变量之间信息有重叠,而且得到的模型稳定性较差,影响回归模型的应用。

自变量选择对回归预测有何影响答:当全模型(m元)正确采用选模型(p元)时,我们舍弃了m-p个自变量,回归系数的最小二乘估计是全模型相应参数的有偏估计,使得用选模型的预测是有偏的,但由于选模型的参数估计、预测残差和预测均方误差具有较小的方差,所以全模型正确而误用选模型有利有弊。

当选模型(p元)正确采用全模型(m 元)时,全模型回归系数的最小二乘估计是相应参数的有偏估计,使得用模型的预测是有偏的,并且全模型的参数估计、预测残差和预测均方误差的方差都比选模型的大,所以回归自变量的选择应少而精。

如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣C统计量达到最小的准则来衡量回答:如果所建模型主要用于预测,则应使用p归方程的优劣。

试述前进法的思想方法。

答:前进法的基本思想方法是:首先因变量Y对全部的自变量x1,x2,...,xm建立m 个一元线性回归方程, 并计算F检验值,选择偏回归平方和显着的变量(F值最大且大于临界值)进入回归方程。

每一步只引入一个变量,同时建立m-1个二元线性回归方程,计算它们的F检验值,选择偏回归平方和显着的两变量变量(F 值最大且大于临界值)进入回归方程。

在确定引入的两个自变量以后,再引入一个变量,建立m-2个三元线性回归方程,计算它们的F检验值,选择偏回归平方和显着的三个变量(F值最大)进入回归方程。

不断重复这一过程,直到无法再引入新的自变量时,即所有未被引入的自变量的F检验值均小于F检验临界值Fα(1,n-p-1),回归过程结束。

应用回归分析_第2章课后习题参考答案.

应用回归分析_第2章课后习题参考答案1. 简答题1.1 什么是回归分析?回归分析是一种统计建模方法,用于研究自变量与因变量之间的关系。

它通过建立数学模型,根据已知的自变量和因变量数据,预测因变量与自变量之间的关系,并进行相关的推断和预测。

1.2 什么是简单线性回归和多元线性回归?简单线性回归是指只包含一个自变量和一个因变量的回归模型,通过拟合一条直线来描述两者之间的关系。

多元线性回归是指包含多个自变量和一个因变量的回归模型,通过拟合一个超平面来描述多个自变量和因变量之间的关系。

1.3 什么是残差?残差是指回归模型中,观测值与模型预测值之间的差异。

在回归分析中,我们希望最小化残差,使得模型与观测数据的拟合效果更好。

1.4 什么是拟合优度?拟合优度是用来评估回归模型对观测数据的拟合程度的指标。

一般使用R方(Coefficient of Determination)来表示拟合优度,其值范围为0到1,值越接近1表示模型拟合效果越好。

2. 计算题2.1 简单线性回归假设我们有一组数据,其中X为自变量,Y为因变量,如下所示:X Y13253749511我们想要建立一个简单线性回归模型,计算X与Y之间的线性关系。

首先,我们需要计算拟合直线的斜率和截距。

根据简单线性回归模型的公式Y = β0 + β1*X,我们可以通过最小二乘法计算出斜率和截距的估计值。

首先,计算X和Y的均值:mean_x = (1 + 2 + 3 + 4 + 5) / 5 = 3mean_y = (3 + 5 + 7 + 9 + 11) / 5 = 7然后,计算X和Y的方差:var_x = ((1-3)^2 + (2-3)^2 + (3-3)^2 + (4-3)^2 + (5-3)^2) / 5 = 2var_y = ((3-7)^2 + (5-7)^2 + (7-7)^2 + (9-7)^2 + (11-7)^2) / 5 = 8接下来,计算X和Y的协方差:cov_xy = ((1-3) * (3-7) + (2-3) * (5-7) + (3-3) * (7-7) + (4-3) * (9-7) + (5-3) * (11-7)) / 5 = 4根据最小二乘法的公式:β1 = cov_xy / var_x = 4 / 2 = 2β0 = mean_y - β1 * mean_x = 7 - (2 * 3) = 1因此,拟合直线的方程为:Y = 1 + 2X。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

-应用回归分析课后答案第二章一元线性回归2.14 解答:EXCEL结果:SUMMARY OUTPUT回归统计Multiple R0.944911R Square0.892857Adjusted R Square0.857143标准误差0.597614观测值5方差分析df SS MS F Significance F回归分析18.9285718.928571250.015392残差3 1.0714290.357143总计410Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限95.0%上限95.0%Intercept-0.214290.6962-0.307790.778371-2.4299 2.001332-2.4299 2.001332 X Variable 10.1785710.03571450.0153920.0649130.292230.0649130.29223RESIDUAL OUTPUT观测值预测Y残差1 1.571429-0.571432 1.5714290.4285713 3.357143-0.357144 3.3571430.6428575 5.142857-0.14286SPSS结果:(1)散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑ =2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75))[]1169049363110/3=++++= 1330 6.13σ∧=≈(5)由于211(,)xxN L σββ∧1112()/xxxxL t L ββσσ∧∧-==服从自由度为n-2的t 分布。

因而1/2()|(2)1xx L P t n αββασ∧⎡⎤-⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(xxxxp t t L L ααβββ∧∧∧∧-<<+=1α-可得11195%333333β∧的置信度为的置信区间为(7-2.353,7+2.353)即为:(2.49,11.5)2201()(,())xxx N n L ββσ-∧+00002221()1()()xxxxt x x n L n L σσ∧∧--∧∧==++服从自由度为n-2的t 分布。

因而00/22(2)11()xx P t n x n L αασ∧-∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥+⎢⎥⎣⎦即220/200/21()1()()1xxxxx x p t t n L n L βσββσα--∧∧∧∧-+<<++=-可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x 与y 的决定系数22121()490/6000.817()nii nii y y r y y ∧-=-=-==≈-∑∑(7)ANOVAx平方和df均方 F 显著性组间(组合) 9.000 2 4.500 9.000 .100 线性项加权的 8.167 1 8.167 16.333 .056 偏差.833 1 .833 1.667.326组内 1.000 2 .500总数10.0004由于(1,3)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。

(8)112/xxxxL t L βσσ∧∧∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 710 3.661333303==≈/2 2.353t α= /23.66t t α=>∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。

(9)相关系数 1211()()()()niixy i nnxx yyi i i i x x y y L r L L x x y y --=--==--==--∑∑∑0.9041060060=≈⨯r 小于表中1%α=的相应值同时大于表中5%α=的相应值,∴x 与y 有显著的线性关系.序号 xyy ∧e1 1 10 6 42 2 10 13 -3 3 3 20 20 04 4 20 27 -7 5540346从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。

(11)当广告费0x =4.2万元时,销售收入028.4y =万元,95%置信度为的置信区间 y 2σ∧∧±近似为,即(17.1,39.7)2.15 解答:(1) 散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=1221(2637021717)0.0036(71043005806440)()ni ii nii x y n x yxn x --=-=--==--∑∑01 2.850.00367620.1068y x ββ-∧-=-=-⨯=0.10680.0036y x ∧∴=+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑2n01i=11(())n-2i y x ββ∧∧=-+∑ =0.2305σ∧=0.4801(5) 由于211(,)xxN L σββ∧1112()/xxxxL t L ββσσ∧∧-==服从自由度为n-2的t 分布。

因而1/2()|(2)1xx L P t n αββασ∧⎡⎤-⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(xxxxp t t L L ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为0.4801/12978600.4801/1297860⨯⨯(0.0036-1.860,0.0036+1.860)即为:(0.0028,0.0044)22001()(,())xxx N n L ββσ-∧+00002221()1()()xxxxt x x n L n L σσ∧∧--∧∧==++服从自由度为n-2的t 分布。

因而00/22(2)11()xx P t n x n L αασ∧-∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥+⎢⎥⎣⎦即220/200/21()1()()1xxxxx x p t t n L n L βσββσα--∧∧∧∧-+<<++=- 可得195%0.3567,0.5703β∧-的置信度为的置信区间为()(6)x 与y 的决定系数 22121()()nii nii y y r y y ∧-=-=-==-∑∑16.8202718.525=0.908(7)ANOVAx平方和 df均方 F 显著性组间(组合) 1231497.500 7 175928.214 5.302 .168 线性项加权的 1168713.036 1 1168713.036 35.222 .027 偏差62784.464 6 10464.077 .315.885组内 66362.500 2 33181.250总数1297860.0009由于(1,9)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。

(8)112/xxxxL t L βσσ∧∧∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 0.003612978608.542⨯==/2 1.895t α= /28.542t t α=>∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。

(9) 相关系数 1211()()()()niii nnxx yyi i i i x x y y L r L L x x y y --=--==--==--∑∑∑0.9489129786018.525=⨯r 小于表中1%α=的相应值同时大于表中5%α=的相应值,∴x 与y 有显著的线性关系.(10)序号 xyy ∧e1 825 3.5 3.0768 0.4232 2 215 1 0.8808 0.11923 10704 3.9588 0.0412 4 550 2 2.0868 -0.08685 480 1 1.8348 -0.83486 920 3 3.4188 -0.41887 1350 4.5 4.9688 -0.4668 8 325 1.5 1.2768 0.22329 670 3 2.5188 0.4812 10121554.48080.5192从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。

(11)001000 3.7x ∧==新保单时,需要加班的时间为y 小时。

(12)00/200y (2)1y t n h αα∧∧±-+的置信概率为1-的置信区间精确为, 即为(2.7,4.7)近似置信区间为:02y σ∧∧±,即(2.74,4.66)(13)可得置信水平为α1-的置信区间为0/200(2)y t n h α∧∧±-,即为(3.33,4.07). 2.16 (1)散点图为:可以用直线回归描述y 与x 之间的关系. (2)回归方程为:12112.629 3.314y x ∧=+ (3)从图上可看出,检验误差项服从正态分布。

第三章多元线性回归3.11 初始数据:编号y x1x2x311607035122607540 2.432106540242657442352407238 1.262206845 1.572757842481606636292757044 3.21025065423解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:相关性y x1 x2 x3 Pearson 相关性y 1.000 .556 .731 .724x1 .556 1.000 .113 .398x2 .731 .113 1.000 .547x3 .724 .398 .547 1.000y . .048 .008 .009x1 .048 . .378 .127x2 .008 .378 . .051x3 .009 .127 .051 . N y 10 10 10 10x1 10 10 10 10x2 10 10 10 10x3 10 10 10 10所以r~=系数a模型非标准化系数标准系数t Sig.B 的95.0% 置信区间相关性共线性统计量B 标准误差试用版下限上限零阶偏部分容差VIF1 (常量) -348.280 176.459 -1.974 .096 -780.0683.500x1 3.754 1.933 .385 1.942 .100 -.977 8.485 .556 .621 .350 .825 1.211(2)所以三元线性回归方程为3447.122101.71754.328.348ˆx x x y+++-= 由于决定系数R 方=0.708 R=0.898较大所以认为拟合度较高Anova b模型 平方和 df均方 F Sig. 1回归 13655.370 3 4551.790 8.283.015a残差3297.1306549.522总计 16952.500 9a. 预测变量: (常量), x3, x1, x2。

相关文档
最新文档