应用回归分析-第9章课后习题答案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用回归分析-第9章课后习题答案

第9章 含定性变量的回归模型

思考与练习参考答案

9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。出现这种情况的原因是什么?

答:假如这个含有季节定性自变量的回归模型为:

t t t t kt k t t D D D X X Y μαααβββ++++++=332211110Λ

其中含有k 个定量变量,记为x i 。对春夏秋冬四个季节引入4个0-1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:

⎪⎪⎪⎪⎪

⎪⎪

⎭⎫

⎛=00011001011000101001

0010100011

)(6

16515414313212111k k k k k k X X X X X X X X X X X X Λ

ΛΛΛΛΛD X,

显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。

当某自变量x j 对其余p-1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型。称Tol j =1-2

j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0.0001。也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。

⎪⎪⎪

⎪⎪⎭

⎝⎛=k βββM 10β⎪⎪⎪

⎪⎪⎭

⎫ ⎝⎛=4321ααααα

而在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。

9.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?

答:原因有两个,以例9.1说明。一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。

9.3 研究者想研究采取某项保险革新措施的速度y对保险公司的规模x1和保险公司类型的关系(参见参考文献【3】)。因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。第一个自变量公司的规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司是定性变量,由两种类型构成,即股份公司和互助公司。数据资料见表9.8,试建立y对公司规模和公司类型的回归。

表9.8

i y x1公司类型

1 17 151 互助

2 26 92 互助

3 21 175 互助

4 30 31 互助

5 22 104 互助

6 0 27

7 互助

7 12 210 互助

8 19 120 互助

9 4 290 互助

10 16 238 互助

11 28 164 股份

12 15 272 股份

13 11 295 股份

14 38 68 股份

15 31 85 股份

16 21 224 股份

17 20 166 股份

18 13 305 股份

19 30 124 股份

20 14 246 股份

解:对定型变量“公司类型”进行数量化处理:

引入虚拟变量x2:公司类型为“互助”时,x2=1,为“股份”时, x2=0。

则表9.5中数据转换成以下数据:

i y x1公司类型

1 17 151 1

2 26 92 1

3 21 175 1

4 30 31 1

5 22 104 1

6 0 27

7 1

7 12 210 1

8 19 120 1

9 4 290 1

10 16 238 1

11 28 164 0

12 15 272 0

13 11 295 0

14 38 68 0

15 31 85 0

16 21 224 0

17 20 166 0

18 13 305 0

19 30 124 0

20 14 246 0

建立回归方程 y =b 0+b 1x 1+b 2x 2+ε

用SPSS 软件作线性回归,得到输出结果如下:

Mode l Sum mary

.946a

.895

.883

3.221

Model 1

R

R Square

Adjusted R Square

Std. E rror of the E stim ate

P redictors: (Constant), 公司类型, x1

a. R 检验:拟合优度R 2=0.883,接近1,说明回归拟合的效果较好。

ANOVA

b

1504.4132752.20772.497.000a

176.3871710.376

1680.800

19

Regression Residual Total

Model 1

Sum of Squares df

Mean Square

F Sig.P redictors: (Constant), 公司类型, x1a. Dependent Variable: y

b.

F 检验:F 值=72.497,Sig.值为0,说明回归方程通过F 检验。

Coe fficie nts

a 41.930 2.01020.859.000-.102.009-.911-11.443.000-8.055 1.459

-.439

-5.521.000

(Constant)x1

公司类型

Model

1

B Std. E rror Unstandardized Coefficients Beta

Standardized

Coefficients

t

Sig.Dependent Variable: y

a.

T 检验:回归系数通过t 检验,回归方程为:

y= 41.930-0.102 x 1-8.055 x 2

说明:若引入虚拟变量x 2,当公司类型为“互助”时,x 2=0,为“股份”时, x 2=1。 则回归方程为:

y= 33.874-0.102x 1 + 8.055x 2

相关文档
最新文档