数据分析习题题答案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第2章 习 题

一、习题

(1)回归模型

15,2,1,22110 =+++=i x x y i i i i εβββ

调用:

由此输出得到的回归方程为:

2100920.049600.045261.3X X y ++=∧

由最后一列可以看出,使用化妆品的人数X1和月收入X2对化妆品的销售数量有着显着影响。46521.30=∧

β可以理解为该化妆品作为一种

必需品每个月的销售量。当购买该化妆品的人数固定时,月收入没增加一个一个单位,改化妆品的销售数量将增加个单位。同理,当购买该化妆品的人均月收入固定时,购买该化妆品的人数每增加一千人,该化妆品的销售数量将增加个单位。

p

n SSE

-=

∧2

σ

是2σ的无偏估计,所以2σ的估计值是. (2)调用

由此可到线性回归关系显着性检验:

0至少有一个为0:2,1:1210ββββH H ↔==

的统计量/(1)/()SSR p MSR

F SSE n p MSE

-=

=-的观测值47.56790=F ,检验的p 值

0001.0)(000<>==F F p p H

另外9989.053902

53845

2===

SST SSR R ,2R 描述了由自由变量的线性关系函数值所能反映的Y 的总变化量的比例。2R 越大,表明线性关系越明显。这些结果均表明Y 与X1,X2之间的回归关系高度显着。

(3)若置信水平05.0=α,由17881.2)12(975.0=t ,利用参数估计值得

到21,0,βββ的置信区间分别为:

对,0β2942.54516.343065.21781.245216.3±=⨯±,即)7458.8,8426.1(-) 对1β:01318.049600.000605.01781.249600.0±=⨯±,即)50198.0,48282.0( 2β:0021

.000920.00009681.01781.200920.0±=⨯±,即)00113.0,0071.0(-

(4)首先检验X1对Y 是否有显着性影:

假设其约简模型为:15,2,

1,220 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得:

88137.484)(=R SSE 13215=-=R f 88357.56)(=F SSE 12315=-=R f

由[()()]()

()/R F F

SSE R SSE F f f F SSE F f --=

求得检验统计量的值为:

3

.9012/88357.5688357

.5688137.4840=-=

F

05.0))13,1(()(0000<>==>==F F P F F p p H

由此拒绝原假设,所以x2对Y 有显着影响。 同理检验X2对Y 是否有显着性影:

假设其约简模型为:15,2,

1,110 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得: 31872)(=R SSE 13215=-=R f

88357.56)(=F SSE 12315=-=R f

由[()()]()

()/R F F

SSE R SSE F f f F SSE F f --=

求得检验统计量的值为:

12/88357.5688357.56318720-=

F 05.0))13,1(()(0000<>==>==F F P F F p p H

由此拒绝原假设,所以x2对Y 有显着影响。 检验X1、x2交叉项对Y 是否有显着性影:

假设其全模型为:15,2,

1,21322110 =++++=i x x x x y i i i i i i εββββ 检验X1、X2的交互作用是否显着即检验假设0:30=βH 是否能被拒

绝。

由观测数据并利用proc reg 过程拟合此模型求得: 72.56)(=F SSE 11415=-=F f

88357.56)(=R SSE 12315=-=R f

由[()()]()

()/R F F

SSE R SSE F f f F SSE F f --=

求得检验统计量的值为:

0317.011

/72.5672

.5688357.560=-=

F

05.0138.0)0317.0)11,1(()(000>=>==>==F P F F p p H

由此接受原假设,也即X1*X2对Y 无显着影响,即模型中没有必要引进交叉项。

(5)关于Y 的预测:

对于给定的X1,X2的值(220,2500),由回归方程可以得到0y 的预测值:

573.135250000920.022049600.045261.30=⨯+⨯+=y

为了得到0y

1)(-X X T

由0(1,220,2500)T x =, 4.74030MSE =,求得

y 的置信度为95%的置信区间

为:

0.975(12)135.5726 2.1788 2.2818135.5726 4.9716y t ±=±⨯=±

即(130.6010,140.5442)

(6)利用proc reg 过程可根据要求输出学生化残差:

利用学生化残差,检验模型误差项的正态性假定的合理性: ○

1频率检验法: 学生化残差中有10/15=(约)落在(-1,1)内;有13/15=(约)落在(,)内;有15/15=1(约)落在(-2,2)内。由此可见,学生化残差在上述各区间内的频率与N (0,1)分布的相应概率相差均不大,因此模型误差项的正态性假定是合理的。 ②正态QQ 图 利用proc capability 直接作出学生化残差的正态QQ 图,如下所示:

从图像可以看出,散点明显分布在一条直线上,则进一步说明学生化残差来自正态总体分布。 通过sas 计算得到),(q r

相关文档
最新文档