数据分析习题题答案

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第2章习题

一、习题

（1）回归模型

15,2,1,22110 =+++=i x x y i i i i εβββ

调用：

由此输出得到的回归方程为：

2100920.049600.045261.3X X y ++=∧

由最后一列可以看出，使用化妆品的人数X1和月收入X2对化妆品的销售数量有着显着影响。46521.30=∧

β可以理解为该化妆品作为一种

必需品每个月的销售量。当购买该化妆品的人数固定时，月收入没增加一个一个单位，改化妆品的销售数量将增加个单位。同理，当购买该化妆品的人均月收入固定时，购买该化妆品的人数每增加一千人，该化妆品的销售数量将增加个单位。

n SSE

∧2

是2σ的无偏估计，所以2σ的估计值是. （2）调用

由此可到线性回归关系显着性检验：

0至少有一个为0:2,1:1210ββββH H ↔==

的统计量/(1)/()SSR p MSR

F SSE n p MSE

=-的观测值47.56790=F ,检验的p 值

0001.0)(000<>==F F p p H

另外9989.053902

53845

2===

SST SSR R ，2R 描述了由自由变量的线性关系函数值所能反映的Y 的总变化量的比例。2R 越大，表明线性关系越明显。这些结果均表明Y 与X1，X2之间的回归关系高度显着。

（3）若置信水平05.0=α，由17881.2)12(975.0=t ，利用参数估计值得

到21,0,βββ的置信区间分别为：

对,0β2942.54516.343065.21781.245216.3±=⨯±，即)7458.8,8426.1(-）对1β：01318.049600.000605.01781.249600.0±=⨯±，即)50198.0,48282.0( 2β：0021

.000920.00009681.01781.200920.0±=⨯±，即)00113.0,0071.0(-

(4)首先检验X1对Y 是否有显着性影：

假设其约简模型为：15,2,

1,220 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得：

88137.484)(=R SSE 13215=-=R f 88357.56)(=F SSE 12315=-=R f

由[()()]()

()/R F F

SSE R SSE F f f F SSE F f --=

求得检验统计量的值为：

.9012/88357.5688357

.5688137.4840=-=

05.0))13,1(()(0000<>==>==F F P F F p p H

由此拒绝原假设，所以x2对Y 有显着影响。同理检验X2对Y 是否有显着性影：

假设其约简模型为：15,2,

1,110 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得： 31872)(=R SSE 13215=-=R f

88357.56)(=F SSE 12315=-=R f

由[()()]()

()/R F F

SSE R SSE F f f F SSE F f --=

求得检验统计量的值为：

12/88357.5688357.56318720-=

F 05.0))13,1(()(0000<>==>==F F P F F p p H

由此拒绝原假设，所以x2对Y 有显着影响。检验X1、x2交叉项对Y 是否有显着性影：

假设其全模型为：15,2,

1,21322110 =++++=i x x x x y i i i i i i εββββ 检验X1、X2的交互作用是否显着即检验假设0:30=βH 是否能被拒

绝。

由观测数据并利用proc reg 过程拟合此模型求得： 72.56)(=F SSE 11415=-=F f

88357.56)(=R SSE 12315=-=R f

由[()()]()

()/R F F

SSE R SSE F f f F SSE F f --=

求得检验统计量的值为：

0317.011

/72.5672

.5688357.560=-=

05.0138.0)0317.0)11,1(()(000>=>==>==F P F F p p H

由此接受原假设，也即X1*X2对Y 无显着影响，即模型中没有必要引进交叉项。

（5）关于Y 的预测：

对于给定的X1，X2的值（220,2500），由回归方程可以得到0y 的预测值：

573.135250000920.022049600.045261.30=⨯+⨯+=y

为了得到0y

1)(-X X T

由0(1,220,2500)T x =， 4.74030MSE =，求得

y 的置信度为95%的置信区间

为：

0.975(12)135.5726 2.1788 2.2818135.5726 4.9716y t ±=±⨯=±

即(130.6010,140.5442)

（6）利用proc reg 过程可根据要求输出学生化残差：

利用学生化残差，检验模型误差项的正态性假定的合理性： ○

1频率检验法：学生化残差中有10/15=（约）落在（-1,1）内；有13/15=（约）落在（,）内；有15/15=1（约）落在（-2,2）内。由此可见，学生化残差在上述各区间内的频率与N （0,1）分布的相应概率相差均不大，因此模型误差项的正态性假定是合理的。 ②正态QQ 图利用proc capability 直接作出学生化残差的正态QQ 图，如下所示：

从图像可以看出，散点明显分布在一条直线上，则进一步说明学生化残差来自正态总体分布。通过sas 计算得到),(q r