应用回归分析实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一元线性回归
一、实验题目1
一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周的时间,收集了每周加班时间的数据和签发的新保单数目,x为每周签发的新报数目,y为每周加班时间(小时),数据见下表:
二、实验内容
散点图如下所示:
[数据集1]
描述性统计量
均值标准偏差N
y 2.850 1.4347 10
x 762.00 379.746 10
相关性
y x Pearson 相关性y 1.000 .949
x .949 1.000 Sig. (单侧)y . .000
x .000 . N y 10 10
x 10 10
输入/移去的变量b
模型输入的变量移去的变量方法
1 x a. 输入
a. 已输入所有请求的变量。
b. 因变量: y
残差统计量a
极小值极大值均值标准偏差N
预测值.889 4.958 2.850 1.3614 10 标准预测值-1.440 1.548 .000 1.000 10 预测值的标准误差.154 .291 .209 .050 10 调整的预测值.834 5.223 2.857 1.3944 10 残差-.8390 .5259 .0000 .4526 10 标准残差-1.748 1.096 .000 .943 10 Student 化残差-1.908 1.272 -.006 1.051 10 已删除的残差-1.0003 .7089 -.0072 .5662 10 Student 化已删除的残差-2.419 1.332 -.058 1.170 10 Mahal。距离.028 2.398 .900 .856 10 Cook 的距离.001 .416 .129 .157 10 居中杠杆值.003 .266 .100 .095 10 a. 因变量: y
残差图分析:
1.x 与y 之间大致呈线性关系。 2、设回归方程为01y x ββ∧
∧
∧
=+
1β∧
=
12
2
1
(2637021717)
0.0036(71043005806440)
()n
i i
i n
i
i x y n x y
x
n x --
=-
=--=
=--∑∑
01 2.850.00367620.1068y x ββ-∧-
=-=-⨯=
0.10680.0036y x ∧
∴=+可得回归方程为
3、 22
n
i=1
1()n-2i i y y σ∧∧=-∑ 2
n 01i=1
1(())n-2i y x ββ∧∧=-+∑
=0.2305
σ∧
=0.4801
4、 由于2
1
1(,
)xx
N L
σββ∧
t σ
∧
=
=
服从自由度为n-2的t 分布。因而
/2|(2)1P t n αασ⎡⎤⎢⎥<-=-
⎢⎥
⎣⎦
也即:1/2
11/2
(p t t ααβββ∧
∧
∧
∧
-<<+=1α-
可得195%β∧
的置信度为的置信区间为
0.4801/0.4801/⨯⨯(0.0036-1.8600.0036+1.860
即为:(0.0028,0.0044)
220
01()(,())xx
x N n L ββσ-
∧
+
t ∧
∧
=
=
服从自由度为n-2的t 分布。因而
/2(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦
即0/200/2()1p βσ
ββσα∧∧
∧
∧
-<<+=- 可得195%0.3567,0.5703β∧
-的置信度为的置信区间为()
5、x 与y 的决定系数 2
21
2
1
()
()
n
i
i n
i
i y y r y y ∧-
=-=-=
=
-∑∑16.82027
18.525
=0.908
6、由于(1,9)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。
7、
t σ
∧
=
=
其中2
2
211
11()22n n
i i i i i e y y n n σ∧∧====---∑∑
0.00368.5420.04801
=
=
/2 1.895t α= /28.542t t α=>
∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。
8、 相关系数
()()
n
i
i
x x y y L r --
--=
=
∑
0.9489=