回归分析论文

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《应用回归分析》课程设计

题目大学生在校人数的多元回归分析

姓名唐家彬乔利飞文韬

学号 10801020120 10801020119 10801020121 指导教师胡爱萍高红霞康新梅

成绩

大学生在校人数的多元回归分析

摘要:自从1978年恢复高考以来,我国高等教育在快速发展,尤其在近十几年发展速度惊人。由以前千军万马挤独木桥演变成满城尽是大学生。我们将研究以普通高等学校在校人数为因变量做回归分析。研究其受那些因素的影响。最终我们选者了x3、x4、x6这几个变量进行回归,分别对应了普通高等学校招生人数、国家财政教育经费、人均可支配收入这几个变量。得出标准化回归方程为:普通高等学校在校人数=0.241*普通高等学校招生人数+0.219*国家财政教育经费+0.216*人均可支配收入。

关键词:强制回归逐步回归岭回归

一、问题的提出

自从1978年恢复高考以来,我国高等教育在快速发展,尤其在近十几年发展速度惊人。由以前千军万马挤独木桥演变成满城尽是大学生。数据显示,从2000年到2005年,高等教育阶段在校生人数一路攀升:从1230万人,增长到1300万人、1500 万人、1900 万人和2000 万人,至2009年增长到2300万人。大学教育越来越普及,在校大学生人数也是剧增。

我们将研究以普通高等学校在校人数为因变量做回归分析。研究其受那些因素的影响。

二、模型的建立

普通高等学校在校人数应该从学校和学生两方面来分析。学校方面因素应该有:普通高等学校学校数(下文称学校数)、普通高等学校专职教师数(教师数)、普通高等学校招生人数(招生数)、国家财政教育经费(教育经费)。学生方面因素应该包括:高中升学率(升学率)、人均可支配收入(可支配收入)。

可建立多元回归模型:

y=β0+β1*1+β2*x2+β3*x3+β4*x4+β5*x5+β6*x6+ε

其中:

y 普通高等学校在校人数(万人)

x1普通高等学校学校数(所)

x2普通高等学校专职教师数(万人)

x3普通高等学校招生人数(万人)

x4国家财政教育经费(亿元)

x5高中升学率

x6 人均可支配收入(元)

)

ε~N(0, 2

1

通过查找《中国统计年鉴》找出了因变量y和自变量x1、x2、x3、x4、x5、x6从1990-2008年的数据。数据如下表。

数据来自《中国统计年鉴》

三、相关系数矩阵求解

首先做因变量y与自变量之间的相关系数矩阵

表1 因变量和各自变量的相关系数矩阵

由表1可以得出因变量y与x1、x2、x3、x4、x6的相关系数在0.9以上,和x5的相关系数也在0.7上,均和y高度线性相关。各自变量的相互相关程度也比较高。

四、运用强制回归法进行分析

所以我们用强制进入法对6个变量进行拟合优度检验、回归方程的显著性检验、最小二乘估计、回归系数的显著性检验和多重共线性的检测。(用SPSS软件分析结果如表2-5)

4.1拟合优度检验

表2 强制回归拟合优度检验表

由表2中可知复相关系数、复决定系数和调整的复决定系数都等于1,因此可以认为拟合优度很高,被解释变量基本可以全部被模型解释

4.2回归方程的显著性检验

表3 强制回归方差分析表

由表3可知,F统计量=11879.835,它对应的概率p值近似为零,如果显著水平ɑ为0.05,由于p小于ɑ,应拒绝回归方程显著性检验的零假设,认为回归系数不同时为零,被解释变量与解释变量全体的线性关系是显著的。

4.3最小二乘估计

表4 强制回归方程分析结果

由表4可以得出回归方程为:

y=-315.732-0.011x1+10.734x2+1.497x3-0.012x4-0.022x5+0.015x6

回归方程中有3个系数为负值,这显然和现实意义不相符,这6个变量的回归效果不好。

4.4回归系数的显著性检验

由表4可知t检验统计量对应的p值只有x2和x3小于显著水平ɑ,所以只有x2和x3通过了回归系数的显著检验,对y有显著影响。

4.5多重共线性诊断

我们将根据方差扩大因子和特征根判别法进行诊断。

表5 强制回归多重共线性分析表

根据方差扩大因子和特征根判别法进行诊断

由表4的VIF(方差扩大因子)都远远超过10,说明存在严重的多重共线性

由表5的条件指数列可以看出第3、4、5、6、7的条件指数的开方都大于10,也说明变量存在多重共线性。

4.6强制回归总结

综上所述,应用强制进入回归将6个变量进行回归分析,存在一些不容忽视的问题,应重新建立回归方程。

五、运用逐步回归法进行分析

下一步我们将用逐步回归法对6个变量进行筛选,选取显著水平ɑ进=0.05,ɑ出=0.01

5.1拟合优度检验

表6 逐步回归拟合优度检验表

由表6可以得出逐步回归最终选取变量为x2、x3、x6,复相关系数,复决定系数、调整的复决定系数都等于1,说明拟合优度很高。

5.2回归方程的显著性检验

表7 逐步回归方差分析表

由表7可知,模型3的F统计量=25638.106,p=0.000,回归方程通过了显著性检验。

5.3最小二乘估计

表8 逐步回归方程分析结果

由表8可知,最终的回归方程为:

y=-296.151+9.957x2+1.564x3+0.009x6

5.4回归系数的显著性检验

各系数的显著性检验p值都为零,所有回归系数均通过显著性检验5.5多重共线性诊断

表9 逐步回归多重共线性分析表

相关文档
最新文档