回归分析论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《应用回归分析》课程设计
题目大学生在校人数的多元回归分析
姓名唐家彬乔利飞文韬
学号 10801020120 10801020119 10801020121 指导教师胡爱萍高红霞康新梅
成绩
大学生在校人数的多元回归分析
摘要:自从1978年恢复高考以来,我国高等教育在快速发展,尤其在近十几年发展速度惊人。由以前千军万马挤独木桥演变成满城尽是大学生。我们将研究以普通高等学校在校人数为因变量做回归分析。研究其受那些因素的影响。最终我们选者了x3、x4、x6这几个变量进行回归,分别对应了普通高等学校招生人数、国家财政教育经费、人均可支配收入这几个变量。得出标准化回归方程为:普通高等学校在校人数=0.241*普通高等学校招生人数+0.219*国家财政教育经费+0.216*人均可支配收入。
关键词:强制回归逐步回归岭回归
一、问题的提出
自从1978年恢复高考以来,我国高等教育在快速发展,尤其在近十几年发展速度惊人。由以前千军万马挤独木桥演变成满城尽是大学生。数据显示,从2000年到2005年,高等教育阶段在校生人数一路攀升:从1230万人,增长到1300万人、1500 万人、1900 万人和2000 万人,至2009年增长到2300万人。大学教育越来越普及,在校大学生人数也是剧增。
我们将研究以普通高等学校在校人数为因变量做回归分析。研究其受那些因素的影响。
二、模型的建立
普通高等学校在校人数应该从学校和学生两方面来分析。学校方面因素应该有:普通高等学校学校数(下文称学校数)、普通高等学校专职教师数(教师数)、普通高等学校招生人数(招生数)、国家财政教育经费(教育经费)。学生方面因素应该包括:高中升学率(升学率)、人均可支配收入(可支配收入)。
可建立多元回归模型:
y=β0+β1*1+β2*x2+β3*x3+β4*x4+β5*x5+β6*x6+ε
其中:
y 普通高等学校在校人数(万人)
x1普通高等学校学校数(所)
x2普通高等学校专职教师数(万人)
x3普通高等学校招生人数(万人)
x4国家财政教育经费(亿元)
x5高中升学率
x6 人均可支配收入(元)
)
ε~N(0, 2
1
通过查找《中国统计年鉴》找出了因变量y和自变量x1、x2、x3、x4、x5、x6从1990-2008年的数据。数据如下表。
数据来自《中国统计年鉴》
三、相关系数矩阵求解
首先做因变量y与自变量之间的相关系数矩阵
表1 因变量和各自变量的相关系数矩阵
由表1可以得出因变量y与x1、x2、x3、x4、x6的相关系数在0.9以上,和x5的相关系数也在0.7上,均和y高度线性相关。各自变量的相互相关程度也比较高。
四、运用强制回归法进行分析
所以我们用强制进入法对6个变量进行拟合优度检验、回归方程的显著性检验、最小二乘估计、回归系数的显著性检验和多重共线性的检测。(用SPSS软件分析结果如表2-5)
4.1拟合优度检验
表2 强制回归拟合优度检验表
由表2中可知复相关系数、复决定系数和调整的复决定系数都等于1,因此可以认为拟合优度很高,被解释变量基本可以全部被模型解释
4.2回归方程的显著性检验
表3 强制回归方差分析表
由表3可知,F统计量=11879.835,它对应的概率p值近似为零,如果显著水平ɑ为0.05,由于p小于ɑ,应拒绝回归方程显著性检验的零假设,认为回归系数不同时为零,被解释变量与解释变量全体的线性关系是显著的。
4.3最小二乘估计
表4 强制回归方程分析结果
由表4可以得出回归方程为:
y=-315.732-0.011x1+10.734x2+1.497x3-0.012x4-0.022x5+0.015x6
回归方程中有3个系数为负值,这显然和现实意义不相符,这6个变量的回归效果不好。
4.4回归系数的显著性检验
由表4可知t检验统计量对应的p值只有x2和x3小于显著水平ɑ,所以只有x2和x3通过了回归系数的显著检验,对y有显著影响。
4.5多重共线性诊断
我们将根据方差扩大因子和特征根判别法进行诊断。
表5 强制回归多重共线性分析表
根据方差扩大因子和特征根判别法进行诊断
由表4的VIF(方差扩大因子)都远远超过10,说明存在严重的多重共线性
由表5的条件指数列可以看出第3、4、5、6、7的条件指数的开方都大于10,也说明变量存在多重共线性。
4.6强制回归总结
综上所述,应用强制进入回归将6个变量进行回归分析,存在一些不容忽视的问题,应重新建立回归方程。
五、运用逐步回归法进行分析
下一步我们将用逐步回归法对6个变量进行筛选,选取显著水平ɑ进=0.05,ɑ出=0.01
5.1拟合优度检验
表6 逐步回归拟合优度检验表
由表6可以得出逐步回归最终选取变量为x2、x3、x6,复相关系数,复决定系数、调整的复决定系数都等于1,说明拟合优度很高。
5.2回归方程的显著性检验
表7 逐步回归方差分析表
由表7可知,模型3的F统计量=25638.106,p=0.000,回归方程通过了显著性检验。
5.3最小二乘估计
表8 逐步回归方程分析结果
由表8可知,最终的回归方程为:
y=-296.151+9.957x2+1.564x3+0.009x6
5.4回归系数的显著性检验
各系数的显著性检验p值都为零,所有回归系数均通过显著性检验5.5多重共线性诊断
表9 逐步回归多重共线性分析表