第十一章 一元线性回归分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十一章一元线性回归

11.1从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:

企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)

1 40 130 7 84 165

2 42 150 8 100 170

3 50 155 9 116 167

4 5

5 140 10 125 180

5 65 150 11 130 175

6 78 154 12 140 185

要求:

(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。

(2)计算产量与生产费用之间的线性相关系数。

(3)对相关系数的显著性进行检验(α = 0.05),并说明二者之间的关系强度。

解:(1)利用Excel的散点图绘制功能,绘制的散点图如下:

从散点图的形态可知,产量与生产费用之间存在正的线性相关。

(2)利用Excel的数据分析中的相关系数功能,得到产量与生产费用的线性相关系数r = 0.920232。

(3)计算t统计量,得到t = 7.435453,在α = 0.05的显著性水平下,临界值为2.6337,统计量远大于临界值,拒绝原假设,产量与生产费用之间存在显著

的正线性相关关系。r大于0.8,高度相关。

11.2 学生在期末考试之前用于复习的时间(单位:h)和考试分数(单位:分)之间是否有关系?为研究这一问题,以为研究者抽取了由8名学生构成的一个随机样本,得到的数据如下:

复习时间x考试分数y

20 64

16 61

34 84

23 70

27 88

32 92

18 72

22 77

要求:

(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。

(2)计算相关系数,说明两个变量之间的关系强度。

解:(1)利用Excel的散点图绘制功能,绘制的散点图如下:

从散点图的形态来看,考试分数与复习时间之间似乎存在正的线性相关关系。

(2)r = 0.862109,大于0.8,高度相关。

11.3根据一组数据建立的线性回归方程为ˆ100.5

=-。

y x

要求:

ˆβ的意义。

(1)解释截距

ˆβ意义。

(2)解释斜率

1

(3)计算当x = 6时的E(y)。

解:(1)在回归模型中,一般不能对截距项赋予意义。

ˆβ的意义为:当x增加1时,y减小0.5。

(2)斜率

1

(3)当x = 6时,E(y) = 10 – 0.5 * 6 = 7。

11.4 设SSR = 36,SSE = 4,n = 18。

要求:

(1)计算判定系数R2并解释其意义。

(2)计算估计标准误差s e并解释其意义。

解:SST = SSR+SSE = 36+4 = 40,

R2 = SSR / SST = 36 /40 = 0.9,意义为自变量可解释因变量变异的90%,自因变量与自变量之间存在很高的线性相关关系。

s== 0.5,这是随机项的标准误差的估计值。

(2)

e

11.5一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,因此,他抽出了公司最近10辆卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下:

1215

5.0

要求:

(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态。 (2)计算线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 解:

(1)利用Excel 绘制散点图,如下:

从散点图的形态来看,运送时间和运送距离之间存在正的线性相关关系。 (2)计算的相关系数为0.9489,这是一个很高的相关系数。

(3)用OLS 方法估计得到模型参数为0ˆβ= 0.118129,1ˆβ= 0.003585, 回归方程为:运送时间 = 0.118129 + 0.003*运送距离,意义为:运送距离每增加1km ,运送时间增加0.003383天,即0.086小时。

11.6 下面是7个地区2000年的人均国内生产总值(GDP )和人均消费水平的统计数据:

地区 人均GDP (元)

人均消费水平(元)

北京

22460 7326 辽宁 11226 4490 上海 34547 11546 江西 4851 2396 河南 5444 2208 贵州

2662

1608

陕西 4549 2035

要求:

(1)人均GDP 作自变量,人均消费水平左因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(α = 0.05)。

(6)如果某地区的人均GDP 为5000元,预测其人均消费水平。 (7)求人均GDP 为5000元时,人均消费水平95%的置信区间和预测区间。 解:

(1)利用Excel 绘制的散点图如下:

从散点图来看,人均消费水平与人均GDP 之间存在很强的正线性相关关系。 (2)r = 0.998,高度相关。

(3)用OLS 方法估计得到模型参数为0ˆβ= 734.69,1

ˆβ= 0.308,回归方程为:

人均消费水平 = 734.69 + 0.308*人均GDP ,

意义为:人均GDP 每增加1元,人均消费水平增加0.31元,此值即为经济学中的边际消费倾向。这里截距可解释为人均GDP 为0时,居民的消费支出为734元/年,即经济学中的自发支出。

相关文档
最新文档