最新实验三 多元线性回归模型及非线性回归

最新实验三 多元线性回归模型及非线性回归
最新实验三 多元线性回归模型及非线性回归

实验三多元线性回归模型及非线性回归

实验三多元线性回归模型及非线性回归

一、多元线性回归模型

例题3.2.2 建立2006年中国城镇居民人均消费支出的多元线性回归模型。数据:

地区2006年消费支出Y2006年可支配收入X12005年消费支出X2

北京14825.41 19977.52 13244.2 天津10548.05 14283.09 9653.3 河北7343.49 10304.56 6699.7 山西7170.94 10027.70 6342.6 内蒙古7666.61 10357.99 6928.6 辽宁7987.49 10369.61 7369.3 吉林7352.64 9775.07 6794.7 黑龙江6655.43 9182.31 6178.0 上海14761.75 20667.91 13773.4 江苏9628.59 14084.26 8621.8 浙江13348.51 18265.10 12253.7 安徽7294.73 9771.05 6367.7 福建9807.71 13753.28 8794.4 江西6645.54 9551.12 6109.4 山东8468.40 12192.24 7457.3 河南6685.18 9810.26 6038.0 湖北7397.32 9802.65 6736.6 湖南8169.30 10504.67 7505.0 广东12432.22 16105.58 11809.9 广西6791.95 9898.75 7032.8 海南7126.78 9395.13 5928.8 重庆9398.69 11569.74 8623.3 四川7524.81 9350.11 6891.3 贵州6848.39 9116.61 6159.3 云南7379.81 10069.89 6996.9 西藏6192.57 8941.08 8617.1 陕西7553.28 9267.70 6656.5 甘肃6974.21 8920.59 6529.2 青海6530.11 9000.35 6245.3 宁夏7205.57 9177.26 6404.3 新疆6730.01 8871.27 6207.5

1、建立模型

01122Y X X βββμ=+++ 2、估计模型 (1)录入数据

打开EViews6,点“File ”→“New ”→“Workfile ”

选择 “Unstructured/Undated ”,在Observations 后输入31,如下所示:

点“ok ”。

在命令行输入:DATA Y X1 X2,回车 将数据复制粘贴到Group 中的表格中:

(2)估计回归方程

在命令行输入命令:LS Y C X1 X2,回车

或者在主菜单中点“Quick” “Estimate Equation”,在Specification中输入 Y C X1 X2,点“确定”。

得到如下估计结果:

对照输出的结果,写出回归报告:

i i i X X Y 212434.05593.036.152??+?+= (0.5881)(7.4348) (2.1414)

9759.02=R 9742.02=R F=566.3870 D.W.=1.8274 做经济意义检验和统计检验: ①经济意义检验

1β的估计值为0.5593,2β的估计值为0.2434,均在0与1之间,符合经济理论和行为规律(或者说符合合理预期的消费理论, 具体介绍见书P329)。 ②统计检验

模型的可决系数为0.9759,模型拟合较好。

给定α=0.05,模型的F 统计量为566.3870,相伴概率p=0.0000<α,表明方程的整体线性关系显著。

给定α=0.05,1X 对应的t 统计量为7.4348,,相伴概率为p=0.0000<α,表明变量1X 显著;2X 对应的t 统计量为2.1414,相伴概率为p=0.0411<α,表明变量2X 显著。

③模型的经济意义解释

1β的估计值为0.5593,表示在其他条件不变的前提下,中国城镇居民2006年的人均可支配收入每增加1元,人均消费支出增加0.56元;2β的估计值为0.2434,表示在其他条件不变的前提下,中国城镇居民在2005年的人均消费每增加1元,2006年的人均消费支出增加0.24元。

二、 非线性回归

(1)可化为线性的非线性回归模型 例题3.5.1:

①中国城镇居民食品消费需求函数模型。

根据需求理论,居民对食品的消费需求函数大致为: ),,(01P P X f Q =

其中,Q 为居民对食品的需求量,X 为消费者的消费支出总额,1P 为食品价格指数,0P 为居民消费价格总指数。根据恩格尔定律,随着居民消费支出的增加,居民对食品的消费支出也增加,但食品消费支出比例会逐渐下降。因此,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系。具体的函数形式设定为:

μ

βββe P P AX Q 32101=

经对数变换,转化为对数线性模型:

μββββ++++=031210LnP LnP LnX LnQ (0LnA β=) 拟定待估参数的理论期望值: A>0

1β:食品消费支出对总消费支出的弹性, 0<1β<1;

2β:食品消费支出对食品的自价格弹性,因为食品是生活必需品,-1<2β<0;

3β:食品消费支出对总价格的弹性,因为食品是生活必需品,总物价

上涨,会导致食品消费支出减少,但不会减少很多,因此 -1<3β<0;

需求函数具有零阶齐次性,即0321=++βββ。当所有商品的价格和

消费者货币支出按同一比例变动时,需求量保持不变,这就是所谓的消费者无货币幻觉。 数据: 年份

X (当年价) X1(当年

价)

GP FP

Q

P0

P1

1985 673.2 351.4 111.9 116.5 1315.9 28.1 26.7

1986 799.0 418.9 107.0 107.2 1463.3 30.1 28.6 1987 884.4 472.9 108.8 112.0 1475.0 32.8 32.1 1988 1104.0 567.0 120.7 125.2 1412.5 39.5 40.1 1989 1211.0 660.0 116.3 114.4 1437.2 46.0 45.9 1990 1278.9 693.8 101.3 98.8 1529.2 46.6 45.4 1991 1453.8 782.5 105.1 105.4 1636.3 49.0 47.8 1992 1671.7 884.8 108.6 110.7 1671.4 53.2 52.9 1993 2110.8 1058.2 116.1 116.5 1715.9 61.7 61.7 1994 2851.3 1422.5 125.0 134.2 1718.7 77.2 82.8 1995 3537.6 1711.9 116.8 123.6 1732.1 90.1 102.3 1996 3919.5 1904.7 108.8 107.9 1725.6 98.1 110.4 1997 4185.6 1942.6 103.1 100.1 1758.2 101.1 110.5 1998 4331.6 1926.9 99.4 96.9 1799.8 100.5 107.1 1999 4615.9 1932.1 98.7 95.7

1885.7 99.2 102.5

04非线性回归模型的线性化 (3)

非线性回归模型的线性化 以上介绍了线性回归模型。但有时候变量之间的关系是非线性的。例如 y t = α 0 + α11βt x + u t y t = α 0 t x e 1α+ u t 上述非线性回归模型是无法用最小二乘法估计参数的。可采用非线性方法进行估计。估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现。计算机的出现大大方便了非线性回归模型的估计。专用软件使这种计算变得非常容易。但本章不是介绍这类模型的估计。 另外还有一类非线性回归模型。其形式是非线性的,但可以通过适当的变换,转化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。称此类模型为可线性化的非线性模型。下面介绍几种典型的可以做线性化处理的非线性模型。 ⑴ 指数函数模型 y t = t t u bx ae + (4.1) b >0 和b <0两种情形的图形分别见图4.1和4.2。显然x t 和y t 的关系是非线性的。对上式等号两侧同取自然对数,得 Lny t = Lna + b x t + u t (4.2) 令Lny t = y t *, Lna = a *, 则 y t * = a * + bx t + u t (4.3) 变量y t * 和x t 已变换成为线性关系。其中u t 表示随机误差项。 图4.1 y t =t t u bx ae +, (b > 0) 图4.2 y t =t t u bx ae +, (b < 0) ⑵ 对数函数模型 y t = a + b Ln x t + u t (4.4) b >0和b <0两种情形的图形分别见图4.3和4.4。x t 和y t 的关系是非线性的。令x t * = Lnx t , 则 y t = a + b x t * + u t (4.5) 变量y t 和x t * 已变换成为线性关系。

非线性回归分析

SPSS—非线性回归(模型表达式)案例解析 2011-11-16 10:56 由简单到复杂,人生有下坡就必有上坡,有低潮就必有高潮的迭起,随着SPSS 的深入学习,已经逐渐开始走向复杂,今天跟大家交流一下,SPSS非线性回归,希望大家能够指点一二! 非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何形式的模型非线性,能够通过变量转换成为线性模型——称之为本质线性模型,转换后的模型,用线性回归的方式处理转换后的模型,有的非线性模型并不能够通过变量转换为线性模型,我们称之为:本质非线性模型 还是以“销售量”和“广告费用”这个样本为例,进行研究,前面已经研究得出:“二次曲线模型”比“线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的趋势变化”,那么“二次曲线”会不会是最佳模型呢? 答案是否定的,因为“非线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的变化趋势” 下面我们开始研究: 第一步:非线性模型那么多,我们应该选择“哪一个模型呢?” 1:绘制图形,根据图形的变化趋势结合自己的经验判断,选择合适的模型 点击“图形”—图表构建程序—进入如下所示界面:

点击确定按钮,得到如下结果:

放眼望去, 图形的变化趋势,其实是一条曲线,这条曲线更倾向于"S" 型曲线,我们来验证一下,看“二次曲线”和“S曲线”相比,两者哪一个的拟合度更高! 点击“分析—回归—曲线估计——进入如下界面

在“模型”选项中,勾选”二次项“和”S" 两个模型,点击确定,得到如下结果: 通过“二次”和“S “ 两个模型的对比,可以看出S 模型的拟合度明显高于

(实验2)多元回归分析实验报告

陕西科技大学实验报告 课 程: 数理金融 实验日期: 2014 年 5 月 22 日 班 级: 数学112 交报告日期: 2013 年 5 月 23 日 姓 名: 常海琴 报告退发: (订正、重做) 学 号: 201112010101 教 师: 刘利明 实验名称: 多元回归分析 一、实验预习: 1.多元回归模型。 2.多元回归模型参数的检验。 3.多元回归模型整体的检验。 二、实验的目的和要求: 通过案例分析掌握多元回归模型的建立方法和检验的标准;并掌握分析解决实际金融问题的能力。 三、实验过程:(实验步骤、原理和实验数据记录等) 软件:Eviews3.1 数据:给定美国机动车汽油消费量研究数据。 实验原理:最小二乘法拟合多元线性回归方程 数据记录: 实例中1950年到1987年机动汽车的消费量、汽车保有量、汽油价格、人口数、国民生产总值 图1各个量之间的关系

陕西科技大学理学院实验报告 - 2 - 1、录入数据 图2录入数据 2、回归分析 443322110X X X X Y βββββ++++= 图3运行结果 Y=24553723+1.418520x1-27995762x2-59.87480x3-30540.88x4 S (25079670) (0.266) (5027085) (198.5517) (9557.981) T (0.979) (5.314) (-5.568) (-0.301) (-3.195) 2R =0.966951 F=241.3764 - R =0.9629 dw=0.6265 四、实验总结:(实验数据处理和实验结果讨论等) 用残差和最小确定直线位置是一个途径。计算残差和有相互抵消的问题。用残差绝对值和最小确定直线位置也是一个途径绝对值计算起来比较麻烦。最小二乘法用绝对值平方和最小确定直线位置。0β、1β、2β、3β、4β具有线性特性,无偏特性,有效性。-R =0.9629基本上接近于1,拟合效果较好。

统计学原理-回归分析案例0204192330

美国各航空公司业绩的统计数据公布在《华尔街日报1998年鉴》(The Wall Street Journal Almanac 1998)上,有关航班正点到达的比率和每10万名乘客投诉的次数的数据如下: 航空公司名称航班正点率(%)投诉率(次/10万名乘客)西南(Southwest)航空公司81.8 0.21 大陆(Continental) 航空公司76.6 0.58 西北(Northwest)航空公司76.6 0.85 美国(US Airways)航空公司75.7 0.68 联合(United)航空公司73.8 0.74 美洲(American)航空公司72.2 0.93 德尔塔(Delta)航空公司71.2 0.72 70.8 1.22 美国西部(America West)航空公 司 环球(TWA)航空公司68.5 1.25 a. 画出这些数据的散点图 b. 根据再(a)中作出的散点图,表明二变量之间存在什么关系? c. 求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程 d. 对估计的回归方程的斜率作出解释 e. 如何航班按时到达的正点率是80%,估计每10万名乘客投诉的次数是多少?

1)作散点图: 2)根据散点图可知,航班正点率和投诉率成负直线相关关系。 3)作简单直线回归分析: SUMMARY OUTPUT 回归统计 Multiple R0.882607 R Square0.778996 Adjusted R Square0.747424 标准误差0.160818 观测值9 方差分析  df SS MS F Significance F 回归分析10.6381190.63811924.673610.001624残差70.1810370.025862 总计80.819156  Coefficient s标准误差t Stat P-value Lower 95%Upper 95%下限95.0%上限95.0% Intercept 6.017832 1.05226 5.7189610.000721 3.5296358.506029 3.5296358.506029 X Variable 1-0.070410.014176-4.967250.001624-0.10393-0.03689-0.10393-0.03689 4)y = -0.0704x + 6.0178

常见非线性回归模型

常见非线性回归模型 1.简非线性模型简介 非线性回归模型在经济学研究中有着广泛的应用。有一些非线性回归模型可以通 过直接代换或间接代换转化为线性回归模型,但也有一些非线性回归模型却无 法通过代换转化为线性回归模型。 柯布—道格拉斯生产函数模型 y AKL 其中L和K分别是劳力投入和资金投入, y是产出。由于误差项是可加的, 从而也不能通过代换转化为线性回归模型。 对于联立方程模型,只要其中有一个方程是不能通过代换转化为线性,那么这个联立方程模型就是非线性的。 单方程非线性回归模型的一般形式为 y f(x1,x2, ,xk; 1, 2, , p) 2.可化为线性回归的曲线回归 在实际问题当中,有许多回归模型的被解释变量y与解释变量x之间的关系都不是线性的,其中一些回归模型通过对自变量或因变量的函数变换可以转化为

线性关系,利用线性回归求解未知参数,并作回归诊断。如下列模型。 (1)y 0 1e x (2)y 0 1x2x2p x p (3)y ae bx (4)y=alnx+b 对于(1)式,只需令x e x即可化为y对x是线性的形式y01x,需要指出的是,新引进的自变量只能依赖于原始变量,而不能与未知参数有关。 对于(2)式,可以令x1=x,x2=x2,?,x p=x p,于是得到y关于x1,x2,?, x p 的线性表达式y 0 1x12x2 pxp 对与(3)式,对等式两边同时去自然数对数,得lnylnabx ,令 y lny, 0 lna, 1 b,于是得到y关于x的一元线性回归模型: y 0 1x。 乘性误差项模型和加性误差项模型所得的结果有一定差异,其中乘性误差项模型认为yt本身是异方差的,而lnyt是等方差的。加性误差项模型认为yt是等 方差的。从统计性质看两者的差异,前者淡化了y t值大的项(近期数据)的作用, 强化了y t值小的项(早期数据)的作用,对早起数据拟合得效果较好,而后者则 对近期数据拟合得效果较好。 影响模型拟合效果的统计性质主要是异方差、自相关和共线性这三个方面。 异方差可以同构选择乘性误差项模型和加性误差项模型解决,必要时还可以使用 加权最小二乘。

实验三多元线性回归模型地估计和检验

实验三 多元线性回归模型的估计和检验 一、实验目的:掌握多元线性回归模型的估计和检验方法 二、预备知识:普通最小二乘法(OLS) 三、实验内容:选择方程进行多元线性回归 四、实验步骤: (一)国内生产总值的增长模型 分析广东省国内生产总值的增长,根据广东数据(数据见“表:广东省宏观经济 数据-第三章.xls ”文件,各变量的表示按照试验指导课本上的来表示)选择不变价GDP (GDPB )、不变价资本存量(ZC )和从业人员(RY ),把GDPB 作为因变量,ZC 和RY 作为两个解释变量进行二元线性回归分析。 要求:按照试验指导课本100P ~102P ,分别作: 1、作散点图(GDPB 同ZC ,GDPB 同RY ) 2、进行因果关系检验(GDPB 同ZC ,GDPB 同RY ) 3、作GDPB 同ZC 和RY 的多元线性回归,写出模型估计的结果,并分析模型检验是均否通过?(三个检验) 4、将建立的二元回归模型(GDPB 同ZC 和RY )同一元回归模型(GDPB 同ZC 、GDPB 同RY )相比较,分析优点。 5、结合相关的经济理论,分析估计的二元回归模型的经济意义。

(二)宏观经济模型 根据广东数据,研究广东省居民消费行为、固定资产投资行为、货物和服务净出口行为和存货行为,分别建立居民消费模型、固定资产投资模型、货物和服务净出口模型和存货增加模型。 要求:按照试验指导课本510P ~211P ,分别作出以下模型,并对需要改进的 模型进行改进。写出最终估计的模型结果,并结合相关的经济理论,分析模型的经济意义。(数据见“表:广东省宏观经济数据-第三章.xls ”文件,各变量的表示按照试 验指导课本上的来表示。) 1、居民消费模型 2、固定资产投资模型 3、货物和服务净流出模型 4、存货增加模型

SPSS多元线性回归分析实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件: 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open;

2. Opening excel data source——OK. 第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择Stepwise.

进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.

3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.

计量经济学基础_非线性回归模型

第四节 非线形回归模型 一、 可线性化模型 在非线性回归模型中,有一些模型经过适当的变量变换或函数变换就可以转化成线性回归模型,从而将非线性回归模型的参数估计问题转化成线性回归模型的参数估计,称这类模型为可线性化模型。在计量经济分析中经常使用的可线性化模型有对数线性模型、半对数线性模型、倒数线性模型、多项式线性模型、成长曲线模型等。 1.倒数模型 我们把形如: u x b b y ++=110;u x b b y ++=1110 (3.4.1) 的模型称为倒数(又称为双曲线函数)模型。 设:x x 1*=,y y 1*=,即进行变量的倒数变换,就可以将其转化成线性回归模型。 倒数变换模型有一个明显的特征:随着x 的无限扩大,y 将趋于极限值0b (或0/1b ),即有一个渐进下限或上限。有些经济现象(如平均固定成本曲线、商品的成长曲线、恩格尔曲线、菲利普斯曲线等)恰好有类似的变动规律,因此可以由倒数变换模型进行描述。 2.对数模型 模型形式: u x b b y ++=ln ln 10 (3.4.2) (该模型是将u b e Ax y 1=两边取对数,做恒等变换的另一种形式,其中A b ln 0=)。 上式lny 对参数0b 和1b 是线性的,而且变量的对数形式也是线性的。因此,我们将以上模型称为双对数(double-log)模型或称为对数一线性(log-liner)模型。 令:x x y y ln ,ln **==代入模型将其转化为线性回归模型: u x b b y ++=*10* (3.4.3) 变换后的模型不仅参数是线性的,而且通过变换后的变量间也是线性的。 模型特点:斜率1b 度量了y 关于x 的弹性:

matlab多元线性回归模型

云南大学数学与统计学实验教学中心 实验报告 一、实验目的 1.熟悉MATLAB的运行环境. 2.学会初步建立数学模型的方法 3.运用回归分析方法来解决问题 二、实验内容 实验一:某公司出口换回成本分析 对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本. 实验二:某建筑材料公司的销售量因素分析 下表数据是某建筑材料公司去年20个地区的销售量(Y,千方),推销开支、实际帐目数、同类商品

竞争数和地区销售潜力分别是影响建筑材料销售量的因素。1)试建立回归模型,且分析哪些是主要的影响因素。2)建立最优回归模型。 提示:建立一个多元线性回归模型。

三、实验环境 Windows 操作系统; MATLAB 7.0. 四、实验过程 实验一:运用回归分析在MATLAB 里实现 输入:x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00 3.40 6.90]'; X=[ones(13,1) x]; Y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40]'; plot(x,Y,'*'); [b,bint,r,rint,stats]=regress(Y,X,0.05); 输出: b = 2.6597 -0.2288 bint = 1.8873 3.4322 -0.3820 -0.0757 stats = 0.4958 10.8168 0.0072 0.0903 即==1,0?6597.2?ββ,-0.2288,0?β的置信区间为[1.8873 3.4322],1,?β的置信区间为[-0.3820 -0.0757]; 2r =0.4958, F=10.8168, p=0.0072 因P<0.05, 可知回归模型 y=2.6597-0.2288x 成立. 1 1.5 2 2.5 散点图 估计某家公司商品流转费用率是6.5%的出口换汇成本。将x=6.5代入回归模型中,得到 >> x=6.5; >> y=2.6597-0.2288*x y = 1.1725

非线性回归分析

非线性回归问题, 知识目标:通过典型案例的探究,进一步学习非线性回归模型的回归分析。 能力目标:会将非线性回归模型通过降次和换元的方法转化成线性化回归模型。 情感目标:体会数学知识变化无穷的魅力。 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的 过程中寻找更好的模型的方法. 教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学方式:合作探究 教学过程: 一、复习准备: 对于非线性回归问题,并且没有给出经验公式,这时我们可以画出已知数据的散点图,把它与必修模块《数学1》中学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量代换,把问题转化为线性回归问题,使其得到解决. 二、讲授新课: 1. 探究非线性回归方程的确定: 1. 给出例1:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. ① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模. ② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量. ③ 在上式两边取对数,得21ln ln y c x c =+ ,再令ln z y =,则21ln z c x c =+, 可以用线性回归方程来拟合. ④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =-$,因此红铃虫的产卵数对温度的非线性回归方程为$0.272 3.843x y e -=. ⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 三、合作探究 例 2.:炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液及炉渣对包衬耐火材料的侵蚀,使其容积不断增大,请根据表格中的数据找出使用次数x 与增大的容积y 之间的关系.

数学建模多元回归模型

实习报告书 学生姓名: 学号: 学院名称: 专业名称: 实习时间: 2014年 06 月 05 日 第六次实验报告要求 实验目的: 掌握多元线性回归模型的原理,多元线性回归模型的建立、估计、检验及解释变量的增减的方法,以及运用相应的Matlab软件的函数计算。 实验内容: 已知某市粮食年销售量、常住人口、人均收入、肉、蛋、鱼的销售数据,见表1。请选择恰当的解释变量和恰当的模型,建立粮食年销售量的回归模型,并对其进行估计和检验。 表1 某市粮食年销售量、常住人口、人均收入、肉、蛋、鱼的销售数据 年份粮食年销售 量Y/万吨 常住人口 X2/万人 人均收 入X3/ 元 肉销售 量X4/万 吨 蛋销售 量X5/ 万吨 鱼虾销 售量 X6/万吨 197498.45560.20153.20 6.53 1.23 1.89 1975100.70603.11190.009.12 1.30 2.03 1976102.80668.05240.308.10 1.80 2.71 1977133.95715.47301.1210.10 2.09 3.00 1978140.13724.27361.0010.93 2.39 3.29 1979143.11736.13420.0011.85 3.90 5.24 1980146.15748.91491.7612.28 5.13 6.83 1981144.60760.32501.0013.50 5.418.36 1982148.94774.92529.2015.29 6.0910.07 1983158.55785.30552.7218.107.9712.57 1984169.68795.50771.1619.6110.1815.12

统计学多元回归分析实例

某农场负责人认为早稻收获量(y:单位为kg/公顷)与春季降雨(x i:单位为mm)和春季温度(X2:单位为C )有一定的联系,通过7组试验获得了相关的数据。利用Excel得到下面的回归结果(a =0.1): 方差分析表 (1)将方差分析表中的所缺数值补齐。 (2 )写出早稻收获量与春季降雨量、春季温度的多元线性回归方程,并解释各回归系数的意义。 (3 )检验回归方程的线性关系是否显著? (4)检验各回归系数是否显著? 2 (5)计算判定系数R,并解释它的实际意义。 (6)计算估计标准误差Se,并解释它的实际意义。 (每个空格为0.5分) 2、设总体回归模型为Y= 口+ P 1X^^ 2X2+ & ?x^ ?x2,由EXCEL输出结果可知,?= -0.39 14.92x1估计回归方程为? = ? 218.45x2,回归系数 ?的意义指在温度不变的条件下,当降雨量每增加1mm早稻收获量平均增加 14.92 kg/公顷;回归系数:?的意义指在降雨量不变的条件下, 2 当温度增加1C,早稻收获量平均增加218.45 kg/公顷。---5 分 3、由于p值=0.000075 < a =0.05,则拒绝原假设,即表明回归方程的线性关系是显著的。

4、由于各回归系数的P值均小于a ( 0.05 ),所以各回归系数是显著的。 ---2 分5、2二§臾二1387849567二0.99,表示早稻收获量的总变异中有99%的部分可以由降 R SST 14000000 雨量、温度的联合变动来解释。---4 分 6、S =」SS E =V MST = J30376.08 =174.29(k为自变量个数),是总体回归模型 e n - k -1 中随机扰动项&的标准差的无偏估计量,用来衡量回归方程拟合程度的分析指标,S e越大,拟合程度越低;S e越小,拟合程度越高? —4 分

实验三多元回归模型

实验三多元回归模型 【实验目的】 掌握建立多元回归模型和比较、筛选模型的方法。 【实验内容】 建立我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为:()ε, f t Y=。其中,L、K分别为生产过程中投入的劳动与资金, L , ,K 时间变量t反映技术进步的影响。表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。 资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理 【实验步骤】 一、建立多元线性回归模型 ㈠建立包括时间变量的三元线性回归模型; 在命令窗口依次键入以下命令即可: ⒈建立工作文件: CREATE A 78 94 ⒉输入统计资料: DATA Y L K

⒊生成时间变量t : GENR T=@TREND(77) ⒋建立回归模型: LS Y C T L K 则生产函数的估计结果及有关信息如图3-1所示。 图3-1 我国国有独立核算工业企业生产函数的估计结果 因此,我国国有独立工业企业的生产函数为: K L t y 7764.06667.06789.7732.675?+++-= (模型1) t = 9958.02=R 9948.02=R 551.1018=F 模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为,资金的边际产出为,技术进步的影响使工业总产值平均每年递增亿元。回归系数的符号和数值是较为合理的。9958.02=R ,说明模型有很高的拟合优度,F 检验也是高度显着的,说明职工人数L 、资金K 和时间变量t 对工业总产值的总影响是显着的。从图3-1看出,解释变量资金K 的t 统计量值为,表明资金对企业产出的影响是显着的。但是,模型中其他变量(包括常数项)的t 统计量值都较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除t 统计量最小的变量(即时间变量)而重新建立模型。 ㈡建立剔除时间变量的二元线性回归模型; 命令:LS Y C L K 则生产函数的估计结果及有关信息如图3-2所示。

计量经济学判断题 )

1. 总离差平方和可分解为回归平方和与残差平方和。( 对 ) 2. 整个多元回归模型在统计上是显着的意味着模型中任何一个单独的解释变量均是统计显着的。( 错 ) 3. 多重共线性只有在多元线性回归中才可能发生。( 对 ) 4. 通过作解释变量对时间的散点图可大致判断是否存在自相关。( 错 ) 5. 在计量回归中,如果估计量的方差有偏,则可推断模型应该存在异方差( 错 ) 6. 存在异方差时,可以用广义差分法来进行补救。( 错 ) 7. 当经典假设不满足时,普通最小二乘估计一定不是最优线性无偏估计量。( 错 ) 8. 判定系数检验中,回归平方和占的比重越大,判定系数也越大。( 对 ) 9. 可以作残差对某个解释变量的散点图来大致判断是否存在自相关。( 错 )做残差 ) n 5、经典线性回归模型(CLRM )中的干扰项不服从正态分布的,OLS 估计量将有偏的。错,,即使经典线性回归模型(CLRM )中的干扰项不服从正态分布的,OLS 估计量仍然是无偏的。 因为222)()?(βμββ=+=∑i i K E E ,该表达式成立与否与正态性无关。 1、在简单线性回归中可决系数2R 与斜率系数的t 检验的没有关系。错误,在简单线性回归 中,由于解释变量只有一个,当t 检验显示解释变量的影响显着时,必然会有该回归模型的可决系数大,拟合优度高。 2、异方差性、自相关性都是随机误差现象,但两者是有区别的。正确,异方差的出现总是与模型中某个解释变量的变化有关。自相关性是各回归模型的随机误差项之间具有相关关

系。3、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。错误,模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”;模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。 4、满足阶条件的方程一定可以识别。错误,阶条件只是一个必要条件,即满足阶条件的的方程也可能是不可识别的。 5、库依克模型、自适应预期模型与局部调整模型的最终形式是不同的。错误,库依克模型、自适应预期模型与局部调整模型的最终形式是相同的,其最终形式都是一阶自回归模型。2、多重共线性问题是随机扰动项违背古典假定引起的。错误,应该是解释变量之间高度相关引起的. (3) 线性回归模型意味着因变量是自变量的线性函数。(错) (4) 在线性回归模型中,解释变量是原因,被解释变量是结果。(对) 1、虚拟变量的取值只能取0或1(对) 2、通过引入虚拟变量,可以对模型的参数变化进行检验(对) 1、简单线性回归模型与多元线性回归模型的基本假定是相同的。错 在多元线性回归模型里除了对随机误差项提出假定外,还对解释变量之间提 出无多重共线性的假定。 2、在模型中引入解释变量的多个滞后项容易产生多重共线性。对 在分布滞后模型里多引进解释变量的滞后项,由于变量的经济意义一样,只

统计学案例——相关回归分析

《统计学》案例——相关回归分析 案例一质量控制中的简单线性回归分析 1、问题的提出 某石油炼厂的催化装置通过高温及催化剂对原料的作用进行反应,生成各种产品,其中液化气用途广泛、易于储存运输,所以,提高液化气收率,降低不凝气体产量,成为提高经济效益的关键问题。 通过因果分析图和排列图的观察,发现回流温度是影响液化气收率的主要原因,因此,只有确定二者之间的相关关系,寻找适当的回流温度,才能达到提高液化气收率的目的。经认真分析仔细研究,确定了在保持原有轻油收率的前提下,液化气收率比去年同期增长1个百分点的目标,即达到12.24%的液化气收率。 2、数据的收集

目标值确定之后,我们收集了某年某季度的回流温度与液化气收率的30组数据(如上表),进行简单直线回归分析。 3.方法的确立 设线性回归模型为εββ++=x y 10,估计回归方程为x b b y 10?+= 将数据输入计算机,输出散点图可见,液化气收率y 具有随着回流温度x 的提高而降低的趋势。因此,建立描述y 与x 之间关系的模型时,首选直线型是

合理的。 从线性回归的计算结果,可以知道回归系数的最小二乘估计值 b 0=21.263和b 1=-0.229,于是最小二乘直线为 x y 229.0263.21?-= 这就表明,回流温度每增加1℃,估计液化气收率将减少0.229%。 (3)残差分析 为了判别简单线性模型的假定是否有效,作出残差图,进行残差分析。

从图中可以看到,残差基本在-0.5—+0.5左右,说明建立回归模型所依赖的假定是恰当的。误差项的估计值s=0.388。 (4)回归模型检验 a.显著性检验 在90%的显著水平下,进行t 检验,拒绝域为︱t ︱=︱b 1/ s b1︱>t α/2=1.7011。 由输出数据可以找到b 1和s b1,t=b 1/ s b1=-0.229/0.022=-10.313,于是拒绝原假设,说明液化气收率与回流温度之间存在线性关系。 b.拟合度检验 判定系数r 2=0.792。这意味着液化气收率的样本变差大约有80%可以由它与回流温度的线性关系来解释。 2r r ==-0.89 这样,r 值为y 与x 之间存在中高度的负线性关系提供了进一步的证据。 由于n ≥30,我们近似确定y 的90%置信区间为: s z y )(?2 α±=21.263-0.229x ±1.282×0.388 = 21.263-0.229x ± 0.497

浅谈非线性回归模型的线性化

浅谈非线性回归模型的线性化 广东省惠州市惠阳区崇雅中学高中部 卢瑞勤(516213) 回归分析在各个领域中都有十分重要的作用,比如:在财务中可以用回归分析进行财务预测;在医疗检验中可以用回归分析进行病理预报等等。高中新课标教材就在《必修3》和《选修2-3》中分别增加了《线性回归》和《回归分析》的内容,介绍了求线性回归方程的方法。但在实际问题中,变量间的关系并非总是线性关系,本文结合本人的教学实践,对教材中的这两部分内容进行适当延伸,谈谈对一些可线性化的非线性回归模型的线性化问题,供各位同行在教学时参考。 一、什么是可线性化的非线性回归模型 线性回归模型的基本特征是预报变量可以表示成解释变量和一个系数相乘的和,即预报变量y 可以表示成解释变量i x (i =1,2,3,……)的如下形式:0112233y a a x a x a x =++++ ,其中变量i x 是以其原型(而不是以n i x 或其它)的形式出现,变量y 是各变量i x 的线性函数。而有些回归模型不具备这个特点,但是可以通过适当的代数变换转化成这种形式,我们称这类回归模型为可线性化的回归模型。 在本文中,我们只讨论只有一个解释变量可线性化的非线性回归模型的线性化。 二、非线性回归模型的线性化的基本思路 非线性回归模线性化的基本思路是:由已知数据,确定解释变量和预报变量,作出散点图,根据经验,确定回归曲线的类型,然后作适当的代数变换,若变换后散点图体现较好的线性关系,即可将其化成线性形式求解,最后还原到原来的回归曲线。如果回归曲线可用多种形式表示,可以各自将其线性化后求解,再用相关系数2 R 进行拟合效果分析,2 R 越大,拟合效果越好,所求的回归方程也就越精确。 三、非线性回归模型的线性化的常用方法 可线性化的非线性回归模型有以下几种常见类型: (1)双曲线型,其形式为 1a b y x =+,其变换为1y y '=, 1 x x '=,变换后的形式为y b ax ''=+ (2)幂函数型,其形式为b y ax = ,可以变形为ln ln ln y a b x =+,作变换ln y y '= ,ln x x '= ,变换后的形式为y a bx ''=+ (3)指数函数型,其形式为bx y ae = ,以变形为ln ln y a bx =+,作变换ln y y '=,ln a a '= ,变换后的形式为y a bx ''=+ (4)对数函数型,其形式为ln y a b x =+,作变换ln x x '=,变换后的形式为y a bx '=+ 下面以高中新课标数学教材《选修2-3》一道习题为例加以说明 【例】在某地区的一段时间内观察到的不小于某震级x 的地震个数y 数据如下表,试建立回归方程表述二者之间的关系。

非线性回归分析(教案)

1.3非线性回归问题, 知识目标:通过典型案例的探究,进一步学习非线性回归模型的回归分析。 能力目标:会将非线性回归模型通过降次和换元的方法转化成线性化回归模型。 情感目标:体会数学知识变化无穷的魅力。 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的 过程中寻找更好的模型的方法. 教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学方式:合作探究 教学过程: 一、复习准备: 对于非线性回归问题,并且没有给出经验公式,这时我们可以画出已知数据的散点图,把它与必修模块《数学1》中学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量代换,把问题转化为线性回归问题,使其得到解决. 二、讲授新课: 1. 探究非线性回归方程的确定: 1. 给出例1:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的/y 个 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. ① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模. ② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量. ③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,可以用线性回归方程来拟合. ④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为 0.272 3.843z x =-,因此红铃虫的产卵数对温度的非线性回归方程为0.272 3.843x y e -=. ⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 三、合作探究 例 2.:炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液及炉渣对包衬耐火材料的侵蚀,使其容积不断增大,请根据表格中的数据找出使用次数 x 与增大的容积y 之间的关系.

实验报告2多元线性回归模型的估计和统计检验(答案).doc

实验实训报告 课程名称:计量经济学实验 开课学期: 2011-2012学年第一学期开课系(部):经济系 开课实验(训)室:数量经济分析实验室学生姓名: 专业班级: 学号: 重庆工商大学融智学院教务处制

实验题目 实验(训)项目名称多元线性回归模型的估计和统 指导教师 计检验 实验(训)日期所在分组 实验概述 【实验(训)目的及要求】 目的:掌握多元线性回归模型的估计、检验。 要求:在老师指导下完成多元线性回归模型的建立、估计、统计检验,并得到正确的分析结果。 【实验(训)原理】 当多元线性回归模型在满足线性模型古典假设的前提下,最小二乘估计结果具有无偏性、有效性等性质,在此基础上进一步对估计所得的模型进行经济意义检验及统计检验。 实验内容 【实验(训)方案设计】 1、创建工作文件和导入数据; 2、完成变量的描述性统计; 3、进行多元线性回归估计; 4、统计检验:可决系数分析(R2);(2)参数显著性分析(t检验);(3)方程显著性分析(F检验); 5、进行变量非线性模型的线性化处理,并比较不同模型的拟合优度(因变量相同时)。 实验背景 选择包括中央和地方税收的“国家财政收入”中的“各项税收”(简称“TAX”)作为被解释变量,以反映国家税收的增长。选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表(FIN);选择“商品零售物价指数”作为物价水平的代表(PRIC),并将它们设为影响税收收入的解释变量。建立中国税收的增长模型,并对已建立的模型进行检验。

【实验(训)过程】(实验(训)步骤、记录、数据、分析 ) 1、根据实验数据的相关信息建立Workfile ; 在菜单中依次点击File\New\Workfile,在出现的对话框“Workfile range ”中选择数据频率。因为本例分析中国1978-2002年度的税收(Tax )与GDP 、财政支出(FIN )、商品零售物价指数(PRIC )之间关系,因此,在数据频率选项中选择“Annual ”选项。在“start data ”输入“1978”,在“end data ”输入“2002”。 2、导入数据; 在菜单栏中选择“Quick\Empty Group ”,将TAX 、GDP 、FIN 、PRIC 的年度数据从Excel 导入,并将这四个序列的名称分别改为“TAX ” 、“TAX ” 、“GDP ” 、“FIN ” 、“PRIC ” 。 或者在EViews 命令窗口中直接输入“data TAX GDP FIN PRIC ” ,在弹出的编辑框中将这四个个变量的时间数列数据从Excel 中复制过来。 3、给出自变量和因变量的描述性统计结果,并判断数据序列是否服从正态分布 (5%α=) 变量名 Mean Median Std J-B 值 J.B p 值 是否服从正态分布 GDP 35977 18548 34445 3.308 0.191 是 FIN 5855 3084 5968 9.390 0.009 否 PRIC 105 103 7 4.125 0.127 是 TAX 4848 2822 4871 6.908 0.032 否 4、给出自变量和因变量之间的相关系数矩阵: GDP FIN PRIC TAX GDP 1.000 0.957 -0.290 0.969 FIN 0.957 1.000 -0.375 0.997 PRIC -0.290 -0.375 1.000 -0.334 TAX 0.969 0.997 -0.334 1.000 5、假设总体回归模型1为0123TAX GDP FIN PRIC u ββββ=++++,进行多元回归估计 并报告估计结果:

统计学多元回归分析实例

某农场负责人认为早稻收获量(y :单位为kg/公顷)与春季降雨(x 1:单位为mm )和春季温度(x 2:单位为℃)有一定的联系,通过7组试验获得了相关的数据。利用Excel 得到下面的回归结果(α=0.1): 方差分析表 (2)写出早稻收获量与春季降雨量、春季温度的多元线性回归方程,并解释各回归系数的意义。 (3)检验回归方程的线性关系是否显著? (4)检验各回归系数是否显著? (5)计算判定系数2 R ,并解释它的实际意义。 (6)计算估计标准误差Se ,并解释它的实际意义。 (每个空格为0.5分) -----3分 2、设总体回归模型为Y =1 2 1 2 x x αεββ+ ++ 估计回归方程为y ?=1 2 1 2 ???x x αββ++,由EXCEL 输出结果可知,y ?=120.3914.92218.45-++x x ,回归系数1 ?β 的意义指在温度不变的条件下,当降雨量每增加1mm ,早稻收获量平均增加14.92kg/公顷;回归系数 2 ?β 的意义指在降雨量不变的条件下, 当温度增加1℃,早稻收获量平均增加218.45kg/公顷。 ---5分

3、由于p 值=0.000075<α=0.05,则拒绝原假设,即表明回归方程的线性关系是显著的。 ---2分 4、由于各回归系数的P 值均小于α(0.05),所以各回归系数是显著的。 ---2分 5、 2 13878495.67 0.9914000000 = ==SSR SST R ,表示早稻收获量的总变异中有99%的部分可以由降雨量、温度的联合变动来解释。 ---4分 6、 174.29= ===e S (k 为自变量个数) ,是总体回归模型中随机扰动项ε的标准差的无偏估计量,用来衡量回归方程拟合程度的分析指标,e S 越大, 拟合程度越低;e S 越小,拟合程度越高. ---4分

相关文档
最新文档