非线性回归模型的线性化

合集下载

回归分析(5)

回归分析(5)
2016/5/10 27
而知。 为此,研究者选用二元二次多项 式回归模型 2 y 0 1 x1 2 x2 11 x1

2 22 x2
12 x1 x2
并检验交互效应和风险反感度的二次 效应。
2016/5/10 28
序号
x1
x2
y
1
2 3 4
66.29
40.964 72.996 45.01
7
5 10 6
196
63 252 84
5
6
57.204
26.852 38.122 35.84
4
5 4 6
126
14 49 49
数 据 表
7 8
9
10 11 12
75.796
37.408 54.376 46.186
9
5 2 7
266
49 105 98
13
14 15 16
第10章 非线性回归
线性回归的理论较为成熟,应用 也较为广泛。但当被解释变量与解释 变量之间呈某种曲线关系时,就必须 用非线性回归。 本章首先介绍可线性化的非线性 回归,然后介绍多项式回归,最后简 要介绍了一般的非线性回归模型。
2016/5/10 2
§1 可线性化的非线性回归
1. 线性化的含义及途径 因为线性回归的“线性”是针对 参数而言,而不是针对自变量而言, 所以有些非线性回归模型可以通过变 量代换转化为线性回归模型。 例如, bx y 0 1e (b已知)
首先做三元线性回归,结果如下:
2016/5/10 37
线性回归
2016/5/10
38
显然,回归效果极差。 可将所有项选入,然后选择逐步 回归法,结果如下:

非线性回归模型的线性化

非线性回归模型的线性化

k 1 beatut yt
k 1 beatut yt
ln
k yt
1
ln b at
ut
令yt
ln
k yt
1
,
b
ln b
yt b at ut
此时可用最小二乘法估计b*和a。
钉螺存活率曲线 (生长曲线模型)
把一批钉螺埋入土中,以后每隔一个月取出部分钉螺,检 测存活个数,计算存活率。数据见表。
FOOD
3000
2000
1000
0 0
4000
8000
12000
INCOME 16000 20000
9.0 LOG(FOOD)
8.5
8.0
7.5
7.0
6.5
6.0 LOG(LOG(INCOME))
5.5 1.80 1.85 1.90 1.95 2.00 2.05 2.10 2.15 2.20 2.25 2.30
以1为例
1
yt xt1
线性模型中的回归系数(边际系数)是对数线性回归模型中弹性
系数的一个分量。
应用柯布-道格拉斯生产函数模型评价台湾省农业生产 效率。利用台湾省1958-1972年农业生产总值yt、劳动力 投入xt1、资本投入xt2的数据估计模型如下:
Yˆt
0.035X
1.5 t1
X
0.49 t2
yt ke be at
yt ke be at
曲线的上限和下限分别为k和0 。
当a 0, Limyt k, 当a 0,b 0 , Limyt 0
t
t
曲线有拐点,坐标为 Lnb , k
a e
, 但曲线不对称于拐点。
一般情形,上限值k可事先估计,有了k值,龚伯斯曲线才 可以用最小二乘法估计参数。

多元非线性回归模型

多元非线性回归模型

j表示在其他解释变量保持不变的情况下,
Xj每变化1个单位时,Y的均值E(Y)的变化。
非线性的情况:
(1) ln Yi 1 2 ln X i ui
(2) ln Yi 1 2 X i ui
(3)Yi 1 2 ln X i ui
(4)Yi 1 2 X i 3 X i2 ui
非线性回归模型的线性化
一、双对数模型 二、半对数模型 三、幂函数模型 四、多项式函数模型 五、倒数函数模型
一元线性回归模型
Yi 1 2 X i ui
i=1,2…,n
1表示X每变化一个单位时, 的均值E(Y)的变化。 Y
多元线性回归模型
Yi 1 2 X 2i 3 X 3i k X ki ui i=1,2…,n
Cobb-Dauglas生产函数
Yi AKi Li e

ui
Q:产出量,K:投入的资本;L:投入的劳动
方程两边取对数:
ln Qi = ln A + ln Ki + ln Li+ui
斜率系数衡量的是被解释变量Y关于解释变量X的弹 性, 表示当L不变时,K每变动百分之一,Y的均值 变动的百分比; 表示当K不变时,L每变动百分之 一,Y的均值变动的百分比。
(二)半对数模型
如果设定的非线性模型为
ln Yi 1 2 X i ui
E (lnYi ) E (lnYi 1 ) Y的均值的相对变化 X i X i 1 X的绝对变化
2
斜率系数 2 衡量的是当变量X的绝对量每发生单位变动 时,引起被解释变量Y平均值的相对变动比率。 令
研究119个发展中国家1960-1985年的GDP增长率与 相对人均GDP之间的关系,考虑建立如下模型:

计量经济学第四章非线性回归模型的线性化

计量经济学第四章非线性回归模型的线性化

第四章 非线性回归模型的线性化以上介绍了线性回归模型。

但有时候变量之间的关系是非线性的。

例如 y t = α 0 + α11βt x + u t y t = α 0 t x e 1α+ u t上述非线性回归模型是无法用最小二乘法估计参数的。

可采用非线性方法进行估计。

估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现。

计算机的出现大大方便了非线性回归模型的估计。

专用软件使这种计算变得非常容易。

但本章不是介绍这类模型的估计。

另外还有一类非线性回归模型。

其形式是非线性的,但可以通过适当的变换,转化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。

称此类模型为可线性化的非线性模型。

下面介绍几种典型的可以线性化的非线性模型。

4.1 可线性化的模型⑴ 指数函数模型y t = t t ubx ae + (4.1)b >0 和b <0两种情形的图形分别见图4.1和4.2。

显然x t 和y t 的关系是非线性的。

对上式等号两侧同取自然对数,得Lny t = Lna + b x t + u t (4.2)令Lny t = y t *, Lna = a *, 则y t * = a * + bx t + u t (4.3) 变量y t * 和x t 已变换成为线性关系。

其中u t 表示随机误差项。

010203040501234XY 1图4.1 y t =tt u bx ae+, (b > 0) 图4.2 y t =tt u bx ae+, (b < 0)⑵ 对数函数模型y t = a + b Ln x t + u t (4.4)b >0和b <0两种情形的图形分别见图4.3和4.4。

x t 和y t 的关系是非线性的。

令x t * = Lnx t , 则y t = a + b x t * + u t (4.5)变量y t 和x t * 已变换成为线性关系。

图4.3 y t = a + b Lnx t + u t , (b > 0) 图4.4 y t = a + b Lnx t + u t , (b < 0)⑶ 幂函数模型y t = a x t b t u e (4.6)b 取不同值的图形分别见图4.5和4.6。

浅谈非线性回归模型的线性化

浅谈非线性回归模型的线性化

浅谈非线性回归模型的线性化广东省惠州市惠阳区崇雅中学高中部 卢瑞勤(516213)回归分析在各个领域中都有十分重要的作用,比如:在财务中可以用回归分析进行财务预测;在医疗检验中可以用回归分析进行病理预报等等。

高中新课标教材就在《必修3》和《选修2-3》中分别增加了《线性回归》和《回归分析》的内容,介绍了求线性回归方程的方法。

但在实际问题中,变量间的关系并非总是线性关系,本文结合本人的教学实践,对教材中的这两部分内容进行适当延伸,谈谈对一些可线性化的非线性回归模型的线性化问题,供各位同行在教学时参考。

一、什么是可线性化的非线性回归模型线性回归模型的基本特征是预报变量可以表示成解释变量和一个系数相乘的和,即预报变量y 可以表示成解释变量i x (i =1,2,3,……)的如下形式:0112233y a a x a x a x =++++,其中变量ix 是以其原型(而不是以ni x 或其它)的形式出现,变量y 是各变量i x 的线性函数。

而有些回归模型不具备这个特点,但是可以通过适当的代数变换转化成这种形式,我们称这类回归模型为可线性化的回归模型。

在本文中,我们只讨论只有一个解释变量可线性化的非线性回归模型的线性化。

二、非线性回归模型的线性化的基本思路非线性回归模线性化的基本思路是:由已知数据,确定解释变量和预报变量,作出散点图,根据经验,确定回归曲线的类型,然后作适当的代数变换,若变换后散点图体现较好的线性关系,即可将其化成线性形式求解,最后还原到原来的回归曲线。

如果回归曲线可用多种形式表示,可以各自将其线性化后求解,再用相关系数2R 进行拟合效果分析,2R 越大,拟合效果越好,所求的回归方程也就越精确。

三、非线性回归模型的线性化的常用方法可线性化的非线性回归模型有以下几种常见类型:(1)双曲线型,其形式为1a b y x =+,其变换为1y y '=, 1x x'=,变换后的形式为y b ax ''=+ (2)幂函数型,其形式为by ax = ,可以变形为ln ln ln y a b x =+,作变换ln y y '= ,ln x x '= ,变换后的形式为y a bx ''=+(3)指数函数型,其形式为bxy ae = ,以变形为ln ln y a bx =+,作变换ln y y '=,ln a a '= ,变换后的形式为y a bx ''=+(4)对数函数型,其形式为ln y a b x =+,作变换ln x x '=,变换后的形式为y a bx '=+ 下面以高中新课标数学教材《选修2-3》一道习题为例加以说明【例】在某地区的一段时间内观察到的不小于某震级x 的地震个数y 数据如下表,试建立回归方程表述二者之间的关系。

第三章非线性回归分析-PPT文档资料

第三章非线性回归分析-PPT文档资料

图 3.9
y t = b 0 + b 1 x t + b 2 x t2 + b 3 x t3 + u t
图 3.10
y t = b 0 + b 1 x t + b 2 x t2 + b 3 x t3 + u t
另一种多项式方程的表达形式是 y t = b 0 + b 1 x t + b 2 x t2 + u t (3.14) 其中 b1>0, b2>0 和 b1<0, b2<0 情形的图形分别见图 3.11 和 3.12。令 xt 1 = xt, x t 2 = xt 2,上 式线性化为, y t = b 0 + b 1 x t1 + b 2 x t2 + u t (3.15) 如经济学中的边际成本曲线、平均成本曲线与图 3.11 相似。
t t
k Lnb 估参数。曲线有拐点,坐标为( a 2 ,
) ,曲线的上下两部分对称于拐点。
be
图 3 .1 3 y t = k / (1 +
at u t
)
图 3 .1 4
b >0 情 形 的 图 形 见 图 3.7 。 x t 和 y t 的 关 系 是 非 线 性 的 。 令 y t* = 1/ y t, x t* = 1/ x t, 得
图 3.7
y t = 1/ ( a + b / x t ),
( b > 0)
图 3.8
y t = a + b /x t ,
(xt b 图 3 .6
e ut
yt = a xt b
⑷ 双曲线函数模型 1/ y t = a + b / x t + u t 也可写成, y t = 1/ ( a + b / x t + u t) y t* = a + b x t* + u t 已 变 换 为 线 性 回 归 模 型 。 其 中 ut 表 示 随 机 误 差 项 。 (3.9) (3.10)

4非线性模型

4非线性模型



d (ln Q) d (ln K )

Q / Q K / K

EK


d (ln Q) d (ln L)

Q / Q L / L

EL
• •
很显然, 为资本弹性系数, 为劳动力弹性系数。 1 ,表示规模报酬不变(即资本和劳动力增长
1%, 产 1出也增长1%);

yˆ 0.529204K L 0.882779 0.181053
,表示规模报酬递减(即资本和劳动力增长
• 1%, 产1,出表将示低规于模1%报的酬速递度增增(长即)资;本和劳动力增长1%,
产202出0/2/1将6 超过1%的速度增长)。
12
• 二、解释变量需间接替换的非线性回归模型
• 1、指数曲线模型 Q AK L eu
• 【例】下表列出了某地区1986~2005年的产出(用国内生产总值GDP度量,单位万 元)、劳动投入(用总就业人数度量,单位为千人)以及资本投入(用资产总额度量, 单位为千元)的数据,试建立该地区的生产函数。
• 【例】美国1958-1969年小时收入指数变化百分比y与失业率x统计资料下表 所示,试建立美国1958-1969年的菲利普斯曲线。

• 若使用Eviews软件,在主窗口的命令栏内,直接键入ls y c
1/x回车即可得到参数估计结果。
2020/2/16
6
一、解释变量可以直接替换的非线性回归模型
• ⒈ 多项式函数模型
边际成本是递减的;当产量超过46.128时,边际成本是递增的。
2020/2/16
5
一、解释变量可以直接替换的非线性回归模型
• ⒈ 多项式函数模型

04-非线性回归模型的线性化

04-非线性回归模型的线性化
t
i l
2 t
2
2016/3/29
6
4.2、线性化方法
1、 被解释变量与解释变量之间不存在线性关系,与
未知参数之间存在线性关系的模型,其线性化的方法 为:变量替换法;然后利用OLS估计参数。 2、被解释变量与解释变量、未知参数之间不存在线性 关系,但可线性化的模型的线性化方法为:对数法和 变量替换法;然后利用OLS估计参数。 3、真正意义上的非线性模型,需要进行线性化处理。
2016/3/29 5
4.1.3、非线性回归模型的基本假定
1.扰动项零均值: E(u ) 0, t 1, 2,..., n 2.无自相关性: E(u u ) 0; i, l 1, 2,..., n; i l 3.同方差性: E(u ) , t 1, 2,..., n ,其中为有限常 数。 4.解释变量为非随机变量 5.函数性质:一般情况下,假设 f (xt , β)为二阶连 续可微函数。 6.模型参数可识别 7.分布假定:零均值、同方差。在极大似然估 计中,需要对扰动项的分布做出假设,一般假 设其服从正态分布。
ˆ ˆ) log(a 1 ˆ ˆ b
2
ˆ e ) (a
ˆ 1
应当指出,在这种情况下,线性模型估计量
的性质(如 BLUE, 正态性等)只适用于变换后的参 ˆ 和 ˆ ,而不一定适用于原模型参数的估 数估计量 1 2 计量 a ˆ 。 ˆ和 b
2016/3/29 16
CES生产函数模型的线性化回归
最小二乘法
t
ˆ ) min S (β) S (β

min (Yt f (xt , β))2

t
2016/3/29 21
非线性最小二乘法的正规方程组
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

非线性回归模型的线性化以上介绍了线性回归模型。

但有时候变量之间的关系是非线性的。

例如 y t = α 0 + α11βt x + u t y t = α 0 t x e 1α+ u t上述非线性回归模型是无法用最小二乘法估计参数的。

可采用非线性方法进行估计。

估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现。

计算机的出现大大方便了非线性回归模型的估计。

专用软件使这种计算变得非常容易。

但本章不是介绍这类模型的估计。

另外还有一类非线性回归模型。

其形式是非线性的,但可以通过适当的变换,转化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。

称此类模型为可线性化的非线性模型。

下面介绍几种典型的可以做线性化处理的非线性模型。

⑴ 指数函数模型y t = t t u bx ae + (4.1) b >0 和b <0两种情形的图形分别见图4.1和4.2。

显然x t 和y t 的关系是非线性的。

对上式等号两侧同取自然对数,得Lny t = Lna + b x t + u t (4.2)令Lny t = y t *, Lna = a *, 则y t * = a * + bx t + u t (4.3) 变量y t * 和x t 已变换成为线性关系。

其中u t 表示随机误差项。

010203040501234XY 1图4.1 y t =tt u bx ae+, (b > 0) 图4.2 y t =tt u bx ae+, (b < 0)⑵ 对数函数模型y t = a + b Ln x t + u t (4.4)b >0和b <0两种情形的图形分别见图4.3和4.4。

x t 和y t 的关系是非线性的。

令x t * = Lnx t , 则y t = a + b x t * + u t (4.5)变量y t 和x t * 已变换成为线性关系。

图4.3 y t = a + b Lnx t + u t , (b > 0) 图4.4 y t = a + b Lnx t + u t , (b < 0)⑶幂函数模型y t= a x t b t u e(4.6)b取不同值的图形分别见图4.5和4.6。

x t和y t的关系是非线性的。

对上式等号两侧同取对数,得Lny t = Lna + b Lnx t + u t(4.7) 令y t* = Lny t, a* = Lna, x t* = Lnx t, 则上式表示为y t* = a* + b x t* + u t(4.8) 变量y t* 和x t* 之间已成线性关系。

其中u t表示随机误差项。

(4.7) 式也称作全对数模型。

图4.5 y t = a x t b t u e图4.6 y t = a x t b t u e⑷双曲线函数模型1/y t = a + b/x t+ u t(4.9)也可写成,y t = 1/ (a + b/x t+ u t) (4.10) b>0情形的图形见图4.7。

x t和y t的关系是非线性的。

令y t* = 1/y t, x t* = 1/x t,得y t* = a + b x t* + u t已变换为线性回归模型。

其中u t表示随机误差项。

图4.7 y t = 1/ (a + b/x t ), (b > 0) 图4.8 y t = a + b/x t , (b > 0) 双曲线函数还有另一种表达方式,y t = a + b/x t + u t(4.11) b>0情形的图形见图4.8。

x t和y t的关系是非线性的。

令x t* = 1/x t,得y t = a + b x t* + u t上式已变换成线性回归模型。

⑸多项式方程模型一种多项式方程的表达形式是y t = b0 +b1 x t + b2 x t2 + b3 x t3 + u t(4.12)其中b1>0, b2>0, b3>0和b1<0, b2>0, b3<0情形的图形分别见图4.9和4.10。

令x t 1 = x t,x t 2 = x t2,x t 3 = x t3,上式变为y t = b0 +b1 x t 1 + b2 x t 2 + b3 x t 3 + u t(4.13)这是一个三元线性回归模型。

如经济学中的总成本曲线与图4.9相似。

图4.9 y t = b0 +b1 x t + b2 x t2 + b3 x t3 + u t图4.10 y t = b0 + b1 x t + b2 x t2 + b3 x t3 + u t 另一种多项式方程的表达形式是y t = b0 + b1 x t + b2 x t2 + u t(4.14)其中b1>0, b2>0和b1<0, b2<0情形的图形分别见图4.11和4.12。

令x t 1 = x t,x t 2 = x t 2,上式线性化为,y t = b0 + b1 x t1 + b2 x t2 + u t(4.15)如经济学中的边际成本曲线、平均成本曲线与图4.11相似。

图4.11 y t = b 0 +b 1x t + b 2x t 2 + u t 图4.12 y t = b 0 + b 1x t + b 2x t 2 + u t⑹ 生长曲线 (logistic) 模型y t = tu t f e k++)(1 (4.16)一般f (t ) = a 0 + a 1 t + a 2 t 2 + … + a n t n ,常见形式为f (t ) = a 0 - a ty t = u u at a e k +-+)(01= tu at be k+-+1 (4.17) 其中b = 0a e 。

a > 0情形的图形分别见图4.13和4.14。

美国人口统计学家Pearl 和Reed 广泛研究了有机体的生长,得到了上述数学模型。

生长模型(或逻辑斯谛曲线,Pearl-Reed 曲线)常用于描述有机体生长发育过程。

其中k 和0分别为y t 的生长上限和下限。

∞→t t Limy = k ,-∞→t t Limy = 0。

a , b 为待估参数。

曲线有拐点,坐标为(a Lnb ,2k),曲线的上下两部分对称于拐点。

图4.13 y t = k / (1 +tu at be+-) 图4.14 y t = k / (1 +tu at be +)为能运用最小二乘法估计参数a , b ,必须事先估计出生曲线长上极限值k 。

线性化过程如下。

当k 给出时,作如下变换,k /y t = 1 + t u at be +- 移项, k /y t - 1 = t u at be +-取自然对数,Ln ( k /y t - 1) = Lnb - a t + u t (4.18) 令y t * = Ln ( k /y t - 1), b * = Lnb , 则y t * = b * - a t + u t (4.19)此时可用最小二乘法估计b *和a 。

图4.15 内地5月1日至28日每天非典数据一览⑺ 龚伯斯(Gompertz )曲线英国统计学家和数学家最初提出把该曲线作为控制人口增长的一种数学模型,此模型可用来描述一项新技术,一种新产品的发展过程。

曲线的数学形式是,y t =at be ke --图4.15 y t =at be ke --曲线的上限和下限分别为k 和0,∞→t t Limy = k , -∞→t t Limy = 0。

a , b 为待估参数。

曲线有拐点,坐标为(a Lnb ,ek ),但曲线不对称于拐点。

一般情形,上限值k 可事先估计,有了k 值,龚伯斯曲线才可以用最小二乘法估计参数。

线性化过程如下:当k 给定时,y t / k = at be e --,k /y t = at be e -Ln (k /y t ) = at be -, Ln [Ln (k /y t )] = Lnb - a t令y *= Ln [Ln (k /y t )], b * = Lnb ,则y * = b * - a t上式可用最小二乘法估计b * 和 a 。

Cobb-Douglas 生产函数下面介绍柯布−道格拉斯(Cobb-Douglas )生产函数。

其形式是Q = k L α C 1- α (4.24)其中Q 表示产量;L 表示劳动力投入量;C 表示资本投入量;k 是常数;0 < α < 1。

这种生产函数是美国经济学家柯布和道格拉斯根据1899-1922年美国关于生产方面的数据研究得出的。

α的估计值是0.75,β的估计值是0.25。

更习惯的表达形式是y t =t u t t e x x 21210βββ (4.25)这是一个非线性模型,无法用OLS 法直接估计,但可先作线性化处理。

上式两边同取对数,得:Lny t = Ln β0 + β1 Lnx t 1 + β2 Lnx t 2 + u t (4.26)取 y t * = Lny t , β0* = Ln β0, x t 1* = Ln x t 1, x t 2* = Ln x t 2,有y t *= β0* +β1 x t 1* + β2 x t 2* + u t (4.27)上式为线性模型。

用OLS 法估计后,再返回到原模型。

若回归参数 β1 + β2 = 1,称模型为规模报酬不变型(新古典增长理论); β1 + β2 > 1,称模型为规模报酬递增型; β1 + β2 < 1,称模型为规模报酬递减型。

对于对数线性模型,Lny = Ln β0 + β1 Lnx t 1 + β2 Lnx t 2 + u t ,β1和β2称作弹性系数。

以β1为例,β1 = 1t t Lnx Lny ∂∂= 1111t t t t x x y y ∂∂--= 11//t t tt x x y y ∂∂= 11t t t t x y y x ∂∂ (4.28) 可见弹性系数是两个变量的变化率的比。

注意,弹性系数是一个无量纲参数,所以便于在不同变量之间比较相应弹性系数的大小。

对于线性模型,y t = α0 + α1 x t 1 + α2 x t 2 + u t ,α1和 α2称作边际系数。

以α1为例,α1 =1t tx y ∂∂ (4.29) 通过比较(4.28)和(4.29)式,可知线性模型中的回归系数(边际系数)是对数线性回归模型中弹性系数的一个分量。

例1:此模型用来评价台湾农业生产效率。

用台湾1958-1972年农业生产总值(y t ),劳动力(x t 1),资本投入(x t 2)数据(见表4.1)为样本得估计模型, ∧t Lny = -3.4 + 1.50 Lnx t 1 + 0.49 Lnx t 2 (4.30) (2.78) (4.80) R 2 = 0.89, F = 48.45 还原后得,t yˆ= 0.713 x t 11.50 x t 20.49 (4.31) 因为1.50 + 0.49 = 1.99,所以,此生产函数属规模报酬递增函数。

相关文档
最新文档