第一部分3 经典线性回归模型的扩展(非线性和虚拟变量)
第一章线性回归模型-mathtype

(1.3.7) (1.3.8)
E A C u A C u A C E (uu ' ) A C 2 A C A C
' 'Байду номын сангаас
'
(1.3.9)
在(1.3.9)式中
A C A C =AA' AC ' CA' CC '
, n)
(1.2.6)
x2i n X X 2 x2i x2i yi ' X Y xi yi
'
正规方程(1.2.4)式变为 n x 2i
x x
2i 2 2i
1 yi x y i i 2
2 2 ' 1 ' ' 1
(X X ) X X (X X )
'
2 ( X ' X ) 1
(1.3.5)
问题:求一元模型yi 1 2 xi ui 最小二乘估计量,
1, 2 的方差,协方差 cov( 1 , 2 ).
1 x var( 2 ) , var( 1 ) ( ) 2 2 n ( x x ) ( x x ) i i
' var( c ) E c E ( c ) c E ( c ) ' E c c
'
( X ' X ) 1 X ' X ( X ' X ) 1 ( X ' X ) 1 X 'C ' CX ( X ' X ) 1 CC ' ( X ' X ) 1 +CC '
第三章 线性回归模型的

例3.2 需求方程 我们可以将需求模型建立成双对数的形式,从而 估计需求弹性。 模型设为: lnQ = b0 + b1 ln P+ b2 lnI+b3 ln Pr+u 其中, Q 是每天的咖啡销售 I是收入 P 是咖啡每磅的价格 Pr 是相关产品——茶叶每磅的价格
估计结果为: lnQ=0.78 -0.25lnP +0.6I+ 0.38lnPr t (51.1) (-5.12) (15.12) (3.25) 解释: (1)自价格弹性 是 -.25,表明保持其他不变, 如果价格增加1%,需求量将减少0.25%。这是缺乏 弹性的——弹性的绝对值小于1 (2)收入弹性是0.6 (3)交叉价格弹性是.38,表明保持其他不变, 如果茶叶的价格增加1%,咖啡的需求量增加0.38%。 注: 如果交叉弹性是正的,表明它们是替代品; 如果交叉弹性是负的,表明它们是互补的。
这种“量化”通常是通过引入“虚拟变量”来完 成的。根据这些因素的属性类型,构造只取“0” 或“1”的人工变量,通常称为虚拟变量 dummy 虚拟变量(dummy 虚拟变量 variables),记为D。 variables 例如,反映文化程度的虚拟变量可取为: 例如,反映文化程度的虚拟变量可取为 1, D= 0, 非本科学历 本科学历
参数的含义: 参数的含义:
β
j
∂Y = ∂ ln X
j
∂Y = =或 ∂X j X j
∆Y ∆X j X j
度量了在给定解释变量(X)的相对变化时, 度量了在给定解释变量(X)的相对变化时,Y的 (X)的相对变化时 绝对变化。 绝对变化。
例3.4货币供给的增长率对GNP的影响模型为: GNP = b 0 + b 1 lnM + u 斜率b1度量对M的相对变化,GNP的绝对变化— —M变化1%,GNP的绝对变化量为b1/100。 例如:b1=2000,说明货币供给增加1% ,将使 GNP 增加2000/100 = $20 billion.
非线性回归分析常见模型

非线性回归常见模型一.基本内容模型一xc e c y 21=,其中21,c c 为常数.将xc ec y 21=两边取对数,得x c c e c y xc 211ln )ln(ln 2+==,令21,ln ,ln c b c a y z ===,从而得到z 与x 的线性经验回归方程a bx z +=,用公式求即可,这样就建立了y 与x 非线性经验回归方程.模型二221c x c y +=,其中21,c c 为常数.令a c b c x t ===212,,,则变换后得到y 与t 的线性经验回归方程a bt y +=,用公式求即可,这样就建立了y 与x 非线性经验回归方程.模型三21c x c y +=,其中21,c c 为常数.a cbc x t ===21,,,则变换后得到y 与t 的线性经验回归方程a bt y +=,用公式求即可,这样就建立了y 与x 非线性经验回归方程.模型四反比例函数模型:1y a b x=+令xt 1=,则变换后得到y 与t 的线性经验回归方程a bt y +=,用公式求即可,这样就建立了y 与x 非线性经验回归方程.模型五三角函数模型:sin y a b x=+令x t sin =,则变换后得到y 与t 的线性经验回归方程a bt y +=,用公式求即可,这样就建立了y 与x 非线性经验回归方程.二.例题分析例1.用模型e kx y a =拟合一组数据组()(),1,2,,7i i x y i =⋅⋅⋅,其中1277x x x ++⋅⋅⋅+=;设ln z y =,得变换后的线性回归方程为ˆ4zx =+,则127y y y ⋅⋅⋅=()A.70e B.70C.35e D.35【解析】因为1277x x x ++⋅⋅⋅+=,所以1x =,45z x =+=,即()127127ln ...ln ln ...ln 577y y y y y y +++==,所以35127e y y y ⋅⋅⋅=.故选:C例2.一只红铃虫产卵数y 和温度x 有关,现测得一组数据()(),1,2,,10i i x y i =⋅⋅⋅,可用模型21e c x y c =拟合,设ln z y =,其变换后的线性回归方程为4zbx =- ,若1210300x x x ++⋅⋅⋅+=,501210e y y y ⋅⋅⋅=,e 为自然常数,则12c c =________.【解析】21e c x y c =经过ln z y =变换后,得到21ln ln z y c x c ==+,根据题意1ln 4c =-,故41e c -=,又1210300x x x ++⋅⋅⋅+=,故30x =,5012101210e ln ln ln 50y y y y y y ⋅⋅⋅=⇒++⋅⋅⋅+=,故5z =,于是回归方程为4zbx =- 一定经过(30,5),故ˆ3045b -=,解得ˆ0.3b =,即20.3c =,于是12c c =40.3e -.故答案为:40.3e -.该景点为了预测2023年的旅游人数,建立了模型①:由最小二乘法公式求得的数据如下表所示,并根据数据绘制了如图所示的散点图.。
计量经济学基础-非线性回归模型

第四节 非线形回归模型一、 可线性化模型在非线性回归模型中,有一些模型经过适当的变量变换或函数变换就可以转化成线性回归模型,从而将非线性回归模型的参数估计问题转化成线性回归模型的参数估计,称这类模型为可线性化模型。
在计量经济分析中经常使用的可线性化模型有对数线性模型、半对数线性模型、倒数线性模型、多项式线性模型、成长曲线模型等。
1.倒数模型我们把形如:u xb b y ++=110;u x b b y ++=1110 (3.4.1) 的模型称为倒数(又称为双曲线函数)模型。
设:xx 1*=,y y 1*=,即进行变量的倒数变换,就可以将其转化成线性回归模型。
倒数变换模型有一个明显的特征:随着x 的无限扩大,y 将趋于极限值0b (或0/1b ),即有一个渐进下限或上限。
有些经济现象(如平均固定成本曲线、商品的成长曲线、恩格尔曲线、菲利普斯曲线等)恰好有类似的变动规律,因此可以由倒数变换模型进行描述。
2.对数模型模型形式:u x b b y ++=ln ln 10 (3.4.2)(该模型是将ub e Ax y 1=两边取对数,做恒等变换的另一种形式,其中A b ln 0=)。
上式lny 对参数0b 和1b 是线性的,而且变量的对数形式也是线性的。
因此,我们将以上模型称为双对数(double-log)模型或称为对数一线性(log-liner)模型。
令:x x y y ln ,ln **==代入模型将其转化为线性回归模型: u x b b y ++=*10* (3.4.3)变换后的模型不仅参数是线性的,而且通过变换后的变量间也是线性的。
模型特点:斜率1b 度量了y 关于x 的弹性:xdx y dy x d y d b //)(ln )(ln 1== (3.4.4) 它表示x 变动1%,y 变动了多少,即变动了1b %。
模型适用对象:对观测值取对数,将取对数后的观测值(lnx ,lny )描成散点图,如果近似为一条直线,则适合于对数线性模型来描述x 与y 的变量关系。
3第三章 多元线性回归模型及非线性回归模型new

各种因素对汽车销量影响的性质怎样?(正、负) 各种因素影响汽车销量的具体数量关系是什么? 所得到的数量结论是否可靠? 中国汽车行业今后的发展前景怎样?应当如何制定汽车的 产业政策? 很明显,只用一个解释变量已很难分析汽车产业的发展, 还需要寻求有更多个解释变量情况的回归分析方法。
注意
ˆ 是向量 (i 1, 2, n) β ( j 1, 2, n)
(由无偏性) (由OLS估计式)
ˆ β)( β ˆ β )] E[( β
E[( X X )1 X uuX ( X X )1 ] ( X X )1 X E(uu) X ( X X )1 ( X X )1 X 2 IX ( X X )1
计量经济学
第三章 多元线性回归模型
引子:中国已成为世界汽车产销第一大国
2009年,为应对国际金融危机、确保经济平稳较快增长, 国家出台了一系列促进汽车消费的政策,有效刺激了汽车消费市 场,汽车产销呈高增长态势,首次成为世界汽车产销第一大国。 2009年,汽车产销分别为1379.1万辆和1364.5万辆,同比增长
c c12 11 c21 c22 ck 1 ck 2
c1k c2 k ckk
所以
ˆ ~ N ( , c ) j j
中第 j 行第 j 列的元素) 2 (j=1,2,---k) jj
19
ˆ 的方差-协方差 β
ˆ ) E{[ β ˆ E( β ˆ )][ β ˆ E( β ˆ )]} COV ( β
因为样本回归函数为 两边左乘 X
X
e
0
ˆ +e Y = Xβ
ˆ + X e X Y = X Xβ
经典线性回归模型

·β的OLS估计量:在假定2.3成立时
( ) å å b =
XTX
-1 X T Y
= çæ 1 èn
n i=1
xi xiT
Hale Waihona Puke -1ö æ1 ÷ç ø èn
n i=1
xi yi
÷ö ø
( ) ·估计量的抽样误差(sampling error): b - b = X T X -1 X Te
·第i次观测的拟合值(fitted value): yˆi = xiTb
且自变量的回归系数和 y 与 x 的样本相关系数之间的关系为
b1 == corr(Y , X )
å( 1 n
n - 1 i=1
yi
- y)2
º r sy
å( ) 1 n
n - 1 i=1
xi - x 2
sx
·修正决定系数(adjusted coefficient of determination, adjusted R square)
4.假定我们观测到上述这些变量的n组值: (y i , x i1 , L , ) x ip (i=1,…,n)。称
这n组值为样本(sample)或数据(data)。
§2.2 经典线性回归模型的假定
假定 2.1(线性性(linearity))
yi = b0 + b1xi1 + L + b p xip + e i (i=1,…,n)。
( ) ( ) E ~x jei
çæ E x j1e i =ç M
÷ö ÷=0
(i=1,…,n ; j=1,…,n )。
( ) ç
è
E
x jp e i
÷ ø
·不相关条件(zerocorrelation conditions)
南开大学经济学硕士研究生考试参考书目及考试大纲

南开大学硕士研究生参考书目学术型金融学院(金融学、保险学、金融工程、精算学)初试专业课:830经济学综合参考书目:《微观经济学:现代观点》范里安《宏观经济学》曼昆《计量经济学》张晓峒《计量经济学基础》古扎拉蒂经济学院(政治经济学、经济思想史、经济史、西方经济学、人口资源与环境经济学)初试专业课:831经济学基础参考书目:《西方经济学》高鸿业《微观经济学:现代观点》范里安《宏观经济学》曼昆《政治经济学》(资本主义部分)张彤玉、张桂文《政治经济学》(社会主义部分)柳欣、林木西《政治经济学》逄锦聚经济学院(世界经济以及其他的应用经济学二级学科专业)、经济与社会发展研究院、金融发展研究院、国家经济战略研究院与阿拉斯加国际合作项目、日本研究院初试专业课:832经济学基础参考书目:《西方经济学》高鸿业《微观经济学:现代观点》范里安《宏观经济学》曼昆南开大学经济学硕专业课主要有三个,分别是830经济学综合,这个是金融学院考的;831经济学基础,这个是经济学院除了世界经济外所有理论经济学专业考的;832经济学基础,这个是考的最多的,除了上面两种之外,考的几乎都是832经济学基础。
2016年金融学院考的还是832经济学基础,从2017年开始换成了830经济学综合,多了计量经济学,分值占总分大约是20%。
831经济学基础与832经济学基础相比,多出了政治经济学,学要背诵的东西多一些。
830经济学综合:总分150分,其中微、宏观经济学约占80%,计量经济学约占20%。
微观经济学:卷结构采用如下题型范围:名词解释题、简答题、计算题和论述题等。
考试重点内容如下1.预算约束:预算约束的定义、预算集的性质、预算线的变动、税收、补贴和配额等经济工具对预算线的影响2.偏好:偏好的定义、偏好的假设、无差异曲线、边际替代率、良态偏好的定义性特征3.效用:效用函数的单调变换、构造效用函数、拟线性偏好、边际效用和边际替代率的关系4.选择:消费者的最优选择、需求函数5.需求:正常商品和低档商品、收入提供曲线和恩格尔曲线、相似偏好、普通商品和吉芬商品、价格提供曲线和需求曲线、替代品和互补品、反需求函数6.显示偏好:显示偏好的概念、从显示偏好到偏好7.斯勒茨基方程:价格变动的替代效应和收入效应、希克斯替代效应8.需求分析和跨期选择问题:禀赋和需求变动、修正的斯勒茨基方程、劳动供给、跨期选择的预算约束9.不确定性条件下的选择:或有消费、期望效用、风险厌恶、风险偏好、风险中性10.消费者剩余:消费者剩余的概念、补偿变化和等价变化11.市场需求:从个人需求到市场需求、弹性、弹性与收益、边际收益曲线、收入弹性12.均衡:市场均衡、比较静态分析、税收、税收的转嫁、税收的额外损失、税收与帕累托效率13.技术:投入和产出、生产函数、技术的特征、边际产品、技术替代率、边际产品递减、技术替代率递减、长期和短期、规模报酬14.利润最大化:利润、不变要素和可变要素、短期利润最大化、长期利润最大化、反要素需求曲线、利润最大化和规模报酬15.成本最小化:成本最小化的定义、规模报酬和成本函数、长期成本和短期成本、沉没成本16.成本曲线:各种成本概念、各种成本之间的关系17.厂商供给和行业供给:市场特征、反供给函数、利润和生产者剩余、短期行业供给和长期行业供给、零利润、不变要素和经济租金、寻租18.垄断和垄断行为:垄断的定义、线性需求曲线和垄断、成本加成定价、垄断的低效率、自然垄断、价格歧视的定义、三种价格歧视19.要素市场:边际产品收益和边际产品价值、产品市场垄断厂商的要素需求、要素市场买方垄断的要素需求、上游垄断和下游垄断20.寡头垄断:寡头垄断特征与模式、古诺模型、斯塔克尔伯格模型、伯特兰竞争模型、价格领导者模型、联合定价和串谋21.博弈论:博弈的收益矩阵、纳什均衡、混合策略、囚徒困境、重复博弈、序贯博弈22.交换经济和福利经济学定理:埃奇沃思方框图、契约曲线、瓦尔拉斯法则、均衡定义与均衡的存在性、福利经济学基本定理23.生产经济与福利经济学定理:鲁滨逊•克鲁索经济、生产与福利经济学第一定理、生产与福利经济学第二定理24.外部效应:外部性的定义与表现形式、庇古税与科斯定理、公地的悲剧25.公共物品:公共物品的定义、搭便车、公共物品的需求和供给26.不对称信息:逆向选择、道德风险、委托代理问题和激励宏观经济学:主要的试题类型有:简答题、计算题和论述题等本考试包括以下13部分内容。
计量经济学第五章(新)

利用Eviews得回归方程为:
ˆ ln y 1.6524 0.3397 ln x1 0.9460 ln x2
t = (-2.73) p= (0.0144*) R2=0.995 (1.83) (0.085) (9.06) (0.000**)
对回归方程解释如下:斜率系数0.3397表示 产出对劳动投入的弹性,即表明在资本投入保持 不变的条件下,劳动投入每增加一个百分点,平 均产出将增加0.3397个百分点。同样地,在劳动 投入保持不变的条件下,资本投入每增加一个百 分点,产出将平均增加0.8640个百分点。两个弹 性系数相加为规模报酬参数,其数值等于1.1857 ,表明墨西哥经济的特征是规模报酬递增的(如 果数值等于1,属于规模报酬不变;小于1,则属 于规模报酬递减)。
20.5879 z 1 20.5879 x (4.6794 ) (4.3996 ** )
3、半对数模型和双对数模型
形式为:
ln y 0 1 x u y 0 1 ln x u
的模型称为半对数模型。 把形式为:
ln y 0 1 ln x u
即可利用多元线性回归分析的方法处理了。
例如,描述税收与税率关系的拉弗曲线:抛物线 t = a + b r + c r2 c<0
t:税收;
r:税率
设 z1 = r, z 2 = r2, 则原方程变换为 s = a + b z1 + c z 2 c<0
例 某生产企业在1981-1995年间每年的产量和总成本如下 表,试用回归分析法确定其成本函数。
表5-1 墨西哥的实际GDP、就业人数和实际固定资本
年份 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 GDP 114043 120410 129187 134705 139960 150511 157897 165286 178491 199457 212323 226977 241194 260881 277498 296530 306712 329030 354057 374977 就业人数 8310 8529 8738 8952 9171 9569 9527 9662 10334 10981 11746 11521 11540 12066 12297 12955 13338 13738 15924 14154 固定资产 182113 193749 205192 215130 225021 237026 248897 260661 275466 295378 315715 337642 363599 391847 422382 455049 484677 520533 561531 609825
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可分别表示1990年前与1990年后的储蓄函数。
在统计检验中, 如果3=0的假设被拒绝,则说明两个时期中储蓄函数的截距不同; (t检验) 如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。 (t检验) 也可以利用F检验,检查3=0, 4=0是否同时成立。
其中:Yi为企业职工的薪金, 1 D Xi为工龄, 0 企业女职工的平均薪金为:
男性 女性
E (Yi | X i , Di 0) 0 1 X i
企业男职工的平均薪金为:
E (Yi | X i , Di 1) ( 0 2 ) 1 X i
②例2:多个虚拟变量的设定和引入 ——一种因素多种状态(水平):
例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平 的回归。
教育水平考虑三个层次:
高中以下, 高中, 大学及其以上。
这时需要引入两个虚拟变量:
1 D1 0 高中 其他 1 D2 0 大学及其以上 其他
模型可设定如下:
Yi 0 1 X i 2 D1 3 D2 i
储蓄-收入关系是否发生改变,可利用虚拟变量模型来 解决。
将1990年前与1990年的观测值合并,并用以估计 以下回归:
Yi 1 2 X i 3 Di 4 ( Di X i ) i
1 Di为引入的虚拟变量: D 0
90年后 90年前
于是有:
E (Yi | Di 0, X i ) 1 2 X i
如,设
1 正常年份 Dt 消费模型可建立如下: 0 反常年份
Ct 0 1 X t 2 Dt X t t
• 这里,虚拟变量D以与X相乘的方式引入了模型中, 从而可用来考察消费倾向的变化。 • 假定E(i)= 0,上述模型所表示的函数可化为:
反常年份:
E (Ct | X t , Dt 0) 0 1 X t
Y 0 1 X u
Y 0 1 X 2 D u
1 城镇 D 0 农村
如果引入两个虚拟变量:
1 城镇 D1 0 农村
回归模型为:
1 农村 D2 0 城镇
Y 0 1 X 2 D1 3 D2 u
对任意家庭都有: D1 D2 1 0 产生完全多重共线 性,陷入“虚拟变量陷阱” 虚拟变量陷阱的实质是:完全多重共线性
(1)多项式建模方法
在模型中出现解释变量的二次项。例如:
Y 1 2 X 3 X 2 u
此时边际消费倾向为: 2 23 X
应该采用几次多项式?
X的阶数越高,越灵活。但是也加入了更多 的回归变量,会降低系数估计的精度。 要权衡灵活性和统计精确度。不要一味追 求高的项数,足够就行。 可以通过t检验帮助确定。直到所有阶数的 系数都显著为止
• 问题:
– 虚拟变量为何只选“0‖, ‗1―,选择0,1,2 等可 以吗 – 同一种属性,两个变量能够表示几种状态?
③多个虚拟变量的引入——多种因素
例如:在上述职工薪金的例中,再引入代表学历的虚拟变量 D2:
1 男性 D1 0 女性
1 D2 0
本科及以上学历 本科以下学历
第三章 经典
一、非线性回归模型
两个角度: 1、非线性模型如何处理? 2、变量之间是非线性关系,如何建模?
1、非线性模型的处理 —通过函数变换,化为线性形式。然后求解 例子:
多项式函数模型
Yi 1 2 X i 3 X i2 k X ik 1 ui
ˆ 3、 testscore 6.336 0.055ln( Income) ln 表示收入增加1%时,预计成绩提高0.0554%
如何比较对数设定形式?
被解释变量相同时,可以根据拟合优度进 行比较。 但被解释变量形式不同,一个是Y,一个是 ln(Y)时,无法比较。此时是根据经济理论 和对问题的实践认知,决定采用对数形式 是否合适。 注意我们检验的三个层次。 当采用ln(Y)时,直接对ln(Y)做预测,但对 于Y 的预测则需要一些技巧。
双曲函数模型
1 1 1 2 u Y X
半对数函数模型
Y 1 2 ln X u
双对数函数模型
ln Y 1 2 ln X u
S型成长曲线模型
1 Y 1 2 e X u
先对模型进行某种数学变换后,再利用直接变 换的方法。 如:C-D 生产函数
•注意:加法方式引入虚拟变量,考察了截距的不同。 但注意到,此时不同性别的人的学历差距对工资的 影响一样。这是一个较强的约束。 如何处理这种非线性效应: 回顾非线性效应的处理 •一个解释变量的边际效应有时可能要依赖于另 一个解释变量。 •交互作用的引入方法:在模型中引入相关变量 的乘积。(对于数量变量,和虚拟变量都适用)
例:性别和留学经历,以及工龄对工资的影响研究。
Y 1 2 X 1 3 D1 4 D2 5 D1D2+u
Y —表示工资收入 X 1—表示工龄 D1—表示性别的虚拟变量,男性=1,女性=0 D 2 —表示是否留学的虚拟变量,留学人员=1,非留学人员=0
• 检验交互效应是否存在?即检验:
③ 有截距项VS没有截距项的虚拟变量模型
(3)自变量的交互作用
(以两个连续型自变量为例)
Y=0 1 X1 2 X 2 3 X1 * X 2 u
Y表示收入的对数 X1表示工作经验 X2表示受教育的年数
年资的边际影响:b1+b3*X2 教育的边际影响:b2+b3*X1
(4)一个综合的例子
• Translog模型(C-D生产函数的扩展)
Y AL K e
u
并非所有非线性模型都可以通过间接代换变为 线性模型的。
2、如何处理非线性效应
引例:
Y 1 2 X 1 u
Y 1 2 X1 3 X 2 u
隐含的假设边际效应(比如边际消费倾向)为常 数。 这在实际中可能并不成立,边际效应可能与X1,或 者X2的水平有关。 如何建模?
E (Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
•女职工本科以上学历的平均薪金:
E (Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i
•男职工本科以上学历的平均薪金:
E (Yi | X i , D1 1, D2 1) ( 0 2 3 ) 1 X i
职工薪金的回归模型可设计为:
Yi 0 1 X i 2 D1 3 D2 i
于是,不同性别、不同学历职工的平均薪金分别为:
•女职工本科以下学历的平均薪金:
E (Yi | X i , D1 0, D2 0) 0 1 X i
•男职工本科以下学历的平均薪金:
log(Y ) 0 1 log( K ) 2 log( L) 3 log ( K ) 4 log ( L) 5 log( K ) *log( L)
2 2
二、虚拟变量
1、虚拟变量的定义 2、虚拟变量引入 3、虚拟变量的综合应用 4、虚拟变量引入的原则
1、虚拟变量的定义
(2)对数建模方法
三种对数回归模型
Y 1 2 ln X u
lnY 1 2 X u ln Y 1 2 ln X u
因变量 Y Y log Y log Y
自变量 X logX X logX
参数 含义 Y对X的斜率,(常边际效应) ) 100 X增加一单位,Y变化的百分比(100%) Y对X的弹性,(常弹性) X增加1%,Y改变的单位。(
ˆ 1、testscore 557.8 36.42 ln( Income) 表示收入增加1%时,测试成绩提高0.01*36.42=0.36分。
2、 earnings) 2.655 0.0086age ln( (对大学毕业生的调查)年龄每增加1岁, 预计收入增加100*0.0086)%=0.86%
OLS法得到该模型的回归方程为:
Y 0 1 X 2 ( X X * ) D u
居民消费方程: 1979年以前,Y 0 1 X u 1979年以后,Y 0 2 X * ( 1 2 ) X u
3、虚拟变量的应用
• 利用虚拟变量,可以检验结构的变化 • 为什么不简单的将数据分成两段?
1 D 0
本科及以上
本科以下
反映性别的虚拟变量可取为:
1 D 0
男性 女性
2、虚拟变量的引入
虚拟变量做为解释变量引入模型的方式:
加法方式——调整截距 乘法方式——调整斜率 加法和乘法方式——同时调整截距和斜率
(1)加法方式 ①例1:一种因素两种状态
Yi 0 1 X i 2 Di i
在E(i)=0 的初始假定下,高中以下、高中、大学及其以上教育水平 下个人保健支出的函数:
• 高中以下: E (Yi | X i , D1 0, D2 0) 0 1 X i E (Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i • 高中: • 大学及以上 E (Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i
H 0 : 5 0 H1 : 5 0
(2) 乘法方式
• 乘法方式引入虚拟变量时,将虚拟变量 与其他解释变量(或者定量变量X,或 者其他虚拟变量D)的乘积,作为新的 解释变量出现在模型中。 • 达到调整设定模型斜率的目的。