计量经济学重点笔记第三讲样本
计量经济学复习笔记

计量经济学复习笔记第⼀章统计概念1.什么是计量经济学计量经济学是对经济的测度,利⽤经济理论、数学、统计推断等⼯具对经济现象进⾏分析的⼀门社会科学。
2.计量经济学的⽅法论(计量经济分析步骤)(1)建⽴理论假说。
(2)收集数据。
(3)假定数学模型。
(4)设⽴统计或计量模型。
(5)估计经济模型参数(6)核查模型的适⽤性:模型设定检验。
(7)检验源⾃模型的假定(8)利⽤模型进⾏预测4.数据类型(1)时间序列数据:按时间跨度获得的数据。
特征是⼀般变量如、下标为t。
(2)截⾯数据:同⼀时点上的⼀个或多个变量的数据集合。
如:各地区2002年⼈⼝普查数据。
(3)合并数据:既包括时间序列数据有包括截⾯数据。
例:20年间10个国家的失业数据。
20年失业数据是时间序列,10个国家⼜是截⾯数据。
(4)⾯板数据:同⼀个横截⾯的单位的跨期调查数据。
例:对相同的家庭数量在⼏个时间间隔内进⾏的财务状况调查。
5.理解回归关系回归关系是⼀种统计上的相关关系,并不意味着⾃变量和因变量之间存在着因果关系。
第⼆章线性回归的基本思想1.回归分析的含义: 回归分析是反映的⾃变量和因变量之间的统计关系,回归分析是在⾃变量给定条件下的因变量的变化,是⼀种条件回归分析E(|)=+2.随机误差项的性质(为什么要引⼊随机误差项)(1)随机误差项代表着未纳⼊模型变量对因变量的影响(2)即使模型包括了影响因变量的所有因素,模型也有不可避免的随机性。
(3)还代表着度量误差(4)模型设定应该尽可能简单,只要不遗漏重要变量,把因变量的次要影响因素归于随机项。
(奥卡姆剃⼑原则)3.参数估计⽅法———普通最⼩⼆乘法的基本思想选择参数使得残差平⽅和最⼩——Min =Min ()=Min ()4.根据Ols 法得出参数称为最⼩⼆乘估计量,最⼩⼆乘估计量的性质:(1)Ols ⽅法获得样本回归直线过样本均值点(,)(2)残差的均值总为0,(3)残差项与解释变量的乘积求和为0,即残差项与解释变量不相关。
学习笔记:伍德里奇《计量经济学》第五版-第三章 多元回归分析:估计

y = b 0+ b 1x 1+ b 2x 2+ . . . b k x k + u一、多元线性回归模型1.我们可以研究控制一些变量不变的条件下,其他变量对y的影响,而不是假定他们不相关。
Cons = b 0+ b 1inc+b 2inc 2 +u2.我们还能推广变量之间的函数关系如:通过在模型中包含更多的变量,我们更好的达到了SLR.4所表达的目的E(u|x 1,x 2, …,x k ) = 0 (3.8)HYP.1一般多元回归模型的关键假定(u和所有x都不相关):( )仍然是最小化残差和:对(3.12)求k +1次偏导得一阶条件(交给计算机计算)(此时假定k +1个方程只能得到估计值得唯一解2.1 如何得到OLS 估计值例3.1分析两个系数时,可得出当我们把其中一个因素涵盖在模型中时,另外一个因素的预测就变得不有力了1.系数表示局部效应(控制其他变量不变时,对y的效应)多元回归分析给了我们在收集不到“其他条件不变”时的数据仍有同样效果的能力2.“控制其他变量不变”的含义3.同时改变不止一个自变量(只需要将效应加和)2.2 对OLS 回归方程的解释从单变量情形加以推广,得:1.残差的样本平均值为02.每个自变量和OLS 残差之间的样本协方差为0。
因此OLS 拟合值和OLS 残差之间的样本协方差也为03.点总位于OLS 回归线上(性质1. 2.由一阶条件得,性质3.由1.可得2.3 OLS 的拟合值和残差( )其中 是x1对其他变量回归后的残差(即排除其他变量对x1的影响,类似矢量正交)2.4 对“排除其他变量影响”的解释( )(是 对 简单回归的斜率1.样本中x2对y的偏效应为0,即2.x1和x 2不相关,即(1. 2.可解释、 的差异由(3.23)知,在两种情况下利用矢量正交的理解考虑简单回归和两个自变量的回归:2.5简单回归和多元回归估计值比较可以证明,R2的另一种理解是 的实际值与其拟合值 的相关系数的平方,其中2.6 拟合优度(与简单回归大致相同)二、普通最小二乘法(多元线性回归模型的代数特征和对方程的解释)使用提示:1.该笔记是对伍德里奇《计量经济学》第五版第三章学习过程中的内容梳理2.由于本人水平有限,单独看该笔记估计会很吃力,且很可能出现错误,建议结合书本进行理解3.希望能够对想学习计量经济学的人起到一点点帮助第三章多元回归分析:估计2020年3月19日10:47由于定义下增加解释变量不会降低R2,所以判断一个解释变量是否应该放入模型的依据应该是该解释变量在总体中对y的偏效应是否非02.7 过原点的回归1.之前推导的性质不再成立,特别是OLS残差的样本平均值不再是02.计算R2没有特定的规则3.当截距项b0不等于0,斜率参数OLS估计量将有偏误;当截距项b0=0,估计带截距项方程的代价是,OLS斜率估计量的方差会更大2.8 OLS估计量的期望值MLR.1(线性于参数)MLR.2(随机抽样)MLR.3(不存在完全共线性,允许一定程度的相关)(在定义函数时要小心不要违背了MLR.3MLR.4(条件均值为0)(内生解释变量:解释变量可能与误差项相关定理3.1 OLS的无偏性()2.9 过度设定和设定不足(多了无关变量和少了解释变量)2.9.1过度设定(不影响OLS估计量的无偏性,但影响OLS估计量的方差)2.9.2设定不足1.简单情形:从一个斜率参数到两个斜率参数由(3.23):取均值得偏误为:(因此偏误的方向取决于两个符号,偏误的大小取决于两者之积,在应用中可以通过常识来判断偏误方向2.扩展情形:从两个斜率参数到三个斜率参数当你假设和不相关时,就可以证明和的关系和简单情形一样2.10 OLS估计量的方差MLR.5(同方差性,不仅可以简化公式,还得到了有效性)定理3.2 OLS斜率估计量的抽样方差在MLR.1-5下,以自变量的样本值为条件,有()(是的总样本波动,则是对所有其他自变量(并包含一个截距项)回归所得到的由(3.51)可知,估计量的抽样方差由三个要素决定:1.误差方差(噪声越大,越难估计)2.的总样本波动(越分散,越容易估计)3.自变量之间的线性关系(和其他自变量相关性越高,越不利于估计(很高的并不一定有问题,抽样方差的大小还要取决于剩下两个因素,可以通过收集更多的数据来削减多重共线性(当考虑某一个自变量 的方差时,若 和其他自变量均无关,那么其他自变量间的关系是不造成影响的,某些经济学家为了分离特定变量的因果效应,而在模型中包括许多控制因素,但这并不影响因果效应的证实( )当含有两个解释变量时:( )当含有一个解释变量时:((3.54)和(3.55)表明除非样本中x1和x2不相关,否则 <1.当 =0时,两个都无偏,但 < ,所以前者更好2.当不等于0时,不放x 2进去会导致有偏,放了x 2进去会导致方差增加,但我们喜欢把x2放进去的理由是:不放进去的偏误不会随着样本容量扩大而缩减,而放进去增加的方差却会随着样本容量的扩大逐渐缩小至0所以有两个结论:2.10.1 过度设定的方差(建立在过度设定无偏讨论的基础上)( )2.10.2 OLS 估计量的标准误(与简单回归相同)在假定MLR.1-5下,有(MLR .5若不满足(即异方差),会使标准误失效(第二种表达清楚说明了随着样本容量的扩大,在其他三项( 、 、 )都趋于常数的时候,估计量标准误是如何变小的因此得估计量的标准误:定理3.3 的无偏估计OLS 估计量是最优线性无偏估计量(如(3.22)所示的线性、无偏误、在线性无偏估计量中方差最小在MLR.1-5下,得定理3.4 高斯-马尔科夫定理2.11 对OLS 估计的一个正确认识。
计量经济学复习笔记

2023计量经济学笔记PERSONAL NOTES计量经济学笔记目录CH1导论 (3)CH2简单线性回归模型 (5)CH3多元线性回归模型 (11)CH4多重共线性 (14)CH5异方差 (16)CH6自相关 (19)CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:●模型设定——确定变量和数学关系式●估计参数——分析变量间具体的数量关系●模型检验——检验所得结论的可靠性●模型应用——做经济分析和经济预测3、模型(1)变量A.解释变量:表示被解释变量变动原因的变量,也称自变量,回归元,X。
B.被解释变量:表示分析研究的对象,变动结果的变量,也成应变量,Y。
C.内生变量:其数值由模型所决定的变量,是模型求解的结果。
D.外生变量:其数值由模型意外决定的变量。
(外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
)E.前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响,但能够影响我们所研究的本期的内生变量。
F.前定变量:前定内生变量和外生变量的总称。
(2)数据●时间序列数据:按照时间先后排列的统计数据(t)。
●截面数据:发生在同一时间截面上的调查数据(i)。
●面板数据:时间序列数据和截面数据结合的数据(t,i)。
●虚拟变量数据:表征政策,条件等,一般取0或1(d).4、估计评价统计性质的标准无偏:E(^β)=β有效:最小方差性一致:N趋近无穷时,β估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比6、计量经济学的研究过程CH2简单线性回归模型一、相关知识点:1、变量间的关系分为函数关系与相关关系(相关系数是对变量间线性相关程度的度量。
(完整版)计量经济学重点知识归纳整理

1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
计量经济学第三章完整

Xe 0
(*)
或
ei 0
(**)
X ji ei 0
i
(*)或(**)是多元线性回归模型正规方程组的另一种 写法
16
⃟样本回归函数的离差形式
yi ˆ1x1i ˆ2 x2i ˆk xki ei 其矩阵形式为
i=1,2…n
y xβˆ e
其中 :
y1
y
y2
y
n
x11
E(Yi | X1i , X 2i , X ki ) 0 1 X1i 2 X 2i k X ki
方程表示:各变量X值固定时Y的平均响应。
j也被称为偏回归系数,表示在其他解释变量
保持不变的情况下,Xj每变化1个单位时,Y的均 值E(Y)的变化;
或者说j给出了Xj的单位变化对Y均值的“直接”
1
1 (YXβˆ )(YXβˆ )
e 2 2
(2
)
n 2
n
即为变量Y的或然函数
26
对数或然函数为
L* Ln(L)
nLn(
2 )
1 2 2
(Y
Xβˆ )
(Y
Xβˆ )
对对数或然函数求极大值,也就是对
(Y Xβˆ )(Y Xβˆ )
求极小值。 因此,参数的最大或然估计为
βˆ (XX)1 XY
28
E(X(Y Xβ) 0
称为原总体回归方程的一组矩条件,表明了原总 体回归方程所具有的内在特征。
1 X(Y Xβˆ ) 0 n
由此得到正规方程组
X' Xβˆ X' Y
解此正规方程组即得参数的MM估计量。
易知MM估计量与OLS、ML估计量等价。
29
矩方法是工具变量方法(Instrumental Variables,IV)和 广义矩估计方法(Generalized Moment Method, GMM) 的基础 • 在矩方法中关键是利用了
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第16~19章)【圣才出品】

第16章联立方程模型16.1 复习笔记考点一:联立方程模型的性质★★当一个或多个解释变量与因变量联合被决定时,模型就会出现内生性问题。
联立方程模型是指从经济理论中推导出来的若干的相关的方程,联立起来就是一个模型,如凯恩斯的国民收入模型等。
联立方程的重要特征:(1)给定多个方程中的外生变量和误差项,所有的方程就决定了剩余的内生变量,因此任一方程的因变量和方程中的内生变量都是SEM的内生变量。
(2)模型中的外生变量的关键假设是与所有的误差项都不相关。
由于这些误差出现在结构方程中,所以它们是结构误差。
(3)SEM中的每个方程自身都应该有一个行为上的其他条件不变解释。
考点二:OLS中的联立性偏误★★★★1.约简型方程考虑两个方程的结构模型:y1=α1y2+β1z1+u1y2=α2y1+β2z2+u2专门估计第一个方程。
变量z1和z2都是外生的,所以每个都与u1和u2无关。
如果将式y1=α1y2+β1z1+u1的右边作为y1代入式y2=α2y1+β2z2+u2中,得到(1-α2α1)y2=α2β1z1+β2z2+α2u1+u2为了解出y2,需对参数做一个假定:α2α1≠1这个假定是否具有限制性则取决于应用。
如果上式的条件成立,y2可写成y2=π21z1+π22z2+v2其中,π21=α2β1/(1-α2α1)、π22=β2/(1-α2α1)和v2=(α2u1+u2)/(1-α2α),用外生变量和误差项表示y2的方程y2=π21z1+π22z2+v2是y2的约简型。
参数π21和π1被称为约简型参数,它们是结构方程中出现的结构型参数的非线性函数。
22约简型误差v2是结构型误差u1和u2的线性函数。
因为u1和u2都与z1和z2无关,所以v2也与z1和z2无关。
因此,可用OLS一致地估计π21和π22。
2.联立性偏误及其方向在约简型方程中,除非在特殊的假定之下,否则对方程y1=α1y2+β1z1+u1的OLS估计,将导致α1和β1的估计量有偏误和不一致。
(完整word版)计量经济学复习笔记

计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:模型设定一一确定变量和数学关系式估计参数一一分析变量间具体的数量关系模型检验一一检验所得结论的可靠性模型应用一一做经济分析和经济预测3、模型变量:解释变量:表示被解释变量变动原因的变量,也称自变量,回归元。
被解释变量:表示分析研究的对象,变动结果的变量,也成应变量。
内生变量:其数值由模型所决定的变量,是模型求解的结果。
外生变量:其数值由模型意外决定的变量。
外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响, 但能够影响我们所研究的本期的内生变量。
前定变量:前定内生变量和外生变量的总称。
数据:时间序列数据:按照时间先后排列的统计数据。
截面数据:发生在同一时间截面上的调查数据。
面板数据:虚拟变量数据:表征政策,条件等,一般取0或1.4、估计评价统计性质的标准无偏:E (人3 )= 3 随机变量,变量的函数?有效:最小方差性一致:N趋近无穷时,3估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比CH2 CH3线性回归模型模型(假设)一一估计参数一一检验一一拟合优度一一预测1、模型(线性)(1)关于参数的线性模型就变量而言是线性的;模型就参数而言是线性的。
Yi = 3 1+ 3 2lnX i+u线性影响随机影响Y i=E (Y|X i) +u E (Y|X i) =f(X i)= 3 1+3 2lnX 引入随机扰动项,(3)古典假设A零均值假定 E ( U i |X i) =0B同方差假定Var(u i|XJ=E(u i2)=2(TC无自相关假定Cov(u i ,u j)=0D随机扰动项与解释变量不相关假定Cov(u i ,X i )=0E正态性假定u~N(0, d 2)F无多重共线性假定Rank(X)=k2、估计在古典假设下,经典框架,可以使用OLS方法:OLS 寻找min Ee i2人B iois = (Y均值)-人B 2(X均值)人B 2ois = Ex i y〃Ex i23、性质OLS回归线性质(数值性质)(1)回归线通过样本均值(X均值,Y均值)(2)估计值人Y的均值等于实际值Y的均值(3)剩余项e i的均值为0(4)被解释变量估计值人Y与剩余项8不相关Cov(人Y,ej=0(5)解释变量X与剩余项8不相关Cov(e i,X i)=0在古典假设下,OLS的统计性质是BLUE统计最佳线性无偏估计4、检验(1) Z检验Ho: B 2=0原假设验证B 2是否显著不为0标准化:Z= (A B 2- B 2) /SE (A B 2)〜N( 0,1 ) 在方差已知,样本充分大用Z检验拒绝域在两侧,跟临界值判断,是否B2显著不为0(2) t检验一一回归系数的假设性检验方差未知,用方差估计量代替 A d 2=Ee i2/(n-k) 重点记忆t =(人卩2- B 2) / A SE (A B 2)〜t (n-2)拒绝域:|t|>=t 2/a( n-2)拒绝,认为对应解释变量对被解释变量有显著影响。
计量经济学笔记

解释变量观测值的平均值和被解释变量观测值的平均值处于 OLS 回归线上。
将被解释变量取值 yi 分解成拟合值和残差两个部分,������! = ������! + ������!。定义总体平方和 SST
N
2
∑ 为 ( yi − y) ,解释平方和 SSE 为 !!!!(������! − ������)!,残差平方和 SSR 为 !!!!(������!)!,则可定义
∑ 1
N
N
u
2 i
,但是由于
ui
是非观测值,所以我们可以用残差
u
来代替,但此时由于假定
1,2
i =1
∑ 对残差做了限制,所以这里的自由度是
N-‐2
而不是
N,即 σ2
=
1 N −2
N i=1
u i2
。将此估计量放
入到对 β1 的估计量的样本方差公式中就可以得到有关 β1 样本方差的无偏估计量。
Assumption 1-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐ E( y − β0 − β1x) = 0 Assumption 2-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐ E(x( y − β0 − β1x)) = 01
该无偏性应是以x!, … ,x!为条件的无偏性。但是对于横截面数据,在 Assumption2 的随机
抽样假定下,由于(x!, … ,x!)提供的信息集和 xi 提供的信息集一样都是总体的信息集,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三讲 假设检验
一、 经典线性模型假定
对于模型01i i
i y x ββε=++, 利用OLS 有: 112()ˆ()
i i i x x x x εββ-=+-∑∑ 其证明可参见第二讲附录。
在高斯-马尔科夫假定下, OLS 估计量的抽样分布完全取决于误差项的分布。
在高斯-马尔科夫假定中, 我们要求误差项是序列无关与同方差的。
现在, 我们施加更强的假定, 即误差项服从正态分布, 即2(0,)i N δε。
应该注意到, 当误差项服从正态分布时, 序列无关与独立性是等价的。
因此, 我们能够把
上述分布假设写为: ..2(0,)i i d
i N δε, 即误差项服从独立同正态分布。
为什么
要施加更强的假定呢? 这是为了进行小样本下的假设检验。
2(0,)i N δε与高斯-马尔科夫假定一起, 被称为经典线性模型假定。
在经典线性模型假定下, 能够证明, OLS 估计量是方差最小的无偏估计量( 注意此时不需要把比较范围限制在线性估计量之中, 因此该结论比高斯-马尔科夫定理更强。
施加更多的假设而得到更强结论, 这非常自然! ) 。
笔记:
1、 假设误差项服从正态分布的合理性在于, 误差项是由很多因素构成的, 当这些因素是独立同分布时, 依照中心极限定理, 那么这些因素之和应该近似
服从正态分布。
当然, 这并不意味着用正态分布来近似误差项的分布总是恰当的, 例如, 各因素或许并不同分布。
另外, 如果y 是价格这样的变量, 那么假设误差项服从正态分布是不合理的, 因为价格不可能是负数, 不过我们能够进行变量变换, 例如对价格取自然对数或者考察价格的变化率, 那么经过变量变换之后, 或许再假设误差项服从正态分布就变得合理了。
2、 如果能够对误差项是否服从正态分布进行检验, 那最好不过了。
一种常见的检验方法是Jarqe-Bera 检验, 这能够参见相关的教科书。
问题是, 尽管我们能观察到解释变量、 被解释变量的取值, 然而, 由于对参数的真实取值无法确定, 因此误差是观测不到的, 我们或许不得不利用残差来代替误差以进行相关的检验。
当然, 一个前提是残差确实是对误差的良好近似, 这进而要求, 我们对参数的估计是合理的。
3、 根据公式:
111221()()1ˆ()()i i i i i i
N x x N x x x x x x εεβββ=•--=++--∑∑∑∑ 考虑x 非随机这种简单情况, 显然, 当样本容量很大时, 只要误差项是独立同分布的( 并不需要要假定误差项服从正态分布) , 那么根据中心极限定理, 1ˆβ应该近似服从正态分布。
当然, 为了保证误差项的独立性, 抽样的随机性十分关键。
二、 利用标准正态分布作假设检验
假定01i i
i y x ββε=++是真实模型, 当然我们并不知道各参数的真实值是多少。
如果某一经济经济理论预言1ωβ=, 而现在你手中正掌握一样本, 一个问题是, 你所掌握的样本支持这个预言吗?
笔记:
由于抽样误差的存在, 1ˆβ恰好等于ω的概率很小。
然而, 即使1
ˆωβ=, 我们也不能说理论被证实, 因为计量经济学方法本质上是属于归纳法, 而且由于其结论是基于某一样本而得到的, 因此它还是属于不完全归纳, 故, 计量经济学不能证实经济学理论。
当然, 计量经济学也不能推翻经济学理论。
经济学理论是逻辑推导, 其正确与否需要从逻辑入手。
总而言之, 我们能够说的是”样本
是否支持某个理论的预言”或者”样本与某个理论的预言是否一致”。
在经典线性模型假定下, 1121ˆˆ(,)N βββδ~或者
111ˆˆ()/()(0,1)sd N βββ-~①, 其中122ˆ2()i x x βδδ=
-∑
,
1
ˆ()sd β=。
练习: 确定0
ˆβ的分布。
现在, 假设经济理论的预言是正确的, 那么针对特定的样本你将得到标准正态分布图横坐标上的一个点: 11
ˆˆ()/()sd βωβ-②。
现在来考察标准正态分布。
在该分布上, 存在对称的两点: 0.025z 与0.025z -, 其中:
0.0250.025Pr()Pr()0.025Z z Z z ≥=≤-=
如果把概率为5%的事件称为小概率事件, 那么, 当
11ˆˆ()/()sd βωβ-的取
①定义111
ˆˆz ()/()sd βββ=-, 则z 就是所谓的z 统计量。
估计量是用来估计真实参数的, 而统计量是用来做统计推断(或者假设检验) 的; 统计量是随机的, 其分布也被称为抽样分布, 针对特定样本, 我们得到统计量值, 它是非随机的。
②在这里, 该式是非随机的, 而特别应该注意的是, 分子中的1
ˆβ是估计值, 而分母中的1
ˆβ是估计量。
估计值的标准差是零! 。
值大于0.025z 或者小于0.025z -时, 我们认为小概率事件发生了! 小概率事件一般是不容易发生的, 现在居然发生了, 因此, 我们应该怀疑上述经济理论所作出的预言。
笔记:
举一个生活中的例子。
我预先认为某一个同学十分优秀。
优秀学生某一次考试考砸了非常正常, 然而连续十次考试考砸了就应该是小概率事件了。
如果我预先所认为的那一个优秀同学确实连续十次考试都考砸了, 我是不是应该对我的先验判断产生怀疑? 当然, 如果我就此认为那一个同学并不优秀, 我也会犯错误, 此即”第一类错误”, 即”弃真”的错误。
但犯这个错误的概率是很小的。
如果优秀学生连续十次考试考砸了其概率是5%, 那么我犯”第一类错误”的概率就是5%。
问题是, 为什么我们取正态分布两端的区间作为小概率区间呢? 为什么我们不在正态分布密度曲线中随意取一小段作为小概率区间?
从直觉上看, 当1ωβ=这个假设为真时, 即使估计值1
ˆβ与ω完全相等不太可能, 但估计值1
ˆβ应该接近于ω。
然而我们也要注意到, 正确1β估计还存在精确性问题, 这经过
1ˆβ统计量的标准差体现出来。
也就是说, 在原假设为真时, 即使估计值1ˆβ与ω有一定的差异, 然而如果1
ˆ()sd β较大, 那么在1
ˆβ与ω间存在一定的可能是正常的。
不过总的来看, 当原假设为真时, z 统计量值是应该接近于0的, 这要么是因为11
ˆˆ()/()z sd βωβ=-中的分子确实接近于0, 要么是因为尽管1ˆβ与ω有一定的差异, 但主要是由1
ˆ()sd β较
大所引起的。
当z 统计量值与0具有较大差异时, 那么
1ωβ=这个假设的真实
性是值得怀疑的!
假设检验的正式步骤是:
( 1) 建立原假设与备择假设: 0111::H H βω
βω
=≠
笔记: 原假设与备择假设互斥; 假设体系应该是完备的, 即原假设与备择假设两者之一必为真, 但两者不能同时为真。
( 2) 确定小概率标准a 。
经常我们把1%、 5%或者10%作为小概率标准。
对a 更加正式的称呼是”显著水平”。
( 3) 考察统计量值11
ˆˆ()/()sd βωβ-是否落在拒绝域: /2/2(,][,)a a z z -∞-⋃+∞之内。
如果落在上述区间之内, 那么在a 显著水平上, 我们拒绝原假设, 接受备择假设; 反之, 我们不拒绝原假设, 拒绝备择假设。
笔记:
1、 为什么当统计量值落在拒绝域/2/2(,][,)a a z z -∞-⋃+∞之外时我们说”不拒绝原假设”而不是说”接受原假设”? 其解释是: 我们能够作出很多的原假设, 例如11βω=或者12βω=而我们所计算出来的一些统计量值恰
好都落在/2/2(,][,)a a z z -∞-⋃+∞之外, 难道我们既接受1
1βω=也接受12βω=? 显然更恰当的表示方式是, 即不拒绝11βω=也不拒绝12βω=。