显著性检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

显著性检验

T检验

零假设,也称稻草人假设,如果零假设为真,就没有必要把X纳入模型,因此如果X确定属于模型,则拒绝零假设Ho,接受备择假设H1,

(Ho:B2=0 H1:B2≠0)

假设检验的显著性检验法:

t=(b2-B2)/Se(b2)服从自由度为(n-2)的t分布,如果令Ho:B2=B2*,B2*是B2的某个数值(若B2*=0)则t=(b2-B2*)/Se(b2)=(估计量—假设值)/假设量的标准误。可计算出的t值作为检验统计量,它服从自由度为(n-2)的t分布,相应的检验过程称为t检验。

T检验时需知:①,对于双变量模型,自由度为(n-2);②,在检验分析中,常用的显著水平α有1%,5%或10%,为避免选择显著水平的随意性,通常求出p值,p值充分小,拒绝零假设;③可用半边或双边检验。

双边T检验:若计算的ItI超过临界t值,则拒绝零假设。

显著性水平临界值t

0.01 3.355

0.05 2.306

0.10 1.860

单边检验:用于B2系数为正,假设为Ho:B2<=0, H1:B2>0

显著性水平临界值t

0.01 2.836

0.05 1.860

0.10 1.397

F检验(多变量)(联合检验)

F=[R2/(k-1)]/(1-R2)(n-k)=[ESS(k-1)]/RSS(n-k).n为观察值的个数,k 为包括截距在内的解释变量的个数,ESS(解释平方

和)= ∑y^i2RSS(残差平方和)= ∑ei2TSS(总平方

和)= ∑yi2=ESS+RSS.判定系数r2=ESS/TSS

F与R2同方向变动,当R2=0(Y与解释变量X不想关),F为0,R2值越大,F值也越大,当R2取极限值1时,F值趋于无穷大。

F检验(用于度量总体回归直线的显著性)也可用于检验R2的显著性—R2是否显著不为0,即检验零假设式(Ho:B2=B3=0)与检验零假设R2为0是等价的。

虚拟变量

虚拟变量即定性变量,通常表明具备或不具备某种性质,虚拟变量用D表示。

方差分析模型:仅包含虚拟变量的回归模型。

若:Yi=B1+B2Di+Ui,Di—1,女性;—0,男性

B2为差别截距系数,表示两类截距值的差异,B2=E(Yi/Di=1)-E(Yi/Di=0) 通常把取值为0的一类称为基准类、基础类、参照类、比较类,研究结论与基准类的选择没有关系。

定型变量有m种分类时,则需引入(m-1)个虚拟变量,否则会陷入虚拟变量陷阱即完全共线性或多重共线性。

多重共线性

例:收入变量(X2)完全线性相关,而R2(=r2)=1

解释变量之间完全线性相关或者完全多重共线性时,不可能获得所有参数的唯一估计值,因而不能根据样本进行任何统计推断。

多重共线性产生的原因:1经济变量变化趋势的同向性2解释变量中含有之后变量

多重共线性的理论后果:①,在近似共线性的情况下,OLS估计量仍是无偏的②近似共线性并未破坏,OLS估计量的最小方差性③即使在总体回归方程中变量x之间不是线性相关,但在某个样本中,x变量之间可能线性相关。

多重共线性的实际后果:①OLS估计量的方差和标准误较大②置信区间变宽

③t值不显著④

R2值较高⑤OLS的估计量及其标准误对数据的微小变化敏感,他们不稳定⑥回归系数符号有误⑦难以评估多个解释变量对回归平方和(ESS)或R2的贡献

异方差:

(同)等方差:例如,对于不同的个人可支配收入,储蓄的方差保持不变异方差:例如,对于不同的个人可支配收入,储蓄的方差并不相等,它随着个人可支配收入增加而变大。异方差问题多存在于截面数据而非时间序列数据。

异方差的后果:①OLS估计量仍是线性的②OLS估计量是无偏的③OLS估计量不再具有最小方差性,即不再是有效的,OLS估计量不再是最优线性无偏估计量④OLS估计量的方差通常是有偏的⑤偏差的产生是由于б^2,即

∑ei2(d•f不再是真实б2的无偏估计量)⑥建立在t分布和F分布上的置信区间和假设检验是不可靠的

自相关

自相关:按时间(如时间序列数据)或者空间(如截面数据)排列的观察值之间的相关关系。自相关通常与时间序列数据有关

自相关的产生原因:①惯性②模型设定误差③蛛网现象④数据处理

自相关的后果:①最小二乘估计量仍是线性的和无偏的②最小二乘估计量不是有效的,OLS估计量并不是最优线性无偏估计量(BLUE)③OLS估计量的方差是有偏的④通常所用的t检验,F检验是不可靠的⑤计算得到的误差方б^2=RSS/ d•f是真实的б^2的有偏估计量,并且很可能低估了真实的б^2⑥通常计算的R2不能测度真实的R^2⑦通常计算的预测方差和标准误也是无效的。

模型选择:

(1)好的模型具有的性质:简约性;可识别性;拟合优度;理论一致性;(2)设定误差的类型:遗漏相关变量;包括不必要变量;采用错误的函数形式;

度量误差(3)各种设定误差的后果:遗漏相关变量,过低拟合模型;包括不相关变量,过度拟合模型;度量误差:1、因变量中的度量误差,OLS 估计量是无偏的,OLS估计量的方差也是无偏的。但是估计量的估计方差比没有度量误差时的大。因为应变量中的误差加入到了误差项ui中。2、解释变量中的度量误差,OLS估计量是有偏的,OLS估计量也是不一致的。即使样本容量足够大,OLS估计量仍然有偏

二元线性回归模型过原点与不过原点的原因:(1)无截距模型是用原始的平方和以及交叉乘积,而有截距模型则使用了均值调整后的平方和以及交叉乘积。(2)无截距中^σ^2的自由度是(n-1)不是(n-2),(3)有截距中

r^2计算公式通常假定了模型中存在截距项(4)有截距模型的残差平方和,∑^ui=∑ei总为零,无截距不一定为零

填空题:(1)若B2=0,则b2/se(b2)=t;(2)若B2=0,则t=b2/se(b2) (3)r^2位于0与1之间,r位于-1到1之间;(4)TSS=RSS+ESS (5)TSS的自由度=ESS的自由度+RSS的自由度(5)^σ称为估计量的标准差(6)在双对数模型中,斜率度量了弹性;(7)在线性-对数模型中,斜率度量了解释变量每百分比变动引起的被解释变量的变化量;(8)在对数-线性模型中,斜率度量了增长量;(9)Y对X的弹性定义为dY(X)/dX(Y) (10)价格弹性的定义为价格每变动1%所引起的需求量变动的百分比(11)需求成为富有弹性的,如果价格弹性的绝对值大于1;需求称为缺乏弹性的,如果价格弹性的绝对值小于1 (12)在接近多重共线性的情况下,回归系数的标准误趋于大,t值趋于小(13)在完全多重共线性的情况下,普通最小二乘估计量是没有定义的,其方差是没有定义的(14)在其他情况不变的情况下,VIF越高,则普通最小二乘估计量的方差越高。

多选

ESS(解释平方和):估计的Y 值围绕其均值的变异,也称回归平方和(由解释变量解释的部分)

RSS(残差平方和),即Y变异未被解释的部分

模型设置的误差:遗漏相关变量,包括不必要变量,采用了错误的函数形式,度量误差

评价模型的好坏:简约性,可识别性,拟合优度,理论一致性,预测能力

一元线性回归的假设条件;1平均干扰为0,2随机干扰项等方差,3随机干扰项不存在序列相关4干扰项与解释变量无关

判断

2随机误差项ui与残差项ei是一回事

2总体回归函数给出了与自变量每个相对应的应变量的值

2线性回归模型意味着模型变量是线性的

2在线性回归模型中,解释变量是因,应变量是果

2随机变量的条件均值与非条件均值是一回事

2式(2-2)中的回归系数B是随机变量,但式(2-4)中的b是参数

2式(2-1)中的斜率B2度量了X的单位变动引起的Y的斜率

3实践中双变量 2 OLS就是使误差1计算ols估量 1 高斯-马尔柯夫定理

2在双变回模中,扰动项 1 只有当ui服从正态分布1r^2=ESS/TSS

2给定显著水平a与自由的2相关系数r与b同号 3 p值和显著水平

1仅当非校正判定系数 2 判定所以解释变量2当r^2=1 1当自由度>120

1在模型Yi=B1+B2…2估计的回归系数是统计显著2要计算t 2多元回归的总体显著性

3就估计和假设检验而言 1 无论模型中包括多少个1双对数模型1LIV模型的斜率系数

1 双对数模型的r^2可以1线性-对数模型的R^

2 2模型A:LnY= 2在模型Yi=

2引入虚拟变量后2 尽管存在完全1在高度多重共线性的情况下3如果辅

相关文档
最新文档