第7章双变量模型：假设检验

合集下载

医学统计学第7版假设检验步骤

医学统计学第7版假设检验步骤
1. 提出原假设(0)和备择假设(1)
- 原假设通常是要被检验的陈述
- 备择假设是原假设被拒绝时要接受的陈述
2. 选择适当的检验统计量及其在原假设为真时的概率分布
3. 确定显著性水平α
- 通常取0.05或0.01,表示拒绝原假设的最大概率
4. 根据样本数据计算检验统计量的观测值
5. 确定拒绝域
- 拒绝域是原假设被拒绝的取值范围
- 通常利用显著性水平α从概率分布中确定拒绝域
6. 进行判断
- 若观测值落在拒绝域内,拒绝原假设
- 若观测值落在保留域内,无法拒绝原假设
7. 陈述结论
以上是我对医学统计学第7版假设检验步骤的总结,没有直接引用书中内容,希望对您有所帮助。

[农学]B03 假设检验：双变量模型

1 1 1

i
ˆ ) Var( ˆ ) / Se( 1 1
ˆ ) Se( 0
ˆ ) 2 [ X 2 / n ( X X )2 ] Var( i i 0
2 ( X X ) i
2 2 X /[ n ( X X ) ] i i
5
计量经济学
一、误差项的概率分布
1、进行OLS估计时，对误差项的概率分布没有假定。对误差项的假定仅仅是：均值为0、没有自相关且方差相等，有了这些假定，无论误差项的分布为何，OLS估计量均为BLUE。 2、如果研究的目的只是估计参数，OLS方法就可达到目的。但是，OLS估计量是误差项的线性函数，所以OLS估计量的概率分布依赖于误差项分布的假设。没有分布假设，就不可能对估计的参数做出有意义的评价，也不可能进行假设检验。
计量经济学
2、正态变量经过线性变换后仍为正态变量。 3、分布函数仅涉及两个参数：均值和方差。许多现象都大致服从正态分布。 4、对于小样本或有限容量的样本，正态性假定有助于推导出OLS估计量的精确概率分布，而且 2 能够用t、F和分布来对回归模型的性质进行统计检验。 ◎当样本容量较小时，应注意正态性假定是否适当。当样本容量大到合理程度时，或许能够放松正态性假定。
4
计量经济学
第2节

OLS估计的精度：标准误
一、标准误（Standard Error）
1、OLS估计量是样本的函数，评价估计量的可信度或精度的工具是标准误。在CLRM假定下，OLS估计量的标准误为： ˆ ) E( ˆ )2 2 / ( X X )2 Var(
18
计量经济学
五、关于假设检验的说明

第3章_双变量模型：假设检验

Yi = b1 + b2 X i + ui （一元线性）一元线性）
Yi = b1 + b2 X 2i + b3 X 3i + L + ui
（多元线性）多元线性）
2. 解释变量X与扰动项u不相关假定解释变量X与扰动项u
当X是非随机变量，即确定性变量时，该条件是非随机变量，即确定性变量时，自动满足；自动满足；是随机变量时，该假定要求X 不相关。当X是随机变量时，该假定要求X与u不相关。
Yi = b1 + b2 X i + ei
ˆ Yi = b1 + b2 Xi
E （ Y X i ）＝ B1＋ B2 X i
Yi = B1＋B2 X i + ui
双变量模型：假设检验双变量模型：
X是
非随机的随机误差项u是随机的 Y 的生成是在随机误差项( 上加上一个非随机项( 由于Y的生成是在随机误差项( u)上加上一个非随机项( X)，因而Y也就变成了随机变量。就变成了随机变量。于是必须对yi的分布做一番讨论的分布做一番讨论。于是必须对yi的分布做一番讨论。所有这些意味着：只有假定随机误差项是如何生成的，假定随机误差项是如何生成的所有这些意味着：只有假定随机误差项是如何生成的，才能判定样本回归函数对真实回归函数拟合的好坏。回归函数对真实回归函数拟合的好坏。
（博彩支）最小二乘准则
Y 出
Yi
ˆ SRF : Yi = b1 + b2 X i
e1
e3
e2
e4
X4
X
1
X
2
X
3
X(收入收入) 收入
B1、B2的估计

双变量模型之假设检验

ˆ 2 ei2 yi2 ˆ12 xi2 4590020 0.7772 7425000 13402
n2
n2
10 2
Sˆ0 ˆ 2
X
2 i
n
xi2 13402 53650000 /10 7425000 98.41
t
ˆ0 0
因此，定义拟合优度：回归平方和ESS/总离差平方和TSS
2020/2/10
qcc
9
2、可决系数R2统计量
记
R2 ESS 1 RSS
TSS
TSS
称 R2 为（样本）可决系数/判定系数（coefficient of determination)。
可决系数的取值范围：[0，1]
R2越接近1，说明实际观测点离样本线越近，拟合优度越高。
R 2

ˆ12

xi2 yi2
在例收入-消费支出例中，
R2 ˆ12
xi2 yi2

(0.777)2 7425000 0.9766
4590020
注：可决系数是一个非负的统计量。它也是
随着抽样的不同而不同。为此，对可决系数
的统计可靠性也应进行检验。
2020/2/10
2020/2/10
qcc
15
二、变量的显著性检验
回归分析是要判断解释变量X是否是被解释变量Y 的一个显著性的影响因素。
在一元线性模型中，就是要判断X是否对Y具有显著的线性影响。这就需要进行变量的显著性检验。
变量的显著性检验所应用的方法是数理统计学中的假设检验。
计量經濟学中，主要是针对变量的参数真值是否为零来进行显著性检验的。

古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-双变量模型：假设检验(圣才出品)

第3章双变量模型：假设检验3.1 复习笔记一、古典线性回归模型古典线性回归模型假定如下：假定1：回归模型是参数线性的，但不一定是变量线性的。

回归模型形式如下：Y i＝B1＋B2X i＋u i这个模型可以扩展到多个解释变量的情形。

假定2：解释变量X与扰动误差项u不相关。

但是，如果X是非随机的（即为固定值），则该假定自动满足。

即使X值是随机的，如果样本容量足够大，也不会对分析产生严重影响。

假定3：给定X，扰动项的期望或均值为零。

即E（u|X i）＝0（3-1）假定4：u i的方差为常数，或同方差，即var（u i）＝σ2（3-2）假定5：无自相关假定，即两个误差项之间不相关。

即：cov（u i，u j）＝0，i≠j（3-3）无自相关假定表明误差u i是随机的。

由于假定任何两个误差项不相关，所以任何两个Y值也是不相关的，即cov（Y i，Y j）＝0。

由于Y i＝B1＋B2X i＋u i，则给定B值和X值，Y 随u的变化而变化。

因此，如果u是不相关的，则Y也是不相关的。

假定6：回归模型是正确设定的。

换句话说，实证分析的模型不存在设定偏差或设定误差。

这一假定表明，模型中包括了所有影响变量。

二、普通最小二乘估计量的方差与标准误有了上述假定就能够估计出OLS估计量的方差和标准误。

由此可知，教材式（2-16）和教材式（2-17）给出的OLS估计量是随机变量，因为其值随样本的不同而变化。

这种抽样变异性通常由估计量的方差或其标准误（方差的平方根）来度量。

教材式（2-16）和式（2-17）中OLS估计量的方差及标准误是：（3-4）（3-5）（3-6）（3-7）其中，var表示方差，se表示标准误，σ2是扰动项u i的方差。

根据同方差假定，每一个u i具有相同的方差σ2。

一旦知道了σ2，就很容易计算等式右边的项，从而求得OLS估计量的方差和标准误。

根据下式估计σ2：（3-8）其中，σ∧2是σ2的估计量，是残差平方和，是Y的真实值与估计值差的平方和，即()122212var ibiXbn xσσ==∑∑1se()b=()22222varbibxσσ==∑()2se b=22ˆ2ienσ=−∑2ie∑n －2称为自由度，可以简单地看作是独立观察值的个数。

07_双变量模型：假设检验

可以证明，在b1 和b2 的所有无偏估计量中， OLS估计量具有最小方差，且其方差为：
ˆ ) X i 2 var( b1 n xi2 ˆ ) 1 2 var( b2 2 xi
2
其中， 2
为扰动项的方差。

因此，在标准假定之下的回归系数的OLS估计量是最优线性无偏估计量（BLUE）高斯---马尔可夫定理经验证明：蒙特卡罗模拟 p175
（二）回归系数的区间估计：
当用回归标准差估计扰动项方差时，可证明以下统计量服从t分布：
ˆ ˆ ) Xi b1 b1 ˆ t1 ~ t (n 2) 其中，Se(b1 2 n xi ˆ Se(b1 )
2
ˆ b2 b2 t2 ~ t ( n 2) ˆ Se(b2 )
ˆ ˆ ˆ ˆ (Yi Y ) 2 (Yi Yi ) 2 2 (Yi Y )(Yi Yi ) ˆ ˆ (Yi Y ) 2 (Yi Yi ) 2 ˆ (Yi Y ) 2 ei 2
2 ˆ (Yi Y ) ：回归平方和，记为 ESS（explained sum of squares）；
5．无自相关或序列相关（no autocorrelation）假定：不同扰动项之间的协方差为零，即： ui , u j ) 0, i j cov( cov( 该假定等价于： Yi , Y j ) 0, i j
6. 回归模型的设定是正确的，即模型不存在设定偏差 (Specification bias) 或设定误差 (specification error)。
八、回归结果的书面表达方式

估计方程式标准差、t统计量、p值；主要统计量：R2 ，F值，回归标准误，DW值等。

杭州电子科技大学2022年同等学力加试考试大纲经济学院-计量经济学

杭州电子科技大学硕士研究生复试同等学力加试科目考试大纲学院：经济学院加试科目名称：计量经济学一、经济计量学的特征及研究范围1. 什么是经济计量学2. 为什么要学习经济计量学3. 经济计量学方法论二、线性回归的基本思想：双变量模型1. 回归的含义2. 总体回归函数（PRF）：假想一例3. 总体回归函数的统计或随机设定4. 随机误差项的性质5. 样本回归函数6.“线性”回归的特殊含义7. 从双变量回归到多元线性回归8. 参数估计：普通最小二乘法三、双变量模型：假设检验1. 古典线性回归模型2. 普通最小二乘估计量的方差与标准误3. 为什么使用OLS?OLS估计量的性质4. OLS估计量的抽样分布或概率分布5. 假设检验6. 拟合回归直线的优度：判定系数r27. 回归分析结果的报告8. 正态性检验四、多元回归：估计与假设检验1. 三变量线性回归模型2. 多元线性回归模型的若干假定3. 多元回归参数的估计4. 估计多元回归的拟合优度：多元判定系数R25. 多元回归的假设检验6. 对偏回归系数进行假设检验7. 检验联合假设：B2=B3=0或R2=08. 从多元回归模型到双变量模型：设定误差9. 比较两个R2值：校正的判定系数10.什么时候增加新的解释变量11.受限最小二乘五、回归模型的函数形式1. 如何度量弹性：双对数模型2. 比较线性和双对数回归模型3. 多元对数线性回归模型4. 如何预测增长率：半对数模型5. 线性-对数模型：解释变量是对数形式6. 倒数模型7. 多项式回归模型8. 过原点的回归9. 关于度量比例和单位10.标准化变量的回归六、虚拟变量回归模型1. 虚拟变量的性质2. ANCOVA模型：包含一个定量变量、一个两分定性变量的回归3. 包含一个定量变量、一个多分定性变量的回归4. 包含一个定量变量和多个定性变量的回归5. 比较两个回归6. 虚拟变量在季节分析中的应用7. 应变量也是虚拟变量的情形：线性概率模型（LPM）七、模型选择：标准与检验1. “好的”模型具有的性质2. 设定误差的类型3. 遗漏相关变量：“过低拟合”模型4. 包括不相关变量：“过度拟合”模型5. 不正确的函数形式6. 度量误差7. 诊断设定误差：设定误差的检验八、多重共线性：解释变量相关会有什么后果1. 多重共线性的性质：完全多重共线性的情形2. 近似或者不完全多重共线性的情形3. 多重共线性的理论后果4. 多重共线性的实际后果5. 多重共线性的诊断6. 多重共线性必定不好吗7. 如何解决多重共线性：补救措施九、异方差：如果误差方差不是常数会有什么结果1. 异方差的性质2. 异方差的后果3. 异方差的诊断：如何知道存在异方差问题4. 观察到异方差该怎么办：补救措施5. 怀特异方差校正后的标准误和t统计量十、自相关：如果误差项相关会有什么结果1. 自相关的性质2. 自相关的后果3. 自相关的诊断4. 补救措施5. 如何估计ρ6. 校正OLS标准误的大样本方法：纽维-韦斯特（Newey-West）方法参考书目：《经济计量学精要》(第四版)，达莫达尔·古扎拉蒂著，机械出版社，2010年6月。

4--双变量回归：假设检验

（Z b2 B2 ~ N (0,1)） SE (b2 )
b2 Z 2 SE (b2 )
3、总体服从正态分布（ 2未知，即SE （b2）未知）
t
b2 B2 ~ t (n 2) ˆ (b ) SE 2
对给定的置信概率1 ，查t分布表确定临界值 t 2，由
P{t （） t t （） } 1 2 n2 2 n2
b2 B2 ~ N (0,1) SE (b2 )
P[b2 Z 2 SE (b2 ) b2 b2 Z 2 SE （b2） ] 1
参数B 2的置信度为1 的置信区间为
b2 z 2 SE (b2 )
2、 2未知（即SE （b2）未知），且为大样本时，B2的置信度为1 的置信区间为
第三讲双变量模型：假设检验
• 假设检验 • 估计回归直线的“优度” • 怎样判别它确实是真实的总体回归函数的一个好的估计量呢？ • 如何仅仅根据一个样本，来确定样本回归函数确实是真实总体回归函数的一个好的近似呢？
ui是如何生成的
• 只有对ui的生成做一些特殊的假定，才能完成假设检验。 • 古典线性回归模型 • (Classical Linear Regression Model, CLRM)。
假定5：随机扰动项服从正态分布
ui ~ N (0, )
2
Yi ~ N （b1 b2 X i ， 2 ）
7
6.2 普通最小二乘估计量的方差与标准差
为估计值的标准差(standard error of the estimate)或是回归标准差(s t a n d a r d error of theregression)， Y值偏离估计的回归直线的标准方差。估计回归线的拟合优度(goodness of fit)的简单度量，

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

7.6 判定系数拟合优度检验：对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标：判定系数 R2
问题：采用普通最小二乘估计方法，已经保证了模型最好地拟合了样本观测值，为什么还要检验拟合程度？
x
2
2 i
)
ˆ 1 1 t ~ t (n 2) 2 2 ˆ se(1 ) ˆ xi
ˆ 1 1
斜率1的显著性检验
ˆ 1 1 t ~ t (n 2) 2 2 ˆ se(1 ) ˆ xi
在上述t统计量中假设1等于零，得到
ˆ 1 1
无偏性成立的关键条件
• CLRM的假设1：µ 和Xi不相关
案例分析
学生的数学考试成绩被解释变量：在一次高中10年级标准化数学考试中通过学生的百分比解释变量：有资格接受联邦政府午餐补助学生的百分比
math10 = 0 + 1 lnchprg+ 1的含义 1 > 0
Eviews
请解释斜率方差的决定因素
斜率方差的决定因素
1、解释变量的变化程度解释变量的变化程度越大，对斜率的估计越精确
0
1
0
1
斜率方差的决定因素
2、总体方差总体方差越小，对斜率的估计越精确
0
1
Y
X
斜率估计量的标准差
sd() x
2
斜率估计量的标准误
7.3 OLS估计量的性质
当模型参数估计出后，需考虑参数估计值的精度，即是否能代表总体参数的真值。可从如下几个方面考察估计量的优劣性：（1）无偏性，即它的均值或期望值是否等于总体的真实值；（2）有效性，即它是否在所有线性无偏估计量中具有最小方差。说明：线性指估计量为随机变量Y的线性函数
1、设计一个服从特定分布的随机变量，例如t 2、选择一个取值范围，上述随机变量落在该取值范围内的概率很小，例如5％ 3、根据样本数据计算上述随机变量的数值 4、判断该数值是否落在上述取值范围之内 5、如果是，则认为发生了不可能发生的事情。因此得出结论：假设前提错了
2、解释变量的显著性检验
ˆ 1 ~ N ( 1 ,
2、OLS估计量的方差
E (Y | X i ) 0 1 X i
2、OLS估计量的方差
xi y i ˆ 1 2 xi Y X ˆ ˆ 1 0
斜率和截距估计量的方差
2 xi 2 2 ˆ var( 2 Y ) var( 1 ) k i i k i 2var( 0 1 X i i ) xi x i 2
（3）给定显著性水平a，查t分布表，得临界值c＝t a/2(n-2)
(4) 比较，判断若 |t|> t a/2(n-2)，则拒绝H0 ，接受H1 ；
若
|t| t a/2(n-2)，则拒绝H1 ，接受H0 ；
简易判断法则
当n > 30时，t分布近似于正态分布给定显著性水平为5％，临界值c约为2 如果t的绝对值大于2，就可以拒绝稻草人假设，说明斜率1显著地不等于零因此，解释变量X对被解释变量Y具有影响
2 i 2 2 2 i 2 i
斜率和截距估计量的方差
2 xi 2 2 ˆ var( 2 Y ) var( 1 ) k i i k i 2var( 0 1 X i i ) xi x i 2
k i2 var( i )
稻草人假设：斜率参数为零
解释变量的显著性 Yi 0 1 X i i
如果1等于零，则X对Y没有影响
1的估计值不等于零
但是
1真的不等于零吗？
问题：如何说服我们相信你高考的数学成绩不是零分？
1、假设检验概述
•假设检验采用的逻辑推理方法是反证法。先假定原假设正确，然后根据样本信息，观察由此假设而导致的结果是否合理，从而判断是否接受原假设。 • 判断结果合理与否，是基于“小概率事件不易发生”这一原理的。 •如果结果是个小概率事件，那我们认为这是不可能发生的。会发生不可能发生的事情，一定是假设前提错了。 •上述“小概率事件”的概率被称为检验的“显著性水平”，或者“犯第一类错误的概率”（拒绝了正确的虚拟假型:假设检验
思考题： 1、CLRM关于随机误差项的五个假设是什么？ 2、影响SRF中斜率估计量方差的两个因素是什么？ 3、OLS估计量具有哪两个优良性质？ 4、假设检验的基本原理是什么？ 5、显著性水平和第一类错误指的是什么？
第7章双变量模型:假设检验
思考题： 6、对稻草人假设进行检验的标准是什么？ 7、拟合优度的含义和度量指标是什么？ 8、正态性检验的目的是什么？
2 i 2
ˆ var( 0 )
1 X2 2 2 n var( wii Yi ) x

x nX X wi2x var( 0 1 X i i ) (1 / n x n
2 i 2 2 2 i 2 i
估计量
估计总体的公式总体均值的估计量：样本均值
估计量
估计总体的公式总体均值的估计量：样本均值
估计量与估计值
随机样本：无数个样本一个具体的样本： 1、样本中每个随机变量都取定一个观察值 2、根据估计量的公式计算估计值
高斯—马尔可夫定理给定CLRM的假设1-4，最小二乘估计量是具有最小方差的线性无偏估计量。
如果假设3不成立：第13章
假设4、各个随机误差项之间无自相关 Cov(i, j)=0 i≠j i,j= 1,2, …,n 如果假设4不成立：第14章
假设5、服从正态分布 i~N(0, 2 )
i=1,2, …,n
如果假设5不成立: 样本容量n>30 中心极限定理被解释变量服从正态分布
ˆ ˆ 2、无偏性，即估计量 0 、 1 的均值（期望）等于总体回归
参数真值 0 与 1
ˆ E (1 ) E (1 ki i ) 1 ki E ( i ) 1
ˆ E ( 0 ) E ( 0 wi i ) E ( 0 ) wi E ( i ) 0
案例分析
工资被解释变量：工资（1976年每小时美元数）解释变量：教育（年数）计量模型：
wage = 0 + 1 educ +
t＝10.17 问题：如何对待稻草人假设？
关于5％
拒绝域
2.5% -2
95%
0 2
拒绝域
2.5%
p值
p值是给定t比率后，能拒绝稻草人假设的最小显著性水平(犯错误水平）即给定显著性水平为p，根据样本计算的t比率刚好可以拒绝稻草人假设如果显著性水平大于p，则仍然可以拒绝如果显著性水平小于p，则不可以拒绝问题：对于计量研究而言，p值越大还是越小好？
(1 a) a) (1
0 c
a/2 a
双侧检验
yi = 0 + 1x i + µi
H0: 1 = 0
拒绝域
H 1: 1 0
拒绝域
a/2 -c
(1 a)
0 c
a/2
双边检验的步骤
（1）对总体参数提出假设 H0： 1=0， H1：10
ˆ 1 t ˆ se(1 )
（2）以原假设H0构造t统计量，并由样本计算其值
k i2 var( i )
2 i 2
ˆ var( 0 )
1 X2 2 2 n var( wii Yi ) x

x nX X wi2x var( 0 1 X i i ) (1 / n x n
案例分析
工资被解释变量：工资（1976年每小时美元数）解释变量：教育（年数）计量模型：
wage = 0 + 1 educ +
p＝0.0000
思考题
假设p值为0.01，如果研究者采用的显著性水平为5％，我们能否拒绝虚拟假设？如果研究者采用的显著性水平为0.5％，我们能否拒绝虚拟假设
1、随机误差项的方差2的估计
Y的方差： Var（Y）＝ Var（µ）＝ σ² 2称为总体方差，反映了随机变量 Y围绕其均值波动的平均幅度。
由于随机误差项i不可观测，只能从i的估计——残差ei出发，对总体方差进行估计。
理想但未知的总体回归模型
Yi E (Y | X i ) i 0 1 X i i
近似但已知的样本回归模型
ˆ ˆ ˆ e X e Yi Yi i 0 1 i i
可以证明，双变量模型中2的无偏估计量为
ˆ
2
e
2 i
n2
回归标准误：SER
ˆ2
e
2 i
n2
2
＝
RSS
n－2
2 i
e ˆ :SER
n2
Eviews
估计Salary 的标准误
7.2 普通最小二乘估计量的方差
Y = f(X) + µ
µ被称为随机误差项，代表所有其他影响因素的总和因此，Y是一个随机变量刻划随机变量的两个参数： ①期望值 ②方差
计量研究目标
1、X对Y的具体影响：
E (Y | X i ) 0 1 X i
2、其他因素对Y的平均影响幅度： Var（Y）＝ Var（µ）＝ σ² Y的标准差：σ
线性：β 帽是Y的线性函数
xi y i ˆ 1 2 xi Y X ˆ ˆ 1 0
7.4 OLS估计量的概率分布
1的正态分布
ˆ 1 ~ N ( 1 ,
x

2
) 2
i
7.5 假设检验
不同的样本，得到不同的估计值，根据某一个具体样本得到的估计值质量如何？可以通过特定的检验指标来衡量