第5章:双变量回归:区间估计与假设检验
双变量区间估计

bˆ 2
b2
( ) b 2
+
tc 2,
* Se
n-2
bˆ 2
Stata得到的t值
H0: b2= 0 H1: b2 0
0.5091 - 0 t=
0.0357
Se(β^2)
RSS
SEE= s^
单尾t检验
我们也可假定: 1. 计算:
H0 : bˆ 2 0.3 H1 : bˆ2 > 0.3
t
=
bˆ 2 - b2
单尾t检验的判断标准
决定准则
第5步: 如t > tc ==> 拒绝 H0
右尾
如 t < tc ==> 不拒绝 H0
右尾
左尾
0 tc < t
t < -tc 0
(如 t < - tc ==> 拒绝H0 )
(如 t > - tc ==> 不拒绝 H0 )
左尾
双尾t检验
1. H0 : bˆ 2 = b2 H1 : bˆ 2 b2
表述出假设
2. 计算
t
=
bˆ 2 - b2
Se(bˆ 2)
3. 查t表得临界值:
t
c
, n-2
2
双尾t检验
4. 比较 t 和 tc
决定准则:
5. If t > tc or -t < - tc , 故拒绝 Ho or | t | > | tc |
接受域
拒绝域
拒绝域
( ) b 2 -
t
c
* Se
2, n-2
构造 bi 的置信区间
t
=
bˆ2 - b2 Se (bˆ 2)
第五章 双变量回归:区间估计与假设检验

三、假设检验
假设检验的方法: 置信区间的方法、显著性检验的方法
消费-收入的例子: H 0:1=0.3 H1:1 0.3 决策规则:构造一个 1的100 ( 1 ) %置信区间, 如果在假设H 0下0.3落入此区间,就不要拒 绝H 0。 但是,如果它落在此区 间之外,就要拒绝 H 0。 注意 : 在统计学中,当我们拒 绝零假设,就说我们 的发现是统计上显著的 (statistica lly significant)。 拒绝零假设=统计上显 著的(这只是习惯上的 约定)
2
ˆ 1 t t / 2 2 ˆ se( 1 )
三、建立虚拟与对立假设
一般是将不愿意出现的结果设置为虚拟 假设,而将愿意看到的结果设置为对立 假设。
四、选择显著性水平
显著性水平 是指拒绝真实的虚拟假设达到的概率, 也叫犯第Ⅰ类错误的概率; 如果虚拟假设是错误的,没有拒绝反而接受了,则 称犯了第Ⅱ类错误。 对于给定的样本大小,如果我们要减少第Ⅰ类错误, 第Ⅱ类错误就要增加,反之亦然。 因犯第Ⅰ类错误的代价(拒绝真实的虚拟假设,弃 真)大于犯第Ⅱ类错误的代价(没有拒绝错误的虚 拟假设,纳伪),那么尽可能将 设置小一些是合 理的。
二、“零”虚拟假设与“2倍t”经验法 则
如果自由度≥20且显著性水平定为0.05时, 那么,根据下式所得t值在绝对值上超过2时, 就可以拒绝虚拟假设
ˆ ) ˆ ( (X X ) 1 1 1 1 t ˆ ˆ se( 1 )
ˆ 1 ˆ 0 t t 2 当 1 ˆ) se( 1 ˆ 1 ˆ 0 t t 2 当 1 ˆ) se( 1
1 1
二、回归系数0和1的置信区间
计量经济学----.区间估计和假设检验

即
P[ 2 t se( 2 ) 2 2 t se( 2 )] 1
2 2
8
^
^
^
^
假设检验
检验某一给定的观测是否与虚拟假设(原假设)相符, 若相符,则接受假设,反之拒绝。 当我们拒绝虚拟假设时,我们说该统计量是统计上显 著的,反之则不是统计上显著的。
的临界值 t 2 (n 2) ,则有
ˆ ˆ P{[YF t 2 SE (eF )] YF [YF t 2 SE (eF )]} 1
1 因此,一元回归时 Y 的个别值的置信度为 的 预测区间上下限为 1 ( X F X )2 ˆ ˆ YF YF t 2 1 n xi2
给定,查t分布表得t (n 2) 2 ( )若t -t 2 (n 2), 或t t 2 (n 2),则拒绝原假设 1 H 0: 2 0,接受备择假设H1: 2 0; (2)若 - t 2 (n 2) t t 2 (n 2), 则接受原假设。
30
^
^
应变量Y 区间预测的特点
1、Y 平均值的预测值与真实平均值有误差,主要是 受抽样波动影响
YF Y F t 2
^ ^
1 ( X F X )2 n xi2
Y 个别值的预测值与真实个别值的差异,不仅受抽
样波动影响,而且还受随机扰动项的影响
1 ( X F X )2 ˆ ˆ YF YF t 2 1 n xi2
^
1 ( X F X )2 ˆ SE (YF ) n xi2
Y F 服从正态分布,将其标准化,
^
当
2
2 ei2 (n 2) 代替,这时有 未知时,只得用 ˆ ˆ YF E (YF X F ) t ~ t (n 2) 1 ( X F X )2 ˆ n xi2
回归系数的假设检验

l b l
XY XX
=0.058826
b0 Y bX =0.000419
39
列出回归方程:
y=0.000419+0.058826x
40
直线回归方程的图示
在自变量X的实测范围内任取相距 较远且易读数的两X值代入回归方程求 得两点坐标、连线即得其回归直线
41
三、直线回归的统计推断
表1
不同饲料组大鼠肝中维生素A含量(IU/g)
大鼠对号 (1 )
1
正常饲料组 (2 )
3550
维生素 E 缺乏组 (3 )
2450
2
3 4 5 6 7 8 合计
2000
3000 3950 3800 3750 3450 3050 26550
2400
1 800 3200 3250 2700 2500 1750 20050
(一)总体回归系数的估计与假设检验 1、总体回归系数的区间估计 bt/2,sb
sb
sy . x l xx
2 ( y y )
sy . x
n2
(y y )
2
l yy
l
2 xy
l xx
2、回归系数的假设检验
方差分析 t检验
回归系数的假设检验:方差分析法
30
例13.2 对例13.1进行回归分析
表2 SAH患者血清和脑脊液IL-6(pg/ml)检测结果 患者号 1 2 3 4 5 6 7 8 血清IL-6 22.4 51.6 58.1 25.1 65.9 79.7 75.3 32.4 脑脊液IL-6 134.0 167.0 132.3 80.2 100.0 139.1 187.2 97.2
第5章 区间估计与假设检验

分布(如t分布,F分布,正态分布, χ 2 分布等)。构造出统计
量以后,就可以利用样本数据计算出这个统计量的样本值,再 把这个样本值与给定某一显著水平的临界值进行比较,看它与 临界值是否有显著差别,从而作出判断,决定拒绝还是接受所 作的假设。
, βˆ2
+
δ
)
包含 β2 的概率
Pr(βˆ2 − δ ≤ β 2 ≤ βˆ2 + δ ) = 1−α (5.2.1)
这样的区间称为置信区间(confidence interval);1−α 称为置
信系数(confidence coefficient);而α 称为显著性水平(level of
significance)。置信区间的端点称置信限(confidence limits)也 称临界值(critical values)。
βˆ2 − δ 为置信下限(lower confidence limit)
βˆ2 + δ 为置信上限(upper confidence limit)
(5.2.1)式表示的是:随机区间包含真实 β2的概率为 1−α。
点估计与区间估计:
单一的点估计量可能不同于总体真值,即存在估计误差。点 估计既不能给出误差范围的大小,也没有给出估计的可靠程度。
进行统计假设检验,就是要制定一套步骤和规则,以使决定 接受或拒绝一个虚拟假设(原假设)。一般来说,有两种相互 联系、相互补充的方式:置信区间(confidence interval)和显 著性检验(test of significance)。
§5.6假设检验:置信区间的方法
第二讲双变量回归模型及其估计问题

x
80 100 120 140 160 180 200 220 240 260
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
1.理论的含糊性
5.糟糕的替代变量
2.数据的欠缺 3.核心变量与周边变量
6.节省原则 7.错误的函数形式
4.人为行为的内在随机性
第11页,本讲稿共46页
第二节 双变量回归分析的基本概念(5)
五、样本回归函数(SRF) E (Y | X ) = b1 + b2 X
Yˆbˆ1+bˆ2X
b b Y Y ˆ+ u ˆˆ1+ˆ2 X + u ˆ
例如: 已知 bˆ2 = 0.5091, n = 10, Se(bˆ 2) =
0.0357, 95% 置信区间是:
bˆ 2
±tc a 2
,
n2 * Se(bˆ2
)
0.5091±tc0.025, 8 (0.0357)
0.5091±0.0823
d
(0.4268, 0.5914)
第34页,本讲稿共46页
第三节 双变量回归模型的估计问题(5)
数值性质
是指由于运用最小二乘法而得以成立的那 些性质而不管数据是如何产生的。
统计性质
是指仅在数据产生的方式满足一定的假设 下才得以成立的那些性质。 数 1.OLS估计量是纯粹由可观测的量表达式,是容易计算的; 值 性 2.OLS估计量是点估计量; 质
3.一旦从样本数据得到OLS估计值,便可画出样本回归线。
第5章 单元回归分析及预测
δ
α
2 回归系数的置信区间 (1) 置信区间 ˆ ˆ − t α se ( βˆ 2 ) , βˆ 2 + tα 2 se ( β 2 ) ) • β 2 的置信区间为( β 2 2 • β 1 的置信区间( β 1 − t α 2 se ( βˆ 1 ) , β 1 + t se ( βˆ )) •
α β
ε
季度 1982.1 2 3 4 1983.1 2 3 4 1984.1 2 3 4 1985.1 2 3 4
IBM股票 开始价 58.25 61 60 74.125 93 102.375 121 128.125 121.75 112 105.875 122.625 121 128.125 124.875 126.625
期末价 61 60 74.125 93 102.375 121 18.125 121.75 112 105.875 122.625 121 18.125 14.875 126.625 152
分红 0.86 0.86 0.86 0.86 0.86 0.95 0.95 0.95 0.95 0.95 1.1 1.1 1.1 1.1 1.1 1.1
第三章 单元回归分析及预测
• • • • • • • 回归分析的基本概念 OLS估计问题 估计问题 区间估计与假设检验 回归分析的应用 有条件预测 误差序列相关情形预测 无条件预测
一 回归分析的基本概念
• 1 高尔登的回归定律 高尔登的回归定律:高尔登的兴趣在于发现为什么人口的身高分布有一种 稳定性。从现代的观点看,我们并不关心这种解释。我们关心的是:给定 父辈身高的前提下找出儿辈平均身高的变化。即给出一条数据分布的拟合 曲线或直线。 • 2经济学家也许想研究个人消费支出对税后或可支配实际个人收入的依赖 关系,这种分析会有助于估计边际消费倾向。 • 3一位能设定价格或产出的垄断商,也许想知道产品需求对价格变化的实 际反应,通过定价实验,能估计产品的价格弹性,从而有助于确定最有利 的价格。 • 4一位劳工经济学家也许要研究货币工资变化绿对失业率的关系。能预测 给定失业率下货币工资的平均变化。 • 5货币经济学知,其他条件不变,通货膨胀率越高,人们以持有货币的比 例越低。对这种关系的定量研究有助于货币政策的调控。 • 6公司的销售部主任相知道人们对公司产品的需求与广告开支的关系。这 种研究在很大程度上有助于算出相对广告费支出的需求弹性,从而制定最 优广告费预算。 • 7农业经济学家想研究作物收成对气温,降余量,阳光量,施肥量的依赖 关系,该分析能及早地预测作物的平均产量。
生物统计学习题集答案
生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为连续变量和非连续变量。
2 样本统计数是总体参数的估计量。
3 生物统计学是研究生命过程中以样本来推断总体的一门学科。
4 生物统计学的根本内容包括_试验设置、统计分析_两大局部。
5 统计学的开展过程经历了古典记录统计学、近代描述统计学现代推断统计学3个阶段。
6 生物学研究中,一般将样本容量n大于等于30称为大样本。
7 试验误差可以分为__随机误差、系统误差两类。
二、判断〔-〕1 对于有限总体不必用统计推断方法。
〔-〕2 资料的准确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
〔+〕4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的假设干个体所构成的集合称为样本。
总体:具有一样的个体所构成的集合称为总体。
连续变量:是指在变量X围内可抽出某一X围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
准确性:也称准确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章试验资料的整理与特征数的计算一、填空1 资料按生物的性状特征可分为___数量性状资料_变量和__变量性状资料_变量。
2 直方图适合于表示__计量、连续变量_资料的次数分布。
3 变量的分布具有两个明显根本特征,即_集中性_和__离散性_。
4 反映变量集中性的特征数是__平均数__,反映变量离散性的特征数是__变异数〔标准差〕_。
5 样本标准差的计算公式s=√∑〔x-x横杆〕平方/(n-1)。
二、判断( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
( - ) 2 条形图和多边形图均适合于表示计数资料的次数分布。
〔+〕3 离均差平方和为最小。
〔+ 〕4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
《计量经济学》第五章最新完整知识
第五章 多元线性回归模型在第四章中,我们讨论只有一个解释变量影响被解释变量的情况,但在实际生活中,往往是多个解释变量同时影响着被解释变量。
需要我们建立多元线性回归模型。
一、多元线性模型及其假定 多元线性回归模型的一般形式是i iK K i i i x x x y εβββ++++= 2211令列向量x 是变量x k ,k =1,2,的n 个观测值,并用这些数据组成一个n ×K 数据矩阵X ,在多数情况下,X 的第一列假定为一列1,则β1就是模型中的常数项。
最后,令y 是n 个观测值y 1, y 2, …, y n 组成的列向量,现在可将模型写为:εββ++=K K x x y 11构成多元线性回归模型的一组基本假设为 假定1. εβ+=X y我们主要兴趣在于对参数向量β进行估计和推断。
假定2. ,0][][][][21=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n E E E E εεεε 假定3. n I E 2][σεε='假定4. 0]|[=X E ε我们假定X 中不包含ε的任何信息,由于)],|(,[],[X E X Cov X Cov εε= (1)所以假定4暗示着0],[=εX Cov 。
(1)式成立是因为,对于任何的双变量X ,Y ,有E(XY)=E(XE(Y|X)),而且])')|()([(])')((),(EY X Y E EX X E EY Y EX X E Y X Cov --=--=))|(,(X Y E X Cov =这也暗示 βX X y E =]|[假定5 X 是秩为K 的n ×K 随机矩阵 这意味着X 列满秩,X 的各列是线性无关的。
在需要作假设检验和统计推断时,我们总是假定: 假定6 ],0[~2I N σε 二、最小二乘回归 1、最小二乘向量系数采用最小二乘法寻找未知参数β的估计量βˆ,它要求β的估计βˆ满足下面的条件 22min ˆ)ˆ(ββββX y X y S -=-∆ (2)其中()()∑∑==-'-=⎪⎪⎭⎫ ⎝⎛-∆-nj Kj j ij i X y X y x y X y 1212ββββ,min 是对所有的m 维向量β取极小值。
双变量模型假设检验
第六章 双变量模型:假设检验本章目的:介绍如何检验样本回归直线对总体回归函数的拟合程度要求:掌握古典线性回归模型的基本假定;OLS 估计量方差、标准差的含义;回归标准差的含义、高斯---马尔柯夫定理的内容;会运用计算机软件得到回归方程。
教学时数: 6学时第一节至第五节:3学时第一节 介绍古典线性回归模型的基本假定及含义1、误差项均值为零 E(u i )=02、误差项同方差 V ar(u i )=σ23、误差项无自相关 Cov(u i ,u j )=04、解释变量与误差项不相关 Cov(X i ,u i )=0 i,j=1,2,3….., i ≠j第二节 OLS 估计量的期望值(均值)、方差、标准差1、OLS 估计量是随机变量对于回归模型 Y i =B 1+B 2X i +u i参数的OLS 估计量为∑∑=-=2221iii xy x b X b Y b由于u 是随机变量, Y 是随机变量u 与非随机变量X 的代数和,则Y 也是随机变量。
由OLS 估计量的表达式可以看出b 1、b 2是Y 的线性函数,所以b 1、b 2也是随机变量。
2、OLS 估计量的期望值E(b 1)= B 1,E(b 2)= B 2可见b 1、b 2 分别为B 1 、B 2无偏估计量。
3、OLS 估计量的方差方差量度随机变量与其平均值的偏离程度,OLS 估计量的方差与观测值及随机误差项 的方差有关系2122)var(σ∑∑=iix n X b)v a r (11b b =σ∑=22)var(2ix b σ)v a r (22b b =σ4、由于我们通常不知道误差的生成过程,当然也不知道误差项的方差,通常使用残差信息来估计误差的方差2ˆ22-=∑n eiσ且22)ˆ(σσ=E5、我们用样本信息、残差信息来估计OLS 估计量的方差和标准差如下21ˆ)ˆvar(22σ∑∑=ii x n X b )ˆv a r ()(11b b se = ∑=22ˆ2)ˆvar(ix b σ)ˆv a r ()(22b b se =6、计算Widget 教科书需求函数中参数的标准差第三节 OLS 估计量的性质1、高斯---马尔柯夫定理如果满足古典线性回归模型的基本假定,OLS 估计量是最优线性无偏估计量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则拒绝原假设。
* ˆ ˆ ˆ 例:根据 Pr[ 2 t / 2 se( 2 ) 2 *2 t / 2 se( 2 )] 1 ˆ 得出: Pr[0.2177 0.3823] 0.95 2
关于 的显著性检验:
2
ˆ 2 (n 2) 2 ~ (n 2)
2 2
用这一统计量进行显著性检验,其决策机制列入表5.2.
暨南大学经济学院统计系
陈文静
26
ˆ 例子:前述消费与收入模型,所计算的 2 42.1591, d . f . 8 如设定原和备假设为:H 0: 2 85 H1: 2 ˆ 2 2 这显然是双尾检验, ( n 2) 2 ~ 2 ( n 2),给出了检验这 ˆ 一假设的统计量,将 2 42.1591, d . f . 8代入(在原假设之下), 有计算的值为 ˆ 2 2 (8) * 2 3.97 选定显著性水平0.05,可查得 2的两个临界值分别为
假设检验:置信区间的方法
暨南大学经济学院统计系
陈文静
13
ˆ ˆ ˆ ˆ P[ 2 t / 2 se( 2 ) 2 2 t / 2 se( 2 )] 1
在假设H 0下,落入此区间的 2值有 100(1 )%可信性,因而,若 2果真 落入此区域,就不能拒绝H 0
2
1
2
ˆ ˆ 2 t /2 se( 2 )
ˆ ˆ 2 t /2 se( 2 )
x
决策规则:构造一个 2的100(1 )%置信区间。 若 2在假设H 0下落入此区间,就不要拒绝H 0。 若落在此区间之外,则不拒绝H 0。
假设检验:显著性检验法
1. 检验回归系数的显著性:t检验 显著性检验最基本的问题是构造一个合适的统计量 (作为估计量),以及在原假设之下的抽样分布(本课 程基于经典的统计量,其分布已知),通过计算这一统 计量的样本值,进而与临界值比较,如落入接受域,则 不拒绝原假设,而不落入接受域即落入拒绝域,则拒绝 原假设。几乎所有假设检验,均按这一原理而实现。这 一思想的核心是,设定原假设和备选假设,构造统计量 以及推导它在原假设下的分布,利用这一分布检验假设, 所以这种思想实质上是先行假定原假设为真,从而有统 计量在原假设下的分布,基于此检验假设。
/2 t
4.13
red area = rejection region for 2-sided test
One-tailed t-test decision rule
Decision Rule Step 5: If t > tc If t < tc ==> reject H0 ==> not reject H0
left-tail
4.25
Right-tail
Right-tail
0
tc < t
t < -tc 0
(If t < - tc ==> reject H0 ) (If t > - tc ==> not reject H0 )
Left-tail
ˆ (2 2 ) t t (n 2) ˆ ) se( 2 ˆ (2 2 ) 置信区间: t / 2 Pr[ t / 2 ] 1 ˆ ) se( 2 ˆ ˆ ˆ Pr[ * t se( ) * t se( )] 1 2
暨南大学经济学院统计系 陈文静 15
t检验法:
第一步:建立原假设和备择假设 H 0: 2 0.3 H1: 2 0.3 ˆ ˆ 第二步:根据回归估计得出 2 0.5091,se( 2 ) 0.0357
根据样本信息和H 0假设下的 2 0.3计算t值 ˆ ( 2 2 ) 0.5091 0.3 t 5.86 ˆ) 0.0357 se (2 , )
2
ˆ 以 2为例进行分析,标准化变量: ˆ ˆ 2 2 (2 2 ) Z ˆ se( 2 ) xi2
若总体方差 2已知,则我们利用正态分布来进行分析。
ˆ 若总体方差 2未知,则只能用估计的方差 2来进行代替。 这时回归系数的分布将会发生变化,服从t分布。 ˆ 2 2 估计量 参数 t ˆ se( 2 ) 估计量的标准误的估计值 ˆ (2 2 ) ˆ
ˆ 2 0.5091,不在这个区间内,因此拒绝原假设H 0。
显著性检验——说明
显著性检验的实质为,建立真值或总体的某 一特定值的原假设和备选假设,在原假设下 构造统计量和它的分布, 并在原假设建立 有关估计量的置信区间,最后考察估计的值 是否落入置信区间之内还是之外,若落入之 内,不能拒绝原假设,否则拒绝原假设。这 一问题可转化为,如计算的t值较大,即可 成为拒绝原假设的证据。
2 2
3 在重复抽样中,平均来看,有100%(1-)次包含着总 体参数的真值。 ˆ 4 只要 不知道,则这个置信区间为随机区间。
2
ˆ 一旦样本确定,估计出一个 2的值,这时就是一个固定区 间了,这是真实 2或在区间内,或在区间外,从而概念只能 是1或0。
5.3
回归系数1和 2的置信区间
2的置信区间为:
ˆ ˆ 2 t / 2 se( 2 )
5.4 的置信区间
2
在ui的正态性假定下,变量:
(n 2)
2 2
ˆ2
2
2
~ ( n 2)
2 2
利用 分布建立 的置信区间: Pr(
2 1 /2
/2 ) 1
第三步:确定显著性水平为5%,则查t分布表得出临界值 自由度为n 2,临界值t 2 2.306,t t 2,则拒绝H 0。
t Distribution
Region of acceptance
f(t)
Reject region
Reject region
/2 -tc
() 0 tc
暨南大学经济学院统计系
陈文静
2
置信区间
由于标准差是度量估计量的精度,所以可利用标准差 来构造置信区间,这样,形成区间估计可以表述为: 确定决定区间的数 (基于标准差)和显著性水平, 使总体参数 2落入这一区间的概率(置信水平)为1 : ˆ ˆ Pr( ) 1
2
xi2
t (n 2)
用t分布来建立置信区间: Pr( t t t 2 ) 1 ˆ (2 2 ) Pr(t / 2 t t / 2 ) Pr t / 2 t / 2 ˆ se( 2 ) ˆ ˆ ˆ ˆ Pr[ 2 t / 2 se( 2 ) 2 2 t / 2 se( 2 )] 1
暨南大学经济学院统计系 陈文静 11
备选假设:通常是对研究者预期取值的表述。 备选假设的表示是在预期取值范围的表述前加 上符号“ H A: ”。继续我们的例子,如果你预期系 数是正值,那么备选假设是: 备选假设 H A : 0 (这是你所预期的取值范围) 注:上述假设是针对单侧(或单尾)检验而言的,因为 备选假设的取值位于虚拟假设的一侧。另一种方 法是使用双侧检验: H0 : 0 HA : 0
2
Pr[(n 2)
ˆ2
/2
2
( n 2)
2
ˆ2
2 1 /2
] 1
5.5 假设检验
虚拟假设:通常是研究者(对某一回归参数的) 非预期取值的一种表述。虚拟假设的表示是在 非预期的取值范围前加上符号“ H 0:。例如, ” 如果你预期系数是正值,那么0或负的系数就是 非预期的取值范围,于是虚拟假设为: 虚拟假设H 0 : 0 这是你的非预期的取值范围)
对于显著性检验(如检验),当计算的统计 量值落入接受域中,因此我们接受原假设, 其含意为,根据样本证据,我们没有理由拒 绝原假设;而并非是指,原假设一定为真。 为什么? 对于已决定接受的原假设,若与 之类似的另一原假设(我们只是没有设定), 通过相同的步骤,有可能结果为接受这一新 的原假设,若如此,哪一个原假设为真?通 过假设检验还无法决定。
2 2 (10.05/2) (8) 2.1797和 (0.05/2) (8) 17.5346, 接表5.2中的
第三行的双尾决策规则,由计算的2.18< 2 3.97 17.54 即落入这两个临界值所界定的区域之内, 故数据支持原假 设, 或者不拒绝原假设,或接受原假设。
接受与拒绝的含义
2 2 2
暨南大学经济学院统计系
陈文静
3
注释
ˆ 置信区间: 2 置信系数: 1 显著性水平: ˆ 置信下限: 2 ˆ 直线上限:
2
暨南大学经济学院统计系 陈文静 4
进一步解释
ˆ 置信区间是根据点估计量 2构造出来的一个区间, 要使得它把总体参数的真值包括在区间内的概率 为1 ,从而区间估计量给出了一个真实 2 会落 入其中的数值范围。若 5%,则置信水平为95%, 那么置信区间包含真实 2的概率就为95%。
ˆ ˆ 在扰动项服从正态分布的假定下,估计的系数1和 2 都服从正态分布。 ˆ 均值: E ( 1 ) 1
2 方差: 1 ): 1 var( ˆ
X n x
2
ˆ E (2 ) 2
2 i 2 i
2
ˆ var( 2 ): 2
2 2 ˆ 1 N ( 1 , )
/2
2
2
2
/2
2
ˆ 这一式子的意义为:在假定 2 2 时, 2以概率1- 落入其中的区间 ˆ ˆ [ * t se( )]。若估计的 落在这个区间外,则拒绝原假设H ,若落 2