计量经济学 第四章 统计推断: 估计与假设检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章统计推断:估计与假设检验

4.1 统计推断的含义

总体和样本

总体是指我们所关注现象出现的可能结果的全体,样本是总体的一个子集(例如,杭州的人口;下沙开发区的人口)。

宽泛地说,统计推断研究的是总体与来自总体的样本之间的关系。

国内股票交易市场共有1500多支股票。假定某一天从中随机选取50支,并计算这50支股票价格与收入比的平均值—即P/E比值。(例如,一支股票的价格为50元,估计年收益为2.5美元,则P/E为20;也就是说,股票以20倍的年收益出售。)

根据50支股票的平均P/E值,能否说这个P/E值就是总体的1000多股票的平均P/E值呢?

如果令X表示一支股票的P/E值,X表示50支股票的平均P/E值,能否得知总体的均值E(X)呢?此处统计推断的实质就是从样本值均值(X)归纳出总体值E(X)的过程。

4.2 参数估计

通常假定某一随机变量X服从某种概率密度,但并不知道其分布的参数值。例如,X服

从正态分布,想知道其两个参数,均值E(X)=u X,及方差2 x

δ。

为了估计未知参数,一般的步骤是:

假定有来自某一总体,样本容量为n的随机样本,根据样本估计总体的未知参数。因此,可将样本均值作为总体均值(或期望)的估计量,样本方差作为总体方差的估计量。

这个过程称为估计问题,估计问题有两类:

点估计(point estimation)和区间估计(interval estimation)。

假定随机变量X(P/E值)服从某一未知均值和方差的正态分布。但是,有来自该正态总体的一个随机样本(50个股票的P/E值),如何根据这些样本数据计算总体的均值u X (=E(X))和方

2 x δ?

表4 - 1

点估计

据表4 - 1的数据 50个P/E 的样本均值为11.5,显然我们可以选择

X 作为u X

的估计值。

我们称这个单一数值为u X 的点估计值。

(注意:点估计量是一个随机变量,因为其值随样本的不同而不同。)

某一特殊的估计值(比如11.5)的可信度有多大呢?虽然

X 可能是总体均值的“最好的”

估计值,但是某个区间,比如8~10,更可能包括了总体均值。这正是区间估计的基本思想。

区间估计 区间估计的主要思想源于估计量的概率分布的概念。如果随机变量X~N(u X ,2x δ),则(回

忆第三章中心极限定理):

X ~ N(u X ,2n

δ)

或,

(0,1)X u Z N -=

即样本均值的抽样分布也服从正态分布。 如前所述,通常

2

δ

未知,可用其估计量2

2()1

i

X X X S n -=∑-代替,则:

/x X u t s -=

服从自由度为(n -1)的t 分布。

在P/E 一例中,共有50个样本观察值,因此自由度为49。查附录中的t 分布表可得: P(-2.0096≤t ≤2.0096)=0.95

也即区间(-2.0096,2.0096)包括t 值的概率为95%。-2.0096和2.0096称为临界t 值,表明了在临界值区间内,位于t 分布曲线下区域的比例。

/x X u t s -=代到P(-2.0096≤t ≤2.0096)=0.95中,得到:

P(-2.0096

/x X u t s -=

≤2.0096)=0.95 整理得:

(0.95

x P X u X ≤= 上式为真实的u X 一个区间估计量。

10.63≤u X ≤12.36(近似值) 即为u X 的95%的置信区间。 一般地,称

2.0096 2.0096()0.95

x S S P X u X

-≤≤+=为未知的总体均值u X 的一个95%

的置信区间。0.95称为置信系数。上式表示随机区间(

X X

)包括真实的u X 概率为0.95。(

2.0

096S X

-)

称为区间的下限(lower limit),( 2.0096S

X +)称为区间的上限(upper limit)。

特别强调:

2.0096 2.0096()0.95

x S S P X u X

-≤≤+=

给出的区间是随机的区间

本的不同而变化。虽然总体均值u X 是未知的,但是它取某一固定值,因而它是非随机的。

简言之,区间是随机的,而参数u X 不是随机的。

2.0096 2.0096()0.95

x S S P X u X

-≤≤+= 也可以理解为,如果建立类似上式这样的置信区间100次,将有95次的区间包括真

实的u X 。

4.3 点估计量的性质

在P/E 一例中,用样本均值作为u X 的点计量,同时还得到了u X 的区间估计量。但除了样本均值以外,样本中位数同样可用作u X 的点估计量,为什么要选择样本均值为u X 的估计量呢?

在实践中,样本均值是度量总体均值最广泛使用的统计量,因为它满足了下面的一些统计性质:

(1) 线性(linearity)

(2) 无偏性(unbiasedness) (3) 有效性(efficiency)

(4) 最优线性无偏估计量(BLUE) (5) 一致性(consistency)

4.4.1 线性

若估计量是样本观察值的线性函数,则称该估计量是线性估计量。

相关文档
最新文档