参数估计基础汇总

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

参数估计基础

抽样研究的目的是用样本信息推断总体特征,即用样本资料计算的统计指标推断总体参数

常用的统计推断方法有参数估计(总体均数和总体概率的估计)和假设检验

内容复习

第6章总体均数估计

抽样分布与抽样误差t分布总体均数及总体概率的估计案例讨论

掌握:均数和率抽样误差的概念;均数和率标准误的意义和计算;总体均数和总体率区间估计的意义、计算及其适用条件。

熟悉:总体均数的点估计;t 0.05,(ν)的概念,标准误和标准差的区别;置信区间与医学参考值范围的区别。复习一些概念

参数(parameter)与统计量(statistics)

参数获取的途径对总体进行研究抽样研究

抽样误差(sampling error)

1.抽样误差的概念:由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异。(抽样误差=总

体参数-样本统计量)

2.抽样误差产生的原因:

3.抽样误差的特点:随机,不可避免,有规律可循。

4.在大量重复抽样的情况下,可以展示其规律性

第一节抽样分布与抽样误差

一、均数的抽样分布与抽样误差

二、频率的抽样分布与抽样误差

(一)样本均数的抽样分布

1.抽样模拟实验

假定总体:某年某地13岁女学生身高值

X~N(155.4,5.3)

随机抽样:n=30,K=100

将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。

2.样本均数的抽样分布特点

●各样本均数未必等于总体均数;

●样本均数之间存在差异;

●样本均数的分布规律:围绕着总体均数155.4cm,中间多,两边少,左右基本对称,服从正态分

布;

●样本均数的变异较原变量的变异减小。

3.抽样误差

1) 概念:由于抽样造成的样本统计量与统计量以及样本统计量与总体参数之间的差异叫作抽样误差。

2)

抽样误差产生的基本条件 ● 抽样研究 ● 个体差异

3)表现形式

● 样本统计量与样本统计量之间的差异 ● 样本统计量与总体参数之间的差异

(二) 均数的抽样误差

1.概念:由个体变异产生的,随机抽样引起的样本均数与总体均数间的差异。 (均数的抽样误差=总体均数-样本均数)

2.表现形式:

● 样本均数与总体均数间存在差异 ● 样本均数与样本均数间存在差异

● 均数的抽样误差可表现为样本均数与总体均数的差值 ● 均数的抽样误差也可表现为多个样本均数间的离散程度

如何度量抽样误差的大小?如何揭示抽样分布的规律? 中心极限定理为我们提供解决办法:

3.中心极限定理(central limit theorem)

从均数为μ、标准差为σ的总体中独立随机抽样,当样本含量 n 增加时,样本均数的分布将趋于正态分布,此

分布的均数为μ,标准差为

4.标准误(standard error ,SE)

● 样本统计量的标准差称为标准误,用来衡量抽样误差的大小。

● 样本均数的标准差称为标准误。此标准误与个体变异σ 成正比,与样本含量n 的平方根成反比。

5.均数的标准误 (standard error)

(1)概念:将样本均数的标准差称为均数的标准误, 它是描述均数抽样误差大小的指标 (2)计算:

实际工作中

,一般可用样本标准差s 代替σ

(3)统计学意义

均数的标准误越大,样本均数的分布越分散,样本均数离总体均数就越远,样本均数与总体均数的差别越大,抽样误差越大;抽样误差越大,由样本均数估计总体均数的可靠性越差。反之,亦然。 (4)影响抽样误差大小的因素

● 标准差 ● 样本含量n 实际工作中,可通过适当增加样本含量n来减少均数的标准误,从而降低抽样误差

X σ

3个抽样实验结果图示

2212

.0;5==X S n

1580

.0;10==X S n

0920

.0;30==X S n

6 .总体分布非正态分布时,样本均数的分布规律中心极限定理表明,即使从非正态总体中随机抽样,只

要样本含量足够大,样本均数的分布也趋于正态分布. ● 样本均数的总体均数仍等于μ;

● 样本均数的标准误仍满足均数标准误的计算式; ● 当n较小时,样本均数的分布是偏态的;

当n足够大(n≥50)样本均数的分布近似正态分布

7. 非正态总体样本均数的抽样实验 下图是一个正偏峰的分布,

用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图

影响抽样误差大小的因素有:

⑴样本标准差。S 越大, 也就越大。

⑵样本含量。n 越大,抽样误差越小。

因此如在一定标准差条件下,加大样本含量,可减少抽样误差,以保证的样本均数的代表性和可靠性。 8. 例6-1 2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125 g /L ,标准差为

15 g /L 。试估计该样本均数的抽样误差。

= =

= 2.89g/L

二.样本频率的抽样分布与抽样误差

例1. 在一口袋内装有形状、重量完全相同的黑球和白球,已知黑球比例为20%(总体概率π=20%),

从口袋中每摸一次看清颜色后放回去,搅匀后再摸,重复摸球35次(n =35), 计算摸到黑球的百分比(样本频率p i )。重复这样的实验100次,每次得到100个黑球的比例分别为14.4%, 19.8%, 20.2%, 22.5%,······等,将其频数分布列于表6-3。

● 频率的抽样误差:这种样本率样本频率与样本率样本频率之间、样本率样本频率与总体率总体概率之间的差异。

频率的标准误:表示频率的抽样误差的指标

样本频率 的总体均数参数为π,

率的标准误计算公式

公式

例2 某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试估

计该样本频率的抽样误差。

p = 41.5% = 0.415,n = 776

=

X s

/s

15/n

X

p =p σ=

n

p p n p p S p )

1(1

)

1(-≈

--=

p s =.77%

0.01771==

相关文档
最新文档