第九章第三节 抽样误差

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章 第三节 定量资料的统计推断
回顾:
统计分析: 统计描述
统计推断:
统计推断 参数估计 假设检验
点估计 区间估计
参数估计:运用统计学原理,利用样本统计 量,对总体参数进行估计。例如:总体均数 的参数估计
假设检验:又称显著性检验,是指由现成的 样本间存在的差别推断所代表的总体间是否 有差别。例如:均数u检验、均数t检验
标准误用 表示; X
其估计值用 S X 表示。

别 计算公式 S
(X X )2
n 1
SX
S n
标准误越小,样本均数的分布越集 统计学 标准差越小,个体值相对越集中, 中,样本均数与总体均数的差别越
意义 均数对数据的代表性越好。
小,抽样误差越小,由样本均数估 计总体均数的可靠性越大。
用途
描述个体值的变异程度
例5-1 2000年某研究者随机调查某地健康成年 男子27人,得到血红蛋白量的均数为125 g /L, 标准差为15 g /L。试估计该样本均数的抽样误 差。
sX = s / n = 15 / 27 = 2.89g /L
标准差和标准误的区别和联系
标准差
标准误
统计符号
总体标准差用 表示; 样本标准差用 S 表示。
现将这100个样本均数。看成新的随机变量绘制频数分布 表,如下表:
从正态总体N (155.4, 5.32)抽样得到的100个样本均数的频数分布(n =30)
组段下限值(cm)
152.6~ 153.2~ 153.8~ 154.4~ 155.0~ 155.6~ 156.2~ 156.8~ 157.4~ 158.0~
样本均数的标准差: X
标准误:样本均数的标准差。通常用SX 代替 X
标准误
标准误的计算公式:
X
n
sX
s n
标准误的大小与标准差成正比,与样本含量n的平方根 成反比,即在同一总体中随机抽样,样本含量n越大,
抽样误差越小。所以在实际应用中可通过增加样本含
量n来减小样本均数的标准误,从而降低抽样误差。
抽样误差
医学研究中,对总体中的所有对象进行 观测是没有必要的也是不可能的,因此 通常要采用抽样研究的方法。
抽样研究的目的是用样本信息推断总体 特征
Baidu Nhomakorabea
假如事先知道某地七岁男童的平均身高为119.41cm。研 究者从所有符合要求的七岁男童中每次抽取100人,共 计抽取了三次。
μ=119.41cm σ= 4.38cm
即u分布也称z分布。
实际工作中,当 X未知时,常用 sX 来代替
X
sX 则代替后不再服从标准正态分布
t 分布
英国统计学家W.S.Gosset于1908年以“Student”笔名
证明它服从自由度 = n 1的t分布,即
t X X
sX s / n
~ t分布, = n 1
每次均抽取30例(n= 30)组成一份样本,可以算
出每一份样本的平均身高.共抽取这样的样本100 次, 最终计算得到156.7, 158.1, 155.6,····157.7等100个样 本均数,如表:
均数的抽样误差
均数的抽样误差(sampling error of mean) 随机抽取样本引起的样本均数与总体均数之间 或样本均数与样本均数之间的差异称为均数 的抽样误差。 是客观存在不可避免的。
合计
频数
1 4 4 22 25 21 17 3 2 1
100
频率%
1.0 4.0 4.0 22.0 25.0 21.0 17.0 3.0 2.0 1.0
100
样本均数的抽样分布具有以下4个特点:
1. 各样本均数未必等于总体均数; 2. 样本均数之间存在差异; 3. 样本均数的分布很有规律,围绕着总体均数 (155.4cm),中间多、两边少,左右基本对
抽样误差的表现
抽 样 误 差 的 表 现
样本统计量和总 体参数间的差别
Xi
样本统计量和样
本统计量间的差

Xi X j
既然抽样误差不可避免且是有规律的, 那么到底它的分布规律到底是怎样的? (以均数的抽样误差为例)
假定某年某地所有13岁女学生身高服从总体均数 =155.4cm,总体标准差 =5.3cm的正态分布N(, 2)。在这样一个有限的总体中作随机抽样,
称,也服从正态分布;
由此得出:
原始 总体
μ
SAMPLE 1:x11 x12 x13 x14...x1n
X1
SAMPLE 2:x21 x22 x23 x24...x2n
X2
SAMPLE k:xk1 xk2 xk3 xk4...xkn
Xk
⑴.从正态总体中随机抽取例数为n的样本,其 所有样本均数的分布仍服从正态分布
标准误的意义
反映了样本统计量(样本均数)分布的离散程度,体 现了抽样误差的大小。
标准误越大,说明样本统计量(样本均数)的离散程 度越大,即用样本统计量来直接估计总体参数越不可 靠。反之亦然。
标准误的大小与标准差有关,在例数n一定时,从标
准差大的总体中抽样,标准误较大;而当总体一定时, 样本例数越多,标准误越小。说明我们可以通过增加 样本含量来减少抽样误差的大小。
描述均数的抽样误差大小
联 系
SX
S n
t 分布
若随机变量X服从正态分布N(,2),
经过u转换
u X
可以变成标准正态分布。
从正态分布N(,2)总体中抽取例数为n的几份
样本,得到的几个样本均数 X 也服从正态分布记
为: N
,
2
X
t 分布
对正态变量X 作u变换: z
X
X
可将一般的正态分布转化为标准正态分布 N(0,,12 )
X 118.21cm s=4.45cm
X 120.81cm s=4.33cm
X 120.18cm s=4.90cm
三次抽样得到了不同的结果,原因何在?
不同男童的 身高不同
每次抽到的 人几乎不同
个体变异
随机抽样
抽样误差
由于存在个体差异,即使非常严格取出的样 本计算得到的各种样本指标都不可能完全等 于总体参数值——抽样误差(sampling error) , 比如均数。
⑵.从偏态总体中抽样,当n足够大时,其所有 样本均数的分布也服从正态分布
——中心极限定理
4.这100个样本均数的均数为155.4cm,其标准差为 0.95cm,而原数据的标准差为5.3,说明样本
均数之间的变异要比原数据之间的变异减小;
XX
为了区别原个体值的标准差和样本均数之间的标准差,
原来数据的标准差:
相关文档
最新文档