抽样推断的一般问题抽样误差

合集下载

统计学 任务一八 抽样推断

统计学 任务一八 抽样推断

31
抽样平均误差
㈢影响抽样误差的主要因素
1.样本容量n。样本容量大小与抽样误差成反比。当 n=N,无抽样误差。此表明,若条件许可应尽量扩容。
2.总体各单位标志变异程度。如总体标准差σ或总体方 差 。标志变异程度大小与抽样误差成正比。当σ=0, 无抽样误差2 。
3.抽样组织形式。类型抽样和等距抽样的抽样误差较小, 整群抽样误差较大。实践中,可利用抽样误差的大小 来检验组织方式的有效性。
差的影响(对抽中群作全面调查,无抽样误差)。 因此群的划分,要尽量缩小群间的差异,加大群 内的差异。 由于样本单位过分集中在少数样本群,同样条件 下抽样误差较大。欲不扩大误差,则需要增加一 些样本群。
21
抽样组织形式
㈣等距抽样——机械抽样
等距抽样是先将总体单位按某一标志顺序排队,再按固 定顺序和相等距离(间隔k)抽取样本单位。
13
◎抽样方法
2.不重复抽样(不回置抽样)从总体中每次抽 取一个单位进行观察,登记后不再放回总体中, 依此直至抽取n 个单位。
不重复抽样的特点:
⑴ n次抽取实质上等于一次同时抽取n个单位; ⑵ n次抽取相互不独立(对下次抽取有影响); ⑶每个总体单位在各次被抽中的概率不同,即1~n次分
别是1/N,1/N-1,1/N-2,…,1/N-n+1,但在每次抽 取时机会仍然均等; ⑷每个总体单位不会被重复抽中。

(n-1)k nk
22
分任务二 抽样误差
抽样误差的概念 抽样平均误差 抽样极限误差与概率度
一.抽样误差的概念
抽样误差是一种调查误差。如前所述:
调 登记性误差 普遍存在可以防止


系统性误差
差 代表性误差

统计学—抽样推断

统计学—抽样推断

解:已知样本的合格率= 3006 0.98 300
重复抽样: P (1 P )0 .9 8 (1 0 .9)8 0 .00 8 0 .80 % 0
p
n
300
不重复抽样:
P(1P)(1n) 0.980.02(1 300)0.80% 6
p
n
N
300 60,000
21
第六章 抽样推断
STAT
(二)分层(类型)抽样形式下
样本成数近似服从于以总体成数为P,方差为P(1-P)/n的正态12 分布。
第六章 抽样推断
STAT
第二节、抽样误差的计算
一、抽样误差的概念
登记性误差
调查误差 代表性误差
系统性误差
实际抽样误差
抽样误差 抽样平均误差
代表性误差是指 由于样本的结构不能完全代表总体的结构 所引起的误差。
系统性误差是指由于抽样调查违反随机原则引起的误差;
p
n N 1
nN
注:(1)可用样本成数方差代替总体成数方差;
(2)可用样本成数 p^ 代替总体成数P;
(3)有若干个P值时,取最接近0.5的P值;
(4)无P值时,取P=0.5 (此时方差最大)
20
第六章 抽样推断
STAT
例:一批食品罐头60,000桶,随机抽查300桶,发现有6桶不合 格,求合格率的抽样平均误差。
统计上讲的抽样一般都是指概率抽样。 二、抽样推断的特点
1、是非全面调查 与普查的区别;
2、按随机原则抽取样本 与典型调查和重点调查的区别; 3、根据样本指标推断总体指标 与重点调查的区别; 4、抽样误差可以事先计算与控制 与典型调查的区别。
3
第六章 抽样推断

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

《统计学》第七章抽样推断第二节 抽样误差

《统计学》第七章抽样推断第二节 抽样误差
6-3
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差

p p P


如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差

抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:

x x X

即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x

n
式中,n为样本容量; 为总体标准 。


成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)

7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)

2

《国民经济统计学概论》_第六章_抽样推断

《国民经济统计学概论》_第六章_抽样推断
总体未分组: 2 (X X )2 N
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。

抽样推断 习题及答案

抽样推断 习题及答案

第六章抽样推断习题答案一、名词解释用规范性的语言解释统计学中的名词。

1. 随机原则:是指在抽样时排出主观上有意识地抽取调查单位,每个单位以相同概率被取到,从而增强样本对总体的代表性。

2. 统计量:是反映样本特征的综合指标,随样本不同而取不同的值,具有随机性。

3. 随机变量:是指变量的值无法预先确定仅以一定的可能性取值的量。

4. 样本容量:是指样本中的总体单位数量。

5. 中心极限定理:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。

这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。

6. 抽样平均误差:是反应抽样误差一般水平的指标,它的实质含义是指抽样平均数的标准差。

7. 区间估计:通过从总体中抽取的样本,根据一定的可行度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。

8. 简单随机抽样:也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

二、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。

1. 抽样推断中,如果获取的样本数据准确,那么,由此推断的总体参数也一定准确。

(×)不一定2. 极限误差越大,则抽样估计的可靠性就越小。

(×)越大3. 抽样平均误差的大小与样本容量的大小成正比关系。

(×)反比4. 在一般的抽样推断中,抽样平均误差小于极限误差。

(×)不一定5. 重复抽样条件下的抽样平均误差,一定比不重复抽样条件下的抽样平均误差大。

(×)在其他条件相同的情况下6. 在不重复抽样的情况下,若调查的单位数为全及总体的10%,则所计算的抽样平均误差比重复抽样计算的抽样误差少10%。

抽样理论抽样误差与样本量的计算公式

抽样理论抽样误差与样本量的计算公式

抽样理论抽样误差与样本量的计算公式在统计学中,抽样是我们用来从整体中获取样本数据的一种方法。

然而,由于我们无法对整体进行完全调查,所以我们需要根据一部分样本数据来推断总体特征。

抽样误差是指由于样本抽取的随机性所引起的对总体特征的估计误差。

本文将介绍抽样理论中常用的抽样误差公式,并说明样本量的计算方法。

1. 抽样误差公式抽样误差是统计推断中的重要概念,它用来衡量样本数据对总体数据的估计精度。

抽样误差可以通过以下公式计算:抽样误差 = 抽样估计值 - 真实值抽样估计值是根据样本数据计算得出的统计量,例如均值、比例等。

真实值是指总体数据的真实数值。

在实际应用中,常用的抽样误差公式有标准误差公式和置信区间公式。

1.1 标准误差公式标准误差是样本统计量的抽样分布标准差。

如果我们假设样本数据满足正态分布,那么标准误差可以通过以下公式计算:标准误差 = 样本统计量的标准差 / 样本容量的平方根其中,样本统计量的标准差是指该统计量在抽样分布中的标准差,样本容量是指样本的大小。

例如,我们要估计某商品在全国范围内的销售量,并从中抽取了100个销售点的销售数据。

我们计算得出样本均值为2000,样本均值的标准差为100。

那么根据标准误差公式,我们可以计算出标准误差为:标准误差= 100 / √100 = 10这意味着我们对总体销售量的估计值平均偏差不超过10个单位。

1.2 置信区间公式置信区间是对总体特征的估计范围。

当我们进行统计推断时,我们通常希望给出一个置信水平,表示我们对估计值的信心程度。

置信区间可以通过以下公式计算:置信区间 = 抽样估计值 ±临界值 ×标准误差其中,临界值是根据所选置信水平和样本容量在统计表中查找得出的。

举例来说,我们希望估计某政党在全国范围内的支持率,并从中抽取了1000个选民的调查数据。

我们计算得出样本支持率为0.6,临界值为1.96(置信水平为95%)。

假设样本比例的标准误差为0.02,那么根据置信区间公式,我们可以计算出置信区间为:置信区间 = 0.6 ± 1.96 × 0.02 = 0.56 ~ 0.64这意味着我们以95%的置信水平估计,该政党的支持率在0.56到0.64之间。

统计推断抽样误差大小评估及控制方法

统计推断抽样误差大小评估及控制方法

统计推断抽样误差大小评估及控制方法统计推断是统计学中一项重要的技术,可以帮助我们从样本数据中推断总体的特征。

然而,在实际应用中,由于抽样误差的存在,我们需要对样本数据的可靠性进行评估,并采取相应的控制方法来减小抽样误差的大小。

本文将围绕这一主题展开,介绍统计推断抽样误差的评估和控制方法。

一、抽样误差的定义和影响因素抽样误差是指由于从总体中选取一部分样本,而使样本统计量与总体参数之间的差异。

抽样误差的大小直接影响到我们对总体特征的推断能力。

它的大小受到以下几个因素的影响:1. 样本容量:样本容量越大,抽样误差越小。

通常来说,当样本容量大于30时,中心极限定理可以保证样本的均值近似服从正态分布,从而减小了抽样误差的大小。

2. 总体的变异程度:总体变异越大,抽样误差越小。

如果总体中的个体差异较大,则从中抽取的样本更有可能代表整个总体。

3. 抽样方法:合理的抽样方法能够减小抽样误差的产生。

如简单随机抽样、分层抽样、整群抽样等,都可以在一定程度上降低抽样误差的大小。

二、抽样误差的评估方法为了确定抽样误差的大小,我们需要进行抽样误差的评估。

常用的抽样误差评估方法有以下几种:1. 置信区间:通过计算样本统计量的置信区间,可以确定总体参数的估计范围。

置信区间越窄,抽样误差越小。

2. 边界值计算:边界值是指满足给定置信度和抽样误差的最大样本容量。

通过计算边界值,可以对抽样误差进行评估。

3. 抽样误差率:抽样误差率是指样本统计量和总体参数之间的相对差异。

通过计算抽样误差率,可以评估抽样误差的大小。

三、抽样误差的控制方法为了减小抽样误差的大小,我们可以采取以下几种控制方法:1. 增加样本容量:样本容量的增加可以有效减小抽样误差的大小。

当样本容量足够大时,样本统计量的分布将更加接近总体参数的分布。

2. 优化抽样方法:选择合适的抽样方法可以降低抽样误差的大小。

例如,分层抽样可以根据总体的重要特征来确定抽样的分层,从而提高样本的代表性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、抽样平均误差
抽样平均误差是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。
例如:假设总体包含1、2、3、4、5,五个数字。
则:总体平均数为 =(1+2+3+4+5)/5=3
现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:25个。
如:(1+3)/2=2、(1+4)/2=2.5、(2+4)/2=3、(3+5)/2=4…
二、抽样推断的内容
参数估计:参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。
假设检验:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。
三、有关抽样的基本概念
(一)总体和样本
总体:又称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。
上式可变形为:Δ=tμ(极限误差是t倍的抽样平均误差)
例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果
平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?
解:已知:N=2000n=400σx=300 =4800
则:
计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。
②抽样平均数的标准差仅为总体标准差的
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?
解:抽样单位数增加2倍,即为原来的3倍
则:
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
抽样单位数增加0.5倍,即为原来的1.5倍
则:
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
采用不重复抽样: 其中:
公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。
例题一:随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?
解:已知:n=100
则:
即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。
第一节抽样推断的一般问题
一、抽样推断的概念和特点
概念:抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。
特点:它是由部分推断整体的一种认识方法。
抽样推断建立在随机取样的基础上。
抽样推断运用概率估计的方法。
抽样推断的误差可以事先计算并加以控制。
样本:又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用“n”表示。
(二)参数和统计量
参数:反映总体数量特征的全及指标。
参数(只有两种表现)
研究总体中的数量标志:总体平均数 、总体标准差
研究总体中的品质标志:总体成数 、成数标准差
统计量:根据样本数据计算的综合指标。
AA
AB
AC
AD
BA
AB
BC
BD
CA
CB
CC
CD
DA
DB
DC
DD
第二节抽样误差
一、抽样误差的含义
由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度
2、样本的单位数
3、抽样方法
4、抽样调查的组织形式
实际上,利用上述两个公式是计算不出抽样平均误差的。想一想,为什么?
抽样平均数平均误差的计算方法
采用重复抽样: 其中:
此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。(当总体标准差未知时,可用样本标准差代替)(教材P180例题)
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。
计算方法:它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。
抽样平均数极限误差:
≤ ≤
抽样成数极限误差:Δp=|p-P|
p-Δp≤P≤p+Δp
五、抽样误差的概率度
含义:抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“t”表示。
公式表示:t=Δ/μ(t是极限误差与抽样平均误差的比值)
多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平均误差是反映抽样误差一般水平的指标。
抽样平均误差的计算公式
抽样平均数的平均误差:
抽样成数平均误差:
(以上两个公式实际上就是第四章讲的标准差。但反映的是样本指标与总体指标的平均离差程度)
例题四:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品300n1=6
则:样本合格率
计算结果表明:不重复抽样的平均误差小于重复抽样,但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。
四、抽样极限误差
含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。
第五章抽样估计
教学目的与要求:抽样估计是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估计。
本章主要内容:抽样推断的一般问题、抽样误差、抽样估计的方法、抽样组织设计
不重复抽样:又称不回置抽样。可能组成的样本数目N(N-1)(N-2)……(N-n+1)
例如:从A、B、C、D四个单位中,抽出两个单位构成一个样本,问可能组成的样本数目是多少?
重复抽样:Nn=42=16(个样本)
AA
AB
AC
AD
BA
AA
AC
AD
CA
CB
CC
CD
DA
DB
DC
DD
不重复抽样:N(N-1)(N-2)…….4×3=12(个样本)
研究数量标志:样本平均数 =∑x/n、 =∑xf/∑f
样本标准差
研究品质标志:样本成数p=n1/n、成数标准差
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用“n”表示。一般要求n≥30
样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
重复抽样:又称回置抽样。可能组成的样本数目:Nn
抽样成数平均误差的计算方法
采用重复抽样: 其中:
采用不重复抽样: 其中:
例题三:某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?
解:已知:n=400n1=80
则:样本成数
即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。
相关文档
最新文档