第七章 抽样调查

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
指标和总体指标的误差不超过一定范 围的概率保证程度(教材P284)
符号表示: P( x - X ≤Δ )x =F(t) (教材P286例题)
理论已经证明,在大样本的情况下,抽 样平均数的分布接近于正态分布,分布特 点是:抽样平均数以总体平均数为中心, 两边完全对称分布,即抽样平均数的正误 差与负误差的可能性是完全相等的。且抽 样平均数愈接近总体平均数,出现的可能 性愈大,概率愈大;反之,抽样平均数愈 离开总体平均数,出现的可能性愈小,概 率愈小,趋于0。(见下图)
例 题 四 解:
已知: N 60000 n 300 n1 6
则:样本合格率 p n n1 300 6 0.98
n
300
p
p1 p 0.98 0.02 0.808(%)
n
300
p
p1
p 1
n
n N
0.98 0.02 1
300
0.806(%)
300 60000
p
二、类型抽样
先对总体各单位按主要标志加以分组,然后再从 各组中按随机的原则抽选一定单位构成样本。
三、等距抽样
先按某一标志对总体各单位进行排队,然后依一 定顺序和间隔来抽取样本单位的一种组织形式。
四、整群抽样
将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的 抽样组织形式。
抽样成数极限误差: p-Δp≤P≤p+Δp
五、抽样误差的可信度(概率度)
含义
抽样误差的概率度是测量抽样估计可靠 程度的一个参数。用符号“ t ”表示。
公式表示:
t=
Δ μ
(t 是极限误差与抽样平均误差的比值)
上式可变形为: Δ = t μ
(极限误差是 t 倍的抽样平均误差)
参看P284-286例题
三、抽样平均误差
抽样平均误差是抽样平均 数或抽样成数的标准差,反映 了抽样指标与总体指标的平均 误差程度。
假设总体包含1、2、3、4、5,五 个数字。 则:总体平均数为
x = 1+2+3+4+5 = 3 5
现在,采用重复抽样从中抽出 两个,组成一个样本。可能组成的 样本数目:25个。
如:
1+3 2
抽样误差不包括下面两类误差:一类是调查误差, 即在调查过程中由于观察、测量、登记、计算上的差 错而引起的误差;另一类是系统性误差,即由于违反 抽样调查的随机原则,有意抽选较好单位或较坏单位
进行调查,这样造成样本的代表性不足所引起的误差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度 2、样本的单位数 3、抽样方法 4、抽样调查的组织形式
第四节 抽样组织设计
一、简单纯随机抽样
1、含义:按随机原则直接从总体N个单位中
抽取 n 个单位作为样本。
2、样本单位数的计算方法:
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
=2
1+4 2
=2.5
2+4 2
=3
3+5 = 4 …….. 2
多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽 样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平 均误差是反映抽样误差一般水平的指标。
抽样平均误差的计算理论公式
抽样平均数 的平均误差
x
xX 2
M
抽样成数 平均误差
某厂生产一种新型灯泡共2000只,随机 抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?
例题一解: 已知: n=100 x=58
σ=10
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题四: 一批食品罐头共60000桶,随机抽查300桶 ,发现有6桶不合格,求合格品率的抽样平 均误差?
例 题 三 解:
已知: n 400 n1 80 则:样本成数 p n1 80 20%
n 400
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例 题 一:
某农场进行小麦产量抽样调查,小麦播种总面积
为1万亩,采用不重复简单随机抽样,从中抽选了
100亩作为样本进行实割实测,测得样本平均亩产 400斤,方差144斤。
(二)全及指标 和 样本指标
全及指标: 反映总体数量特征的指标数值。
∑X
总体平均数 X= N
研究总体中 的数量标志
∑XF X= ∑F
全 及 指 标
研究总体中
总体方差 总体成数
σ
2=
Σ(X-X)2 N
σ
2=
Σ(X-X)2F ΣF
N1 P=
N
的品质标志
(只有两种表现) 成数方差 σ 2 = P(1-P)
愈低,但抽样估计的精确度愈高。
三、总体参数区间估计的方法
(一)根据给定的概率F(t),推算 抽样极限误差的可能范围
分 析 步 骤:
1、抽取样本,计算样本指标。 2、根据给定的F(t)查表求得概率度 t 。 3、根据概率度和抽样平均误差计算极限误差。 4、计算被估计值的上、下限,对总体参数作
出区间估计。
均误差也总是小于重复抽样的平均误差。
采用不重复抽样:
x
2 1
n
n
N
公式表明:抽样平均误差不仅与总体变异程度、 样本容量有关,而且与总体单位数的多少有关。
例题一:
随机抽选某校学生100人,调查他们的体 重。得到他们的平均体重为58公斤,标 准差为10公斤。问抽样推断的平均误差 是多少?
例题二:
抽样极限误差指在进行抽样估计时,根据研究 含义: 对象的变异程度和分析任务的要求所确定的样
本指标与总体指标之间可允许的最大误差范围。 计算方法:设Δx与Δp分别表示样本平均数与样本成数的抽样
极限误差,则有: |x-X|≤Δx,|p-P|≤Δp 上述不等式也可表示成 :
抽样平均数极限误差:x-Δx≤X≤x+Δx
它是由部分推断整体的一种认识方法。 建立在随机取样的基础上。 运用概率估计的方法。 其误差可以事先计算并加以控制。
三、有关的基本概念
(一)总 体 和 样 本
总体: 又称全及总体。指所要认识的 研究对象全体。总体单位总数用“N” 表示。
样本: 又称子样。是从全及总体中随机 抽取出来,作为代表这一总体的那 部分单位组成的集合体。样本单位 总数用“n”表示。
正态概率分布图
因为扩大或缩小以后 的平均误差,就是极 限误差: Δ=tμ 所以,抽样平均误 差的系数就是概 率度t。
68.27%
数理统计已经证明,抽样 误差的概率就是概率度的
函数,二者对应的函数 关系已编成“正态分布 概率表”。
95.45%
x-2μ x-1μ X
x+1μ x+2μ
由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计 的精确度愈低;反之,误差范围愈小,则抽样估计的置信度
通过例题可说明以下几点: ①样本平均数的平均数等于总体平均数。
②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加 2 倍、0.5 倍时,抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
第五节 抽样单位数目的确定
第五节 抽样单位数目的确定
样本单位数的计算方法: 教材P302-306
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
重复抽样: 又称置回抽样。
不重复抽样:又称不置回抽样。
例如:从A、B、C、D四个单位中,抽出两个单位构成 一个样本
重复抽样 16个样本 不重复抽样
12个样本
AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
第三节 抽 样 误 差
一、抽样误差的含义
由于随机抽样的偶然因素使样本各单位的结构不 足以代表总体各单位的结构,而引起抽样指标和全及 指标之间的绝对离差。
• 习题:有5个工人的日产量分别为(单位: 件):6,8,10,12,14,用重复抽样的方法, 从中随机抽取2个工人的日产量,用以代表这5 个工人的总体水平。则抽样平均误差为多少?
若改用不重复抽样方法,则抽样平均误差为多 少?

解:根据题意可得:X
6
8
10 5
12
14
1(0 件)
(X X)2
计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
四、抽 样 极 限 误 差
抽样极限误差是指样本和总体指标之间误 差的可能范围。
由于总体指标是一个确定的数,而样本指 标则是围绕总体指标上下波动的,它与总体指 标之间既有正离差,也有负离差,样本指标变 动的上限或下限与总体指标之差的绝对值就可 以表示抽样误差的可能范围,我们将这种以绝 对值形式表示的抽样误差可能范围称为抽样极 限误差。
第七章 抽样调查
本章主要内容
•抽样调查的一般问题 •抽样误差 •抽样估计的方法 •抽样组织设计
第一节 抽样调查概述
一、抽样调查的概念:是一种非全面调查,
就是按随机原则从全部研究对象中抽取部分
单位进行观察,并根据这一部分单位的实际 数据推断总体的数量特征,作出具有一定可 靠程度的估计和判断。
二、 特点
例题二解: 已知: N=2000 n=400 σ=300 x=4800
则:
x
n
300 15(小时) 400
x
2 1 n 3002 1 400 13.42(小时)
n N
400 2000
计算结果表明:根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。
p
第六节 全集总体指标的推断
一、总体的点估计
点估计的特点:P307
无偏性
总体参数优良估计的标准
一致性
有效性
二、总体的区间估计
教材P271
区间估计的 区方间法估步计骤三:要素
P307
估计值
x, p
抽样误差范围 x , p x , p
抽样估计的置信度 F t
什 么 是 抽 样 估 计 的 置 信 度? 抽样估计的置信度就是表明抽样
p
p P2
M
(以上两个公式实际上就是第四章讲的标准差。 但反映的是样本指标与总体指标的平均离差程度)
实际上,利用上述两个公式是计算不出抽样平均误差的。
想一想,为什么?
抽样平均数平均误差的实际计算方法
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替)(教材P279例题)
40
8(件)
N
5
重复抽样条件下
抽样平均误差 x 8 2(件)
n2
不重复抽样条件下
抽样平均误差
x=
2

N
n )=
n N 1
8( 2
5-2 5-1
)=1.732(件)
抽样成数平均误差的实际计算方法
采用重复抽样:
p
p1 p 百度文库
n
采用不重复抽样: p
p1
n
p 1
n N
例题三: 某校随机抽选400名学生,发现戴眼镜的学 生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?
产品质量 x 数量(件) f
合格品 1
N1
不合格品 0
N0
合计
N
平均数
x xf f
1 N1 0 N0 N1 P (成数)
N1 N0
N
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用 “n”表示。 一般要求 n ≥30
样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
样本指标:
研究数 量标志
样 本 指 标
研究品 质标志
根据样本数据计算的综合指标。
样本平均数
x
=
∑x n
x
=
∑xf ∑f
S
样本标准差
样本成数
S
p=
n n
x
2
x
n
x
2
x
f
f
成数标准差 p p1 p
什么是成数?
将总体所包含的总体单位按某一标志划分为两大部分,具有 某种特征的单位数占全部单位数的比重,就是成数。 成数也是这个总体的平均数。
抽样单位数增加 0.5倍,即为原来的 1.5倍
则: x
1.5n
1 0.8165 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
与重复抽样相比,不重复抽样平均误差是在重复 抽样平均误差的基础上,再乘以 (N-n)(/ N-1) , 而 (N-n)(/ N-1)总是小于1,所以不重复抽样的平
相关文档
最新文档