分层随机抽样概述(PPT 148页)_8284

合集下载

第4章分层随机抽样-精品文档

第4章分层随机抽样-精品文档
L
ˆ ˆ ˆ ˆ Yu sY ( ), Yu sY ( ) 1 1 2 2
9
例4.2 调查某地区的居民奶制品年消费支出,以居民户为 抽样单元,根据经济及收入水平将居民户分为4层,每层 按简单随机抽样抽取 10 户,调查数据如下,估计该地区 居民奶制品年消费总支出及估计的标准差。 样本户奶制品年消费支出
5
例4.1 总体由1000人组成,按以往的收入情况将总体分成两 层:第一层(高收入层),20人;第二层(低收入层), 980人。从第一层随机抽取2人,调查上月收入,得数据 (单位:元)1200及1600;从第二层随机抽取8人,调查上 月收入,得数据(单位:元)220、230、180、320、400、 340、280、360。估计这1000人上月平均收入。 解: ˆ ˆ Ny Ny Y ˆ 1 Y 2 2 2 Y 11 W Wy 1y 1 2 2 N N 2 0 9 8 0 1 4 0 0 2 9 1 .2 53 1 3 .4 3 1 0 0 0 1 0 0 0
Y 的 置 信 度 为 1 的 置 信 区 间 为 : u s (y , y u s (y y s t s t) s t s t) 1 1 2 2
2 . 总 体 总 和的 Y 估 计 : ˆ Ny ˆ Y ˆ NY Y h h h h st
h 1 h 1 h 1 L L L
f 21 h 2 ˆ ˆ 方 差 V ( Y ) V ( Y ) N V ( y ) N S h s t h h n h 1 h 1 h 1 h
L L 2 h L
1 f 2 2 h ˆ ˆ 方 差 V ( Y ) 的 无 偏 估 计 : v ( Y ) N s h h n h 1 h Y 的 置 信 度 为 1 的 置 信 区 间 为 :

抽样技术-分层随机抽样概述

抽样技术-分层随机抽样概述

19
W1

N1 N

200 2850

0.07018
f1

n1 N1

10 200

0.05
1 n1
y1 n1 i1 y1i 39.5
s12

1 n1 1
n1 i 1
y1i y1 2 1624.722
同理,求得: y2 105
s22 2166.667
y3 165
2020/3/10
17
性质3:对于分层随机抽样, 的一个无偏估计为:
V Yˆ
v Yˆ
L

N
2 h
v
yh
h1

L h1
N
2 h
1 fh nh
s
2 h
2020/3/10
18
例3.1
调查某地区的居民奶制品年消费支出,以居民户为抽样 单元,根据经济及收入水平将居民户划分为4层,每层 按简单随机抽样抽取10户,调查获得如下数据(单位: 元),要估计该地区居民奶制品年消费总支出及其 95%的置信区间。
Wh
Nh N 第 h 层的
层权
fh
nh Nh
第 h 层的
抽样比
Yh
1 Nh
Nh
Yhi
i 1
第 h 层的
总体均值
yh
1 nh
nh i1 yhi
第 h 层的
样本均值
6
记号
Yh
yh
S
2 h
s h2
公式
Nh
Yhi NhYh
i 1
代表的含 义
第 h 层的

9.1.2分层随机抽样课件(人教版)

9.1.2分层随机抽样课件(人教版)

问题1 树人中学高一年级共有712名学生,男生有326名,女生有386名, 若要抽取50名学生的身高作为样本,用简单随机抽样可以吗?为什么? 如何去抽取比较合理?
影响身高因素有很多,性别是其中的一个主要因素.高中男生的身 高普遍高于女生的身高,而相同性别的身高差异相对较小.
可以将男生和女生看作两个群体,分别进行简单随机抽样,然后汇总作 为总体的一个样本,由于在男生和女生两个群体中都抽取了相应的个体, 这样就能有效地避免“ ”样本.
解 初中部人数为 60×1855000=34, 高中部人数为 60×1655000=26,
学校平均视力为6304×1.0+2660×0.8≈0.91,
所以在初中部、高中部各抽34,26人,学校平均视力约为0.91.
反思感悟 求总体平均数的方法有
M (1)M+N
X
+M+N N
Y

(2)MM+N x +M+N N y ;
2.最常用的简单随机抽样
抽签法 随机数法(随机实验、信息技术)
3.总体均值与样本均值
Y
Y1 Y2 YN N
1 N
N
Yi
i1
y
y1 y2 n
yn
1 n
n i1
yi
导语
抽样调查最核心的问题是样本的代表性.简单随机抽样是使总体 中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能 会出现比较“极端”的样本.例如,在对树人中学高一年级学生身高 的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情 形.这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使 得估计出现较大的误差.能否利用总体中的一些额外信息对抽样方法 进行改进呢?
选择抽样方法的规律: (1)当总体的个体数和样本量都较小时,可采用抽签法. (2)当总体的个体数较大,样本量较小时,可采用随机数法. (3)当总体按一个或多个变量可划分为若干个层时,采用分层随机抽样.

9.1.2分层随机抽样课件高一下学期数学人教A版

9.1.2分层随机抽样课件高一下学期数学人教A版

问题三:为什么会出现这种“极端样本”? 抽样结果的随机性个体差异较大
问题四:如何避免这种“极端样本”?
分组抽样,减少组内差距
背景:在高一年级的712名学生中, 男生有326名、女生有 386 名,抽取50人
思考:样本量在男生、女生中应如何分配?
男生样本量=
×总样本量
女生样本量=
×总样本量
人数多的群体应多抽一些,人数少的群体应少抽一些
在比例分配的分层随机抽样中,
对应成比例
我们可以直接用样本平均数 估计总体平均数 .
练习册P106
例3 某校有初中、高中两个部门,其中初中有学生850人,高中有学生650 人,小军想要进行一个视力调查,对学校按部门进行按比例分配分层随机抽 样,得到初中生、高中生平均视力分别为1.0,0.8,其中样本量为60,则在 初中部、高中部各抽取多少人?整个学校平均视力是多少?
D.105
课堂小结 分层随机抽样适用于:总体由差异明显的几个部分组成的情况。 分层随机抽样的步骤:
分层随机抽样中如何用样本估计总体平均值
可以直接用样本平均数 估计总体平均值
课后作业
1、课时作业P235:第1-9、11-15题 2、预习:教材书P185-187《9.1.3获取数据的途径》
9.1.2分层随机抽样
学习目标
1、理解分层随机抽样的概念; 2、掌握用分层随机抽样从总体中抽取样本的方法; 3、掌握两种抽样的区别与联系。
复习回顾
简单随机抽样
放回简单随机抽样 不放回简单随机抽样
简单随机抽样的特点
①总体个数有限 ②逐个进行抽取 ③机会均等抽样
简单随机抽样的常用方法 ①抽签法 ②随机数表法
方法总结
使用分层随机抽样的前提

分层随机抽样概论(PPT 50张)

分层随机抽样概论(PPT 50张)
4
2019/2/15
例题


例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。 为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。 各省再将省内拥有的汽车按经济成分分层。 为提高抽样效率,再对汽车按吨位分层。 例如,某高校对学生在宿舍使用电脑的情况进行调查, 根据经验,本科生和研究生拥有电脑的状况差异较大。 因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。
st
W 2 VY VY h h s t
h 1

L


只要对各层估计无偏,则总体估计也无偏。

各层可以采用不同的抽样方法,只要相应的估计量 是无偏的,则对总体的推算也是无偏的。
8
2019/2/15
证明性质1
由于对每一层有 L L ˆ ˆ ˆ E Y E W Y W E Y st hh h h 因此, h 1 1 h L L L 1 1 Y W Y N Y Y Y h h h h h N N N h 1 h 1 h 1 估计量的方差 L L L L ˆ ˆ ˆ ˆ 2ˆ V Y V W Y W V Y 2 W W Cov Y , Y st h h h h h k hk h 1 h 1 h 1 k h 由于各层是独立抽取的,因此上式第二项中的协方差全 L 为0,从而有
二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个 层或不属于任何一个层。




1.估计:层内单元具有相同性质,通常按调查对 象的不同类型进行划分。 2.精度:尽可能使层内单元的指标值相近,层间 单元的差异尽可能大,从而达到提高抽样估计精 度的目的。 3.估计和精度:既按类型、又按层内单元指标值 相近的原则进行多重分层,同时达到实现估计类 值以及提高估计精度的目的。 4.实施:抽样组织实施的方便,通常按行政管理 机构设置进行分层。

抽样技术第三章_分层随机抽样

抽样技术第三章_分层随机抽样

4

4
4
ˆ v Y ˆ 23208 s Y
ˆ 209650 2 23208 ˆ ts Y Y

2015/11/6
23
三、对总体比例的估计

总体比例P的估计为:pst Wh ph
h 1
L

估计量的性质
对于一般的分层抽样,如果 ph是 P h 的无偏估计 (h 1,2,, L ),则 pst 是 P的无偏估计。 p 的方差为:
W 2V Y V Y h h st
h1

L


只要对各层估计无偏,则总体估计也无偏。

各层可以采用不同的抽样方法,只要相应的估计量是无 偏的,则对总体的推算也是无偏的。
11
2015/11/6
证明性质1
由于对每一层有
ˆ Y EY h h

L L ˆ ˆ ˆ E Y E W Y W E Y st h h h h 因此, h1 h1

L
L
N Y hh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
N
h 1
L
h
yh
10
2015/11/6
估计量的性质

是 Yh 的无 性质1&2:对于一般的分层抽样,如果 Y h 偏估计( h 1,2, , L ),则 Y 是Y 的无偏估计。 st Yst 的方差为:
7
三、符号
所有总体参数的估计量都采用下标“st”以示区别:
记 号 代表的含义
h
下标
i

分层抽样-PPT

分层抽样-PPT
②按照地区分类:大城市、中等城市、城镇、乡镇四个层次。
③按照学校分类:重点、非重点两个层次。
7
为了了解高一年级12000名学生的数学成绩,需要抽 取容量为120的样本,请用合适的方法抽取.
解:(1)对全体学生的数学成绩进行编号:1,2,3……,12000.
(2)分段:由于样本容量与总体容量的 比是1:100,我们 将总体平均分为100个部分,其中每一部分包含100个 个体.
数学必修3
分层抽样
1
数理统计是研究如何有效地收集,整理,分 析受随机影响的数据,并对所考虑的问题作出推断 或预测,直至为采取决策和行动提供依据和建议的 一门学科。它是一门应用性很强的学科,凡是有大 量数据出现的地方,都要用到数理统计。现在,数 理统计的内容已异常丰富,成为数学中最活跃的学 科之一。教科书选择了数理统计中最基本问题来介 绍这门学科的思想与方法。
由于分层抽样的要求不同,各层的抽样的样本容量也不相同, 所以,应当按照实际情况,合理地将样本容量分配到各个层, 以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。
分层抽样适用于总体由差异明显的几部分组成的情况, 每一部分称为层,在每一层中实行简单随机抽样。这种方法较 充分地利用了总体己有信息,是一种实用、操作性强的方法。
(4)按照规则抽取样本:l;l+k;l+2k;……l+nk
系统抽样时,将总体中的个体均分后的每一段进 行抽样时,采用简单随机抽样;系统抽样每次抽样时, 总体中各个个体被抽取的概率也是相等的;如总体的个体 数不能被样本容量整除时,可以先用简单随机抽样从总 体中剔除几个个体,然后再按系统抽样进行。需要说明 的是整个抽样过程中每个个体被抽到的概率仍然相等。11
数理统计所要解决的问题是如何根据样本来推 断总体,第一个问题就是采集样本,然后才能作统 计推断。

第三章 分层随机抽样

第三章 分层随机抽样
N1 N2 NL N
NL ,则有:
2014-12-12
2
定义 4.2 分层抽样(stratified sampling) :又称为类型 抽样或分类抽样。即抽样在每一层中独立进行,总的样 本由各层样本组成, 总体参数则根据各层样本参数的汇 总做出估计,这种抽样就称为分层抽样,所得样本称为 分层样本。设总的样本量为 n ,从 L 个子总体中所抽取的 样本量分别为 n1 , n2 , nL ,则有: n1 n2
W 2V Y V Y h h st
h1

L


只要对各层估计无偏,则总体估计也无偏。

各层可以采用不同的抽样方法,只要相应的估计量是无 偏的,则对总体的推算也是无偏的。
11
2014-12-12
证明性质1
由于对每一层有
ˆ Y EY h h

L L ˆ ˆ ˆ E Y E W Y W E Y st h h h h 因此, h1 h1

L
如果得到的是分层随机样本,则总体总 量的简单估计为:
h 1
Ny Y st
2014-12-12 17
2.估计量的性质
性质1:对于一般的分层抽样,如果 ˆ 是 Y 的无偏估 Yst 是 Y 的无偏估计,则 Y ˆ 的方差为: 计。Y

2 ˆ ˆ ˆ V Y N V Yst V Y h
L


1 L 1 L Y WhYh N hYh Yh Y N h1 N h1 N h 1 估计量的方差 L L L L 2 ˆ ˆ ˆ ˆ ,Y ˆ V Yst V WhYh Wh V Yh 2WhWk Cov Y h k h 1 k h h1 h1 由于各层是独立抽取的,因此上式第二项中的协方差全 L ˆ W 2V Y ˆ 为0,从而有 V Y
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

估计为:
L
1L
yst Whyh
h1
Nh1Nhyh
(二)估计量的性质
性质1 对于一般的分层随机抽样,如果 Yˆh 是 Y h
的无偏估计(h=1,2,…L),则 Yˆst 是Y 的无偏估计。
即对各层估计是无偏的,则对总体的估计也是无
偏的。
Yˆst 的方差为:
VYˆst L Wh2VYˆh
L
合起来就是整个总体(N=
N h )。
h 1
然后,在每个层中分别独立进行抽样,这种抽样就是分层抽样,
所得到的样本称为分层样本。如果每层都是简单随机抽样,则 称为分层随机抽样,所得到的样本称为分层随机样本。
2021/2/27
3
各层中的抽样是独立进行的,因此,在各 层中所采取的抽样手段完全可以不相同, 在一个层进行简单随机抽样,在另一层则 可采用更复杂一些的抽样,完全视各层的 情况不同而定,这种因地制宜的手段将使 样本尽可能反映总体的特性以及子总体的 特性。 分层抽样有时也称为类型抽样或分类抽样。
从该层中抽取的样本的单元值为: yh(ii1,2,..n .h,)
层权:
Wh
Nh N
抽样比: f h
nh Nh
总体均值:Yh
1 Nh
Nh
Yhi
i1
2021/2/27
样本均值:yh
1 nh
nh i1
yhi
10

层内方差:
Sh2
1 Nh
2
Nh1i1(YhiYh)
▪ 样本方差: sh2 nh11inh1(yhiyh)2
2021/2/27
4
分层随机抽样三原则: (1)每层都抽样; (2)各层都独立地抽样; (3)各层的抽样都是简单随机抽样。
2021/2/27
5
(二)特点:
1.分层抽样的抽样效率较高,也就是说分层 抽样的估计精度较高。
注意:
分层抽样估计量的方差只和层内方差有关, 和层间方差无关。
2.分层抽样不仅能对总体指标进行推算, 而且能对各层指标进行推算。
分层随机抽样概述(PPT 148页)
▪ 简单随机抽样只适合小型的抽样调查: 1. 抽样框 2. 代表性 如:了解中国各民族的情况:(鄂伦春族)
2021/2/27
2
第一节 概述
Байду номын сангаас
一.定义与作用 (一)分层抽样和分层随机抽样
不重 不漏
先将总体N个单元划分成L个互不重复的子总体,每个子
总体称为层,它们的大小分为别 N1,N2,..N .L,这L个层
也适用于正态近似其置信区间。
2021/2/27
17
二.总体总量的估计
(一)简单估计量的定义
总体总量Y的估计为: Yˆ NYˆst L Yˆh h1
分层随机样本: Yˆ Nyst
(二)估计量的性质
性质4 对于一般的分层抽样,如果Yˆst 是 Y 偏估计,则Yˆ
是Y的无偏估计。
Yˆ 的方差为:
2021/2/27
11
第二节 简单估计量及其性质
一.总体均值的估计
(一)简单估计量的定义
对于分层样本,对总体均值Y 的估计是通过对
各层的Y h 公式为:
的估计,按层权 W h 加权平均得到的。
YˆstL WhYˆh h1
N 1hL 1NhYˆh
2021/2/27
12
如果得到的是分层随机样本,则总体均值 Y 的简单
行划分,这时,分层抽样能够对每一类的目标量进行估 计。 2.尽可能使层内单元的标志值相近,层间单元的差异尽可 能大,从而达到提高抽样估计精度的目的。 3.既按类型又按层内单元标志值相近的原则进行多重分 层,同时达到实现估计类值以及提高估计精度的目的。 4.为了抽样组织实施的方便,通常按行政管理机构设置进 行分层。
h1
由于各层的抽样
2021/2/27
是相互独立的
13
证明:因各层抽样是相互独立,则Yˆh 也相互独立,
则有 covYˆh,Y ˆj 0
VYˆst
VhL1WhY ˆhhL 1Wh2VY ˆh
L
2
L WhWjcoY vˆh,Y ˆj
h1 jh
L Wh2VYˆh h1
2021/2/27
性质6 对于分层随机抽样, V (Yˆ ) 的一个无偏估计为:
v(Y ˆ)hL 1N h2v(yh)hL 1N h21 nhfhsh2
2021/2/27
20
P69
【例3.1】调查某地区的居民奶制品年 消费支出,以居民户为抽样单元,根据经 济及收入水平将居民户划分为4层,每层 按简单随机抽样抽取10户,调查获得如 下数据(单位:元),估计该地区居民奶
2021/2/27
18
V (Yˆ ) V
N Y st
N 2V (Yˆst )
L
V (Yˆh )
N2LW h2V(Yˆh)L
h 1
Nh2V(Yˆh)
h1
h1
2021/2/27
19
性质5 对于分层随机抽样,Yˆ 的方差为:
V (Y ˆ)hL 1N h2 V (Y ˆh)hL 1N h21 nhfhSh2
14
性质2 对于分层随机抽样 , y st 是 Y y st 的方差为:
的无偏估计,
V ( yst )
L
Wh2V ( yh )
h1
L
Wh 2
h1
1 fh nh
Sh2
L Wh2
h1
1 nh
1 Nh
Sh
2
L Wh2Sh2 L WhSh2
h1 nh
h1 N
2021/2/27
15
性质3 对于分层随机抽样, V ( yst ) 的一个无偏估 计为:
2021/2/27
8
如:对全国汽车货运量调查,目的是不仅要 了解全国货运量,而且推算不同经济成分 货运量。
首先为组织方便,按省分层;各省再按 经济成分分层;为提高抽样效率,再按吨位 分层。
2021/2/27
9
三.符号说明
层号:h(h=1,2…,L) 第h层的记号如下: 单元总数:N h 样本单位数:n h 第i个单元标志值为: Yh(ii1,2,..N .h ,)
L
v ( y st ) W h 2 v ( y h ) h 1
L h 1
W
2 h
1
fh nh
sh
2
L W h 2 s h 2 L W h s h 2
h1 n h
h1 N
2021/2/27
16
▪ 注:
当 Nh, nh与 Nhnh适当的大,各层样本
平均数 y h 均可适用正态近似,因此一般地 y st
如:消费物价指数(全国和各省) 3.层内抽样方法可以不同,而且便于抽样
工作的组织。
2021/2/27
6
(三)作用
可以对各层的参数进行估计, 有助于提
高估计精度。
2021/2/27
7
二.使用场合
应用条件: 适合于各层差异较大,有进行分层的辅助信息。
层的划分原则: 1.层内单元具有相同性质,通常按调查对象的不同类型进
相关文档
最新文档