分层抽样(计算详解)

合集下载

分层抽样

分层抽样
分层抽样
分层抽样
抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当 中。自从 1895 年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议 上提出所谓“代表性调查”的抽样方法以来,经过 100 多年的理论探讨和时间积 累,抽样理论更加科学,抽样技术日臻完善。抽样又称取样。其原理是从研究的 全部样品中抽取一部分样品单位。从被抽取样品单位的分析、研究结果来估计和 推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效 的工作和研究方法。基本的抽样技术包括简单随机抽样,系统抽样,分层抽样, 多阶段抽样等。在实际的抽样调查中我们常常会根据调查成本,调查规模等结合 运用各种抽样方法进行实践。
然后,在每个层中分别独立地进行抽样。
1-1、分层抽样的总体均值估计
在分层抽样中,对总体均值Y 的估计是通过对各层Yh 的估计,安权层Wh 加权
平均得到的,公式为
Yˆst l WhYˆh 1 l NhYˆh
h1
N h1
如果得到的是分层随机样本,则总体均值Y 的简单估计为
yˆst l Whyh 1 l Nhyh
3
Whsh 0.4920+1.2543+3.0744=4.8207
h1
因此按尼曼分配时,各层应分配的样本量为
n1 n
W1s1
3
Wh sh
40 0.4920 4.0824 4.8207
h1

n2 12.290
n3 23.8235
即各层的样本量分别为 4,12,24.
此时的样本估计量的方差为
3 WhSh
Vopt( yst) h1
ch
3
WhSh
n
h1

系统抽样和分层抽样

系统抽样和分层抽样
)综合每层抽样,组成样本.
简单随机抽样、系统抽样、分层抽样的比较
类别 简单 随机 抽样 系统 抽样 共同点 各自特点 从总体中逐个 抽取 (1)抽样过 程中每个个体 被抽到的可能 性相等 (2)每次抽 出个体后不再 将它放回,即 不放回抽样 联 系 适用 范围 总体中 个体 较少
2.书59第3题
3.一个总体中有100个个体,随机编号为0,1,2,…,99, 依编号顺序平均分成10个小组,组号分别为 1,2,3,…,10.现用系统抽样方法抽取一个容量为10的 样本,规定如果在第1组随机抽取的号码为m,那么在第 k组抽取的号码个位数字与m+k的个位数字相同.若 m=6,则在第7组中抽取的号码是______. 63
(1)总体、个体、样本、样本容量分别是什么?
(2)能否在2500名学生中随机抽取100名学生?为什么?
不能
不具有好的代表性 不具有好的代表性
(3)能否在三个年级中平均抽取?
不能
创设情景:
某校高一、高二和高三年级分别有1000,800和700名, 为了了解全校学生的视力情况,从中抽取容量为100的样 本,你认为应当怎样抽取样本较为合理?
解析:依编号顺序平均分成的10个小组分别为 0~9, 10~19, 20~29, 30~39, 40~49,50~59,60~69,70~79,80~89,90~9 9.因第7组抽取的号码个位数字应是3,所以抽取 的号码是63. 这个样本的号码依次是 6,18,29,30,41,52,63,74,85,96这10个号.
例2:一个地区共有5个乡镇,人口15万人,其中人口 比例为3:2:5:2:3,现从15万人中抽取一个1500 人的样本,分析某种疾病的发病率,已知这种疾病与不 同的地理位置及水土有关,问应采取什么样的方法?并 写出具体过程。

【抽样调查】分层随机抽样

【抽样调查】分层随机抽样

【抽样调查】分层随机抽样第2部分:分层随机抽样⽬录概述分层随机抽样的思路:当N ,n 都较⼤,总体单元之间的差异也较⼤时,简单随机抽样会出现⾼成本、低精度情形,解决⽅法是将总体划分为若⼲个⼦总体、减少总体单元之间的差异。

假设在各个⼦总体内已经满⾜实施简单随机抽样的条件,则可以在各个⼦总体内独⽴地进⾏简单随机抽样,再将各个⼦总体参数的估计值进⾏加权,得到总体参数的估计。

分层抽样的概念:层:如果⼀个包含N 个单位的总体可以分成不重不漏的L 个⼦总体,即每个单元必定属于且仅属于⼀个⼦总体,则这样的⼦总体称为层。

有N 1+⋯+N L =N 。

分层抽样:在每⼀层中独⽴进⾏抽样,总的样本由各层样本组成,总体参数⼜按照各层样本参数的汇总作出估计。

有n 1+⋯+n L =n 。

分层随机抽样:每层的样本,都独⽴地按照简单随机抽样进⾏,这样的分层抽样称为分层随机抽样。

符号规定:h :层。

从⽽N h 代表第h 层的单位总数,n h 代表第h 层的样本数。

i :层内单位号。

从⽽Y hi 代表第h 层第i 个总体单元,y hi 代表第h 层第i 个样本单元。

W h :层权,即W h =N h N 。

f h :层内抽样⽐,即f h =n hN h 。

¯Yh,Y h,S 2h:层内总体参数(均值、总值与⽅差)。

¯y h ,y h ,s 2h:层内样本参数(样本均值、样本总值与样本⽅差)。

简单估计量分层抽样⾸先根据各层的样本,计算出各层均值¯Y h的适当估计值ˆ¯Y h ,然后再使⽤总体层权加权平均,得到总体均值¯Y 的估计,即ˆ¯Y st =L∑h =1W h ˆ¯Y h =1N L∑h =1N h ^¯Y h .对于分层随机抽样,每⼀层的ˆ¯Y h就是h 层的样本均值¯y h ,即ˆ¯Y st =L∑h =1W h ¯y h =1N L∑h =1N h ¯y h .注意这⾥的线性形式。

分层抽样(计算详解)

分层抽样(计算详解)

实验题目:1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。

调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及调查的情况:请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。

给出95%的置信区间,并与简单随机抽样进行精度比较。

2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛夜市,或用过年的假期到外地旅游。

为研究这种现象,某研究机构以市中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。

9.030273011===a p933.030283022===a p9.030273033===a p 867.030263044===a p933.030283055===a p 967.030293066===a p867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑pw p hHhst923.0967.0*22.0933.0*16.0≈++06.0*933.0*301*1.0*9.0*301*)1(1)(ˆ21.018.0222+=--=∑p p nf w p hhhhhhstV067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*16.009.014.0222+++838.322.042033.0*967.0*301*-=+P:[)(ˆ96.1p pststV±]=[0.923±1.96*838.34-]=[0.866,0.979]。

分层抽样的案例(文档3篇)

分层抽样的案例(文档3篇)

分层抽样的案例(文档3篇)以下是网友分享的关于分层抽样的案例的资料3篇,希望对您有所帮助,就爱阅读感谢您的支持。

第一篇某市有300所小学,共有240000名学生,这些小学分布在全市5个行政区中,其中重点小学有30所,一般小学有240所,较差的小学有30所。

现在要从全市小学生中抽取1200名学生进行调查,以了解全市小学生的学习情况。

请设计一份抽样方案。

答:分层抽样方案:1、因为有300所小学,240000名学生,假设每所小学的学生人数相同,所以每所小学有学生人数800名。

2、又因为有重点小学30所,一般小学240所,较差小学30所,所以重点小学有学生人数24000名,一般小学有学生人数192000名,较差小学有学生人数24000名。

3、因为要从240000名学生中抽取1200名学生进行调查,所以1200:240000=1:200,即每200名学生中抽取1名学生进行调查,所以由第2步得出24000×1/200=120名;192000×1/200=960名;24000×1/200=120名,然后按照简单随机抽样的方法分别抽取相应的人数。

4、综上所述,要从240000名学生中抽取1200名学生进行调查,应当从30所重点小学中抽取120名学生,从240所一般小学中抽取960名学生,从30所较差小学中抽取120名学生,共计1200名学生。

第二篇作者:金勇进石可统计研究2000年02期一、问题的提出分层抽样中样本量在各层中如何分配,这是抽样设计中的一个重要问题。

计算各层的样本量需要一些辅助信息,如各层中目标变量的方差。

在抽样调查的实践中,特别是一次性的抽样调查中,上述所需的辅助信息常常不具备,因此,我们面临着在信息量最小的条件下如何在各层中分配样本量的问题。

本文产生于作者在美国NORC(National Opinion Research Center)进行研究期间所做的调查设计中的一个实例,这里对其进行了归纳,,加工,提炼与析,希望能够就极小信息量条件下如何在分层抽样中进行样本量的分配这一问题提供一种思考的途径。

高中数学(人教B版)必修第二册:分层抽样【精品课件】

高中数学(人教B版)必修第二册:分层抽样【精品课件】
10
2.下列试验中最适合用分层抽样法抽样的是( ) A.从一箱 3 000 个零件中抽取 5 个入样 B.从一箱 3 000 个零件中抽取 600 个入样 C.从一箱 30 个零件中抽取 5 个入样 D.从甲厂生产的 100 个零件和乙厂生产的 200 个零件中抽取 6 个入样 D [D 选项中甲、乙生产的零件有差异,最适合分层抽样.]
160 [男生人数为 560×5602+80420=160.]14源自合 作探究
释 疑

15
分层抽样的概念 【例 1】 (1)下列各项中属于分层抽样的特点的是( ) A.从总体中逐个抽取 B.将总体分成几层,分层进行抽取 C.将总体分成几部分,按事先确定的规则在各部分中抽取 D.将总体随意分成几部分,然后进行随机抽取
(2)分成的各层互不交叉;
(3)各层抽取的比例都等于样本容量在总体中的比例,即Nn ,其中 n 为样本容量,N 为总体容量.
31
2.计算各层所抽取个体的个数时,若 Ni·Nn 的值不是整数怎么 办?
[提示] 为获取各层的入样数目,需先正确计算出抽样比Nn,若 Ni·Nn 的值不是整数,可四舍五入取整,也可先将该层等可能地剔除多 余的个体.
21
(1)④ (2)分层抽样 [(1)①中对四个饲养房抽取的白鼠平均分, 但由于各饲养房所养数量不一,反而造成了每个个体入选的可能性 不相等,是错误的方法.②中保证了每个个体入选的可能性相等, 但由于没有注意到处在四个不同环境会产生不同差异,不如采用分 层抽样可靠性高,且统一编号、统一选择加大了工作量.③中总体 采用了分层抽样,但在每个层次中抽取时有一定的主观性,貌似随 机,实则每个个体被抽到的可能性无法保证相等.
11
3.甲校有 3 600 名学生,乙校有 5 400 名学生,丙校有 1 800 名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取 一个容量为 90 的样本,应在这三校分别抽取学生( )

分层抽样和随机抽样详解

分层抽样和随机抽样详解

例1:某地农田分布在山地、丘陵、平原、洼地不同的地形上, 要对这个地区的农作物产量进行调查,应当采用什么抽样方法? 解:由于不同类型的农田之间的产量有较大差异,应当采用分 层抽样的方法,对不同类型的农田按其占总数的比例来抽取样 本.
例2:某公司有1000名员工,其中:高层管理人员为50名,属于高 收入者;中层管理人员为150名,属于中等收入者;一般员工为800 名,属于低收入者.要对这个公司员工的收入情况进行调查,欲抽
2.2 分层抽样与系统抽样
1. 正确理解分层抽样、系统抽样的概念,掌握 分层抽样、系统抽样的一般步骤. 2. 掌握分层抽样、系统抽样的特点,并能根据
实际问题确定选用哪种抽样方法.
自学导引
分层抽样的概念
属性特征 分成若干类型(有时称作层),然 将总体按其_________ 随机 抽取一定的样本,这种抽样方法 后在每个类型中_____ 称为分层抽样,有时也称为类型抽样.
调查方案.
解:我们可以采用系统抽样,按照下面的步骤设计方案. 第一步 按生产时间将一天分为50个时间段,也就是说,每个时间段
大约生产
10000 = 200 件产品.这时,抽样距就是200. 50
第二步 将一天中生产的机器零件按生产时间进行顺序编号.比如,第 一个生产出的零件就是0号,第二个生产出的零件就是1号等.
第一步 把这些图书分成40个组,由于 362 的商是9,余数是2,所以每个组 有9册书,还剩2册书.这时,抽样距就是9.
40
第二步 先用简单随机抽样的方法从这些书中抽取2册书,不进行检验. 第三步 将剩下的书进行编号,编号分别为0,1,...,359. 第四步 从第一组(编号分别为0,1,…,8)的书中按照简单随机抽样的方法, 抽取1册书,比如说,其编号为k. 第五步 顺序地抽取编号分别为下面数字的书:k+9,k+18,k+27,…,k+39×9,

2.1.3 分层抽样

2.1.3 分层抽样
分析:保证每个个体等可能入样是简单随 机抽样、系统抽样、分层抽样共同的特征.
(2)如果采用分层抽样,从个体数为N的总体 中抽取一个容量为n样本,那么每个个体被抽 到的可能性为( C )
1 A. N
1 B. n
n C. N
D. N
n
分析:根据每个个体都等可能入样,所 以其可能性等于样本容量与总体容量之比.
定层抽取容量
抽样 组样 结束
要点分析: (1) 当总体是由差异明显的几个部分组成时 ,往往选用分层抽样的方法.
(2)每个个体被抽中的可能性相同 (3)每一层抽取的数=
该层个体数 总体个体数 样本 × 容量
〖探究交流〗 (1)分层抽样又称类型抽样,即将相似的 个体归入一类(层),然后每层抽取若干个 体构成样本,所以分层抽样为保证每个个体 等可能入样,必须进行 (C) A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样 D、以上答案都不对
B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽档法,分层抽样法
5、某单位有工程师6人,技术员12人,技工18 人,要从这些人中抽取一个容量为n的样本;如果采 用系统抽样和分层抽样方法抽取,不用剔除个体; 如果样本容量增加1个,则在采用系统抽样时,需要 在总体中先剔除1个个体,求得样本容量为___. 6
4、(2004年全国高考湖南卷)某公司在甲、 乙、丙、丁四个地区分别有150个、120个、180 个、150个销售点,公司为了调查产品销售的情 况,需从这600个销售点中抽取一个容量为100的 样本,记这项调查为①;在丙地区中有20个特大 型销售点,要从中抽取7个调查其销售收入和销 后服务等情况,记这项调查为②.则完成①、②这 两项调查采用的抽样方法依次是( B ) A.分层抽样法,系统抽样法
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验题目:
1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。

调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行
了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及
调查的情况:
请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。

给出95%的置信区间,并与简单随机抽样进行精度比较。

2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除
夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛
夜市,或用过年的假期到外地旅游。

为研究这种现象,某研究机构以市
中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行
政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个
行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:
试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。

9.03027301
1
===a p
933.030
283022===a p
9.030
27
303
3
===a p 867.03026304
4
===a p
933.030283055
===
a p 967.03029306
6
===a p
867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑p
w p h
H
h
st
923.0967.0*22.0933.0*16.0≈++
06.0*933.0*301
*1.0*9.0*301*)1(1)(ˆ21.018.02
2
2+=--
=∑p p n
f w p h
h
h
h
h
h
st
V
067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*
16.009.014.02
22
+++
838.322.04
2
033.0*967.0*30
1*
-=+
P:[
)(ˆ96.1p p
st
st
V
±]=[0.923±1.96*838
.34
-]=[0.866,0.979]。

相关文档
最新文档