分层抽样
分层抽样名词解释

分层抽样名词解释分层抽样是指从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法,分层抽样是怎么解释的?以下是为大家整理的分层抽样的名词解释,希望对大家有帮助分层抽样的意思分层抽样(stratified sampling)是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。
可以提高总体指标估计值的精确度。
先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的方法。
一般地,在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取一定数量的个体,将各层次取出的个体合在一起作为样本,这种抽样方法是一种分层抽样。
又称分类抽样或类型抽样。
将总体划分为若干个同质层,再在各层内随机抽样或机械抽样,分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。
分层抽样的区别与多阶抽样关系多阶段抽样区别于分层抽样,其优点在于适用于抽样调查的面特别广,没有一个包括所有总体单位的抽样框,或总体范围太大,无法直接抽取样本等情况,可以相对节省调查费用。
其主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。
将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。
因此,分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。
主要区别多阶抽样与分层抽样的主要区别在于:一、分层抽样是对总体中的每个一级样本群体进行全面入样,再对所有的样本进行抽查;而两阶抽样则把总体中所有的群体视为一阶单元,对这些一阶单元进行抽样,将抽出的样本再次进行抽样(两次都不是进行全面的调查),产生两级样本,最后综合估算出总的一级样本指标。
2.1.3分层抽样

课堂小结
1.分层抽样的定义以及分层抽样的步骤: ①分层 ②求比 ③定数 ④抽样 ⑤组样 2.简单随机抽样、系统抽样、分层抽样的区别和 联系.
【课后作业】
课本P61 探究题 留给大家课后思考
联 系
简单随机抽样 是基础,分层 抽样和系统抽 样转化为简单 随机抽样
适 用 范 围 总体中 个体数 目较少
分层 抽样
(2)每次 抽出个体后 不再将它放 将总体分为几层, 各层抽样时 回,即不放 每层按比例抽取 采用简单随 机抽样或系 回抽样 统抽样
将总体平均分成 在确定第一个 总体中 个体时采用简 个体数 几段,按等距的 单随机抽样 目较多 规则抽取样本 总体是 由差异 明显的 几部分 组成
关于分层抽样,有以下几点需要注意:
①在分层抽样中,要求每层的各个个体互不交叉, 即遵循不重复、不遗漏的原则; ②在分层抽样中,由于各层抽取的个体数与这一 层个体数的比等于样本容量与总体的个体数的比,所 以每一个个体被抽到的可能性都是相等的; ③分层抽样适用于总体由差异明显的几部分组成 的情况,每一部分称为层,在每一层中实行简单随机 抽样或者系统抽样; ④分层抽样中分多少层,要视具体情况而定.总的 原则是:层内样本的差异要小,而层与层之间的差异 尽可能地大,否则将失去分层的意义; ⑤在分层抽样中,由分层抽样确定每层的个体数, 由简单随机抽样或者系统抽样抽出每层的个体.
③某学校有160名教职工,其中教师120名,行政人员16名,
后勤人员24名.为了了解教职工对学校在校务公开方面的意见,
拟抽取一个容量为20的样本.
③分层抽样
简单随机抽样、系统抽样、分层抽样的比较
类别
简单 随机 抽样 系统 抽样
共同点 (1)抽样 过程中每 个个体被 抽到 的可 能性相等
分层抽样1

分析步骤:
一、分层:高一、高二、高三共三层。 二、求比: k n 1 N 10
24 三、定数: 高一45人 男生: 人 21 女生: 人
24 男生: 人 高二44人 20 女生: 人 24 男生: 人 高三46人 22 女生: 人 四、抽样。
例4:
某大学共有全日制学生15000人,其中专科 生3788人、本科生9874人、研究生1338人 ,现为了调查学生上网查找资料的情况, 欲从中抽取225人,为了使样本具有代表性 ,问如何抽样才合适?
问题1:你认为不同年龄段的学生的视力有差异吗?
设计抽样方法时需要考虑这些因素吗? 问题2:请问例1中的总体是什么?总体中的个 体数是多少?样本的容量是多少? 问题3:1%的样本是什么含义? 问题4:请问例1中总体可看成几部分组成?样本 可看成由几部分组成? 问题5:你怎么从各部分 中抽取样本?请动笔试试。 为什么要这样取各个学段 的个体数?
分层抽样的具体步骤是什么?
步骤1:根据已经掌握的信息,将总体分 成互不相交的层 分层 步骤2:根据总体的个体数N和样本容量n 计算抽样比k=n:N 求比 步骤3:确定每一层应抽取的个体数目,并使 每一层应抽取的个体数目之和为样本容量n 定数 步骤4:按步骤3确定的数目在各层中随机 抽取个体,合在一起得到容量为n样本 抽样
目标检测 (1)某校有1000名学生,其中O型血的 有400人,A型血的人有250人,B型血 的有250人,AB型血的有100人,为了 研究血型与色弱的关系,要从中抽取 一个40人的样本,按分层抽样,O型 16 血应抽取的人数为___人,A型血应抽 取的人数为___人,B型血应抽取的人 10 10 数为___人,AB型血应抽取的人数为 ___人。 4
分层抽样
分层抽样法

分层抽样法分层抽样法是一种普遍应用的抽样方法。
它的主要原理是划分总体结构,根据划分的等级来进行抽样,从而获得总体信息。
分层抽样法可以用来采集来自总体中某个特定群体的信息,也可以用来有效地完成任务所需的抽样量。
一、定义分层抽样法是一种抽样法,它将总体分为若干层,不同层之间拥有不同的特征,根据层级关系进行抽样。
分层抽样法可以获得有效且可控的抽样样本,能有效提高抽样准确率,并可以将抽样成本降低到最低。
二、原理分层抽样法的主要原理是划分总体结构,根据划分的等级来进行抽样,从而获得总体信息。
分层抽样法的层级划分有两个步骤:一是划分;二是控制。
在划分步骤中,将总体进行层级划分,即根据总体的特性,将总体分割为若干个类别,即“抽取、感知、描述”;在控制步骤中,从每一层中进行抽样,选择不同层次和不同总体的信息,抽取抽样样本,从而获得总体信息。
三、优点1、分层抽样法可以有效的节省抽样成本,减少采样的成本开支。
2、分层抽样法可以根据总体特征和既定的层次关系来抽取抽样样本,不能受到偶然因素的影响,从而有效提高抽样准确率,使采样结果更加准确,减少误差。
3、分层抽样法可以满足抽样任务所需的抽样量,有效完成抽样任务,可以更好地满足实际需求。
四、缺点1、分层抽样法需要进行较为复杂的层次划分,并且要求抽样样本的特征具有内在的稳定性。
如果采用的层次划分不合理,容易导致抽样误差,影响抽样结果的准确性。
2、分层抽样法需要提前了解被抽样总体的总体特征,可能需要较大的统计分析能力和耗费较多的时间成本。
3、分层抽样法虽然可以节省抽样成本,但由于抽样量较少,导致抽样结果的精确性无法做到极致。
五、应用1、市场调研:分层抽样法在市场调研中常被采用,可以根据消费者的特征、结构、消费习惯进行层级划分,采用不同的抽样样本,从而有效地完成调研任务。
2、政策评估:分层抽样法在政策评估中也有很好的应用,可以根据政策影响的不同地区、不同人群进行层级划分,从每一层中抽取抽样样本,从而可以更有针对性地了解政策的实施情况和影响。
分层抽样

分层抽样分层抽样抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当中。
自从1895年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议上提出所谓“代表性调查”的抽样方法以来,经过100多年的理论探讨和时间积累,抽样理论更加科学,抽样技术日臻完善。
抽样又称取样。
其原理是从研究的全部样品中抽取一部分样品单位。
从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。
基本的抽样技术包括简单随机抽样,系统抽样,分层抽样,多阶段抽样等。
在实际的抽样调查中我们常常会根据调查成本,调查规模等结合运用各种抽样方法进行实践。
分层抽样是通过对总体单位进行分类,即分成若干子总体,子总体之间比较相似,使每一个字总体的方差变小,这样只需要在子总体中抽取少量样本单位,就能很好地代表子总体的特征,从而提高对整个总体估计的精度。
分层抽样需要事先知道各层权重,但在现实情况下有些资料无法提前预知。
这时我们可以先从总体中抽取一个大的初始样本,从而获得有关的辅助信息,然后再从初始样本中抽取一个字样本,这种方法就是双重抽样。
其定义为,当简单性状与复杂性状存在关系时可用抽取简单性状来间接估计复杂性状的抽样方法。
结合分层抽样的双重抽样方法即为分层的双重抽样。
分层抽样,的主要特点就是可以提高估计精度,它不但能对总体进行估计。
同时可以对各层子总体进行估计。
如此便于实际中抽样的组织和实施。
下面我们就分层抽样方法展开讨论,运用实例分析进行比较。
一、分层抽样的原理简介在抽样之前,先将总体N 个单位划分成L 个互不重复的子总体,每个子总体成为层,他们的大小分别为L N N N N ...,,,321,这L 层构成整个总体(1lh N Nh ==∑)。
然后,在每个层中分别独立地进行抽样。
1-1、分层抽样的总体均值估计在分层抽样中,对总体均值Y 的估计是通过对各层h Y 的估计,安权层h W 加权平均得到的,公式为111ˆˆˆllst h h h hh h Y W Y N Y N ====∑∑如果得到的是分层随机样本,则总体均值Y 的简单估计为111ˆllst h h h hh h yW y N yN ====∑∑估计量的性质有性质1:对于一般的分层抽样,如果h Y 是Y 的无偏估计(h=1,2,3…,L ),则ˆstY是Y 的无偏估计。
分层抽样

2 3
400 750
4 1500
50
35
15
0
20
30
25
10
30
25
解: N = 200+400+750+1500=2580 nh =10( h=1,2,3,4) 各层的层权及抽样比为:
N1 200 W1 0.07018 N 2850 N 400 W2 2 0.14035 N 2850 N 750 W3 3 0.26316 N 2850 N 4 1500 W4 0.52632 N 2850
三、符号说明
关于第h层的记号如下:
第二节 估计量
一.总体均值的估计 (一)简单估计量的定义 对于分层样本,对总体均值Y 的估计是通过对各层的Yh 的估计, 按层权 Wh 加权平均得到的。 公式为:
1 ˆ ˆ Yst WhYh N h 1
L
ˆ N Y hh
h 1
L
如果得到的是分层随机样本,则总体均值 Y 的简单估 计为:
f1 n1 10 0.05 N1 200
n2 10 f2 0.025 N2 400 f3 f4 n3 10 0.013 3 N3 750 n4 10 0.006 7 N4 150 0
各层样本均值及样本方差为:
1 y1 y1i 39.5 n1 i 1 y2 105 y3 165 y4 24
y 15180 300 9856 250 / 550 1)简单估计量的定义 总体比例P的估计为:
L
pst Wh ph
h 1
(二)估计量的性质 如果定义 1, 第i个单元具有所考虑的特征 Yi , 其他 i=1,2 … N 0
分层抽样法

分层抽样法分层抽样方法是统计学中最常用的两种抽样法之一,它是从样本中抽取统一数量的样本,按一定的比例进行抽样。
具体来说,分层抽样法是按照一定的比例,将总体按一定的特征分为若干层,比如按照年龄分层,按照受访者的地域划分等,然后抽取每一层样本,从而使抽样的结果更加接近总体的客观情况。
分层抽样法有何种特征?1.抽样前,首先要确定总体特征,即总体特征(如地域、性别、年龄);2.抽样前要按特征划分层次:根据特征将总体分为若干层,比如按照年龄段划分成儿童、青年、中年和老年;3.抽样时需要按一定比例进行抽样:即从每一层中按照一定的比例进行抽样,以保证抽样结果更加接近于总体客观情况;4.抽样后要统计抽样结果:即将抽样结果统计出每一层的样本数量,进而得出抽样与总体的误差率。
分层抽样法的优点1.分层抽样结果较为客观:它能够比较准确地反应总体客观情况,准确度高,因此,它的结果更容易与总体结果相比较;2.抽样结果准确可靠:它能够比较准确地反应总体特征,因此可以比较准确可靠地得出抽样结果,不会受外界的影响;3.实现成本低:分层抽样简单易行,耗时耗力较小,实现起来成本也较低,因此被常用于实际研究中。
分层抽样法应用分层抽样法广泛应用于各个领域,比如教育、社会科学、经济等,在调研上是最常用的抽样方法之一。
比如在教育领域,可以利用分层抽样法来研究学校成绩的影响因素;在社会科学领域,可以利用分层抽样法研究社会上不同性别的行为差异等等。
分层抽样法的局限性1.分层抽样法不能准确反映总体细微差异:因为它只能按一定比例抽样,而不能反映总体细微差异;2.抽样结果受划分层次影响:根据不同总体特征适当划分层次对抽样结果影响很大;3.分层抽样法不能大范围分析:由于分层抽样法的规模较小,它不能被用于大范围的分析活动。
结论分层抽样法是一种经济、简便的抽样方法,它能够使抽样结果更加接近于总体客观情况,因此,它常被应用于社会科学、教育、经济等各个领域,然而,它也存在一定的局限性,比如不能准确反映总体细微差异,抽样结果受划分层次影响,不能大范围分析等等。
分层抽样

1.分层抽样的概念当总体由的几部分组成时,为了使抽取的样本更好地反映总体的情况,常将总体中各个个体按某种特征分成若干个的几部分,每一部分叫做层,在各层中按层在总体中进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.2.分层抽样的优点(1)使样本具有较强的.(2)在抽样时,可灵活地选用不同的抽样方法3.收集数据的常用方式有、、4.做试验:根据调查项目的要求来设计一些合适的试验,能够地获得样本数据.5.查阅资料:有些数据资料不容易直接调查得到,这时可以通过查阅统计年鉴、图书馆文献等办法获得所需或相关的数据.还可以通过得到数据资料.6.调查问卷一般由一组、有系统、的题目组成.在调查问卷中,设计题目应注意符合以下要求:(1)问题要,使受调查者能够容易作答.(2)语言,避免出现有歧义或意思含混的句子.(3)题目不能出现的语句.一、课堂练习1.某城市有学校700所.其中大学20所,中学200所,小学480所,现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为() A.70 B.20C.48 D.22.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应在这三校分别抽取学生() A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人3.下列问题符合调查问卷要求的是() A.你所购买的名牌产品,您认为该产品的知名度□很好□一般□很低B.你认为数学学习□较容易□较困难C.你们班有几位大个子同学?________D.你对我们厂生产的电视机□满意□不满意4.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是() A.4 B.5C.6 D.75.某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,从中学中抽取________所学校.6.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.7.某学校高一年级有x个学生,高二年级有y个学生,高三年级有z个学生,采用分层抽样抽取一个容量为45人的样本,高一年级被抽取20人,高三年级被抽取10人,高二年级共有300人,则此学校共有高中学生多少人?8.某工厂有3条生产同一产品的流水线,每天生产的产品件数分别是3 000件,4 000件,8 000件.若要用分层抽样的方法从中抽取一个容量为150的样本,应该如何抽样?二、课后作业9.下列数据适合用试验的方法得到的有() A.2012年的全国人口总数B.某学校抽烟的学生在总人数中所占的比例C.某班男生的平均身高D.顾客对某种产品的满意程度10.某小学三个年级共有学生270人,其中一年级108人,二、三年级各81人,现要用抽样方法抽取10人形成样本,将学生按一、二、三年级依次统一编号为1,2,…,270,如果抽得号码有下列四种情况:①5,9,100,107,111,121,180,195,200,265;②7,34,61,88,115,142,169,196,223,250;③30,57,84,111,138,165,192,219,246,270;④11,38,60,90,119,146,173,200,227,254;其中可能是由分层抽样得到,而不可能是由系统抽样得到的一组号码为() A.①②B.②③C.①③D.①④11.某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号有16件,那么此样本的容量n为________.12.一批产品有一级品100个,二级品60个,三级品40个,分别采用系统抽样和分层抽样,从这批产品中抽取一个容量为20的样本.三、探究与拓展13.某单位有技师18人,技术员12人,工程师6人,需要从这些人中抽取一个容量为n 的样本,如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量增加1,则在采用系统抽样时,需要在总体中剔除1个个体,求样本容量n.问题5一般地,分层抽样的操作步骤如何?答第一步,按某种特征将总体分成若干部分(层);第二步,计算样本容量与总体的个体数之比;第三步,依据抽样比各层分别按简单随机抽样的方法抽取样本;第四步,综合每层抽样,组成样本.小结如果总体中的个体有差异时,那么就用分层抽样抽取样本.用分层抽样抽取样本时,要把性质、结构相同的个体组成一层.探究点三数据的收集问题1在实际统计调查时,一般先要确定什么?答确定需要调查的总体及调查的项目.问题2收集数据通常有哪些方式?答做试验,查阅资料,设计调查问卷.问题3在统计中,通常根据调查项目的要求设计试验来获得样本数据,试验前要做哪些准备?答准备好试验的用具(或组织好观测的对象)、指定专门的记录人员等.问题4做实际调查时往往要设计调查问卷,设计题目时要注意符合什么要求?答(1)问题要具体,有针对性,使受调查者能够容易作答(3)题目不能出现引导受调查者答题倾向的语句.问题5在实际调查时,可以通过哪些方式收集数据?答可以通过邮寄、打电话、派专人调查、网络调查等方式得到数据.答可以通过邮寄、打电话、派专人调查、网络调查等方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分层抽样
抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当 中。自从 1895 年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议 上提出所谓“代表性调查”的抽样方法以来,经过 100 多年的理论探讨和时间积 累,抽样理论更加科学,抽样技术日臻完善。抽样又称取样。其原理是从研究的 全部样品中抽取一部分样品单位。从被抽取样品单位的分析、研究结果来估计和 推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效 的工作和研究方法。基本的抽样技术包括简单随机抽样,系统抽样,分层抽样, 多阶段抽样等。在实际的抽样调查中我们常常会根据调查成本,调查规模等结合 运用各种抽样方法进行实践。
然后,在每个层中分别独立地进行抽样。
1-1、分层抽样的总体均值估计
在分层抽样中,对总体均值Y 的估计是通过对各层Yh 的估计,安权层Wh 加权
平均得到的,公式为
Yˆst l WhYˆh 1 l NhYˆh
h1
N h1
如果得到的是分层随机样本,则总体均值Y 的简单估计为
yˆst l Whyh 1 l Nhyh
3
Whsh 0.4920+1.2543+3.0744=4.8207
h1
因此按尼曼分配时,各层应分配的样本量为
n1 n
W1s1
3
Wh sh
40 0.4920 4.0824 4.8207
h1
故
n2 12.290
n3 23.8235
即各层的样本量分别为 4,12,24.
此时的样本估计量的方差为
3 WhSh
Vopt( yst) h1
ch
3
WhSh
n
h1
ch 1
3
WhSh2 = 0.5726
N h1
(3)尼曼分配 根据比例分配的计算结果,我们可以得到
W1s1 0.15 10.761 0.4920 W2s2 0.25 25.1716 1.2543 W3s3 0.6 26.2549 3.0744
h1
N h1
估计量的性质有
性质 1:对于一般的分层抽样,如果Yh 是Y 的无偏估计(h=1,2,3…,L),则Yˆst 是Y 的无偏估计。Yˆst 的方差为
V (Yˆst) l Wh2V (Yˆh) h1
在分层抽样中只要对各层估计是无偏的,则对总体的估计也是无偏的。因此,
各层可以采用的不同的抽样方法,只要相应的估计量是无偏的则对总体的推算也
数据进行分组,然后再每层进行简单随机抽样即可。层的划分原则为,层内单位
具有相同性质,通常暗点查对象的不同类型进行划分;尽可能使层内单位的标志
值相近,层间单位的差异尽可能大,从而达到提高抽样估计精度的目的;既按类 型又按层内单位标志相近的原则进行多重分层,达到提高估计值以及提高估计精 度的目的。
2-1、抽样设计的基本思路 1. 调查对象(总体):用随机数生成的模拟数据总体 2. 基本抽样方法:分层随机抽样 3. 精度确定:置信水平为 95% 4. 抽样工具和方法:excel 随机数据生成器和抽样函数 5. 估计量的性质分析 6 .样本最优分配的确定 7.分层抽样设计的效果分析
0
6
5
0
5
4
6
4
3
3
5
2 15 48.7 48.7 51.8 57.4 55.9 50.9 48.7 53.4 50.9 52.7
0
3
3
3
2
0
5
3
0
5
0
3 20 51.0 49.9 49.8 44.5 52.0 44.5 54.5 48.8 56.7 56.7
0
3
3
7
1
9
4
6
4
5
5
4 25 46.6 54.5 50.5 44.2 49.6 52.8 49.8 48.7 49.0 44.8
2-2、抽样的实施
1.总体数据的生成
点击 excel2003 菜单栏中的“工具”—“数据分析”,在选择对话框中“随机
数发生器”,选择“随机数发生器”;在弹出窗口中变量个数选择 2,随机个数取 100
个,分布类型选择“正态”,平均值为 50,标准差为 4。
通过上述方法可以得到 200 个随机数据,再对数据进行调整(见附录)。
nh Nh Wh 或 fh nh n f
nn
Nh N
这时
nh n Nh nWh n
对于分层抽样,总体均值Y 的估计量是 yprop y ,总体比例 P 的估计量是
pprop p 1 l ห้องสมุดไป่ตู้h , yprop 的方差为V ( yprop) 1 f
n h1
n
l
WhSh2 , pprop 的方差为
NhSh
h1
h1
这种分配称为尼曼分配。这时, v( yst) 达到最小,称为最小方差。
V min( yst) 1 ( l WhSh)2 1
l
WhSh2
n h1
N h1
二、抽样设计思路和实施方法
通过运用软件随机数生成的方法来对分层抽样方法进一步阐述,这里需要用
到 Excel 随机数生成和抽样的基本方法,对于分层抽样而言,需要对随机生成的
0
1
6
5
2
6
5
7
3
6
8
3.总体均值与总体总量的估计
由上表 2-1 的模拟数据可以分别计算下面的结果,如下表所示:
表 2-2
h
nh
Nh
Wh
fh
yh
Wh yh
s2 h
1
10
100
0.1429 0.1000 50.0107 7.4616 7.4249
2
10
150
0.2413 0.0667 51.9358 12.6256 9.024
各层的层权与抽样比为:
W1
N1 N
0.15
W2
N2 N
0.25
f1
n1 N1
0.3333
f2
n2 N2
0.2
W3
N3 N
0.6
f3
n3 N3
0.05
各层样本的均值及方差如下表所示:
y1
1 n1
ni i 1
y1i
52.495
9
s12
=
1 n1
n1
( y1i
i 1
2
y)
10.76
1
以此类推, y2 49.0822
s22 =25.1716
y3 49.8801
s32 =26.2549
从而,
3
yst Wh yh 50.0730(元) h1
按比例分配时,各层的样本量为
n1 W1n 0.15 40 6
n2 W2n 0.25 40 10
n3 W3n 0.6 40 24
即各层的样本量分别为 6,10,24。
分层抽样,的主要特点就是可以提高估计精度,它不但能对总体进行估计。 同时可以对各层子总体进行估计。如此便于实际中抽样的组织和实施。下面我们 就分层抽样方法展开讨论,运用实例分析进行比较。
一、分层抽样的原理简介
在抽样之前,先将总体 N 个单位划分成 L 个互不重复的子总体,每个子总体
l
成为层,他们的大小分别为 N1, N 2, N 3..., NL ,这 L 层构成整个总体( N Nh )。 h1
sh2
1-3、样本量的分配
分层抽样中,需要研究总样本量 n 一定时各层应该分配多少样本量。因为对
总体进行估计时,估计量的方差不仅与各层的方差有关,还与各层所分配的样本
量有关。实际工作中根据实际需要选取分配方法。
分配方法 1:比例分配
比例分配指的是按各层单位数占总体单位数的比例,也就是按各层的权层进
行分配,即
2.对随机抽样的数据进行实例模拟
假设这 200 个数据是来自于某地区月水电费支出,以居民户为抽样单位,根
据家庭可支配收入划分 4 层,每层按简单随机抽样抽取 10 户,用 Excel 随机抽样
方法得到如下结果:
表 2-1
户
样本户月水电费支出情况/元
层数 1
2
3
4
5
6
7
8
9 10
1 10 46.3 47.0 52.7 52.5 45.5 51.8 50.2 50.2 51.0 52.5
1-2、分层抽样总体总值的估计
总体总值Y 的估计量为
Yˆ NYˆst l NhYˆh h1
如果得到的是分层随机样本,则总体总值Y 的简单估计为
Yˆ Nyst
估计量的性质有 性质 1:对于一般的分层抽样,如果Yˆst 是Yˆ 的无偏估计,则Yˆ 是Y 的无偏估计。Yˆ 的方差为
V (Yˆ) N 2V (Yˆst) l Nh2V (Yh) l V (Yˆh)
(2)最优分配
对于最优分配,假设 c1 25 , c2 =49, c3 100 ,则可以得到总的成本费用函数为:
3
C c0 chnh h1
最优分配是
N1S1
n1
n
3
c1 19.6824 0.1682 NhSh 117.0064
c h1
h
因此 n1 =6.729 7,同样的可以得到 n2 12 , n3 21。
7
3
4
1
9
43.8 57.4 57.4 47.6 50.5
5
2
2
7
5
50.8 39.7 50.1 57.5 45.2
0
4
8
4
0
8 50.4
1 44.4