分层抽样

合集下载

分层抽样名词解释

分层抽样名词解释

分层抽样名词解释分层抽样是指从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法,分层抽样是怎么解释的?以下是为大家整理的分层抽样的名词解释,希望对大家有帮助分层抽样的意思分层抽样(stratified sampling)是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。

可以提高总体指标估计值的精确度。

先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的方法。

一般地,在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取一定数量的个体,将各层次取出的个体合在一起作为样本,这种抽样方法是一种分层抽样。

又称分类抽样或类型抽样。

将总体划分为若干个同质层,再在各层内随机抽样或机械抽样,分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。

分层抽样的区别与多阶抽样关系多阶段抽样区别于分层抽样,其优点在于适用于抽样调查的面特别广,没有一个包括所有总体单位的抽样框,或总体范围太大,无法直接抽取样本等情况,可以相对节省调查费用。

其主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。

将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。

因此,分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。

主要区别多阶抽样与分层抽样的主要区别在于:一、分层抽样是对总体中的每个一级样本群体进行全面入样,再对所有的样本进行抽查;而两阶抽样则把总体中所有的群体视为一阶单元,对这些一阶单元进行抽样,将抽出的样本再次进行抽样(两次都不是进行全面的调查),产生两级样本,最后综合估算出总的一级样本指标。

分层抽样法

分层抽样法

分层抽样法:也叫类型抽样法。

它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。

这种方法的优点是,样本的代表性比较好,抽样误差比较小。

缺点是抽样手续较简单随机抽样还要繁杂些。

就是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。

分层抽样:也称分类或类型抽样,是先按与研究内容有关的因素或指标将总体各单位(或个体)分为不同的等级或类型,即层,然后从每一层中按比例或不按比例再用简单随机抽样或机械抽样的方法抽取一定数量的个体构成样本。

最常用的是按比例抽样。

分层抽样的原则是各层内部的差异要尽可能小,而层与层之间的差异要大。

检查用分层抽样:
如设定四个月处方抽100张。

抽二月、四月、六月、八月,每隔4张抽一张,每个月抽25张。

实际是从500张处方抽取得100张,抽样率2%。

日常处方点评用分层抽样:保证样品代表性,即每个处方医师都抽取,考察持续性改进情况。

设定一个月处方抽100张。

统计本期开处方医师数分摊抽样,即每个医师抽样数=100/医师数。

不足加抽上个月问题多的医师处方。

如25个医师处方,每个医师抽样数=100/25=4。

45个医师处方,每个医师抽样数=100/45=2.2即2张,剩余的10张分摊给上月前10名每个人加抽一张。

分层抽样法

分层抽样法

分层抽样法
分层抽样法是统计学中的一种随机抽样方法,它也称之为分层随机抽样法。

它是在抽样过程中以分层的思路来抽取样本,将总体分为固定数量的分层,每一层都代表着总体中某一特定性状的样本。

本质上来说,分层抽样法是在总体中抽取有系统偏差的抽样,它可以给研究者提供一种更高效的方式,从总体中抽取几乎等数量的样本,并且保证样本之间的相关性。

分层抽样法的优点是,能够从总体中比较有效地抽取样本,并可以使得抽取到的样本能够具有一定的特征,可以更好地反映总体的特征。

它还有一个重要的优点就是抽样效率高,可以从总体中抽取有代表性的样本,而且抽取数量可以控制得很准确。

分层抽样法也有一些不足。

其中最为突出的一点就是不能保证抽取到的样本完全反映总体的状态,因为在抽取的过程中可能会漏掉某些特殊的样本。

另外,分层抽样法依赖于层次的准确性,如果层次不准确,可能会导致抽取到的样本不具有代表性,从而影响分析的准确性。

在实际应用中,分层抽样法经常被用于从大量的总体中抽取有代表性的样本,它可以起到降低研究成本、节约时间等作用,是一种常用的统计抽样方法。

在教育调查、社会调查及其他多种研究领域中,分层抽样方法也经常被用来进行总体数据抽取。

综上所述,分层抽样法是一种常用的统计抽样方法,它可以有效地从总体中抽取出反映总体特性的样本,在教育调查、社会调查及其
他多种研究中都可以得到应用。

但是,也存在一些不足,例如层次准确性不足,以及可能抽取到有偏差的样本等,建议我们在使用分层抽样法时要仔细斟酌,以期达到更好的效果。

分层抽样

分层抽样

2 3
400 750
4 1500
50
35
15

20
30
25
10
30
25
解: N = 200+400+750+1500=2580 nh =10( h=1,2,3,4) 各层的层权及抽样比为:

N1 200 W1 0.07018 N 2850 N 400 W2 2 0.14035 N 2850 N 750 W3 3 0.26316 N 2850 N 4 1500 W4 0.52632 N 2850
三、符号说明
关于第h层的记号如下:
第二节 估计量
一.总体均值的估计 (一)简单估计量的定义 对于分层样本,对总体均值Y 的估计是通过对各层的Yh 的估计, 按层权 Wh 加权平均得到的。 公式为:
1 ˆ ˆ Yst WhYh N h 1

L
ˆ N Y hh
h 1
L
如果得到的是分层随机样本,则总体均值 Y 的简单估 计为:
f1 n1 10 0.05 N1 200
n2 10 f2 0.025 N2 400 f3 f4 n3 10 0.013 3 N3 750 n4 10 0.006 7 N4 150 0
各层样本均值及样本方差为:
1 y1 y1i 39.5 n1 i 1 y2 105 y3 165 y4 24


y 15180 300 9856 250 / 550 1)简单估计量的定义 总体比例P的估计为:
L
pst Wh ph
h 1
(二)估计量的性质 如果定义 1, 第i个单元具有所考虑的特征 Yi , 其他 i=1,2 … N 0

分层抽样法

分层抽样法

分层抽样法分层抽样方法是统计学中最常用的两种抽样法之一,它是从样本中抽取统一数量的样本,按一定的比例进行抽样。

具体来说,分层抽样法是按照一定的比例,将总体按一定的特征分为若干层,比如按照年龄分层,按照受访者的地域划分等,然后抽取每一层样本,从而使抽样的结果更加接近总体的客观情况。

分层抽样法有何种特征?1.抽样前,首先要确定总体特征,即总体特征(如地域、性别、年龄);2.抽样前要按特征划分层次:根据特征将总体分为若干层,比如按照年龄段划分成儿童、青年、中年和老年;3.抽样时需要按一定比例进行抽样:即从每一层中按照一定的比例进行抽样,以保证抽样结果更加接近于总体客观情况;4.抽样后要统计抽样结果:即将抽样结果统计出每一层的样本数量,进而得出抽样与总体的误差率。

分层抽样法的优点1.分层抽样结果较为客观:它能够比较准确地反应总体客观情况,准确度高,因此,它的结果更容易与总体结果相比较;2.抽样结果准确可靠:它能够比较准确地反应总体特征,因此可以比较准确可靠地得出抽样结果,不会受外界的影响;3.实现成本低:分层抽样简单易行,耗时耗力较小,实现起来成本也较低,因此被常用于实际研究中。

分层抽样法应用分层抽样法广泛应用于各个领域,比如教育、社会科学、经济等,在调研上是最常用的抽样方法之一。

比如在教育领域,可以利用分层抽样法来研究学校成绩的影响因素;在社会科学领域,可以利用分层抽样法研究社会上不同性别的行为差异等等。

分层抽样法的局限性1.分层抽样法不能准确反映总体细微差异:因为它只能按一定比例抽样,而不能反映总体细微差异;2.抽样结果受划分层次影响:根据不同总体特征适当划分层次对抽样结果影响很大;3.分层抽样法不能大范围分析:由于分层抽样法的规模较小,它不能被用于大范围的分析活动。

结论分层抽样法是一种经济、简便的抽样方法,它能够使抽样结果更加接近于总体客观情况,因此,它常被应用于社会科学、教育、经济等各个领域,然而,它也存在一定的局限性,比如不能准确反映总体细微差异,抽样结果受划分层次影响,不能大范围分析等等。

分层抽样法

分层抽样法

分层抽样法分层抽样法是一种基于统计学原理的定量研究方法,在一个样本总体中,按照划分的层次和抽取的比例,抽取该样本的一定量样本,组成研究的样本组,以进行定量研究。

由于分层抽样法是根据样本总体的结构,充分考虑了样本总体的内在联系,能够更准确的描述样本总体的水平情况,具有较高的科学性和精确性,因此在定量研究中得到越来越广泛的应用。

分层抽样是在识别样本总体内部结构的基础上,将样本总体分层,分成多个子群体,对每个子群体进行抽样,以及各子群体间有效的抽样,以形成一个包含样本总体的分层样本的方法。

该方法把研究的重点放在了研究对象的内部结构上,相对于其它研究方法,分层抽样能够更有效的反映样本总体的分布状况,更可靠地估计样本总体的总体参数,对研究结果的准确性和可靠性有较大的保障。

一般来说,选择分层抽样法作为研究方法,应考虑以下几个基本要素:一、样本总体的内部结构;二、样本总体的分层结构;三、抽样的比例;四、抽样结果的分析方法。

因此,在选择分层抽样的研究方法时,首先要对样本总体进行结构分析,确定样本总体的结构层次和抽样比例;然后根据分层抽样方案,通过计算和抽样,确定研究样本组;最后,选择合适的统计分析方法,对研究结果进行分析和综合,使研究结果更加准确可靠。

分层抽样的优点是,样本的分布更符合样本总体的分布;其次,分层抽样减少了样本量,样本的采集更容易,研究的成本也会相应的减少;最后,分层抽样的样本集更能反映样本总体的分布情况,研究结果更加准确可靠。

然而,分层抽样也有一定的局限性,首先,在分层抽样中,样本总体必须有一定的结构,有足够的数据,否则将无法确定分层结构和抽样比例;其次,仅仅依靠一次分层抽样的结果,很难反映样本总体变化的程度,有可能会出现偏差;最后,分层抽样很难用于复杂的、多层次结构的样本总体,因为抽样比例的设置和样本调查的难度都较大。

总之,分层抽样法是一种被广泛应用的定量研究方法,它能够反映样本总体的内在结构和分布特征,提高研究结果的准确性和可靠性,但也有一定的局限性,在使用分层抽样时,应根据研究内容确定抽样计划,注意抽样的准确性和可靠性,以保证研究的准确性和可靠性。

分层抽样

分层抽样

1.分层抽样的概念当总体由的几部分组成时,为了使抽取的样本更好地反映总体的情况,常将总体中各个个体按某种特征分成若干个的几部分,每一部分叫做层,在各层中按层在总体中进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.2.分层抽样的优点(1)使样本具有较强的.(2)在抽样时,可灵活地选用不同的抽样方法3.收集数据的常用方式有、、4.做试验:根据调查项目的要求来设计一些合适的试验,能够地获得样本数据.5.查阅资料:有些数据资料不容易直接调查得到,这时可以通过查阅统计年鉴、图书馆文献等办法获得所需或相关的数据.还可以通过得到数据资料.6.调查问卷一般由一组、有系统、的题目组成.在调查问卷中,设计题目应注意符合以下要求:(1)问题要,使受调查者能够容易作答.(2)语言,避免出现有歧义或意思含混的句子.(3)题目不能出现的语句.一、课堂练习1.某城市有学校700所.其中大学20所,中学200所,小学480所,现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为() A.70 B.20C.48 D.22.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应在这三校分别抽取学生() A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人3.下列问题符合调查问卷要求的是() A.你所购买的名牌产品,您认为该产品的知名度□很好□一般□很低B.你认为数学学习□较容易□较困难C.你们班有几位大个子同学?________D.你对我们厂生产的电视机□满意□不满意4.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是() A.4 B.5C.6 D.75.某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,从中学中抽取________所学校.6.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.7.某学校高一年级有x个学生,高二年级有y个学生,高三年级有z个学生,采用分层抽样抽取一个容量为45人的样本,高一年级被抽取20人,高三年级被抽取10人,高二年级共有300人,则此学校共有高中学生多少人?8.某工厂有3条生产同一产品的流水线,每天生产的产品件数分别是3 000件,4 000件,8 000件.若要用分层抽样的方法从中抽取一个容量为150的样本,应该如何抽样?二、课后作业9.下列数据适合用试验的方法得到的有() A.2012年的全国人口总数B.某学校抽烟的学生在总人数中所占的比例C.某班男生的平均身高D.顾客对某种产品的满意程度10.某小学三个年级共有学生270人,其中一年级108人,二、三年级各81人,现要用抽样方法抽取10人形成样本,将学生按一、二、三年级依次统一编号为1,2,…,270,如果抽得号码有下列四种情况:①5,9,100,107,111,121,180,195,200,265;②7,34,61,88,115,142,169,196,223,250;③30,57,84,111,138,165,192,219,246,270;④11,38,60,90,119,146,173,200,227,254;其中可能是由分层抽样得到,而不可能是由系统抽样得到的一组号码为() A.①②B.②③C.①③D.①④11.某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号有16件,那么此样本的容量n为________.12.一批产品有一级品100个,二级品60个,三级品40个,分别采用系统抽样和分层抽样,从这批产品中抽取一个容量为20的样本.三、探究与拓展13.某单位有技师18人,技术员12人,工程师6人,需要从这些人中抽取一个容量为n 的样本,如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量增加1,则在采用系统抽样时,需要在总体中剔除1个个体,求样本容量n.问题5一般地,分层抽样的操作步骤如何?答第一步,按某种特征将总体分成若干部分(层);第二步,计算样本容量与总体的个体数之比;第三步,依据抽样比各层分别按简单随机抽样的方法抽取样本;第四步,综合每层抽样,组成样本.小结如果总体中的个体有差异时,那么就用分层抽样抽取样本.用分层抽样抽取样本时,要把性质、结构相同的个体组成一层.探究点三数据的收集问题1在实际统计调查时,一般先要确定什么?答确定需要调查的总体及调查的项目.问题2收集数据通常有哪些方式?答做试验,查阅资料,设计调查问卷.问题3在统计中,通常根据调查项目的要求设计试验来获得样本数据,试验前要做哪些准备?答准备好试验的用具(或组织好观测的对象)、指定专门的记录人员等.问题4做实际调查时往往要设计调查问卷,设计题目时要注意符合什么要求?答(1)问题要具体,有针对性,使受调查者能够容易作答(3)题目不能出现引导受调查者答题倾向的语句.问题5在实际调查时,可以通过哪些方式收集数据?答可以通过邮寄、打电话、派专人调查、网络调查等方式得到数据.答可以通过邮寄、打电话、派专人调查、网络调查等方式。

抽样方法之分层抽样

抽样方法之分层抽样

抽样方法之分层抽样分层抽样是一种常用的抽样方法,适用于样本总体分为几个不同层次的情况。

它将总体划分为若干层次,并从每个层次中选择一部分样本,以保证样本的代表性和可靠性。

以下将详细介绍分层抽样的流程、优点和应用。

分层抽样的流程主要包括:确定分层依据和层数、确定每层的样本容量、随机抽取样本和分析结果。

首先,确定分层的依据。

分层抽样一般根据样本总体的特征,将总体划分为几个层次。

分层的依据可以是地理位置、年龄、性别、教育水平等。

依据总体特征选择合适的分层依据是分层抽样的前提。

其次,确定每个层次的样本容量。

根据每个层次所占总体的比例和分层抽样的目标精度,确定每个层次应该抽取的样本容量。

通常,样本容量与层次所占总体比例成比例关系。

然后,随机抽取样本。

在每个层次中,按照一定的概率分布,随机抽取相应数量的样本。

可以使用随机数表、随机数生成器或者计算机软件等方法进行随机抽样。

通过随机抽样,可以保证每个层次中的样本是具有代表性的。

最后,分析结果。

通过对抽取的样本进行数据分析,得出相应的结论和推断。

对于分层抽样来说,可以对不同层次的样本进行分析比较,揭示总体特征和差异。

分层抽样的优点主要有以下几个方面。

首先,分层抽样可以提高样本的代表性。

通过将总体划分为若干层次,保证每个层次中的样本能够反映该层次在总体中的比例,从而得到更加准确的结果。

其次,分层抽样可以减少抽样误差。

由于分层抽样能够反映总体的分层特征,所以在总体进行估计时,可以根据不同层次的样本比例对总体参数进行加权估计,从而减小估计误差。

再次,分层抽样可以提高调查效率。

由于分层抽样可以根据不同层次的特征,设计不同的调查方法,使得每个层次的调查更加精细和专业,从而提高调查的效率和质量。

分层抽样的应用非常广泛。

在社会科学研究、市场调研、教育评估等领域,都可以使用分层抽样方法。

例如,在进行一项教育调研时,可以根据不同学校的类型、不同年级的学生进行分层抽样,从而得到更具代表性的结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


L
ˆ) Wh 2V (Y h
h 1
性质2 对于分层随机抽样, Yst 是 Y 的无偏估计, Yst 的方差为: L L 1 fh 2 2 V yst Wh V yh Wh2 Sh
h 1 h 1
nh
2 2 2 L L W S W S 1 1 2 ( )Wh2 S h h h h h Nh nh N h 1 nh h 1 h 1 L
L
h 1
y st . ˆ Rc x st
对于分层随机抽样的联合比估计,若总样本量
n
比较大,则有 E ( y RC ) Y
MSE ( y RC ) V ( y RC ) Wh2 (1 f h ) 2 2 ( S yh R 2 S xh 2 R h S yh S xh ) nh h 1
i 1
nh
第h层总体方差
2 1 S Yhi Yh N h 1 i 1 2 h
Nh
nh 1 2 第h层样本方差: s 2 yhi yh h nh 1 i 1
简单估计量
一、总体均值的估计
在分层抽样中,对总体均值 Y 的估计是通过对各层的 Y h 的估计,按层权 W 加权平均得到的。公式为:
L
ˆ ) MSE (YRS ) V (Y RS
L
2 Nh (1 f h ) 2 2 2 ( S yh Rh S xh 2 Rh h S yh S xh ) nh h 1
2 2 S yh , S xh , h , Rh 分别为第h层指标Y和X的方差、相关系数以
及比率估计量。

证明:当 nh
比较大时,有
E ( y Rh ) Yh
MSE ( y RS ) V ( y RS ) (1 f h ) 2 2 2 ( S yh Rh S xh 2 Rh h S yh S xh ) nh
所以 E ( y ) W E ( y ) W Y Y h h h RS Rh
y hi

层权: Wh N h
N

nh 第h层抽样比: f h Nh

第h层总体均值: Yh 1 Nh
Y
i 1
Nh
hi

第h层样本均值:
第h层总体总值: 第h层样本总值:
1 yh nh
y
i 1
Nh i 1
nh
hi

Yh N hYh Yhi

yh nh yh yhi
2 2 又因为 V ( gst ) E( g st ) [E( g st )]2 E( gst )
则有 而
V ( y RC ) V ( g st )
V ( g st ) Wh2
h 1 L
1 fh 2 S gh nh
S
2 gh
Nh 2 1 G G hi h N h 1 i 1 2
V yst Wh V Yh
h 1

证明:
L L L ˆ E Yst E ( WhYh ) Wh E (Yh ) WhYh Y h 1 h 1 h 1 L L L L ˆ 2 V (Yst ) V ( WhYh ) Wh V (Yh ) 2 WhW j cov(Yh , Y j ) h 1 h 1 h 1 j h
2 h
L
性质 9
对于分层随机抽样,V pst 的一个无偏估计
为:
N N h nh ph qh 1 v pst W v ph 2 N h 1 N h 1 nh 1 h 1
L 2 h L 2 h
ph qh W 1 f h nh 1 h 1
h
1 ˆ ˆ Yst WhYh N h 1
L
ˆ N Y hh
h 1
L
如果得到的是分层随机样本,则总体均值 计为:
Y 的简单估
1 L yst Wh yh N h yh N h 1 h 1
L
ˆ 是 Y h 的无偏 性质 l 对于一般的分层抽样,如果 Y h 估计(h=1,2,…,L),则 Yst 是 Y 的无偏估计。 Yst 的 L 方差为: ˆ 2
偏估计(h=1,2,…,L),则
pst 是P的无偏估计。
pst 的方差为:
V pst Wh2V ph
h 1 L
性质8 对于分层随机抽样,
pst是P的无偏估计,则
1 L 2 Nh nh PhQh V pst 2 N h N h1 N h 1 nh
当Nh 1 Nh时,pst的方差为
Ah 记 层 比 例 为 Ph , Qh 1 Ph , 层 样 本 比 Nh ah 例 ph , qh 1 ph ,其中 Ah 与 ah 是第h层总体及 nh
样本中具有所考虑特征的单元数,则总体比例P的
x
估计为:
pst
W
h 1
L
h
P h
性质7
对于一般的分层抽样,如果 ph 是 P 的无 h
2 N 1 h N h nh P 2 h Qh V pst Wh V ph 2 N h 1 N h 1 nh h 1 L L 2 N 1 h N h nh PhQh 2 Nh nh h 1 N L
PhQh W 1 f h nh h 1


L
性质 6
ˆ )的一个无偏估计为: 对于分层随机抽样, V (Y st
L
ˆ N 2v y v Y st h h
h 1


2 L 1 f s 2 h 2 Nh sh N h ( N h nh ) h nh nh h 1 h 1 L
三、总体比例的估计

L
N h N h nh 2 ˆ ˆ 的无偏估计。 v Ast N v pst ph qh 是 V A st n 1 h 1 h

L
比率估计量
分别比估计

要求各层的样本量 nh 比较大。 定义: 对于分层随机抽样,总体均值 Y 和总体总量 Y 的 分别比估计为
机抽样,所得到的样本称为分层随机样本。
符号说明
设总体分为L层,下标h表示层号(h=1,2,…,L)。 则关于第h层的记号如下: 第h层总体单元数: N h (通常已知),且 N h N 第h层样本单元数: n ,且hlnh 1l
h 1
h
n
第h层总体和样本第i个单元标志值(观察值): Yhi
二、总体总量的估计
总体总量Y的估计为: L ˆ ˆ Yst NY Y h st
h 1
如果得到的是分层随机样本,则总体总量Y的简 单估计为:
ˆ Ny Y st st
性质4
ˆ 是 Y 的无偏 对于一般的分层抽样,如果 Y st
ˆ 的方差为: ˆ 是Y的无偏估计。Y 估计,则 Y st st
ˆ ˆ N 2V Y V Y st st
2 L 2 h h
ˆ N W V Y ˆ N V Y

L h 1 h 1 2 h h
性质 5
ˆ 的方差为: 对于分层随机抽样, Y st
L
2 L 1 f S ˆ N2 2 h h ˆ N 2V Y V Y S N ( N n ) st h h h h h h h n nh h 1 h 1 h 1 h

证明:当总样本量n比较大时,有 xst X
所以 y Y y st X R X X ( y Rx st ) y Rx st RC st st x st x st 于是
E ( y RC Y ) E( y st Rx st ) E ( y st ) RE ( x st ) Y RX 0
联合比估计

定义: 对于分层随机抽样,总体均值Y 和总体总量 Y 的联合比估计为
ˆ X y st X y RC R c x st
y st ˆ YRC Rc X X x st
y st Wh y h和 x st Wh x h 分别是 Y 和 X 的分层简单估计量;
h 1 L
h 1 h 1 L L
ˆ N y N [ y ( X h x h )] Y lrs h h lrs h
h 1
L
当各层的回归系数
L
ˆ ) MSE (YRC ) V (Y RC
L
2 Nh (1 f h ) 2 2 ( S yh R 2 S xh 2 R h S yh S xh ) nh h 1
2 2 S yh , S xh , h 分别为第h层指标Y和X的方差以及相关
系数;R为总体比率, R Y / X Y / X 。
2 h
L
性质 10
对于分层随机抽样,总体中具有指定特征
的单元总数A的简单估计量为:
ˆ Np N A Wh ph st st
h 1 L
N
h 1
L
h
ph
且具有如下性质:
ˆ ) A E( A st
2 N h nh P h Qh ˆ V Ast N h N h 1 nh h 1

E ( y RC ) Y
令 Ghi Yhi RX hi 又令 gst yst Rxst 因此
则 Gh Yh RX h 则
E ( gst ) 0
2 V ( y RC ) E ( y RC Y ) E ( y st Rx st )2 E ( g st )
1 Nh Y Y R X X hi h hi h N h 1 i 1
相关文档
最新文档