抽样技术第6章 不等概率抽样

合集下载

自考-市场调查与预测-第6章-抽样方法

自考-市场调查与预测-第6章-抽样方法

1 定义总体 确定调查对象全体:从抽样元素、抽样 单位、抽样范围、抽样时间角度考虑 例如…

2 确定抽样框架 抽样总体中,抽样元素的表现形式。总体中 的每一个元素都在抽样框架中出现一次,且 仅出现一次。如户籍簿。 适用性、完整性。 3 确定抽样单位 容纳总体的基本单位,大于等于样本元素。 取决于抽样框架和调查方法。 电话调查——电话号码 邮寄调查——地址或姓名

B 平均值估计 C 百分比估计样本容量

根据允许误差大小估计样本量
不同抽样方法样本容量的确定 影响因素: 调查目的;总体大小;总体构成;抽样方式 计算公式:见表6-4

其它调查方法介绍
2、自愿样本
被调查者自愿参加,成为样本中的一分子,向
调查人员提供有关信息

例如,参与报刊上和互联网上刊登的调查问
第6章 抽样方法
普查与抽样调查 抽样程序
常用抽样方法
样本容量的确定
6.1普查与抽样调查
抽样设计的重要性 案例6-1 普查的相关概念和案例 P159 抽样调查的概念 抽样是通过抽取总体中的部分单位,收集 这些单位的信息,从而对总体进行推断的 一种手段。 抽样调查的含义 P163 抽样调查的适用范围
第一节 抽样方法

6.3 常用抽样方法
1 简单随机抽样 2 分层随机抽样 3 分群随机抽样 4 等距随机抽样 5 任意抽样 6 判断抽样 7 配额抽样 8 滚雪球抽样

1 简单随机抽样 1、抽样方法 根据研究目的选定总体,首先对总体中所 有的观察单位编号,遵循随机原则,采用不放 回抽取方法,从总体中随机抽取一定数量观察 单位组成样本。 2、具体方法 ①抽签法

(硕)《抽样技术》第三讲 等概率与不等概率抽样比较研究

(硕)《抽样技术》第三讲  等概率与不等概率抽样比较研究

三、严格的πPS抽样
n是固定的;一阶包含概率与单 是固定的; 位规模大小严格成比例, 位规模大小严格成比例,即
πi = nZi
1.当 n = 2 的情况下 1.当 布鲁尔估计法: 布鲁尔估计法: 要求: 要求:总体中最大的单位必须小 于全部单位大小总和的 1 2
记第一个被抽取的单位为i 记第一个被抽取的单位为i,第一个单位 成比例的概率抽取。 按与 Z i (1 − Z i ) 成比例的概率抽取。
设从总体中不放回地抽去 n 个 单位, 单位, 令 π i 为第 i 个单位入样的概率 (一阶包含概率). 一阶包含概率). π ij 为第 i 和第 j 个单位同时入 样的概率(二阶包含概率). 样的概率(二阶包含概率).
1. 霍维茨 汤普森估计量 霍维茨-汤普森 汤普森估计量
总体总值的估计量 X ˆ 估计量的方差为
2
( )
ˆ xi XHH M = ∑ m − M n ( n −1) i=1 i 0
第三节 不重复的 不等概率抽样
一、基本概念 1. πPS 抽样:不放回的与单元规模 抽样:
大小成比例的概率抽样称为严格的
πPS 抽样。 抽样。
2. 在不重复的不等概率抽样中,总 在不重复的不等概率抽样中, 体中的每个单位每次被抽中的概率 为 Zi 。
两个单位同时入样概率称为 二阶包含概率。 二阶包含概率。
包含概率的性质: 包含概率的性质:
(1)
∑π
i =1 N
N
i
=n = ( n − 1) π i
(2)
∑π
i≠ j N
ij
1 ∑∑i π ij = 2 n ( n − 1) (3) i =1 j >
N

市场调查-第六章抽样技术

市场调查-第六章抽样技术

N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。

抽样技术期末知识点(附考点大题)

抽样技术期末知识点(附考点大题)

抽样期末知识点汇总一.绪论(一)抽样调查抽样调查是指非全面调查的总称。

只要是从研究的对象中抽取部分单位加以调查,用来说明全体,就统称为抽样调查。

(广义)选样方法:非概率抽样&概率抽样1.非概率抽样抽样方法:目的抽样、判断抽样、任意抽样、方便抽样、配额抽样(盖洛普民意测验、自愿样本原因:(1)受客观条件限制,无法进行严格的随机抽样。

(2)为了快速获得调查结果。

(3)在调查对象不确定,或无法确定的情况下采用,例如,对某一突发(偶然)事件进行现场调查等。

(4)总体各单位间离散程度不大,且调查员具有丰富的调查经验时。

优点:成本低,而且容易完成;缺点:不能对估计的精度作出客观、准确的说明。

2.概率抽样(狭义抽样调查)按照概率统计的原理,从研究的总体中按随机原则来抽选样本,通过对样本的调查获取数据,以此来对总体的特征作出估计推断;对推断中可能出现的抽样误差可以从概率的意义上加以控制。

特点:(1)对于一个具体的调查,要求总体中的每一个单元都有一个已知的非零概率被抽中。

(2)抽取样本的方法必须是随机的。

(3)根据样本来计算估计值的方法,应符合抽样的方法确定合适的估计量。

(4)能够以一定的概率控制抽样误差的范围。

概率抽样:等概率抽样&不等概率抽样(二)抽样调查的常用概念1. 目标总体:可简称为总体,是指所要研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成,组成总体的各个个体称作总体单元或单位。

2.抽样总体:指从中抽取样本的总体。

3.抽样框:抽样总体的具体表现。

通常抽样框是一份包含所有抽样单元的名单。

4.总体参数:总体的特征。

5. 统计量(估计量):样本观察值的函数。

6.抽样误差:由于抽样的非全面性和随机性所引起的偶然性误差。

7.非抽样误差:由随机抽样的偶然性因素以外的原因所引起的误差。

8.抽样误差表现形式:抽样实际误差、抽样标准误和抽样极限误差。

9. 抽样标准误(S ),抽样方差(V ),V=S 210.偏差:样本估计量的数学期望与总体真值间的离差,ˆˆE()-()ˆB θθθ=。

应用抽样技术_3版(李金昌主编)PPT模板

应用抽样技术_3版(李金昌主编)PPT模板

著名抽样专家简介
17
第十一章非抽样误差
第十一章非抽 样误差
0 1
第一节非抽样 误差构成
0 4
第四节计量误 差分析
0 2
第二节抽样框 误差分析
0 5
本章小结
0 3
第三节无回答 误差分析
0 6
思考与练习
第十一章非抽样误 差
著名抽样专家简介
18
主要参考文献
主要参考文献
19
封底
封底
感 谢 聆 听
第三版前言
07
第一章抽样技术概述
第一章抽样技 术概述
01 第一节什么是抽样 02 第二节抽样技术的
技术
产生与发展
03 第三节抽样技术的 04 本章小结
应用
05 思考与练习
06 著名抽样专家简介
08
第二章抽样技术基本概念
第二章抽样 技术基本概

0 1
第一节总体与 样本
0 4
第四节样本设 计
0 2
16
第十章其他抽样方法技术
第十章其他抽样方法技术
01
第一节样本轮 换
02
第二节双重抽 样
03
第三节随机化 装置
04
第四节交叉子 样本
05 本章小结
06
思考与练习
单击此处添加标题
单击此处添加文本具体内 容,简明扼要的阐述您的 观点。根据需要可酌情增 减文字,以便观者准确的 理解您传达的思想。
第十章其 他抽样方 法技术
第二节估计量 与抽样分布
0 5
本章小结
0 3
第三节抽样误 差与置信区间
0 6
思考与练习
第二章抽 样技术基 本概念

抽样技术之不等概率抽样概述ppt(67张)

抽样技术之不等概率抽样概述ppt(67张)

不等概率抽样的分类
放回不等概抽样:按照总体单元的规模大小来确定在每次抽 中的概率。抽取后放回总体,再进行下一次抽样,每次抽
样都是独立的。这种抽样称为放回不等概抽样(sampling with probabilities proportional to sizes,简称PPS抽样)
• 不放回的不等概抽样:每次在总体中对每个单元按入样概 率进行抽样,抽出的样本不再放回总体,因此,在抽取了 第一个单元后,余下的单元再以什么概率被抽取就较复杂。 这种抽样不是独立的,无论是抽样方法还是方差估计,都 要比放回抽样繁复得多。不放回抽样通常称为πPS抽样。
7
10
100
631 532~631
8
3.6
36
667 632~667
9
6
60
727 668~727
10
1.1
11
738 728~738
=73.8
738
假设在[1,738] 中等概产生第一个随机数为354,再在[1,738]中产生第二 个随机数为553,最后在[1,738]中产生第三个随机数为493,则它们所对 应的第5,7,6号单元被抽中。
不等概率抽样的特点
1、凡需使用不等概率抽样的场合,必须提供总体单 元的某种辅助信息。 例如:每个单元的“大小”度量Mi。注意:比估计 和回归估计是估计方法用到了辅助信息,本章是抽 样方法用到辅助信息.
2、不等概率抽样的主要优点是由于使用了辅 助信息,提高了抽样策略的统计效率, 能 显著地减少抽样误差。
例5.1 设某个总体有10个单元,相应的单元大小及其代码 数如下表,在其中产生一个n=3的样本。
i
Mi
Mi*10
累计
代码

抽样技术7不等概率抽样

抽样技术7不等概率抽样

抽样技术:7不等概率抽样1. 引言在进行数据分析和统计研究时,抽样是一种常用的技术。

抽样技术允许我们从总体中选择一个样本,以便推断总体的性质。

在抽样技术中,不等概率抽样是一种常见的方法,它允许我们以非均匀的概率抽取样本。

本文将介绍关于7种不等概率抽样方法的详细信息。

2. 简单随机抽样简单随机抽样是最基本的抽样方法之一,它要求每个个体被选中的概率相等且任意组合都是可能的。

然而,在某些情况下,简单随机抽样可能并不适用,例如当总体分布不均匀时,或者我们希望在样本中增加一定的多样性。

这时,我们可以考虑使用不等概率抽样方法。

3. 整群抽样整群抽样是一种不等概率抽样方法,它将总体划分为若干个互不重叠的群组(或称为簇),然后从每个群组中抽取样本。

整群抽样可以有效地减少抽样过程中的复杂性,并提高样本的效率。

整群抽样常用于调查社会群体或大型组织等场景。

4. 分层抽样分层抽样是一种根据总体特点进行划分的抽样方法,它将总体划分为若干个层级或相似的子群(层),然后从每个层中抽取样本。

通过分层抽样,我们可以保证样本在各层中的分布情况与总体相似,从而更为准确地推断总体的特征。

5. 系统抽样系统抽样是一种按照固定间隔选择样本的抽样方法。

它类似于简单随机抽样,但是通过定义一个间隔,我们可以按照一定的规律抽取样本。

例如,我们可以在总体中选取每隔一定数量的个体作为样本。

系统抽样在样本大小较大时表现出较高的效率。

6. 按比例分层抽样按比例分层抽样是一种常用的不等概率抽样方法,它根据总体各层的比例确定各层的样本容量。

比例分层抽样可以使得样本在各层中的分布与总体的比例相对应。

这种抽样方法适用于总体中的各个层存在不同比例的情况。

7. 两阶段抽样两阶段抽样是一种复杂的不等概率抽样方法,它将抽样过程分为两个阶段。

在第一阶段,我们从总体中选择一部分群组(或称为簇),在第二阶段,我们从每个群组中抽取一定数量的样本。

两阶段抽样适用于总体较大或分布复杂的情况下,可以提高抽样的效率。

应用抽样技术答案

应用抽样技术答案

3.5解:已知
PQ (1) 由 n0 得: V ( p)
1 0
P1= 0.08, Q1= 1-P1 = 0.92; P2= 0.05, Q2 = 1– P2 = 0.95; V(p) = 0.05*0.05

0.08 0.92 n 30 2 0.05 Q 得: (2) 由 n0 2 Cv ( p) P
(2)事后分层
Ppst=ΣhWhph=0.7*1/43+0.3*2/57=0.0268 V(Ppst) =ΣhWh2[(1—fh)/(nh—1)]phqh =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942
第五章 比率估计与回归估计
N1 的95%的置信区间为: (159,776)
(3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1-0.267=0.733 由此可计算得: t 2 q 1.962 0.733 n0 2 1054.64 r p 0.01 0.267
n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659
21 22 23 24 25 26 27 28 29 30
49 45 95 36 25 45 128 45 数据,有:
1682 2 56.07(元), s y (118266 16822 / 30) / 30 798.73 yi 1682, y 30
回归系数 b = Sxy/Sxx2= 370.5965 ylr=x—b(x—X)=1260—370.5965*(2.97—460/140)=1377.089
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第6章 不等概率抽样1 不等概率抽样原理等概率抽样通常容易设计和解释,但并不总是如不等概率抽样一样的可行、实用、有效。

因为等概率抽样(psu’s)可能导致方差很大(尤其是对于无偏估计量)、管理困难以及成本难以控制。

而不等概率抽样的特点是以不等概率抽取psu’s 、m i 的数目相同,因此不等概率抽样使得每一个样本被抽取的概率相等、调查成本可控、每一个初级样本单元(psu )的样本数相等、方差急剧减小。

当采用不等概率抽样时,我们可以自由的调整选择不同初级样本单元(psu’s )作为样本的概率,并在估计中补充合适的权重。

核心是选择一个给定单元的概率已知: πi =P(psu i), ψi = P(psu i on first sample), ωi =1/πi1.1 抽取一个初级样本单元假定我们只要抽取N 个初级样本单元(psu )中的一个作为样本(n=1)。

初级样本单元i 的总值用t i 表示,我们需要估计总体总值t.用抽取一个初级样本单元的简单例子来说明不等概率抽样的思想。

先来考虑一个所有总体已知的情形。

一个城镇拥有四个超市,从100平方米到1000平方米按面积大小排列。

通过抽取一个超市,来估计四个超市上个月的总营业收入。

你可能预期大超市比小超市的营业收入多而且大超市的收入波动性也明显大于小超市。

因为仅抽取一个超市,所以在第一个回合中一个超市被抽取的概率 ψi 等于这个超市包含在样本中的概率πi 。

即,πi = ψi =P(超市i 被选取),此概率与超市的面积成比例。

超市A 占四个超市总面积的1/16,则它被抽取的概率为1/16。

为了说明性目的,假定我们已知总体的所有总值t i :我们可以以以上给定的概率选择一个容量为1的概率样本,通过洗散16张卡片并从中选择1张。

如果卡片数字为1,则选择超市A;如果卡片数字为2或3,则选择超市B;…… 在估计量中,我们通过使用 ψi 补充选取的不等概率权重。

如果超市面积与超市营业收入近似成比例,那么超市A 的营业收入在总收入的1/16,则可用超市A 的营业收入的16倍来估计四个超市的总收入。

同理,单元i 的抽样权重是选择概率的倒数: ωi =1P(unit i in sample)=1ψi这样,容量为1的不等概率抽样的总体总值估计量为:t ψ=∑ωi t i i∈S =∑tiψii∈S 。

四个容量为1的样本来自于这个简单总体:根据定义,E[t ψ]=∑P(S)possible samples S t ψs=116(176)+216(160)+316(128)+1016(392)=300当然,t ψ是无偏的,因为一般地,E[t ψ]=∑ ψit i ψiN i=1=t 。

t ψ的方差:V[t ψ]=E[(t ̂ψ−t)2]= ∑P(S)possible samples S (t ̂ψ−t)2=∑ ψi (t iψi−t)2N i=1。

对于这个例子,V[t ψ]=14248。

比较容量为1的简单随机抽样的结果,因为 ψi =1/4,所以1ψi=4=N 。

同理,t SRS 也是无偏的,但是这个例子中SRS 方差远远大于不等概率抽样的方差。

因为我们认为超市面积与超市营业收入相关联,在抽样设计中,我们使用了这个辅助信息。

抽取一个样本单元与我们想象的有些不同。

许多大型,复杂调查分层很细以致于每一个层仅包括少量psu’s 。

分许多层有利于提高调查估计的精确性。

在这样一个调查中,从每一层中选择一个初级样本单元非常合理。

但是,仅仅选择一个初级样本单元,我们则没有在每一层内估计psu’s 之间的变动性。

当大型调查组织仅从每层中抽取一个初级样本单元时,他们经常用其他方法分开被选初级样本单元来估计层内方差。

2 有放回不等概率抽样2.1 一阶段有放回抽样在一阶段有放回抽样中,每一个样本单元以相同概率独立的被抽取,相同的单元拥有相同的总体数目(以被抽取的次数作为权重),每一个单元用于估计总体然后取平均值。

现在假定n>1,采用有放回抽样。

有放回抽样意味着在抽取第一个单元之后,选择概率不会发生变化。

令 ψi=P(select unit i on the first draw)。

如果我们采用有放回抽样,那么 ψi等于单元i在第二回被抽取的概率,或者第三回被抽取的概率……单元i在至少一次在样本中的总概率为πi=1−P(unit i is not in sample)=1−(1− ψi)n若n=1,则πi= ψi。

这样,不等概率抽样思想变得非常简单。

有放回抽取n个psu’s。

然后估计总体总值,使用前部分的估计量,独立的抽取每一个初级样本单元(psu)。

有些psu’s可能被抽取多次,使用一个给定psu计算的总体总值包括的次数跟psu被抽取的次数一样多。

因为psu’s被有放回地抽取,所以我们可得到n个独立的总体总值估计值。

则我们去这n个值的平均来估计t。

估计方差是这n个独立估计的样本方差的平均值。

2.1.1 选取初级样本单元(psu’s)2.1.1.1 累积量法我们拥有许多以不等概率抽取psu’s的方法。

所有方法都要求你对总体中所有psu’s的容量已知。

累积量法拓展了先前的方法:产生一些随机数,psu’s对应这些随机数被包括在样本中。

对于超市的例子,我们从标记1到16的卡片中抽取。

如果抽到1,则选择超市A;……采用有放回抽样,抽取一个psu后,放回卡片,继续抽取。

当然,当 ψi’s与 M i’s不成比例,我们可以采用不得概率抽样:简单的从累积 ψi区间,抽取0到1之间的均匀随机数。

系统抽样常用于比较大型、复杂的样本中,选择psu’s,但不是有放回的产生随机数。

系统抽样无放回的抽取一个样本,但是在大型总体中,有放回抽样和无放回抽样非常相似,因为一个单元被抽到两次的概率很小。

为系统的抽取psu’s,在样本中为第一个psu排列总体元素,接着排列第二个psu的元素……然后提取一个元素。

被选取的psu’s是至少有一个元素在系统的所有元素中。

Psu越大,它被选取的概率就越大。

假如某统计班总共有647个学生。

采取一个系统抽样,从1到129之间抽取一个随机数k,分别选择学生k、(k+129)、(k+2∗129)、(k+3∗129)、(k+4∗129)所对应的班级。

假定我们选择的开始值为112.那么系统抽样选择的psu’s如下:越大的班级(psu中。

系统抽样不能给我们一个真实的有放回随机抽样,因为对于只有129名学生或更少的班级不可能出现两次,而多于129名的班级被抽中的概率为1.然而,在许多总体中,系统抽样比其他给出随机数的方法更容易执行。

如果psu’s地理上的安排,系统抽样可能要求被选择的psu’s在许多地区摊开并且可能比有放回的随机抽样给出更好的结果。

2.1.1.2 Lahiri(拉希里)方法当psu’s 的数目很大时,拉希里方法比累积量法更加实用。

它是一种拒绝性的方法,因为你产生一些随机数以选择psu’s ,并且如果psu 容量很小时,拒绝其中一些数字。

令N=总体中psu’s 的数目且max {M i }=最大psu 容量。

拉希里方法可以产生一个被要求概率的有放回抽样。

拉希里方法的步骤如下:①抽取一个属于1到N 之间的随机数。

这个数确定你将考虑的psu 。

②抽取一个属于1到max {M i }之间随机数;如果随机数小于或等于M i ,那么把psu i 作为样本;否则,回到第一步。

③重复直到得到满意的样本容量。

2.1.2 估计理论因为采用有放回抽样,样本可能多次包括相同的单元。

为了知道某个psu’s 在样本中出现的次数,定义随机变量Q i :Q i =number of times unit i occurs in the sample那么,t ψ是作为样本的单元的所有ti ψi 的平均值:t ψ=1n ∑Q i t iψiNi=1 (1)如果一个单元在样本中出现k 次,在估计量中它也被计算k 次。

假定∑Q i N i=1=n 且E [Q i ]=n ψi ,所以t ψ是t 的无偏估计量。

为了计算方差,假定(1)式中的估计量是n 个独立观测值的平均,每一个的方差为∑ ψi (t i ψi−t )2N i=1,所以,V[t ψ]=1n ∑ ψi (t iψi−t )2Ni=1 (2)为了估计样本的V[t ψ],不能使用(2)式。

(2)式包含(t iψi−t )2的加权平均值,以选取的不等概率加权。

但是在选取样本时,我们已经使用不等概率,它们已出现在公式(1)随机变量Q i 。

如果在估计方差时,继续把 ψi `s 包括多次,我们将两次使用不等概率。

替代的,为估计方差,使用V ̂[t ψ]=1n ∑Q i (t iψi −t ψ)2n −1N i=1 (3)假定(3)式正好是描述统计中公式s 2/n 的一个变形:这个和式就是被抽取psu’s 的tiψi的样本方差。

(3)式是(2)式方差的无偏估计,即E [V̂[t ψ]]=V[t ψ]。

采用有放回抽样,所以单元i 在样本中出现的次数近似为n ψi 。

注意的是,如果N 非常小或者 ψi `s 比较大,某个psu 可能被n 次抽到。

在这个情况下,估计方差为零;这时,最好使用无放回抽样。

2.1.3 设计抽样概率我们期望选择 ψi`s,以使得估计方差越小越好。

理想情况下,我们将用 ψi=t it(这样,tψ=t且V[tψ]=0),所以如果t i为家庭i的年收入,则 ψi为家庭i收入占所有家庭的收入的比率。

但是 t i`s是未知的,直到样本被抽取,即使收入在被调查前是已知的,我们常常感兴趣的不仅仅为一个数量;为设计抽样概率而使用收入可能无法最好的估计其他数量。

因为一个psu中许多总体与一个psu中元素的个数相关,我们常常把 ψi作为psu i中相关元素的比值或相关容量。

这样,一个大容量psu比小容量psu有更大的概率成为样本。

令M i为第i个psu中元素个数,K为总体中元素个数,则 ψi=M i/K。

有了概率 ψi,我们得到probability proportional to size(pps)抽样。

对于一阶段pps抽样,t iψi=Ky i̅,所以,tψ=Kn∑Q i y i̅Ni=1y̅̂ψ=1n∑Q i y i̅Ni=1V̂(tψ)=1n∑Q i(t iψi−tψ)2n−1Ni=1=K2n∑Q iNi=1(y i̅−y̅̂ψ)2n−1 V̂(y̅̂ψ)=1n∑Q iNi=1(y i̅−y̅̂ψ)2n−1方差估计中的这个和式是psu均值y i̅的样本方差。

Pps抽样中的所有工作已经在抽样设计中自行完成。

Pps估计可通过把y i̅‘s当作独立观测值来计算,并且可以找到它们的均值和方差。

然而,在实际中,存在许多来自严格pps设计的变形,所以应该使用(1)式和(2)式来估计总体总值和它的估计方差。

相关文档
最新文档