PPS抽样与非概率抽样 ppt课件
合集下载
抽样调查第3章 不等概抽样ppt课件

则第a个单元入样,否则此次抽取无单元入样.
3、重复2,直至抽得n个单元.
pi NXM i Xi
精选课件
7
PPS抽样的实现方法
目录抽样
1、计算抽样间隔 K X (假定K为整数); n
2、从{ 1,2, … , K }抽取随机数R1,由K确定R2=R1+K,
R3=R1+2K,…,Rn=R1+(n-1)K ;
无放回PPS抽样的实现:在前面方法中去掉重复单 元即可.
精选课件
12
例题与练习
例3 一村庄有8个果园,分别有果树50,30,65, 80,140,44,20,100棵,要调查该村庄水果总 产量.如果实地调查得第5,第8、第3号三个果园的 产量(单位:104 千克)分别为15,12,7,计算 该村八个果园的总产量的估计量和估计量的均方偏 差。再用简单估值法进行估计,并比较两个结果的 优劣。
Sen-Midzuno抽样方法
大体思路
解决样本量超过2的麻烦,使πi近似地正比于Xi
实现步骤
1、以概率pi抽取第一个样本单元
2、从剩下的N-1个单元中,抽取容量为n-1的简单随 机样本(不放回)
i pi (1pi)N n11 pi( f很小时 )
ijN n 1 1 N N n 2(pipj)N n 2 2
V(YˆRH)C有一个无偏估计 2 v(Y ˆRH ) CN N 2 2( n k(1 n ) k k()n N k)tn n1Z X t p yiitt Y ˆRH C
其中 pit是样本yi单 t对元 应的总体中 模正 测比 度于 的
率,即
N
pit Xit X,X Xi
i1
有放回抽样的效率比无放回低但分析计算较简单
3、重复2,直至抽得n个单元.
pi NXM i Xi
精选课件
7
PPS抽样的实现方法
目录抽样
1、计算抽样间隔 K X (假定K为整数); n
2、从{ 1,2, … , K }抽取随机数R1,由K确定R2=R1+K,
R3=R1+2K,…,Rn=R1+(n-1)K ;
无放回PPS抽样的实现:在前面方法中去掉重复单 元即可.
精选课件
12
例题与练习
例3 一村庄有8个果园,分别有果树50,30,65, 80,140,44,20,100棵,要调查该村庄水果总 产量.如果实地调查得第5,第8、第3号三个果园的 产量(单位:104 千克)分别为15,12,7,计算 该村八个果园的总产量的估计量和估计量的均方偏 差。再用简单估值法进行估计,并比较两个结果的 优劣。
Sen-Midzuno抽样方法
大体思路
解决样本量超过2的麻烦,使πi近似地正比于Xi
实现步骤
1、以概率pi抽取第一个样本单元
2、从剩下的N-1个单元中,抽取容量为n-1的简单随 机样本(不放回)
i pi (1pi)N n11 pi( f很小时 )
ijN n 1 1 N N n 2(pipj)N n 2 2
V(YˆRH)C有一个无偏估计 2 v(Y ˆRH ) CN N 2 2( n k(1 n ) k k()n N k)tn n1Z X t p yiitt Y ˆRH C
其中 pit是样本yi单 t对元 应的总体中 模正 测比 度于 的
率,即
N
pit Xit X,X Xi
i1
有放回抽样的效率比无放回低但分析计算较简单
抽样调查-不等概抽样培训课程模板ppt

11
738
累计
M
×10
i
6
151
166
303
381
531
631
667
727
738
__
代码
1~6 7~151 152~166 167~303 304~381 382~531 532~631 632~667 668~727 728~738
__
返回
先在[1,738]中产生一个随机数为354,再 在[1,738]中产生第二个随机数为553,最后 产生第三个随机493。则它们所对应的第5, 7,6号单元被抽中。
返回
§5.2 放回不等概抽样
一、只抽取一个样本单元(n=1)的不等概抽样
为了便于了解不等概抽样的基本思想,我们先看 一个总体已知,只抽取一个样本单元的例子。
【例】一个城市有四个超市营业面积从100平方米 到1000平方米不等(见下表),我们的目标是通过抽 取一家超市来估计这四个超市上个月的总营销量。通 常超市面积越大则销售量越大,因此,我们选择的入 样概率与超市的营业面积成正比。
(1)逐个抽取法。每次从总体未被抽中的单元中 以一定的概率取一个样本单元。
(2)重抽法。以一定的概率逐个进行放回抽样, 如果抽到重复单元,则放弃所有抽到的单元,重新抽取。
(3)全样本抽取法。对总体每个单元分别按一定 概率决定其是否入样。这种方法的样本量是随机的,事 先不能确定。
(4)系统抽样法。将总体单元按某种顺序排列, 根据样本量确定抽样间距k,在[1,k]中产生一个随机数。
(3,121), M 3 =15< m121, 舍弃,重抽;
(8,50), M 8 =36< m50, 舍弃,重抽;
(7,77), M 7 =100≥ m77,第7号单元入样;
PPS抽样

甲:800户居民
乙:200户居民
甲居委会每一户居民被抽中的概率=20/200 × 50/800=1/160 乙居委会每一户居民被抽中的概率=20/200 × 50/200=1/40
不符合等概率原则
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling to Size)
《社会调查与统计分析》
第四章 抽样
知识点10 PPS抽样
学习导航
PPS抽样
PPS抽样的定义 PPS抽样的原理 PPS抽样的具体操作
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
多段抽样暗含的假定:每一个阶段抽样时,其元素的规 模是相同的。
原理:以阶段性的不等概率换取最终的、总体的等概率 。
实质:在第一个阶段中,大的群被抽中的概率大,而小 的群被抽中的概率小;这样到了第二个阶段,被抽中的 大的群中的元素被抽中的概率就小于被抽中的小的群中 的元素了。正是这一大一小,平衡了由于群的规模不同 带来的概率差异。
2. PPS抽样的原理
每一个元素被抽中的概率
甲居委会中居民被抽中的概率=20×1/125×1/16=1/100 乙居委会中居民被抽中的概率=20×1/500×1/4=1/100
3. PPS的具体操作
例2:从全市100家企业(总共20万名职工)中,抽取 1000名职工进行调查。
THE END
谢 谢 观 看!
=
所抽取的群数
群的规模 总体规模
平均每个群中要抽的元素 群的规模
=所抽取的群数╳平均每个群中所要抽取的元素/总体的规模 =样本规模/总体规模
《非概率抽样方法》课件

误差的来源
• 调查方式 • 被调查者
如何减少误差
• 增加样本容量 • 使用恰当的抽样方法
应用实例
市场调研
用于收集市场数据、确定 消费群体、調查競爭對手。
医学研究
用于收集临床数据、诊断 和评估治疗方案。
政治调查
用于调查选举和政策支持 率等。
总结
1
非概率抽样方法的优缺点
优点:调查成本较低,简便易行。缺
1
简单随机抽样
每个样本有相同的概率被选中,且每
系统抽样
2
个样本选中的概率都是已知的。
在总
3
分层抽样
将总体分为若干层,在每层中随机选
簇抽样
4
择一定比例的样本。
将总体划分为一些组,随机选取一部 分组,再选择每个被选中组中部分个
体。
非恰概率抽样
方便抽样
选择最为便利、易于取得的样本,调查简单但 可能存在偏误。
列表抽样
从名单列表中选择样本,但可能存在名单不全 等问题。
定额抽样
按照一定比例抽取样本,例如从总体中抽取 10%的样本。
范围抽样
选择总体中特定范围内的样本,例如某个地区 或某种产品。
随机抽样误差与非随机抽样误差
误差类型
• 抽样误差 • 非抽样误差
如何选择合适的抽样方法
2
点:调查数据的误差较大,难以保证 抽样的代表性。
选择抽样方法时需要根据调查目的、
总体量、调查期限等因素进行判断,
酌情选择。
附录
相关术语解释
详细解释非概率抽样方法的相关术语及定义,方 便理解相关概念。
参考文献
列举了非概率抽样方法的相关著作及研究论文, 方便学习及参考。
抽样技术之不等概率抽样概述ppt(67张)

不等概率抽样的分类
放回不等概抽样:按照总体单元的规模大小来确定在每次抽 中的概率。抽取后放回总体,再进行下一次抽样,每次抽
样都是独立的。这种抽样称为放回不等概抽样(sampling with probabilities proportional to sizes,简称PPS抽样)
• 不放回的不等概抽样:每次在总体中对每个单元按入样概 率进行抽样,抽出的样本不再放回总体,因此,在抽取了 第一个单元后,余下的单元再以什么概率被抽取就较复杂。 这种抽样不是独立的,无论是抽样方法还是方差估计,都 要比放回抽样繁复得多。不放回抽样通常称为πPS抽样。
7
10
100
631 532~631
8
3.6
36
667 632~667
9
6
60
727 668~727
10
1.1
11
738 728~738
=73.8
738
假设在[1,738] 中等概产生第一个随机数为354,再在[1,738]中产生第二 个随机数为553,最后在[1,738]中产生第三个随机数为493,则它们所对 应的第5,7,6号单元被抽中。
不等概率抽样的特点
1、凡需使用不等概率抽样的场合,必须提供总体单 元的某种辅助信息。 例如:每个单元的“大小”度量Mi。注意:比估计 和回归估计是估计方法用到了辅助信息,本章是抽 样方法用到辅助信息.
2、不等概率抽样的主要优点是由于使用了辅 助信息,提高了抽样策略的统计效率, 能 显著地减少抽样误差。
例5.1 设某个总体有10个单元,相应的单元大小及其代码 数如下表,在其中产生一个n=3的样本。
i
Mi
Mi*10
累计
代码
抽样调查:不等概率抽样

二、估 值 法
PPS抽样法的估值法的理论依据
定理3.1.1 在有放回PPS抽样下,
Yˆ PPS
1 n
是总体Y总 N数 Yi 的无偏.估计
n
i1
yi pi
i 1
(pi为i个 第样y本 i时单 的元 抽取总 概体 率 i单 中 , 元 第 而 对不 应 .)是 的
估计的均方偏差为:
VY ˆ(PP)Sn 1 i n1pi(p yii Y)2.
例3.1 设某总体共有N=8个单元,相应 M i及代码如表所示
i
Mi
30 Mi
累计
代码
1
2/5
12
2
1/2
15
3
2/3
20
4
4/3
40
5
8/5
48
6
3/5
18
7
2/3
20
8
1
30
12
1~12
27
13~27
47
28~47
87
48~87
135 88~135
153 136~153
173 154~173
2、Hansen-Hurwitz (汉森—赫维茨)估计量
若 y1,y2, ,yn是按 Z i为入样概率的多项抽样而得的样 本数据,它们相应的 Z i 值自然记为 z1,z2, ,zn ,则对总
体总和, Hansen-Hurwitz 给出了如下的估计量:
yHH
1 n
n i 1
yi zi
且 E(yHH)Y ,即 y HH 是总体总和 Y 的无偏估计。
为整数。见下表。
表3—1 pps 抽样时各单元的代码数
单元 i 单元大小M i
抽样理论与方法课件 (2)

i1
Zi
1
独立地进行这样的抽样 n次,共抽到 n个单元(有可能重复) ,
放回的不等概率抽样又 称为多项抽样。
*这种放回的不等概率抽样为何又叫多项抽样?
设ti为在n次抽样中,第i个总体单元被抽到的次 数,
1 2iN
N
Zi 1
Z1
Z2
Zi
Z N ,且
i1 N
t1 t2 ti tN
2011、7972、10281分别属于3、6、8部门的代码范围,
这三个部门被抽中。
ቤተ መጻሕፍቲ ባይዱ
Y HH
Y HH
1
n yi 2.02
M0 M0n i1 zi
v(YHH )
1 M02n(n 1)
n i1
(yi zi
YHH )2
0.0119
v(YHH ) 0.11
MN
代码
M1 1,M1,12,2,M,1 M1 M2
N1
N1
N1
M j 1, M j 2,, M j MN M0
j1
j1
j1
2.拉希里法(二次抽取法):
令M*
max
1iN
Mi
每次取一个 1,N上的随机数 i,
及 1,M* 上的随机数 m。
则总体均值E()
N i1
Zi i
N i1
Zi
Yi Zi
Y
总体方差V()
N i1
Zi (i
E())2
N i1
Zi
概率抽样和非概率抽样概率抽样PPT精选文档

,写上1-10000号,从中随机(或按随机数
)抽取200张,被抽中的居民即为样本。
42
特点
简单、直观 对参数进行估计比较方便
局限性
当总体量很大时,不易构造抽样框 抽出的单位很分散 没有利用其它辅助信息
43
分层抽样
将抽样单位按某种规则划分为不
同的层,然后从不同的层中独立、随机地
抽取样本。
重点调查
总体单位
调查单位
只调查重点单位(单位 数不多但其标志量占标 志总量比重较大的单位)
32
统计调查的组织方式
在对调查对象有一定了解的基础上,
典型调查 有意识地选择少数典型单位 进行
调查的一种非全面调查组织方式
一定条件下能估计总体指 作 标数值 用 可以补充全面调查的不足
可以用来研究新生事物
局 不能确定推断的把握程度, 限 无法计算和控制推断误差
数值型数据表示事物的数量特征,定量数 据或数量数据(qualitative data)。
对不同类型的数据,采用的统计方法可能 有所不同 。
10
4、截面数据(cross-sectional data)
在相同或近似相同的时间点上收集的数 据
描述现象在某一时刻的变化情况 比如,2002年我国各地区的国内生产总
51
系统抽样
定义:将个体按一定顺序排列,在规定的 范围内随机地抽取一个单位作为初始单位 ,然后按事先规定好的规则确定其它样本 单位
优点:操作简便
缺点:对总体参数的估计比较复杂
52
系统抽样的步骤
(1) 将总体单位排列。
(2) 决定抽样间距(总体单位数/样本数)。
(3) 采用简单随机抽样法抽出一个单位作为起点 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 区别随机抽样: 偶遇抽样没有保证总体中的每一个成员都具有同等的被抽中的概
率。
2020/12/27
15
二、判断抽样
• 研究者根据研究的目标和自己主观的分析来选择和确定研究对象的 方法。
• 由于抽样标准的确定带有较大的主观性,所以,此法的运用结果如 何往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很 大关系。
2020/12/27
5
几种抽样方法的比较
第二阶段:从10所高校中分别抽取500名学生
按整群抽样的方法
(假设其中一个学校有100个班级,每班50名学生)
2020/12/27
6
• 多段抽样中,其实暗含了一个假定:即每一个阶段抽 样时,其元素的规模是相同的。
• 比如第一阶段抽取学校时,暗含了每个学校的规模相 同。
每一个元素
群的规模
平均每个群中 所要抽取的元素
= 所抽取的群数
被抽中的概率
×
总体的规模
×
群的规模
PPS的做法已经排除了群的规模这一影响因素——第一个分子与第 二个分母相互约掉了——每一个元素的被选中概率变成了:(所抽取 的群数*每个群中所抽取的元素数目)/总体的规模。
这实际上就是样本规模除以总体规模。
笨,没有学问无颜见爹娘 ……” • “太阳当空照,花儿对我笑,小鸟说早早早……”
4
几种抽样方法的比较
第一阶段:从100所高校中抽取10所
按简单随机抽样或系统抽样的方法,则首先需 要弄到一份100所高校的名单,并对其进行编号 ,然后根据抽签、随机数表或通过计算抽样间 距直接从抽样框中抽取;
若按分层抽样的方法,则可以先将其分为本科 院校和专科院校,然后分别从每一类中抽取若 干高校;
04
20000
32200
012201-032200 012234 单位3、4
029824
05 …… 99 100
6000 …… 10000 8000
38200 …… 492000 500000
032201-038200
……
……
482001-492000 484551
492001-500000
…… 单位20
文科(20人)
理科(30人)
一二三四
一二三四
一二三四
一二三四
人数
12 9 6 3
12 9 6 3
8 6 42
8 6 42
2020/12/27
18
定额抽样与分层抽样的区别
• 分层抽样是完全依据概率原则,排除主观因素,客观地 、等概率地到各层中进行抽样;
• 配额抽样是由调查人员在配额内主观判断选定样本。 先“分层”(事先确定每层的样本量,即抽选出一个总体
2020/12/27
9
(二)做法(以二阶段为例):
• 1、在第一阶段,每个群按照其规模(其所含元 素的数量)被给予大小不等的抽取概率。
• 2、到了第二阶段,从每个抽中的群中都抽取同 样多的元素(也是不等概率的)。
• 正是这一大一小,平衡了由于群的规模带来的 概率差异。
2020/12/27
10
(三)公 式
2020/12/27
13
§5 非概率抽样方法
• 非概率抽样,不是按照概率均等的原则,而是根据人们 的主观经验或其他条件来抽取样本。
•偶遇抽样 •判断抽样 •定额抽样 •雪球抽样
2020/12/27
14
一、偶遇抽样
• 又称作方便抽样或自然抽样
• 是研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作 为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为 调查对象
2020/12/27
11
(四)PPS的具体操作方法:
• 1、在确定的总体内,给每个抽样单位按序编号 ,并且写出它们的规模;
• 2、累计相加每个抽样单位包含的单位数,并根 据累计相加结果确定每个单位的号码范围;
• 3、采用随机数表的方法或等距抽样的方法选择 号码,号码所对应的单位入选第一阶段样本;
• 4、在被抽取的单位中,按照抽样元素的多少进 行第二阶段抽样。
抽样
• 假设从某市100所高校的50万大学生中, 抽取5000名学生进行环保意识的抽样调查 。
二阶段抽样:大学——学生
2020/12/27
2
精品资料
• 你怎么称呼老师? • 如果老师最后没有总结一节课的重点的难点,你
是否会认为老师的教学方法需要改进? • 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭 • “不怕太阳晒,也不怕那风雨狂,只怕先生骂我
• 甲学校学生被抽中的概率为:(10/100)*(500/20000)=1/400
• 乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/60
2020/12/27
8
§4 PPS抽样
一、PPS抽样 (概率与元素的规模大小成比例的抽样)
(一)原理:
• 以阶段性的不等概率换取最终的、总体 的等概率。
• 在这样的假定下,采取上述几种随机抽样的方法,最 终每名学生被抽中的概率相等。
2020/12/27
7
• 但现实生活中,每一个学校包含的学生人数不同,因 而按照上述多段抽样的方法来抽取样本时,最终每名学 生被抽中的概率实际上是不同的。
• (规模不一样大)假设甲学校比较大,有2万名学生,乙学校比较小 ,只有3千名学生。那么当二者在第一阶段都被抽中后,第二阶段分 别从他们中抽取500名学生,
2020/12/27
12
用PPS方法抽取一阶段样本举例
学校序号 学生人数/人 累计人数/人 号码范围
入选号码 入样单位
01
4000
4000
000001-004000 002032 单位1
02
5000
9000
004001-009000
03
3200
12200
009001-012200 009786 单位2
%;文科学生和理科学生各占50%;一年级学生占40%、二年 级、三年级、四年级学生分别占30%、20%和l0%。
现在要用定额抽样方法依上述三个变数抽取一个规模 为100人的样本。
2020/12/27
17
依据总体的构成和样本规模,我们得到的定额表 :
年级
男生(60人)
文科(30人)
理科(30人)
女生(40人)
• 在实际中,这种抽样多用于总体规模小、所涉及的范围较窄或时间 、人力等条件有限而难以进行大规模抽样的情况
2020/12/27
16
三、定额抽样
• 又称作配额抽样
• 是指调查人员将调查总体样本按一定标志分类或分层,确定各类( 层)单位的样本数额,在配额内任意抽选样本的抽样方式。
例:假设某高校有4000名学生,其中男生占60%,女生占40
率。
2020/12/27
15
二、判断抽样
• 研究者根据研究的目标和自己主观的分析来选择和确定研究对象的 方法。
• 由于抽样标准的确定带有较大的主观性,所以,此法的运用结果如 何往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很 大关系。
2020/12/27
5
几种抽样方法的比较
第二阶段:从10所高校中分别抽取500名学生
按整群抽样的方法
(假设其中一个学校有100个班级,每班50名学生)
2020/12/27
6
• 多段抽样中,其实暗含了一个假定:即每一个阶段抽 样时,其元素的规模是相同的。
• 比如第一阶段抽取学校时,暗含了每个学校的规模相 同。
每一个元素
群的规模
平均每个群中 所要抽取的元素
= 所抽取的群数
被抽中的概率
×
总体的规模
×
群的规模
PPS的做法已经排除了群的规模这一影响因素——第一个分子与第 二个分母相互约掉了——每一个元素的被选中概率变成了:(所抽取 的群数*每个群中所抽取的元素数目)/总体的规模。
这实际上就是样本规模除以总体规模。
笨,没有学问无颜见爹娘 ……” • “太阳当空照,花儿对我笑,小鸟说早早早……”
4
几种抽样方法的比较
第一阶段:从100所高校中抽取10所
按简单随机抽样或系统抽样的方法,则首先需 要弄到一份100所高校的名单,并对其进行编号 ,然后根据抽签、随机数表或通过计算抽样间 距直接从抽样框中抽取;
若按分层抽样的方法,则可以先将其分为本科 院校和专科院校,然后分别从每一类中抽取若 干高校;
04
20000
32200
012201-032200 012234 单位3、4
029824
05 …… 99 100
6000 …… 10000 8000
38200 …… 492000 500000
032201-038200
……
……
482001-492000 484551
492001-500000
…… 单位20
文科(20人)
理科(30人)
一二三四
一二三四
一二三四
一二三四
人数
12 9 6 3
12 9 6 3
8 6 42
8 6 42
2020/12/27
18
定额抽样与分层抽样的区别
• 分层抽样是完全依据概率原则,排除主观因素,客观地 、等概率地到各层中进行抽样;
• 配额抽样是由调查人员在配额内主观判断选定样本。 先“分层”(事先确定每层的样本量,即抽选出一个总体
2020/12/27
9
(二)做法(以二阶段为例):
• 1、在第一阶段,每个群按照其规模(其所含元 素的数量)被给予大小不等的抽取概率。
• 2、到了第二阶段,从每个抽中的群中都抽取同 样多的元素(也是不等概率的)。
• 正是这一大一小,平衡了由于群的规模带来的 概率差异。
2020/12/27
10
(三)公 式
2020/12/27
13
§5 非概率抽样方法
• 非概率抽样,不是按照概率均等的原则,而是根据人们 的主观经验或其他条件来抽取样本。
•偶遇抽样 •判断抽样 •定额抽样 •雪球抽样
2020/12/27
14
一、偶遇抽样
• 又称作方便抽样或自然抽样
• 是研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作 为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为 调查对象
2020/12/27
11
(四)PPS的具体操作方法:
• 1、在确定的总体内,给每个抽样单位按序编号 ,并且写出它们的规模;
• 2、累计相加每个抽样单位包含的单位数,并根 据累计相加结果确定每个单位的号码范围;
• 3、采用随机数表的方法或等距抽样的方法选择 号码,号码所对应的单位入选第一阶段样本;
• 4、在被抽取的单位中,按照抽样元素的多少进 行第二阶段抽样。
抽样
• 假设从某市100所高校的50万大学生中, 抽取5000名学生进行环保意识的抽样调查 。
二阶段抽样:大学——学生
2020/12/27
2
精品资料
• 你怎么称呼老师? • 如果老师最后没有总结一节课的重点的难点,你
是否会认为老师的教学方法需要改进? • 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭 • “不怕太阳晒,也不怕那风雨狂,只怕先生骂我
• 甲学校学生被抽中的概率为:(10/100)*(500/20000)=1/400
• 乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/60
2020/12/27
8
§4 PPS抽样
一、PPS抽样 (概率与元素的规模大小成比例的抽样)
(一)原理:
• 以阶段性的不等概率换取最终的、总体 的等概率。
• 在这样的假定下,采取上述几种随机抽样的方法,最 终每名学生被抽中的概率相等。
2020/12/27
7
• 但现实生活中,每一个学校包含的学生人数不同,因 而按照上述多段抽样的方法来抽取样本时,最终每名学 生被抽中的概率实际上是不同的。
• (规模不一样大)假设甲学校比较大,有2万名学生,乙学校比较小 ,只有3千名学生。那么当二者在第一阶段都被抽中后,第二阶段分 别从他们中抽取500名学生,
2020/12/27
12
用PPS方法抽取一阶段样本举例
学校序号 学生人数/人 累计人数/人 号码范围
入选号码 入样单位
01
4000
4000
000001-004000 002032 单位1
02
5000
9000
004001-009000
03
3200
12200
009001-012200 009786 单位2
%;文科学生和理科学生各占50%;一年级学生占40%、二年 级、三年级、四年级学生分别占30%、20%和l0%。
现在要用定额抽样方法依上述三个变数抽取一个规模 为100人的样本。
2020/12/27
17
依据总体的构成和样本规模,我们得到的定额表 :
年级
男生(60人)
文科(30人)
理科(30人)
女生(40人)
• 在实际中,这种抽样多用于总体规模小、所涉及的范围较窄或时间 、人力等条件有限而难以进行大规模抽样的情况
2020/12/27
16
三、定额抽样
• 又称作配额抽样
• 是指调查人员将调查总体样本按一定标志分类或分层,确定各类( 层)单位的样本数额,在配额内任意抽选样本的抽样方式。
例:假设某高校有4000名学生,其中男生占60%,女生占40