第2章-简单随机抽样
第2章简单随机抽样

称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2
是
V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量
简单随机抽样

【预习自测】 1.简单随机抽样的结果( ) A.完全由抽样方式所决定 B.完全由随机性所决定 C.完全由人为因素所决定 D.完全由计算方法所决定
【解析】选B.根据简单随机抽样的定义,总体中每个个 体被抽到的机会相等,因此抽样结果只与随机性有关.
2.简单随机抽样中,某一个个体被抽中的机会是( ) A.与第n次抽样有关,第一次抽中的机会要大些 B.与第n次抽样无关,每次抽中的机会都相等 C.与第n次抽样有关,最后一次抽中的机会大些 D.该个体被抽中的机会无法确定 【解析】选B.由简单随机抽样的定义可知:每个个体被 抽到的机会都相等,与第几次抽到无关.
4.下列抽样试验中,适合用抽签法的是( ) A.从某工厂生产的3 000件产品中抽取600件进行质量 检验 B.从某工厂生产的两箱(每箱15件)产品中抽取6件进行 质量检验 C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件 进行质量检验 D.从某厂生产的3 000件产品中抽取10件进行质量检验
2.某校有40个班,每班50人,要求每班随机选派3人参加
“学生代表大会”.在这个问题中样本容量是( )
A.40
B.50
C.120
D.150
【解析】选C.由于样本容量即样本的个数,故抽取的样
本的个数为40×3=120.
【补偿训练】1.一个总体中共有10个个体,用简单随机
抽样的方法从中抽取一个容量为3的样本,则某特定个
3.在问题2的基础上,若想得到样本饼干,则应如何摸取? 提示:从中不放回地摸取并且每次只摸一个. 4.在上述抽样过程中,某一包饼干第一次被抽到与第二 次被抽到的机会相等吗? 提示:相等.
结论: 1.抽样涉及的基本概念(以某地区高一学生身高为例) 为了了解某地区高一学生身高的情况,我们找到了该地 区高一8 000名学生的体检表,从中随机抽取了150张, 表中有体重、身高、血压、肺活量等15类数据,那么总 体是指_该__地__区__高__一__8__0_0_0_名__学__生__的__身__高__数__据__,个体是指 _该__地__区__高__一__某__个__学__生__的__身__高__,样本是指_被__抽__到__的__1_5_0_个__ _学__生__的__身__高__,样本容量是_1_5_0_.
第二章 简单随机抽样-2.1-2.2-1

3 估计量的性质
(3)比例估计量的性质
性质8
ˆ E ( P) E ( p) P
N n P(1 P) 性质9 样本比例p的方差为 V ( p) N 1 n
性质10 V(p)的无偏估计为
1 f v( p ) p(1 p) n 1
作业
设总体单元为N=6,单元的取值分别为3、4、
第二章 简单随机抽样
第一节 第二节 第三节 第四节 引言 估计量及其性质 样本量的确定 子总体的估计
第一节 引言
1 简单随机抽样的定义 2 简单随机样本的性质 3 简单随机样本的实现方法
1 简单随机抽样的定义 定义: 每次都是从剩下的总体单元中随机抽 取1个单元,相继依次抽取n次,得到n个单 元组成的样本,叫做不放回简单随机样本。
1
1 简单随机抽样的几个重要结论
(1)单元入样概率的一个重要结论
定理1 :对总体 U {Y1 ,, YN } 的一个样本量为n的无重 复样本,有
(1) k n
k 1 N
(2) kj (n 1) j , 对固定的j
k 1 k j
N
1 简单随机抽样的几个重要结论
(2) 简单估计量
设 y1 ,, yn 是总体{Y1 , ,YN }的一个简单随机样本,则
ˆ (1) Y
y
ˆ (2)Y Ny ˆ (3)P p
3 估计量的性质
(1)均值估计量的性质
性质1
设y1 ,, yn 是总体{Y1 , ,YN }的一个简单随机样本,则
ˆ ) E( y ) Y E (Y
3 简单随机样本的实现方法
首先将N个总体单元编号为:1,2,,N,每一单元对应 一个号码,若抽到某号,则相应单元入样。
抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样

X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:
Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1
推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X
Y X
r
n
yi xi
i 1
y x
i 1
i 1
简单估计量
1 Y y n
n
yi
y1 y 2 y n n
i 1
N Y Ny n
n
yi
i 1
a 1 P p n n
n
yi y Y
i 1
ˆ R
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。
引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r
抽样技术第二章_简单随机抽样

目前,世界上已编有许多种随机数表。其中较 大的有兰德公司编制,1955年出版的100万数 字随机数表,它按五位一组排列,共有20万组 ;肯德尔和史密斯编制,1938年出版的10万 数字随机数表,它也按五位一组排列,共有 25000组。我国常用的是中国科学院数学研究 所概率统计室编印的《常用数理统计表》中的 随机数表。
率都等于1/ CNn,这种抽样称为简单随机抽样。
注意:定义2.1与定义2.3是等价的。
三个定义之间的联系
简单随机抽样的具体实施方法
常用的有抽签法和随机数法两种。 (一)抽签法 抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与
之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以 是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽 中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样 本。 抽签法在技术上十分简单,但在实际应用中,对总体各单元编号 并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时 ,抽签法并不是很方便,而且也往往难以保证做到等概率。因此 ,实际工作中常常使用随机数法。
s2 / n
s(y)
y
t
1
2
s(y),y
t
1
2
s(y)
概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样
二、实施方法 三、地位、作用
是其他抽样方法基础
2.1定义与符号
定义2.1 从总体的N个单元中,一次整批抽取n 个单元,使任何一个单元被抽中的概率都相等 ,任何n个不同单元组成的组合被抽中的概率 也都相等,这种抽样称为简单随机抽样.
此外,简单随机抽样要求在抽样前编制出抽样 框,并对每一个总体抽样单元进行编号,而且 当总体抽样单元的分布比较分散时,样本也可 能会比较分散,这些都会给简单随机抽样方法 的运用造成许多的不便,甚至在某些情况下干 脆无法使用。因此,在此基础上研究其它抽样 技术显得更加重要。
第二章 简单随机抽样

2.1 定义与符号
总体:( )具体总体;( ;(2)有限总体; 总体:(1)具体总体;( )有限总体; :( (3)与样本框存在一一对应关系的所谓实查总体或被称为 ) 抽样总体的样本框本身。 抽样总体的样本框本身。 单元:总是指构成抽样总体的样本单元(样品、样本点) 单元:总是指构成抽样总体的样本单元(样品、样本点) 抽样单元并不总是等同于个体, 抽样单元并不总是等同于个体,有时抽样单元甚至包含几个或 多个个体 个体:最小的不可再分的单元 个体: 设抽样总体由N个抽样单元组成 个抽样单元组成, 是已知整数 表示总体规模 是已知整数, 总体规模; 设抽样总体由 个抽样单元组成,N是已知整数,表示总体规模; 欲在其中抽取n个抽样单元构成样本 个抽样单元构成样本。 欲在其中抽取 个抽样单元构成样本。 n是一个事先人为确定的不大于 ,不小于 的正整数,称为样本容 是一个事先人为确定的不大于N,不小于1的正整数 称为样本容 的正整数, 是一个事先人为确定的不大于 简称样本量或样品数,表示样本规模。 量,简称样本量或样品数,表示样本规模。 样本容量相对于总体规模的比例f=n/N,称为抽样比 样本容量相对于总体规模的比例 ,称为抽样比
n CN
简单随机抽样的三个等价定义: 简单随机抽样的三个等价定义:
定义2.1 从总体的 个单元中,一次整批抽取 个单元,使任何一个 从总体的N个单元中 一次整批抽取n个单元 个单元中, 个单元, 定义 单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概 单元被抽中的概率都相等,任何 个不同单元组成的组合被抽中的概 率也相等,这种抽样称为简单随机抽样。 率也相等,这种抽样称为简单随机抽样。 定义2.2从总体的 个单元中,逐个不放回地抽取单元,每次抽取到 从总体的N个单元中 定义 从总体的 个单元中,逐个不放回地抽取单元, 尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止 个单元为止, 尚未入样的任何一个单元的概率都相等,直到抽足 个单元为止,这 样所得的n个单元组成一个简单随机样本 个单元组成一个简单随机样本。 样所得的 个单元组成一个简单随机样本。 定义2.3 按照从总体的 个单元中抽取 个单元的所有可能不同的组 按照从总体的N个单元中抽取 个单元中抽取n个单元的所有可能不同的组 定义 n n 个样本数, 个样本随机抽取一个样本, 合构造所有可能的 CN个样本数,从 CN 个样本随机抽取一个样本,使 n 这种抽样称为简单随机抽样。 每个样本被抽中的概率都等于1/ CN ,这种抽样称为简单随机抽样。 n N
第二章 简单随机抽样

第二章简单随机抽样§2.1 引言§2.2 估计量§2.3 样本量的确定§2.4 其他问题§2.1 引言➢简单随机抽样也称为纯随机抽样.从抽样框内的N个抽样单元中随机地、逐个抽取n个单元组成样本,在每次抽选时,总体中每个单元入样的概率都相等,这n个被抽中的单元就构成了简单随机样本。
➢简单随机样本也可以从总体中一次取得全部n 个单元,要求全部可能的样本每种样本被抽得的概率都相等。
➢放回抽样与不放回抽样⏹抽选方法➢抽签法当总体不大时,可以用均匀同质的材料制作N个签,将其充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,接着抽下一个签直到第n个签为止,则这n个签上所示的号码表示入样的单元号。
➢随机数法当总体较大时,抽签法实施起来很困难,这时可以利用随机数表、随机数骰子、计算机产生的伪随机数进行抽样。
※随机数表随机数表是由数字0,1,…,9组成的表,每个数字都有同样的机会被抽中。
常用的做法:根据总体大小N的位数决定在随机数表中随机抽取几列,如N=678,要取n=5的样本,则在随机数表中随机抽取3列,顺序往下,选出头5个001~678之间互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽满n个单元为止。
※随机数骰子随机数骰子是由均匀材料制成的正20面体,面上标有0~9的数字各2个。
我国“运筹”牌随机数骰子一盒有6个不同颜色的骰子,使用时,根据总体大小N的位数,如N=327的位数是3,则将3个不同颜色的骰子放入盒中,并规定每种颜色所代表的位数,如红色代表个位数,蓝色代表十位数,黄色代表百位数等,盖上盒盖,摇动盒子,使骰子充分旋转,然后打开盒盖,读出骰子所表示的数字,重复上述步骤,直到产生n个不同的随机数。
※计算机产生伪随机数不少统计软件都有现成的产生随机数的程序,利用计算机产生的随机数具有快捷、方便的特点,但需要注意的事,利用计算机产生的随机数是伪随机数,并不能保证其随机性。
抽样调查-第2章简单随机抽样

N2 1
f
S2
n
V (P)
V ( p)
1
f
1 NP(1 P)
n n 1
返回
总体总量的估计量方差是总体均值方差的直接 推导,下面我们来推导总体比例估计量的方差。
1 f 1
V (P)
NP(1 P)
n N 1
只需证明此时S 2 1 NP(1 P)即可。 N 1
返回
设N个样本单元中有N1个具有某一特 性,即有N1个单元取值为1,有N-N1个单元 取值为0.
Yi 2
N( 1 N
N
Yi )2 ]
i 1
返回
1 n( N
f 1)
[
N i 1
Yi 2
2
NY ]
1 f n( N 1)
N
(Yi 2
Y
2
)
i 1
1 f n( N 1)
N
(Yi
i 1
Y )2
S 2 (1 f ) n
即 V (y) 1 f S 2 n
C C2 n2 2 N 2
每个样本被抽中的概率为:
C C2 n2 2 N 2
/
CNn
n(n 1) N (N 1)
返回
引理二 从总体规模为N的总体中抽取一个样 本量为n的简单随机样本。若对总体中的每个单
元 Yi ,引进随机变量 ai 如下:
ai
1,
若Yi入样
0,若Yi不入样(i 1,2,, N )
N i1
(Yi
Y )2
N 2
N 1
返回
总体指标值上面带符号“ ”的表示由样本得
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
推论 2.12:对于简单随机抽样,n较大时, YR yR 的方差为:
1 f 1 N 2 V ( yR ) ( Y RX ) i i n N 1 i1
设:
S yx SS x
是Y和X的总体相关系数 Y的相对方差(变异系数)
SS x YX
2 S C2 2 Y
C yx
是总体协方差
S yx
的无偏估计。
2.3 比率估计量及其性质
主要变量 Y 与Y有关的辅助变量 X
辅助变量必须与主要变量高度相关 辅助变量与主要变量之间的相关关系整体上相当 稳定 辅助变量的总体总值或总体均值必须是已知的, 或是容易获得的 辅助变量的信息质量更好,或信息更容易取得即 调查成本更低。 比率估计量一般用来估计主要 变量的总体总值和总体均值
【例2.4】
在20世纪90年代初的一项工资研究中,人们发现IT行 业中,从业者的现薪与起薪之间相关系数 高达0.88, 已知某IT企业474名员工的平均起薪为17016.00/年, 现根据对100个简单随机抽样方式选出的员工现薪的调 查结果,估计该企业员工的现薪平均水平。
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
第2章 简单随机抽样(SRS)
2.1概述
抽样总体
样本容量
简单随机抽样也称为纯随机抽样。 从含有 N 个单元的总体中抽取 n 个单元组成 样本,如果抽样是不放回的,则所有可能的样 本有 C 个,若每个样本被抽中的概率相同,都 为 1 C ,这种抽样方法就是简单随机抽样。 称 n N 为抽样比,记为 f 。
(i, j 1, 2,...., N ; i j )
定理 2.1:对于简单随机抽样,作为 Y 的简单估计, Y y 是无偏的,即
E (Y ) E y Y
始终成立。
Y 推论 2.1:对于简单随机抽样, 为: E (Y ) E Ny NY Y
Ny
定理 2.4:简单随机抽样的方差
n 1 2 2 s yi y n 1 i1
2 S 是总体方差 的无偏估计。
推论 2.7:对于简单随机抽样,
V (Y ) v( y ) 1 f 2 s n
是 V ( y ) 的无偏估计。
推论 2.8:
V (Y ) v( Ny ) N 2 (1 f ) 2 s n
比率估计、回归估计需要有足够的样本量才能 保证估计的有效性。
有偏估计:当样本量足够大时,估计的偏倚趋于0。
符号定义
总体均值的比率估计量:
y 1 YR yR X XR x N
总体总值的比率估计量:
YR NYR NyR X y XR x
R 属于简单估计量,不属于比率估计量。
2
比率估计量的方差估计
1 f 2 ˆ R ˆ 2s2 ) v1 ( yR ) ( s 2Rs xy x n X 2 1 f 2 ˆ R ˆ 2s2 ) v2 ( yR ) 2 ( s 2Rs xy x x n
1 f 2 ˆ R ˆ 2s2 ) ( s 2 Rs xy x n 2 X 1 f 2 ˆ R ˆ 2s2 ) v2 (YR ) N 2 2 (s 2Rs xy x x n v1 (YR ) N 2
是 V (Y ) 的无偏估计。
推论 2.9:对于简单随机抽样,
1 f 2 1 f V ( P) v( p) v( y01 ) sp p(1 p) n n 1
推论 2.10:对于简单随机抽样,当n较大时, 有
1 1 f 1 n 2 V ( R) v(r ) 2 yi rxi x n n 1 i1
引理2.4 :对于简单随机抽样, n较大时, Rr 的方差为: V ( R) V (r ) 1 1 f 1 N (Y RX )2 i i 2
X
n
N 1 i1
YR NyR 定理 2.7:对于简单随机抽样,n较大时, 的方差为:
1 f 1 N 2 V (YR ) N ( Y RX ) i i n N 1 i1
引理 2.3:对于简单随机抽样,n较大时, R r 的期望为:
E ( R) E r R
(1) R 不是无偏的; (2)但在某种条件下,R 是近似无偏的。
定理 2.6:对于简单随机抽样,n较大时,YR yR 的期望为: E ( y ) XR Y
R
推论 2.11:对于简单随机抽样, n较大时, YR NyR 的期望为: E (YR ) NXR NY Y
定义2.1 从总体的N个单元中,一次整批抽取n个单元 ,使任何一个单元被抽中的概率都相等,任何n个不同 单元组成的组合被抽中的概率也都相等,这种抽样称为 简单随机抽样。 定义2.2 从总体的N个单元中,逐个不放回地抽取单元 ,每次抽取到尚未入样的任何一个单元的概率都相等, 直到抽足n个单元为止,这样所得的n个单元组成一个简 单随机样本。 定义2.3 按照从总体的N个单元中抽取n个单元的所有 n n 可能不同的组合构造所有可能的 CN 个样本,从 CN 个样 本随机抽取1个样本,使每个样本被抽到的概率都等于 n , 这种抽样称为简单随机抽样。 1 CN
的期望
推论 2.2:对于简单随机抽样, P p 的期望 为:
E ( P) E p P
推论 2.3:对于简单随机抽样,n较大时, Rr 的期望为:
E ( R) E r R
对于有限总体的方差定义 :
1 2 N
Y Y
i i 1
N
2
2 1 N S Yi Y N 1 i1 2
引理2.2 从总体规模为N的总体中抽取一个样本量为n 的简单随机样本,若对总体中的每个单元 Yi ,引进 ai 1 ; Yi 不入样, ai 0 ),则 随机变量 a i(Yi 入样,
n f (i 1, 2,...., N ) N n N n V (ai ) f (1 f ) (i 1, 2,...., N ) N N n n f (1 f ) cov(ai , a j ) (1 ) N ( N 1) N N 1 E (ai )
Y 推论 2.4:对于简单随机抽样, 为: 2 1 f 2
Ny
的方差
V (Y ) N
n
S
推论 2.5:对于简单随机抽样, P p 的方差 为: 1 f 1
V ( P) n N 1 NP (1 P )
推论 2.6:对于简单随机抽样,当n较大时, R 的方差为:
1 1 f 1 N 2 V ( R) 2 ( Y RX ) i i X n N 1 i1
符号
1 Y N
N N
大写符号表示总体的标志值, 用小写符号表示样本的标志值
样
y
n
总 体
Y Y2 YN Yi 1 N i 1
本
y y2 yn 1 n yi 1 n i 1 n y1 y 2 y n
Y Yi Y1 Y2 YN
i 1 i 1 n
n
总体指标值 上面带符号 “^”的表 示由样本得 到的总体指 标的估计。i Nhomakorabea
y x
i
2.2 简单估计量及其性质
引理 2.1:从大小为N的总体中抽取一个样本量为n的 简单随机样本,则总体中每个特定单元入样的概率为 n/N,两个特定单元都入样的概率为: n n 1
N N 1
v y 1.3115
由置信度95%对应的 z 1.96,因此,可以 以95%的把握说总体平均水平大约在 5 1.96 1.3115 之间,即 2.4295 和 7.5705 之间。
/2
定理 2.5:简单随机抽样的协方差
1 n s yx yi y xi x n 1 i1
i 1
y
i 1
i
A 1 P N N
2
Y
i 1
N
i
Yi 0或1
a 1 n p yi n n i 1
2
yi 0或1
2 1 N S Yi Y N 1 i 1
1 n yi y 2 s n 1 i 1
R
Y
i 1 N i 1
协方差定义:cov( y , x ) E y E ( y ) x E ( x )
定理 2.3:对于简单随机抽样,有
1 f cov( y , x ) S yx n
1 N 式中, S yx N 1 Yi Y X i X i 1
为总体协方差。
定理2.2:对于简单随机抽样,y 的方差
1 f 2 V y S n
评价调查成功 与否的重要指标
其中, 1 f 称为有限总体校正系数。(未入样率)
估计量的方差 V y 是衡量估计量精度的 度量。影响估计量方差的因素主要是样本量n, 未入样率 1-f和总体方差 。 S2
在简单随机抽样的条件下,只有通过加大 样本量来提高估计量的精度。
N
i
X
Y Y X X
i
r
y x
i 1 i 1 n
n
i
y x
i
简单估计量
y y2 1 n Y y yi 1 n i1 n yn