抽样调查第2章 简单随机抽样
合集下载
第2章简单随机抽样

称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2
是
V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量
简单随机抽样

[ p z 2 v( p), p z 2 v( p)] [0.2846,0.4154]
2.3 比率估计量及其性质
当存在与我们调查的主要变量高度相关 的所谓其他辅助变量的有效信息,且这些 辅助变量的信息质量较好时,利用这些信 息无疑将有助于提高估计的精度。
主要变量为Y,另一个与Y有关的辅助变量 为X,对简单随机抽样的一个样本中的每 一个单元获得了Y和X的调查值yi和xi,而X 的总体总值是已知的。
总体比例的简单估计
性质1. E(Pˆ) E( p) P
性质2.V (Pˆ) 1 f S 2 1 f 1 NP(1 P)
n
n N 1
证明:S 2
1 N -1
N i 1
(Yi
Y )2
1 N -1
N i 1
(Yi 2
2YYi
Y
2)
1 N -1
N i 1
Yi 2
NY
2
1 (NP NP2 ) 1 NP(1 P)
[P z 2
1 f n
1 N 1
Np(1
p),
P
z
2
1 f 1 Np(1 p)] n N 1
2.4 某大学有10000名本科生,现欲估计在暑期间参加
了各类英语培训的学生所占的比例。随机抽取了200名
学生进行调查,得到p 0.35。试估计该大学所有本科
生中暑假参加培训班的比例的95%的置信区间。
解:利用去年化肥总产量X 2135,今年化肥总产量 Y的估计值为
YˆR
XRˆ
X
y x
2135 22 25
2426.14.
引理2.3 对于简单随机抽样,n较大时, =; 二是说在某种条件下, 是近似无偏的。
抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样

N
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:
Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1
推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X
Y X
r
n
yi xi
i 1
y x
i 1
i 1
简单估计量
1 Y y n
n
yi
y1 y 2 y n n
i 1
N Y Ny n
n
yi
i 1
a 1 P p n n
n
yi y Y
i 1
ˆ R
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。
引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:
Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1
推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X
Y X
r
n
yi xi
i 1
y x
i 1
i 1
简单估计量
1 Y y n
n
yi
y1 y 2 y n n
i 1
N Y Ny n
n
yi
i 1
a 1 P p n n
n
yi y Y
i 1
ˆ R
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。
引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r
抽样技术第二章_简单随机抽样

目前,世界上已编有许多种随机数表。其中较 大的有兰德公司编制,1955年出版的100万数 字随机数表,它按五位一组排列,共有20万组 ;肯德尔和史密斯编制,1938年出版的10万 数字随机数表,它也按五位一组排列,共有 25000组。我国常用的是中国科学院数学研究 所概率统计室编印的《常用数理统计表》中的 随机数表。
率都等于1/ CNn,这种抽样称为简单随机抽样。
注意:定义2.1与定义2.3是等价的。
三个定义之间的联系
简单随机抽样的具体实施方法
常用的有抽签法和随机数法两种。 (一)抽签法 抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与
之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以 是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽 中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样 本。 抽签法在技术上十分简单,但在实际应用中,对总体各单元编号 并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时 ,抽签法并不是很方便,而且也往往难以保证做到等概率。因此 ,实际工作中常常使用随机数法。
s2 / n
s(y)
y
t
1
2
s(y),y
t
1
2
s(y)
概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样
二、实施方法 三、地位、作用
是其他抽样方法基础
2.1定义与符号
定义2.1 从总体的N个单元中,一次整批抽取n 个单元,使任何一个单元被抽中的概率都相等 ,任何n个不同单元组成的组合被抽中的概率 也都相等,这种抽样称为简单随机抽样.
此外,简单随机抽样要求在抽样前编制出抽样 框,并对每一个总体抽样单元进行编号,而且 当总体抽样单元的分布比较分散时,样本也可 能会比较分散,这些都会给简单随机抽样方法 的运用造成许多的不便,甚至在某些情况下干 脆无法使用。因此,在此基础上研究其它抽样 技术显得更加重要。
第二章 简单随机抽样

2.1 定义与符号
总体:( )具体总体;( ;(2)有限总体; 总体:(1)具体总体;( )有限总体; :( (3)与样本框存在一一对应关系的所谓实查总体或被称为 ) 抽样总体的样本框本身。 抽样总体的样本框本身。 单元:总是指构成抽样总体的样本单元(样品、样本点) 单元:总是指构成抽样总体的样本单元(样品、样本点) 抽样单元并不总是等同于个体, 抽样单元并不总是等同于个体,有时抽样单元甚至包含几个或 多个个体 个体:最小的不可再分的单元 个体: 设抽样总体由N个抽样单元组成 个抽样单元组成, 是已知整数 表示总体规模 是已知整数, 总体规模; 设抽样总体由 个抽样单元组成,N是已知整数,表示总体规模; 欲在其中抽取n个抽样单元构成样本 个抽样单元构成样本。 欲在其中抽取 个抽样单元构成样本。 n是一个事先人为确定的不大于 ,不小于 的正整数,称为样本容 是一个事先人为确定的不大于N,不小于1的正整数 称为样本容 的正整数, 是一个事先人为确定的不大于 简称样本量或样品数,表示样本规模。 量,简称样本量或样品数,表示样本规模。 样本容量相对于总体规模的比例f=n/N,称为抽样比 样本容量相对于总体规模的比例 ,称为抽样比
n CN
简单随机抽样的三个等价定义: 简单随机抽样的三个等价定义:
定义2.1 从总体的 个单元中,一次整批抽取 个单元,使任何一个 从总体的N个单元中 一次整批抽取n个单元 个单元中, 个单元, 定义 单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概 单元被抽中的概率都相等,任何 个不同单元组成的组合被抽中的概 率也相等,这种抽样称为简单随机抽样。 率也相等,这种抽样称为简单随机抽样。 定义2.2从总体的 个单元中,逐个不放回地抽取单元,每次抽取到 从总体的N个单元中 定义 从总体的 个单元中,逐个不放回地抽取单元, 尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止 个单元为止, 尚未入样的任何一个单元的概率都相等,直到抽足 个单元为止,这 样所得的n个单元组成一个简单随机样本 个单元组成一个简单随机样本。 样所得的 个单元组成一个简单随机样本。 定义2.3 按照从总体的 个单元中抽取 个单元的所有可能不同的组 按照从总体的N个单元中抽取 个单元中抽取n个单元的所有可能不同的组 定义 n n 个样本数, 个样本随机抽取一个样本, 合构造所有可能的 CN个样本数,从 CN 个样本随机抽取一个样本,使 n 这种抽样称为简单随机抽样。 每个样本被抽中的概率都等于1/ CN ,这种抽样称为简单随机抽样。 n N
抽样调查简单随机抽样

所得的样本C称Nn 为不放回简单随机样本。
(三)简单随机抽样是等概率抽样(※※※)
1、从样本来看是等概率抽样
每个可能样本的被抽中的概率:
1
(1)考虑顺序的重复抽样时:N n
1
(2)考虑顺序的不重复抽样时:C
n N
n1
(3)不考虑顺序的重复抽样时:(NN!n)! (4)不考虑顺序的不重复抽样时:1 2、从抽样单元看是等概率抽样 CNn
第一节 抽样方式
一、什么是简单随机抽样 为什么叫“简单”随机抽样? ①估计总体参数时使用简单估计量; ②“单纯”抽样,从总体中直接抽个体;(不是
抽群,不是抽大类,抽前不进行任何处理) ③其他抽样都包含简单随机抽样的成分; ④生活中有时抓“机会”、“归属”时采用,
有“容易操作”的意思。
第一节 抽样方式
抽签法
一次抽n个单位 一次抽1个单位连抽n次
简单随机样本抽取方法
随机数法
随机数字表法() 随机数色子法 摇奖机法 伪随机数法
利用随机数字表抽选简单随机样本
随机数表是一张由0,1,2,…,9这十个数 字组成的,一般常用的是五位数的随机数字表, 10个数字在表中出现的顺序是随机的,每个数 字都有同样的机会被抽中。
一、什么是简单随机抽样
根据抽样单位放回否分为放回简单随机抽样 (Simple Random Sampling with Replacement,SRSWR)和不放回简单随 机抽样(Simple Random Sampling without Replacement,SRSWOR) 。
简单随机抽样
一、估计量的种类
• 根据构造方法不同划分:
• ①简单估计量(直接估计量)
• 直接以调查变量的样本指标作为总体指标的 估计量。如样本均值作为总体均值的估计量。 简单估计量是线性估计量,往往也是无偏估 计量。
(三)简单随机抽样是等概率抽样(※※※)
1、从样本来看是等概率抽样
每个可能样本的被抽中的概率:
1
(1)考虑顺序的重复抽样时:N n
1
(2)考虑顺序的不重复抽样时:C
n N
n1
(3)不考虑顺序的重复抽样时:(NN!n)! (4)不考虑顺序的不重复抽样时:1 2、从抽样单元看是等概率抽样 CNn
第一节 抽样方式
一、什么是简单随机抽样 为什么叫“简单”随机抽样? ①估计总体参数时使用简单估计量; ②“单纯”抽样,从总体中直接抽个体;(不是
抽群,不是抽大类,抽前不进行任何处理) ③其他抽样都包含简单随机抽样的成分; ④生活中有时抓“机会”、“归属”时采用,
有“容易操作”的意思。
第一节 抽样方式
抽签法
一次抽n个单位 一次抽1个单位连抽n次
简单随机样本抽取方法
随机数法
随机数字表法() 随机数色子法 摇奖机法 伪随机数法
利用随机数字表抽选简单随机样本
随机数表是一张由0,1,2,…,9这十个数 字组成的,一般常用的是五位数的随机数字表, 10个数字在表中出现的顺序是随机的,每个数 字都有同样的机会被抽中。
一、什么是简单随机抽样
根据抽样单位放回否分为放回简单随机抽样 (Simple Random Sampling with Replacement,SRSWR)和不放回简单随 机抽样(Simple Random Sampling without Replacement,SRSWOR) 。
简单随机抽样
一、估计量的种类
• 根据构造方法不同划分:
• ①简单估计量(直接估计量)
• 直接以调查变量的样本指标作为总体指标的 估计量。如样本均值作为总体均值的估计量。 简单估计量是线性估计量,往往也是无偏估 计量。
抽样调查-第2章简单随机抽样

N2 1
f
S2
n
V (P)
V ( p)
1
f
1 NP(1 P)
n n 1
返回
总体总量的估计量方差是总体均值方差的直接 推导,下面我们来推导总体比例估计量的方差。
1 f 1
V (P)
NP(1 P)
n N 1
只需证明此时S 2 1 NP(1 P)即可。 N 1
返回
设N个样本单元中有N1个具有某一特 性,即有N1个单元取值为1,有N-N1个单元 取值为0.
Yi 2
N( 1 N
N
Yi )2 ]
i 1
返回
1 n( N
f 1)
[
N i 1
Yi 2
2
NY ]
1 f n( N 1)
N
(Yi 2
Y
2
)
i 1
1 f n( N 1)
N
(Yi
i 1
Y )2
S 2 (1 f ) n
即 V (y) 1 f S 2 n
C C2 n2 2 N 2
每个样本被抽中的概率为:
C C2 n2 2 N 2
/
CNn
n(n 1) N (N 1)
返回
引理二 从总体规模为N的总体中抽取一个样 本量为n的简单随机样本。若对总体中的每个单
元 Yi ,引进随机变量 ai 如下:
ai
1,
若Yi入样
0,若Yi不入样(i 1,2,, N )
N i1
(Yi
Y )2
N 2
N 1
返回
总体指标值上面带符号“ ”的表示由样本得
2简单随机抽样的方法

5年至10年 10年以上
人数
300
500
200
试利用上述资料设计一个抽样比为1/10的抽样方法。
23
练习、在1000个有机会中奖的号码(编号为 000~999)中,在公证部门的监督下,按随机抽 取的方法确定最后两位数为88的号码为中奖号码, 这是运用那种抽样方法确定中奖号码的?依次写 出这10个中奖号码。
1%的学生进行调
你认为哪些因素影响学生视 查,你认为应当怎
力?抽样要考虑和因素? 样抽取样本? 13
2.1.3 分层抽样
14
一、分层抽样的定义。 一般地,在抽样时,将总体分成互不交叉
的层,然后按照一定的比例,从各层独立地抽 取一定数量的个体,将各层取出的个体合在一 起作为样本,这种抽样的方法叫分层抽样。
号可能是( B )
A.5,10,15,20,25 B、3,13,23,33,43 C、1, 2, 3, 4, 5 D、2, 4, 6, 16,32
10
例3:从2005个编号中抽取20个号码入样,采
用系统抽样的方法,则抽样的间隔为
( C)
A.99
B、99.5
C.100 D、100.5
例4:某小礼堂有25排座位,每排20个座位,一次 心理学讲座,礼堂中坐满了学生,会后为了了解 有关情况,留下座位号是15的所有25名学生进行
分层抽样抽取容量为45的样本,那么高一、高
二、高三各年级抽取的人数分别为(D )
A.15,5,25
B.15,15,15
C.10,5,30
D15,10,20
例2:一个地区共有5个乡镇,人口3万人, 其中人口比例为3:2:5:2:3,从3万人中抽 取一个300人的样本,分析某种疾病的发病率, 已知这种疾病与不同的地理位置及水土有关, 问应采取什么样的方法?并写出具体过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
均方偏差的无偏估计量 为 1 n 2 1 n v( p) 1 s 1 p(1 p) n N n 1 N
思考: 总体具有某特征的个体总数该如何估计?
比例估计
例 2 某大学有 1 万名本科生,现欲估计暑假期间参 加了各类英语培训的学生所占比例,随机抽取了 200名学生调查,得到p=0.35,估计全校参加培训学 生比例P及 该估的标准差。 练习2 利用例1的数据估计该社区人均收入低于500 元的户数N1,并估计其均方偏差。
例题与练习
例3 从某地区15786位老人中,抽出一个含525位老 人的简单随机样本,调查每位老人的性别及生活能 否自理,结果如下:
性别 能否自理 能
不能
男
女
211
31
263
20
(1)估计该地区生活不能自理的老人人数及该估计的 均方偏差; (2)估计该地区生活不能自理的男性老人人数及该估 计的均方偏差;
则Z Z i即具有该特征的子总体 的总值,对
i 1 N
样本作同样处理,则样 本为 ( z1 , z 2, , z n ) ( y1 , y2 , , yn1 ,0, ,0)
部分估计
按简单估值法, Z的估计量为 N n N Nz zi n i 1 n 该估计的均方偏差为
62180
63447 26619 78740 61996 63434 47269 92933 69507 05977 60829 48817 31262
32361
89809 96244 92558 24476 56074 56088 81257 24726 88443 41925 76031 00327
使用随机数表
随机数表是数字 0~9 随 机 排 列 而 成 的,这些数字在表 中的一位数、两位 数、三位数等随机 出现并有相同的概 率。
例 : 从 N=345 的 总体中抽取一个 n=15的简单随机 样本。
35161
11756
31582
58790
随机数法
使用计算机随机数 开始抽样 使用随机数骰子
D {D1, D2 ,, DN }指示了一个具体样本
定义与符号
线性估计与非线性估计
不借助任何辅助变量,对总体进行直接估 计,用样本特征的线性组合估计总体特征称为 线性估计;而借助辅助变量,用样本特征的非 线性组合表示总体特征,称为非线性估计。
简单估计
对简单随机抽样的线性估计有“简单线性估 计(Simple linear estimate)”之称,简称简单估计。
7 1 2 6 5 4 2 8 5 1 0 6 7 3 8 3 4 9
9
0
顶视图
底视图
随机数法
永久随机数法
抽样者给总体的第 i 个个体赋予一个 [0 , 1] 上的 随机数 Ri , Ri 与第 i 个个体永久对应,抽样设计时, 确定好抽样比f,Ri<f的对应单元入样。
特点: (1)可保证多次抽样中有大量相同单元; (2)缺点是样本量不完全确定
如:Y的SLE为y, Y的SLE为y
几个基本定理
定理1 对简单随机抽样,有:
n P{Di 1} , i 1,2, , N N n(n 1) , i j , i, j 1,2, , N P{Di 1, D j 1} N ( N 1)
定义与符号
易于 易于 操作 操作 易于 揭示 操作 本质
定义1
定义2
易于 综合 操作 两者
定义3
定义与符号
符号
有限总体 {Y1 , Y2 ,, YN } 1 N 1 n 总体均值 Y Yi , 样本均值 y yi N i 1 n i 1
抽样的示性函数
1, 第i个单元 Yi 被抽中 Di 0, 第i个单元 Yi未被抽中
3(n 1)(N n)(N n 1) 1 2 3 Yi O 2 n N ( N 1)(N 2)(N 3) i 1 n
N
2
Y 0不是本质条件,只是为 了使定理形式 较简洁.
几个基本定理
一般情况下 (Y 0)有:
(1) E ( y ) Y ;
n 每一单元的入样概率为 , N n(n 1) 任意两单元同时入样的 概率为 , N ( N 1) Di与Dj不独立
几个基本定理
定理2 对简单随机抽样,有:
n n n E ( Di ) N , var( Di ) N 1 N , i 1,2,, n n n cov( D , D ) 1 , i j, i, j 1,2,, n i j N ( N 1) N
2
y
i 1
n1
i
N2 n 1 N 2 E( Nz Z ) ( Z Z ) 1 i n N N 1 i 1 均方偏差的估计量为
N2 n 2 N2 n 1 N 2 ( z z ) 1 s 1 i n N n N n 1 i 1 2 n1 n1 N ( N n) 1 2 yi yi n(n 1) i 1 n i 1
放回无序、不放回有序通常没有使用价值; “放回有序”又称“放回简单随机抽样 (SRSWR)”,所有可能样本数量最多,但理论结 果简单; “不放回无序”又称“不放回简单随机抽样 (SRSWOR)”,所有可能样本数量最少,操作最 简单; 本书的简单随机抽样指的是SRSWOR.
定义与符号
定义1 从一个单元数为N的总体中逐个抽取单元 且无放回,每次都在所有尚未进入样本的单元中 等概率地抽取直到n个单元抽完,这种抽样称为简 单随机抽样。 定义2 按照从总体的N个单元抽取n个单元的所有 可能不同组合构造所有可能的 CNn 个样本,从 CNn 个样本随机抽取1个,使每个样本被抽中的概率等 于1/ CNn ,这种抽样成为简单随机抽样。 定义3 从总体的N个单元中,一次整批地抽取n 个单元,使任何一个单元被抽中的概率都相等, 任何 n 个不同单元组成的组合被抽中的概率也都 相等,这种抽样称为简单随机抽样。
随机数法
65547 38844 76684 79311
95846
05630 36056 53454 05602 58225 79596 69398 56323 77938 29639 61103 34313
75837
54244 02112 43644 11326 78627 95072 04569 62258 11661 91665 91058 65698
1 n 2 1 (2) var(y ) 1 SY (1 f ) SY2 n N n
抽样理论 核心定理
其中称1-f 为有限总体校正系数 (finite population correction factor, fpc)
抽签法 统计软件抽样 随机数法 其它方法
抽签法
一个样本量为 n的简单随机样本,则样 本均值 1 n 1 y yi 是总体均值 Y n i 1 N
2
Y 的无偏估计 .
i 1 i
N
该估计 y的均方偏差为(无偏时 即为方差) 1 n 2 V ( y ) E ( y Y ) 1 S n N N 1 2 2 其中 S (Yi Y ) . N 1 i 1
2
Y
i 1
N
i
0,则:
几个基本定理
( N n)(N 2n) N 3 1 (3) E ( y ) 2 Yi O 2 n N ( N 1)(N 2) i 1 n
3
2 2 N ( N n )[ N ( 6 n 1 ) N 6 n ] 4 (4) E ( y 4 ) Y i 3 n N ( N 1)(N 2)(N 3) i 1
练习 1 为合理调配电力资源,某市欲了解 5 万户居 民日用电量.用简单随机抽样抽取了300户进行调查, 得到日用电量平均值为9.5kwh,样本方差为206.估 计用电量平均值与该估计的均方偏差.
部分估计
估计总体U中具有某一特征的“子总体”的 数量参数,可令
Yi , 第i个个体具有该特征 Zi 0, 第i个个体不具有该特征
估值定理
系 Ny是总体 Y Yi的无偏估计 , 其均方偏差
i 1 N
为 N2 n 2 V ( Ny ) 1 S n N
估值定理
定理2 在简单随机抽样下,样本方差
n 1 2 s2 ( y y ) . i n 1 i 1
是总体方差 S 的无偏估计量 .从而 1 n 2 v ( y ) 1 s n N 是估计量 y的均方偏差 V ( y )的无偏估计 .
做 N个签,分别编上1到N号,完全均匀 混合后,一次同时抽取 n个签 ,或一次抽 取一个签但不把这个签放回,接着抽第 2 个、第3个、……,直到抽足n个为止。 缺点: (1)实施较麻烦,N较大时更不实用; (2)等概率性很大程度依赖于抽样个体 是否摇匀。
统计软件抽样
例:某校为了解学生身体素质的基本情况, 从全校学生总数 N=1003 人中抽选一个简 单随机样本n=100人进行体检。 开始抽样
几个基本定理
定理3
设y1 , y2 , , yn是来自总体{Y1 ,Y2 , ,YN } 的简单随 机样本,Yi有界,即存在一个与N无关的数M, 1 使 | Yi | M (i =1, 2, , N )且Y N
(1) E( y) Y 0;
1 1 2 1 (2) E ( y ) SY O ; n N n
§2.1 简单随机抽样的几个基本定理 §2.2 简单随机抽样的实现 §2.3 简单估值法 §2.4 区间估计与样本量的确定 §2.5 比估计 §2.6 差估计与回归估计