简单随机抽样

合集下载

Chap03简单随机抽样

Chap03简单随机抽样

N i j
(Yi
Y
)(Yj
Y
)

1 nN
1
n 1 N 1
N i 1
(Yi
Y
)2
n 1 N 1

N i 1
(Yi
Y
2 )


1 n

N N
n

1 N 1
N i 1
(Yi
Y
)2
1 f S2
n
证明Ⅱ:仍引进随机变量 ai :
N 1 n 1

N n


n N
ˆ
f
E(ai )
n N

f
(3.5)
借助 ai ,样本均值 y 可以表示成:
y

1 n
N i 1
aiYi
(3.6)
E( y) 1
n
N
E(ai )Yi
i 1
1 n
n N
N
Yi
i 1
Y
推论: Y 的简单估计量Yˆ Ny 也是无偏的,即: E(Ny ) Y
所有可能的样本求平均: E( y)
N 1 y n

N n

个样本中,包含特定单元
Yi
的样
本数为

N 1 n 1
,也有同样多样
本含有任何其他单元,因此
y 1
n
( y1
y2

yn )

1 n

N 1 n 1
数,则编号为这些随机数的 n 个单元组成一个简单随机样本。
随机数的产生可使用随机数骰子或随机数表。
图 3.1 随机数骰子 随机数骰子:标上 0~9 数字的正 20 面体(每个数字出现在两面)

【】简单随机抽样

【】简单随机抽样

3.抽签法的步骤
(1)将总体中的所有个体编号(号码可以从1到N); (2)将1到N这N个号码写在形状、大小相同的号签上(号签可
以用小球、卡片、纸条等制作); (3)将号签放在同一箱中,并搅拌均匀;
(4)从箱中每次抽出1个号签,并记录其编号,连续抽取n次;
(5)从总体中将与抽到的号签编号相一致的个体取出.
(2)在利用抽签法抽取编号时可视情况而定,若已知编号,如学号、考号等可直接使用.但一定要保证抽样的公平性. (3)从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过;
(2)仓库中有1万支奥运火炬,从中一次性抽取100支 第四步:相应编号的男生参加合唱.
(4)将总体中的个体编号时与抽签法有所不同,须使个体编号位数相同,以便于运用随机数表.
这样就得到一个容量为n的样本.对个体编
号时,也可以利用已有的编号,如从全体学生中 抽取样本时,利用学生的学号作为编号.
4.随机数表法的步骤 (1)对总体的个体进行编号(每个号码位数一致); (2)在随机数表中_任__选__一__个__数__作为开始; (3)从选定的数开始按一定的方向读下去,得到的 号码若不在编号中,则跳过;若在编号中,则取出; 如果得到的号码前面已经取出,也跳过;如此继续 下去,直到取满为止; (4)根据选定的号码抽取样本.
一、课堂引入
, 你准备怎么做?显然,不可能对所有的饼干进 行一一检验,只能从中抽取一定数量的饼干作 为检验的样本.为了使得到的结果更加真实可 靠,我们不能按顺序来抽取,而往往采用随机 抽样的方法来进行抽取.如何获得比较合理的 样本?这就是我们本节课要研究的问题.
(4)根据选定的号码抽取样本.
(3)某连队从200名党员官兵中,挑选出50名最优秀 自我挑战2 学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班

简单随机抽样

简单随机抽样

一、知识概述1、简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.注:(1)一般地,用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;(2)简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等;(3)简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.介绍:抽样方法在统计学中很多,如果按照抽取样本时总体中的每个个体被抽取的概率是否相等来进行分类,可分为:等概率抽样和不等概率抽样.在等概率抽样中,又可以分为不放回抽样和放回抽样.在实际应用中,使用较多的是不放回抽样,相对来说,放回抽样在理论研究中显得更为重要.2、简单随机抽样的实施方法:(1)抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多时.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.(2)随机数表法:1°.制定随机数表;2°.给总体中各个个体编号;3°.按照一定的规则确定所要抽取的样本的号码.随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.3、简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.注:抽签法与随机数表法的比较:共同点:(1)抽签法和随机数表法都是简单随机抽样的方法,并且要求被抽取样本的总体的个数有限;(2)抽签法和随机数表法都是从总体中逐个地进行抽取,都是不放回抽样.不同点:(1)抽签法相对于随机数表法简单,随机数表法较抽签法稍麻烦一点;(2)随机数表法更适用于总体中的个体数较多的时候,而抽签法适用于总体中的个数相对较少的时候,所以当总体中的个数较多时,应当选用随机数表法,这样可以节约大量的人力和制作号签的成本与精力.二、例题讲解例1、某次考试有70000名学生参加,为了了解这70000名考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:(1)1000名考生是总体的一个样本;(2)1000名考生数学成绩的平均数是总体平均数;(3)70000名考生是总体;(4)样本容量是1000,其中正确的说法有()A.1种B.2种C.3种D.4种解:(3)(4)对,故选B.例2、现要从20名学生中抽取5名进行阅卷调查,写出抽取样本的过程.解:①先将20名学生进行编号,从1编到20;②把号码写在形状、大小均相同的号签上;③将号签放在一个箱子中进行充分搅拌,力求均匀,然后从箱子中抽取5个号签,这5个号签上的号码对应的学生,即为所求的样本.例3、为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,写出用随机数表法抽取样本的过程.解:第一步,先将40件产品编号,可以编为00,01,02,…,38,39.第二步,利用本节教材中提供的随机数表,任选一个数作为开始,例如从第10行第6列的数字开始.第三步,从选定的数6开始,从左往右读,依次得到样本号码是:24,29,05,28,27,34,32,38,20,00.这10个号码所对应的产品为样本.例4、上海某中学从40名学生中选1人作为上海男篮拉拉队的成员,采用下面两种选法:选法一将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选.选法二将39个白球与1个红球混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为拉拉队成员.试问这两种选法是否都是抽签法?为什么?这两种选法有何异同?解:选法二不是抽签法.因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.这两种选法相同之处在于每名学生被选中的概率都相等,等于.例5、某市通过电话进行民意测验实施某项调查,该市的电话号码有7位,其中首两位为区域代码,只能为2,3,5,7的任意两两组合,后5位取自0~9这10个数字.现在任意选择3个区域,每个区域随机选取5个号码进行调查.请你设计一种抽取方案,选出这15个电话号码.解:首先列出所有由2,3,5,7两两组合而成的区域代码共16个,用抽签法随机选取3个;然后制作一张0~99999的随机数表,方法是用抽签法或计算机生成法产生若干个0~9之间的随机整数,5个一组,构成0~99999之间的随机数表;最后用随机数表法选出15个5位号码,分成3组,第1组前加上用抽签法选出的第1个区域代码,第2,3组前分别加上选出的第2,3个区域代码.。

第2章简单随机抽样

第2章简单随机抽样

称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2

V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量

简单随机抽样(创新设计)

简单随机抽样(创新设计)
以基于样本数据进行推断和预测。
03
创新设计在简单随机抽 样中的应用
利用创新技术提高抽样的效率
01
02
03
自动化技术
利用自动化设备或软件进 行随机抽样,减少人工操 作,提高抽样的速度和准 确性。
大数据技术
利用大数据分析技术,对 大量数据进行快速处理和 分析,提高抽样的效率。
云计算技术
利用云计算平台进行分布 式计算,提高数据处理和 存储的效率,加速抽样过 程。
要点一
总结词
要点二
详细描述
简单随机抽样将拓展到其他领域,为不同领域的研究和实 践提供支持。
简单随机抽样作为一种基础统计方法,不仅在统计学领域 有广泛应用,还将拓展到其他领域,如社会学、经济学、 政治学等。通过与其他领域的结合,简单随机抽样将为各 领域的研究和实践提供有力支持,促进跨学科的发展和应 用。
特点
简单随机抽样具有简单易行、误差小、 代表性强的特点,适用于各种类型的 调查对象,尤其适用于样本量较大、 总体各单位之间差异不大的情况。
简单随机抽样的应用场景
市场调研
在市场调研中,简单随机抽样常 用于了解消费者需求、品牌认知 度、市场份额等方面的情况。
社会调查
在社会调查中,简单随机抽样用 于了解社会现象、人口特征、民 意倾向等方面的情况。
总结词
详细描述
人工智能技术将为简单随机抽样提供更智能、 自动化的方法,提高抽样的效率和精度。
人工智能技术,如机器学习和深度学习,可 以应用于简单随机抽样中,实现自动化抽样 和数据分析。通过训练模型,可以自动识别 和筛选符合条件的样本,减少人为干预和误 差,提高抽样的准确性和可靠性。
简单随机抽样的跨领域应用
总结词

初级1 -第三章简单随机抽样

初级1 -第三章简单随机抽样
n
n
n 1 N 1 n N
n 1 N 1
二、实施方法 • 抽签 制作N个同质的签,充分混合。从中一次抽出n个签, 或者先抽出一个签但不放回,再抽下一个签直到抽 满n个签为止。抽出的这n个签对应的单元入选样本, 这是不放回简单随机抽样;若从充分混合的N个签 中抽取一个,记录后放回,再抽取下一个,如此进 行,直到抽满n个为止,则是放回简单随机抽样。 抽签法的实施起来比较麻烦,尤其是当总体单元数 N较大时,所以该方法的使用场合为当总体单元数 N比较小,签的制作比较方便时。
第三章 简单随机抽样

第一节
基本问题
一、什么是简单随机抽样
从 N个单元的总体中抽取 n个单元组成的样本。总体单元数为 N,
样本量为 n。 若抽样是放回的,每次都是从 个总体单元中随机抽取1个单元,独 立重复抽取n次,得到 个单元组成的样本,叫做放回简单随机抽样。 若抽样是不放回的,每次都是从剩下的总体单元中随机抽取1个单 元,相继依次抽取n次,得到n个单元组成的样本,叫做不放回简单 随机抽样。
精度margin of error
对精度的要求通常以允许最大绝对误差
差限)或允许最大相对误差 (相对误差限)来表 示。
r
d(绝对误
d 1 P
P r 1


样本量足够大时,可用正态分布近似
ˆ tS ˆ d t V
2
第三章 基本概念
N n N 1
N n N
为 修正系数
2
为 S 修正系数
n f ,称抽样比, N
2

N n 1 f 有限总体调整系数 故, N 2
S V ( y ) (1 f ) n

抽样调查简单随机抽样

抽样调查简单随机抽样
所得的样本C称Nn 为不放回简单随机样本。
(三)简单随机抽样是等概率抽样(※※※)
1、从样本来看是等概率抽样
每个可能样本的被抽中的概率:
1
(1)考虑顺序的重复抽样时:N n
1
(2)考虑顺序的不重复抽样时:C
n N
n1
(3)不考虑顺序的重复抽样时:(NN!n)! (4)不考虑顺序的不重复抽样时:1 2、从抽样单元看是等概率抽样 CNn
第一节 抽样方式
一、什么是简单随机抽样 为什么叫“简单”随机抽样? ①估计总体参数时使用简单估计量; ②“单纯”抽样,从总体中直接抽个体;(不是
抽群,不是抽大类,抽前不进行任何处理) ③其他抽样都包含简单随机抽样的成分; ④生活中有时抓“机会”、“归属”时采用,
有“容易操作”的意思。
第一节 抽样方式
抽签法
一次抽n个单位 一次抽1个单位连抽n次
简单随机样本抽取方法
随机数法
随机数字表法() 随机数色子法 摇奖机法 伪随机数法
利用随机数字表抽选简单随机样本
随机数表是一张由0,1,2,…,9这十个数 字组成的,一般常用的是五位数的随机数字表, 10个数字在表中出现的顺序是随机的,每个数 字都有同样的机会被抽中。
一、什么是简单随机抽样
根据抽样单位放回否分为放回简单随机抽样 (Simple Random Sampling with Replacement,SRSWR)和不放回简单随 机抽样(Simple Random Sampling without Replacement,SRSWOR) 。
简单随机抽样
一、估计量的种类
• 根据构造方法不同划分:
• ①简单估计量(直接估计量)
• 直接以调查变量的样本指标作为总体指标的 估计量。如样本均值作为总体均值的估计量。 简单估计量是线性估计量,往往也是无偏估 计量。

简单随机抽样

简单随机抽样

简单随机抽样简答题:结合实例,简述什么是简单随机抽样。

【参考答案】(1)简单随机抽样:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n\;(1≤n<N)个个休作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等。

我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,目每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫作不放回简单随机抽样。

放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样。

特点:每个个体被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其他各种抽样方法的基础。

通常当总体内的个体之间差异程度较小和数目较少时,采用这种抽样方法。

简言之,其特点是:①总体个数有限;②逐个抽取;③等可能抽样。

例如:高一三班52名学生的学号分别是01,52,从中随机挑选2名学生参加演讲表演,这种抽样方法就是简单随机抽样。

(2)分层随机抽样:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。

适用特征:①总体由差异明显的几部分组成;②分成的各层互不重叠;③各层抽取的比例等于样本在总体中的比例 \frac{n}{N}例如:初级中学有学生270人,其中初一年级108人,初二、初三年级各81人,现要抽取10人参加项调查,使用分层抽样时,将学生按初一、初二、初三年级依次统一编号为1,2,…,270,则抽取比例为\frac{10}{27}=\frac{1}{27} ,所以应分别从初一、初二、初三年级抽取4人,3人,3人。

重点概念补充说明:总体:目标总体与抽样总体目标总体也简称为总体,是指所有研究对象的全体,或是研究人员希望从中获取信息的总体,它研究对象中所有性质相同的个体所组。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[ p z 2 v( p), p z 2 v( p)] [0.2846,0.4154]
2.3 比率估计量及其性质
当存在与我们调查的主要变量高度相关 的所谓其他辅助变量的有效信息,且这些 辅助变量的信息质量较好时,利用这些信 息无疑将有助于提高估计的精度。
主要变量为Y,另一个与Y有关的辅助变量 为X,对简单随机抽样的一个样本中的每 一个单元获得了Y和X的调查值yi和xi,而X 的总体总值是已知的。
总体比例的简单估计
性质1. E(Pˆ) E( p) P
性质2.V (Pˆ) 1 f S 2 1 f 1 NP(1 P)
n
n N 1
证明:S 2
1 N -1
N i 1
(Yi
Y )2
1 N -1
N i 1
(Yi 2
2YYi
Y
2)
1 N -1
N i 1
Yi 2
NY
2
1 (NP NP2 ) 1 NP(1 P)
[P z 2
1 f n
1 N 1
Np(1
p),
P
z
2
1 f 1 Np(1 p)] n N 1
2.4 某大学有10000名本科生,现欲估计在暑期间参加
了各类英语培训的学生所占的比例。随机抽取了200名
学生进行调查,得到p 0.35。试估计该大学所有本科
生中暑假参加培训班的比例的95%的置信区间。
解:利用去年化肥总产量X 2135,今年化肥总产量 Y的估计值为
YˆR
XRˆ
X
y x
2135 22 25
2426.14.
引理2.3 对于简单随机抽样,n较大时, =; 二是说在某种条件下, 是近似无偏的。
总体总值的置信区间
总体总值Y的1的置信区间为 [Ny z 2 V (Ny), Ny z 2 V (Ny)].
若V (Ny) N 2 1 f S 2中S 2是未知的,则V (Ny)替换为 n
v(Ny) N 2 1 f s2 n
2.5 研究某小区家庭用于文化方面的支出,N 200,
现抽取一个容量为20的样本,调查结果如下
若V ( y) 1 f S 2中S 2是未知的,则V ( y)替换为 n
v(y) 1 f s2 n
总体总值的简单估计
N
总体总值 Y Yi NY 的简单估计量为 i 1
Yˆ Ny
N n
n i 1
yi
性质1:Ny是Y的无偏估计,即 E(Ny) Y.
性质2: V (Ny) N 2 1 f S 2. n
200,150,170,150,160,130,140,100,110,140,
150,160,180,130,150,100,180,100,170,120.
估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间
解:该小区平均的文化支出Y的估计值为
Yˆ =y
1 20
20 i 1
yi
2890 20
总体比例的简单估计
"0 1"变换
令 Yi
1, 若总体中第i个单元具有所研究的特征 0, 若总体中第i个单元不具有所研究的特征
N
则总体中具有这种特征的单元总数A Yi Y.
总体中具有这种特征的比例记为 i1
P= A N =Y
总体比例P的简单估计量为
Pˆ = p a
n= 1 n
n i 1
yi
y
第2章 简单随机抽样(SRS)
2.1 定义及其抽选方法 2.2 简单估计量及其性质 2.3 比率估计量及其性质 2.4 回归估计量及其性质 2.5 简单随机抽样的实施
总体均值的简单估计
总体均值 Y
1 N
N
Yi 的简单估计量为样本均值,即
i 1

y
1 n
n i 1
yi
性质1: y是Y的无偏估计, 即 E( y) Y
在实际抽样调查中,这样的辅助变量一般有以下几种常 见情况:
(1)同一个变量的上期调查结果,往往隐含着当期与上期的 变化不会太大的假设;
(2)与主要变量之间整体上存在某种比值关系,即隐含着两 者比值关系的变化不会太大的假设。
辅助变量的选择
辅助变量必须与主要变量高度相关; 辅助变量与主要变量之间的相关关系整体上相
N -1
N -1
总体比例的简单估计
P的1-置信区间[Pˆ z 2 V (Pˆ), Pˆ z 2 V (Pˆ)]
因为V (Pˆ) 1 f 1 NP(1 P)中P是未知的,用
v(Pˆ) 1 f
1
n N 1 Np(1 p)来代替,这样置信区间为
n N 1
[Pˆ z 2 v(Pˆ), Pˆ z 2 v(Pˆ)]
144.5
样本方差计算为
s2= 1 19
20 i 1
( yi
y)2
826.0256
v( y) 1 f s2 1 20 200 826.0256 37.1712
n
20
又z 2 z0.025 1.96, 因而Y的95%置信区间为
[y z0.025 v(y), y z0.025 v(y)] [132.55,156.45]
当稳定; 辅助变量的总体总值必须是已知的,或是容易获
得的; 辅助变量的信息质量更好,或信息更容易取得即
调查成本更低。
主要变量的总体均值 的比率估计量
主要变量的总体总值Y的比率估计量
只有 属于估计量,而且是简单估计量,也就是说这些比率 估计量都是简单估计量 的线性组合。
习题2.8 某地区对本地100家化肥生产企业的尿素产量 进行调查。已知去年的总产量为2135吨,抽取10家 企业调查今年的产量,得到y 25,这些企业去年的 产量均值为x 22。试估计今年该地区化肥总产量。
解:据题意知,N 10000,n 200, f n 0.02. N
该大学所有本科生中参加培训班的比例P的估计值为 Pˆ =p 0.35.
v(Pˆ) v( p) 1 f N p(1 p) 1 f p(1 p) 0.001115,
n N 1
n
v( p) 0.03339.
又z 2 z0.025 1.96,因而P的95%的置信区间为
性质2:V ( y) 1 f S 2,其中,f n 称为入样比,
n
N
S 2
1 N -1
n i 1
(Yi
Y
)2是总体方差
总体均值的置信区间
根据中心极限定理,当 n 较大时
y E( y ) y Y 近似服从正态分布 V(y) V(y)
因此,Y 的1 的置信区间为
[ y z 2 V ( y), y z 2 V (y)].
相关文档
最新文档