第3章简单随机抽样
第3章选择抽样调查方法

第3章选择抽样调查方法在进行调查研究时,我们通常无法直接面对整个研究对象的总体,而需要通过对样本进行观察和分析来推断总体的特征和规律。
因此,正确选择适当的抽样调查方法是保证调查结果可靠和有效的一个重要步骤。
抽样调查方法可以分为概率抽样和非概率抽样两大类。
概率抽样方法是以一定的概率原则进行样本选择的方法,可以减少抽样误差,提高样本的代表性和推广能力。
非概率抽样方法则是基于研究者的主观判断进行样本选择的方法,其优势在于灵活性和经济性。
1.概率抽样方法概率抽样方法是利用随机数表或随机数发生器确定样本的选择机会,以保证样本的选取是随机的、无偏的。
常见的概率抽样方法有简单随机抽样、系统抽样、整群抽样和多阶段抽样等。
(1)简单随机抽样是最常用的抽样方法之一,其基本思想是将总体划分为若干个有相同特征的子群,然后从每个子群中随机选择若干个样本,再将这些样本合并成总体样本。
这种方法具有操作简单、抽样误差可控等优点。
(2)系统抽样是将总体按照一定的规则排列后,根据随机数表或随机数发生器选择出一个随机起点,然后按照一定的间隔逐个选择样本。
这种方法适用于总体比较稳定的研究对象,具有操作简单、抽样比例可控等优点。
(3)整群抽样是将总体按照其中一种特征划分为若干个互不重叠的子群,然后从每个子群中全面选择样本。
这种方法适用于总体具有一定规模的亚群体的研究,具有简化抽样过程、减小抽样误差等优点。
(4)多阶段抽样是将总体按照一定的层次划分并逐层选择样本,其中每一层可以使用不同的抽样方法。
这种方法适用于总体分布复杂、无法直接获取的情况,具有适应性强、适用范围广等优点。
2.非概率抽样方法非概率抽样方法是基于主观判断或特定目的选择样本的方法,其优势在于灵活性、经济性和操作简单,但容易引入选择偏差和非抽样误差。
常见的非概率抽样方法有方便抽样、判断抽样、专家抽样和配额抽样等。
(1)方便抽样是研究者根据个人方便性自主选择的样本,不具备随机性和代表性,容易引入选择偏差。
第三章-简单随机抽样

N!
考虑顺序可能的样本为 N n !
每个样本被抽中的概率为 ( N n)! N!
s2 1358.41, v( y) (1 f )s2 / n 37.6444, se( y) 6.1355
对该校大学生某月电信消费人均支出额的估计为 53.64元,在置信度95%下,临界值1.96,可以说以 95%的把握说明该校大学生该月的人均支出在 [53.64+(-)1.96*6.1355],即41.61~65.67元。
n 1
2n
正态近似产生的误差 主要与nP有关,特别 当nP比较小时,产生 的误差甚大,在95% 置信度下,P<0.5时正 态分布需要的最小nP 值与n值如下表。
P
nP
0.5
0.4
0.3
0.2
0.1
0.05
0
n
15
30
20
50
24
80
40 200
60 600
70 1400
80 无穷
试以95%的置信度估计上例大学生月电信消费超 过80元的人数及其比例。
N n S2 N n
nN
为调查某校大学生的电信消费水平,在全 校N=15230名学生用简单随机抽样抽取 n=36名学生,调查上月电信支出数据。试 以95%的置信度估计该校大学生该月电信 消费的平均支出额。
样本序号 消费元/月 样本序号 消费
样本序号 消费
1
45
13
抽样技术第三章_分层随机抽样

4
4
4
ˆ v Y ˆ 23208 s Y
ˆ 209650 2 23208 ˆ ts Y Y
2015/11/6
23
三、对总体比例的估计
总体比例P的估计为:pst Wh ph
h 1
L
估计量的性质
对于一般的分层抽样,如果 ph是 P h 的无偏估计 (h 1,2,, L ),则 pst 是 P的无偏估计。 p 的方差为:
W 2V Y V Y h h st
h1
L
只要对各层估计无偏,则总体估计也无偏。
各层可以采用不同的抽样方法,只要相应的估计量是无 偏的,则对总体的推算也是无偏的。
11
2015/11/6
证明性质1
由于对每一层有
ˆ Y EY h h
L L ˆ ˆ ˆ E Y E W Y W E Y st h h h h 因此, h1 h1
L
L
N Y hh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
N
h 1
L
h
yh
10
2015/11/6
估计量的性质
是 Yh 的无 性质1&2:对于一般的分层抽样,如果 Y h 偏估计( h 1,2, , L ),则 Y 是Y 的无偏估计。 st Yst 的方差为:
7
三、符号
所有总体参数的估计量都采用下标“st”以示区别:
记 号 代表的含义
h
下标
i
(人教a版)必修三同步课件:2.1.1简单随机抽样

样本
样本容量 2.从3个同学当中选择1位同学去参加某项活动,每个同学被
选中的可能性为___.
1 3
[预习导引]
1.简单随机抽样的定义
不放回 (n≤N),如果每次抽 设一个总体含有N个个体,从中逐个_______地抽取n个个体作为样本
取时总体内的各个个体被抽到的机会都_____,就把这种抽样方法叫做简单随机抽样.
高中数学· 必修3· 人教A版
第二章
统计
2.1 随机抽样 2.1.1 简单随机抽样
[学习目标]
1.理解并掌握简单随机抽样的概念、特点和步骤. 2.掌握简单随机抽样的两种方法.
[知识链接]
1.在初中我们已学过一些统计知识.我们把所要考察对象的全体叫做_____,其中每一个考
总体 个体 _____,样本 察对象叫做_____ .从总体中抽出的若干个个体组成的集合叫做总体的一个
跟踪演练3
(2013· 江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面
的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右一 次选取两个数字,则选出来的第5个个体的编号为 ( )
7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481
第四步,从盒子中依次取出6个号签,并记录上面的编号. 第五步,与所得号码对应的志愿者就是医疗小组成员. 规律方法 1.一个抽样试验能否用抽签法,关键看两点:一
是制签是否方便;二是个体之间差异不明显.一般地,当样
本容量和总体容量较小时,可用抽签法. 2.应用抽签法时应注意以下几点: (1)编号时,如果已有编号可不必重新编号; (2)号签要求大小、形状完全相同; (3)号签要均匀搅拌; (4)要逐一不放回的抽取.
第三章 抽样设计

一、方便抽样
又称任意抽样。一般由调研人员从工作的 方便出发,在调研对象的范围内随意抽取 一定数量的样本进行调查。
最常用的两种方法是“街头拦截法” 最常用的两种方法是“街头拦截法”和 “空间抽样法” 空间抽样法” 特点: 节约费用和时间,但样本的信息不 适用于总体参数的推断。
注意:
方便抽样一般用于非正式的探索性调查, 只有在调查总体各单位之间的差异不大时, 抽取的样本才有较高的代表性。
抽取样本的数量
允许误差 % 1 2 3 4 5 6 7 可信程度(把握程度)% 95 99 9600 16589 2400 4147 1067 1849 600 1037 384 663 267 461 196 339
一、简单随机抽样
适用范围:调查总体中各个体之间差异程 度较小的情况下,或者调研对象不明,难 以分组、分类的情况。 常用方法: 1、抽签法 2、随机数表法
二、系统抽样
又称等距抽样,就是先将调查总体的各个 体按照一定的标志排列起来,然后按照固 定的顺序和一定间隔来抽取样本个体。
排队的标志有两种: 1、按调查项目有关的标志排队 2、按调查项目无关的标志排队
(独立控制配额)按年龄分组: 独立控制配额)按年龄分组:
按年龄分组 18-29岁 18-29岁 30-40岁 30-40岁 41-55岁 41-55岁 56岁 56岁 合计 人数 40 60 70 30 200
按性别分组
性别 人数 100 100 200
男
女
合计
相互控制配额抽样
合计 40 60 70 30 收入 性别 年龄 18-29岁 18-29岁 30-40岁 30-40岁 41-55岁 41-55岁 56岁以上 56岁以上 合计 高 男 3 6 6 3 18 女 4 5 6 3 18 中 男 7 11 13 6 37 女 8 11 13 5 37 低 男 9 13 16 7 45 女 9 14 16 6 45
第3章抽样设计

三、抽样框 抽样框是指用以代表总体,并从中抽选样本的一个框架,
其具体表现形式主要有包括总体全部单位的名册、地图等。抽 样框在抽样调查中处于重要地位,是抽样调查必不可少的部分, 其对于推断总体具有相当大的影响。
四、抽样比 抽样比是指在抽选样本时,所抽取的样本单位数与总体单位
随机抽样调查的特点和作用
一、随机抽样调查的特点
抽样就是根据随机原则从总体中抽取一部分单位作为样本,并 根据样本数量特征对总体特征做出有一定可靠性的估计与推断。
在统计中将从总体中抽取的部分单位称为样本,把描述样本数 量特征的指标称为统计量,描述总体数量特征的指标称为参数。
随机抽样调查是建立在随机取样基础上,保证了每一单位都有 被抽中的可能性,从而增强了被抽中单位对总体的代表性。
特征的指标称为统计量,描述总体数量特征的指标称为参数。
抽样按抽取方法可分为重复抽样和不重复抽样。但是当总体单位 数很大,或样本量与总体单位数相比很小时,二者区别不大。
二、抽样调查的分类
包括随机抽样调查(概率抽样调查)和非机抽样调查(非 概率抽样调查)。
(一)随机抽样
这是从总体中按照随机原则抽取一定数目的单位作为样本进行 调查,并以一定概率保证对总体的特征值进行推断和估计。
面的数据; (二)在进行全面调查比较困难的时候,取得全面的数
据; (三)为了节约调查人力、费用和时间,采用抽样调查
代替全面调查。
抽样调查的几个基本概念
一、总体 总体是指所要研究对象的全体。它是根据一定研究目的而
规定的所要调查对象的全体所作成的集合,组成总体的各研究对 象称为总体单位。
二、样本 样本是总体的一部分,它是由从总体中按一定程序抽选出
第三章 抽样分布

y0
y0
F分布的密度函数曲线
f ( y)
(二)非重置抽样
非重置抽样是指被抽中单位不再放回总体中,下 一个样本单位只能从余下的总体单位中抽取。
同一总体单位不可能被重复抽中.
每次抽取是在不同数目的总体单位中进行的
n次抽取可看作是n次互不独立的随机试验。
本章重点
重点:掌握随机样本和样本值的区别、 统计量的含义
当n次观察结束后,就可以得到一组实数 x1,x2, ,xn ,它们依次是随机变量 X1,X 2, ,X n 的观测值,称 为样本值。
第二节 抽样分布
一、统计量 设X 1,X 2, ,X n是来自总体X的一个样本,g(X 1,X 2, ,X n )
是X 1,X 2, ,X n的函数,若函数g(X 1,X 2, ,X n )不含有任何 未知参数,则称g(X 1,X 2, ,X n )是一个统计量。
第三章 抽样分布
学生姓名 小张 小刘 小李 小王 小赵
月支出(元) 1120 1980 1500 1320 1870
小黄
小谭 小杜 小蔡 小唐 小高 小许
1390
1700 1380 1600 1740 1760 1850
80名
小卢
小吴 小郑
1780
1670 1720
求全班学生的平均月支出
测算每一名学生的月支出 ?
y0 y0
卡方分布密度函数的图形
f ( y)
第三章随机抽样和抽样散布

第三章随机抽样和抽样散布在前两章的讨论中,咱们明白了随机现象常常通过随机变量及其概率散布和数字特点来描述,但是,在实际问题中,要准确明白概率散布和数字特点,有时是很困难的。
例如,咱们要以药丸的崩解时刻或药片的溶解速度为指标来考察某一批药品的质量。
假设把这批药品全数进行一下实验,其散布函数及其有关的数字特点都可求出。
可是,由于测定这些指标的实验,一样是破坏性的,报废了全数药品即便求出了有关指标也无心义。
还有一些查验指标,如蜜丸的重量、体积等,对它们的查验虽不是破坏性的,但要成批逐个查验,不管从人力仍是物力上都会受到条件限制。
事实上,人们老是通过对部份产品的实验结果作分析,推断出全数产品的情形。
这确实是数理统计研究的一个要紧问题。
本章先讨论样本和统计量等大体概念,然后讨论常见的几种抽样散布,为进一步讨论统计推断方式打下必要的理论基础。
§3-1 随机抽样整体与样本整体与样本是数理统计中两个要紧概念。
整体是指研究对象的全部,组成整体的每一个单元称为个体。
整体能够包括有限个个体,也能够包括无穷多个个体。
某个整体是有限的,但在个体相当多的情形下,往往把它作为无穷整体来对待。
在数理统计中,咱们不笼统地研究所关切的对象,只考察它的某一种数值指标,例如,考察某批中成药丸的质量时,能够考察崩解时刻、溶解速度、丸重等项指标。
那个地址,若是咱们只需注意药丸的重量,固然,每一丸都有一个确信的重量如:6g,,,,…。
咱们就把所有这些丸重数值当做丸重的整体;每一个丸重值确实是一个个体。
如此,丸重X事实上是一个随机变量,它的取值的全部是一个整体,每一个可能取值确实是它的个体。
由于随机变量是用其概率散布F(x)(或密度函数f x)来刻画,因此假设X具有散布函数F(X),那么称这一整体为具有散布函数F(X)的整()体。
为了研究整体,需在整体中抽取假设干个个体,这就得出样本的概念。
概念1在一个整体X中抽取n个个体X1,X2,…,X n,这n个个体称为整体X的一个容量为n的样本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 N 1
N i 1
(Yi
Y
)2
N n S2 1 f S2
nN
n
12
引进N个随机变量:
证 法 二
1, ai 0,
若Yi入样, 若Yi不入样,
i
1,
2,
,
N
则 ai 都服从两点分布.
显然,
P(ai
1)
n N
;
P(ai
0)
N n ;
N
V(ai )
E(ai2 ) E(ai )2
n N
n N
中出现的次数为C
n1 N 1
。
y 1 n
y1 y2 L yn
1 n
C
n1 N 1
N
Yi
i 1
N
E
y
y
C
n N
C n1 N 1
Yi
i 1
nC
n N
1 N
N
Yi
i 1
Y
7
证 由于每个单元出现在总体所有可能样本
法 二
中的次数相同,因此 E y1 y2 L yn
一定是 Y1 Y2 L YN 的倍数,且这个倍
n
n1
P的区间估计:
P的置信度为1 的近似置信区间为:
pu
1 2
1 f pq , n1
修正为:
pu 1 2
1 f n1
pq
p (u
1 2
1 f pq 1 ),
n1
2n
p (u 1 2
1 f n1
pq
1 2n
)
*推导总体总量A=NP的估计量及其性质。
24
P的区间估计:
P的置信度为1 的近似置信区间修正为:
N i 1
(Yi
Y
)2
n1 N 1
i
j
(Yi
Y
)(Y j
Y
)
n1 N 1
N i 1
(Yi
Y
)2
n1 N 1
N i 1
(Yi
Y
)2
1 nN
1
n1 N 1
N i 1
(Yi
Y
)2
n1 N 1
N i 1
(Yi
Y
2 )
1 nN
N N
n 1
N i 1
(Yi
Y
)2
1 n
N N
n
数就是 n N ,
E y
1
n
E
n i 1
yi
1 n
n N
N
Yi
i 1
Y
n
N
Q E yi cYi
i 1
i 1
取Yi = Y0
则,nY0 cNY0
c n . N
8
证 法
引进N个随机变量:
三
1, ai 0,
若Yi入样, 若Yi不入样,
i
1,
2,
,
N
则 ai 都服从两点分布.
显然,
P(ai
nN
n
说明:总体方差
2
E(Yi Y )2
1 N
N
(Yi Y )2
i 1
但为了使大多数情形下公式表达更简练,定义总 体方差为:
S 2
1 N 1
N
(Yi
i 1
Y )2
N 2 N 1
10
证明性质2
证 法 一
V y E
y Y
2
1 n
2 1 n
2
E n i1 yi Y n2 E i1 ( yi Y )
n i 1
( yi
y )2
1 (
n1
n i 1
yi 2
ny 2 )
证明 :
s2
1 n1
n i 1
( yi
y )2
1 n1
n i 1
( yi
Y
)2
n( y
Y
)2
n
E ( yi i1
Y
)2
n N
N
(Yi
i 1
Y )2
n( N 1) S 2 N
E y Y 2 V y 1 f S2 N n S2
i j
(Yi Y )(Yj Y )中求和是对 N (N 1) 2项.
i j
11
V
y
1 n2
E
n i 1
( yi
Y
)2
1 n2
E
i j
(
yi
Y
)(
yj
Y
)
1 n2
n N
N
(Yi
i 1
Y )2
1 n2
n(n 1) N ( N 1)
(Yi
i j
Y )(Yj
Y)
1 nN
总体中具有所考虑特征的单元在总体中所占的比例
N
即总体比例:P
A
Yi
i 1
Y
NN
总体方差:S 2
1 N 1
N
(Yi
i 1
Y )2
N PQ N 1
其中,Q 1 P
22
2.样本 简单随机样本{y1……yn}
其中,yi
1,具有某种特征时 0,否则
样本比例
p
a n
1 n
n i 1
yi
y
n
(其中,a yi )
1 n2
E
n i 1
(
yi
Y
)2
1 n2
E
i
j
(
yi
Y
)(
yj
Y
)
n
E i1 ( yi
Y
)2
n N
N
(Yi
i 1
Y )2
n(n 1)
E i j
( yi
Y )( y j
Y )
N(N
1)
i j
(Yi
Y )(Yj
Y)
E
( yi Y )( y j Y )中求和是对 n(n 1) 2项,
2
n N
(1
n) N
n n1
E(aia j )
p(ai
1&aj
1)
N
(
N
ห้องสมุดไป่ตู้
) 1
Cov(i , j )
E(aia j ) E(ai )E(a j )
n N
(1
n N
)
n N
2
1 n (1 n ) N 1 N N
13
V(y)
1 n2
V
N i 1
iYi
1 n2
N i 1
i 1
样本方差
s2
1 n1
n
(yi
i 1
y)2
n pq n1
其中,q 1 p
二、估计量及其性质 性质1. 对于简单随机抽样,p为P的无偏估计,即E(p)=P.
性质2.
V( p) 1 f N PQ n N 1
23
性质3.
v( p) 1 f s2 1 f pq为V(p)的无偏估计
s2 / n
s( y)
y
t
1
(s y),y
2
t
1
(s y)
2
4
3.1 概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样
二、实施方法 三、地位、作用
是其他抽样方法基础 精度较高 但,样本比较分散(局限性)
5
3.2 总体均值与总量的简单估计
一、总体均值的估计 1.简单估计及其无偏性:
ˆ ~&N(0,1) V(ˆ )
则P(
ˆ V(ˆ )
u1 )=1 2
因此,d u V(ˆ) u S(ˆ)
1
1
2
2
Y的置信度为1 的近似置信区间为:
y
ut 11 22
1 f n
s,
y tu11 22
1 n
f
s
17
例1:在某地区10000户家庭中,按简单随机抽样抽取400户, 调查一个月的伙食费(单位:元)。经计算:
Y i
2
V
(ai
)
N i 1
N
YiYjCov(ai , a j )
ji
1 n2
n
N
(1
n N
)
N i 1
Yi2
N i 1
N
YiY j
ji
n (1 N
n N
)
1 N
1
1 n2
n (1 N
n N
)
1 N
1
(
N
1)
N i 1
Yi2
N i 1
N
YiYj
ji
1 (1 n
n N
Np
u1 2
N
pq , n1
Np
u
1
N
2
n1
pq
25
例3:从一份共有3042人的人名录中随机抽200人,发现38人 的地址已经变动。
(1)试估计这份人名录中需要修改的地址的人所占的比例及其 标准差,并以95%的置信度求P的置信区间 ;
(2)试估计这份人名录中需要修改的地址的人总数及其标准差, 并以95%的置信度求A的置信区间。
692 371 887 641 399 442 927 442 918 11
178 416 405 210 58 797 746 153 644 476 (1)计算样本均值与样本方差。 (2)若用 y 估计总体均值μ,按数理统计结果,