第七章抽样调查
第七章 抽样调查技术

13
一、简单随机抽样
(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;
第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
5
2015/12/22
(二)样本总体
概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。
2015/12/22
23
三、分层抽样
(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24
假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因
原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。
统计学课件-第七章抽样调查

分层抽样特点
03
04
05
适用于总体内部差异较 大的情况,能够提高样 本的代表性。
可以根据各层的具体情 分层抽样能够降低抽样 况采用不同的抽样方法, 误差,提高估计的精度。 灵活性强。
分层标准选择与确定
选择分层标准的原则
各层之间具有明显的 区分度,避免出现重 复或遗漏。
与调查目的密切相关, 能够反映总体内部差 异的标志。
3
灵活性高,可以在不同阶段采用不同的抽样方法 和技术。
多阶段抽样优缺点分析
• 节约成本,减少调查人员和资源的需求。
多阶段抽样优缺点分析
抽样误差可能增加
01
由于多阶段抽样的复杂性,可能导致抽样误差的增加。
对抽样设计的要求较高
02
需要仔细设计和规划每个阶段的抽样方法和样本量分配,以确
保抽样的有效性和代表性。
抽样调查作用
抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料, 因而,也可起到全面调查的作用。
抽样方法与类型
抽样方法
简单随机抽样、系统抽样、分层抽样和整群抽样。
抽样类型
概率抽样和非概率抽样。
抽样误差与置信水平
抽样误差
是指由于随机抽样的偶然因素使样本各单位的结构不足以代 表总体各单位的结构,而引起抽样指标和全局指标的绝对离 差。
成本考虑
当总体差异较大时,简单随机抽样的 精度可能受到影响。
对于大规模调查,简单随机抽样可能 需要较高的成本。
实施难度
在某些情况下,获取完整的抽样框可 能较为困难。
03 分层抽样技术及应用
分层抽样原理及特点
01
02
分层抽样原理:将总体 按照某种特征或标志分 成若干层,然后从每一 层中随机抽取一定数量 的样本,最后将这些样 本合并起来构成总体的 样本。
统计学原理第七章 抽样调查

合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
《统计学原理》课件第七章抽样调查

第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序
研
究 原
总体分布 样本分布 抽样分布
理
一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析
第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
第七章抽样

第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。
抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
第七章 抽样调查

数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x
2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍
则:
1 x 0.8165 1.5n 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:
第7章抽样

随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
90 80 70 60 50 40 30 20 10
0 第一季度
第二季度
第三季度
第四季度
东部 西部 北部
2021/3/15
第七章抽样调查
1
第一节 抽样调查的概念及其分类
一、几个概念 1、抽样调查
从研究的总体中按随机原则抽取部分单位为样 本,进行观察研究,并根据样本的调查结果推 断总体,以达到认识总体的统计调查方法。
2021/3/15
第七章抽样调查
6
举例:
在预测美国的总统选举中: 总体:全体合法选民 样本:部分选民 推断:根据部分对整体做出归纳 指标:1、全体合法选民的平均年龄
2、当前登记投票的全体合法选民的 百分比 以上总体指标是不能精确测定的,仅能根据 统计量和样本指标来估计
2021/3/15
第七章抽样调查
2021/3/15
第七章抽样调查
8
美国1948年的选举
候选人 Crossley Gallup Roper
结果
Tromam
45
44
38
50
Dewey
50
50
53
45
Thurmond 2
2
5
3
Wallace
3
4
4
2
(由于访问员自由挑选时无意的共和党偏性造成预测差错)
2021/3/15
第七章抽样调查
9
Gallup在St.Louis定额抽样13对象
选举结果
55.4 57.8 50.1 61.3 43.5 61.8 51.1 51.6 59.2 53.9
误差 测验预测值
+4.4 -1.7 +0.9 -2.7 +0.5 -0.2
+1.6 -3.7 +0.2 -0.2
2021/3/15
第七章抽样调查
11
二、抽样的理论依据
大数定律
– 契比雪夫定理:当样本容量n足够大时,独立同 分布的一系列随机变量的算术平均数接近(依概 率p收敛于)数学期望值,即随机变量平均数具 有稳定性,该定律提供了用样本平均数估计总
第七章抽样调查
3
3、样本 n(抽样总体)(大(小)样本)
(样本单位数达到或超过30个称为大样本, 而在30个以下称为小样本 )
不唯一性;
抽样总体的确定原则:
1)相关性是指抽样总体与抽样目标相关。
2)完整性是指抽样总体的内容能全面反 映项目的实际情况。
3)经济性是指抽样总体的确定应符合成 本效益原则
7
美国1936年选举
Roosevelt的百分比
Gallup预言《摘要》的预测结果
44
《摘要》预测的选举结果(240万人)
43
Gallup预测的选举结果 (59万人)
56
选举结果
62
(注:上述百分比仅用主要政党所得选票计算,选举中约有2%的选票投向小 党的候选人)
(由于选择偏倚和不回答偏倚造成《摘要》的预测差错)
(以很小的样本来推断很大的总体) 2、总体 N(全及总体: Total population/Parent population )(有限总体、无限总体)
2021/3/15
第七章抽样调查
2
全及总体又称“母体”,简称“总体”,是指所要认 识对象的全体,总体是由具有某种共同性质的 许多单位组成的,因此,总体也就是具有同一 性质的许多单位的集合体。。
和方差D(xi)=σ2,则当样本容量n趋于无穷大时,
随机变量均值x_ 趋于期望值为X、标准差为
2
的正态分布,即当n→∞时, x_~N(X, 2 )
年份
样本容量
1952
5385
1956
8144
19608ຫໍສະໝຸດ 1519646625
1968
4414
1972
3689
1976
3439
1980
3500
1984
3456
1988
4089
(注:误差=预测-实际)
获胜候选人
艾森豪威尔 艾森豪威尔 肯尼迪 约翰逊 尼克松 尼克松
卡特 里根 里根 布什
Gallup民意
51 59.5 51 64 43 62 49.5 55.3 59.0 56.0
它的概率附近摆动。 如:投硬币
即:
nl imP
mp n
1
2021/3/15
第七章抽样调查
13
大数定理在抽样中的作用:
A、理论基础
B、通过偶然现象揭示必然性和规律性的 工具
2021/3/15
第七章抽样调查
14
中心极限定理
– (独立同分布)如果随机变量x1,x2,….xn,
独立且服从同一分布,且存在数学期望E(xi)=X
体平均数的理论依据。
–
即:
n l i m p 1 ni n1xi 1 ni n1E(xi)
1
2021/3/15
第七章抽样调查
12
贝努里定理:当试验次数n足够大时,事 件A发生的频率接近(依概率收敛于)事件A 发生的概率,即频率具有一定的稳定性, 该定理也说明,在试验不变的条件下, 重复进行很多次时,随机事件的频率在
规定:6人住近郊,7人住在市中心 男的7人:3人40岁以下,4人40岁以上
1名黑人,6名白人 6名白人支付的月租又做了以下的规定:
1人的支付金额不少于44.01美元 3人的支付金额在18.01-44.00美元 2人的支付金额不超过18美元 女的6人
2021/3/15
第七章抽样调查
10
Gallup民意测验在1948年后的总统选举中的记录 (采用概率抽样调查)
2021/3/15
第七章抽样调查
4
4、总体指标
根据总体各个单位的标志值或标志特 征计算的、反映总体某种属性的综合指 标,称为“总体指标”。全及指标也称为 “母体参数”或“总体参数”。
唯一性:由于全及总体是唯一确定的, 所以总体指标也是唯一确定的。
常用的总体指标有:总体平均数、总体 成数、总体方差和标准方差。
通常全及总体的单位数用大写的英文字母N来 表示。作为全及总体,单位数N即使有限,但 总是很大,大到几千,几万,几十万,几百万。 对无限总体的认识只能采用抽样的方法,而对 于有限总体的认识,理论上虽可以应用全面调 查来搜集资料,但实际上往往由于不可能或不 经济而借助抽样的方法以求得对有限总体的认 识
2021/3/15
2021/3/15
第七章抽样调查
5
5、样本指标
样本指标又称“抽样指标”、“样本统计量”,由 样本总体各单位标志值计算出来反映样本特征, 用来估计总体指标的综合指标。统计量是样本 变量的函数,用来估计总体参数,因此与总体 参数相对应,统计量有样本平均数(或抽样成 数)、样本标准差(或样本方差 )。
对于一个问题总体是唯一确定的,所以总体指 标也是唯一确定的,总体指标也称为参数,它 是待估计的数。而统计量则是随机变量,它的 取值随样本的不同而发生变化。