抽样调查的基本概念与理论依据
合集下载
社会调查之抽样

抽样单位就是一次直接的抽样所使用的基本单位. 抽样单位有时与构成总体的元素是相同的.
5.抽样框(Sampling Frame)
——抽样框也叫抽样范围是指一次抽样时总体中 所有抽样单位的名单.
6.参数值( Parameter )
也称总体指标值,它是关于总体中某一变量的综 合描述,或者说是总体中所有元素的某种特征 的综合数量表现. 在统计中最常见的参数值时总体某一变量的平均 数, 需要注意的是,参数值只有对总体中的每 一个元素都进行调查或测量才能得到.
2、方便抽样 (Accidental or Convenience Sampling)
——又称任意抽样、偶遇抽样,是指样本的选择完 全根据调查人员的方便来确定,研究者将其在一 定时间内,一定环境里所能遇见或接触到的人均选 入样本的方法 “街头拦截式访问”
特点:
1)假定母体的特性是相同的 2)实施简单,速度较快,比较节省费用 3)抽样误差较大,结果的代表性差,有很大的 偶然性
§2 概率抽样方法
——概率抽样是使总体内的所有个体具有相同的被 抽入样本的概率.这样的样本被称为随机样本.随 机抽样是由等概率地随机抽取的个体所组成.由 于是以概率为依据,所以能避免抽样过程中的人 为误差.保证样本的代表性. 概率抽样可以分为简单随机抽样,等距抽样,分层抽 样,整群抽样,以及多阶段抽样.
3、配额抽样 (Quota Sampling )
——又称定额抽样,是指对母体根据一定标准或某种特性分成 不同群体并事先分配各群体的样本数量,然后再由调查人员 按分配的样本数量在群体内主观地抽取样本 它与分层随机抽样相似,也是按调查对象的某种属性或特征将 总体中所有个体分成若干类或层,然后在各层中抽样,样本中 各层所占的比例与它们在总体中所占的比例一样.但是不同 的是分层抽样中各层子样本是随机抽取的,而定额抽样中各 层的子样本是非随机抽取的.
5.抽样框(Sampling Frame)
——抽样框也叫抽样范围是指一次抽样时总体中 所有抽样单位的名单.
6.参数值( Parameter )
也称总体指标值,它是关于总体中某一变量的综 合描述,或者说是总体中所有元素的某种特征 的综合数量表现. 在统计中最常见的参数值时总体某一变量的平均 数, 需要注意的是,参数值只有对总体中的每 一个元素都进行调查或测量才能得到.
2、方便抽样 (Accidental or Convenience Sampling)
——又称任意抽样、偶遇抽样,是指样本的选择完 全根据调查人员的方便来确定,研究者将其在一 定时间内,一定环境里所能遇见或接触到的人均选 入样本的方法 “街头拦截式访问”
特点:
1)假定母体的特性是相同的 2)实施简单,速度较快,比较节省费用 3)抽样误差较大,结果的代表性差,有很大的 偶然性
§2 概率抽样方法
——概率抽样是使总体内的所有个体具有相同的被 抽入样本的概率.这样的样本被称为随机样本.随 机抽样是由等概率地随机抽取的个体所组成.由 于是以概率为依据,所以能避免抽样过程中的人 为误差.保证样本的代表性. 概率抽样可以分为简单随机抽样,等距抽样,分层抽 样,整群抽样,以及多阶段抽样.
3、配额抽样 (Quota Sampling )
——又称定额抽样,是指对母体根据一定标准或某种特性分成 不同群体并事先分配各群体的样本数量,然后再由调查人员 按分配的样本数量在群体内主观地抽取样本 它与分层随机抽样相似,也是按调查对象的某种属性或特征将 总体中所有个体分成若干类或层,然后在各层中抽样,样本中 各层所占的比例与它们在总体中所占的比例一样.但是不同 的是分层抽样中各层子样本是随机抽取的,而定额抽样中各 层的子样本是非随机抽取的.
统计学原理-第六章 抽样调查(复旦大学第六版)

全体。其单位数用N来表示。
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28
2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。
2
x X f
2
f
2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x
N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28
2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。
2
x X f
2
f
2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x
N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F
《统计学原理》课件第七章抽样调查

4 -6
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序
研
究 原
总体分布 样本分布 抽样分布
理
一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序
研
究 原
总体分布 样本分布 抽样分布
理
一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析
抽样调查的基本概念与理论依据(一)

抽样调查的基本概念与理论依据(一)
抽样调查是一种常见的社会调研方法,其基本概念和理论依据是有必要进行了解的。
一、抽样调查的基本概念
抽样调查是指通过抽取代表性样本,对个体或群体的某些特定情况或认识进行调查。
这种调查方法与全面调查相比,具有省时、省力、精确度高等优点。
抽样调查的过程包括样本的抽取、样本的调查和结果的分析三个步骤。
二、抽样调查的理论依据
1.概率论基础:抽样调查的理论依据是概率论的基础。
从一个总体中随机选出样本,对这些样本进行统计分析,得到的结果可以反映整个总体的情况。
抽样调查中,概率论相关的知识可用于计算样本的大小和推断总体的参数,从而提高样本调查的准确性。
2.中心极限定理:中心极限定理是抽样调查的另一个理论依据。
它表明,当样本容量较大时,样本平均数的分布会趋近于正态分布。
这一定理对于估计总体参数和确定置信区间等都有重要的应用价值。
3.抽样误差:抽样误差也是抽样调查的理论基础之一。
它指的是样本调查结果与总体实际情况之间的偏差,通常来说,样本容量越大,抽样误差越小。
了解抽样误差的概念和大小,有助于对抽样结果的解释和推理。
4.信度和效度:信度和效度也是抽样调查中重要的理论概念。
信度指
的是对同样问题的几次调查结果之间的一致性,而效度指的是调查结
果是否能够有效地反映目标问题的本质。
保证调查工具的信度和效度,对于可靠的抽样调查结果至关重要。
总之,抽样调查的基本概念和理论依据涵盖了概率论、中心极限定理
和抽样误差等内容。
这些理论基础的应用使得抽样调查在定量研究中
发挥着不可替代的作用。
第七章 抽样调查

数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x
2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍
则:
1 x 0.8165 1.5n 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:
第四章 抽样调查

抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
第四节抽样调查

一、抽样的基本术语 总体(population)总体通常与构成它的元素(element)
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
第6章 抽样调查(1)

33
1、由于总体单位总数未 知,因此采用重复抽样 公式。又总体标 准差未知,采用过去资 料最大标准差作为估计 值。
x
n
0.12 0.0219 (升) 30
n1 30 2 2、合格率p 93.3% n 30 S P p(1 p) 93.3% (1 93.3%) 6.25%
根据质量标 准,使用寿 命800小时及 以上者为合 格品,计算 产品平均合 格率和标准 差。
14
全及指标
X XF X N F
P N1 N
X
2
( X X )2
N
( X X )2 F F
X
(X X )
N
2
(X X ) F F
2
P 2 P(1 P)
31
例 上题中,如果寿命低于9000小时的产品是不合格品,计 算不合格率(合格率)的抽样平均误差。
不合格率:
n1 90 x p 18% n 500
Sp
p(1 p)
Sp
0.18 (1 0.18) 38.4%
重复抽样下:
p
p
Sp n
0.384 1.7% n 500
3
特 点
遵循随机原则抽取部分单位 ;
用样本推断总体;
会产生抽样误差,但误差可以计算和控制。
4
随机原则的实现
统 计 学 概 论
是将总体中每个单位的编号写在外形完全 一致的签上,将其搅拌均匀,从中任意抽 抽签法 选,签上的号码所对应的单位就是样本单 位。 将总体中每个单位编上号码,然后使 用随机数表,查出所要抽取的调查单 随机数表法 位。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢ 抽样调查和全面调查同时进行,可以发挥相互补充 和检查质量的作用。
➢ 抽样调查可以用于工业生产过程的质量控制。 ➢ 利用抽样调查原理,还可以对某种总体的假设进行
检验,来判断这种假设的真伪,以决定行动的取舍 。
§2、抽样调查的基本概念及理论依据
一、总体与样本
(一)、总体与总体指标
总体:是根据研究目的确定的所要研究的同类事物的 全体。总体单位数称为总体容量,一般用N 表示。
抽样调查的基本概念与 理论依据
2020年4月22日星期三
第六章 抽样调查
§1抽样调查的意义 §2抽样调查的基本概念和理论依据 §3抽样平均误差 §4抽样推断 §5必要抽样单位数的确定
§1、抽样调查的意义
一、抽样调查的概念、特点
(一)、概念: 抽样调查是按照随机原则从全部研究对象中抽取一
部分单位进行观察,并依据所获得的数据对全部研究对 象的数量特征做出具有一定可靠性的估计判断,从而 达到对全部研究对象的认识的一种统计方法。
二、概率抽样与非概率抽样
随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定 ➢的概概率率被抽抽样选:为也样叫本随单机位抽,样每,个是总指按体照单随位机能原否则选抽入取样样本本是。随概机率的。
抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽 样和整群抽样。 ➢ 非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调 查者的经验或判断,从总体中有意识地抽取若干单位构成样本 。重点调查、典型调查、配额调查等属于非随机抽样。(但由 于非随机抽样的效果取决于调查者的经验、主观判断和专业知 识,故难免掺杂调查者的主观偏见,出现因人而异的结果,且 容易产生倾向性误差;此外,非随机抽样不能计算和控制其抽 样误差,无法说明调查结果的可靠程度。)
3、时间表抽样框:即将总体全部单位按时间 顺序排列,把总体的时间过程分为若干个小 的时间单位,以此时间单位为抽样单位。
四、抽样误差:
登记性误差
登记性误差是指在调查和汇总过程中由 于观察、测量、登记、计算等方法的差 错或被调查者提供虚假资料而造成的误 差。任何一种统计调查都可能产生登记 性误差。
系统性误差是指由于非随机因素引起的样 本代表性不足而产生的误差,表现为样本 估计量的值系统偏低或偏高。。
1、考虑顺序的抽样:即从总体N 中抽取n个单位
构成样本,不但要考虑样本各单位的不同性质,而 且还考虑不同性质各单位的中选顺序。相同构成成 分的单位,由于顺序不同,也作为不同样本。
2、不考虑顺序的抽样:即从总体N个单位抽取n
个单位构成样本。只考虑样本各单位的组成成分如 何,而不考虑单位的抽样顺序。如果样本的成分相 同,不论顺序有多大不同,都作为一种样本。
三、抽样框:是包括全部抽样单位的名单框架。
编制抽样框是实施抽样的基础。抽样框的好坏通常会 直接影响到抽样的随机性和调查的效果。
➢抽样框的主要形式有三种: 1、名单抽样框:即列出全部总体单位的名录
一览表,如职工名单、企业名单等。
2、区域抽样框:即按地理位置将总体范围划 分为若干小区域,以小区域为抽样单位。
➢ 考虑顺序的重复组合:
AA BA CA
DA
AB BB CB
DB
AC BC CC
DC
AD BD CD
DD
➢ 不考虑顺序的不重复抽样数目 AB BC CD AC BD AD
六、抽样调查的理论基础
➢大数法则:关于大量的随机现象具有稳 定性质的法则。
➢中心极限定理:如果总体变量存在有限 的平均数和方差,那么不论这个总体变 量的分布如何,随着抽样单位数n的增 加,抽样平均数的分布便趋近于正态分 布。
以上抽样方法的两种分类还存在交叉情况,即有:
➢考虑顺序的不重复抽样数目 ➢考虑顺序的重复抽样数目 ➢不考虑顺序的不重复抽样数目 ➢不考虑顺序的重复抽样数目
例如:从4个(N)职工中抽取其中的2个(n)
进行调查。 ➢考虑顺序的重复抽样数目
➢不考虑顺序的不重复抽样数目
A=40、B=50、C=70、D=80
重复抽样与不重复抽样的区别:
➢ 重复抽样: 同一总体单位有可
能被重复抽中;
每个总体单位在每 次抽样中被抽中的 概率都是相同的。
抽样误差较大。
ቤተ መጻሕፍቲ ባይዱ
➢ 不重复抽样: 同一总体单位不可能被
重复抽中;
由于每次抽取是在不同 数目的总体单位中进行 ,每个总体单位在各次 抽样中被抽中的概率不 相等。
抽样误差较小。
➢根据对样本的要求不同,抽样方法又 有考虑顺序抽样和不考虑顺序抽样两种 :
样本的可能数目既和样本的容量有关,也和抽 样的方法有关。 ➢ 根据取样方式的不同,抽样方法有重复抽样和不重 复抽样两种。 1、重复抽样:是指从总体的N个单位中抽取一个容量 为n的样本,每次抽出一个单位后,再将其放回总体 中参加下一次抽取,这样连续抽n次即得到一个样本 。
2、不重复抽样:是指抽中单位不再放回总体中,下一 个样本单位只能从余下的总体单位中抽取。
误差
系统性误差
代表性误差
随机性误差
代表性误差是指用样本指标推断 总体指标时,由于样本结构与总 体结构不一致、样本不能完全代 表总体而产生的误差。
随机性误差又称 偶然性误差,是 指遵循随机原则 抽样,由于随机 因素(偶然性因 素)引起的误差 。抽样估计中的 所谓抽样误差, 就是指的这种随 机误差。
五、抽样方法和样本可能数目
(二)、抽样调查的基本特点:
➢根据部分实际资料对全部总体的数 量特征做出估计。
➢按随机的原则从全部总体中抽取样 本单位。
➢抽样推断的抽样误差可以事先计算 并且加以控制。
二、抽样调查的作用:
➢ 对某些不可能进行全面调查而又要了解其全面情况 的社会经济现象,必须应用抽样调查。
➢ 对某些社会经济现象虽然可以进行全面调查,但抽 样调查可以节约时间、费用,提高调查的时效性。
(一)、大数法则的意义可以归纳为:
➢ 现象的某种总体规律只有当具有这些现象足够多数的单位汇 总综合在一起的时候,才能显示出来。因此只有从大量现象 的总体中,才能研究这些现象的规律性。
总体指标:用来反映总体数量特征的指标。
(二)、样本与样本指标
样本:从总体中抽取的部分总体单位所构成的整体。 样本所包含的总体单位个数称为样本容量,一般用 n表示。在实际工作中,人们通常把n≥30的样本称 为大样本,而把 n﹤30的样本称为小样本。
样本指标:是根据样本资料计算的、用于估计和推断 相应总体指标的综合指标。
➢ 抽样调查可以用于工业生产过程的质量控制。 ➢ 利用抽样调查原理,还可以对某种总体的假设进行
检验,来判断这种假设的真伪,以决定行动的取舍 。
§2、抽样调查的基本概念及理论依据
一、总体与样本
(一)、总体与总体指标
总体:是根据研究目的确定的所要研究的同类事物的 全体。总体单位数称为总体容量,一般用N 表示。
抽样调查的基本概念与 理论依据
2020年4月22日星期三
第六章 抽样调查
§1抽样调查的意义 §2抽样调查的基本概念和理论依据 §3抽样平均误差 §4抽样推断 §5必要抽样单位数的确定
§1、抽样调查的意义
一、抽样调查的概念、特点
(一)、概念: 抽样调查是按照随机原则从全部研究对象中抽取一
部分单位进行观察,并依据所获得的数据对全部研究对 象的数量特征做出具有一定可靠性的估计判断,从而 达到对全部研究对象的认识的一种统计方法。
二、概率抽样与非概率抽样
随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定 ➢的概概率率被抽抽样选:为也样叫本随单机位抽,样每,个是总指按体照单随位机能原否则选抽入取样样本本是。随概机率的。
抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽 样和整群抽样。 ➢ 非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调 查者的经验或判断,从总体中有意识地抽取若干单位构成样本 。重点调查、典型调查、配额调查等属于非随机抽样。(但由 于非随机抽样的效果取决于调查者的经验、主观判断和专业知 识,故难免掺杂调查者的主观偏见,出现因人而异的结果,且 容易产生倾向性误差;此外,非随机抽样不能计算和控制其抽 样误差,无法说明调查结果的可靠程度。)
3、时间表抽样框:即将总体全部单位按时间 顺序排列,把总体的时间过程分为若干个小 的时间单位,以此时间单位为抽样单位。
四、抽样误差:
登记性误差
登记性误差是指在调查和汇总过程中由 于观察、测量、登记、计算等方法的差 错或被调查者提供虚假资料而造成的误 差。任何一种统计调查都可能产生登记 性误差。
系统性误差是指由于非随机因素引起的样 本代表性不足而产生的误差,表现为样本 估计量的值系统偏低或偏高。。
1、考虑顺序的抽样:即从总体N 中抽取n个单位
构成样本,不但要考虑样本各单位的不同性质,而 且还考虑不同性质各单位的中选顺序。相同构成成 分的单位,由于顺序不同,也作为不同样本。
2、不考虑顺序的抽样:即从总体N个单位抽取n
个单位构成样本。只考虑样本各单位的组成成分如 何,而不考虑单位的抽样顺序。如果样本的成分相 同,不论顺序有多大不同,都作为一种样本。
三、抽样框:是包括全部抽样单位的名单框架。
编制抽样框是实施抽样的基础。抽样框的好坏通常会 直接影响到抽样的随机性和调查的效果。
➢抽样框的主要形式有三种: 1、名单抽样框:即列出全部总体单位的名录
一览表,如职工名单、企业名单等。
2、区域抽样框:即按地理位置将总体范围划 分为若干小区域,以小区域为抽样单位。
➢ 考虑顺序的重复组合:
AA BA CA
DA
AB BB CB
DB
AC BC CC
DC
AD BD CD
DD
➢ 不考虑顺序的不重复抽样数目 AB BC CD AC BD AD
六、抽样调查的理论基础
➢大数法则:关于大量的随机现象具有稳 定性质的法则。
➢中心极限定理:如果总体变量存在有限 的平均数和方差,那么不论这个总体变 量的分布如何,随着抽样单位数n的增 加,抽样平均数的分布便趋近于正态分 布。
以上抽样方法的两种分类还存在交叉情况,即有:
➢考虑顺序的不重复抽样数目 ➢考虑顺序的重复抽样数目 ➢不考虑顺序的不重复抽样数目 ➢不考虑顺序的重复抽样数目
例如:从4个(N)职工中抽取其中的2个(n)
进行调查。 ➢考虑顺序的重复抽样数目
➢不考虑顺序的不重复抽样数目
A=40、B=50、C=70、D=80
重复抽样与不重复抽样的区别:
➢ 重复抽样: 同一总体单位有可
能被重复抽中;
每个总体单位在每 次抽样中被抽中的 概率都是相同的。
抽样误差较大。
ቤተ መጻሕፍቲ ባይዱ
➢ 不重复抽样: 同一总体单位不可能被
重复抽中;
由于每次抽取是在不同 数目的总体单位中进行 ,每个总体单位在各次 抽样中被抽中的概率不 相等。
抽样误差较小。
➢根据对样本的要求不同,抽样方法又 有考虑顺序抽样和不考虑顺序抽样两种 :
样本的可能数目既和样本的容量有关,也和抽 样的方法有关。 ➢ 根据取样方式的不同,抽样方法有重复抽样和不重 复抽样两种。 1、重复抽样:是指从总体的N个单位中抽取一个容量 为n的样本,每次抽出一个单位后,再将其放回总体 中参加下一次抽取,这样连续抽n次即得到一个样本 。
2、不重复抽样:是指抽中单位不再放回总体中,下一 个样本单位只能从余下的总体单位中抽取。
误差
系统性误差
代表性误差
随机性误差
代表性误差是指用样本指标推断 总体指标时,由于样本结构与总 体结构不一致、样本不能完全代 表总体而产生的误差。
随机性误差又称 偶然性误差,是 指遵循随机原则 抽样,由于随机 因素(偶然性因 素)引起的误差 。抽样估计中的 所谓抽样误差, 就是指的这种随 机误差。
五、抽样方法和样本可能数目
(二)、抽样调查的基本特点:
➢根据部分实际资料对全部总体的数 量特征做出估计。
➢按随机的原则从全部总体中抽取样 本单位。
➢抽样推断的抽样误差可以事先计算 并且加以控制。
二、抽样调查的作用:
➢ 对某些不可能进行全面调查而又要了解其全面情况 的社会经济现象,必须应用抽样调查。
➢ 对某些社会经济现象虽然可以进行全面调查,但抽 样调查可以节约时间、费用,提高调查的时效性。
(一)、大数法则的意义可以归纳为:
➢ 现象的某种总体规律只有当具有这些现象足够多数的单位汇 总综合在一起的时候,才能显示出来。因此只有从大量现象 的总体中,才能研究这些现象的规律性。
总体指标:用来反映总体数量特征的指标。
(二)、样本与样本指标
样本:从总体中抽取的部分总体单位所构成的整体。 样本所包含的总体单位个数称为样本容量,一般用 n表示。在实际工作中,人们通常把n≥30的样本称 为大样本,而把 n﹤30的样本称为小样本。
样本指标:是根据样本资料计算的、用于估计和推断 相应总体指标的综合指标。