第6章_抽样设计

合集下载

第6章抽样设计

第6章抽样设计

第四节 抽样误差与样本量
• 一、调查误差的概念与种类 • 调查误差是指调查的结果和客观实际情况的出入和差数。
一般有两种误差存在, 即非抽样误差和抽样误差。 • 非抽样误差是基于抽样之外的许多其它原因而产生的误差。
• 抽样误差是指一个样本的测定值与对该变量真值之间的差 异,抽样误差无特定偏向,其误差大小主要受以下三个因 素影响:
• 单位顺序的排列方式有两种: 一种是排列顺 序与调查项目无关。另一种是按与调查项 目有关标志排队。
• 三、分层抽样
• 分层抽样又叫类型抽样, 它是先将总体 所有单位按某一重要标志进行分类(层), 然后再各类(层)中采用简单随机抽样或 等距抽样方式抽取样本单位的一种抽样方 式。
• 分层抽样比简单随机抽样和机械抽样更 为精确, 能够通过对较少的抽样单位的调查, 得到比较准确的推断结果, 特别是当总体较 大、内部结果复杂时, 分层抽样常能取得令 人满意的效果。同时, 分层抽样在对总体推 断的同时, 还能获得对每层的推断。
• (二)特点
• 与全面调查相比,抽样调查具有以下三个 显著特点:
• 1、经济
• 与全面调查相比,抽样调查的样本量大大 减少,从而可以显著地节约人力、物力和 财力。
• 2、高效
• 由于抽样调查只对总体中少量单位进行调 查,故能十分迅速地得到调查讨论。
• 3.准确
• 抽样调查是调查部分总体单位,数目较少,
• 第一,被研究总体各单位标志值的变异程度。 • 第二,抽样的样本量。 • 第三,抽样调查的组织方式。
• 二、样本量 • 在开始组织抽样调查之前,确定抽多少样本单位是个很重
要的问题。 • (一)影响样本量的因素 • 抽样调查的样本量取决于以下几个因素: • 1、被调查对象标志的差异程度 • 2、允许误差数值的大小 • 3、调查结果的可靠程度 • 4、抽样的方法 • 5.抽样的组织形式

市场调查-第六章抽样技术

市场调查-第六章抽样技术

N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。

社会研究方法 第6章

社会研究方法 第6章

整群抽样
不同子群
子群抽取
整群抽样
优点:简便易行,节省费用 扩大抽样应用范围
缺点: 样本分布不广, 代表性相对较差
适用对象: 总体的不同子群之间差别不大, 而每个子群内部差异较大
五、多段抽样
按抽样元素的隶属、层级关系把抽样过程分为 几个阶段进行:先从总体中随机抽取几个大群, 然后再从这几个大群内随机抽取几个小群,这 样一级级抽下去直到抽到最基本的元素为止。
第六章 抽样
第一节 抽样的意义与作用 第二节 概率抽样的原理与程序 第三节 概率抽样方法 第四节 户内抽样与PPS抽样 第五节 非概率抽样方法 第六节 样本规模与抽样误差
第一节 抽样意义与作用
一、抽样的概念
(1)总体(population):构成它的所有元素的 集合,用“ N ”表示。
(2)元素(element):构成总体的最基本单位。
出总体内在结构的变量作为分层变量。 c:以那些已有明显层次区分的变量作为分层变量 (2)分层的比例 a:按比例分层抽样 b:不按比例分层抽样
按比例分层抽样
分层
学生
1200
女生1000 (5/6)
男生200 (1/6)
抽 样(120人)
100人 5/6
样 本 20人 1/6 120
按各种类型或层次中单位数目同总体单位数目间 的比例来抽取子样本的方法。可以确保得到一个 与总体结构完全一样的样本。
样本规模的计算
简单随机抽样中样本规模的计算 置信水平对应的临界值

推论总体均值

n
t2
e2
பைடு நூலகம்
2
总体的标准差 允许的抽样误差
推论总体成数:
t 2 p(1 p)

统计学第六章 抽样法

统计学第六章  抽样法
31
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80

x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数

概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计

总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。

6第六章抽样方法

6第六章抽样方法
• 该方法的准确性一般比随机抽样高。
选择聚集抽样的步骤:
(1)在研究区随机抽取一定数量的样方。 (2)在抽取的样方中选择含有研究个体的样
方。 (3)在每个选择样方周围进行继续选样,形
成多个网状样方组。 (4)继续选样直到选择的样方中不含有研究
个体数为止。 (5)进行种群密度及置信区间的估计。
参数估计
• 方差估计
S2
(wi x)2 (有放回抽样,n n(n1) 为抽取的样方数)
S2
(Nn)
(wi x)2
N(nn1)
(无放回抽 样,N为总样方 数)
讨论题
• 哪些情形的种群调查不宜采用选择性聚 集抽样方法?
–当大部分样方中均有一到多个研究个体 时不宜采用。
第四节 顺序抽样(自学3min) Systematic sampling
8.146 176,32,122,41
1
9.146
21
1.41421 10.56
0,0
2.23507 12.796 9,112,255,3,65
2
14.796 122,102,0,7
1.41421 16.210
18,1
1.41421 17.625
14,9
思考题
• 请说说哪些情形的生态学调查不需采用 分层抽样方法?
• 常用的顺序抽样方法有: –五点取样:适宜随机分布种群 –对角线取样:适宜随机分布种群 –棋盘式取样:随机和核心分布 –平行跳跃式取样:核心分布 –z字形取样:负二项分布
• 在统计上没有严格意义上的方差估计方法
五点取样
单对角线取样
双对角线取样
棋盘式取样
Z字形取样
平行跳跃式取样
第五节 多重抽样

第6章市场研究抽样设计

第6章市场研究抽样设计
➢样本:从总体中按一定程序抽得的那部分个体或抽样单元组 成的集合。
➢样本容量:样本中包含的单位数目。
➢抽样和抽样框:抽样是指从总体中按一定的方式选取样本的 过程。抽样框(sampling frame)是用来抽取样本的工具。是总 体的数据名录或单位的名单。
➢参数值(总体值)与统计值(样本值)
➢抽样误差与非抽样误差
3.决定抽样方案 随机抽样与非随机抽样
4.确定样本容量
5.实际抽取样本 6.评估样本质量
对样本的质量、代表性、偏差等进行初 步的检验和衡量,以防止由于样本的偏 差过大而导致失误。
编制抽样框
• 在编制抽样框架时常见的问题如下:
– 遗漏-遗漏部分样本单位; – 聚堆-缺乏个体样本单位信息; – 重复-同一样本单位重复出现; – 混杂-抽样框架中包括部分非样本总体成员。
定义: ✓ 将总体单位按某种特征 分成两个或两个以上相
A
B
互独立的组,从每一组
中再简单随机抽样,样
本相互独立,
✓ 使得:组间特征差异大, 组内特征差异小,增加
样本对总体的代表性。
适用情况:
C
✓总体分布不均匀,各总体单
D
位之间标志变异程度比较大。来自1)比例分层抽样即按各层中的单位数占总体的比例分配各层样本量。
主要内容
• 一、抽样设计的基本概念 • 二、抽样设计的步骤 • 三、抽样方法 • 四、样本大小的确定 • 五、有关抽样设计的几个问题
二、抽样设计的步骤
1.界定总体 地理特征、人口统计特征、产品使用情 况、认知程度等。
2.制定抽样框
依据已经明确界定的总体范围,收集总体中 全部抽样单位的名单,并通过对名单进行统 一编号来建立供抽样使用的抽样框。

6第六章抽样设计

6第六章抽样设计

分层
高收入层 高 高 高 高 高 高 高 中收入层 中 中 中 中 中 中 低收入层 低 低 低 低 低 低 低 低






分群
第一群 高 高 高 中 中 中 低 低 低
第二群 高 高 高 中 中 中 低 低 低
第三群 高 高 高 中 中 中 低 低 低


某市要进行啤酒需求量的调查,该市共有 30个街道,300个居民委,每个居民委有 200户居民,试采用分群抽样调查。
1、全及总体:简称总体或母体,是指所要 调查对象的总体。 2、抽样总体:简称样本量或样本,是总体 的一部分,是指从总体中抽选出所要直接 观察的全部单位。每一个被抽到的个体或 单位,就是一个样本。
三、指标和标志
1、标志:用来说明个体特征名称,如个人 年龄、性别、职业等。标志可以是数量标 志也可以是质量标志。 一种标志是用数量来加以反映的,叫数量 标志,有标志值。如,年龄、收入等;另 一种是不可以用数值来加以反映的,叫品 质标志,如职业、性别等。他们虽然可以 用1,0来表示,但它只是一种代号,不代 表数值。
六、抽样单元
为了便于实现抽样,常常将总体按某些特 征划分成互不重叠的部分,每一个部分都 叫做一个抽样单元。例如,对“北京市中 高档商品房的市场需求调查,”就可以先 按区域将北京划分为,东城区、西城区、 崇文区、丰台区、海淀区、宣武区、潮阳 区等。这是一级抽样单位,在案街道划分 成二级抽样单位。
P+Q=1
3、总体(方差)标准差:是指说明总体数 量特征离散程度的指标。用σ表示 公式(1)简单式(2)加权式
五、重复抽样和不重复抽样
1、重复抽样:是指任何一个样本单位被抽 出进行登记以后,再放回去参加下一次的 抽取,总数始终不变。 2、不重复抽样:是指各样本单位被抽出登 记信息,不再放回去参加第二次抽取。被 抽中的样本不会在有第二次被抽中的可能 性,抽样总体单位数减少。

抽样调查-第6章-整群抽样

抽样调查-第6章-整群抽样

群规模相等时的整群抽样
总体方差分析表
来源 群间
自由度
平方和
均方
群内
总计
我们将整群抽样与简单随机抽样的效率进行 比较,假设直接从总体中抽取一个样本容量为nM 的简单随机样本,则样本均值的方差为:
但如果该整体被等分为N个规模为M的群,定义 为群内相关系数,描述同一群内成对个体单元之间 的相关程度,其表达式为:
总体总值 Y 的比率估计为:
根据比率估计量的方差公式,估计量 的方差分别为:
与前一种方法相比,在大样本量情况下,比率 估计的精度更高些。
的样本估计为: 的样本估计为:
4、例题和方法比较
【例4.3】某县有33个乡,共726个村,某一
年度某作物总种植面积为30 525亩。现采用等 概抽样随机抽取十个乡进行该种作物的产量调 查(调查数据如下表)。要求利用无偏估计量 和比率估计量分别估计全县总产量,并计算估 计量的标准差。
总体中的个体均值: 总体方差: 样本方差:
总体群间方差: 样本群间方差:
总体中第i个群群内方差: 样本第i个群群内方差:
群规模相等时整群抽样总体群内方差: 群规模相等时整群抽样样本群内方差:
Байду номын сангаас
§4.2 等概率整群抽样
在N个初级抽样单元中,第i个初级单元含 个二级抽样单元。对于整群抽样而言,被抽中的 群中所有二级单元全部入样。
抽样调查-第6章-整群抽 样
2021/7/13
二、群的划分
整群抽样中的群大致可分为两类:
一类是根据行政或地域形成的群体,如学校企业 和街道,对此采用整群调查是为了方便调查,节 约费用。 另一类群则是调查人员人为确定的,如将一大块 面积划分若干块较小面积的群,这时就需要考虑 如何划分群,以使在相同调查费用下调查误差最 小。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章 抽样设计
本章的几个基本问题
是否进行抽样? 采用什么样的方法抽样? 选择什么类型的样本? 样本大小如何确定? 如何控制和调整样本误差?

2019/3/1
2
一、抽样设计概述
6.1抽样的基本概念
6.1.1抽样的基本概念 市场调研工作的目标是获取研究总体的各 类信息及其特征。一般来说,有两种方法 可以采用:一是普查,二是抽样。普查是 穷举调查总体的各类信息及其特征。抽样 是按照随机原则从调查总体中抽取一部分 单位作为样本而进行的一种非全面调查。
配额抽样是分别从总体的各控制特性的层次中抽取若干个样本, 复杂,注重“量”; 判断抽样是从总体的某一层次抽取若干符合条件的典型样本, 简单,注重“质”。

配额抽样 vs 判断抽样

2019/3/1
30
参考抽样(滚雪球抽样)


先随机方式选择一组调查对象或个体,在对他们 进行调查后,根据他们所提供的信息或由他们推 荐选择下一组调查对象或个体。 可以分析调研总体中的稀有特征,如35岁的单身贵 族。

类型 简单随机抽样 系统抽样技术 分层随机抽样技术 分群随机抽样技术
2019/3/1
21
简单随机抽样


例子:抽签法、随机数表法 特点: 每个总体元素入选为样本的概率相等; 能得到总体特征的无偏估计值; 要求有总体元素的完整列表。 适应情况: 调研总体中各个体之间差异较小 调查对象不明,难以分组、分类
23
2019/3/1
分层抽样

分层抽样:
先将总体的所有个体按某一重要标志进行分类(层),
然后在各类(层)中采用简单随机抽样或系统抽样。

分层抽样的理由:
抽样误差更小 可以对特定群体进行研究

分层抽样方法:
等比例分层 分等比例分层
2019/3/1
24
整群抽样

整群抽样
将总体分为若干子群体,随机抽取一个群体,以此推断
6.3 抽样误差分析
6.3.1调查误差的分类 1.非抽样误差 2.抽样误差

6.3.2抽样误差的控制 1、准确选定抽样方法 2、正确确定样本数目 3、加强组织领导

6.4 样本容量的确定
6.4.1影响抽样数目的因素 1、总体各单位间的标志变异程度 2、极限抽样误差的大小 3、调查结果的概率保证程度 4、抽取样本单位的方法
为方便实行随机抽样,将总体划分为有限个互
不重叠的部分,每个部分就是一个抽样单元

样本单位(样本元素)
组成总体或样本的基本单位
抽样单元不一定是样本单位

样本框:总体中所有样本单位的完整列表
总体指标和样本指标

总体指标:总体参数
总体平均数和总体成数 总体方差和均方差

样本指标
样本平均数和样本成数 样本方差和均方差

μx: 为平均数抽样标准误差 μp:为成数抽样标准误差 P:为总体成数 N:为总体的个体数 n: 为样本的个体数
当N→很大
2019/3/1 53
2019/3/1
31
非概率抽样技术比较
优点 方便抽样 判断抽样 配额抽样 缺点
成本最低,耗时少, 有选择偏差,无代表 最方便 性 低成本,方便
结论不支持推广,主 观
可以就确定的特征对 有选择偏差,不能确 样本进行控制 保代表性
滚雪球抽样
可以估计稀缺特征
较耗时
4、抽样技术的选择
非概率抽样 研究性质 误差 总体的变异程度 统计上的考虑 操作上的考虑 探索性 非抽样误差较大时 同质 不要求精确时 人员/费用/时间有 限制时 概率抽样 归纳性 抽样误差较大时 异质 要求精确时 人员/费用/时间允 许时
4、确定最终样本量

根据回答率/发生率再对样本量进行调整,以确定 最终的样本量
r为预计回答率或发生率
例子:样本量计算


某杂志出版商希望得到读者对该杂志综合满意度 的估计值。通过邮寄调查,出版商可以联系到所 有2500个订户。但由于时间的限制,出版商决定 使用简单随机抽样进行电话调查。请问应访问多 少个订户? 我们假定:可接受的误差限e为0.10;调查估计值 的置信度为95%,因此Z=1.96;使用简单随机抽样 ;预计回答率 =0.65;
利用统计资料判断选择样本
利用调查总体的全面统计资料,按照一定的标准选择 样本。
2019/3/1
29
配额抽样

配额抽样:按照一定的标准分配样本数额,并 在规定数额内由调查人员任意抽选样本。 配额抽样 vs 分层抽样

分层抽样是按随机原则在层内抽样。 配额则是由调查人员在配额内主观判断选定样本
终的样本量 :
3、抽样平均数的标准误差

重复抽样



不重复抽样

μx: 为平均数抽样标准误差 μp:为成数抽样标准误差 σ2 :为总体方差 σ:为总体均方差 N:为总体的个体数 n: 为样本的个体数
当N→很大
2019/3/1 52
4、抽样成数的标准误差

重复抽样


不重复抽样
设计样本计划
考虑数据收集成本 确定具体抽样方法 确定样本容量

样本抽取与检验(实施调查与测算结果


样本抽取的步骤
选择样本单位 从样本单位获取信息

样本抽取中的问题
受访者替代:舍弃、过多抽样、再抽样
样本有效性:检验样本的代表性
6.2 抽样技术的分类及选择
1、什么是抽样技术

抽样的价值:
用样本指标估计、推算总体指标
10
2019/3/1
抽样误差

抽样误差:指样本指 标值与被推断的总体 指标值之差。主要包 括:
样本平均数与总体平均

抽样误差的主要来源
抽样方法 样本容量 总体单位的标志值的差
异程度
数之差 样本成数与总体成数之 差
3、为什么要开展抽样调查

6.4.2样本量的确定 1)经验法 2)可支配预算法 3)置信度法

1、初始样本量的计算
以简单随机抽样为例 给定均值,计算样本量 给定成数,计算样本量
样本容量的确定:均值
简单随机抽样下,通常使用误差限和估计量的标准差来确 定所需的样本量。
其中,z为置信区间的值, 误差,N为总体大小
由于事先没有关于顾客满意度的估计 方差应取最大,即 。 样本量的计算步骤如下: 第1步:计算初始样本量 :



第2步:根据总体大小调整样本量(这一步 只需对中小规模的总体):

第3步:根据抽样的设计效应来调整样本量: 在本例中,由于假定采用简单随机抽样设计, 所以B = 1。
第4步:根据无回答情况进行调整,确定最
2019/3/1
6
总体

总体
指所要调查对象的全体,其中每个被调查对象
叫做个体。

实际调查/1
7
样本
样本:是从调查总体中被选择研究的对总 体具有代表性的一些个体 样本容量:样本中个体的数目 大样本、小样本(≤30)

抽样单元、样本单位和样本框

抽样单元

抽样技术
对抽样的方法、操作技巧和工作程序的总称。
抽样技术分为两大类型:
概率抽样:总体元素均有一定概率入选样本 非概率抽样:无法估计总体元素的选样概率
2019/3/1
20
2、概率抽样技术

特点: 每个总体元素都有一个 已知的、非零的机会 (概率)入选为样本。 这个概率不一定相等, 其大小取决于样本选择 程序。 保证了样本的代表性
总体的一般特性。

适应于:
大规模市场调查中,群体内各个体的差异大,但各群之
间的差异较小的情况。 如产品质量检验
2019/3/1
25
概率抽样技术比较
优点
简单随机抽 样 系统抽样 分层抽样 整群抽样
易于理解 可增加代表性,比简单抽 样容易执行,不需抽样框
缺点
成本高,精确度较低,不 能确保代表性,难以构建 抽样框 会降低代表性
10000 4500
容许的抽样误差 e(%) 5.5 6.0
样本量n
320 277
2.0
2.5 3.0 3.5 4.0 4.5 5.0
2500
1600 1100 816 625 494 400
6.5
7.0 7.5 8.0 8.5 9.0 9.5
237
204 178 156 138 123 110
10.0

普查不可行
总体太大 有些个体难以接触 破坏性 费用高昂
时间与时效问题

抽样调查的必要性和可行性
12
2019/3/1
4、抽样调查适用范围


对一些不可能或不必要进行全面调查的项目;
经费、人力、物力和时间有限的情况; 运用抽样调查对全面调查或普查进行验证; 对某种总体的假设进行检验,判断这种假设的真 伪,以决定行为的取舍。
2019/3/1
13
6.1.2抽样调查的流程
2019/3/1
14
定义总体
根据研究目标识别目标总体; 根据人口统计学特征,将目标总体明确化 进一步明晰样本单位。

识别抽样框(样本框)


抽样框的常见形式:电话号码本、名单、手册、 地图、数据包等 抽样框的要求 抽样框应是有序的(抽样单元有编号,且按某 种顺序排列); 抽样框中包含的抽样单元应“不重不漏” 。 评估抽样框误差
相关文档
最新文档