第6章抽样设计.ppt

合集下载

第6章抽样设计

第6章抽样设计

第四节 抽样误差与样本量
• 一、调查误差的概念与种类 • 调查误差是指调查的结果和客观实际情况的出入和差数。
一般有两种误差存在, 即非抽样误差和抽样误差。 • 非抽样误差是基于抽样之外的许多其它原因而产生的误差。
• 抽样误差是指一个样本的测定值与对该变量真值之间的差 异,抽样误差无特定偏向,其误差大小主要受以下三个因 素影响:
• 单位顺序的排列方式有两种: 一种是排列顺 序与调查项目无关。另一种是按与调查项 目有关标志排队。
• 三、分层抽样
• 分层抽样又叫类型抽样, 它是先将总体 所有单位按某一重要标志进行分类(层), 然后再各类(层)中采用简单随机抽样或 等距抽样方式抽取样本单位的一种抽样方 式。
• 分层抽样比简单随机抽样和机械抽样更 为精确, 能够通过对较少的抽样单位的调查, 得到比较准确的推断结果, 特别是当总体较 大、内部结果复杂时, 分层抽样常能取得令 人满意的效果。同时, 分层抽样在对总体推 断的同时, 还能获得对每层的推断。
• (二)特点
• 与全面调查相比,抽样调查具有以下三个 显著特点:
• 1、经济
• 与全面调查相比,抽样调查的样本量大大 减少,从而可以显著地节约人力、物力和 财力。
• 2、高效
• 由于抽样调查只对总体中少量单位进行调 查,故能十分迅速地得到调查讨论。
• 3.准确
• 抽样调查是调查部分总体单位,数目较少,
• 第一,被研究总体各单位标志值的变异程度。 • 第二,抽样的样本量。 • 第三,抽样调查的组织方式。
• 二、样本量 • 在开始组织抽样调查之前,确定抽多少样本单位是个很重
要的问题。 • (一)影响样本量的因素 • 抽样调查的样本量取决于以下几个因素: • 1、被调查对象标志的差异程度 • 2、允许误差数值的大小 • 3、调查结果的可靠程度 • 4、抽样的方法 • 5.抽样的组织形式

市场调查-第六章抽样技术

市场调查-第六章抽样技术

N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。

社会研究方法 第6章

社会研究方法 第6章

整群抽样
不同子群
子群抽取
整群抽样
优点:简便易行,节省费用 扩大抽样应用范围
缺点: 样本分布不广, 代表性相对较差
适用对象: 总体的不同子群之间差别不大, 而每个子群内部差异较大
五、多段抽样
按抽样元素的隶属、层级关系把抽样过程分为 几个阶段进行:先从总体中随机抽取几个大群, 然后再从这几个大群内随机抽取几个小群,这 样一级级抽下去直到抽到最基本的元素为止。
第六章 抽样
第一节 抽样的意义与作用 第二节 概率抽样的原理与程序 第三节 概率抽样方法 第四节 户内抽样与PPS抽样 第五节 非概率抽样方法 第六节 样本规模与抽样误差
第一节 抽样意义与作用
一、抽样的概念
(1)总体(population):构成它的所有元素的 集合,用“ N ”表示。
(2)元素(element):构成总体的最基本单位。
出总体内在结构的变量作为分层变量。 c:以那些已有明显层次区分的变量作为分层变量 (2)分层的比例 a:按比例分层抽样 b:不按比例分层抽样
按比例分层抽样
分层
学生
1200
女生1000 (5/6)
男生200 (1/6)
抽 样(120人)
100人 5/6
样 本 20人 1/6 120
按各种类型或层次中单位数目同总体单位数目间 的比例来抽取子样本的方法。可以确保得到一个 与总体结构完全一样的样本。
样本规模的计算
简单随机抽样中样本规模的计算 置信水平对应的临界值

推论总体均值

n
t2
e2
பைடு நூலகம்
2
总体的标准差 允许的抽样误差
推论总体成数:
t 2 p(1 p)

统计学第六章 抽样法

统计学第六章  抽样法
31
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80

x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数

概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计

总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。

第6章--抽样推断PPT优秀课件

第6章--抽样推断PPT优秀课件

不考虑顺序
(N n 1)! n!(N 1)!
不重复抽样:又称不回置抽样。
考虑顺序 N !
( N n )!
可能组成的样本数目
不考虑ห้องสมุดไป่ตู้序
N! ( N n )! n!
7
标号为A、B、C、D的四个圆球从中随机抽取两个 可能样本个数
考虑顺序 N n
AA、AB、AC、AD BA 、BB、BC、BD
CA、CB、CC、CD
p
p1p0.9 8 0.0 20.8(0% 8 )
n
300
p p1np1N n 0.938 0 0.0021630000 00 0.80(6 %
计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
24
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
例题二解 已知: N 20 ,n 040,0 x 0 48 ,0 3000
则:
x
n
3001(5小)时 400
x
2 1 n 3020140013.42(小时 )
n N 400 2000
计算结果表明:
根据部分产品推断全部产品的平均使用寿命时,采用
不重复抽样比重复抽样的平均误差要小。
21
抽样成数平均误差的计算公式
例题二:
某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
17
下面求 Y 的无偏估计 y 的方差 V ( y )

6第六章抽样方法

6第六章抽样方法
• 该方法的准确性一般比随机抽样高。
选择聚集抽样的步骤:
(1)在研究区随机抽取一定数量的样方。 (2)在抽取的样方中选择含有研究个体的样
方。 (3)在每个选择样方周围进行继续选样,形
成多个网状样方组。 (4)继续选样直到选择的样方中不含有研究
个体数为止。 (5)进行种群密度及置信区间的估计。
参数估计
• 方差估计
S2
(wi x)2 (有放回抽样,n n(n1) 为抽取的样方数)
S2
(Nn)
(wi x)2
N(nn1)
(无放回抽 样,N为总样方 数)
讨论题
• 哪些情形的种群调查不宜采用选择性聚 集抽样方法?
–当大部分样方中均有一到多个研究个体 时不宜采用。
第四节 顺序抽样(自学3min) Systematic sampling
8.146 176,32,122,41
1
9.146
21
1.41421 10.56
0,0
2.23507 12.796 9,112,255,3,65
2
14.796 122,102,0,7
1.41421 16.210
18,1
1.41421 17.625
14,9
思考题
• 请说说哪些情形的生态学调查不需采用 分层抽样方法?
• 常用的顺序抽样方法有: –五点取样:适宜随机分布种群 –对角线取样:适宜随机分布种群 –棋盘式取样:随机和核心分布 –平行跳跃式取样:核心分布 –z字形取样:负二项分布
• 在统计上没有严格意义上的方差估计方法
五点取样
单对角线取样
双对角线取样
棋盘式取样
Z字形取样
平行跳跃式取样
第五节 多重抽样

第6章 抽样调查


第二节 抽样调查的组织形式
通常有以下四种组织形式: 通常有以下四种组织形式:
抽样方式
概率抽样 非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
简单随机抽样(纯随机抽样) 一、简单随机抽样(纯随机抽样)
即从总体单位中不加任何分组、排队, 即从总体单位中不加任何分组、排队, 完全随机地抽取调查单位。 完全随机地抽取调查单位。
统计应用
“抓阄”征兵计划
然而结果是, 73个较小的号码被分配给了 然而结果是 , 有 73 个较小的号码被分配给了 前半年的日子,同时有110 110个较小的号码被分配给 前半年的日子,同时有110个较小的号码被分配给 了后半年的日子。 换句话说, 了后半年的日子 。 换句话说 , 如果你生于后半年 的某一天, 那么, 的某一天 , 那么 , 你因为被分配给一个较小号码 而去服兵役的机会要大于生于前半年的人 在这种情况下, 在这种情况下 , 两个数字之间只应该有随机 误差, 73和110之间的差别超出了随机性所能解 误差,而73和110之间的差别超出了随机性所能解 释的范围。 释的范围 。 这种非随机性是由于乒乓球在被抽取 之前没有被充分搅拌造成的。 在第二年, 之前没有被充分搅拌造成的 。 在第二年 , 主管这 件事的部门在抓阄之前去咨询了统计学家( 件事的部门在抓阄之前去咨询了统计学家(这可能 使生于后半年的人感觉稍微舒服些) 使生于后半年的人感觉稍微舒服些)
分层抽样的好处是: 分层抽样的好处是: 样本代表性高、抽样误差小、抽样调查 本代表性高、抽样误差小、
成本较低。如果抽样误差的要求相同的话则 成本较低。 抽样数目可以减少。 抽样数目可以减少。

第6章抽样分布与参数估计


抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
/3:22
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
6.1.4 样本均值的抽样分布 1.大样本场合下的样本均值抽样分布
总体(Population)是指所研究的事物及其现象的全体,由该事物及 其现象的全部个体组成。
个体(Item Unit)是指构成总体的元素。 总体容量(Population Size)是指构成总体的全部个体的数量。
样本(Sample)是指从总体抽取的若干个体构成的集合。 抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽 取若干个体的过程。 样本容量(Sample size)是指构成样本的全部个体的数量。
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
/3:22
《统计学教程》
第6章 抽样分布与参数估计
在反复抽取容量相同的独立同分布样本条件下,所得到的样本均值的 概率分布称为样本均值的抽样分布。在样本容量充分大的情况下,即大 样本场合,样本均值依据中心极限定理趋于正态分布。
所谓独立同分布样本为从无限总体中随机抽取的等概样本,或从有限 总体中以放回方式,随机抽取的等概样本。
所谓大样本是指能够满足中心极限定理要求,使样本均值趋于正态分 布的样本容量。在统计实践中一般称样本容量大于30即为大样本这只是 一个粗略的经验数值。

第六章 抽样


简单随机抽样
• 简单随机抽样(纯随机抽样):按等概率 原则直接从含有N个元素的总体中随机抽取 n个元素组成样本(N>n)。 • 概率抽样中最基本形式,其他形式都是以 此为基础。
系统抽样
• 系统抽样(等轴抽样、等距抽样、机械抽 样):把总体的单位进行编号排序,再计 算出其中间隔,然后按这个固定的间隔抽 取个体的号码来组成样本的方法。
整群抽样与分层抽样
• 当总体由若干个自然界限或区分的组(子 群、层)所组成时
– 若组内部差异较大,组间差异较小----整群抽样。 – 若组内部差异较小,组间差异较大----分层抽样。
• 一.抽样的概念 • 二.抽样的作用 • 三.抽样的类型
抽样的概念
• • • • • • • 1. 2. 3. 4. 5. 6. 7. 总体(Population) 样本(Sample) 抽样(Sampling) 抽样单位(Sampling Unit) 抽样框(Sampling Frame) 参数值(Parameter) 统计值(Statistics)
抽样的概念
• 统计值(样本值):样本中某一个变量的 综合描述。 • 是从样本中计算出来的。 • 是作为总体值的估计值。
抽样的作用
• 用十分有限的人力、财力、时间去了解庞 杂、广阔、纷繁、多变的社会现象。
• 比如:民意测验,要求迅速、准确。往往 调查对象不到2000人。
第二节 概率抽样的原理与程序
• 比如家庭、班级、居委会。
– 特点:抽样单位不是个体,而是成群的个体。
• 比如:某大学共有100个班,每班都是30名同学,总 共 3000名学生,现在要抽取300名。先从100个班中 抽取10个班,则这10个班的全部学生就构成了样本。

第6章抽样


【观念应用4-3】 仍以上述居民收入与购买力之间关系为例。各层样本标准差其中高收入为300元,中收入为200元, 低收入为100元,为了便于观察,列表如表5-2所示。 表4-2 调查单位数与样本标准差乘积计算表 各层次 (不同经济收入)
各层的调查单位数(户)Ni
4 000 12 000 4 000 20 000
47 74 76 56 59 22 11 26 21 60 28 62
43 24 62 85 56 77 17 63 12 17 17 37
73 67 27 99 35 94 53 78 86 34 12 35
86 62 66 26 64 39 71 59 29 44 13 18
36 42 56 96 37 49 57 16 78 09 40 98
各层的样本标准差(元)Si 300 200 100
高 中 低
∑NiSi
4.2.2

随机抽样技术的分类及技术特点
(3)等距离随机抽样技术 抽样间隔计算公式为: 抽样间隔=总体数(N)÷样本数 (n) (4.2)



【观念应用4-4】 某地区有零售店110户,采用等距离抽样方法抽选11户进行调查。 【分析提示】 等距离抽样,方法简单,省却了一个个抽样的麻烦,适用于大规模 调查。还能使样本均匀地分散在调查总体中,不会集中于某些层次, 增加了样本的代表性。
96 81 50 96 54 54 24 95 64 47 33 83
47 14 26 68 82 43 55 55 56 27 20 50
36 57 75 27 46 55 06 67 07 96 38 87
61 20 07 31 22 82 88 19 82 54 26 75
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2019/11/5
27
方便抽样(偶然抽样)
方便抽样: 以偶然的方式获得样本
具体方式 街头拦截法
特点
方便 代表性无法保证
应用
适合探测性研究 不适合描述性研究、因
果性研究
伪,以决定行为的取舍。
2019/11/5
13
6.1.2抽样调查的流程
2019/11/5
14
定义总体
根据研究目标识别目标总体; 根据人口统计学特征,将目标总体明确化 进一步明晰样本单位。
识别抽样框(样本框)
抽样框的常见形式:电话号码本、名单、手册、 地图、数据包等
抽样框的要求 抽样框应是有序的(抽样单元有编号,且按某 种顺序排列); 抽样框中包含的抽样单元应“不重不漏” 。
2019/11/5
23
分层抽样
分层抽样:
先将总体的所有个体按某一重要标志进行分类(层), 然后在各类(层)中采用简单随机抽样或系统抽样。
分层抽样的理由:
抽样误差更小 可以对特定群体进行研究
分层抽样方法:
等比例分层 分等比例分层
2019/11/5
24
整群抽样
整群抽样
1、什么是抽样调查
日常生活的例子 抽样调查:
按照一定方式,从调查总体中抽取能代表总体 的一部分(即样本)进行调查,然后用样本所 包含信息对总体的状况进行估计和推算的一种 调查方法。
相对于普查
2、抽样调查相关概念
总体 样本 总体指标 抽样指标 抽样单元与抽样框 抽样误差
抽样单元
为方便实行随机抽样,将总体划分为有限个互 不重叠的部分,每个部分就是一个抽样单元
样本单位(样本元素)
组成总体或样本的基本单位 抽样单元不一定是样本单位
样本框:总体中所有样本单位的完整列表
总体指标和样本指标
总体指标:总体参数
总体平均数和总体成数 总体方差和均方差
异程度
3、为什么要开展抽样调查
普查不可行
总体太大 有些个体难以接触 破坏性 费用高昂 时间与时效问题
抽样调查的必要性和可行性
2019/11/5
12
4、抽样调查适用范围
对一些不可能或不必要进行全面调查的项目; 经费、人力、物力和时间有限的情况; 运用抽样调查对全面调查或普查进行验证; 对某种总体的假设进行检验,判断这种假设的真
评估抽样框误差
设计样本计划
考虑数据收集成本 确定具验(实施调查与测算结果

样本抽取的步骤
选择样本单位 从样本单位获取信息
样本抽取中的问题
受访者替代:舍弃、过多抽样、再抽样 样本有效性:检验样本的代表性
6.2 抽样技术的分类及选择
精确
容易执行
成本高,精确度较低,不 能确保代表性,难以构建 抽样框
会降低代表性
难以选择相关的分层 变量
不精确,难以计算和 解释结果
3、非概率抽样技术
特点
不是基于概率,但努力抽取代表性样本
类型
方便抽样(任意抽样) 判断抽样 配额抽样 参考抽样(滚需求抽样) 固定样本连续法
样本指标
样本平均数和样本成数 样本方差和均方差
抽样的价值:
用样本指标估计、推算总体指标
2019/11/5
10
抽样误差
抽样误差:指样本指 标值与被推断的总体 指标值之差。主要包 括:
样本平均数与总体平均 数之差
样本成数与总体成数之 差
抽样误差的主要来源
抽样方法 样本容量 总体单位的标志值的差
2019/11/5
22
系统抽样
系统抽样:
先将总体的各个体按一定的标志排列起来,然后,按 照固定顺序和一定间隔来抽取样本个体。
跳跃区间(间隔): 总体数(N)÷样本数(n)
抽样标志
按与调查项目无关的标志排队,如门牌号; 按与调查项目有关的标志排队,如住户月均收入
避免自然周期的影响
将总体分为若干子群体,随机抽取一个群体,以此推断 总体的一般特性。
适应于:
大规模市场调查中,群体内各个体的差异大,但各群之 间的差异较小的情况。
如产品质量检验
2019/11/5
25
概率抽样技术比较
优点
缺点
简单随机抽 样
系统抽样
分层抽样
整群抽样
易于理解
可增加代表性,比简单抽 样容易执行,不需抽样框
1、什么是抽样技术
抽样技术
对抽样的方法、操作技巧和工作程序的总称。
抽样技术分为两大类型:
概率抽样:总体元素均有一定概率入选样本 非概率抽样:无法估计总体元素的选样概率
2019/11/5
20
2、概率抽样技术
特点:
每个总体元素都有一个 已知的、非零的机会 (概率)入选为样本。
这个概率不一定相等, 其大小取决于样本选择 程序。
保证了样本的代表性
类型 简单随机抽样 系统抽样技术 分层随机抽样技术 分群随机抽样技术
2019/11/5
21
简单随机抽样
例子:抽签法、随机数表法 特点:
每个总体元素入选为样本的概率相等; 能得到总体特征的无偏估计值; 要求有总体元素的完整列表。 适应情况: 调研总体中各个体之间差异较小 调查对象不明,难以分组、分类
第6章 抽样设计
本章的几个基本问题
是否进行抽样? 采用什么样的方法抽样? 选择什么类型的样本? 样本大小如何确定? 如何控制和调整样本误差?
2019/11/5
2
一、抽样设计概述
6.1抽样的基本概念
6.1.1抽样的基本概念 市场调研工作的目标是获取研究总体的各 类信息及其特征。一般来说,有两种方法 可以采用:一是普查,二是抽样。普查是 穷举调查总体的各类信息及其特征。抽样 是按照随机原则从调查总体中抽取一部分 单位作为样本而进行的一种非全面调查。
2019/11/5
6
总体
总体
指所要调查对象的全体,其中每个被调查对象 叫做个体。
实际调查中总体的定义要精确和具体。
2019/11/5
7
样本
样本:是从调查总体中被选择研究的对总 体具有代表性的一些个体
样本容量:样本中个体的数目 大样本、小样本(≤30)
抽样单元、样本单位和样本框
相关文档
最新文档