第6章抽样设计

合集下载

统计学教案(第6章抽样推断)

统计学教案(第6章抽样推断)
若对于任意ε>0,有
二、区间估计法
在参数估计中,虽然点估计可以给出未知参数得一个估计,但不能给出估计得精度。为此人们希望利用样本给出一个范围,要求它以足够大得概率包含待估参数真值。这就就是导致区间估计问题。
所谓区间估计,就就是估计总体参数得区间范围,并要求给出区间估计成立得概率值。
设 就是未知参数, 就是来自总体得样本,构造两个统计量 , ,对于给定得 (0< <1),若 、 满足
例如
就就是一个统统计量,称为样本方差(Sample variance),
3、重复抽样与不重复抽样
(1)重复抽样:就是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一次样本单位得抽取。
(2)不重复抽样:即每次从总体中抽取一个单位,登记后不放回原总体,不参加下一次抽样。
2、总体参数与样本统计量
(1)总体参数:总体分布得数量特征就就是总体参数,也就是抽样统计推断得对象。常见得总
体参数有:总体得平均数指标,总体成数(比重)指标,总体分布得方差、标准差等等。
(2)样本统计量:与总体参数对应得就是样本统计量。
设( )就是总体 容量为n得样本,若样本函数
( )
中不含任何未知参数,则称 为一个统计量。
2、根据部分推断总体得数量特征
3、抽样推断得结果具有一定得可靠性与准确性,抽样误差可以事先计算与控制
其她特点有经济性、时效性、准确性、灵活性等
(三)抽样推断得应用
1、不可能进行全面调查时
2、不必要进行全面调查时
3、检查生产过程正常与否
4、对全面调查资料进行补充修正时
二、抽样得几个基本概念
1、样本容量与样本个数
区间估计步骤:
1、计算样本统计量

第6章抽样设计

第6章抽样设计

第四节 抽样误差与样本量
• 一、调查误差的概念与种类 • 调查误差是指调查的结果和客观实际情况的出入和差数。
一般有两种误差存在, 即非抽样误差和抽样误差。 • 非抽样误差是基于抽样之外的许多其它原因而产生的误差。
• 抽样误差是指一个样本的测定值与对该变量真值之间的差 异,抽样误差无特定偏向,其误差大小主要受以下三个因 素影响:
• 单位顺序的排列方式有两种: 一种是排列顺 序与调查项目无关。另一种是按与调查项 目有关标志排队。
• 三、分层抽样
• 分层抽样又叫类型抽样, 它是先将总体 所有单位按某一重要标志进行分类(层), 然后再各类(层)中采用简单随机抽样或 等距抽样方式抽取样本单位的一种抽样方 式。
• 分层抽样比简单随机抽样和机械抽样更 为精确, 能够通过对较少的抽样单位的调查, 得到比较准确的推断结果, 特别是当总体较 大、内部结果复杂时, 分层抽样常能取得令 人满意的效果。同时, 分层抽样在对总体推 断的同时, 还能获得对每层的推断。
• (二)特点
• 与全面调查相比,抽样调查具有以下三个 显著特点:
• 1、经济
• 与全面调查相比,抽样调查的样本量大大 减少,从而可以显著地节约人力、物力和 财力。
• 2、高效
• 由于抽样调查只对总体中少量单位进行调 查,故能十分迅速地得到调查讨论。
• 3.准确
• 抽样调查是调查部分总体单位,数目较少,
• 第一,被研究总体各单位标志值的变异程度。 • 第二,抽样的样本量。 • 第三,抽样调查的组织方式。
• 二、样本量 • 在开始组织抽样调查之前,确定抽多少样本单位是个很重
要的问题。 • (一)影响样本量的因素 • 抽样调查的样本量取决于以下几个因素: • 1、被调查对象标志的差异程度 • 2、允许误差数值的大小 • 3、调查结果的可靠程度 • 4、抽样的方法 • 5.抽样的组织形式

市场调查-第六章抽样技术

市场调查-第六章抽样技术

N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。

统计学原理-第六章 抽样调查(复旦大学第六版)

统计学原理-第六章  抽样调查(复旦大学第六版)
全体。其单位数用N来表示。
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28

2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。

2
x X f
2
f

2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x

N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F

统计学 第 6 章 抽样与参数估计

统计学  第 6 章   抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。

社会研究方法 第6章

社会研究方法 第6章

整群抽样
不同子群
子群抽取
整群抽样
优点:简便易行,节省费用 扩大抽样应用范围
缺点: 样本分布不广, 代表性相对较差
适用对象: 总体的不同子群之间差别不大, 而每个子群内部差异较大
五、多段抽样
按抽样元素的隶属、层级关系把抽样过程分为 几个阶段进行:先从总体中随机抽取几个大群, 然后再从这几个大群内随机抽取几个小群,这 样一级级抽下去直到抽到最基本的元素为止。
第六章 抽样
第一节 抽样的意义与作用 第二节 概率抽样的原理与程序 第三节 概率抽样方法 第四节 户内抽样与PPS抽样 第五节 非概率抽样方法 第六节 样本规模与抽样误差
第一节 抽样意义与作用
一、抽样的概念
(1)总体(population):构成它的所有元素的 集合,用“ N ”表示。
(2)元素(element):构成总体的最基本单位。
出总体内在结构的变量作为分层变量。 c:以那些已有明显层次区分的变量作为分层变量 (2)分层的比例 a:按比例分层抽样 b:不按比例分层抽样
按比例分层抽样
分层
学生
1200
女生1000 (5/6)
男生200 (1/6)
抽 样(120人)
100人 5/6
样 本 20人 1/6 120
按各种类型或层次中单位数目同总体单位数目间 的比例来抽取子样本的方法。可以确保得到一个 与总体结构完全一样的样本。
样本规模的计算
简单随机抽样中样本规模的计算 置信水平对应的临界值

推论总体均值

n
t2
e2
பைடு நூலகம்
2
总体的标准差 允许的抽样误差
推论总体成数:
t 2 p(1 p)

06第六章 整群抽样

i 1 i 1 j 1
n
n
M

N M 1 S ( yij Y ) 2 为总体方差; NM 1 i 1 j 1 2
n M 1 s ( yij y ) 2 nM 1 i 1 j 1 2
2 b

为样本方差; 为总体群间方差;

M N 1 N 2 S (Yi Y ) N 1 (Yi Y ) 2 N 1 i 1 i 1
第一节 第二节 第三节 第四节

整群抽样概述 等概率整群抽样的情形 不等概率整群抽样的情形 设计效应和样本容量的确定
第一节 整群抽样概述




一、整群抽样的概念 整群抽样是先将总体各单元划分成若干群(组),然后以 群为单位,从中随机抽取一部分群,对中选群内的所有单 元进行全面调查。确切地说,这种抽样组织形式应称为单 级整群抽样。 如果总体中的单元可以分成多级,则可以对前几级单元采 用多阶抽样(详见下章),而在最后一阶中对该阶抽样单 元所包含的全部个体(最基本单元)进行调查,这种抽样 称作多级整群抽样。本章只讨论单级整群抽样。 设总体被划分为N群,第i群含有Mi个次级单元,全部总 体次级抽样单元数记为M 0,即 M 0 M i 。当诸Mi都相等 时,称为等群;否则,称为不等群。
M n 1 n 2 (Yi y ) (Yi y ) 2 s n 1 i 1 n 1 i 1
2 b
为样本群间方差;

N M 1 S ( yij Yi ) 2 N ( M 1) i 1 j 1 2
为总体平均群内方差; 为样本平均群内方差;



二、分群的原则 尽量扩大群内差异,而缩小群间差异。 三、整群抽样的特点 1.在大规模抽样调查中,常常没有或很难编制出包括总 体所有次级单元在内的抽样框,而整群抽样则不需要编制 庞大的抽样框。 2.在样本单元数相同的条件下,整群抽样与简单随机抽 样相比,样本单元的分布相对较集中,虽然样本的代表性 较差,但调查组织实施过程更加便利,同时还可以大大地 节省调查费用。因此,实际工作中,在权衡费用和精度之 后,有时宁可适当增加一些样本单元数,也采用整群抽样 方法。 3.整群抽样的随机性体现在群与群间不重叠,也无遗漏, 群的抽选按概率确定。

概率论 第六章 样本及抽样分布

函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.

统计学第六章抽样和抽样分布


2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布

第6章市场研究抽样设计

➢样本:从总体中按一定程序抽得的那部分个体或抽样单元组 成的集合。
➢样本容量:样本中包含的单位数目。
➢抽样和抽样框:抽样是指从总体中按一定的方式选取样本的 过程。抽样框(sampling frame)是用来抽取样本的工具。是总 体的数据名录或单位的名单。
➢参数值(总体值)与统计值(样本值)
➢抽样误差与非抽样误差
3.决定抽样方案 随机抽样与非随机抽样
4.确定样本容量
5.实际抽取样本 6.评估样本质量
对样本的质量、代表性、偏差等进行初 步的检验和衡量,以防止由于样本的偏 差过大而导致失误。
编制抽样框
• 在编制抽样框架时常见的问题如下:
– 遗漏-遗漏部分样本单位; – 聚堆-缺乏个体样本单位信息; – 重复-同一样本单位重复出现; – 混杂-抽样框架中包括部分非样本总体成员。
定义: ✓ 将总体单位按某种特征 分成两个或两个以上相
A
B
互独立的组,从每一组
中再简单随机抽样,样
本相互独立,
✓ 使得:组间特征差异大, 组内特征差异小,增加
样本对总体的代表性。
适用情况:
C
✓总体分布不均匀,各总体单
D
位之间标志变异程度比较大。来自1)比例分层抽样即按各层中的单位数占总体的比例分配各层样本量。
主要内容
• 一、抽样设计的基本概念 • 二、抽样设计的步骤 • 三、抽样方法 • 四、样本大小的确定 • 五、有关抽样设计的几个问题
二、抽样设计的步骤
1.界定总体 地理特征、人口统计特征、产品使用情 况、认知程度等。
2.制定抽样框
依据已经明确界定的总体范围,收集总体中 全部抽样单位的名单,并通过对名单进行统 一编号来建立供抽样使用的抽样框。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
市场调查方法与技术
一.方便抽样
非概率抽样方式
❖ 依据方便原则抽取样本 ❖ 适合于探索性研究
市场调查方法与技术
二.判断抽样
非概率抽样方式
❖ 在判断的基础上确定样本,如何判断取决于研究目的 ❖ 不具备用样本调查结果对总体进行推断的依据
市场调查方法与技术
三.配额抽样
非概率抽样方式
❖ 按一定标准划分类别,分配样本数额。 ❖ 不需要抽样框
市场调查方法与技术
1. 抽样设计概述 2. 概率抽样方式 3. 非概率抽样方式 4. 抽样中的误差问题 5. 样本量的确定
市场调查方法与技术
样本量的确定 一.影响样本量的因素
❖ 1.调查精度 ❖ 2.总体变异度 ❖ 3.总体规模 ❖ 4.无回答情况 ❖ 5.调查经费情况
市场调查方法与技术
样本量的确定 二.确定样本量的方法
概率抽样方式 ❖ 五种常用概率抽样方式
简单随机抽样 分层抽样 整群抽样 系统抽样
多阶段抽样 市场调查方法与技术
概率抽样方式 一.简单随机抽样
❖ 无放回简单随机抽样和有放回简单随机抽样两种,无放回 简单随机抽样具有代表意义。
❖ 抽样程序可以通过三种方式实现:
▪ 抽签法 ▪ 随机数表法 ▪ 计算机抽取
❖ 非概率抽样,样本量确定主要根据经验判断 ❖ 概率抽样,需要在计算的基础上确定
市场调查方法与技术
样本量的确定 ❖ 三.样本量的计算
样本量的计算
无放回简单随机抽样
S(y) V(y) n S2
(1 ) Nn
有放回简单随机抽样
S(y) V(y) S2
n
市场调查方法与技术
样本量的确定
❖ 抽样误差
▪ 由于抽样的随机性造成的误差 ▪ 定义式 S(ˆ) V (ˆ) ▪ 影响因素
• 总体分布 • 样本量 • 抽样方式和估计方式
市场调查方法与技术
抽样中的误差问题 三.非抽样误差
❖ 除抽样误差以外由其他原因引起的误差 ❖ 主要类型:
▪ 抽样框误差 ▪ 无回答误差 ▪ 调查人员误差 ▪ 受访者误差
45
50岁以上
50
50
合计
250
250
合计
150 150 100 100 500
❖ 交叉变量配额控制保证样本分布更均匀,更具有代表性, 但操作的难度要大。
市场调查方法与技术
四.自愿样本
非概率抽样方式
❖ 被调查者自愿填写调查问卷,如网络调查
❖ 优点:
▪ 实施方便,调查成本低
❖ 缺点:
▪ 容易形成被调查者集中于某类特定群体,对总体缺乏代表性 ▪ 可以反映特定群体的信息,但难以对总体进行推断
市场调查方法与技术
N nk
四.系统抽样
概率抽样方式
❖ 将总体单位排列,计算抽样间距,每隔一定距离进行抽取 ❖ 总体单位排列的类型会影响估计效率 ❖ 主要的排列方式有:
▪ 按无关标志排列 ▪ 按有关标志排列
❖ 当 N nk 时,估计量是有偏的 ❖ 若排列存在周期性变化,要选择恰当的抽样间隔
市场调查方法与技术
抽样的作用 1.解决数据来源 2.进行质量检验,如普查以后的抽样质量检验
市场调查方法与技术
抽样设计概述
抽样的特点 1.节省费用 2.调查周期短,时效快 3.有助于提高原始数据质量
❖ 抽样调查适合于大规模的总体,对规模小的总体进行抽样, 为达到同样精度,一般需要较大比例的样本,从经济角度 考虑就不合算。
按单一变量控制配额分配表
年龄 20-30岁 30-40岁 40-50岁 50岁以上
合计
人数 150 150 100 100 500
性别 男 女 合计
人数 250 250 500
市场调查方法与技术
非概率抽样方式
交叉变量控制配额分配表
年龄
性别


20-30岁
70
80
30-40岁
75
75
40-50岁
55
反映估计量的系统性误差
偏差
VB(iaˆs)(ˆ)EEˆ (Eˆ)(ˆ)2
市场调查方法与技术
抽样中的误差问题 一.描述误差的一些概念
均方误差
更综合地反映估计误差的情况
MSE(ˆ) V (ˆ) Bias(ˆ)2
市场调查方法与技术
抽样中的误差问题
二.抽样误差
❖ 抽样中的误差可以分为抽样误差和非抽样误差两类
❖ 还可以采用相对误差的要求计算样本量
rY t (1 n ) S2 Nn
n

1
n0 n0
N
n0


tS rY
2
市场调查方法与技术
样本量的确定
❖ 若采用变异系数
C S Y
n0


tC r
2
市场调查方法与技术
样本量的确定
❖ 若估计总体比例P,则
t2P 1 P
n0
2
❖ 若使用相对误差要求,则
t2P 1 P
n0 r 2P
市场调查方法与技术
样本量的确定 ❖ 设计效应Deff
复杂抽样估计量方差 Deff 简单随机抽样估计量方差
❖ 利用设计效应,可以计算复杂抽样设计所需要的样本量
n deff gn
市场调查方法与技术
概率抽样方式 五.多阶段抽样
❖ 通过多个阶段抽到最终接受调查的单元 特点
▪ 构造抽样框相对容易 ▪ 抽样误差大小与抽样阶段多少有关 ▪ 总抽样误差是各阶段抽样误差的累加
❖ 抽样设计时尽可能减少抽样阶段
市场调查方法与技术
1. 抽样设计概述 2. 概率抽样方式 3. 非概率抽样方式 4. 抽样中的误差问题 5. 样本量的确定
❖ 绝对误差的表达式为
tS( y) t
(1
n
S2 )
Nn
❖ 其中t为概率度,其数值与 有关 ❖ 由此可以解出样本量计算公式
n

1
n0 n0
N
市场调查方法与技术
样本量的确定
❖ 上式中,n0为有放回条件下的样本量,既
n0


tS 2
2

市场调查方法与技术
样本量的确定
市场调查方法与技术
1. 抽样设计概述 2. 概率抽样方式 3. 非概率抽样方式 4. 抽样中的误差问题 5. 样本量的确定
市场调查方法与技术
抽样中的误差问题 一.描述误差的一些概念
估计量方差
描述估计精度的重要指标
V (ˆ) E ˆ E(ˆ)2
市场调查方法与技术
抽样中的误差问题 一.描述误差的一些概念
市场调查方法与技术
抽样设计概述 二.抽样中的基本概念
基本概念
总体 样本
总体参数 样本统计量
抽样框
市场调查方法与技术
抽样设计概述
三.概率抽样与非概率抽样
随机原则抽取样本
可以构造置信区间
概率抽样
总体中每个单位 都有机会被抽中
可以用样本统计量对 总体参数进行估计
样本统计量遵循 一定的概率分布
市场调查方法与技术
第6章 抽样设计
本章主要内容
1. 抽样设计概述 2. 概率抽样方式 3. 非概率抽样方式 4. 抽样中的误差问题 5. 样本量的确定
市场调查方法与技术
1. 抽样设计概述 2. 概率抽样方式 3. 非概率抽样方式 4. 抽样中的误差问题 5. 样本量的确定
市场调查方法与技术
抽样设计概述 一.抽样的作用与特点
抽样设计概述
三.概率抽样与非概率抽样
抽取样本不是依据随机原则
不具备用样本统计量对 总体参数进行推断 的理论依据
非概率抽样
操作简便 成本低
无法计算抽样误差
样本统计量分布未知
市场调查方法与技术
1. 抽样设计概述 2. 概率抽样方式 3. 非概率抽样方式 4. 抽样中的误差问题 5. 样本量的确定
市场调查方法与技术
市场调查方法与技术
二.分层抽样
概率抽样方式
❖ 先将总体单位分层,在各层中随机抽取样本。
❖ 样本在各层分配可以分为两类 ❖ 分层抽样可以提高估计的效率。
等比例分配 不等比例分配
市场调查方法与技术
三.整群抽样概率抽样方式❖ 对抽群中的所有单位进行调查特点
▪ 构造抽样框相对容易 ▪ 被调查单位分布相对集中,调查成本低 ▪ 单位之间同质性高,影响估计效率 ▪ 对特定构造的群,有好的估计效果
相关文档
最新文档