抽样估计与样本量确定优秀课件

合集下载

抽样与抽样估计课件

抽样与抽样估计课件
抽样与抽样估计课件
$number {01}
目 录
• 抽样的基本概念 • 抽样分布 • 参数估计 • 样本量的确定 • 抽样误差与非抽样误差 • 实际应用案例
01
抽样的基本概念
定义与意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对样本的研究,可以推断出 总体的特征和规律,从而提高研 究效率和准确性。
误差的评估
误差的评估方法包括通过历史数据或置信区间来评估误差的 大小和分布,以及通过对比不同调查方法或不同时间点的调 查结果来评估误差的可控性和稳定性。
06
实际应用案例
市场调查抽样
实施调查
按照抽样计划进行调查,收集所 需数据,并确保数据质量和完整 性。
选择抽样方法
根据调查目的和资源限制,选择 合适的抽样方法,如简单随机抽 样、分层抽样、系统抽样等。
抽样的常见方法
01
随机抽样
按照随机原则从总
体中抽取样本。
02
系统抽样
按照一定的间隔或 顺序从总体中抽取
样本。
04
整群抽样
将总体分成若干群
03
,然后从各群中随
机抽取样本。
分层抽样
将总体分成若干层 ,然后从各层中随
机抽取样本。
抽样的原则与步骤
原则
随机性、代表性、可行性、经济性。
步骤
确定研究目的和总体范围、选择抽样方法、确定样本量和样本分布、实施抽样、 分析样本数据并推断总体特征。
02 抽样分布
随机抽样与概率分布
1 2
3
随机抽样
在统计学中,随机抽样是从总体中选取一部分个体的过程, 每个个体被选中的机会均等且不受其他因素的影响。

抽样样本量的确定_图文

抽样样本量的确定_图文

除了估计值的精度以外,调查实际操作的限制条件 也许是影响样本容量的最大因素。
客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少
1.给定精度水平下样本容量的确定
样本容量的大小与调查估计值所要求的精度紧密相关
数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。
表3: 显示了不同规模的总体在P=0.5时,使用简单随机 抽样,且以误差界限为0.05、置信度为95%的标准估计P 所需的样本容量
总体规模 50 100 500
1,000 5,000 10,000 100,000 1,000,000 10,000,000
所需的样本量 44 80 222 286 370 385 398 400 400
抽样方差的几种计量方法
标准误差 误差界限 变异系数
抽样调查中样本容量的确定,也经常会使 用一种或多种这样的计量方法来对精度进行说 明。
非抽样误差
非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑 为确保调查结果的准确性,应该消除非抽样误差,至少应尽 可能使之最小化
对于小规模总体,通常必须调查较大比 例的样本,以取得所期望的精度。因此,实 际操作中,对小规模总体经常采用普查而不 是抽样调查。
6.样本设计和估计量
计算样本容量时,通常假定采用的抽样方式为简单随 机抽样(SRS)。所以,如果样本容量计算公式假定为简单随 机抽样。
分层抽样得到的估计值通常比相同规模的简单随机抽 样更精确,或者至少 一样精确。 整群抽样得到的估计值,其精度通常低于使用同一估 计量进行估计时的简单随机抽样的估计值的精度

第九章抽样与抽样估计优秀课件

第九章抽样与抽样估计优秀课件
3.对普查或全面调查统计资料的质量进行检 查和修正;
4.抽样方法适用于对大量现象的观察,即组 成事物总体的单位数量较多的情况;
5.利用抽样推断的方法,可以对于某种总体 的假设进行检验,判断这种假设的真伪, 以决定取舍。
参数估计 二、抽样推断的内容
假设检验 三、有关抽样的基本概念
(一)总体和样本
总体:也称全及总体。指所要认识的研究对 象全体。总体单位总数用“N”表示。
登记误差 统计误差代表性误差随 系机 统误 性差 误差 实 抽际 样误 平差 均误差
(1)登记性误差,指在调查和汇总过程 中由于测量、登记、计算等方面的差错 或被调查者提供虚假资料而造成的误差。 它在任何调查中均存在。而且调查范围 越大,调查单位越多,产生登记性误差 的可能性也越大。
(2)代表性误差,指样本推断总体时, 由于样本结构与总体结构不一致而产生 的误差。又分系统误差与随机误差两种。
NEXT
总体参数
总体平均数
X
总体成数
P
总体方差
2
总体标准差
样本统计量
样本平均数
x
样本成数
p
样本方差
s2
样本标准差
s
样本统计量 公式
xxn
pn1 n
xx1x2 xn x
n
n
xx1f1f1 x2f2 f2 fxnnfn
xf f
或 x1
f1 fix2
f2 fi xn
fn fi
xf f
样本: 也称抽样总体,是抽出的单位组成 的整体。样本单位总数用“n”表示。
(二)参数和统计量 1、针对总体计算的指标叫总体参数,也叫全及 指标。参数的值是定值
常用的参数有:总体平均数、总体成数P、总体 标准差σ 2、针对样本计算的指标为统计量,也叫估计 量,也叫抽样指标。 其值随样本的不同而不同,是个随机变量。

第六讲-2 样本量确定

第六讲-2  样本量确定
11
深圳土壤风沙尘合理采样数目
深圳
Na Mg Al Si K Ca
分布类型 对 对 对 对 正 正
变异系数(%) 2.3 23.7 2.4 0.5 36.3 58.5
=0.05,K=0.1 1 21 1 1 50 131
=0.05,K=0.2 1
5 1 1 13 33
=0.1,K=0.1 1 15 1 1 36 93
(二)约定式方法
认为某一个约定或数量就是正确的样本容量。但约定式确定样本容量的方法
忽略了与所要进行的研究相关的情况,而且采用约定的样本容量进行研究所
需的费用可能比较高。
如大气颗粒物采样
(三)成本基础法
将成本作为确定样本容量的基础。成本将不是确定样本容量的唯一考虑因素, 但在确定样本容量时也应予必要的考虑。
)S
2
假定两样本标准差相同
t均为不同显著性水平的t值
n1、n2- n1=n2时两个样本的大小
Δ—样本平均值*相对误差(%)
14
两个相关样本的情况
n
(t
t
)Sd
2
n
(t
/2
t
)Sd
2
Sd,样本差别的标准差
15
2
为什么要确定样本量?
4. 取样误差与实验室分析误差比较,通常认为取样 误差更大,因此应更加重视取样方法及取样的代 表性,尤其在微量、痕量组分分析中,取样误差 往往比其它误差来源更重要。
5. 当取样偏差是测量偏差的3倍或更多时,测量偏 差就不重要了。所以,当存在显著的取样偏差时, 任凭用多么精密的仪器,对提高分析结果的准确 性都无济于事。可见,分析全过程中,取样工作 是重要的一环.
=0.1,K=0.2 1

市场调查与分析第十二章 抽样估计与样本容量确定.ppt

市场调查与分析第十二章 抽样估计与样本容量确定.ppt
表示。 ❖ 样本分布是单个样本所有单位的频率分布。样本分
布是已知的。样本均值用 x 表示,标准差用S表示。
❖ 样本均值的抽样分布是从一个特定总体中抽取的给 定容量的所有可能样本的平均值的概率分布。
❖ 总体的分布、样本分布可能不一定是正态分 布,但是根据中心极限定理,样本平均值的 抽样分布必定是正态分布。
❖ 5.置信区间为(34.4-4.9,34.4+4.9)即(29.5, 39.3)
样本量的确定
❖ 在确定概率抽样样本容量的过程中涉及财务、统计 和管理3个方面的问题。在其它条件相同的情况下, 样本越大,抽样误差就越小。但样本越大,耗费的 资金也越多。
❖ 而且,虽然抽样成本随着样本容量的增加呈线性递 增(样本容量增加一倍,成本也增加一倍),抽样 误差却只以相当于相应样本容量增长幅度的平方根 的速度递减。
确定置信区间,然后在点估计的基础上确定 区间估计。
❖ 例:从一个500人的总体中,采用简单随机抽 样抽出一个10人的样本,每个入样单元的年 龄见下表。求平均年龄估计值的抽样方差、 标准差,并计算在95% 的置信水平下的误差 限于相应的置信区间。Leabharlann 样本单元年龄1
21
2
26
3
27
4
32
5
34
6
37
7
38
nN
当总体方差未知时,它可以用下式来估计:
ˆ2 Sˆ2 (1 n)
nN
❖ 设e为误差则:
给定均值精度,计算简单随机抽样样 本量
N
(Yi Y)2
❖ 总体方差的计算公式为:S2 i1 ❖ 对于简单随机样本,S2的一个无N偏估1 计量是:
n
(Yi Y)2
❖ Sˆ 2 i1 n 1

统计学课件第六章抽样调查PPT课件

统计学课件第六章抽样调查PPT课件

特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件

抽样方法与样本量估计ppt课件


x
Nn
n
率的标准 ) :误 Sp(( 1N n)有 p(n 1 1 p 限 ) 总 无 限 体 总 体 p(1n p)
ppt课件完整
31
4 . 1
例1 欲调查某农村小学学生的蛔虫感染率,该校有学生2000人,若取样本例数 100人,试作单纯随机抽样设计。
解:先将全校学生编号:0,1,2,3,…,1999;再用附表17随机数字表,任意 指定某行某列,比如第5行第9列,由此处开始,向右依次抄录随机数字100组,每 组4个数字,凡后面出现与前面相同的数字弃去,如得0873,3732,0405,6930, 1609,0588,…。凡首字≥8者减8,≥6者减6,≥4减4,≥2减2,依次得873,1732, 405,930,1609,588,…。
ppt课件完整
5
抽样调查的特点
特点1:抽取的样本作为一个“代表团”来代表总体。而不是随意 挑选的个别单位代表总体。
特点2:调查样本一般按随机的原则抽取,在总体中每个单位被抽 取的机会相等。因此被抽中的单位在总体中是均匀分布的,不致出 现倾向性误差,代表性强。
特点3:所抽取的调查样本数量是根据误差的要求并经过科学的计 算确定,在调查样本的数量上有可靠保证。
ppt课件完整
18
滚雪球抽样
通常是先选出一组最初的调查对象,通常是随机选出的, 在访谈之后,要求这些被访者推荐一些属于目标总体的其他 人,根据这些推选出后面的被访者。与随机的方式相比,被 推举的人将具备与推荐人更为翔实的人口及心理特征。 优点是:主要目的是估计总体中非常稀少的某些特征。 缺点是:这种方式非常耗时。
ppt课件完整
10
对抽样误差认识与使用的误区
一些研究者甚至部分官员不愿意或不习惯接受数据的误差 范围,一谈到误差,惟恐别人说数据不准,将数据误差绝对。 由于对数据误差的认识存在着误区,在如何使用数据上也存在 着误区。抽样调查的数据拿来就用,不谈抽样误差和调查误差, 认为调查数据就是总体的真值。在进行工作政绩考核或进行地 区间的数据对比时,调查指标数据的高低变成了地区之间排队、 政绩评比的依据,忽视了对数据误差的评估。现有的调查数据 不仅没有正确地使用,反而还带来地区之间数据高低的相互攀 比,同时也影响了以后抽样调查的数据质量。

抽样估计与样本量确定

收入层次 高收入层 中收入层 低收入层 各层单位数 2000 12000 6000 样本数量 33.3 133.3 33.3 设计权数 wd,1=N1/n1=2000/33.3=60.1 wd,2=N2/n2=12000/133.3=90.0 wd,3=N3/n3=6000/33.3=180.2
4
調查分析預測
步骤1:各层的设计权数为: 城市层 wd,1=N1/n1==5 农村层 wd,2=N2/n2==2 步骤2:调整以弥补无回答。各层的无回答调整因子计算如下: 城市层:n1 / nr,1==200/150==1.33 农村层:n2 / nr,2==50/40==1.25 步骤3:无回答的调整权数等于设计权数与无回答调整因子的乘积:
城市层:
农村层:
w nr,1 w d,1
w nr,2
n1 5 1.33 6.67 n r,1 n w d,2 2 2 1.25 2.5 n r,2
8
調查分析預測
MRAF
使用辅助信息调整权数
• 为什么要使用辅助信息来调整权数呢?
– 首先,使调查的估计值与已知总体总值相匹配。例如, 使用最新的人口普查数据来调整估计值,以确保这些 估计值(如年龄、性别分布等)的一致性。 – 二是为了提高估计值的精度。将辅助信息与抽样设计 相结合,将有助于提高估计的精度。
[例10.5] 计算过程
步骤 1:设计权数是入样概率的倒数,设计权数计算如下: wd=N/n=780/100=7.8 步骤 2:利用设计权数,计算得到调查估计值,如表10-4所示。 估计公司男女性职员各有429名和351名,且吸烟比例不同。 假定调查完成后,得到如下辅助信息:该公司实际共有360名男 性职员和420名女性职员。如何利用这个辅助信息呢? 步骤 3:对样本分层,计算事后分层权数用于估计。 事后分层权数W pst是事后层的辅助变量总和除以该层回答单元的 数量。 N 男性 360 w 6.55 其中,男性的事后分层权数为: pst ,男性 n r,男性 55 女性的事后分层权数为:w pst ,女性

抽样及样本含量估计

10 0.792495 8 0.708996 1 0.704446 2 0.566829
11 0.358031 7 0.297145 6 0.251854 3 0.009253
样本估计和总体参数
对于简单随机抽样,可以用样本均数来估计总 体均数
简单随机抽样的特点
优点: (1)比较容易理解和掌握;(2)抽样框不需要其他辅
以95%的可信度,估计有效成分含量的均值在真值的 10%范围内,需要多大的样本?
222=277.56≈278 22/(2.25*10%)2=54.38≈55
简单随机抽样样本量估计是其他概率抽样方法样本 量估计的基础
其他概率抽样样本量估计可以用简单随机抽样样本 量乘以设计效应deff
如多阶段抽样deff范围约在1.3~3之间
简单随机抽样样本量估计(总体参数 为均数)
2
2
u n
/2 2
2: 总 体 的 方 差 , 根 据 预 试 验 估 计
= x
当用相对容许误差 ( 与 总 体 均 数 相 差 不 超 过 真 值 的 (% ) ) 表 示 时 , 则 =
举例:抽样调查时估计总体均数时
以α=0.05,估计有效成分含量的均值在真值的± 0.10范 围内,需要调查多少样本?
抽样框中应该有抽样单元名称和地理位置的信息,以便 研究人员能找到被选中的单元.
好的抽样框不仅与目标总体保持一致,而且还尽可能的 提供与研究的目标量有关的辅助信息。
年龄、性别等
举例:
居委会住户名单
抽样的类型
概率抽样 按一定的概率以随机原则抽取样本 概率抽样中抽样框是关键 抽中的概率已知 当用样本对总体目标进行估计时,要考虑到该样本被抽中 的概率 “概率抽样”不等于“等概率抽样”

MRAF-C10 抽样估计与样本量确定

• 点估计是容易做到的,但是,点估计没有 给出估计值接近总体参数程度的信息。
• 当样本均值与总体均值不全相同时,样 本均值与实际总体均值就存在着差距,形 成抽样误差。
16
調查分析預測
MRAF
总体参数的区间估计
• 区间估计:在点估计的基础上,对总体参数的区 间或范围进行估计。
• 区间估计不仅要说明区间大小,还要说明点估计 值在区间内的概率,即置信度。置信度是一个百 分比,用来说明结果正确的长期概率。被估计的 区间则被称为置信区间。
27
調查分析預測
MRAF
设计权数的调整
• 上述等概率抽样的加权和不等概率抽样的 加权都是加权的基本形式。
• 权数估计常会遇到更真实和复杂的情况:
– 考虑无回答的情况,然后对权数做出调整;
– 考虑来自其他渠道的、更具权威性的某些辅助 信息,将它们合并到权数中。
28
調查分析預測
MRAF
对无回答的权数调整
– 另外, PPS等也可以设计为一个自加权抽样。
• 对于自加权抽样设计,如果无需对权数调整, 则在计算比例、均值等估计量时可将其忽略, 对总值估计也仅需将样本总值乘上某个倍数。 (例P215)
26
調查分析預測
MRAF
不等概率抽样的加权
• 自加权设计并不总是可行的。如,在使用分层抽样进行 一个全国调查时,可能需要采用纽曼分层。
18
調查分析預測
MRAF
训练题
• 5.一家电器连锁商店正在进行空调的季节性降价促销。被抽取的10个 样本商店销售出的空调数量如下(单位:台):82,113,2,41, 71,83,99,52,84,30。那么,根据这些数据能否说明这次促销 期间每家商店平均销售空调数量多于50台(95%)?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 当所采用的抽样设计不是等概率时,正确地使用设计权 数就显得尤为重要。
• [例10.2] 有关各层总体数和样本数资料见表10-1。对 于这项调查,被调查者的设计权数是多少呢?
收入层次 高收入层 中收入层 低收入层
各层单位数 2000 12000 6000
样本数量 33.3 133.3 33.3
设计权数 wd,1=N1/n1=2000/33.3=60.1 wd,2=N2/n2=12000/133.3=90.0 wd,3=N3/n3=6000/33.3=180.2
– 设计权数×无回答调整因子=无回答的调整权数
• 无回答调整因子是原样本单元的权数和与给出回答的 单元的权数和的比值。对于自加权设计,该比值可用 原样本的单元数与给出回答的单元数的比值来表示。
• 无回答权数调整应区分两种不同情况:
– 等概率抽样 – 不等概率抽样
对无回答的权数调整(SRS)
ቤተ መጻሕፍቲ ባይዱ
• [例10.3] 从一个 N=100人的总体 中抽取一个n=25 人的简单随机样本。 记回答单元的数量 为nr,结果显示只 有20个人提供了所 需的信息。那么, 此时无回答的调整
抽样估计与样本量 确定
10.1 引言
• 估计就是根据从样本中收集的信息对 总体未知量进行推断的过程。
• 抽样估计涉及的重要问题:
– 一个样本单元的设计权数问题。 – 抽样估计,包括总体总量、均值和比例以及抽
样误差的估计。 – 样本量的确定构成抽样设计程序的重要步骤和
内容。同时,样本量的确定与样本估计值的精 度密不可分。
– 另外, PPS等也可以设计为一个自加权抽样。
• 对于自加权抽样设计,如果无需对权数调整, 则在计算比例、均值等估计量时可将其忽略, 对总值估计也仅需将样本总值乘上某个倍数。 (例P215)
不等概率抽样的加权
• 自加权设计并不总是可行的。如,在使用分层抽样进行 一个全国调查时,可能需要采用纽曼分层。
总体大小 样本量
回答者数量
N1=1000 N2=100
n1=200 n2=50
nr,1=150 nr,2=40
步骤1:各层的设计权数为: 城市层 wd,1=N1/n1==5 农村层 wd,2=N2/n2==2
步骤2:调整以弥补无回答。各层的无回答调整因子计算如下: 城市层:n1 / nr,1==200/150==1.33 农村层:n2 / nr,2==50/40==1.25
• 在收集有关吸烟习惯信息时,收集 了每个回答者的年龄和性别情况, 且100人都做出了回答,由此得到
样本数据的分布如表10-3所示:
[例10.5] 计算过程
步骤1:设计权数是入样概率的倒数,设计权数计算如下:
wd=N/n=780/100=7.8
步骤2:利用设计权数,计算得到调查估计值,如表10-4所示。
权数是多少?
步骤1:计算设计权数。 入样概率p为:P=n/N=25/100=1/4 故,每个样本单元的设计权数为4。
步骤2:计算无回答调整因子。 由于在n=25人中只有nr=20人提供了
所需的信息,最终样本量应为20。假定回 答单元不仅能代表回答单元且能代表无回 答单元,计算无回答调整因子为:
n / nr = 25/20 = 1.25 步骤3:计算无回答的调整权数。
无回答的调整权数wnr等于设计权数与 无回答调整因子的乘积:
wnrwdnnr 41.255
对无回答的权数调整(STR)
• [例10.4] 对于一项公共交通
系统调查,总体由1100人组成, 层 并按城乡分为两个层。分层及 样本数据如表10-2所示。那么, 城市
回答者的权数是多少?
农村
表10-2 公交系统调查的分层数据
10.2 加权及权数调整
• 设计权数
– 设计权数是指每个样本单元所代表的调查总体的单元 数,它是由抽样设计所决定的,通常以wd表示。确定 设计权数是估计的第一步。
• 加权估计
– 设计权数其实就是样本单元的入样概率的倒数。假如 入样概率是1/10,那么每个入选样本代表总体中的10 个单元,此时设计权数即为10。
步骤3:无回答的调整权数等于设计权数与无回答调整因子的乘积:
城市层: 农村层:
wnr, 1 wd, 1nnr1, 151.336.67 wnr, 2 wd,2nnr2,221.252.5
使用辅助信息调整权数
• 为什么要使用辅助信息来调整权数呢?
– 首先,使调查的估计值与已知总体总值相匹配。例如, 使用最新的人口普查数据来调整估计值,以确保这些 估计值(如年龄、性别分布等)的一致性。
– 二是为了提高估计值的精度。将辅助信息与抽样设计 相结合,将有助于提高估计的精度。
• 要想在调查设计阶段使用辅助信息,抽样框中的所有单元都 必须具备这个辅助信息。否则,就只能在数据收集上来后, 在估计阶段利用辅助信息提高估计值的精度。
使用辅助信息调整权数
• [例10.5] 为得到某公司职员是否 有吸烟习惯的信息,进行了一项调 查。从N=780人的名录中抽出了 一个n=100人的简单随机样本。
– 不同样本单元的设计权数可能不同,这取决于抽样设 计。因此,加权估计应区分等概率抽样的加权和不等 概率抽样的加权。
等概率抽样的加权
• 当每个单元都有相同的入样概率时,所有样 本单元的设计权数都相同,这种抽样就是自 加权设计。
– SRS抽样和SYS抽样都属于自加权设计,比例分 层抽样也是自加权设计。
估计公司男女性职员各有429名和351名,且吸烟比例不同。
假定调查完成后,得到如下辅助信息:该公司实际共有360名男
性职员和420名女性职员。如何利用这个辅助信息呢?
步骤3:对样本分层,计算事后分层权数用于估计。
事后分层权数Wpst是事后层的辅助变量总和除以该层回答单元的
设计权数的调整
• 上述等概率抽样的加权和不等概率抽样的 加权都是加权的基本形式。
• 权数估计常会遇到更真实和复杂的情况:
– 考虑无回答的情况,然后对权数做出调整; – 考虑来自其他渠道的、更具权威性的某些辅助
信息,将它们合并到权数中。
对无回答的权数调整
• 单元无回答是指一个样本单元几乎所有的数据都缺失。 简单的处理办法是忽略它。然而,如果发现忽略单元 无回答是不适当的,则应该对权数进行调整。即,
相关文档
最新文档