第四章抽样调查
(完整版)抽样调查习题及答案

第四章习题抽样调查一、填空题1.抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2.采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)……(N-N+1)。
3.只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。
4.参数估计有两种形式:一是点估计,二是区间估计。
5.判别估计量优良性的三个准则是:无偏性、一致性和有效性。
6.我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。
7.常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8.对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩小一半,抽样单位数必须为原来的4倍。
若Δ扩大一倍,则抽样单位数为原来的1/4。
9.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。
二、判断题1.抽样误差是抽样调查中无法避免的误差。
(√)2.抽样误差的产生是由于破坏了随机原则所造成的。
(×)3.重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。
(√)4.在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
(√)5.抽样调查所遵循的基本原则是可靠性原则。
(×)6.样本指标是一个客观存在的常数。
(×)7.全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。
(×)8.抽样平均误差就是抽样平均数的标准差。
(×)三、单项选择题1.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C)A.2倍B.3倍C.4倍D.5倍2.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D)A.分层抽样B.简单随机抽样C.整群抽样D.等距抽样3.计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B)A.最小一个B.最大一个C.中间一个D.平均值4.抽样误差是指(D)A.计算过程中产生的误差B.调查中产生的登记性误差C.调查中产生的系统性误差D.随机性的代表性误差5.抽样成数是一个(A)A.结构相对数B.比例相对数C.比较相对数D.强度相对数6.成数和成数方差的关系是(C)A.成数越接近于0,成数方差越大B.成数越接近于1,成数方差越大C.成数越接近于0.5,成数方差越大D.成数越接近于0.25,成数方差越大7.整群抽样是对被抽中的群作全面调查,所以整群抽样是(B)A.全面调查B.非全面调查C.一次性调查D.经常性调查8.对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)A. 4%B. 4.13%C. 9.18%D. 8.26%9.根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(B)A.甲产品大B.乙产品大C.相等D.无法判断10.抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B)A.甲企业较大B.乙企业较大C.不能作出结论D.相同四、多项选择题抽样调查中的抽样误差是(ABCDE)A.是不可避免要产生的B.是可以通过改进调查方法来避免的C.是可以计算出来的D.只能在调查结果之后才能计算E.其大小是可以控制的2.重复抽样的特点是(AC)A.各次抽选相互影响B.各次抽选互不影响C.每次抽选时,总体单位数始终不变D每次抽选时,总体单位数逐渐减少E.各单位被抽中的机会在各次抽选中相等3.抽样调查所需的样本容量取决于(ABE)A.总体中各单位标志间的变异程度B.允许误差C.样本个数D.置信度E.抽样方法4.分层抽样误差的大小取决于(BCD)A.各组样本容量占总体比重的分配状况B.各组间的标志变异程度C.样本容量的大小D.各组内标志值的变异程度E.总体标志值的变异程度5.在抽样调查中(ACD)A.全及指标是唯一确定的B.样本指标是唯一确定的C.全及总体是唯一确定的D.样本指标是随机变量E.全及指标是随机变量五、名词解释1.抽样推断2.抽样误差3.重复抽样与不重复抽样4.区间估计六、计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
第4章__抽样调查

4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章:抽样调查技术

分层 或
分类
在每一层 或类中 分配样本数
在每一层 或类中 进行简单 随机抽样
22
• 两种两种样本数分配方法:
1、等比例分层随机抽样
• 例:某居住小区有100户人家,其中高收入 户20户、中等收入户50家、低收入户30家。 计划抽10户,
• 由高的应抽2户、中的应抽5户、低的应抽3 户。
• 思考:上述案例中采用此种方法合理吗? 为什么?
第二章:抽样调查技术P90
• 主要学习内容 • 补充:全面市场调查
补充:典型和重点市场调查方式 • 随机抽样市场调查方式 • 非随机抽样技术 • 抽样误差
1
第一节 全面市场调查
一、概念、特征、适用情况
• 1、概念: • 为了搜集比较全面、精确的调查资料,对调查
对象(总体)的全部样本所进行的逐一的、无 遗漏的专门调查。
择。
4
三、全面调查的具体做法
• 1、向每一个调查样本发放调查表,由对方 按规定填报。
• 小提示:适合于谁对谁的调查呢?
• 2、调查人员按照调查项目的要求,对调查 对象进行访问或观察。
• 小提示:适用于谁对谁的调查呢?
5
• 3、借用机关、团体、企业等单位的统计资料, 再进行汇总
• 4、搭便车。利用国家或地方、部门所组织的普 查机会,搜集自己的资料。
6
第二节 典型和重点市场调查方式
一、典型调查方式
• 1、含义 • 对调查对象作全面分析、比较的基础上,有意识
地选择少数具有代表性的样本作为典型,对其进 行比较系统、深入的专门调查。“解剖麻雀”
7
•2、特点 •优点: •1)可节省工作量和费用 •2)可和研究结合起来,揭示事物的内在规律。
第四章 抽样

主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
现代社会调查 第四章 抽样

2.抽样的一般程序 2.抽样的一般程序
界定总体 制定抽样框
决定抽样方案 实际抽取样本 评估样本质量
14
2.抽样的一般程序 2.抽样的一般程序
界定总体 制定抽样框
明确界定总体是确保样本 代表性的重要前提
当存在多阶段抽样时, 当存在多阶段抽样时,需 分别编制不同的抽样框
决定抽样方案
是对样本的质量、 样本评估 是对样本的质量、代表 性、偏差等进行初步的检验和衡量
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
系统抽样的注意事项: 系统抽样的一个十分重要的前提条件,是总体中个体 的排列,相对于研究的变量来说,应是随机的 相对于研究的变量来说, 相对于研究的变量来说 应是随机的,即不存在 某种与研究变量相关的规则分布。否则,系统抽样的结果 将会产生极大的偏差。 两种可能导致偏差的情况: (1)个体的排列有次序的先后,等级上高低的情况; (2)总体名单中,个体的排列与抽样间隔有相对应的周 期分布。
当抽样间距(K=N/n)不是整数时怎么办? 不是整数时怎么办? 当抽样间距 不是整数时怎么办
25
当抽样间距(K=N/n)不是整数时: 当抽样间距(K=N/n)不是整数时: (K=N/n)不是整数时
循环等距抽样法 A+K A A+2K A+3K A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
16
二、概率抽样及其方法
概率抽样的类型: 概率抽样的类型: 的类型
第四章 抽样调查

抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
第四章 抽样技术

• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四节抽样调查

共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
平均亩产量在345—355公斤之间的把握程度为56.62%。现在将
允许误差扩大到10公斤,即总体平均数在340—360公斤之间,
则概率度为:
t x
x X
340 360
1.6
x
x
6.25
查《正态概率表》,当t=1.6时,估计置信度t)=0.8904时即 总体平均亩产量在340—360公斤之间的把握程度为89.04%。
如上例粮食平均亩产,也可以作如下区间估计, 即以89.04%的概率保证,总体平均亩产在 340—360公斤之间。
估计置信度
=89.04%,显著水平 =1-
89.04%=10.96%,它表示总体平均亩产落在340—
360公斤区间内有89.04%的把握程度(概率),而不
落在这个区间内的概率为10.96%,因此作上述区间
(1)调查样本是按随机的原则抽取的,在总体中每一个单
位被抽取的机会是均等的,因此,能够保误差,代表性强。
(2)是以抽取的全部样本单位作为一个“代表团”,用整
个“代表团”来代表总体。而不是用随意挑选的个别单位代
表总体。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求, 经过科学的计算确定的,在调查样本的数量上有可 靠的保证。
置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
例如,设样本粮食平均亩产量为350公斤,又知抽样平均误差为 6.25公斤,求总体粮食平均亩产量在345—355公斤之间的估计置 信度是多少。根据公式:
t x
x X
345 355
0.8
x
x
6.25
查《正态概率表》,当t=0.8时,估计置信度(t)=0.5662. 即总体
第二节 概率抽样的原理与程序
抽样框就是所有总体单位的集合,是总体的 数据目录或全部总体单位的名单。
理想的完整抽样框应具备以下几个条件: 1.包含尽可能多的样本单位,而且总体是清
晰的,易确定的。 2.所有样本单位出现在这一集合中的概率相
等。 3. 有时可以按照一定原则方法进行人为的假
定。
第二节 概率抽样的原理与程序
第二节 概率抽样的原理与程序
抽样的基本术语 抽样单位(Sampling Unit)就 是一次直接的抽样所使用的基本单位。
抽样框(Sampling Frame)也叫抽样范围是指 一次抽样时总体中所有抽样单位的名单。 参 数值(Parameter)也称总体值,是关于总体中 某一变量的综合描述,或者说是总体中所有 元素的某种特征的综合数量表现。
第一节 抽样的意义与作用
抽样调查优缺点
优点
缺点
费用低,易广泛应用
方案设计比较复杂
质量可控,可信度高
对设计人员的要求较高
时间短,收效快
第二节 概率抽样的原理与程序
一、抽样的基本术语 总体(population)总体通常与构成它的元素(element)
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第一节 抽样的意义与作用
二、抽样调查的特点 抽样调查与普查相比具有如下特点: 调查费用
较低、速度快、应用范围广、可获得内容丰 富的资料、准确性高。
第一节 抽样的意义与作用
三、抽样调查的理论依据
抽样调查数据之所以能用来代表和推算总体,主要是因为抽 样调查本身具有其它非全面调查所不具备的特点,主要是:
估计就必须冒不超过10.96%概率的失败风险。显著
第四章 抽样调查
抽样使我们能从总体具有代表性的部分样本 中获取数据,从而可以得到关于整个总体的 有效结论。
———[英]托尼·普罗科特
第一节 抽样的意义与作用
一、抽样调查的概念
抽样调查就是从研究对象的总体中选择一部 分代表加以调查研究,然后用所得的结果推 论总体特征,从总体中选取部分代表的过程 就是抽样,所选取的这一部分代表就称为样 本。
(4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。
基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
第一节 抽样的意义与作用
四,误差(?)
与其它调查一样,抽样调查也会遇到调查的误差和 偏误问题。通常抽样调查的误差有两种:一种是工 作误差(也称登记误差或调查误差),一种是代表 性误差(也称抽样误差)。
第四章 抽样调查
知识点 1、抽样及其相关概念; 2、抽样的类型; 3、概率抽样的基本原理; 4、抽样的一般程序; 5、简单随机抽样、系统抽样、分层抽样、整群抽样、多段
抽样、PPS抽样、户内抽样的含义与特点; 6、偶遇抽样、判断抽样、定额抽样、雪球抽样的含义与特
点; 7、样本规模的确定方法; 8、影响抽样误差的因素; 9、样本规模与抽样误差的关系。
统计值(Statistic)也称为样本值,它是关于样本中某 一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。
置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。
但是,抽样调查可以通过抽样设计,通过计算并采 用一系列科学的方法,把代表性误差控制在允许的 范围之内;另外,由于调查单位少,代表性强,所 需调查人员少,工作误差比全面调查要小。特别是 在总体包括的调查单位较多的情况下,抽样调查结 果的准确性一般高于全面调查。
第一节 抽样的意义与作用
五,抽样的作用 提供由部分认识总体的途径和手段 例子:一勺汤,一滴血 民意测验。1984美国总统选举P.59