第(11)章如何选取样本.

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2、判断抽样
判断抽样:是按照调研设计者的主观判断选取调 查单位组成样本的一种抽样方法。应用前提是, 调研设计的必须以对调查总体的有关特征相当了 解,或者可以依靠专家判断来决定样本。 在判断抽样中,样本单位的选取通常分为两种情 况: 第一种情况是,选择最能代表普遍情况的调查对 象,即选取“多数型”、或“平均型”的样本作 为调查对象。 第二种情况是,选择那些异乎寻常的个案,目的 是调查造成异常的原因。
分层抽样和整群抽样的不同之处
操作的群体不同,分层抽样操作的是分层群体 ,而整群抽样操作的是子群体; 适用的总体不同,分层抽样适用于容易按属性 差异进行群体划分的总体,而整群抽样适用于 不容易按属性差异但容易按可见标志进行群体 划分的总体。
非概率抽样
1、便利抽样 2、判断抽样 3、推荐抽样 4、配额抽样
等比例分层抽样

等比例分层抽样是按各层中的个体数量占 总体数量的比例分配各层的样本数量。 这种方法简单易行,分配合理,计算方便 ,适用于各类型之间的个数差异不大的分类抽 样调查。
不等比例分层抽样

不等比例分层抽样不提按照各层中个体数 占总体数的比例分配样本个体,而是根据其他 因素,调整各层的样本数。 不等比例分层抽样适用于各类总体的个数 相差很大的情况。
实际结果
37%
61%

这项全国瞩目的民意调查得出了完全错误 的结论,《文学摘要》也因此关门倒闭。 为什么会出现这样严重的错误?

一个原因是抽样框架主要是根据电话号码 簿和汽车登记册建立的。 在1936年,拥有汽车或电话的这些人显然 是富裕的美国人,这些人大多是共和党的坚定 支持者,而大多数投票选民既不拥有电话,也 不拥有汽车。 另一个问题可能是由于无回答引起的偏倚 ——总共寄出了一千多万份的问卷,但是返回 的问卷不足25%。
图示
12-17
两种抽样方法的特点
概率抽样的特点 因为样本个体是随机选择的,所以可确定样本估计值 的精确度,计算包含给定确定程度的真实总体值的置 信区间,并对样本所在的目标总体做出推论。概率抽 样技术本身操作起来相对复杂,成本较高,对抽样设 计和现场抽人员的专业技术要求也高。 非概率抽样的特点 最大特点是操作简便,时效快,成本低。非概率样本 可以产生对总体特征很好的估计,但是,无法对样本 结果的精确度做出客观评价。
概率抽样
1、简单随机抽样 2、系统抽样 3、整群抽样 4、分层抽样
1、简单随机抽样
简单随机抽样:在简单随机抽样中,总体中所 有的成员被选为样本的概率是相等的。 简单随机抽样即完全按照随机的原则来抽取样 本。 最常见的有抽签法和随机数表法。

简单随机抽样的优点: 最简单、最典型的概率抽样技术,易于理解; 抽样框不需要其他(辅助)信息就能进行抽样; 样本结果可以推论到目标总体上,大多数统计 推论方法都假定数据是由简单随机抽样方法收 集的。

美国空军请来数学家亚伯拉罕· 沃尔德。 数学家沃尔德的方法十分简单。他把统计表 发给地勤技师,让他们把飞机上中弹弹孔的位置 报上来。他自己铺开一张大纸,画出轰炸机的轮 廓,再把那些小窟窿一个个地填上去。 画完后大家一看,飞机浑身上下都是窟窿, 只有飞行员座舱和尾翼两个地方几乎是空白。 为什么是这样? 防弹钢板应该焊在哪里呢?
整群抽样的适用条件: 整群抽样比较适用于适用群体内各单位间 的误差较大,而各群之间的差异较小的情况。 另一种适用情况:工业抽样 例如:对工业产品进行质量调查时,每隔五个 小时,抽取一个小时的产品进行检查。
4、分层抽样
分层抽样:指将调查总体中的所有单位按照一 定的属性或特征分成不相重叠的若干层次(或 类),然后在每一个层次(或类)中进行简单随 机抽样或等距抽样。 抽样程序: 1)确定分层变量 2)分层 3)确定各层的样本量 4)在各层内部进行抽样

上面两个案例都涉及同一个重要问题—抽 样问题。 但是,处理方式不同,导致两种完全不同 的结果—一个有效地解决了问题,另一个则被 问题所拖累,破产倒闭了。
样本和抽样的基本概念
1、总体 2、普查 3、样本和样本单位 4、抽样框和抽样框误差 5、抽样误差
什么是抽样?
抽样:是根据一定的规则和程序,从研究总体中抽取其 中的一部分样本来代表总体的过程。
wenku.baidu.com
排列调查总体单位时所依的标准有两种: 一种是按与调查项目无关的标志排队。例如: 在住户调查时,选择住户可以按住户所在街区 的门牌号码排队,然后每隔若干个号码抽选一 户进行调查; 另一种是按与调查项目有关标志排队。例如: 住户调查时,可按住户平均月收入排队,再进 行抽选。
总体单位的排序决定着系统抽样的代表性,并 决定系统抽样调查结果的统计效率,分三种情 况说明: 如果排序与要研究的特征无关,则结果与简单 随机抽样相似; 当排序与要研究的特征有关时,系统抽样能增 加样本的代表性。 若排序呈现循环形式,抽样间距又与循环周期 相同时,系统抽样会降低样本的代表性。
简单随机抽样的局限性: (1)采用简单随机抽样,一般必须对总体各单 位加以编号,而实际所需调查总体往往是十分 庞大的,单位非常多,逐一编号几乎是不可能 的; (2)在总体单位数不清楚的情况下,无法采用 简单随机抽样;
(3)当总体各单位差异较大时,采用简单随 机抽样抽出的样本可能会集中于某类单位,不 能做到在各种类型的单位中较为均匀分布,其 样本的代表性就比较差; (4)采用简单随机抽样抽出的样本分布较为 分散,实地调查消耗的人力、物力、费用较大 ;
分层抽样的适用条件: 分层抽样比较适用于总体由差异明显的几 个层次组成且层内差异较小进行的抽样。
分层抽样和整群抽样的相同之处
都是先对总体中的群体再对个体进行操作; 都不是完全随机地抽取样本,都涉及一定的规则 :分层随机抽样涉及的规则是分层群体之间属性 的差异,而整群随机抽样涉及的规则是子群体之 间的相似; 都能提高随机抽样的效率和改善随机抽样的结果 。
系统抽样的适用条件: 系统抽样比较适用于总体中个体数目较多 ,且个体之间有明显差异进行的抽样。
3、整群抽样
整群抽样:指首先将调查总体区分为若干 群,然后采用简单随机方法抽出部分群作样本 ,最后对这些样本群进行全面调查---即两段整 群抽样。 在两段整群抽样中,如果不对所抽样本群 进行全面调查,而是进一步将这些群划分为若 干小群,然后按照随机原则抽出一部分群进行 全面调查,就形成所谓的三段整群抽样。
例如:从600名大学生中抽选50名大学生进行调 查,可以利用学校现有的名册顺序按编号排队 ,从第1号编至600号。 抽选距离 = N/n = 600/50 = 12人 如从第一个12人中用简单随机抽样方式,抽取 第一个样本单位,如抽到的是8号,依次抽出的 是20号、32号、44号……。
为何抽样
首先,从成本的角度看,抽样比普查更优越; 其次,专业调研公司或调研人员不可能分析处 理由普查产生的大量数据。
两种基本的抽样方法
概率抽样:样本设计采取随机的办法,排除研 究人员主观因素的干扰,使样本总体中的每一 个成员都有一个事先确定好抽中概率。 非概率抽样:样本设计依赖于研究人员的个人 判断而非随机原则选择样本个体,事先并不确 定每个样本单位被抽中的概率。

整群抽样以群体为单位进行抽选,抽选单位 比较集中,明显得影响了样本分布的均衡性。 因此,整群抽样与其他抽样比较,在抽样单 位数目相同的条件下抽差误差较大,代表性较低 ,在抽样调查实践中,采用整群抽样技术一般都 要比其他抽样技术抽选更多的单位,以降低抽样 误差,提高抽样结果的准确程度。 当然,整群抽样的可靠程度主要还是取决于 群与群之间的差异的大小,当各群间差异较小时 ,整群抽样的调查结果就越准确。 因此,在大规模的市场调查中,当群体内各 单位间的误差较大,而各群之间的差异较小时, 最适宜采用整群抽样方式。

(二) 《文学摘要》的厄运

在1936年美国总统选举中,由《文学摘要 》杂志组织了一项民意调查,这项民意调查动 用了大量的人力物力进行调查。 在调查的基础上,该杂志预测共和党候选 人阿尔夫•伦敦将击败在任总统富兰克林•罗斯 福,这个预测准不准呢?
阿尔夫•伦敦 预测结果 55%
富兰克林•罗斯福 41%
第11章
如何选取样本
兔年春晚调查
1、您今年收看了中央电视台春节联欢晚会了吗? A、看了 B、没看 2、如果你收看了,请问您对兔年春晚的评价如何 ? A、满意 B、一般 C、不满意
春晚满意度调查数据
央视市场研究股份有限公司的调查结果是:在全国 收看电视的家庭中,有93.88%的家庭收看了中央电视台 春节联欢晚会,有 81.92%的受访者认为今年中央电视 台春节联欢晚会办得好。 腾讯网对春晚满意度调查结果显示:有38.47%的网 友给春晚打出了60-80分,而有43%的人认为今年春晚表 现不及格。 在1万多人参与的微博小秘书发起的调查中,对兔年 春晚表示“满意”的只有6%,认为“一般”的有25%, 还有59%的人表示“失望”,10%的人“没看”。
【教学目标】
熟悉抽样设计的术语 了解概率抽样与非概率抽样方法的区别 了解如何使用四种概率抽样 了解如何使用四种非概率抽样 掌握不同类型抽样技能 能够制定一份抽样计划
开篇案例:两种抽样两种命运
(一)防弹钢板应焊在哪里? 第二次世界大战后期,美军对德国和日本 展开了大规模战略轰炸,每天都有成千架轰炸 机呼啸而去,返回时则往往伤亡惨重。 美国空军对此十分头痛:如果要降低损失 ,就要往飞机上焊防弹钢板;但是飞机焊上防 弹钢板后,速度、航程、载弹量都会受影响, 同样也会影响轰炸机安全返航。 这是一个两难选择,怎么办呢?
分层抽样的必要性
设计抽样方法时,最核心的问题是考虑如何使 抽取的具有代表性,为此在设计抽样方法时, 我们应考虑如何利用已有的总体。 例如:调查高一学生平均身高 由经验知,男同学一般要比女同学高,这时就 要采用分层抽样,因为简单随机抽样或系统抽 样都有可能产生部分是男生(或女生)或全部 是男生(或女生)的样本,这样的样本是不能 代表总体的。

有人会问,81.92%的受访者满意和43%的 人认为不及格,我们相信谁? 应该说,我们都没有绝对相信的理由,因 为我们不能确知调查的科学性。例如,由央视 自己调查自己的成绩,本身就缺乏公信力;其 次,调查方法我们也不知道,包括样本如何选 择、问题如何设置都会直接影响到调查结果。 因此,我们与其相信调查数据,还如靠自 己的判断。
沃尔德告诉大家,从数学家的眼光来看,这 张图明显不符合概率分布的规律,而明显违反规 律的地方往往就是问题的关键。 飞行员最终明白了数学家沃尔德这套做法的 意义。如果飞行员座舱中弹,飞行员就完了;如 果飞机尾翼中弹,飞机失去平衡就会坠落—这两 处中弹,轰炸机多半就会掉下来了,难怪顺利返 航的轰炸机只有这两处几乎没有弹孔。 结论很简单,只需给这两个部位焊上防弹钢 板就可以了,一个两难的难题就这样解决了。
1、便利抽样
便利抽样:就是依据方便原则抽取样本,对抽 样单位的选择主要是由调查人员完成,通常被 访者由于碰巧在适当的时间出现在适当的地点 而被选中。 例如: “街头拦人法”是在街上或路口任意找某个行 人,将其作为被调查者进行调查。 利用客户的名单进行调查 将问卷登在宣传媒体上,被调查者自填后寄回
简单随机抽样的适用条件: 简单随机抽样比较适用于总体单位数不多 ,且内部差异不大的情况下进行的抽样。
简单随机抽样在实践中的应用
1、随机数字拨号 2、计算机随机抽样
2、系统抽样
系统抽样:也叫等距抽样或机械抽样,它是将 调查总体单位按照一定标志进行顺序排列,然 后根据总体单位数和样本单位数计算出抽样间 距(k),并从抽样框中每隔k个单位抽选一个个 体,组成样本。 抽样间距(k)=总体单位数(N)/样本单位 数(n)
相关文档
最新文档