社会调查与统计 第四章 抽样..
合集下载
抽样的基本概念1:总体、样本、抽样、抽样单位、抽样框

《社会调查与统计分析》
第四章 抽样
知识点1 抽样的基本概念1
总体、样本、抽样、抽样单位、抽样框
学习导航
抽样的基本概念 总体 样本 抽样 抽样单位 抽样框
抽样的推断
样本 400人
研究结果
抽样的基本概念
抽样(sampling)就是从总体中按照一定方 式抽取样本的过程。
总体用N表示,样本用n表示。
抽样的基本概念
抽样单位(Sampling Unit):一次直接抽样所使用 的基本单位。
调查1000名大学生的价值 观念 元素:每一个大学生 抽样单位:每一个大学生
调查1000名大学生的价值 观念(直接从200个班级中 抽取40个班级) 元素:每一个大学生 抽样单位:班级
抽样的基本概念
总体(Population):构成它的所有元素(Element) 的集合。
调查某市大学生的价值观念 总体:该市所有的在校大学 生
调查某城市居民的家庭生活 质量 总体:该市所有居民家庭
元素:每一个大学生
元素:每一户家庭
样本(Sample):从总体中按一定方式抽取出的一部 分元素的集合。
选民的地址与姓名大都取自于电话簿与汽车俱乐部会 员名单
THE END
谢 谢 观 看!
抽样框(Sampling Frame):又称作抽样范围,一 次直接抽样中总体中所有抽样单位的名单。
抽样框的经典例子
《文学摘要》杂志在1920年、1924年、1928年和1932 年,以邮寄明信片的方式对美国总统大选,进行了民 意测验,并准确预测出这4次选举的结果。当1936年总 统大选来临时,杂志回收了200多万份明信片。测验结 果显示57%的人支持共和党的候选人兰登,民主党候 选人、在任总统罗斯福的支持率为43%。然而,两星 期后的选举结果,罗斯福以62%的得票率当选。杂志 因此声誉扫地,不久就关门大吉了。
第四章 抽样
知识点1 抽样的基本概念1
总体、样本、抽样、抽样单位、抽样框
学习导航
抽样的基本概念 总体 样本 抽样 抽样单位 抽样框
抽样的推断
样本 400人
研究结果
抽样的基本概念
抽样(sampling)就是从总体中按照一定方 式抽取样本的过程。
总体用N表示,样本用n表示。
抽样的基本概念
抽样单位(Sampling Unit):一次直接抽样所使用 的基本单位。
调查1000名大学生的价值 观念 元素:每一个大学生 抽样单位:每一个大学生
调查1000名大学生的价值 观念(直接从200个班级中 抽取40个班级) 元素:每一个大学生 抽样单位:班级
抽样的基本概念
总体(Population):构成它的所有元素(Element) 的集合。
调查某市大学生的价值观念 总体:该市所有的在校大学 生
调查某城市居民的家庭生活 质量 总体:该市所有居民家庭
元素:每一个大学生
元素:每一户家庭
样本(Sample):从总体中按一定方式抽取出的一部 分元素的集合。
选民的地址与姓名大都取自于电话簿与汽车俱乐部会 员名单
THE END
谢 谢 观 看!
抽样框(Sampling Frame):又称作抽样范围,一 次直接抽样中总体中所有抽样单位的名单。
抽样框的经典例子
《文学摘要》杂志在1920年、1924年、1928年和1932 年,以邮寄明信片的方式对美国总统大选,进行了民 意测验,并准确预测出这4次选举的结果。当1936年总 统大选来临时,杂志回收了200多万份明信片。测验结 果显示57%的人支持共和党的候选人兰登,民主党候 选人、在任总统罗斯福的支持率为43%。然而,两星 期后的选举结果,罗斯福以62%的得票率当选。杂志 因此声誉扫地,不久就关门大吉了。
PPS抽样

甲:800户居民
乙:200户居民
甲居委会每一户居民被抽中的概率=20/200 × 50/800=1/160 乙居委会每一户居民被抽中的概率=20/200 × 50/200=1/40
不符合等概率原则
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling to Size)
《社会调查与统计分析》
第四章 抽样
知识点10 PPS抽样
学习导航
PPS抽样
PPS抽样的定义 PPS抽样的原理 PPS抽样的具体操作
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
多段抽样暗含的假定:每一个阶段抽样时,其元素的规 模是相同的。
原理:以阶段性的不等概率换取最终的、总体的等概率 。
实质:在第一个阶段中,大的群被抽中的概率大,而小 的群被抽中的概率小;这样到了第二个阶段,被抽中的 大的群中的元素被抽中的概率就小于被抽中的小的群中 的元素了。正是这一大一小,平衡了由于群的规模不同 带来的概率差异。
2. PPS抽样的原理
每一个元素被抽中的概率
甲居委会中居民被抽中的概率=20×1/125×1/16=1/100 乙居委会中居民被抽中的概率=20×1/500×1/4=1/100
3. PPS的具体操作
例2:从全市100家企业(总共20万名职工)中,抽取 1000名职工进行调查。
THE END
谢 谢 观 看!
=
所抽取的群数
群的规模 总体规模
平均每个群中要抽的元素 群的规模
=所抽取的群数╳平均每个群中所要抽取的元素/总体的规模 =样本规模/总体规模
第4章__抽样调查

4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
现代社会调查 第四章 抽样

2.抽样的一般程序 2.抽样的一般程序
界定总体 制定抽样框
决定抽样方案 实际抽取样本 评估样本质量
14
2.抽样的一般程序 2.抽样的一般程序
界定总体 制定抽样框
明确界定总体是确保样本 代表性的重要前提
当存在多阶段抽样时, 当存在多阶段抽样时,需 分别编制不同的抽样框
决定抽样方案
是对样本的质量、 样本评估 是对样本的质量、代表 性、偏差等进行初步的检验和衡量
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
系统抽样的注意事项: 系统抽样的一个十分重要的前提条件,是总体中个体 的排列,相对于研究的变量来说,应是随机的 相对于研究的变量来说, 相对于研究的变量来说 应是随机的,即不存在 某种与研究变量相关的规则分布。否则,系统抽样的结果 将会产生极大的偏差。 两种可能导致偏差的情况: (1)个体的排列有次序的先后,等级上高低的情况; (2)总体名单中,个体的排列与抽样间隔有相对应的周 期分布。
当抽样间距(K=N/n)不是整数时怎么办? 不是整数时怎么办? 当抽样间距 不是整数时怎么办
25
当抽样间距(K=N/n)不是整数时: 当抽样间距(K=N/n)不是整数时: (K=N/n)不是整数时
循环等距抽样法 A+K A A+2K A+3K A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
16
二、概率抽样及其方法
概率抽样的类型: 概率抽样的类型: 的类型
《现代社会调查方法》第四章抽样

第一节 抽样的意义与作用
2、抽样的作用
抽样作为人们从部分认识整体这一过程的关键 环节,其基本作用是向人们提供一种实现“由 部分认识总体”这一目标的途径和手段。 在社会调查中,抽样主要是解决的是调查对象 的选取问题,即如何从总体中选出一部分对象 作为总体的代表的问题。
两个例子
1984年的美 国总统大选
第二节 概率抽样的原理与程序
概率抽样的两项优点:
概率样本更具代表性,可避免各种偏见和减少误差 概率理论使我们能够估计样本的精确度和代表性
概率抽样之所以能够保证样本对总体的代表性, 其原理就在于它能够很好地按总体内在结构中 所蕴涵的各种随机事件的概率来构成样本,使 样本称为总体的缩影。
第二节 概率抽样的原理与程序
随机抽样:同等、独立
第二节 概率抽样的原理与程序
在概率抽样的过程中,我们总是要求保 证总体中的每一个个体都有同等的机会 入选样本,而且,任何一个个体的入选 与否,与其他个体毫不相关,互不影响。
随机事件与概率
确定性现象:必然发生的。 必然事件:在一定条件下必然发生的。 如:在一个大气压下,水在100摄氏度时必然沸腾。
分层抽样
整群抽样
多段抽样
其他抽样技术
按比例
不按比例
图 抽样分类
第三节 概率抽样方法
一、简单随机抽样(simple random sampling)
又称纯随机抽样,是按照等概率原则直接从含 有N个元素的总体中抽取n个元素组成样本 (N>n),常用的办法是抽签。
另外方法是利用随机数表进行抽样。
第三节 概率抽样方法
社会调查研究第四—七章

概率抽样有简单随机抽样、系统抽样、分类抽样、整群抽 样、多阶段抽样等类型。
非概率抽样有偶遇抽样、主观抽样、定额抽样、滚雪球抽 样等类型。
5、抽样的基本程序
界定总体 决定抽样方法 设计抽样方案 制定抽样框 实际抽取样本 样本评估
6、概率抽样的概念
概率抽样又称随机抽样指总体中每一个成员都 有同等的进入样本的可能性,但任何一个个体 之间彼此被抽取的机会是独立的。
9、分类抽样
分类抽样也叫类型抽样或分层抽样,即先分类, 然后从每一类中简单随机抽取样本。
分类抽样的分类:比例分类抽样和非比例分类 抽样。
分类抽样的两个假设:活分合理,分配合理。 分类抽样的评价:精度高,适用不同层面,效
率高。
10、整群抽样
整群抽样是将总体根据标准先划分为一些群体, 再随机从群体中抽取若干个体,并将个人集合 为总体的样本。
非概率抽样则主要是依据研究者的主观意愿判断或是否方便等因素来抽取对象它不考虑抽样中的等概率原则因而往往产生较大的误差难以保证样本的代表性
第四章 抽样调查
主讲:周红益
1、抽样的概念
抽样指从总体中按照一定方式选择或抽取样本 的过程和方法。
抽样存在的必要性缘于总体中所有个体之间的 异质性。
抽样存在的合理性性缘于总体中所有个体之间 的同质性。
7、简单随机抽样
简单随机抽样指在特定总体的所有单位中直接 抽取n个组成样本。
简单随机抽样方法有直接抽样法、抽签法和随 机数表法。
简单随机抽样的评价:简单易行,但效果不好。
8、系统抽样
系统抽样也称等距抽样或机械抽样,是按一定 的间距抽取样本的方法。
系统抽样的评价:规模较大时,易于实施,工 作量少;精确度更高,更有代表性;可仍有一 定的局限性。
非概率抽样有偶遇抽样、主观抽样、定额抽样、滚雪球抽 样等类型。
5、抽样的基本程序
界定总体 决定抽样方法 设计抽样方案 制定抽样框 实际抽取样本 样本评估
6、概率抽样的概念
概率抽样又称随机抽样指总体中每一个成员都 有同等的进入样本的可能性,但任何一个个体 之间彼此被抽取的机会是独立的。
9、分类抽样
分类抽样也叫类型抽样或分层抽样,即先分类, 然后从每一类中简单随机抽取样本。
分类抽样的分类:比例分类抽样和非比例分类 抽样。
分类抽样的两个假设:活分合理,分配合理。 分类抽样的评价:精度高,适用不同层面,效
率高。
10、整群抽样
整群抽样是将总体根据标准先划分为一些群体, 再随机从群体中抽取若干个体,并将个人集合 为总体的样本。
非概率抽样则主要是依据研究者的主观意愿判断或是否方便等因素来抽取对象它不考虑抽样中的等概率原则因而往往产生较大的误差难以保证样本的代表性
第四章 抽样调查
主讲:周红益
1、抽样的概念
抽样指从总体中按照一定方式选择或抽取样本 的过程和方法。
抽样存在的必要性缘于总体中所有个体之间的 异质性。
抽样存在的合理性性缘于总体中所有个体之间 的同质性。
7、简单随机抽样
简单随机抽样指在特定总体的所有单位中直接 抽取n个组成样本。
简单随机抽样方法有直接抽样法、抽签法和随 机数表法。
简单随机抽样的评价:简单易行,但效果不好。
8、系统抽样
系统抽样也称等距抽样或机械抽样,是按一定 的间距抽取样本的方法。
系统抽样的评价:规模较大时,易于实施,工 作量少;精确度更高,更有代表性;可仍有一 定的局限性。
影响样本规模确定的因素

《社会调查与统计分析》
第四章 抽样
知识点14 影响样本规模确定 的因素
学习导航
影响样本规模确定的因素
影响样本规模确定的四类因素 样本规模与抽样误差
1. 影响样本规模确定的因素
总体 的规模
经费、人 力和时间
影响因素
推断的把
握性与精 确性
总体的异 质性程度
总体的规模
在一定程度上,总体越大时,则样本也要越大。 样本规模的增加速度低于总体规模的增加速度。
样本 规模
600
400
200
10000 20000 30000 40000
总体规模
推断的把握性和精确性
在其他条件一定的情况下,置信度越高,即推论的可靠 性越大,则所要求的样本规模就越大。
n=(t2×σ2)/e2 n=[t2×p(1-p)]/e2 在其他条件下一定的情况下,置信区间越小,即样本统 计值与总体参数值之间的误差范围越小,则所要求的样 本规模就越大。
总体的异质性程度
总体的同质性程度越高,所需要的样本规模就越小。 总体的异质性程度越高,所需要的样本规模就越大。
调查者所拥有的经费、人力和时间
样本规模越大就意味着所需投入的人力、 物力和时间越多,调查的成本会上升。
2. 抽样误差(Sampling Error)
抽样误差就是样本统计值与总体参数值之间的误差。
(%)
(%)
(%)
1.0
9604
4.5
474
8.0
150
1.5
4268
5.0
384
8.5
9.0
119
2.5
1537
6.0
267
9.5
106
3.0
第四章 抽样
知识点14 影响样本规模确定 的因素
学习导航
影响样本规模确定的因素
影响样本规模确定的四类因素 样本规模与抽样误差
1. 影响样本规模确定的因素
总体 的规模
经费、人 力和时间
影响因素
推断的把
握性与精 确性
总体的异 质性程度
总体的规模
在一定程度上,总体越大时,则样本也要越大。 样本规模的增加速度低于总体规模的增加速度。
样本 规模
600
400
200
10000 20000 30000 40000
总体规模
推断的把握性和精确性
在其他条件一定的情况下,置信度越高,即推论的可靠 性越大,则所要求的样本规模就越大。
n=(t2×σ2)/e2 n=[t2×p(1-p)]/e2 在其他条件下一定的情况下,置信区间越小,即样本统 计值与总体参数值之间的误差范围越小,则所要求的样 本规模就越大。
总体的异质性程度
总体的同质性程度越高,所需要的样本规模就越小。 总体的异质性程度越高,所需要的样本规模就越大。
调查者所拥有的经费、人力和时间
样本规模越大就意味着所需投入的人力、 物力和时间越多,调查的成本会上升。
2. 抽样误差(Sampling Error)
抽样误差就是样本统计值与总体参数值之间的误差。
(%)
(%)
(%)
1.0
9604
4.5
474
8.0
150
1.5
4268
5.0
384
8.5
9.0
119
2.5
1537
6.0
267
9.5
106
3.0
分层抽样

《社会调查与统计分析》
第四章 抽样
知识点7 分层抽样
学习导航
分层抽样
分层抽样的定义 分层抽样的优点 分层的标准 按比例分层和不按比例分层
1. 分层抽样的定义
分层抽样又称类型抽样,它是先将总体中的 所有元素按照某种特征或标志(如性别、年 龄、职业或地域等)划分成若干类型或层次 ,然后再在各个类型或层次中采用简单随机 抽样或系统抽样的办法抽取一个子样本,最 后,将这些子样本合起来构成总体的样本。
2. 分层抽样的优点
优点2:便于了解总体内不同层次的情况,便于对总 体中不同层次进行单独研究,或者进行比较。
3. 分层的标准
已有明显层次区分的变量; 把分析和研究的主要变量或相关的变量作为分层的标准; 保证各层内部同质性强和各层之间的异质性强。
思考:在“大学生价值观念研究”层
例如,某工厂有工人500人,男性有450人,女性有 50人,男女比例为9:1,样本为100人。 按比例分层抽样,男性90人,女性10人。 不按比例的方法进行分层抽样,男性70人,女性30 人。
THE END
谢 谢 观 看!
专业、家庭背景
4. 按比例分层和不按比例分层
按比例分层是根据统一的比例来确定各层要抽取的 元素数。即通常用各类型组的元素数占总体元素数 的比例,来确定各层抽样的样本元素数。 不按比例分层就是不根据各类型组的元素数占总体 元素数的比例,来确定各层抽样的样本元素数。
4. 按比例分层和不按比例分层
例:某县共有农户30万户,其中纯务农户10万户、 兼业户15万户、纯务工户5万户,问如何使用按比例 分层抽样抽取3000户进行家庭状况调查? N=300000户 n=3000户 统一的抽样比例为:n/N=3000/300000=1/100,按照 要求,三种农户类型分别抽取的样本元素数为: n1(纯农户)=100000×1%=1000(户) n2(兼业户)=150000×1%=1500(户) n3(纯务工户)=50000×1%=500(户)
第四章 抽样
知识点7 分层抽样
学习导航
分层抽样
分层抽样的定义 分层抽样的优点 分层的标准 按比例分层和不按比例分层
1. 分层抽样的定义
分层抽样又称类型抽样,它是先将总体中的 所有元素按照某种特征或标志(如性别、年 龄、职业或地域等)划分成若干类型或层次 ,然后再在各个类型或层次中采用简单随机 抽样或系统抽样的办法抽取一个子样本,最 后,将这些子样本合起来构成总体的样本。
2. 分层抽样的优点
优点2:便于了解总体内不同层次的情况,便于对总 体中不同层次进行单独研究,或者进行比较。
3. 分层的标准
已有明显层次区分的变量; 把分析和研究的主要变量或相关的变量作为分层的标准; 保证各层内部同质性强和各层之间的异质性强。
思考:在“大学生价值观念研究”层
例如,某工厂有工人500人,男性有450人,女性有 50人,男女比例为9:1,样本为100人。 按比例分层抽样,男性90人,女性10人。 不按比例的方法进行分层抽样,男性70人,女性30 人。
THE END
谢 谢 观 看!
专业、家庭背景
4. 按比例分层和不按比例分层
按比例分层是根据统一的比例来确定各层要抽取的 元素数。即通常用各类型组的元素数占总体元素数 的比例,来确定各层抽样的样本元素数。 不按比例分层就是不根据各类型组的元素数占总体 元素数的比例,来确定各层抽样的样本元素数。
4. 按比例分层和不按比例分层
例:某县共有农户30万户,其中纯务农户10万户、 兼业户15万户、纯务工户5万户,问如何使用按比例 分层抽样抽取3000户进行家庭状况调查? N=300000户 n=3000户 统一的抽样比例为:n/N=3000/300000=1/100,按照 要求,三种农户类型分别抽取的样本元素数为: n1(纯农户)=100000×1%=1000(户) n2(兼业户)=150000×1%=1500(户) n3(纯务工户)=50000×1%=500(户)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.抽样:从组成某个总体的所 有元素的集合中,按一定的方 式选择或抽取一部分元素的过 程。
4.抽样单位( sampling unit)
抽样单位就是一次直接的抽样
所使用的基本单位。抽样单位 与构成总体的元素有时是相同 的,有时又是不同的。 抽取1000个大学生。 直接抽取 先抽班级,在抽学生
(一)与抽样有关的概念(续2)
5.抽样框(sample frame) 又称作抽样范围,它指的是 一次直接抽样时总体中所有 抽样单位的名单。
案例——抽样框
从一所中学中,直接抽取 200名学生作为样本。
抽样框
该中学的全体学生名单
案例——抽样框
如果抽取20个班级作为 调查样本。
抽样框
该中学的所有班级名单
社会调查步骤
选 抽 题 样 研究设计
第问卷设计 资料收集
资料分析 调查报告撰写
第四章
抽
样
本章主要内容
1.抽样的概念和类型 2.非概率抽样方法 4.概率抽样方法 5.户内抽样和PPS抽样 6.样本规模
案例1——2004年美国大选主要民调样本数
调查机构
福克斯新闻
盖洛普 全国广播公司/《华尔街日报》 哥伦比亚广播公司/纽约时报 美国广播公司/华盛顿邮报
(一)与抽样有关的概念(续3)
6.参数值 (parameter)也称 为总体值,它是关于总体中某 一变量的综合描述。 7.统计值(statistic)也称为 样本值,它是关于样本中某一 变量的综合描述。
二、抽样的作用
基本作用:是人们从部分认识
整体的关键环节 必要性:研究人员难以做到任 何研究都进行全面调查,而抽 样误差可以控制到很小,因而 抽样调查成为最常用的研究方 法之一。
一、抽样的基本概念
1.元素:等同于分析单位
2.总体(population):元素的集合体 N
3.样本(sample)从总体中按一定的方式抽取
出的一部分元素的集合。
研究结论只能推及总体范围
不反映总体的样本——农民为何常在民 意调查中被忽略(中国青年报 2005-03-04 )
中国人如何看美国,如何看美国人和中美 关系?近期,《环球时报》在中国社会科 学院美国研究所和专业调查公司的帮助下, 就此进行了民意调查,并公布了调查结果。 尽管该媒体发布的报道声称,他们这次是 “做了一次严格意义上的民意调查”,但 这次调查是否真称得上“严格意义”,值 得商榷。
实际上,他们调查的只是中国5大 城市的部分居民,却根本没有调查过 任何一位农民,而在当代中国,农村 人口在全国人口总数中所占比例远远 大于城市人口。所以,仅仅5个城市部 分居民在调查中表达出来的民意,并 不足以真正代表包括广大农村居民在 内的“中国人”。
值得注意的是,类似这种只调查部分城市居民、 调查结果却被说成是整个“中国人”的民意调查, 并不鲜见。例如,稍前,《解放日报》和复旦大 学、神州调查公司等合作,开展了“今天我们怎 样过春节”的全国30个城市抽样调查,也将农民 排除在外。 中国经济景气监测中心曾经发布的一项调查结果, 本来只是显示有58.2%的中国城市居民对目前的 收入水平感到满意,但某些媒体在报道时,则声 称是“逾半中国人满意当前收入”。超过8亿的中 国农民居然“人间蒸发”。
三、抽样的一般程序
界定总体
48% 44%
0% 1%
0.35%
持平
布什+6 布什+3.03
51.3 51.34% 4%
48.31 48.31% %
案例2《文学文摘》抽样——理论依据
《文学文摘》(literary
Digest) 以邮寄明信片的方式进行民意测 验,并且颇为准确预测出1916年、 1920年、1924年、1928年和1932 年的总统选举结果。该杂志所依 据的理论是:“所询问的选民愈 多,则结果愈可靠”。
零点调查公司曾经对京沪穗蓉宁等 10个城市的4226名成年市民进行一项 调查,旨在了解这些城市居民未来5 年内最关心的事情,但媒体发布的调 查结果,却是“中国人关注的十大焦 点”。一项标榜为揭示“当代中国人 世界观”的调查,实际调查的不过是 京沪穗三市的部分居民。
(一)与抽样有关的概念(续1)
样本量
1200
1573 1014 939 939
《新闻周刊》
882
2004年美国总统大选一周前民调结果
当选的相对机会值 福克斯新闻(1200 LV) 盖洛普(1573 LV) 全国广播公司/《华 尔街日报》 (1014 LV*) 哥伦比亚广播公司/ 纽约时报(939 LV) 美国广播公司/华盛 顿邮报(939 LV**) 《新闻周刊》(882 LV)
案例《文学文摘》—预测结果
候选人
兰登 A· Landon 罗斯福 F· Roosevelt
党派
共和党 民主党
支持率
57% 43%
案例《文学文摘》抽样——选举结果 两个星期之后,美国总统选举 的结果罗斯福以61%的得票率 获得第二任任期。相较于罗斯 福的523张选举人票,兰登仅 得到8张。
案例《文学文摘》——失败原因
案例《文学文摘》——抽样框获得
《文学文摘》通常会采用上千
万个调查单位样本,而这些样 本名单则是通过全美杂志订户、 电话薄和汽车俱乐部会员名单 收集到的。
案例《文学文摘》——样本量
当1936年总统大选来临时,杂
志仍以同样的方式进行了民意 测验,并从寄出的10000万份 明信片中,回收了200多万份。
最后结果
日期
10/30-10/31 10/29-10/31
奥巴马 克里 纳德尔
46% 49% 48% 49% 1% 1%
差额
克里+2 持平
10/29-10/31
48%
47%
1%
布什+1
10/28-10/30
49%
46%
1%
布什+3
10/27-10/30 10/27-10/29
11 月 2 日
48% 50%
《文学文摘》的民意测验失败是
因为它的样本严重地偏向高收入 群体。在当时条件下,收入较低 或失业者家里通常没有电话,也 没有汽车,因此,根据电话薄和 汽车俱乐部会员名单选定的样本, 主要涵盖的是经济地位较高的上 层选民。
案例《文学文摘》——失败原因
当时下层选民是罗斯福 社会及经济政策的主要受益 者和支持者,而共和党候选 人则更受上层选民的青睐。