非概率抽样调查

合集下载

适用于那些特征稀少小规模特殊总体的非概率抽样方法是

适用于那些特征稀少小规模特殊总体的非概率抽样方法是

常用的非概率抽样方法有以下四类:1、方便抽样(Convenience sampling)指根据调查者的方便选取的样本,以无目标、随意的方式进行。

例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。

优点:适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。

缺点:抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。

2、判断抽样(Judgment sampling)指由专家判断而有目的地抽取他认为“有代表性的样本”。

例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行。

也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。

优点:适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。

缺点:该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。

3、配额抽样(Quota sampling)指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。

相当于包括两个阶段的加限制的判断抽样。

在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。

在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。

例如:定点街访中的配额抽样。

优点:适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。

大数据下非概率抽样方法的应用思考

大数据下非概率抽样方法的应用思考

统计与管理 二○一六·四统计聚焦摘 要:大数据时代对于数据的搜集提出了更高的要求,在现有存储计算能力还难以满足处理全数据的需求时,抽样调查依然有其存在的价值。

非概率抽样作为重要的抽样方法,关于其如何适应大数据特点讨论有一定现实意义。

本文首先介绍了已有的非概率抽样方法,并提出互联网是大数据产生和存储的重要载体。

在结合已有各类非概率抽样方法和互联网数据产生特点的基础上,该文给出了在面对互联网大数据时,如何继续使用非概率方法的讨论。

关键词:非概率抽样 大数据 互联网课题项目:2013年山西省普通高校特色重点学科项目:山西综改实验区建设统计调查与评价方法设计和应用;2015年山西省研究生创新项目:转型期社会网络非概率抽样研究(编号2015SY47)DOI:10.16722/j.issn.1674-537X.2016.04.003大数据的到来,迫使我们以大数据思维面对数据,这对我们以往的调查方法提出了挑战,在计算、存储能力的限制下,全数据还难以实现,抽样调查仍然将在一段时间内成为我们获取数据的重要方式,因此如何改进已有的抽样调查方法来适应大数据特点,就成为了我们亟需解决的问题,而非概率抽样方法作为重要的抽样方法,其如何适应大数据的特点也自然的成为了我们关注的重点。

一、现有非概率抽样方法简介(一)目标抽样所谓目标抽样就是利用大量不同的延伸方法在隐藏总体中获得抽样人群。

[1]该抽样法往往会派遣调查员进入公共场所来招募所要研究的目标群体成员。

从上述抽样过程我们可以看到该方法有非随机性,这也就导致我们难以较好的衡量抽样过程中的选择性偏差,而这种偏差可能会很大,这就阻碍了我们顺利的由样本推测总体。

(二)时间地点抽样该抽样指在特定的时间和空间内对目标群体进行抽样。

时间地点抽样常在无法获取抽样框的情形中使用,它的特点是利空时空单元构建抽样框,即把具体的某一地点某一时段当作抽样单元(例如某个公园,周六,下午3点—6点)。

非概率抽样方法

非概率抽样方法
特点:任意、方便、随意
[例]一些大城市想做流动人口消费品购买力调研
[例]某市调研人员想了解市民对于规划的万达商圈的 停车位的满意程度
注意:偶遇抽样A ≠随机抽样
6
偶遇抽样的适用性
➢ 探索性调查 ➢ 同质性强的总体 ➢ 时效性要求较高的调查 ➢ 流动性大的总体
A
7
调查实例
“都市里的吉卜赛人——对武汉市 外来务工、经商人员的调查”,《青年 研究》2001年第6期,作者:刘玉等
无法界定总体边界。例如:农民工研究、流浪儿 童研究
总体规模较小或同质性较强。例如:同性恋研 究、吸毒问题研究
时间、人力等条件有限。
A
4
目录
非概率抽 样方法
1 偶遇抽样 2 判断抽样 3 定额抽样 4 雪球抽样
A
5
一、偶遇抽样
1、含义
偶遇抽样又称作方便抽样或自然抽样,是指研究者根 据现实情况,以自己方便的形式抽取偶然遇到的人作为对 象,或者仅仅选择那些离得最近的、最容易 由被调查者当场填 写回收,对一些没 有上过学不识字的 被调查者采取由调 查员根据问卷的内 容逐一访谈的方式 完成。
8
二、判断抽样
1、含义
判断抽样又称立意抽样或目的抽样,它是研究者根据自己主观 的分析来选择和确定研究对象的方法。
特点:典型、主观
例如,调查客户评价可以重点调查核心客户的评价。对全 国城市家庭平均消费支出的调查应该选择3口之家。
采用非概率抽样能 够便捷地收集被调 查者的各种信息, 有助于调研人员形 成想法,拓展思路, 得出结论。
A
缺点:
不能估计抽样误差 难以评价样本所具
有的代表性程度 非概率抽样的结果
不能推算出总体, 通常存在较大的偏 倚

第四讲非概率抽样方法与数据误差

第四讲非概率抽样方法与数据误差

一个单位有职工160人,其中业务人员 96人,管理人员40人,后勤服务人员 24人,现要从中抽取容量为20的一个 样本,请简述三种抽样方法的过程?
分层抽样
按20:160=1:8 的比例,从业务人员中抽取12人, 从管理人员中抽取5人从后勤服务人员中抽取3人, 都用抽签法从各类人员中抽取所需的人数,最后 合在一起
误差的控制
1. 抽样误差可计算和控制 2. 非抽样误差的控制
– – – –
• •
调查员的挑选 调查员的培训 督导员的调查专业水平 调查过程控制
调查结果进行检验、评估 现场调查人员进行奖惩的制度
本章小结
1. 2. 3. 4. 数据的来源 调查数据与问卷设计 实验数据 数据的误差
一个单位有职工160人,其中业务人员 96人,管理人员40人,后勤服务人员 24人,现要从中抽取容量为20的一个 样本,请简述三种抽样方法的过程?
– 主要用于对稀少群体的调查。 – 调查结果不能推断总体
概率抽样与非概率抽样的比较
概率抽样:可以根据调查的结果推断总体 非概率抽样:不能根据调查的结果推断总体 实际上每个抽样通常都可能是各种抽样方法 的组合。既要考虑精确度,还要根据客观情 况考虑方便性、可行性和经济性。不能一概 而论。 这些抽样方法的选择多半是种艺术,而不是 科学。
2.4 数据的误差
2.4.1 抽样误差 2.4.2 非抽样误差 2.4.3 误差的控制
数据的误差
数据的误差
抽样误差
非抽样误差
抽样框误差
回答误差
无回答误差
调查员误差
抽样误差
(sampling error)
1. 由于抽样的随机性所带来的误差 2. 所有样本可能的结果与总体真值之间的平 均性差异 3. 影响抽样误差的大小的因素

中级经济师中级经济基础预习资料-抽样调查及误差

中级经济师中级经济基础预习资料-抽样调查及误差

中级经济师中级经济基础预习资料专题8抽样调查知识点抽样调查的基本概念一、总体总体是调查对象的全体,在一项具体的调查项目中,调查总体必须是明确的而不能是模糊的。

【举例】对北京市的个体商业进行抽样调查,则北京市所有的个体商业单位就构成一个总体。

二、总体参数1.总体参数是根据总体中所有单位的数值计算的,是通过调查想要了解的,不受样本的抽选结果影响。

2.常用的总体参数有总体总量、总体均值等。

【举例】在对北京市个体商业进行的调查中,北京市所有个体商业的年零售总额就是一个总体参数。

三、样本样本是总体的一部分,由从总体中按一定原则或程序抽出的部分个体所组成。

【举例】从北京市的个体商业中按照一定原则抽取100家个体商业进行调查,抽取出的100家个体商业就是样本。

四、样本统计量1.样本统计量是根据样本中各单位的数值计算的,是对总体参数的估计,也称估计量。

2.常用的样本统计量有样本均值等。

【举例】抽取的100家个体商业年零售总额就是样本统计量。

五、抽样框1.抽样框是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。

2.常用的有名录框,如企业名录、电话簿、人员名册等。

【举例】北京市注册企业名录就是抽样框。

☆快速检测☆【真题·单选】在某省住户收支与生活状况调查中,通过对该城镇住户和农村住户的抽样调查来了解该省城乡居民收入、消费及其他生活状况,该抽样调查的总体是该省()。

(2021年真题)A.被采集数据的住户B.每一个被采集数据的用户C.所有住户D.每一个住户【答案】C【解析】总体是指调查对象的全体,本题调查某省住户的收支与生活状况,总体就是该省所有住户。

【真题·单选】如果随机抽取1000个消费者进行电话访问来了解某商品的品牌忠诚度,按照抽样调查理论,这1000个受访者的品牌忠诚度的平均值是()。

(2021年真题)A.总体B.样本C.总体参数D.样本统计量【答案】D【解析】随机抽取的1000个消费者是样本,根据样本中各单位的数值计算的是样本统计量。

社会调查方法03抽样一

社会调查方法03抽样一

不等概率抽样的后期统计一般要做特殊处理。

举例:20000户居民,按经济收入高低分类,高收 入居民4000户,占总体20%;中等收入12000户, 占总体60%;低收入户4000户,占总体20%,从 中抽取200户,进行购买力调查。
等比例分层抽样 高收入层样本数:200× 20%=40户 中收入层样本数:200× 60%=120户 低收入层样本数:200× 20%=40户

★ 划分 ●★ ■ 子群 ■▼■●● ★■ ▼▼ ★
★● ★● ▼★ ■ ■ ▼ ■ ★● ▼■
随机 抽样
★● ▼■
N
5000 R1 R2 R3 R4 48 …… R130 45 R98 R110
总体
确定分群 特征
53
R1
50
R4
58
R33
群(互不
重叠)
子群
53
48
52
50
47
n
样本
250
等距抽样与简单随机抽样相比,样本分布更为 均匀,抽样误差更小 注意: 等距抽样是以总体的随机排列为前提的, 如果总体的排列出现有规律的分布时,会使等距抽 样产生极大的误差,降低样本的代表性 等距抽样最适用于同质性较高的总体,当总体 内个体类别之间的数目悬殊过大时,样本的代表性 可能较差。在这种情况下应采用另一种分层抽样方 法。
直线等距抽样练习题:
某大学有12000名学生,欲了解 其生活态度,决定采用系统抽样的方法 从中抽查200名学生,用简单随机抽样 的方法抽出第一名学生序号为12,请计
算第十位,第十五位学生的序号是多少?

(二)循环等距抽样(k不为整数)
方法1. 1. 将总体N首尾相连, N K=——,取接近K的整数; 2. 随机起点r从1-N中随机抽取 n 方法2. 调整直线等距抽样 1. 将K的小数点后移,便为整数[K] 2. 确定整数的随机起点[r],从10-[K]中选 3. 确定非整数的随机起点r,即将[r]的小数点移回来 4. 从r开始,每隔K各单位抽取一个单位 5. 再将所有抽取的号码的小数点略去 特点:所有单位有相同的中选概率1/K

抽样方法

抽样方法
广东商学院华商学院经济系
模拟市场调查大赛
4、滚雪球抽样
(1)定义:先选择一组调查单位,对其实施调查 之后,再请他们提供另外一些属于研究总体的调 查对象,调查人员根据所提供的线索,进行此后 的调查。这个过程持续下去,就会形成滚雪球效 应。 (2)特点: ①适合于对稀少群体和特定群体研究; ②优点:容易找到那些属于特定群体的被调查者, 调查的成本也比较低。
“随机数表”
(5)例题:从班上50个同学中抽取10个同学参加 某项活动,采用“随机数表法”进行抽样。
广东商学院华商学院经济系
模拟市场调查大赛
2、分层抽样(stratified sampling)、
在上面的例题中,“从班上50个同学中抽取10个同学 参加某项活动”,若班男生30人,女生20人,按照性别 之比,在抽取的10个同学中,应该男生6人,女生4人, 如此才能保证男女生性别上的公平。但在实际操作中,采 用简单随机抽样进行抽样,得到的样本,男女生之比会出 现偏离3:2的情况,即会出现性别上不公平的现象,因此 我们需要对简单随机抽样进行改进,得到分层抽样。
模拟市场调查大赛
抽样方法
主讲 石立
广东商学院华商学院经济系
模拟市场调查大赛
调查数据往往是通过从总体中抽取样本进行 调查,抽取样本的方法直接影响着样本的可信度, 常用的抽样方法有两大类,各五种方法:
一、概率抽样:简单随机抽样;分层抽样; 整群抽样;系统抽样;多阶段抽样 二、非概率抽样:方便抽样;判断抽样;自 愿样本;滚雪球抽样;配额抽样
广东商学院华商学院经济系
模拟市场调查大赛
2、判断抽样
(1)定义:研究人员根据经验、判断和对研究对 象的了解,有目的选择一些单位作为样本。 (2)特点: ①判断抽样是主观的,样本选择的好坏取决于调研 者的判断、经验、专业程度和创造性; ②抽样成本比较低,容易操作 ③样本是人为确定的,没有依据随机的原则,调查 结果不能用于对推断总体

非概率抽样方法中样本类型的选择与应用研究

非概率抽样方法中样本类型的选择与应用研究

非概率抽样方法中样本类型的选择与应用研究概述在社会科学研究中,样本的选择是非常重要的环节,它对于研究结果的可靠性和普遍性有着至关重要的影响。

非概率抽样方法是一种常用的研究方法,本文将探讨非概率抽样方法中样本类型的选择与应用。

一、目的抽样目的抽样是非概率抽样方法中常用的一种类型。

研究者根据研究目的和研究问题,有意识地选择符合研究目标的个体或群体作为样本。

目的抽样可以分为以下几类:1. 专家抽样:研究者通过专家的推荐或评估,选择具有代表性的个体或群体进行研究。

例如,在医学研究领域中,研究者可能通过请教医学专家来选择具有特定疾病的患者作为样本。

2. 极端个案抽样:研究者有意选择极端或特殊的个体或群体进行研究,以便深入了解其特点和行为模式。

例如,在犯罪学研究中,研究者可以选择罪犯或犯罪集群作为样本,来揭示犯罪行为的原因和动机。

3. 契约抽样:研究者与样本个体签订契约,在一定的时间内对其进行观察或调查。

契约抽样常用于长期追踪研究,以了解个体或群体的变化和发展。

二、方便抽样方便抽样是非概率抽样方法中最常见的一种类型。

研究者选择容易接触到的个体或群体作为样本,主要出于研究的方便性考虑。

尽管方便抽样具有一定的实用性,但其样本的代表性和普遍性往往较低,容易引起偏倚。

因此,在使用方便抽样时,研究者需认识到其局限性,并尽量采取措施来减小偏倚的可能性。

三、判断抽样判断抽样是非概率抽样方法中一种常用的类型。

研究者根据对样本个体或群体的直觉判断和专业知识,选择具有代表性的个体或群体进行研究。

判断抽样可以分为以下几类:1. 专家判断抽样:研究者请教领域内的专家,根据其意见和判断选择样本。

专家判断抽样常用于对特定领域的深入研究,借助专家的经验和见解来选择样本个体或群体。

2. 多阶段判断抽样:研究者根据不同的因素和判断标准,采用多个层次的抽样方法进行样本选择。

多阶段判断抽样通常用于复杂的调查研究中,以便获取更多样本的信息并提高研究的广度和深度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样法范围之外 的抽样法。 在实践中,使每个样本被抽取的机会相 等的方法,并非对所有调查都具有可行 性。 为什么呢?

非概率抽样技术的分类
非 概 率 抽 样 方 法
任 意 抽 样 方 法
判 断 抽 样 方 法
配 额 抽 样 方 法
独 立 控 制 配 额 抽 样 相 互 控 制 配 额 抽 样
(A)
(B)
(C)
年龄(岁)
18~34 35~44 45~60 61岁以上 总计 40 60 70 30 200 男 女
性别 100 100 200
收入

中 低
40
60 100
总计
总计
200
收入 性别 样本数目 年龄
高 男 4 7 6 3 20 40 女 4 7 6 3 20 男 6 9 10 5 30

配额抽样法:是指市场调查总体按某些属性特征进行 分层,对分层后的副次总体样本按规定样本配额,配 额内的样本则由调查人员主观判断选定。
分层判断抽样法是采用 随观方法抽取样本。 配额抽样是非概率抽样 法抽取样本。 不能象概率抽样法那样 可以估计抽样误差,并 且能够对调查人员访问 调查对象的方法加以规 定和控制。
任意抽样法
概念:是一种随意选取样本的方法。 例如:在街头向路人作访问、在柜台销售产品的 过程中向买者作当面访问。 优点:便利、方便。 缺点:抽样误差较大。 适用于:市场初步调查、对市场情况不甚了解 时,正式市场调查中较少使用。

判断抽样法
概念:是由市场调查人员根据经验判断选定样本的 一种非概率抽样法。 例如:对全国城市家庭平均消费支出的调查应该选择3 口之家。 优点:简便、易行。 缺点:易于发生主观判断偏差所造成的抽样误差增 大的情况,所以调查人员必须对总体的基本特征相 当清楚的情况下才能用,这样所选择的样本才具有 代表性、典型性,从而透过对所选样本的调查研究, 了解、掌握整个总体的情况。 市场调查中,常用的典型调查、重点调查均属于此 类抽样调查。


实行配额抽样法的主要 理论依据:认为特征相 同的调查对象,如同一 类别年龄、性别、收入 的居民,其要求、反应 大致相似,误差不大, 因而不必再按随机抽样 法抽取样本。
独立控制的配额抽样:这种方法只对具有某种特征的 样本数规定配额,而对具有两种或两种以上特性的样 本数则不作规定。

例1:控制特性为年龄、性别、收入三种,已 经确定样本总数为200,按独立控制的配额抽 样,则可列成如下三表:
中 女 6 9 10 5 30 60 男 10 14 19 7 50
低 总计 女 10 14 19 7 50 40 60 70 30 200
18~34 35~44 45~60 61以上 合计 总计
100
滚雪球抽样
以若干个具有所需特征的人为最初的调查对象,然 后依靠他们提供认识的合格的调查对象,再由这些人提 供第三批调查对象,……依次类推,样本如同滚雪球般 由小变大。滚雪球抽样多用于总体单位的信息不足或观 察性研究的情况。这种抽样中有些分子最后仍无法找到 ,有些分子被提供者漏而不提,两者都可能造成误差。 例如,要研究退休老人的生活,可以清晨到公园去 结识几位散步老人,再通过他们结识其朋友,不用很久 ,你就可以交上一大批老年朋友。但是这种方法偏误也 很大,那些不好活动、不爱去公园、不爱和别人交往、 喜欢一个人在家里活动的老人,你就很难把雪球滚到他 们那里去,而他们却代表着另外一种退休后的生活方式 。
相关文档
最新文档