抽样技术.

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中等收入: 200×60%= 120户
低收入: 200×20%=40户
解:(2)分层最佳抽样法
高收入:60户(40↑)
中等收入: 120 户(120→)
低收入: 20户(40↓)
STAT
通过计算可以看出,采用分层最佳抽样法,高收 入者家庭增加了20户,低收入家庭减少了20户, 中收入不变。
因此,由于购买力同家庭经济收入关系很大, 因而采用分层最佳抽样方法,可以增加高收入样 本数,相应减少低收入层的样本数,这样使所抽 取的样本更具有代表性。
抽样调查的应用 不可能进行全面调查时


不必要进行全面调查时
来不及进行全面调查时 对全面调查资料进行补充修正时
用于工业生产过程中的产品质量控 制和管理
抽样调查的一般步骤
STAT
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
推 断 总 体 参 数
类别
按被抽取机会是否相等,可以分为:
随机抽样 按照随机原则抽取样本 根据调查者主观意愿和判断选取样本
非随机抽样
抽样调查的特点 由部分推断总体
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
因此,抽样调查具有以下优越性:
(1)经济性; (3)准确性; (2)时效性; (4)灵活性。
3. 最低成本抽样:
•指在考虑统计效果的前提下,根据费 用支出来确定各层应抽取的单位数, 以节省调查费用。(经济效益)
每层抽取的样本数计算公式为: Ni i / ci ni n ( N i i / ci )
式 中: ni为第i层抽出的样本数
Ni为第i层的总单位数 i 为第i层的标准差 ci 为第i层每单位的调查费用 n 为总体样本数
STAT
必要样本容量的影响因素
STAT
允许误差范围的大小; 抽样调查的组织方式和方法; 人力、财力和物力的允许条件。
§4.2
随机抽样技术
STAT
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
一、简单随机抽样(纯随机抽样)
——对总体单位不做任何分类排队,完 全按照随机原则直接从总体中随机抽取一 部分单位组成样本的抽样组织方式。 应用 仅适用于规模不大、内部各单位 标志值差异较小的总体
•指分层后,按随机原则根据各层中单 位数量占总体单位数量的比例抽取各 层的样本数量。 每层抽取的样本数计算公式为:
Ni ni n N 式 中: ni为第i层抽出的样本数 Ni为第i层的总单位数 N为总体单位数 n为总体样本数
STAT
• 例1:某市有各类型书店500家,其中大型 50家,中型150家,小型300家。为了调查 该市图书销售情况,先计划从中抽取30家书 STAT 店进行调查,采用分层比例抽样法应从各层 中抽取多少家书店调查? • 解:根据分层比例抽样公式,则 (1)大型书店应抽取的样本数为: n大=50家/500家*30家=3家 (2)中型书店应抽取的样本数为: n中=150家/500家*30家=9家 (3)小型书店应抽取的样本数为: n小=300家/500家*30家=18家
是最简单、最基本、最符合随机原则,但同 时也是抽样误差最大的抽样组织形式
方 法 先将总体各单位进行编码,然后按照随 机原则,用抽签法或随机数法抽取若干 数码,所有中选的数码对应的单位即构 成样本。 给总体各单位编号后,把 号码写在结构均匀的字签 上,将字签混合均匀后即 可从中抽取。
STAT
二、 分层抽样(类型抽样)
系统抽样的优缺点
STAT
• 优 点:
(1)简便易行,容易确定样本单元 (2)分布比较均匀,有利于提高估计精度
例 如:对公路旁树木进行病虫害防治,确定
每30棵树检查1棵,只要确定了起点的被检查 树,每隔30棵检查1棵即可。
• 缺 点:若存在周期性变化,代表性差
四、 整群抽样(集团抽样)
—将总体全部单位分为若干“群”,然 后随机抽取一部分“群”,被抽中群体的所 有单位进行全面调查的抽样组织方式。 例:总体群数R=16
600 500 400
STAT
(150 8000) / 500 n中 5020000 1508000 3005000 30 9家
600 500 400
(300 5000) / 400 n小 5020000 1508000 3005000 30 14家
—将总体按某个主要标志进行分组,再 按随机原则采用简单随机抽样方式从各组 中抽取一定数目的总体单位组成样本的抽 样组织方式。
N1
n1
等额抽取
样本
总体
N
N2
Nk
n2
nk
n
等比例抽取 不等比例抽取
能使样本结构更接近于总体结构,提高样本的代表 性;能同时推断总体指标和各子总体的指标
· · ·
· · ·
1. 分层比例抽样:
STAT
2. 分层最佳抽样:
•指不仅按各层单位数占总体单位数的 比例分配各层的样本数,还根据各层 标准差的大小来调整各层样本数目的 抽样方法。 每层抽取的样本数计算公式为: N i i ni n N i i
式 中: ni为第i层抽出的样本数
Ni为第i层的总单位数 i 为第i层的标准差 n 为总体样本数
STAT
STAT
例 如( 2): 仍用上例资料,假设各类型书店图书销 售额的标准差估计值为:大型20000元;中 型8000元;小型5000元。按照最佳抽样法应 从各层中抽取多少家书店进行调查?
解:根据分层最佳抽样法,则
50 20000 n大 30 50 20000 150 8000 300 5000 8家 150 8000 30 50 20000 150 8000 300 5000 10家 n中 300 5000 n小 30 50 20000 150 8000 300 5000 12家
STAT


STAT
某地共有居民20000户,按经济收入 高低进行分类,其中高收入的居民户为 4000户,标准差为300元,;中等收入为 12000户,标准差为200元;低收入为4000 户,标准差为100元。
请问:若要从中抽取200户进行购买力调
查,则各类型应抽取的样本数为多少?
STAT
解:(1)等比例分层抽样法 高收入:200×20%=40户
例 如:
STAT
• 某企业对购进的10000台电视机的质量进 行调查,计划抽取400台作为样本调查, 总体编号为1-10000,样本间距为 K=10000/400=25,然后从1-25中任意抽 取一个数为样本,假定为第8台,则第2 个样本为8+25=33,即抽取第33台作为第 2个样本,以此类推,一直抽够400台为 止。
是最常用的抽样方法,用于无限总体和许多 有限总体样本单位的抽样。
四、抽样误差
----指所选取的样本的结果不能
STAT
完全代表总体而导致的误差。
原 因
登记误差 误差 系统性误差 代表性误差 随机误差
三种误差的区别:
• 登记误差:由于人的主观失误在观察、登
记、计算时造成的误差,可以避免。
成的系统偏差,理论上可以避免。
STAT
• 系统性误差:由于有意识选取调查单位造 • 随机误差:由于按照随机原则抽取样本而
产生的误差,无法避免但可以控制。
因 此:抽样误差一般指随机误差,而不包括登记 性误差和系统性偏差。
影响抽样误差的因素
总体各单位的差异程度: 样本单位数的多少:
STAT
(标准差) 越大,抽样误差越大;
三、抽样方法
STAT
1.重复抽样 又称作重置抽样、有放回抽样
抽出 个体 特点
登记 特征 放回 总体 继续 抽取
Байду номын сангаас
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
又被称作不重置抽样、不放 2.不重复抽样 回抽样 抽出 个体 特点 登记 特征 继续 抽取
STAT
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行。
二、基本准则
STAT
1.随机原则 ——抽取样本单位时,应确保每个总体单位都 有被抽取的可能. 2.抽样误差最小 ——在其他条件相同的情况下,选抽样误差 设计抽样方案时,通常是 最小的方案. 在误差达到一定要求的条 3.费用最少 件下,选择费用最少的方案 —在其他条件相同的情况下,选费用最少的 方案.
600 500 400
三、系统抽样(机械抽样)
—将总体单位按某一标志排序,而后 按一定间隔抽取样本单位的抽样组织方式。
随机起点 半距起点 对称起点
· · · · · ·
(总体单位按某一标志排序)
具体操作步骤:
STAT
• 假设总体有N个单位,需要抽取的样本容 量为n,可以将总体单位按一定标志排序 编号,然后确定样本间距,每个样本的 间隔均为K,则K=N/n(四舍五入取整)。 最后从1至N/n之间抽取一个号作为样本, 再从这个样本算起,加上样本间距K,即 为第2个样本的号码,以此类推,直至整 个样本抽取完为止。
STAT
P N N N N
n N
n
共 n个
⒉ 不重复抽样的可能样本数目:
n CN N N 1N n 1
例如:
• 假设 N=4 n=2 (1)重复抽样时 : 样本个数=42=4×4=16 • 若改变样本单位数,取n=3 , 样本个数=4×4×4=64 (2)不重复抽样时 : 样本个数=4×3=12 • 若改变样本单位数,取n=3 , 样本个数=4×3×2=24
第四章 抽样技术
§4.1 抽样调查的一般理论 §4.2 随机抽样技术 §4.3 非随机抽样技术
STAT
§4.1 抽样调查的一般理论
一、基本概念 二、基本准则 三、基本方法 四、抽样误差的确定 五、样本容量的确定
STAT
一、基本概念
STAT
1.全及总体 简称总体或母体,是指所要调查认识的研究对 象的全体,它由具有某种共同性质或特征的单 位组成。用字母N表示。 2.样本总体
思 考:
• 假定某大学的商学院想对今年的毕业生 进行一次调查,以便了解他们的就业意 向。该学院共有5个专业:会计、金融、 市场营销、经营管理、信息系统。今年 共有1500名毕业生,其中,会计专业有 500名,金融专业300名,市场营销300名, 经营管理250名,信息系统150名。 • 请 问:假定要抽取的样本数为180人, 各专业按比例分别应抽取多少人?
若n 过小,抽样误差会增大,抽样推断就 会失去价值。
确定样本容量的意义
小样本容量 节省费用但 调查误差大 调查误差 样本容量 调查费用
找出在限定费用 范围内的最大样 本容量
找出在规定误差 范围内的最小样 STAT 本容量
大样本容量 调查精度高 但费用较大
样本的可能数目
指从总体N中随机抽取n个样本单 位,共有多少种可能的抽选结果 ⒈ 重复抽样的可能样本数目:
n 越大,抽样误差越小;
抽样方法:不重复抽样比重复抽样小; 抽样组织方式:简单随机抽样最大。
五、样本容量的确定
样本容量 指样本中含有的总体单位的 数目,通常用n 来表示。
当 n <
STAT
一般来讲:当 n ≥ 30,称为大样本;
30,称为小样本。
确定适当样本容量的意义:
若n过大,调查工作量增大,体现不出抽样 调查的优越性;
简称样本,指在全及总体中抽取部分单位所构 成的小总体。用字母n表示。
全及总体指标:
参数(未知量)
STAT
统计推断
样本总体指标:统
计量(已知量)
注意
全及总体是唯一确定 的,样本总体不唯一
3.抽样调查
又称为抽样推断或抽样估计,指从总体中抽 取一部分单位作为样本进行调查,然后根据 样本调查结果对总体情况作出推断和估计的 一种统计方法,是一种非全面调查 。
STAT
STAT
例 如( 3): 仍用上例资料,现假设对不同类型书店进 行调查,每调查一家大型书店需要的调查费用 为600元,中型书店需要500元,小型书店需要 400元,其他情况不变。按照最低成本抽样法 应从各层中抽取多少家书店进行调查?
解:根据最低成本抽样法,则
(50 20000) / 600 n大 5020000 1508000 3005000 30 7家
A CM N B L P D J F KO E H I G
样本群数r=4
样本容量
L
H
P D
n nd n p nl nh
相关文档
最新文档