第七章抽样推断
第七章 抽样设计与推断(改)

第七章 抽样设计与推断 第一节 抽样设计 一、抽样推断与抽样设计的概念 (一)抽样推断 抽样推断(Sampling inference)是在抽样调查的基础上,利用样本的实际资料计算样本指标(统计量),并据以推算总体相应特征值(总体参数)的一种统计分析方法。抽样推断具有如下特点: 第一,抽样推断是建立在随机取样的基础上。按随机原则抽取样本单位,是抽样推断的前提。所谓随机原则就是在抽选调查单位的过程中,完全排除人为的主观因素的干扰,以保证使现象总体中的每一个个体都有一定的可能性被选中。换句话讲,哪些单元能够被选作调查单位纯属偶然因素的影响所致。这里需说明几点:①随机并非“随意”。随机是有严格的科学含义的,可用概率来描述,而“随便”仍带有人为的或主观的因素,它不是一个科学的概念;②随机原则不等于等概率原则;③随机原则一般要求总体中每个单元均有一个非零的概率被抽中;④抽样概率对总体参数的估计有影响。只有坚持抽取的随机原则,才能使被抽中单位的频数分布类型与调查对象相同,从而增强被抽中单位对总体的代表性,达到推断总体的目的。 第二,抽样推断是由部分推算整体的—种认识方法。即对抽取的调查单位进行调查研究,取得调查单位的实际资料,计算出调查单位的指标数值,并据以推断和估计总体的指标数值。 第三,抽样推断以概率论中的大数法则和中心极限定理为理论依据。 第四,抽样误差可以事先计算和控制。 抽样调查除具有十分明显的特色之外,还在实际应用过程中发挥着突出的作用。 其一,抽样调查能够解决全面调查所无法解决的现象的调查问题。在实际工作中,对某些现象常常可能一方面需要了解其全面情况,另一方面又由于现象自身的特性决定了无法通过全面调查获取资料。此时,只有使用抽样调查。该类现象主要有:(1)产品质量的破坏性检验。如轮胎的里程寿命试验,青砖的抗折耐压试验,炮弹的杀伤力试验,弹簧的抗拉强度试验等等。(2)无限总体的调查。无限总体所包含的总体单位数目无限多个,无法一一调查。(3)包括未来时序的总体,如生产过程稳定性的检查等。 其二,抽样调查适用于对理论上可以作全面调查,而实际上又难以组织全面调查的现象进行调查。有些现象虽属于有限总体,但由于其总体范围过大,单位数目过多且过于分散,事实上不可能作全面调查,如森林的木材蓄积量调查,大量连续作业的某些产品质量的非破坏性检验,水稻的颗粒重检验等等。还有些现象由于受时间或其他条件的制约,不能组织全面调查,如战备物资调查,自然灾害造成损失情况的调查等等。 其三,抽样调查对于时效性要求较高、同时又可以不作全面调查的现象的调查有着特殊的作用。如前所述,抽样调查具有费用低、速度快、精度高的特点,这使得它比其它非全面调查能更有效地满足各有关方面的需要。 其四,抽样调查的结果可被用来检验和修正全面调查结果。由于全面调查涉及面广、工作量大、参加人员多、汇总传递环节多、调查结果容易出现差错。但是,其差错到底有多大,全面调查自身无法回答这一问题。因此,可在全面调查之后再进行一次抽样调查,根据抽样调查结果对全面调查结果进行检查和修正,从而提高全面调查的质量。 其五,抽样调查可对工业生产过程的稳定性进行监测,从而实现质量控制。 其六,利用抽样调查方法还可以对总体的某些假设进行检验,以判断这些假设的真伪,为管理决策提供依据。例如:一种新药在对某位患者使用后效果不错,这是否意味着这种新药的疗效就一定显著呢?单凭此还不能做出结论。因为疗效对于每个人常会受到一些随机因素的影响而呈现出一定的不确定性。因此,最好利用抽样调查结果,对这种药物的疗效是否存在显著性的统计差异进行检验,以确定其疗效状况,并据此做出是否推广使用该药的决策。 (二)抽样设计 抽样设计是为抽样调查的实施提供一个指导性文件,以实现抽样调查的目的和任务。抽样设计的目的首先要合理安排整个抽样调查各个环节上的费用,使调查费用控制在预算范围内,保证抽样调查的顺利实施。其次,抽样设计中要通过对抽样方法的选择、样本容量的科学计算等,把抽样误差控制在要求的范围内,达到抽样的精度要求。最后,抽样设计要为抽样调查提供一个具体的日程表,指导调查工作按预定的时间要求进行,保证在规定的调查期限内全面完成调查的各项工作。 一次抽样设计通常主要包括:抽样方法设计、抽样单位设计、抽样框设计、估计方法设计、辅助变量设计、样本轮换设计、样本容量设计、问卷设计等基本内容。本节主要研究抽样方法的设计问题。
第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
第七章 抽样推断

一 抽样推断概述
(二)样本容量和样本可能数目
1.样本容量
样本容量是指一个样本中所包含的单位数的多少。总体单位数通常用N表示,样本容 量一般用n表示。在社会经济统计中,总体单位数N一般很大,有时可以是无限多的,样
本容量n相对于总体单位数N一般是很小的。n 30 的样本叫小样本,n 30 的样本叫大样
不重复抽样又称不回置抽样,其具体做法是:从总体N个单位中抽取一个容量为n的 样本,每次从总体中随机抽取一个单位,观察登记后不再放回总体,在此基础上抽取第 二个单位,依次类推。
不重复抽样有这样的特点:每次抽样以后,总体都会少一个单位。因此,不重复抽 样的每次抽取都会影响到下一次,n次抽取不是相互独立的。所以,不重复抽样的每次抽 一个,连续抽n次,相当于一次从总体中抽出n个单位组成样本。由于每次抽取时总体单 位数不同,每个单位中选或不中选的机会在各次是不同的。
一 抽样推断概述
(3)抽样推断的误差可以事先计算并进行控制 以抽样调查的样本指标数值来推断总体指标数值,虽然存在一定误差,但这种误差
在抽样调查之前是可以计算的,并能根据统计研究的任务、目的、精确性等,采取相应 的措施加以控制,使抽样推断的结论达到一定的可靠程度。这也是抽样调查不同于其他 调查方式的重要区别之一。
一 抽样推断概述
2.抽样框
要从一个总体中抽选样本,很重要的一个问题就是需要一个包括全部总体单 位的框架,以此代表总体,从中抽取样本单位。从中抽取样本的这个框架就称为 抽样框。它的作用就是将无形的总体变成有形的事物以便于实际抽取。
一 抽样推断概述
要很好地理解抽样框,需要区分一对概念:目的总体和被抽样总体。 在统计研究中,根据研究目的所确定的理想总体,就是目的总体。但是,有 时目的总体非常复杂,尤其在社会经济调查中,我们想得到一个包括目的总体全 部单位的框架往往很难,只能用一个接近目的总体,并且容易取得和便于操作的 框架来代替,这就是被抽样总体,即抽样框包含的总体范围。
(完整版)第七章抽样推断与检验习题(含答案)

第七章 抽样推断与检验习题一、填空题1.抽选样本单位时要遵守 随机 原则,使样本单位被抽中的机会 均等 。
2.常用的总体指标有 均值 、 成数(比例) 、 方差 。
3.在抽样估计中,样本指标又称为 统计 量,总体指标又称为 参数 。
4.全及总体标志变异程度越大,抽样误差就 越大 ;全及总体标志变异程度越小,抽样误差 越小 。
5.抽样估计的方法有 点估计 和 区间估计 两种。
6.整群抽样是对被抽中群内的 所有单位 进行 全面调查 的抽样组织方式。
7.常用的离散型随机变量分布包括 几何分布 、二项分布和 泊松分布 。
8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下:()n u p ππ-=1;不重复抽样条件下:()⎪⎭⎫⎝⎛---=11N n N nu p ππ。
9.误差范围△,概率度t 和抽样平均误差σ之间的关系表达式为 。
10.对总体指标提出的假设可以分为原假设和 备选假设(备择假设) 。
二、单项选择题1.所谓大样本是指样本单位数在()及以上A 30个B 50个C 80个 D100个2.抽样指标与总体指标之间抽样误差的可能范围是( )A 抽样平均误差B 抽样极限误差C 区间估计范围D 置信区间3.抽样平均误差说明抽样指标与总体指标之间的( )A 实际误差B 平均误差C 实际误差的平方D 允许误差4.成数方差的计算公式( )A P(1-P)B P(1-P)2C )1(P P -D P 2(1-P)5.对入库的一批产品抽检100件,其中有90件合格,最高可以( )概率保证合格率高于80%。
A 95.45%B 99.73%C 68.27%D 90%6.假设检验是检验( )的假设值是否成立A 样本指标B 总体指标C 样本方差D 样本平均数7.在假设检验中的临界区域是( )A 接受域B 拒受域C 置信区间D 检验域8.假设检验和区间估计之间的关系,下列说法正确的是( )A 虽然概念不同,但实质相同B 两者完全没有关系C 互相对应关系D 不能从数量上讨论它们之间的对应关系 222∆=σt n三、简答题1.什么是随机原则?在抽样调查中为什么要遵循随机原则?2.样本和总体有什么区别和联系?3.影响抽样误差的因素有哪些?4.抽样误差、抽样极限误差和概率度三者之间有何关系?5.什么是假设检验?其作用是什么?四、计算题1.工商部门对某超市经销的小包装休闲食品进行重量合格抽查,规定每包重量不低于试以95.45%概率推算:(1)这批食品的平均每包重量是否符合规定要求;(2)若每包食品重量低于30克为不合格,求合格率的范围。
《统计学》第七章抽样推断第二节 抽样误差

经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差
或
p p P
如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差
抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:
x x X
即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x
n
式中,n为样本容量; 为总体标准 。
成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)
7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)
;
2
第七章抽样推断

第七章抽样推断一、单项选择1.抽样调查所必须遵循的基本原则是()。
A.随意原则B.可比性原则C.随机原则D.准确性原则2.抽样调查的主要目的是( )。
A.广泛运用数学的方法B.计算和控制抽样误差C.用样本指标来推算总体指标D.修正普查的资料3.是非(交替)标志的标准差为( )。
A.p B.pq C.p(1-P) D.4.抽样调查按抽取样本的方法不同,可分为( )。
A.大样本和小样本B.重复抽样和不重复抽样C.点估计和区间估计D.纯随机抽样和分层抽样5.抽样平均误差反映了样本指标与总体指标之间的()A.实际误差B.实际误差的绝对值C.平均误差程度D.可能的误差范围6.抽样平均误差,确切地说是所有样本指标(样本平均数和样本成数)的( )。
A.全距B.平均差C.标准差D.离散系数7.重复抽样条件下的抽样平均误差与不重复抽样条件下的抽样平均误差相比( )。
A.前者总是大于后者B.前者总是小于后者C.两者总是相等D.不能确定大小8.在抽样平均误差一定的条件下,要提高推断的可靠程度,必须()。
A.扩大误差B.缩小误差C.扩大极限误差D.缩小极限误差9.当提高抽样推断的可靠性时,则推断的准确性将( )。
A.保持不变B.随之缩小C.随之扩大D.无法确定10.计算抽样平均误差时,如有若干个样本方差的资料,应根据()计算。
A.最大一个B.最小一个C.中间一个D.平均值11.抽样平均误差和允许误差的关系是()。
A.抽样平均误差大于允许误差B.抽样平均误差等于允许误差C.抽样平均误差小于允许误差D.抽样平均误差可以大于、等于或小于允许误差)。
A.成数的数值越接近于1,成数标准差越大;B.成数的数值越接近于0,成数标准差越大;C.成数的数值越接近于0.5,成数标准差越大;D.成数的数值越接近于0.25,成数标准差越大。
13.纯随机重复抽样条件下,当允许误差△扩大一倍,则抽样单位数n()。
A.只需原来的1/2 B.只需原来的1/4 C.只需原来的1倍D.只需原来的倍14.根据抽样的资料,一年级优秀生比重为10%,二年级为20%,在抽样人数相等的条件下,优秀生比重的抽样平均误差()。
第7章 抽样调查及答案
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
统计学(第7章)
s2 p(1 p)
2020/1/18
第七章 推断统计
13
统计学
三、抽样的组织方式
(一)简单随机抽样(纯随机抽样)
1、重复抽样
也称回置抽样,它是指每次抽取一个样本登记后再将 它放回总体中参加下一次抽取。
重复抽样的特点是:每次抽取样本是在完全相同的条 件下进行的,总体中每个单位中选的机会在各次都完 全相等。
第七章 推断统计
6
(二)总体参数
是唯一的、 确定的。
统计学
1、总体的平均数与方差
总体平均数
对未整理资料:
X X N
对经过整理的资料: X Xf f
2020/1/18
第七章 推断统计
7
统计学
无法直接求得
总体的方差(或标准差):
对未整理资料:
σ 2 ( X X )2
假设检验:依据样本观察资料对总体综合 指标的某种假设检验,来判断这种假设的 真伪。
2020/1/18
第七章 推断统计
5
统计学
第二节 有关抽样的基本概念
一、总体的相关概念
(一)总体 (母体、全及总体)
一般用 N 表示总体的单位数。 一个总体的指标数值是确定的、唯一的,
所以称为参数。
2020/1/18
取第 a 个,则第二组起分别为:2k-a,2k+a, 4k-a,4k+a,6k-a,6k+a,……
2020/1/18
第七章 推断统计
18
统计学
(三)类型抽样(又称分层抽样)
类型抽样:是将总体各单位按主要标志进行分 组,然后再从各组中按随机原则抽取一定比例 的单位构成样本。
第七章 抽样推断 (《统计学》PPT课件)
接作为相应全及指标的估计值。
2.定义:设x_
表示总体平均数
__
X
的估计值,p^ 表示
总体成数P的估计值,则有:
__ _
X x
或
^
Pp
27
第四节 抽样估计
二、总体参数的点估计
3. 性质:
用抽样指标估计总体指标时,要求抽样指标
的平均数等于被估计的总体指标;E(
_
x)
__
X
_
E( p) P
用抽样指标估计总体指标时,要求当样本容 量n充分大时抽样指标充分靠近总体指标;
6
第一节 抽样推断概述
二、有关抽样的基本范畴
2.指标
:根据全及总体各个单位的标志值或标 志特征计算的,用来反映全及总体某种属性的综合 指标;
:由样本总体各单位标志值或标志特征 计算出的综合指标。
注:对于一个确定的问题,全及指标是唯一的, 样本指标不是唯一确定的,即样本指标的随机变量。
7
抽样推断
2.种类:
根据抽样资料计算样本指标,并以此直接作 为相应全及指标的估计值;
根据给定的概率保证程度的要求,利用实 际抽样资料,求出总体被估计值的上限和下限,即给 出总体参数可能存在的区间范围,而不是直接给出总 体参数的估计值。
26
第四节 抽样估计
二、总体参数的点估计
根据抽样资料计算样本指标,并以此直
n
N
22
第三节 抽样误差
三、抽样极限误差
在抽样推断中可允许的误差范围,等于样本指 标可允许变动的上限或下限与总体指标之差的绝对值。
2.计算公式:
_ __
_
__ _
抽样平均数极限误差: 或
_ x- X
第七章 抽样推断与检验
n Z 22 P ( 1 P ) 2 p
(三)总体方差的区间估计
▪ 总体均值已知时,总体方差的区间估计
2
( xi )2 2
2(n)
P (1 2 (n) 2 ) 1
P(
2 (n)
1 )
P(
2 (n)
2 )
2
1
2 1
(n), 2
一定误差的要求下选择费用最小。或者一定 费用开支条件下,选择误差最小。
二、抽样的组织设计
(一)简单随机抽样(Simple random sampling):直接从总体N个单位中抽取n
个单位作为样本,也称单纯随机抽样。
(二)类型抽样(Stratification sampling): 又称分层抽样,对总体单位按主要标志分 组,再从各组中按随机的原则按比例抽选 一定单位构成样本。不存在组间误差。
▪ 抽样推断(sampling inference)是在抽样调查的 基础上,利用样本的实际资料计算样本指标,并据 以推算总体相应数量特征的一种统计分析方法。
▪ 特点: 1. 抽样推断是建立在随机取样的基础上,坚持抽取的
随机原则,增强被抽中单位对总体的代表性。
2. 抽样推断是由部分推算整体的一种认识方法。 3. 抽样推断以概率论中的大数法则和中心极限定理为
2
(n)
2
2
P
(
2 1
(n)
2 (n)
2
(n))
1
2
2
P
(x 2 i( n))22
2
(1 2 x i2 (n ))2 1
▪ 总体均值未知时,总体方差的区间估计
2