《新编统计学》之七-抽样推断
第七章 抽样推断

一 抽样推断概述
(二)样本容量和样本可能数目
1.样本容量
样本容量是指一个样本中所包含的单位数的多少。总体单位数通常用N表示,样本容 量一般用n表示。在社会经济统计中,总体单位数N一般很大,有时可以是无限多的,样
本容量n相对于总体单位数N一般是很小的。n 30 的样本叫小样本,n 30 的样本叫大样
不重复抽样又称不回置抽样,其具体做法是:从总体N个单位中抽取一个容量为n的 样本,每次从总体中随机抽取一个单位,观察登记后不再放回总体,在此基础上抽取第 二个单位,依次类推。
不重复抽样有这样的特点:每次抽样以后,总体都会少一个单位。因此,不重复抽 样的每次抽取都会影响到下一次,n次抽取不是相互独立的。所以,不重复抽样的每次抽 一个,连续抽n次,相当于一次从总体中抽出n个单位组成样本。由于每次抽取时总体单 位数不同,每个单位中选或不中选的机会在各次是不同的。
一 抽样推断概述
(3)抽样推断的误差可以事先计算并进行控制 以抽样调查的样本指标数值来推断总体指标数值,虽然存在一定误差,但这种误差
在抽样调查之前是可以计算的,并能根据统计研究的任务、目的、精确性等,采取相应 的措施加以控制,使抽样推断的结论达到一定的可靠程度。这也是抽样调查不同于其他 调查方式的重要区别之一。
一 抽样推断概述
2.抽样框
要从一个总体中抽选样本,很重要的一个问题就是需要一个包括全部总体单 位的框架,以此代表总体,从中抽取样本单位。从中抽取样本的这个框架就称为 抽样框。它的作用就是将无形的总体变成有形的事物以便于实际抽取。
一 抽样推断概述
要很好地理解抽样框,需要区分一对概念:目的总体和被抽样总体。 在统计研究中,根据研究目的所确定的理想总体,就是目的总体。但是,有 时目的总体非常复杂,尤其在社会经济调查中,我们想得到一个包括目的总体全 部单位的框架往往很难,只能用一个接近目的总体,并且容易取得和便于操作的 框架来代替,这就是被抽样总体,即抽样框包含的总体范围。
第7章 抽样推断

D 所调查的200名学生
正确答案是( C )
同步训练
8. 某大学的一位研究人员希望估计该大学本科生 平均每月的生活费支出,为此,他调查了200名学 生,发现他们每月平均生活费支出是500元。该研 究人员感兴趣的参数是( ) A 该大学的所有学生 B该大学所有大学生的月平均生活费支出 C该大学所有的在校本科生
经常采用的样本指标主要有样本均值、样本比例和样 本方差。
(二)总体指标和样本指标
样本均值:
未分组 分 组
x x2 xn x 1 n
x
i 1
n
i
样本比例:
x f x f
i i
n
i
样本方差:
n1 p n
S
S
2
未分组
2
(x
i
i
x)2
n 1
x)2 fi
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
二、抽样推断的特点 • 按随机原则抽取样本
每个单位都有 相同的被抽中 的机会,哪个单 位被抽中,由随 机因素确定,完 全排除抽样者 的个人主观意 志
• 运用概率论的理论和方法,用样本指标来推断 总体指标。 • 推断的误差可以事先计算和控制。
N! M n!( N n)!
M
( N n 1)! n!( N 1)!
(五)抽样组织方式
简单随机抽样
类型抽样
整群抽样 等距抽样 多阶段抽样
抽样的组织方式
简单随机抽样
简单随机抽样也叫纯随机抽样。它是按照随机原则直接从总体 N个单位中抽取n个单位作为样本,然后通过对样本单位的调
统计学基础项目7抽样推断

13
◎抽样方法
2.不重复抽样(不回置抽样)从总体中每次抽 取一个单位进行观察,登记后不再放回总体中, 依此直至抽取n 个单位。 不重复抽样的特点:
⑴ n次抽取实质上等于一次同时抽取n个单位; ⑵ n次抽取相互不独立(对下次抽取有影响); ⑶每个总体单位在各次被抽中的概率不同,即1~n次分 别是1/N,1/N-1,1/N-2,…,1/N-n+1,但在每次抽取时 机会仍然均等; ⑷每个总体单位不会被重复抽中。
8
抽样推断的意义
㈢抽样推断的作用 抽样推断既是一种科学的调查方法,也是一种有 效的分析方法,应用极为广泛。 1.可以降低调查成本,提高调查资料的时效性, 收到事办功倍的效果。 2.能够解决不能用全面调查解决的问题。 3.用于评价、补充或修正全面调查资料。 4.用于工业生产过程的质量控制。 5.用于对总体假设的检验。
随机原则(等概原则)即在总体中每个单位都有 同等被抽取的机会,能否抽中,完全是随机的、 偶然的事件。 3.抽样误差不可避免,但可事先计算和控制。
7
※为什么要遵守随机原则?
⑴排除主观因素的影响,避免系统性误差 (偏差)产生的可能性; ⑵保证样本与总体同分布,使样本对总体有 充分的代表性; ⑶只有遵守随机原则,才能运用数理统计原 理计算抽样误差、确定估计推断的可靠性。
项目五 抽样推断
——数理统计应用之一
1
抽样推断全程图
总体
可 靠 性
抽样
样本
确定样本容量
2
学习目标
【知识目标】 了解抽样推断的概念、特点和作用 理解抽样推断的一般原理 掌握纯随机抽样组织形式下抽样误差和样本容 量的计算方法 【能力目标】 能够熟练地运用抽样方法进行区间估计 能够按照可靠性和准确性要求确定必要的样本 容量
第七章 统计 抽样推断

同上,如果将样本中n条鱼的平均重量计算出 来,记为 x ,它就可以作为湖中全部鱼的平 均重量 的估计量,则湖中鱼产量的点估计
量为
ˆ nN1 x Nˆ n1
例2 某工厂生产了一批产品,共10000件,须经 检验后方可出厂,按规定次品率不得超过3%。 现从中抽取100件产品,结果发现有5件次品,
lim P(
n
) 1
估计值的优良标准
问题:
不是那一个统计量来估计某个总体 m 参数?
o
x 第一,我们为什么以这一个而 me
第二,如果有两个以上的统计 估计值的优良标准: 量可以用来估计某个总体参数,其 无偏性、有效性、一致性 估计结果是否一致?是否一个统计 量要优于另一个?
(二) 主要的样本指标
指根据抽样总体各个单位的标志值 样本指标 或标志特征计算的综合指标,又被 称为统计量,它是随机变量。
设样本中 n 个样本单位某项标志的标志值 分别为 x1 , x2 , xn ,其中具有和不具有某 种属性的样本单位数目分别为 n1和 n0 个,则
⒈ 样本平均数(又叫样本均值):
可以这样去推理:鱼在湖中的游动具有一定
的随机性质,如果网是均匀撒出的,则打捞出的
鱼应当对湖中整个的鱼具有较好的代表性。整个 但可以通过有记号的鱼所占的比重n1/n去估计,
即
N 1 n1 N n
湖中有记号的鱼所占的比重(记为P)N1/N虽然未知,
于是,整个湖中鱼的总数目N的点估计就是
ˆ nN1 N n1
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样推断
总体指标:参数
(未知量)
统计推断
7抽样推断

置信下限
置信上限
置信下限=
x − ∆x
p − ∆p
置信上限=
x +∆ x
p +∆ p
两种情况) 三、区间估计的计算(两种情况)
Ⅰ)已知抽样极限误差,求概率保证程度 已知抽样极限误差, 第一步:抽取样本,计算样本指标,作为总体指标 估计值,并算出抽样平均误差; 第二步:根据给定的抽样极限误差估计总体指标所 在的上下限; 第三步:求出概率度t,再根据《正态分布概率表》 求出相应的概率保证程度F(t)。
k
···
k
3·等距抽样(机械抽样) 等距抽样(机械抽样) 等距抽样 •方法:将总体单位按某一标志排序,而后按一 方法:将总体单位按某一标志排序, 方法 定的间隔抽取样本单位。 定的间隔抽取样本单位。
······
·
·
·
·
·
·
(总体单位按某一标志排序) 总体单位按某一标志排序) 排序依据的标志: 排序依据的标志:(1)无关标志;(2)有关标志 )无关标志; )
所有可能的n 的样本( 所有可能的 = 2 的样本(共16个) 个 16个样本的均值(x) 个样本的均值( ) 个样本的均值 第一个 观察值 第二个观察值 第二个观察值
1 1,1 2,1 3,1 4,1
2 1,2 2,2 3,2 4,2
Байду номын сангаас
3 1,3 2,3 3,3 4,3
4 1,4 2,4 3,4 4,4
第二节 抽样误差
一、抽样误差的含义
抽样估计的可能误差 抽样推 断误差 由人为原因造成的、 由人为原因造成的、可以避免的 误差:非抽样误差 误差: 非人为原因造成的、 非人为原因造成的、无法避免的 误差:抽样误差 误差:
抽样推断

t=1.96 F(t)=95%
t=2 F(t)=95.45%
t=3 F(T)=99.73%
28
x
2 x
3 x
4 x
5 x 432x xx 5 x
2020/7/24
第三节 抽样估计
一、点估计
点估计以样本指标的实际值直接作为相应总体指标的估计
值,即直接以样本平均数、成数推断总体的平均数和成数。
设Xˆ 表 示 总 体 平 均 数X的 估 计 量 ,Pˆ 表 示 总 体 成 数P的 估 计 量
第四节 必要样本
单位数的确定 一、确定必要样本单位数的意义
直接关系到抽样误差大小 影响到抽样推断的效果 影响到抽样调查的成本
34
样本单位数越多, 抽样误差越小
抽样单位数越多, 抽样效果越好
抽样单位数越多, 调查成本越大
2020/7/24
第四节 必要样本 单位数的确定
二、必要样本单位数的确定
重复抽样
1
1
7
0
0
8
1
1
9
2
4
63
0
12
x x 63 7元 M9
x X 2 12 1.15元
x
M
9
x X X X X 2
5
-2
4
7
0
0
9
2
4
21
—
8
X X 21 7元
N
3
X X 2 8 1.63元
N
3
1.63 1.15元
x
n
2
第二节 抽样误差
样本平均数:x
x
n
xf f
样本方差: 2 ( x x)2 ( x x)2 f
7抽样推断——精选推荐

7抽样推断7 抽样推断教学目标通过本章的学习,要求学生掌握抽样推断的基本原理和方法,能够利用样本资料推断总体指标。
学习中要重点掌握抽样误差的计算,简单随机抽样下总体参数的区间估计及样本单位数的计算。
关键词汇总体(Population)样本(Sample )抽样平均误差(Sampling Average Error)参数估计(Parameter Estimation)7 抽样推断7.1 抽样推断概述7.2 抽样推断中的误差7.3 抽样估计7.4 抽样单位数的确定◎知识归纳◎习题与思考题7.1 抽样推断概述7.1.1 抽样推断的意义及特点抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。
在实际工作中,有的社会经济现象因总体单位数众多而不便于采用全面调查,例如市场商品需求量、城市居民家庭收支情况、农产品量预测等等。
或者当某些现象总体的数量特征是要经过破坏性测试才能取得的情况下,如炮弹射程的远近测试、灯泡使用寿命的测试等等,都很难对每个单位进行调查,只能组织抽样调查,取得部分单位的实际资料,来估计判断总体的数量特征,以达到对现象总体的认识。
抽样推断不同于一般的推算,归纳起来有如下特点:1 抽样推断是由部分推算整体的一种认识方法2 抽样推断是建立在随机取样的基础上3 抽样推断是运用概率估计方法4 抽样推断的误差可以事先计算并加以控制7.1.2 抽样推断的作用抽样推断由于调查单位少,具有节省人力、物力、时间等优点,因而这种方法在统计中的作用日益显著,归纳起来有以下几个方面的作用。
1 可用于对无限总体数量特征的推断无限总体包括的单位数是不可数的,如连续生产的某种产品的产量,大海里鱼的资源数等,对这类总体无法进行全面调查,必须采用抽样推断的方法来认识总体的数量特征。
2 可用于某些不必要进行全面调查的总体数量特征的推断有些现象理论上可以进行全面调查,但由于调查对象包括的范围广、单位多,需花费较多的人力、物力和时间,这时采用抽样推断的方法可以取得事半功倍的效果。
统计学原理第七章 抽样推断

11
§7.2 抽样误差
1. 抽样误差 样本指标与被估计的总体指标之间,总是存在着某种程度的离差,
这种离差就是抽样误差 2.抽样平均误差
又叫抽样标准误差,是反映抽样误差一般水平的指标,也可以说 是样本指标的标准差
12
§7.2 抽样误差
一、影响抽样误差的因素 1 样本容量 2 总体各单位标志值的差异程度 3 抽样方法 4 抽样组织形式
0.18 1.9% 500
p
p(1 p) (1 n )
n
NLeabharlann 0.18 (1 500 ) 1.84% 500 10000
因此,重复抽样下,手机持有率的抽样平均误差为1.9%;不重复 抽样下,手机持有率的抽样平均误差为1.84%。
20
§7.3 抽样估计
一、 抽样估计 根据样本平均数或成数估计总体平均数或成数。
3
§7.1 抽样推断的基础理论 抽样推断过程:
全及总体 样本
总体指标
样本统计量
4
§7.1 抽样推断的基础理论
概念 抽样推断是按随机原则从全部研究对象中抽取一部分单位进行调查, 并以调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计 与推断,从而认识现象总体的一种统计方法。
特点 1.按随机原则抽选调查单位 2.非全面调查 3.抽样误差是可以事先计算并控制
1
x x xf
n f
2
s2 (x x)2 (x x)2 f
n
f
3 4
s (x x)2 (x x)2 f
n
f
p n1 n
5
s2 p(1 p)
9
§7.1 抽样推断的基础理论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x x , p P p
x x x x
总体平均数 落在抽样平均数
成数 p ±Δp 的范围内
pp pp 的范围内,总体成数 P 落在抽样 x x
15
4.影响抽样误差大小的因素 抽样平均误差受以下几方面的因素影响:
(1)总体各单位的变异性。 (2)抽样单位数的多少。 (3)抽样方法。 (4)抽样调查的组织形式。
(五)抽样误差与抽样平均误差 1.抽样误差的概念 含义:指样本指标和总体指标之间数量上的差别。 如抽样平均数与总体平均数之差 、抽样成数与总 体成数之差等。
抽样调查中的误差有两个来源 :
(1)登记性误差;2)代表性误差
代表性误差的发生有两种情况:
(1)非随机的代表性误差;(2)随机性误差
13
2.抽样平均误差 含义:是抽样平均数(或抽样成数)的标准差,它
16
5.简单随机抽样的抽样平均误差
抽样平均数的平均误差 重置抽样 :
不重置抽样 :
抽样成数的平均误差 重置抽样 :
不重置抽样 :
(x) n
(x)
n
N n N 1
(p)
P(1 P) n
(p)
P(1 P) n
N n N 1
17
三、抽样推断的理论依据
(一)大数定理
lim
n
p
1 n
➢ 4.抽样调查可以用于工业生产过程的质量控制。 ➢ 5.利用抽样调查原理,还可以对某种总体的假设进行检
验,来判断这种假设的真伪,以决定行动的取舍。
二、抽样推断的几个基本概念
抽样涉及的基本概念有: 总体与样本 样本容量与样本个数 总体参数与样本统计量 重复抽样与不重复抽样 抽样误差与抽样平均误差
20
一、总体参数估计概述
基本内容
一、抽样推断的基本概念与原理 二、参数估计 三、抽样组织方式 四、样本容量的确定
任务一 抽样推断的基本概念与原理
本节主要内容: 一、抽样推断的意义 二、抽样推断中的基本概念 (一)总体与样本 (二)总体参数和样本统计量 (三)抽样方法
三、抽样推断的理论依据 (一)大数定理 (二)中心极限定理
s2
(x
f
x)2 1
f
11
(四)重复(置)抽样与不重复(置)抽样
重复抽样——也叫回置抽样,指从总体的N个单位 中抽取一个容量为n的样本,每次抽出一个单位后, 再将其放回总体中参加下一次抽取,这样连续抽n 次即得到一个样本。
不重复抽样——也叫不回置抽样,是指抽中单位不 再放回总体中,下一个样本单位只能从余下的总体 单位中抽取。
反映抽样平均数(或抽样成数)与总体平均数 (或总体成数)的平均差异程度 。
抽样平均数的平均数等于总体平均数,抽样成数的
平均数等于总体总数,因而抽样平均数(或抽样
成数)的标准差实际上反映了抽样平均数(或抽
样成数)与总体平均数(或总体成数)的平均差
异程度。
14
3.抽样极限误差
含义:抽样估计时,应根据研究对象的差异程度和分析任务的需要来确定样本 指标与总体指标之差的可允许的误差范围,这种允许的误差范围称为抽样极限 误差。
这些概念是统计学特有的,体现了统计学的基本思想与方 法。
8
(一)总体和样本 1.总体:又称全及总体、母体,指所要研究对象的
全体,由许多客观存在的具有某种共同性质的单位
构成。总体单位数——即总体容量用 N 表示。
2.样本:又称子样,来自总体,是从总体中按随机 原则抽选出来的部分单位构成的总体。样本单位
就是大数定理的意义。
18
(二)中心极限定理
中心极限定理的意义:在一定条件下,大量相互独 立的随机变量之和的概率分布是以正态分布为极 限的。其主要内容是:如果总体分布未知,且存在 有限的均值和方差,则当样本容量足够大时,抽 样平均数近似服从正态分布。
X
~
N
,
2
n
19
任务二 参数估计
本节主要内容: 总体参数估计概述 总体参数的点估计 参数区间估计 样本容量的确定
5
一、抽样推断的概念、特点和作用
(一)什么是抽样推断 它是按随机原则从全部研究对象中,抽取一部分
单位(即样本)进行观察,并依据获得的数据对总 体的数量特征作出估计和判断,以达到对总体的认 识。 (二)抽样推断的特征
1.部分推断整体的一种方法。
2.抽样推断遵循随机原则。
3.抽样推断运用概率估计的方法。
4.抽样会产生误差,但可以事先计算并加以控制6 。
(三)抽样调查的作用
➢ 1.对某些不可能进行全面调查而又要了解其全面情况的 社会经济现象,必须应用抽样调查。
➢ 2.对某些社会经济现象虽然可以进行全面调查,但抽样调 查可以节约时间、费用,提高调查的时效性。
➢ 3.抽样调查和全面调查同时进行,可以发挥相互补充和 检查质量的作用。
项目七 抽样推断
学习目标
1.理解抽样推断的概念及特点; 2.理解抽样误差产生的原因; 3.对抽样误差、抽样平均误差、抽样极限误差加以区别; 4.重点掌握简单随机抽样组织形式的区间估计方法; 5.掌握必要样本容量的确定方法。
学习重点
• 抽样推断的概念及特点; • 简单随机抽样组织形式的区间估计; • 简单随机抽样单位数的确定方法。
10
(三)总体参数和样本统计量
总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。 主要包括:总体平均数及其方差、总体成数及其方差
样本统计量:根据样本分布计算的指标,或称“样本估计量”、“样本指标”, 是随机变量。 主要包括:样本平均数及其方差、样本成数及其方差 注意:
s2
(x x)2 n 1
数即样本容量用 n 表示。
3.总体是唯一的、确定的,而样本是不确定的、 9 可变的、随机的。
(二)样本容量与样本个数
样本容量:一个样本中所包含的单位数,用n表示。
样本个数:又称样本可能数目,指从一个总体中所可 能抽取的样本的个数。对于有限总体,样本个数可 以计算出来。样本个数的多少与抽样方法有关。 (这个概念只是对有限总体有意义,对无限总体没 有意义!)
n i1
Xi
1
lim
n
p
m n
p
1
当样本容量n 充分大时,可以用 样本平均数估计总体平均数。
当试验次数n充分大时, 可以用素影响而表
现出差异性,但是,对总体的大量观察后进行平均,
就能使偶然因素的影响相互抵消,从而使总体平
均数稳定下来,反映出事物变化的一般规律,这