05第五章抽样推断
合集下载
《抽样推断概述》课件

实际应用中的问题
1 样本容量的影响
探讨样本容量对推断结 果的影响,以及如何选 择适当的样本容量。
2 多重比较问题
解决多重比较问题时需 要注意的统计学考虑因 素。
3 可信度分布分析
介绍可信度分布分析的 概念,以及如何使用该 方法进行推断。
总结和展望
1 抽样推断的局限性
总结抽样推断的局限性,例如样本偏差和抽样误差的不可避免性。
《抽样推断概述》PPT课 件
抽样推断概述PPT课件大纲
背景引入
1 认识抽样推断
了解抽样推断的定义、作用和重要性。
2 抽样推断的应用领域
探索抽样推断在实际应用中的广泛领域, 如市场调研、医学研究和金融分析。
样本的概念
1 总体和样本
2 抽样方法
解释总体和样本的概念, 以及它们在抽样推断中 的作用。
介绍常用的抽样方法, 如简单随机抽样、分层 抽样和整群抽样。
3 样本误差与抽样误差
讨论样本误差和抽样误 差的含义和影响。
统计推断的基本步骤
1 点估计与区间估计
比较点估计和区间估计的优缺点,以及它们在推断中的应用。
2 统计假设检验与置信区间
解释统计假设检验步骤和置信区间的概念,并讨论它们的意义和用途。
3 参数和统计量
区分参数和统计量的概念,以及它们在推断中的不同作用。
常见的统计学方法
1 正态分布的基础知识
2 单样本均值的检验
介绍正态分布的特点和定理,以及它在统 计学方法中的重要性。
解释如何使用单样本均值的检验来推断总 体均值。
3 双样本均值的检验
4 方差分析
说明如何通过双样本均值的检验来比较不 同总体均值。
讨论方差分析的原理和应用,以及它在多 总体比较中的优势。
第5章__抽样推断

抽样误差的影响因素
(1)总体各单位标志变异程度。 (2)样本容量的大小。 (3)抽样方法。 (4)抽样的组织形式。
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
计算方法:
它等于样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解 已知: N 2000, n 400, x 4800, 300
则:
x
n
300 15(小时) 400
x
2 1 n
3002 1
400
13.42(小时)
n N
-20
400
-15
225
-5
25
0
0
-15
225
-10
100
0
0
5
25
-5
25
0
0
10
100
15
225
0
0
5
25
15
225
20
400
0
2000
样本平均数的平均数( x )
x
样本可能数目
960 16
60元
所以 (x) X
样抽样平均误差x
x (x)2
样本可能数目
2000 11.18元 16
四个工人工资分别为40、50、70、80元
抽样平均误差 x
n
15.81 11.18元 2
第5章抽样推断40页PPT

影响抽样误差的主要因素: 1、总体各单位标志值的差异程度。在其他条件不变的情况下, 总体各单位标志值的变异程度愈大,抽样误差也愈大,反之则 愈小。 2、样本的单位数。在其他条件不变的情况下,样本单位数愈 多,抽样误差就愈小,反之则愈大。 3、抽样方法。抽样方法不同,抽样误差也不同。一般说来,重 复抽样的误差比不重复抽样的误差要大。
例 题二:
某厂生产一种新型灯泡共2000只,随机抽出400只 作耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
解: 则:
已知 N 20 ,n 0 4 00 ,x 0 48 , 0 3 000
x
n
3001(5小)时 400
x
2 1 n
则:样本合格率 pnn130060.98 n 300
p
p 1 p 0 .9 8 0 .0 20 .8( 0% 8 )
n
300
p
p1p1n
n N
0.980.021 300 0.80(6 %) 300 60000
4、抽样调查的组织形式。选择不同的抽样组织形式,也会有 不同的抽样误差。
抽样平均误差
抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽 样平均数与总体平均数抽样,成数与总体成数的平均误差程度。
抽样平均数的 平均误差
x
抽样成数的 平均误差
p
重复抽样 2
nn
p(1 p) n
不重复抽样
2 (1 n )
总体平均数
X
Xf f
总体标准差
(X X)2 f f
总体成数
p N1 N
成数标准差 p P(1P)
将总体N个单位分成性质相反的两组,其中具有某特征
例 题二:
某厂生产一种新型灯泡共2000只,随机抽出400只 作耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
解: 则:
已知 N 20 ,n 0 4 00 ,x 0 48 , 0 3 000
x
n
3001(5小)时 400
x
2 1 n
则:样本合格率 pnn130060.98 n 300
p
p 1 p 0 .9 8 0 .0 20 .8( 0% 8 )
n
300
p
p1p1n
n N
0.980.021 300 0.80(6 %) 300 60000
4、抽样调查的组织形式。选择不同的抽样组织形式,也会有 不同的抽样误差。
抽样平均误差
抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽 样平均数与总体平均数抽样,成数与总体成数的平均误差程度。
抽样平均数的 平均误差
x
抽样成数的 平均误差
p
重复抽样 2
nn
p(1 p) n
不重复抽样
2 (1 n )
总体平均数
X
Xf f
总体标准差
(X X)2 f f
总体成数
p N1 N
成数标准差 p P(1P)
将总体N个单位分成性质相反的两组,其中具有某特征
《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
统计学05第五章抽样推断

(2)
计算 p
p1 p
n
(3) 根据 F Z 查表 Z
(4) 计算 Z
(5) 写出:P : p , p
2020/11/17
第五章 抽样推断
44
2.3 区间估计
【例5-5】某工厂要估计一批总数5 000件的产品的废品率,于是随机抽 出 400 件产品进行检测,发现有32 件废品。在置信度为 90% 的要求下, 试给出该批产品的废品率的区间估 计。
总体参数和样本统 x计 量x-x2 n
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2020/11/17
2020/11/17
第五章 抽样推断
35
2.3 区间估计
2. 给定 , 已知 X , 总体平均数的估计:
步骤
内
容
(1) 抽样,计算 x 区间的中心
(2) 计算抽样平均误差: X n
(3) 计算 Z 查表F Z
(4) 根据 x 和 : X : x ,x
2020/11/17
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2020/11/17
第五章 抽样推断
16
2.2 点估计
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
22
统计学课件05第5章抽样与参数估计

反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。
统计学课件:抽样推断

3.当总体X~N(, 2),从中抽取容量为n的样本,则
n
2
(n 1)s2
2
~
(2 n-1); 2
(xi x)2
i 1
2
~
(2 n-1)
4. 2—分布的性质 (1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ), X,Y独立,则 X +Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则 E(X)= n,D(X)=2n
3、进行产品质量检验 4、进行假设检验
(一)总体和样本 1、总体 总体也称全及总体,指所有认识的研究对象全体,它是
有所研究范围内具有某种共同性质的全体单位所组成的 集合体。 一般用英文字母大写N来表示总体的单位数。 2、样本 样本又称子样,它是从全及总体中随机抽取出来,作为 代表这一总体的那部分单位组成的集合体。 一般用英文小写字母n来表示样本的单位数。
5. 分位点 设X ~ 2(n),若对于:0<<1,
存在 2 (n) 0 满足
P{X 2 (n)} ,
则称 2 (n) 为 2 (n) 分布的上分位点。
2
(n
)
(二)t 分布
若X 服从N (0,1),Y 服从自由度为n的 2分布, 且X 和Y 独立,则 X
Y /n 服从自由度为n的 t分布。
1、全及指标 根据各单位的标志值或标志属性计算的,反映总体
数量特征的综合指标称为全及指标,又称为参数。
设总体变量 X 为: X1, X 2 ,X N 则有:
X X XF N F
2 X X 2 X X 2 F
N
F
设总体 N 个单位,有 N1 个单位具有某种性质, N0 个单位不具有某种性质,
《抽样推断》课件 (2)

参数估计
通过样本数据得到总体参数的估计值。
1
点估计
用单个统计量估计总体参数。
2
区间估计
用一个区间估计总体参数,包含真实参数的可能范围。
3
最大似然估计
选择使样本数据出现的概率最大的参数估计值。
置信区间的计算
置信区间提供了一个总体参数的范围估计。
计算方法
正态分布假设
根据样本数据和置信水平, 使用统计方法计算置信区间。
《抽样推断》PPT课件 (2)
抽样推断是统计学的重要概念之一,通过从总体中选取一部分样本,对总体 的特征进行推断。本课件将介绍抽样推断的概念、抽样方法、样本容量的确 定、参数估计、置信区间的计算、假设检验的基本原理以及实例分析。
抽样推断的概念
抽样推断是从样本数据中,通过统计方法推断总体的特征。借助抽样推断,我们能够在研究中得 到有关总体的重要信息,而无需对整个总体进行研究。
3 分层抽样
4 整群抽样
将总体划分为若干层,每层内进行简单 随机抽样。
将总体划分为若干群,随机抽取群内的 全部个体作为样本。
样本容量的确定
样本容量的大小对抽样推断的准确性有重要影响。
总体大小
总体越大,需要的样本容 量越大。
可接受的抽
置信水平
置信水平越高,需要的样 本容量越大。
在满足一定条件下,可以使 用正态分布进行置信区间的 计算。
置信水平
置信区间给出的范围包含了 真实总体参数的概率。
假设检验的基本原理
假设检验用于对总体参数的某个假设进行验证。
原假设
对总体参数的一个特定 值或范围的假设。
备择假设
与原假设相对立的假设。
检验统计量
用于比较观察到的样本 数据与原假设的预期值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 在点估计的基础上,给出总体参数估计的一个估 计区间,该区间由样本统计量加减估计误差而得 到
2. 根据样本统计量的抽样分布能够对样本统计量与 总体参数的接近程度给出一个概率度量 比如是,95某%班级平均置分信数区在间75~85之样间(本点,统估计计置量)信水平
置信下限
置信上限
2021/1/2
第五章 抽样推断
2021/1/2
第五章 抽样推断
35
置信区间的表述
(confidence interval)
1. 当抽取了一个具体的样本,用该样本所构造的区间是一 个特定的常数区间,我们无法知道这个样本所产生的区 间是否包含总体参数的真值,因为它可能是包含总体均 值的区间中的一个,也可能是未包含总体均值的那一个
2. 一个特定的区间总是“包含”或“绝对不包含”参数的 真值,不存在“以多大的概率包含总体参数”的问题
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2021/1/2
第五章 抽样推断
10
1.3 抽样推断的基本条件
2021/1/2
第五章 抽样推断
22
2.2 点估计
优良估计量的三个标准: 1.无偏性: (unbiasedness)
E (统计量) = 总体参数
样本平均数 — E x x X
样本成数 — E p p P
2021/1/2
第五章 抽样推断
23
2.2 点估计
优良估计量的三个标准:
2.一致性:(consistency)
2. 统计学家在某种程度上确信这个区间会包含真正的总体 参数,所以给它取名为置信区间
3. 如果用某种方法构造的所有区间中有95%的区间包含总 体参数的真值,5%的区间不包含总体参数的真值,那么, 用该方法构造的区间称为置信水平为95%的置信区间。 同样,其他置信水平的区间也可以用类似的方式进行表 述
第五章
抽样推断
第一节 抽样推断及其特点 第二节 总体参数估计 第三节 假设检验概述
2021/1/2
第五章 抽样推断
1
统计名言
不象其他科学,统计从来不打算使自 己完美无缺,统计意味着你永远不需 要确定无疑
—— Gudmund R.Iversen
2021/1/2
第五章 抽样推断
2
参数估计在统计方法中的地位
公式 x x 2
n
作用
反映样本的 离散程度
S 2 x
x x2
n1
推断总体
2021/1/2
第五章 抽样推断
28
2.2 点估计
总体参数的点估计:
原则优 缺:点总: 体参数估计值就取统
计量11..的简 无值单 法明 提了 供; 误差情况;
2. 2.
能 估 X 提 计 x供 的具 可体 靠 Pˆ 估 程 p度 计无 值。
置信区间的表述
(confidence interval)
1. 使用一个较大的置信水平会得到一个比较宽的置信区间, 而使用一个较大的样本则会得到一个较准确(较窄)的区间。 直观地说,较宽的区间会有更大的可能性包含参数
2. 但实际应用中,过宽的区间往往没有实际意义 比如,天气预报说“在一年内会下一场雨”,虽然这很 有把握,但有什么意义呢?另一方面,要求过于准确 (过窄)的区间同样不一定有意义,因为过窄的区间虽 然看上去很准确,但把握性就会降低,除非无限制增 加样本量,而现实中样本量总是有限的
3. 区间估计总是要给结论留点儿余地
2021/1/2
第五章 抽样推断
38
置信区间与置信水平的关系
均值的抽样分布
x
/2
1 –
/2
x
x
(1 - ) % 区间包含了 % 的区间未包含
2021/1/2
第五章 抽样推断
39
2.3 区间估计
1. 区间的确定:
ΔΔ
x
1. 区间的中心
2. — 统计量的值,如x 、:p 2. 区间的半径 Δ 3. — 允许(极限)误差。
2021/1/2
第五章 抽样推断
4
大学生每周上网花多少时间?
回答类别 3小时以下 3~6小时 6~9小时 9~12小时 12小时以上
合计
人数(人) 32 35 33 29 71 200
频率(%) 16 17.5 16.5 14.5 35.5 100
平均上网时间为8.58小时,标准差为0.69小时。全校学生 每周的平均上网时间是多少?每周上网时间在12小时以 上的学生比例是多少?你做出估计的理论依据是什么?
抽样推断的基本条件
1. 选择统计量—优良估计量。 2. 合适的允许误差—精确性。 3. 可接受的置信度—可靠性。
精确性和可靠性是一对矛盾。要根据问 题的性质和研究的需要在二者间权衡。
2021/1/2
第五章 抽样推断
11
1.4 抽样推断的误差 统计误差的分类
登记性误差
可消除
统计误差
代表性误差
系统误差 抽样误差
2021/1/2
第五章 抽样推断
19
2.1 总体参数估计概述
总体参数估计就是以样本统计量来估 计总体参数。
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2021/1/2
第五章 抽样推断
20
2.2 点估计(point estimate)
2021/1/2
第五章 抽样推断
可消除 可控制
12
1.4 抽样推断的误差
抽样误差
1. 抽样实际误差:
对某一样本而言,由随机因素引起的 样本统计量与总体参数在数量上的差异 就是抽样实际误差。
xX
2021/1/2
第五章 抽样推断
13
1.4 抽样推断的误差
2. 抽样平均(标准)误差:
抽样平均误差是抽样平均数的标准差,它 反映样本平均数(样本成数)与总体平均数 (总体成数)之间的平均差异程度。
抽样推断的方法: —总体参数的估计 —总体参数的假设检验。
2021/1/2
第五章 抽样推断
7
1.1 抽样推断及其特点 抽样推断的特点
1. 抽样推断必须遵循随机原则。 2. 对抽样误差可以事先加以计算和控制。 3. 具有经济性、时效性,应用广泛的特点。 4. 可对全面调查的结果进行检验和修正。
2021/1/2
σ 2 优良估计量 σ 2 其他估计量
σ 2 x σ 2 c
2021/1/2
第五章 抽样推断
26
2.2 点估计 总体参数
优良估计量
2X
2 P
2021/1/2
S 2 x x x 2 n1
2 p p1 p
第五章 抽样推断
27
2.2 点估计
样本方差
符号 2 x
第五章 抽样推断
8
1.2 总体参数和样本统计量
பைடு நூலகம்
含义
总体参数与样本统计量的比较
总体参数
样本统计量
总体的指标
样本的指标
性 质 唯一、常量
不唯一、随机变量
特点 未知
易求
常 见 X、P、 X
x、p、S x
目 的 利用样本统计量推断总体参数
2021/1/2
第五章 抽样推断
9
1.2
总体参数和样本统 x计 量x-x2 n
2021/1/2
第五章 抽样推断
34
置信区间的表述
(confidence interval)
1. 总体参数的真值是固定的,而用样本构造的区间则是不 固定的,因此置信区间是一个随机区间,它会因样本的 不同而变化,而且不是所有的区间都包含总体参数
2. 实际估计时往往只抽取一个样本,此时所构造的是与该 样本相联系的一定置信水平(比如95%)下的置信区间。 我们只能希望这个区间是大量包含总体参数真值的区间 中的一个,但它也可能是少数几个不包含参数真值的区 间中的一个
X
x
n
p
P 1 P
n
2021/1/2
第五章 抽样推断
14
1.4 抽样推断的误差
总体标准差和成数的确定:
总体变化不大,采用过去总体指标数值做代 替;
用样本标准差σ(x) 或样本成数 p 替代; 对于成数,可取 P = 0.5;如果有多个 P 值,
取其最接近 0.5 的P 做替代。
2021/1/2
第五章 抽样推断
15
1.4 抽样推断的误差
3. 抽样极限(允许)误差
是样本统计量与被估计的总体参数之 绝对离差的最大允许值,常用Δ表示,可 简称为极限误差或允许误差。
xX x
;
pP p
2021/1/2
第五章 抽样推断
16
1.4 抽样推断的误差
Δ和μ的关系:
Z
Z
Z —概率度,Z 表示以抽样平均误差为标 准单位对极限误差的度量值。由Z 确定的概率 保证程度F(Z)—置信度。
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
Xˆ x Pˆ p ˆ 2 S 2 ( x x )2
n1
2021/1/2
第五章 抽样推断
21
估计量与估计值
(estimator & estimated value)
2021/1/2
第五章 抽样推断
2. 根据样本统计量的抽样分布能够对样本统计量与 总体参数的接近程度给出一个概率度量 比如是,95某%班级平均置分信数区在间75~85之样间(本点,统估计计置量)信水平
置信下限
置信上限
2021/1/2
第五章 抽样推断
2021/1/2
第五章 抽样推断
35
置信区间的表述
(confidence interval)
1. 当抽取了一个具体的样本,用该样本所构造的区间是一 个特定的常数区间,我们无法知道这个样本所产生的区 间是否包含总体参数的真值,因为它可能是包含总体均 值的区间中的一个,也可能是未包含总体均值的那一个
2. 一个特定的区间总是“包含”或“绝对不包含”参数的 真值,不存在“以多大的概率包含总体参数”的问题
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2021/1/2
第五章 抽样推断
10
1.3 抽样推断的基本条件
2021/1/2
第五章 抽样推断
22
2.2 点估计
优良估计量的三个标准: 1.无偏性: (unbiasedness)
E (统计量) = 总体参数
样本平均数 — E x x X
样本成数 — E p p P
2021/1/2
第五章 抽样推断
23
2.2 点估计
优良估计量的三个标准:
2.一致性:(consistency)
2. 统计学家在某种程度上确信这个区间会包含真正的总体 参数,所以给它取名为置信区间
3. 如果用某种方法构造的所有区间中有95%的区间包含总 体参数的真值,5%的区间不包含总体参数的真值,那么, 用该方法构造的区间称为置信水平为95%的置信区间。 同样,其他置信水平的区间也可以用类似的方式进行表 述
第五章
抽样推断
第一节 抽样推断及其特点 第二节 总体参数估计 第三节 假设检验概述
2021/1/2
第五章 抽样推断
1
统计名言
不象其他科学,统计从来不打算使自 己完美无缺,统计意味着你永远不需 要确定无疑
—— Gudmund R.Iversen
2021/1/2
第五章 抽样推断
2
参数估计在统计方法中的地位
公式 x x 2
n
作用
反映样本的 离散程度
S 2 x
x x2
n1
推断总体
2021/1/2
第五章 抽样推断
28
2.2 点估计
总体参数的点估计:
原则优 缺:点总: 体参数估计值就取统
计量11..的简 无值单 法明 提了 供; 误差情况;
2. 2.
能 估 X 提 计 x供 的具 可体 靠 Pˆ 估 程 p度 计无 值。
置信区间的表述
(confidence interval)
1. 使用一个较大的置信水平会得到一个比较宽的置信区间, 而使用一个较大的样本则会得到一个较准确(较窄)的区间。 直观地说,较宽的区间会有更大的可能性包含参数
2. 但实际应用中,过宽的区间往往没有实际意义 比如,天气预报说“在一年内会下一场雨”,虽然这很 有把握,但有什么意义呢?另一方面,要求过于准确 (过窄)的区间同样不一定有意义,因为过窄的区间虽 然看上去很准确,但把握性就会降低,除非无限制增 加样本量,而现实中样本量总是有限的
3. 区间估计总是要给结论留点儿余地
2021/1/2
第五章 抽样推断
38
置信区间与置信水平的关系
均值的抽样分布
x
/2
1 –
/2
x
x
(1 - ) % 区间包含了 % 的区间未包含
2021/1/2
第五章 抽样推断
39
2.3 区间估计
1. 区间的确定:
ΔΔ
x
1. 区间的中心
2. — 统计量的值,如x 、:p 2. 区间的半径 Δ 3. — 允许(极限)误差。
2021/1/2
第五章 抽样推断
4
大学生每周上网花多少时间?
回答类别 3小时以下 3~6小时 6~9小时 9~12小时 12小时以上
合计
人数(人) 32 35 33 29 71 200
频率(%) 16 17.5 16.5 14.5 35.5 100
平均上网时间为8.58小时,标准差为0.69小时。全校学生 每周的平均上网时间是多少?每周上网时间在12小时以 上的学生比例是多少?你做出估计的理论依据是什么?
抽样推断的基本条件
1. 选择统计量—优良估计量。 2. 合适的允许误差—精确性。 3. 可接受的置信度—可靠性。
精确性和可靠性是一对矛盾。要根据问 题的性质和研究的需要在二者间权衡。
2021/1/2
第五章 抽样推断
11
1.4 抽样推断的误差 统计误差的分类
登记性误差
可消除
统计误差
代表性误差
系统误差 抽样误差
2021/1/2
第五章 抽样推断
19
2.1 总体参数估计概述
总体参数估计就是以样本统计量来估 计总体参数。
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2021/1/2
第五章 抽样推断
20
2.2 点估计(point estimate)
2021/1/2
第五章 抽样推断
可消除 可控制
12
1.4 抽样推断的误差
抽样误差
1. 抽样实际误差:
对某一样本而言,由随机因素引起的 样本统计量与总体参数在数量上的差异 就是抽样实际误差。
xX
2021/1/2
第五章 抽样推断
13
1.4 抽样推断的误差
2. 抽样平均(标准)误差:
抽样平均误差是抽样平均数的标准差,它 反映样本平均数(样本成数)与总体平均数 (总体成数)之间的平均差异程度。
抽样推断的方法: —总体参数的估计 —总体参数的假设检验。
2021/1/2
第五章 抽样推断
7
1.1 抽样推断及其特点 抽样推断的特点
1. 抽样推断必须遵循随机原则。 2. 对抽样误差可以事先加以计算和控制。 3. 具有经济性、时效性,应用广泛的特点。 4. 可对全面调查的结果进行检验和修正。
2021/1/2
σ 2 优良估计量 σ 2 其他估计量
σ 2 x σ 2 c
2021/1/2
第五章 抽样推断
26
2.2 点估计 总体参数
优良估计量
2X
2 P
2021/1/2
S 2 x x x 2 n1
2 p p1 p
第五章 抽样推断
27
2.2 点估计
样本方差
符号 2 x
第五章 抽样推断
8
1.2 总体参数和样本统计量
பைடு நூலகம்
含义
总体参数与样本统计量的比较
总体参数
样本统计量
总体的指标
样本的指标
性 质 唯一、常量
不唯一、随机变量
特点 未知
易求
常 见 X、P、 X
x、p、S x
目 的 利用样本统计量推断总体参数
2021/1/2
第五章 抽样推断
9
1.2
总体参数和样本统 x计 量x-x2 n
2021/1/2
第五章 抽样推断
34
置信区间的表述
(confidence interval)
1. 总体参数的真值是固定的,而用样本构造的区间则是不 固定的,因此置信区间是一个随机区间,它会因样本的 不同而变化,而且不是所有的区间都包含总体参数
2. 实际估计时往往只抽取一个样本,此时所构造的是与该 样本相联系的一定置信水平(比如95%)下的置信区间。 我们只能希望这个区间是大量包含总体参数真值的区间 中的一个,但它也可能是少数几个不包含参数真值的区 间中的一个
X
x
n
p
P 1 P
n
2021/1/2
第五章 抽样推断
14
1.4 抽样推断的误差
总体标准差和成数的确定:
总体变化不大,采用过去总体指标数值做代 替;
用样本标准差σ(x) 或样本成数 p 替代; 对于成数,可取 P = 0.5;如果有多个 P 值,
取其最接近 0.5 的P 做替代。
2021/1/2
第五章 抽样推断
15
1.4 抽样推断的误差
3. 抽样极限(允许)误差
是样本统计量与被估计的总体参数之 绝对离差的最大允许值,常用Δ表示,可 简称为极限误差或允许误差。
xX x
;
pP p
2021/1/2
第五章 抽样推断
16
1.4 抽样推断的误差
Δ和μ的关系:
Z
Z
Z —概率度,Z 表示以抽样平均误差为标 准单位对极限误差的度量值。由Z 确定的概率 保证程度F(Z)—置信度。
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
Xˆ x Pˆ p ˆ 2 S 2 ( x x )2
n1
2021/1/2
第五章 抽样推断
21
估计量与估计值
(estimator & estimated value)
2021/1/2
第五章 抽样推断