第4章参数估计和假设检验

合集下载

参数估计和假设检验

参数估计和假设检验

假设检验
实际中的假设检验问题
假设检验: 事先作出关于总体参数、分布形式、
相互关系等的命题(假设),然后通过样本信息 来判断该命题是否成立(检验) 。



产品自动生产线工作是否正常? 某种新生产方法是否会降低产品成本? 治疗某疾病的新药是否比旧药疗效更高? 厂商声称产品质量符合标准,是否可信?





两个正态总体均值差的检验(t检验) 两个正态总体方差未知但等方差时,比较两正态总体样 本均值的假设检验 函数 ttest2 格式 [h,sig,ci]=ttest2(X,Y) %X,Y为两个正态总体的样本,显 著性水平为0.05 [h,sig,ci]=ttest2(X,Y,alpha) %alpha为显著性水平 [h,sig,ci]=ttest2(X,Y,alpha,tail) %sig为当原假设为真时得 到观察值的概率,当sig为小概率时则对原假设提出质疑 ,ci为真正均值μ的1-alpha置信区间。
例:从某厂生产的滚珠中随机抽取10个,测得滚珠的
直径(单位:mm)如下 15.14 14.81 15.11 15.26 15.08 15.17 15.12 14.95 15.05 14.87 若滚珠直径满服从正态分布N(μ,σ2),其中μ,σ未知。试 求之并计算置信水平为90%的置信区间
x = [15.14 14.81 15.11 15.26 15.08 15.17 15.12 14.95 15.05 14.87]; % 定义样本观测值向量 % 调用normfit函数求正态总体参数的最大似然估计和置信区间 % 返回总体均值的最大似然估计muhat和90%置信区间muci, % 还返回总体标准差的最大似然估计sigmahat和90%置信区间sigmaci [muhat,sigmahat,muci,sigmaci] = normfit(x,0.1)

参数估计和假设检验

参数估计和假设检验

参数估计和假设检验1.参数估计参数估计是指通过样本数据来推断总体参数的过程。

总体参数是指总体的其中一种性质,比如总体均值、总体方差等。

样本数据是从总体中随机抽取的一部分数据,用来代表总体。

参数估计的目标是使用样本数据来估计总体参数的值。

常见的参数估计方法有点估计和区间估计。

(1)点估计点估计是通过一个统计量来估计总体参数的值。

常见的点估计方法有样本均值、样本方差等。

点估计的特点是简单、直观,但是估计值通常是不准确的。

这是因为样本的随机性导致样本统计量有一定的误差。

因此,点估计通常会伴随着误差界限,即估计值的置信区间。

(2)区间估计区间估计是通过一个统计量构建总体参数的估计区间。

常见的区间估计方法有置信区间和可信区间。

置信区间是指当重复抽样时,包含真实总体参数的概率。

置信区间的计算方法是在样本统计量的基础上,加减一个合适的误差界限,得到一个估计区间。

可信区间是指在一次抽样中,包含真实总体参数的概率。

可信区间的计算方法同样是在样本统计量的基础上,加减一个合适的误差界限,得到一个估计区间。

参数估计的应用非常广泛,可以用于各个领域的数据分析和决策。

例如,经济学家可以通过样本数据估计失业率,政治学家可以通过样本数据估计选举结果,医学研究者可以通过样本数据估计药物的疗效等。

2.假设检验假设检验是指通过样本数据来判断总体参数的其中一种假设是否成立。

在假设检验中,我们先提出一个原假设(H0),然后使用样本数据来检验该假设的合理性。

在假设检验中,我们需要确定一个统计量,该统计量在原假设成立时,其分布是已知的。

然后,我们计算该统计量在样本数据下的取值,并通过比较该取值与已知分布的临界值,来判断原假设是否成立。

假设检验包含两种错误,即第一类错误和第二类错误。

第一类错误是指在原假设成立的情况下,拒绝原假设的错误概率。

第二类错误是指在原假设不成立的情况下,接受原假设的错误概率。

常见的假设检验方法有单样本假设检验、双样本假设检验、方差分析等。

参数估计与假设检验

参数估计与假设检验

参数估计与假设检验参数估计是指利用样本数据对总体参数进行估计的过程。

在统计学中,总体参数通常是我们关心的感兴趣的数量,比如总体均值、总体方差等。

通过对样本进行抽样调查,我们可以得到样本数据,然后利用样本数据来估计总体参数的值。

常用的参数估计方法有点估计和区间估计。

点估计是通过一个统计量来估计总体参数的值。

例如,样本均值可以作为总体均值的点估计值,样本方差可以作为总体方差的点估计值。

点估计通常使用最大似然估计或最小二乘估计等方法来求解。

区间估计是通过一个区间来估计总体参数的值。

区间估计提供了一个参数可能取值的范围。

例如,我们可以计算一个置信区间,表示总体参数在一定置信水平下落在该区间内的概率。

常用的区间估计方法有正态分布的置信区间和t分布的置信区间等。

假设检验是用于检验总体参数的假设的方法。

假设检验可以帮助我们判断总体参数是否等于一些特定值,或者两个总体参数是否相等。

假设检验通常需要先提出一个原假设和一个备择假设。

原假设是我们要进行检验的假设,而备择假设则是对原假设的补充或者扩展。

通过计算样本数据的统计量,并结合给定的显著性水平,我们可以得到一个检验统计量的观察值。

根据观察值和显著性水平的关系,我们可以判断是否拒绝原假设。

假设检验的步骤可以分为以下几个部分:1.提出假设:明确原假设和备择假设。

2.选择显著性水平:设定拒绝原假设的标准。

3.计算检验统计量:根据样本数据计算出统计量的观察值。

4.求取拒绝域和接受域:结合显著性水平和检验统计量的分布,确定拒绝原假设的条件。

5.得出结论:通过比较检验统计量的观察值和拒绝域的关系,判断是否拒绝原假设。

假设检验是统计学中非常重要的一部分,它可以帮助我们对实际问题进行科学的推断和决策。

在实际应用中,我们常常使用假设检验来判断广告效果、药物疗效、投资收益等方面的问题。

通过参数估计和假设检验,我们可以从样本数据中获取关于总体参数的信息,并对其进行推断和判断。

管理统计学-第4章 假设检验

管理统计学-第4章  假设检验

• 在本例中,
_
x 32 35
3.184
s / n 5.96 / 40
⑤作出统计决策
• 根据样本信息计算出统计量z的具体值,Z 将它与临界值 相比较,就可以作出接受 原假设或拒绝原假设的统计决策。
• 在本例中,由于z=3.184>1.96,落在拒绝 域内,所以拒绝原假设H0。可以得出结论:
在0.05的显著性水平下,抽样结果的平
– p<α,拒绝零假设 – p>α,不应拒绝零假设
举例1
• 某健身俱乐部主管经理估计会员的平均年 龄是35岁,研究人员从2005年入会的新 会员中随机抽取40人,调查得到他们的年 龄数据如下。
33 28 32 26 37 35 27 29 33 30 35 29 39 34 27 37 34 36 31 29 29 26 19 21 36 38 42 39 36 38 27 22 29 34 36 20 39 37 22 39
素有:总体方差已知还是未知,用于进行检验的
样本是大样本还是小样本,等等。
• 在本例中,由于n=40>30是大样本,所以 近似
服从正态分布,以样本标准差代替总体标准差, 所用的统计量是:
_
x
3.184
s/ n
③选取显著性水平,确定接受域和拒绝域
• 显著性水平(Significant Level):事先给定的形 成拒绝域的小概率,用表示。
(3)右单侧检验
两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,
右单侧检验的拒绝域位于统计量分布曲线的右侧。
④计算检验统计量的值
• 在提出原假设H0和备选假设H1,确定了检验统计 量,给定了显著性水平以后,接下来就要根据

参数估计和假设检验

参数估计和假设检验
统计学
STATISTICS (第三版)
第 4 章 参数估计和假设检验
作者:西南大学商贸系
庞新军
1-1
2021/8/113
统计学
STATISTICS 第 4 章 参数估计和假设检验 (第三版)
§4.1 抽样调查的基本概念 §4.2 抽样估计的基本原理 §4.3 参数估计 §4.4 样本容量的确定 §4.5 假设检验
1 - 33
2021/83/313
统计学
STATISTICS (第三版)
2分布
(2 distribution)
1. 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特 (Hermert)和卡·皮尔逊(K·Pearson) 分别于1875年 和1900年推导出来
2. 设 X ~ N (, 2 ) ,则
合格品(或不合格品) 与全部产品总数之比
2. 总体比例可表示为
N0 或 1 N1
N
N
3. 样本比例可表示为
P n0 或 1 P n1
n
n
1 - 29
2021/82/913
统计学
STATISTICS (第三版)
样本比例的抽样分布
1. 容量相同的所有可能样本的样本比例的概 率分布
2. 当样本容量很大时,样本比例的抽样分布 可用正态分布近似
统计学
STATISTICS (第三版)
抽样分布
(sampling distribution)
1. 样本统计量的概率分布
2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本
5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据

参数估计和假设检验

参数估计和假设检验

参数估计和假设检验参数估计和假设检验是统计学中常用的两种方法,用于根据样本数据对总体的特征进行推断和判断。

参数估计是通过样本数据估计总体参数值的方法,而假设检验则是基于样本数据对总体参数假设进行判断的方法。

下面将详细介绍这两种方法以及它们的应用。

1.参数估计参数是指总体特征的度量,比如总体均值、总体方差等。

在实际应用中,我们往往无法得到总体数据,只能通过抽样得到样本数据。

参数估计的目标是利用样本数据去估计总体参数的值。

最常用的参数估计方法是点估计和区间估计:-点估计是使用样本统计量来估计总体参数的值,常用的样本统计量有样本均值、样本方差等。

-区间估计是利用样本数据构建一个置信区间,用来估计总体参数的取值范围。

置信区间的计算方法通常是基于样本统计量的分布进行计算。

在进行参数估计时,需要注意以下几个要点:-选择适当的样本容量和抽样方法,确保样本具有代表性,并满足参数估计的要求。

-选择适当的样本统计量进行参数估计,并对其进行合理的解释与限制。

-利用抽样分布特性和统计理论,计算参数估计的标准误差和置信区间,对参数估计结果进行解释和判断。

2.假设检验假设检验是基于样本数据对总体参数假设进行判断的方法。

在实际问题中,我们常常需要根据样本数据来判断一些总体参数是否达到一些要求或存在其中一种关系。

假设检验的基本步骤:-建立原假设(H0)和备择假设(H1)。

原假设通常是对总体参数取值的一种假设,备择假设则是原假设的对立假设。

-选择适当的统计量用来检验假设,并计算样本统计量的检验统计量。

-根据样本数据计算得出的检验统计量,利用抽样分布特性和统计理论计算P值。

-根据P值与事先设置的显著性水平进行比较,如果P值小于显著性水平,则拒绝原假设;反之,接受原假设。

在进行假设检验时,需要注意以下几个要点:-显著性水平的选择:显著性水平(α)是进行假设检验过程中设置的一个临界值,它反映了能够容忍的错误发生的概率。

常用的显著性水平有0.05和0.01-选择适当的统计量与检验方法:根据问题的性质和数据类型选择适当的统计量和检验方法。

《统计学(第二版)》电子课件 第4章 假设检验

显著性检验中原假设与备择假设的位置是不对称 的,二者不能随意交换;
显著性检验本身对原假设起保护作用,水平越小, 检验犯第一类错误的概率就越小,换言之,越有 可能不拒绝原假设。
2021/8/7
《统计学》第4章假设检验
4-29
4.1.5 双侧检验和单侧检验
常见的三种显著性假设检验形式: (1)双侧检验 H0 : 0 H1 : 0 (2)右侧检验 H0 : 0 H1 : 0 (3)左侧检验 H0 : 0 H1 : 0
从该批产品中随机抽取了100件,发现其中有4件 次品,即样本次品率为4%,A公司认为样本次品 率4%大于1%,所以不接受B公司的这批产品,B 公司则认为虽然样本次品率为4%,但并不能说明 10万件产品的次品率大于1%,因为样本量很小;
2021/8/7
《统计学》第4章假设检验
4-3
问题
(1)A公司是否应该接受该批产品? (2)如果随机抽取了100件产品有3件次品,
H0:pp01%
2021/8/7
《统计学》第4章假设检验
4-12
记X为100件产品中次品的数目,直观上看, X越大,原假设越值得怀疑,反之, X越小, 对原假设越有利;问题是, X大到多少应 该拒绝原假设?
两种处理方法:
2021/8/7
《统计学》第4章假设检验
4-13
1. 假定H0成立,计算事件X≥4的概率
4-32
4.2 一个正态总体的检验
4.2.1 总体均值μ的检验: Z检验 考虑如下三种检验问题
H0:0 H1:0 H0:0 H1:0 H0:0 H1:0
(4.4) (4.5) (4.6)
2021/8/7
《统计学》第4章假设检验
4-33

参数估计与假设检验的关系


1-2

参数估计与假设检验的区别
2、区间估计通常求得的是以样本估计值为中心的双侧置 信区间。 假设检验不仅有双侧检验也有单侧检验。 3、区间估计立足于大概率1-α,通常以较大的把握程度( 可信度)1-α去估 计总体参数的置信区间。 假设检验是立 足于小概率α ,通常以很小的显著水平去检验对总体参数 的先验假设是否成立。
双侧检验!
1-7

用置信区间进行检验
(例题分析)
H0: = 1000
置信区间为
H1: 1000
= 0.05
n = 49
临界值(s):
拒绝 H0
拒绝 H0
.025
.025
-1.96 0 1.96 Z
x z 2
n
,
x
z
2
n
9911.96
50 ,991 1.96 16
50 16
966.5,1015.5
3. 右侧检验:求出单边置信上限
X z
n
或X
t
S n
4. 若总体的假设值0大于单边置信上限,拒绝H0
1-6

用置信区间进行检验
(例题分析)
【例】一种袋装食品每包的标准重量应为
1000克。现从生产的一批产品中随机抽取16 袋,测得其平均重量为991克。已知这种产 品重量服从标准差为50克的正态分布。试确 定这批产品的包装重量是否合格?( = 0.05)
参数估计与假设检验的区别
1、参数估计是根据样本资料估计总体参数的真值,假设检验是根 据样本资料来检验对总体参数的先验假设是否成立。 例如,通过 随机抽取的样本对某地区居民的平均收入进行推断:
参数估计:要求以一定的概率估计总体平均收入 假设检验:要求以一定的概率判断总体平均收入是否达到某

第4章参数估计和假设检验

第4章参数估计和假设检验第四章参数估计与假设检验掌握参数估计和假设检验的基本思想是正确理解和应⽤其他统计推断⽅法的基础,后⾯将要学习的⽅差分析、⾮参数检验、回归分析、时间序列等统计推断⽅法都是在此基础上展开的。

需要特别指出的是,所有的统计推断都要以随机样本为基础。

如果样本是⾮随机的,统计推断⽅法就不适⽤了。

由于相关知识在先修课程中已经学习过,本章主要在回顾相关知识的基础上,补充讲解必要样本容量的计算、p值、参数估计和假设检验⽅法的软件操作和结果分析等内容。

本章的主要内容包括:(1)参数估计的基本思想和软件实现。

(2)简单随机抽样情况下样本容量的计算。

(3)假设检验的基本原理。

(4)假设检验中的p值。

(5)⼏种常⽤假设检验的软件实现。

第⼀节参数估计⼀、参数估计的基本概念参数估计是指利⽤样本信息对总体数字特征作出的估计。

例如,我们可以通过估计⼀部分产品的合格率对整批产品的合格率作出估计,通过调查⼀个样本的⼈⼝数来对全国的⼈⼝数作出估计,等等。

参数估计可以分为点估计和区间估计。

点估计是指根据样本数据给出的总体未知参数的⼀个估计值。

对总体参数进⾏估计的⽅法可以有多种,例如矩估计法、极⼤似然估计法等,得到的估计量(样本统计量)并不是唯⼀的。

例如我们可以使⽤样本均值对总体均值作出估计,也可以使⽤样本中位数对总体均值进⾏估计。

因此,在参数估计中我们需要对估计量的好坏作出评价,这就涉及到估计量的评价准则问题。

常⽤的估计量评价准则包括⽆偏性、有效性、⼀致性等。

⽆偏性是指估计量的数学期望与总体参数的真实值相等;有效性的含义是,在两个⽆偏估计量中⽅差较⼩的估计量较为有效,⽅差越⼩越有效;⼀致性是指随着样本容量的增⼤,估计量的取值应该越来越接近总体参数。

样本的随机性决定了估计结果的随机性。

由于每⼀个点估计值都来⾃于⼀个随机样本,所以总体参数真值刚好等于⼀个具体估计值的可能性极⼩。

区间估计的⽅法则以概率论为基础,在点估计的基础上给出了⼀个置信区间,并给出了这⼀区间包含总体真值的概率,⽐点估计提供了更多的信息。

统计学 第4章 假设检验


【解】研究者想收集证据予以支持的假设是该 城市中家庭拥有汽车的比率超过30%。 因此,建立的原假设和备择假设为 H0 :μ≤30% H1 :μ>30%
结论与建议
◆原假设和备择假设是一个完备事件组, 而且相互对立。在一项假设检验中,原假设和 备择假设必有一个成立,而且只有一个成立; ◆先确定备择假设,再确定原假设。因为 备择假设大多是人们关心并想予以支持和证实 的,一般比较清楚和容易确定; ◆等号“=”总是放在原假设上; ◆因研究目的不同,对同一问题可能提出 不同的假设,也可能得出不同的结论。 ◆假设检验主要是搜集证据来推翻和拒绝 原假设。


◆理想地,只有增加样本容量,能同时减小 犯两类错误的概率,但增加样本容量又受到很多 因素的限制; ◆通常,只能在两类错误的发生概率之间进 行平衡,发生哪一类错误的后果更为严重,就首 要控制哪类错误发生的概率; ◆在假设检验中,一般先控制第Ⅰ类错误的 发生概率。因为犯第Ⅰ类错误的概率是可以由研 究者控制的。
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择!
总体
我认为人口的平 均年龄是50岁


抽取随机样本
均值 x = 20
二、原假设与备择假设
什么是假设?
对总体参数的具体数
值所作的陈述

我认为这种新药的疗效 比原有的药物更有效!
总体参数包括总体均值、 总体比率、总体方差等 分析之前必须陈述
备择假设。
500g
【解】研究者抽检的意图是倾向于证实这种洗 涤剂的平均净含量并不符合说明书中的陈述。 因此,建立的原假设和备择假设为 H0:μ≥500 H1:μ< 500
提出假设例3
一家研究机构估计,某城市中家庭拥有 汽车的比率超过 30% 。为验证这一估计是否 正确,该研究机构随机抽取了一个样本进行 检验。试陈述用于检验的原假设与备择假设
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

15.8
27.1 23.8
23.2
22.0 35.3
20.3
36.1 21.6
33.5
23.0 35.7
30.0
22.1 30.8
37.8
26.5 22.7
24.4
22.9 24.5
26.9
26.9 21.9
29.0
30.2 26.5
27.7
25.2 50.3
SPSS输出结果(数据:tv.xls) 操作:分析->描述统计->探索
有限总体校正系数
Finite Population Correction Factor

简单随机抽样、不重复抽样时,样本均值 抽样分布的方差略小于重复抽样的方差, 等于 2 N n n N 1
N n 这一系数称为有限总体校正系数。 N 1


当抽样比(n/N)<0.05时可以忽略有限总 体校正系数。
1
2 3 4
1.0
1.5 2.0 2.5
1.5
2.0 2.5 3.0
2.0
2.5 3.0 3.5
2.5
3.0 3.5 4.0
四川农业大学
样本均值的抽样分布
12
所有样本均值的均值和方差
x
2 x
x
i 1
n
i
M
n i 1
1.0 1.5 4.0 2.5 16
i
M (1.0 2.5) 2 (4.0 2.5) 2 2 0.625 16 n 1. 样本均值的均值(数学期望)等于总体均值
四川农业大学 20

有限总体不重复抽样时,样本比例的方 差也需要乘以“有限总体校正系数”, 即
p ˆ
ˆ (1 p ˆ) N n p n N 1
四川农业大学
21
关于置信度含义的说明
在所有的置信区间中, 有(1-)*100% 的区间包 含 总体真实值。 对于计算得到的一个具 体区间,“这个区间包 含总体真实值”这一结 论有(1-)*100% 的可能 是正确的。 /2
39.4
38.7 9.5 20.6 21.3
35.5
27.2 21.0 19.7 22.8
19.5
26.5 42.4 38.6 23.4
29.3
14.7 13.9 37.1 32.5
31.2
15.6 32.8 17.0 11.3
20.6
28.4 29.8 15.1 43.8
34.9
24.0 32.9 23.4 30.8

指随着样本容量的增大,估计量越来越接 近被估计的总体参数。
P(X )
较大的样本容量
B A
较小的样本容量

四川农业大学 7
X
区间估计

根据事先确定的置信度1-给出总体参数的 一个估计范围。 根据样本统计量的分布推断出总体参数的 置信区间。
置信区间

置信下限
估计值(点估计)
四川农业大学 8
置信上限
由于在实践中总体参数的真实值是未 知的,因此实际抽样误差是不可知的; 由于样本估计值随样本而变化,因此 实际抽样误差是一个随机变量。

四川农业大学
28
抽样平均误差

抽样平均误差:样本均值的标准差,也称为标准误。 它反映样本均值(或比例)与总体均值(比例)的 平均差异程度。 ˆ )2 ˆ E ( 例如对简单随机抽样中的样本均值有:
2. 样本均值的方差等于总体方差的1/n
四川农业大学 13

(x
x )
2
M为样本数目
样本均值的抽样分布与总体分布的 比较
总体分布
.3 .2 .1 0
.3 .2 .1 P(x)
抽样分布
1
2
3
4
0
= 2.5
σ2 =1.25
1.0 1.5 2.0 2.5 3.0 3.5 4.0
样本均值的抽样分布
四川农业大学
17
总体均值的 置信区间
σ2已知?


2
是 总体正态?

n≥30? 否 是 否
x Z
n
x t
s
2
n
x Z 2

n
增大n?数学 变换?
实际中总体方差总是未知的, 因而这是应用最多的公式。在 大样本时t值可以用z值来近似。
四川农业大学 18
根据中心极限定理得 到的近似结果。 σ未知时用s来估计。
x
n

或 x
n
N n (不重复抽样) N 1

我们通常说“抽样调查中可以对抽样误差进行控 制”,就是指的抽样平均误差。由上面的公式可知 影响抽样误差的因素包括:总体内部的差异程度; 样本容量的大小;抽样的方式方法。
最大允许误差


最大允许误差(allowable error):在确定 置信区间时样本均值(或样本比例)加减 的量,一般用E来表示,等于置信区间长 度的一半。在英文文献中也称为margin of error。 置信区间= x E 最大允许误差是人为确定的,是调查者在 相应的置信度下可以容忍的误差水平。

无偏性:估计量的数学期望与总体待估参 数的真值相等: E ( ˆ)
ˆ) P(
无偏 有偏
A
B

四川农业大学 5
ˆ
点估计量的常用评价准则: 有效性

在两个无偏估计量中方差较小的估 计量较为有效。
ˆ) P(
ˆ1 的抽样分布
B A
ˆ2 的抽样分布
ˆ
6

四川农业大学
估计量的常用评价准则:一致性
总体比例的置信区间

ˆ 5, n(1 p ˆ) 5 np 当 时总体比例的置 信区间可以使用正态分布来进行区间估计。 ˆ ,总体比例记为π) (样本比例记为 p
z
ˆ p ~ N (0,1) (1 ) n ˆ (1 p ˆ) p ˆ Z 2 p n
四川农业大学 19
参数估计与假设检验
4.1参数估计 4.2假设检验
四川农业大学
4.1 参数估计
4.1.1 参数估计的基本概念 4.1.2 总体均值和比例的区间估计 4.1.3 必要样本容量的确定

四川农业大学
2
4.1.1 参数估计的基本概念
总体 样本
参数
统计量
?
算术平均数
x
用来推断总体参数的统计量称为估计量(estimator), 其取值称 为估计值(estimate) 。 同一个参数可以有多个不同的估计量。 参数是唯一的,但估计量(统计量)是随机变量,取值是不确 定的。
样本均值的 抽样分布
σ_
x
1 -
/2
_
X
x =
说“总体均值有(1)*100% 的概率落入某 一区间”是不严格的, 因为总体均值是非随机 的 。
四川农业大学
22
Example:用SPSS进行区间估计

例:儿童电视节目的赞助商希望了解儿童每周看电 视的时间。下面是对100名儿童进行随机调查的结 果(小时)。计算平均看电视时间95%的置信区间。
39.7 21.5 19.5 29.9 34.7 15.0 27.0 16.4 41.3 36.8 15.1 23.4 20.5 24.1 31.3 28.9 18.3 23.4 17.0 24.4
40.6
15.5 43.9 33.0 21.0
46.4
31.6 20.6 38.0 21.8
23.6
38.9 29.1 28.7 29.3
四川农业大学 30
简单随机抽样下估计总体均值时 样本容量的确定
E Z / 2

Z , n 2 E n
2
/2
2
式中的总体方差可以通过以下方式估计: 根据历史资料确定 通过试验性调查估计
四川农业大学
31
简单随机抽样下估计总体比例时 样本容量的确定
E Z / 2

(1 )
均值 均值的 95% 置信区间 下限 上限 5% 修整均值 中值 方差 标准差 极小值 极大值 统计量 27.191 25.530 28.852 26.977 26.500 70.104 8.3728 9.5 50.3 标准误 .8373
总体比例的置信区间:例子
1986年对悉尼995 名青少年的随机 调查发现,有216 人每天都抽烟。 试估计悉尼青少 年中每天都抽烟 的青少年比例的 90%的置信区间。
2 2
=
(1645) . (45)
2
2
(5)
2
= 219.2≈ 220
X
x 50
X
总体分布
抽样分布
四川农业大学
15
中心极限定理
从均值为,方差为2的一个任意总体中抽取容量为 n的样本,当n充分大时,样本均值的抽样分布近似 服从均值为μ、方差为σ2/n的正态分布。
x
f(X)
n
大样本(n 30)
小样本
x
X
4.2 总体均值和比例的区间估计
ˆ 5, n(1 p ˆ) 5 解:显然有 np 因此可以用正态分布进行估计。 Z/2=1.645
ˆ Z p
2
ˆ (1 p ˆ) p n
0.217(1 0.217 ) 0.217 1.645 995 0.217 0.0215
结论:我们有 90 %的把握认为悉尼青少年中每 天都抽烟的青少年比例在19.55%~23.85%之间。
相关文档
最新文档