【VIP专享】第五章 统计推断(1)

合集下载

第五章统计推断课件(1)

第五章统计推断课件(1)

2020/8/1
版权所有 BY 统计学课程组
28
一、假设检验的一般性问题(5)
上述的判断实际上体现着反证法的思想。判断的基础是样本
信息,判断的理论依据是小概率原理,即小概率事件在一次试验
(或抽样)中几乎不发生。直观来想,在所做假设是正确的情况
下,那么一次试验(或抽样)中人们期望的结果出现的概率应该
2020/8/1
版权所有 BY 统计学课程组
11
二、区间估计(3)
5.区间估计时应考虑的一些具体问题 在对总体均值进行区间估计时,
常常需要考虑总体是否为正态总体、 总体方差是否已知、用于构造估计量 的样本是大样本(n≥30)还是小样本(n< 30)等几种情况。
2020/8/1
版权所有 BY 统计学课程组
2. 解决问题的统计思想 4. 单、双侧检验问题 6. 统计检验的显著性
二、几种常用、具体的参数检验方法
1. Z检验法 3. c 2 检验法
2. T检验法 4. F检验法
2020/8/1
版权所有 BY 统计学课程组
23
一、假设检验的一般性问题(1)
(一) 问题的提出
2020/8/1
版权所有 BY 统计学课程组
12
二、区间估计(4)--总体均值的区间估计
1.正态总体、总体方差已知;或非正态总体、大样本
2020/8/1
版权所有 BY 统计学课程组
13
二、区间估计(5)--总体均值的区间估计
2.正态总体、总体方差未知、小样本
2020/8/1
版权所有 BY 统计学课程组
14
二、区间估计(6)--总体成数的区间估计
第五章
统计推断
2020/8/1

第五章 统计推断(1)

第五章 统计推断(1)
2检验是根据s判断抽出该样本的总体 其标准差是否等于
某一给定值。
检验程序:
(a) 确定假设H 0和H A: H 0:= 0;H A 有三种可能的形式: ( 1 ) 0 (2) 0 (若已知不可能小于 0 ) (3) 0 (若已知不可能大于 0 )
(b)计算检验的统计量:
1. 单个样本平均数检验
在实际研究中,常常要 检验一个样本平均数 x与已知的总体 平均数0是否有显著差异,即检 验该样本是否来自某一 已知 的总体。
已知的总体平均数一般 为一些公认的理论数值 。如畜禽正常 的生理指标、怀孕期、 生产性能指标等,都可 以样本平均数 与之比较,检验差异显 著性。
1.1 在σ已知的情况下,单个平均数的显著性 检验-u检验 检验程序:
• 两类错误之间的关系如何?
二者的区别是I型错误只有在否定H0的情况下发生,而 II型错误只有在接受H0时才会发生。 二者的联系是,在样本容量相同的情况下,I型错误减 小,II型错误就会增大;反之II型错误减小,I型错误就 会增大。比如,将显著性水平α从0.05提高到0.01,就 更容易接受H0,因此犯I型错误的概率就减小,但相应 地增加了犯II型错误的概率。
第一节 假设检验的基本步骤及原理
1. 假设检验的基本步骤
我们通过一个例子来介绍假设检验的基本步骤:
例一,已知某品种玉米 单穗重X ~ N (300,9.52 ),即单穗重 总体平均数0 300g,标准差 9.5 g。在种植过程中喷洒 了某种药剂的植株中随 机抽取9个果穗,测得平均单穗 重 x 308g,试问这种药剂对该品 种玉米的平均单穗重 有无真实影响?
• (一)提出假设
首先对样本所在的总体 作一假设。假设喷洒了 药剂的玉米单穗重 总体平均数与原来的玉米单穗重总 体平均数0之间没有真实差异, 即=0。也就是说表面差异( x 0)是由抽样误差造成的 。

第五章 统计推断 PPT课件

第五章 统计推断 PPT课件

(点估计)
置信区间
置信下限 ˆ 1
置信上限 ˆ 2
一般地,如果将构造置信区间的步骤重复多次, 置信区间中包含总体参数真值的次数所占的比率, 称为置信水平(概率保证程度)。
即区间包含总体参数真实值的可信度.
通常用1- 表置信水平,其中称为显著性水平。 比较常用的置信水平:90%,95%和99%。
第五章 统计推断
第一节 总体参数估计 第二节 总体参数检验
统计推断在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,某校4名 本科生对全校部分本科生做了问卷调查。调 查的对象为本校在校本科生,调查内容包括 上网时间、途径、支出、目的、关心的校园 网内容,以及学生对收费的态度,包括收费 方式、价格等。
例如,抽取了1000个样本,根据每一个样本均构 造了一个置信区间,这1000个置信区间中,有95% 的区间包含了总体参数的真值,而5%的置信区间则 没有包含。这里,95%这个值被称为置信水平(或置 信度)。
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
点估计完全正确的概率通常为0。因此, 我们更多的是考虑用样本统计量去估计总 体参数的范围 区间估计。
(一)总体参数的区间估计概述
1.基本概念
(1)区间估计:在点估计的基础上,给出总体参数 估计的一个范围,并给出区间估计成立的概率值。


p(1 2 ) 1 样本统计量
P(X )
均值的抽样分布

第五章 统计推断 《试验设计与统计分析》PPT课件

第五章 统计推断  《试验设计与统计分析》PPT课件

则( x1 x 2 ) ~ N ( ( x1 x2 ) , ......
2 ( x1 x 2 )
)。
统计推断
总体 ——从样本到总体
样本
通过一个或多个样本统计数推断总体相应参数
第一节 统计推断的含义和内容
一、统计推断的概念
按照一定的抽样方法,从所研究的总体中,随机抽 出一个样本或一系列样本,并研究样本的特征,然后根 据对样本特征的研究结果去推断总体的特征 。
拿 3棵 拿 4棵 拿 5棵

推断:一次就猜对5棵的概率是0.03125,概率很小, 亦即猜100次只有5次能把5棵麦苗属何品种全猜对, 在一次试验中几乎不可能发生,所以,他若能一次 就说对,不是凭猜的,是确有鉴别能力。
这里有一个概率标准的问题,这个概率标准
称为显著水平(a)一般为0.05或0.01。 我们是依据“小概率实际不可能性原理”进 行推断的。这个原理是说:概率很小的事件, 在一次试验中几乎不可能发生或可以认为不 可能发生。如果我们假设了一些条件,并在 假设的条件下能够准确地算出事件A出现的 概率很小,但在一次试验中,事件A竟出现 了,那么,我们就可以认为这个假设不正确, 从而否定这个假设。
四、统计假设检验的两类错误

1、第一类错误(first kind error)或I型错误(type I error)。––如果H0是真实的,我们通过检验却否定 了它,就犯了一个否定真实假设的错误。第一类错
误只有在否定H0时才会发生。由于规定显著水平为
a ,故H0为真而被否定的概率最多为a ;因而这类
实际上包括了 0 (或1 2 )和 0 (或1 2 )两种情况, 要在 a显著水平否定无效假设 H 0 : 0 (或1 2 ), 必须 否定区,分别位于 水平 a u ua 或u ua,因而这种检验有两个 表示的概率在曲线两尾

《统计学》课件 第五章统计推断

《统计学》课件 第五章统计推断

三、 样本容量的确定

p152
一、问题的提出 二、处理问题的原则 三、简单随机抽样下,调查成本既定时样本容 量确定的方法 1. 估计总体均值时样本容量的确定
2. 估计总体比例时样本容量的确定
2014-1-1
版权所有 BY lazhenx
37
样本容量的确定
一、问题的提出

从推断来看,要达到估计所要求的精确程度,
对置信区间的理解注意:
②总体参数是固定的、未知的,而用样本构造的区间则是不 固定的。若抽取不同的样本,用该方法可以可到不同的区 间,从这个意义上说置信区间是随机区间,会因样本的不 同而不同,而且不是所有的区间都包含总体参数的真值。 ③在实际问题中,进行估计时往往只抽取一个样本,此时所 构造的是与该样本相联系的一定置信水平(比如95%)下的 置信区间。由于用该样本所构造的区间是一个特定的区间 ,而不再是随机区间,所以无法知道这个样本所产生的区 间是否包含总体参数的真值。我们只能希望这个区间是大 量包含总体参数真值的区间中的一个,但它也可能是少数 几个不包含参数真值的区间中的一个。
1.
ˆ P q1 #q
{
ˆ q2 = 1- a
}
置信区间
置信水平1-α
样本统计量 (点估计)
置信下限
置信上限
当总体服从正态分布N(μ,σ2)时,(σ2已知)来自该总体 的所有容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n 即x~N(μ,σ2/n) 置信水

p(
x
原点矩存在,若不存在则无法估计;矩估计法不能充分地利 用估计时已掌握的有关总体分布形式的信息。
2.最大似然估计法
基本思想:当我们经一次抽样取得一些观测数据(样本值) 后,应给未知参数选取一些数值,使得所观测得到的样本值 出现的概率最大。

第05章 统计推断

第05章  统计推断

单侧检验 α=0.05或0.01 统计推断 第五章
§5.1 单个样本的统计假设检验
5.1.2 单个样本的显著性检验程序
统计假设检验的三步曲: 1、建立零假设(null hypothesis)——假设差异不显著或无关; 2、计算统计量(u-检验,t-检验,x2-检验,F-检验);
3、判断假设。 对于带备择假设的零假设:需根据备择假设的拒
F
s , df n 1, df n 1 s
下侧临界点F1-α的 值,按右式计算
解释: F< F0.05,或P>0.05,接受H0; F> F0.05,或P<0.05,拒 Fdf1,df2,α,df 1附表7中没有给出 df 2为分母自由度 为分子自由度, 1 绝H0, ② F < F 1-α
s ③HA:μ≠μ0,包括μ>μ0和μ<μ0 此时相应各备择假设的H0的拒绝域分别为:
①t > tα解释: t<t0.05,接受H0; t>t0.05,拒绝H0 ②t < -tα ③|t| > tα/2,或表示为|t| > tα(两侧)
t n 1
n
第五章 统计推断
§5.1 单个样本的统计假设检验
379.2 377.2 u 1.82 3. 3 n 9 由于u 1.82 u0.05 1.645 ,所以拒绝H0假设、接受HA。
即栽培条件的改善显著地提高了豌豆籽粒重量。
x 0
第五章 统计推断
§5.1 单个样本的统计假设检验
5.1.4 σ未知时平均数的显著性检验——t 检验(t-test) 检验的程序: (1)零假设H0:μ=μ0 备择假设:①HA:μ>μ0,若已知μ不可能小于μ0 (2)计算统计量: x 0 (3)判断统计量: ②HA:μ<μ0,若已知μ不可能大于μ0

第五次-统计推断(1)

第五次-统计推断(1)

2)μ可能非常接近于μ0;
3)抽样结果符合零假设的值μ0,样本统计量的值与μ0不
符合是偶然因素造成的。
对于拒绝零假设μ=μ0,可以有以下解释:
1)μ不可能很接近μ0;
2)若零假设是真实的,产生一个我们所见的样本的可能
性很小;
3)抽样结果不符合零假设的值μ0,样本统计量的值与μ0
不符合(在a水平上),不能用偶然因素解释。
样本平均数 u 服从标准正态分布N(0,1)。
由正态分布及其附表,可以得到 P(U > u) 或 P(U < u) 或P( U > u)的值,即得到:平均数为x 的样本抽自平 均数为μ0的总体的概率。如果求得的概率值很小,则表 示平均数为x 的样本抽自平均数为μ0的总体的事件是小概 率事件,根据小概率原理,说明假设的条件不正确,即μ
可见,用不同方法检验相同数据,可能得到不同
结论。
单侧检验比双侧检验的辨别力更强些,因为在做
单侧检验时利用了“已知有一侧不可能”这一条
件,从而提高了其辨别力。
4. 两种类型的错误
I型错误:如果假设是正确的,却错误地拒绝了它;犯此
类错误的概率不会超过 a。
a =P(I型错误)=P(拒绝H0
为了对总体平均数进行推断,从动物群体中随机抽取含量
为 n 的样本,通过样本平均数 x 推断总体平均数

需要了解的概念: 1. 假设
针对考查内容可提出零假设,记为H0: μ=μ0 或 H0:
μ-μ0 = 0,是假设总体平均数μ等于某一给定的值μ0,即
这两者的差为0。
本例题要考查:在这种饲养条件下生长的动物
未知时用t 检验,变异性用
为检验统计量)
2检验。

应用统计学(第五章 统计推断)

应用统计学(第五章 统计推断)
差与已知总体的方差存在显著差异
检验统计量: χ2 (n 1) s2 σ02
例题5 已知某农田受到重金属污染,抽样测定其镉含量
(μg/g)分别为:3.6、4.2、4.7、4.5、4.2、4.0、3.8、
3.7,试检验污染农田镉含量的方差与正常农田镉含量的方 差0.065是否相同。
解:假设 H0:σ 2 σ02 , H A:σ 2 σ02
P(μ-1.960 σ x ≤ x < μ+1.960 σ x)=0.95
否定区
接受区
否定区
左尾
0.025
μ-1.960σ x
0.95
0.025
0 μ+1.960σ x
右尾
临界值: ± uσ x= ± 1.960σ x
双尾检验 = 0.01
P(μ-2.576 σ x ≤ x < μ+2.576 σ x)=0.99
解: 假设: H0: μ ≤ μ0, HA : μ > μ0 确定显著水平:α=0.05 检验统计量:u x μ0 379.2 377.2 1.818 σ n 3.3 9 u0.05=1.645,计算得:u=1.818>u0.05,P<0.05
推断:否定H0,接受HA。
即:栽培条件的改善,显著提高了豌豆籽粒重量。
4)推断
接受/否定H0(HA,实际意义)
例题1 正常人血钙值服从的正态分布,平均值为2.29 mM,标准差为 0.61mM。现有8名甲状旁腺减退患者经治疗后,测得其血钙值平均为 2.01mM,试检验其血钙值是否正常。
1)提出假设 2)确定显著水平 3)计算概率 4)推断
1)提出假设
H0
零假设 /无效假设
对 /检验假设
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为了确定这个偏误的程度和总体参数的所在,我 们可以进行区间估计。
区间估计: 是指以一定的概率保证总体参数位于某两 个数值之间。
如,某一水稻品种的亩产量 落在(700kg-800kg)区间的概率为95%。
二、统计假设测验的基本步骤
进行统计假设测验,首先要对统计总体提出假设,
统计假设(statistical hypothesis): 就是试验工作者提出有关某一总体参数的假设。
(1)计算概率的方法
在 H 0 : 0 的假设下可算得: 查附表2,
uu xx00 551155550000 22..55
xx
1188// 99
P(u 2.5) 20.0062 0.0124
在 0 500 的总体中,如以n=9作随机抽样,抽得 一个与500kg相差达15kg以上的的概率为0.0124。
【例5·1】
设一水稻地方品种一般亩产为500kg,方差为 324kg,现有一新品种对其抽查了 9个试验小区, 测得样本平均亩产为515kg,问:这样本是否从 亩产为500kg的总体中随机抽出的?差数15kg究 竟是抽样误差造成的? 还是确实有差异?
1.提出统计假设
无效假设必须是有意义的,即在假设的前提下可以 确定试验结果的概率的。
第五章 统计推断
5.1 统计假设测验的基本原理
一、统计推断的意义和内容
第四章我们学到从总体到样本的方向,即抽样分 布问题,讲述从理论分布中抽出的样本统计数的变 异特点。
本章将讨论从样本到总体的方向,就是从一个样 本或一系列样本结果去推断其总体结果,即统计推 断问题。
统计推断(statistical inference):
测验前提出无效假设的目的在于,可从假设的总 体里推论其平均数的随机抽样分布,从而算出某一 样本平均数指定值出现的概率,进而研究样本与总 体的关系,作为假设测验的理论依据。
无论是平均数,百分数,还是变异数的统计假设, 均应在试验前按研究目的提出。H0的形式和内容可 以多种多样,但必须遵循两个原则:
①有实际意义; ②据之可以算出因抽样误差而获得样本结果的概率。
就是根据抽样分布规律和概率理论,由样本结 果(统计数)来推断总体特征(参数)。
试验实践中所获得的资料,通常都是样本的结 果,而我们希望了解的却是抽得样本的总体。
因此,统计推断是科研工作中一个十分重要的 工具,对试验设计也有指导意义。
统计推断包括:统计假设测验(hypothesis test) 参数估计(parameter estimate)
统计假设测验:就是根据某种实际需要,对未知 的或不完全知道的统计总体提出一些假设,然后由 样本的实际结果,经过一定的计算,做出在概率意 义上应当接受哪种假设的测验。
如,某地进行了两个水稻品种对比试验,在 相同条件下,两个水稻品种分别种植10个小区, 获得两个水稻品种的平均亩产量为:
x1 510 kg
假设新品种的总体平均数 等于原地方品种的总
体平均数 0 ,即 H0 : 0
假设新品种的总体平均数 0 500kg ,而样本平
均数 x 和 0 之间的差数 x 0 15kg 乃是随机误差;
在 H0 : 0 的假设下,我们就有一个具有平均数
0 500kg 、方差
2 x
324 / 9 36
x2 500 kg
x1 x2 10
我们能否根据 x1 x2 10 就判定这两个水稻
品种平均产量不同? 结论是,不一定。
参数估计(point setimate):
是指由样本统计数对总体参数做出点估计和区 间估计。
点估计:就是以统计数估计相应参数。 如以一个小麦品种的样本所得的平均产量作为总 体参数的估计值。但是点估计总是有一定偏误的。
的x
分布,即
N(500,36);
据之才能算得因抽样误差而获得一个与 0 的500相kg
差≥15kg的 x 的概率。
Байду номын сангаас
对应假设:H :
A
0
则HA是假设样本不是从已知总体中随机抽出的。
2. 确定一个否定H0的概率标准
这个标准叫显著水平(significance level),记 做α。
α是人为定出的统计推断的小概率(显著)标准。 在生物学研究中常取α=0.05或α=0.01。
显著水平的选择,应根据试验要求或试验结论的 重要性而定。
显著水平α对假设测验结论是有直接影响的,所 以应在试验开始前规定下来,在试验结果分析时不 能随意改变。
3.假设正确的前提下,研究样本平均数的抽样分布 算出试验所得的平均数出现的概率有多大,即算出
实得结果由抽样误差造成的概率。或者划出接受区域 和否定区域。二法选一即可。
如何确切地证实假设是正确的还是错误的呢? 当然可以把全部产品逐个检验,这种研究全部总体 方法当然是很准确的,但往往是行不通的。
因此,我们不得不采用另一种方法,即研究样 本。也就是抽取样本进行检验,推断这批产品是 否合格。
如果通过测验证明假设与试验结果相符,则该 假设就被接受;反之,如果假设与试验结果不相 符,则该假设就被否定
基本步骤:
统计假设测验: 首先要对统计总体提出假设;
然后根据试验的数据去证明假设的正确与否? 这种方法也叫显著性测验,因为试验的结果在 习惯上用显著、极显著或不显著来表示。
*对统计总体的两个假设
1.无效假设(null hypothesis) 假设总体参数与某一指定值相等或假设两个总体 参数相等,即假设其没有效应,这一假设称为无效 假设,记作H0 2.对应假设 (alternative hypothesis) 无效假设相对应的另一统计假设,叫对应假设或 备择假设,记作HA。 H0和HA是对立的假设,如果接受H0就否定 HA,如 果否定H0就接受HA。
(2)划接受区域和否定区域的方法
根据上章所述 x 和 u (x ) / x 的分布,我们知道:
x )] 0.025和P[x ( 1.96 x )] 0.025 P[x ( 1.96 x )] 0.025和P[x ( 1. ( 1.96 x ),( 1.96 x )
因此,在 x 的抽样分布中,落在 ( 1.96 x ),( 1.96 x ) 区间内的 x 有95%,落在这一区间外的 x 只有5%。
相关文档
最新文档