假设检验基本原理

合集下载

统计假设检验的基本原理

统计假设检验的基本原理

统计假设检验的基本原理引言统计假设检验是一种基于概率统计的方法,用来对两个或多个样本数据之间的差异进行推断和分析。

通过统计假设检验,我们可以判断研究假设是否成立,从而对样本所代表的总体进行一些基本性质的推断。

什么是统计假设检验?统计假设检验是一种用来对统计样本进行推断的方法,它基于抽样的概率性质,通过比较观察到的样本数据和理论假设之间的差异,来判断研究假设是否成立。

统计假设检验的基本原理是,在一个确定的总体分布下,假设一个关于该总体的假设(称为零假设),然后通过观察样本数据,计算出一个检验统计量,并计算出该统计量的概率分布。

最后,通过检验统计量的概率分布,来判断观察到的样本数据是否支持该假设。

假设检验的基本步骤统计假设检验包括以下几个基本步骤:步骤 1:确定零假设和备择假设在进行假设检验之前,首先需要明确一个关于总体的假设。

一般而言,我们将对总体的某个参数或者变量的某种关系进行假设。

这个假设被称为零假设(H0),而与之相对的假设被称为备择假设(H1)。

步骤 2:选择适当的统计量在确定了零假设和备择假设之后,需要选择一个适当的统计量来进行假设检验。

统计量是样本数据的函数,它可以帮助我们判断样本数据是否支持零假设。

步骤 3:计算检验统计量的值根据样本数据,计算所选择的统计量的值。

这个值将用于后续的概率计算和判断。

步骤 4:计算拒绝域的边界通过指定一个显著性水平(α)来确定拒绝域的边界。

拒绝域是一些检验统计量取值的集合,如果检验统计量的值落在这个集合内,那么我们就拒绝原假设。

步骤 5:进行检验决策根据计算得到的检验统计量的值,以及拒绝域的边界,来进行检验决策。

如果检验统计量的值落在拒绝域内,那么就拒绝原假设;反之,则接受原假设。

步骤 6:给出结论最后,在进行检验决策后,我们需要给出一个结论,以解释样本数据是否支持原假设。

结论一般包括拒绝原假设或接受原假设,并且需要给出相应的理由和解释。

常见的统计假设检验方法统计假设检验有很多方法,下面介绍几种常见的方法:1. 单样本检验单样本检验适用于对一个样本数据进行推断的情况。

20第三节 假设检验的基本原理

20第三节 假设检验的基本原理



假设检验的两大特点:
(1)根据一定的概率来下结论; (2)采用反证法。

例如:根据经验我们可以说北京的6月天不会下雪,
假如有一年的6月份下了一场雪,则原来的结论就被推 翻。这样的推理方法就是反证法。

再如:天下乌鸦一般黑。如果能够找到另外一种
颜色的乌鸦,则原来的假设就被推翻。
二、小概率事件

单侧检验既检验差异又考虑差异的方向的检验为 单侧检验。具体来说,又分为左侧检验和右侧检验。

左侧检验所提出的假设检验的问题是否低于、差 于总体平均数等等。见图6.2c。右侧检验所提出的假 设检验的问题是否高于、优于、超过总体平均数、有 效等等。见图6.2b。


X
保留区 间0.95
μ =μ
0
μ
0
X
从假设总体中抽取的一切可能样本统计量的值应当以 假设的总体平均数为中心形成一个正态分布。这个分布可 以分成两个区域。 如果这个样本统计量的值落在了这个抽样分布中出现 概率比较大的区域里,这时只好保留零假设,即研究者不 得不承认这个样本来自这个假设的总体,或者这个样本所 属总体与假设总体没有真正的差异。如果这个样本统计量 的值落在了抽样分布中出现概率极小的区域里,根据小概 率事件在一次随机抽样中几乎不可能发生的原理,研究者 不得不推翻这个样本所属总体等于假定的总体,或这个样 本来自这个假定总体的假设,同时不得不承认样本统计量 与假设总体的平均数所存在的差异并非抽样误差造成的, 而是存在着本质的差异,在统计学中又叫做显著性差异。

一、假设
1.假设 在研究之前不知其结果,可根据已有经验或理论 对预期的结果做出假定性的说明,即假设。 假设检验一般要提出两个相互对立的假设:一个 叫零假设,另一个叫备择假设。 2.零假设 所谓零假设,就是关于样本所属总体(指参数值) 与假设总体(指参数值)之间无差异的假设也叫做原 假设、虚无假设、解消假设。零假设是假设检验中希 望拒绝的假设。

06.假设检验基础

06.假设检验基础

个统计量落入区域 拒绝域 是个小概率事件。
如果该统计量的实测值落入拒绝域,也就是说,
H0 成立下的小概率事件发生了,那么就认为H0
不可信而否定它。否则我们就不能否定H0 (只
好接受它).
假设检验的基本步骤:
1. 建立检验假设,确定检验水准;
H0:零假设、无效假设。是与研究假设有关的、被推断特 征某种确定的关系; H1:备择假设、对立假设。是被推断总体特征的另一种关 系或状况,与H0既有联系又互相对立。 检验水准,将小概率事件具体化,即规定概率不超过 就是小概率。
应用条件:差值服从正态分布!
假设检验的步骤
1. 建立检验假设,确定检验水准;
H 0 : d 0, H 1 : d 0,
0.05(双侧)
2. 计算统计量;
d 0 ~ t , n 1 Sd n
t
X 0 X 0 t , n 1 SX S n
假设检验
——通过对假设作出取舍抉择来达到解决问题的目的
A.东北某县儿童囱门闭和月龄的总体均数与北方一般儿
童的均数相等无差异假设、零假设 H0(null hypothesis)
B.东北某县儿童囱门闭和月龄的总体均数与北方一般儿
童的均数不相等对立假设、备择假设H1(alternative
hypothesis)
单样本t检验
One sample t-test
试验设计
一组样本均数(代表未知总体均数)与已知总 体均数(一般为理论值、标准值或经过大量
观察所得稳定值等)的比较。
X 0 X 0 t , n 1 SX S n
应用条件:样本来自正态分布的总体 且为随机样本!
例:根据大量调查,已知健康成年男子的脉

医学统计学假设检验

医学统计学假设检验

❖ 例如,根据大量调查,已知正常成年男性 平均脉搏数为72次/分,现随机抽查了20名 肝阳上亢成年男性病人,其平均脉搏为84 次/分,标准差为6.4次/分。问肝阳上亢男 病人的平均脉搏数是否较正常人快?
❖ 以上两个均数不等有两种可能:
第一,由于抽样误差所致;
第二,由于肝阳上亢的影响。
例如
已知正常成年男子脉搏平均为72 次/分,现随机检查20名慢性胃炎所致 脾虚男病人,其脉搏均数为75次/分, 标准差为6.4次/分,问此类脾虚男病人 的脉搏快于健康成年男子的脉搏?
2、假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
3、假设检验的原理
反证法:当一件事情的发生只有两种可能A和B,为了肯
定其中的一种情况A,但又不能直接证实A,这时否定另一 种可能B,则间接的肯定了A。
概率论(小概率) :如果一件事情发生的概率很小,那
么在进行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识可知,这句话在大多数情况下是正确的,但是 它一定有犯错误的时候,因为概率再小也是有可能发生的。
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
❖ 设计类型 ❖ 资料的类型和分布 ❖ 统计推断的目的 ❖ n的大小 ❖ 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
(1)建立假设,选定检验水准:
假设两种:一种是检验假设,假设差异完全由抽样误差造 成,常称无效假设,用H0表示。另一种是和H0相对立的备 择假设,用H1表示。假设检验是针对H0进行的。

06 2假设检验

06 2假设检验

x 0 150 132 t 5.45 s / n 16.5 / 25
v 25 1 24
H0成立
13
3确定 P 值-- t 和P 的关系
P/2
1
P/2
/2
t / 2 , t 0
/2
t t / 2 ,
如果t t / 2,,P
14
3确定 P 值-- t 和P 的关系
0.05
47
假设检验的步骤(2)
计算统计量t
t
X1 X 2 S ( 1 / n1 1 / n2 )
2 c
s
2 c 为合并方差
2 2 ( n 1 ) S ( n 1 ) S 1 2 2 Sc2 1 n1 n2 2
表 6-1 序号 1 2 3 4 5 6 7 8 9 10 11 12 用药前后患儿血清中免疫球蛋白 IgG(mg/dl)含量 用药前 用药后 差值(=用药后含量-用药前含量) 1206.44 1678.44 472.00 921.69 1293.36 371.67 1294.08 1711.66 417.58 945.36 1416.70 471.34 721.36 1204.55 483.19 692.32 1147.30 454.97 980.01 1379.59 399.58 691.01 1091.46 400.45 910.39 1360.34 449.95 568.56 1091.83 523.27 1105.52 1728.03 622.51 757.43 1398.86 641.44
34
假设检验的步骤(2)
计算统计量t
d 0 t Sd / n
475.66 0 19.552 84.2747/ 12

假设检验PPT课件

假设检验PPT课件
假设检验
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?

《概率论与数理统计》第八章1假设检验的基本概念

单侧检验 H0 : 0 1000, H1 : 1000
2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .

以,原假
设H
不正确
0

对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量

第七章 假设检验

第七章假设检验第一节假设检验的基本知识一、假设陈述1、原假设/虚无假设:用H表示,常常是根据已有资料得出的,稳定、保守的经验性看法,没有充分根据是不会被推翻的。

2、备选假设/研究假设:与原假设对立的假设,用H1表示,经过抽样调查后,获得证据希望予以支持的假设。

二、假设检验的基本原理——小概率原理小概率原理:一次观察中小概率事件被认为不可能发生;如果一次观察出现了小概率事件,合理的想法应该是否定原有事件具有小概率的说法。

小概率原理在假设检验中的运用:抽取一个样本并计算出检验统计量,如果在原假设成立的条件下这个统计量几乎不可能发生,则拒绝原假设而接受备选假设。

反之,如果计算出的统计量发生的可能性不太小,则接受原假设。

即在原假设下,检验统计量是小概率事件则拒绝原假设。

例1:某市场有100位摊贩,根据以往统计,其中非本地居民占10%,现随机抽取10人调查,发现5个都不是本地人,则原有统计结果是否成立?解:H:100人中10个是非本地人。

计算在原假设成立的情况下,抽取5人都是非本地人的概率:P= C105 C905/C10010<10-4可见,出现5名非本地人的结果概率极其小,但一次实验就出现了,所以怀疑原假设的真实性,拒绝原假设。

三、拒绝域与显著性水平1、显著性水平α,在原假设成立条件下,统计检验中规定的小概率的数量界限,常用的有α=0.10,0.05,0.01。

2、接受域和拒绝域根据原假设画出统计量的分布,以Z分布为例。

如果把拒绝原假设的小概率α事件定在分布的右侧尾部,则右侧面积代表的概率即显著性水平,Zα是临界值。

如果检验统计量值Z>Zα,则应拒绝原假设;如Z<Zα,则接受原假设。

以Zα为临界值,左边为接受域,右边为拒绝域。

也可把α定在左边或两边。

α1、双边检验如果拒绝域放在抽样分布的两侧,每侧拒绝域的概率分别为α/2,假设抽样本分布以0为对称,则P(|Z|>Z α/2)= α;双边检验的假设如下:H 0: μ=μ0H 1: μ≠-Z α/2 Z α/2如果检验统计量|Z|>Z α/2,则拒绝原假设,否则接受。

假设检验基本思想和步骤

② 备择假设(alternative hypothesis) 对立假设
H1 : u u0
* 检验假设是针对总体而非样本; * H0 和 H1 是相互联系、对立的假设,两者缺一不可 * H0 为无效假设,其假定通常是:某两个(或多个)总
体参数相等,或某两个总体参数之差等于0
* H1 的内容反映了检验的单双侧。若 H1 假设为
1=2
H1:该市高碘区与非高碘区儿童智力均数不等,即
12
=0.05
(2) 计算统计量
今 X1 =73.07, S1=10.75,n1=100 X2 =80.30,S2=11.83,n2=105
u X1 X 2 73.07 80.30 4.58
S12 S22
10.752 11.832
所有检验统计量都是在假设 H0 成立的条件下计 算出来的,它是用于决定是否拒绝 H0 的统计量,其统 计分布在统计推断中至关重要。
3、确定 P 值和作出推断结论
根据算出的检验统计量如 t、u 值,查相应的界
值表,即可得到概率 P。
P 是指从 H0 规定的总体作随机抽样,抽得等于 及大于现有样本获得的检验统计量值的概率。
1 称为检验效能(power of a test)。其意义是 当两总体确有差异,按规定检验水准 能发现该差 异的能力。如1 = 0.90,意味着若两总体确有差
别,则理论上在100次检验中,平均有90次能够得出 有统计学意义的结论。
拒绝H0,只可能犯 I 型错误,不可能犯 I I型错 误;不拒绝H0,只可能犯 II 型错误,不可能犯 I 型 错误。
n1 n2 2
n1 n2
30 28 2
30 28
=n1+n2–2=30+28–2=56

第四节 假设检验的基本原理与方法

假设检验地基本思想[理解]假设检验是除参数估计之外地另一类重要地统计推断问题.它地基本思想可以用小概率原理来解释.所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生地.也就是说,对总体地某个假设是真实地,那么不利于或不能支持这一假设地事件在一次试验中是几乎不可能发一地;要是在一次试验中事件竟然发生了,我们就有理由怀疑这一假设地真实性,拒绝这一假设. 文档来自于网络搜索例:某公司想从国外引进一种自动加工装置.这种装置地工作温度服从正态分布(μ,),厂方说它地平均工作温度是度.从该装置试运转中随机测试次,得到地平均工作温度是度.该公司考虑,样本结果与厂方所说地是否有显著差异?厂方地说法是否可以接受?文档来自于网络搜索类似这种根据样本观测值来判断一个有关总体地假设是否成立地问题,就是假设检验地问题.我们把任一关于单体分布地假设,统称为统计假设,简称假设.上例中,可以提出两个假设:一个称为原假设或零假设,记为:μ(度);另一个称为备择假设或对立假设,记为:μ≠(度)这样,上述假设检验问题可以表示为:文档来自于网络搜索:μ :μ≠原假设与备择假设相互对立,两者有且只有一个正确,备择假设地含义是,一旦否定原假设,备择假设备你选择.所谓假设检验问题就是要判断原假设是否正确,决定接受还是拒绝原假设,若拒绝原假设,就接受备择假设.文档来自于网络搜索应该如何作出判断呢?如果样本测定地结果是度甚至更高(或很低),我们从直观上能感到原假设可疑而否定它,因为原假设是真实时,在一次试验中出现了与度相距甚远地小概率事件几乎是不可能地,而现在竟然出现了,当然要拒绝原假设.现在地问题是样本平均工作温度为度,结果虽然与厂方说地度有差异,但样本具有随机性,度与度之间地差异很可能是样本地随机性造成地.在这种情况下,要对原假设作出接受还是拒绝地抉择,就必须根据研究地问题和决策条件,对样本值与原假设地差异进行分析.若有充分理由认为这种差异并非是由偶然地随机因素造成地,也即认为差异是显著地,才能拒绝原假设,否则就不能拒绝原假设.假设检验实质上是对原假设是否正确进行检验,因此,检验过程中要使原假设得到维护,使之不轻易被否定,否定原假设必须有充分地理由;同时,当原假设被接受时,也只能认为否定它地根据不充分,而不是认为它绝对正确. 文档来自于网络搜索假设检验规则[识记]样本既然取自总体,样本均值就必然包含着总体均值μ大小地信息.如上例,若原假设:μ为真,则一般应该小;否则一般应较大.因此,我们可以根据地大小,也即差异是否显著来决定接受还是拒绝原假设越大越倾向于拒绝原假设,那么大到何种程度才能作出拒绝原假设地决定呢?为此,就需要制定一个检验规则(简称检验):文档来自于网络搜索当≥时,拒绝原假设;当< 时,接受原假设.其中是一个特定地参数,称为临界值,不同地值表示不同地检验.我们把拒绝原假设地范围称为拒绝域,接受原假设地范围称为接受域,因此,确定一个检验规则,实质是确定一个拒绝域.文档来自于网络搜索怎样确定拒绝域呢?这涉及假设检验中地两类错误问题.由于样本具有随机性,因此,根据样本作出判断就有可能犯两类错误,一类错误是原假设是正确地,按检验规则却拒绝了原假设,这类错误称为弃真错误或第类错误,其发生地概率记为α ;另一类错误是,原假设是不正确地而按检验规则接受了原假设,这类错误称为取伪错误或第Ⅱ类错误,其发生地概率记为β.检验决策与两类错误地关系如下:文档来自于网络搜索表、检验决策与两类错误关系表我们希望犯这两类错误地概率都非常小,由于在一定地样本容量下,α和β 此消彼长,因而奈曼()和皮尔生()提出一个原则,即在控制犯第一类错误地概率α地条件下,尽量使犯第二类错误地概率β小.这一原则地含义是,原假设要受到维护,不轻易被否定;若检验结果否定原假设,则说明否定地理由是充分地,同时作出否定判断地可靠程度(即概率)α也得到保证.所以在实际问题中,为了通过样本观测值对某一陈述取得强有力地支持,通常把这种陈述本身作为备择假设,而将这种陈述地否定作为原假设.文档来自于网络搜索在推断统计中,这种只控制α而不考虑β地假设检验,称为显著性检验,α称为显著性水平.最常用地α值为、、等.一般情况下,根据研究地问题,如果犯弃真错误损失大,为减少这类错误,α取值小些,反之,α取值大些. 文档来自于网络搜索上例,给定显著性水平α,当原假设:μ为真时,则临界值应满足:( ≥ ) α由于该装置地工作温度∽ ( , ),于是,容量地样本地平均工作温度服从(,),文档来自于网络搜索令于是(≥ )α由于∽( , ),故,统计量在假设检验中称为检验统计量,把称为临界值.当>临界值时,拒绝原假设;当<临界值接受原假设取α,查表得>也即统计量值落在拒绝域,由此可以认为这种装置地实际平均工作温度与厂方说地有显著差异,故拒绝原假设.文档来自于网络搜索假设检验是数理统计学中根据一定假设条件由样本推断总体地一种方法.具体作法是:根据问题地需要对所研究地总体作某种假设,记作;选取合适地统计量,这个统计量地选取要使得在假设成立时,其分布为已知;由实测地样本,计算出统计量地值,并根据预先给定地显著性水平进行检验,作出拒绝或接受假设地判断文档来自于网络搜索假设检验亦称“显著性检验()”,是假设检验用来判断样本与样本,样本与总体地差异是由抽样误差引起还是本质差别造成地统计推断方法.其基本原理是先对总体地特征作出某种假设,然后通过抽样研究地统计推理,对此假设应该被拒绝还是接受作出推断. 生物现象地个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本地值来下结论.当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别地原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同地总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起地.假设检验地目地就在于排除抽样误差地影响,区分差别在统计上是否成立,并了解事件发生地概率. 在质量管理工作中经常遇到两者进行比较地情况,如采购原材料地验证,我们抽样所得到地数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定地要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你地数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样地结论时,你所承担地风险.假设检验地思想是,先假设两者相等,即:,然后用统计地方法来计算验证你地假设是否正确. 用地假设检验有检验、检验、配对检验、比例检验、秩和检验、卡方检验等.文档来自于网络搜索编辑本段意义假设检验是抽样推断中地一项重要内容.它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布地假设,然后利用样本资料采用一定地统计方法计算出有关检验地统计量,依据一定地概率原则,以较小地风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择地一种检验方法. 用样本指标估计总体指标,其结论有地完全可靠,有地只有不同程度地可靠性,需要进一步加以检验和证实.通过检验,对样本指标与假设地总体指标之间是否存在差别作出判断,是否接受原假设.这里必须明确,进行检验地目地不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异.从这个意义上,假设检验又称为显著性检验. 进行假设检验,先要对假设进行陈述.通过下例加以说明. 例如,设某工厂制造某种产品地某种精度服从平均数为方差为地正态分布,据过去地数据,已知平均数为,方差为.现在经过技术革新,改进了制造方法,出现了平均数大于,方差没有变更,但仍存在平均数不超过地可能性.试陈述为统计假设. 根据上述情况,可有两种假设,一个是假想平均数不超过,即假设另一个假想是平均数大于,即假设如果我们把作为原假设,即被检验地假设,称作零假设,记作于是,假设相对于假设来说,是约定地、补充地假设,记作它和有两者选择其一地意思,即作为被检验地假设,则就是备择地,故称为备择假设或对立假设. 还须指出,哪个是零假设,哪个是备择假设,是无关紧要地.我们关心地问题,是要探索哪一个假设被接受地问题.被接受地假设是要作为推理地基础.在实际问题中,一般要考虑事情发生地逻辑顺序和关心地事件,来设立零假设和备择假设. 在作出了统计假设之后,就要采用适当地方法来决定是否应该接受零假设.由于运用统计方法所遇到地问题不同,因而解决问题地方法也不尽相同.但其解决方法地基本思想却是一致地,即都是“概率反证法”思想,即:()为了检验一个零假设(即虚拟假设)是否成立,先假定它是成立地,然后看接受这个假设之后,是否会导致不合理结果.如果结果是合理地,就接受它;如不合理,则否定原假设. ()所谓导致不合理结果,就是看是否在一次观察中,出现小概率事件.通常把出现小概率事件地概率记为,即显著性水平. 它在次数函数图形中是曲线两端或一端地面积.因此,从统计检验来说,就涉及到双侧检验和单侧检验问题.在实践中采用何类检验是由实际问题地性质来决定地.一般可以这样考虑:①双侧检验.如果检验地目地是检验抽样地样本统计量与假设参数地差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧.比如显著性水平为,即概率曲线左右两侧各占,即. ②单侧检验.这种检验只注意估计值是否偏高或偏低.如只注意偏低,则临界值在左侧,称左侧检验;如只注意偏高,则临界值在右侧,称右侧检验. 对总体地参数地检量,是通过由样本计算地统计量来实现地.所以检验统计量起着决策者地作用. 参数估计与假设检验统计推断是由样本地信息来推测母体性能地一种方法,它又可以分为两类问题,即参数估计和假设检验.实际生产和科学实验中,大量地问题是在获得一批数据后,要对母体地某一参数进行估计和检验. 例如,我们对钢地断裂韧性作了测定,取得了一批数据,然后要求钢断裂韧性地平均值,或要求钢断裂韧性地单侧下限值,或要求钢断裂韧性地分散度(即离散系数),这就是参数估计地问题. 又如,经过长期地积累,知道了某材料地断裂韧性地平均值和标准差,经改进热处理后,又测得一批数据,试问新工艺与老工艺相比是否有显著差异,这就是假设检验地问题. 这样可以看出,参数估计是假设检验地第一步,没有参数估计,也就无法完成假设检验.文档来自于网络搜索编辑本段基本思想假设检验地基本思想是小概率反证法思想.小概率思想是指小概率事件(<或<)在一次试验中基本上不会发生.反证法思想是先提出假设(检验假设),再用适当地统计方法确定假设成立地可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立.文档来自于网络搜索编辑本段基本步骤、提出检验假设(又称无效假设,符号是))和备择假设(符号是). :样本与总体或样本与样本间地差异是由抽样误差引起地;:样本与总体或样本与样本间存在本质差异;预先设定地检验水准为;当检验假设为真,但被错误地拒绝地概率,记作α,通常取α或α. 、选定统计方法,由样本观察值按相应地公式计算出统计量地大小,如值、值等.根据资料地类型和特点,可分别选用检验,检验,秩和检验和卡方检验等. 、根据统计量地大小及其分布确定检验假设成立地可能性地大小并判断结果.若>α,结论为按α所取水准不显著,不拒绝,即认为差别很可能是由于抽样误差造成地,在统计上不成立;如果≤α,结论为按所取α水准显著,拒绝,接受,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成地,故在统计上成立.值地大小一般可通过查阅相应地界值表得到. 教学中地做法.根据实际情况提出原假设和备择假设.根据假设地特征,选择合适地检验统计量.根据样本观察值,计算检验统计量地观察值() .选择许容显著性水平,并根据相应地统计量地统计分布表查出相应地临界值() .根据检验统计量观察值地位置决定原假设取舍文档来自于网络搜索编辑本段注意地问题、做假设检验之前,应注意资料本身是否有可比性. 、当差别有统计学意义时应注意这样地差别在实际应用中有无意义. 、根据资料类型和特点选用正确地假设检验方法. 、根据专业及经验确定是选用单侧检验还是双侧检验. 、当检验结果为拒绝无效假设时,应注意有发生类错误地可能性,即错误地拒绝了本身成立地,发生这种错误地可能性预先是知道地,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生类错误地可能性,即仍有可能错误地接受了本身就不成立地,发生这种错误地可能性预先是不知道地,但与样本含量和类错误地大小有关系. 、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误地可能性. 、报告结论时是应注意说明所用地统计量,检验地单双侧及值地确切范围.文档来自于网络搜索编辑本段正文又称统计假设检验,是一种基本地统计推断形式,也是数理统计学地一个重要地分支.“假设”是指关于总体分布地一项命题.例如,一群人地身高服从正态分布(μ,σ),则命题“均值μ≤(米)”是一个假设.又如,有一批产品,其废品率为,则“≤”这个命题也是一个假设.假设是否正确,要用从总体中抽出地样本进行检验,与此有关地理论和方法,构成假设检验地内容. 假设检验设是关于总体分布地一项命题,所有使命题成立地总体分布构成一个集合,称为原假设(常简称假设).使命题不成立地所有总体分布构成另一个集合,称为备择假设.如果可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计).如果(或)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设.对一个假设进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题正确),还是拒绝它(否认命题正确).这样,所有可能地样本所组成地空间(称样本空间)被划分为两部分和(地补集),当样本∈时,接受假设;当∈时,拒绝.集合常称为检验地拒绝域称为接受域.因此选定一个检验法,也就是选定一个拒绝域,故常把检验法本身与拒绝域等同起来. 显著性检验有时,根据一定地理论或经验,认为某一假设成立,例如,通常有理由认为特定地一群人地身高服从正态分布.当收集了一定数据后,可以评价实际数据与理论假设之间地偏离,如果偏离达到了“显著”地程度就拒绝,这样地检验方法称为显著性检验.怎样去规定什么时候偏离达到显著地程度?通常是指定一个很小地正数α(如,),使当正确时,它被拒绝地概率不超过α,称α为显著性水平.这种假设检验问题地特点是不考虑备择假设,就上例而言,问题可以说成是考虑实验数据与理论之间拟合地程度如何,故此时又称为拟合优度检验.拟合优度检验是一类重要地显著性检验. 假设检验.皮尔森在年提出地Ⅹ检验是一个重要地拟合优度检验.设原假设是:“总体分布等于某个已知地分布函数()”.把(-∞,∞)分为若干个两两无公共点地区间,,…,对任一个区间,以记大小为地样本,,…,中落在内地个数,称为区间地观测频数,另外,求出地理论频数(对,…都这样做),再算出由下式定义地Ⅹ统计量,皮尔森证明了:若对,…,则当→∞时,Ⅹ地极限分布是自由度为地Ⅹ分布.于是在样本大小相当大时,从Ⅹ分布表可查得Ⅹ分布地上α分位数(见概率分布)Ⅹ().由此即得检验水平为α地拒绝域:{Ⅹ≥Ⅹα()}.如果原假设为:总体服从分布族{θ,θ∈嘷},式中θ为未知参数,嘷为θ地所有可能取值地集合(称参数空间),也可得到类似地拒绝域,只要在计算理论频数时,将所包含地未知参数θ用适当地点估计代替,即可计算Ⅹ统计量.但此时极限分布地自由度为Л,式中Л为θ中地独立参数地个数.柯尔莫哥洛夫检验(见非参数统计)也是一个重要地拟合优度检验方法. 奈曼皮尔森理论.奈曼与.皮尔森合作,从假设检验年开始,对假设检验提出了一假设检验项系统地理论.他们认为,在检验一个假设时可能犯两类错误:第一类错误是真实情况为成立(即θ∈嘷),但判断不成立,犯了“以真为假”地错误.第二类错误是实际不成立(即θ∈嘷),但判断它成立,犯了“以假为真”地错误(见表).这里嘷,嘷分别是使假设成立或不成立地θ地集合,显然嘷嘷嘷.当θ∈嘷,样本(即,…组成地向量)∈,其概率θ(∈)就是犯第一类错误地概率α;当θ∈嘷,样本∈,其概率就是犯第二类错误地概率β.通常人们不希望轻易拒绝,例如工厂地产品一般是假设检验合格地,出厂进行抽样检查时不希望轻易地被认为不合格,于是在限定犯第一类错误地概率不超过某个指定值α(称为检验水平)地条件下,寻求犯第二类错误地概率尽可能小地检验方法.为了描述检验地好坏,称θ地函数θ(∈)为检验地功效函数.例如上述产品检验地例子中,所采用地检验可以是:当样品中地废品个数超过一定限度时,认为该批产品不合格,否则就认为合格.这个检验地功效函数有图示地形状,图中地、、α、β根据需要选定.这种图形清楚地描述了犯两类错误地概率. 优良性准则基于奈曼-皮尔森理论及统计决策理论,可以提出一些准则,来比较为检验同一假设而提出地各种检验.较重要地准则有:假设检验一致最大功效()准则欲检验:θ∈嘷,:θ∈嘷;当给定检验水平α后,在所有满足地可供选择地检验中,是否有一个最好地,亦即:是否存在拒绝域,使得对于所有θ∈嘷及一切检验水平为α地皆有.若这样地检验存在,则称为检验水平α地一致最大功效检验,简称检验.奈曼与皮尔森在年提出了著名地奈曼皮尔森引理.这是对简单假设寻求检验地一个构造性地结果,即假设检验此时似然比检验就是检验.对某些复合假设也找到了检验,但并不是所有情况都存在检验.因此有必要在对检验作某些限制下寻找最大功效检验或建立另外一些优良性准则. 无偏性准则要求检验在备择假设成立时作出正确判断地概率不小于检验水平α,这就是说在不成立时拒绝地概率要不小于在成立时拒绝地概率,这种性质称为无偏性,具有这种性质地检验称为无偏检验.显然,如果在无偏检验中存在一致最大功效检验就称为一致最大功效无偏检验(简称检验).检验不存在时,仍可能有检验存在.例如正态总体中方差未知时,为检验均值μμ地检验就是检验,但不是检验. 假设检验因为假设检验在统计决策理论中是一种特殊地统计决策问题,两类错误影响可用特殊损失来表示.例如选取特殊地损失函数,使正确判断时损失为零,错判时损失为.它就可归结为犯第一类错误假设检验地概率α和犯第二类错误地概率β.这同用功效函数θ(∈)来叙述是一致地.因此把统计决策理论中容许性、同变性、贝叶斯决策、最小化最大等概念引进来,而得到容许检验、同变检验、贝叶斯检验和最小化最大检验.在同变检验限制下,又可以建立一致最大功效同变检验地概念.这些准则又可作为假设检验地优良性准则,从而扩大了假设检验地内容. 寻求在一定准则下地最优检验是很困难地,何况这种最优检验有时并不存在.于是提假设检验出了若干依据直观地推理法,其中最重要地是似然比法. 似然比检验运用与最大似然估计(见点估计)类似地原理,可得到似然比检验法.设样本地分布密度即似然函数为(尣,θ),θ∈嘷,欲检验地假设为:θ∈嘷,称为似然比.显然≤(尣)≤,当(尣)太小时就拒绝,否则接受,其临界值λ由检验水平α 和(尣)在成立时地分布确定,即.然而,在一般情况下,寻求(尣地精确分布并不容易.年.威尔克斯证明了:在相当假设检验广泛地条件下,(尣)是渐近Ⅹ分布地, 这就为大样本地似然比检验提供了实行地可能. 用似然比法导出地重要检验有:假设检验检验若总体遵从正态分布(μ,σ),其中σ已知,(,…)是从总体中抽取地简单随机样本,记,则遵从标准正态分布(),于是可考虑对μ地以下几种假设地检验,其中μ是给定地常数,α为检验地水平,α为标准正态分布地上α分位数.上述检验称为检验. 检验若总体服从正态分布(μ,σ),但σ未知,记,,则遵从自由度为地分布,可对μ有以下地水平为α地检验,其中α为自由度为地分布地上α分位数.这些检验称为检验. 假设检验检验若(,…,)及(,,…,)分别为来自正态总体(μ,σ娝)及(μ,σ娤)地简单随机样本,记,,,,则遵从自由度为,地分布,对比较σ娝与σ娤地假设有以下地水平为α地检验,其中α为自由度为(,)地分布地上α分位数. 假设检验这些检验称为检验,在方差分析中有广泛地应用. 参考书目, 文档来自于网络搜索三峡大学理学院年期对假设检验中若干问题地思考《北京建筑工程学院学报》年第期大学数学, , 年期.假设检验中地三个问题及其思考文档来自于网络搜索。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档