非参数检验
第十一章非参数检验
本章讲述某些用于定序尺度的双样本检验。与上一章所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。
与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行t检验时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验。
非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布”不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。
很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率”
E n =
n
n
非参数检验中的
参数检验中的
0第一节符号检验
“符号检验”是针对观察结果之差的符号来作估价的。在单一实验组的实验中,对于样本中每个个体的前测与后测,如果我们并不关心(X1―X0)的具体数值,而只关心是增大了还是减小了。
符号检验的零假设就是配对观察结果的差平均起来等于零:人们期望这些差中有一半小于零(负号),而另一半大于零(正号),因此符号检验就是对差分布之中位数为零的零假设检验。
符号检验是二项检验的一种实际应用,即先假设p=0.5,按二项分布计算正号“+”出现次数之抽样分布,然后以样本中正号“+”出现的次数x作为检验统计量。如果它是B(x;n,0.5)下的小概率事件,便否定对差分布之中位数为零的零假设,即认为两总体存在平均水平上的差别。
像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检验)。这类检验方法的特点,不仅在于其计算方法具有简捷性,而且在于其应用范围十分广泛。其缺点是检验效力低,因为在统计决策中它仅利用了数据中的部分信息。同有关的最佳参数或非参数检验相比,简便检验的统计决策是保守的,即它接受零假设已远远超过了必要程度,它拒绝零假设则需要有更大的样本容量。
第二节 配对符号秩检验
对于配对样本,至此我们已经接触了两种检验,即符号检验和t 检验。在符号检验中,只考虑差值d 的符号而不管其大小,并且应用二项分布检验零假设。另一方面,最有力的检验——t 检验,则不仅需要定距尺度,而且还要求假定差值d 服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征,其效力也介乎两者之间。
配对符号秩检验对于非正态分布的d 值,是最佳检验,其检验效力大大高于符号检验。如果t 检验的假定成立,配对符号秩检验的检验效力对于大、小样本都近乎为95%。因此,在定距尺度测量的水平上,若由于样本容量太小而不能假定正态分布的时候,配对符号秩检验特别有用。
配对符号秩检验的零假设基本上和符号检验以及用于配对样本的t 检验的零假设相同。
第三节 秩和检验
前面我们刚刚讨论过的符号检验和配对符号秩检验,都只适用于配对样本。当样本为独立样本时,可采用本节所讨论的秩和检验法。其具体步骤为:
(1) 设从两个未知的总体1和总体2中分别独立、随机地各抽取1个样本,样本 1的容量为n 1,样本2的容量为n 2,两样本的数据分别列示如下:
样本1:X 1,X 2,…,1n X
样本2:Y 1,Y 2,…,2n Y
(2)把样本1和样本2混合起来,并按数值从小到大顺序编号,每个数据的编号即为它的秩。如果混合样本中有相同数值的数据,则将它们应得的秩均分。
(3)分别计算两样本的秩和:样本l 中所有X 1,X 2,…,1n X 的秩和记作R 1;样本2中所有Y 1,Y 2,…,2n Y 的秩和记作R 2。
(4)秩和检验是针对两个总体具有完全相同的形式的零假设而进行检验的。在均值差检验中,研究的重点放在中心趋势的差异上,而不是离差的差异或形式的差异。秩和检验的零假设则可以用任何差异形式表出。
(5)计算检验统计量U 。检验统计量U 是对混合样本中n 1+ n 2个元素根据它们的秩和和它们所属的总体标出的双重指标
U 1=n 1n 2 +
2
)1(11+n n ―R 1 U 2=n 1 n 2 +2
)1(22+n n ―R 2 检验统计量U 是U1和U2中较小的一个,即U =min(U 1,U 2),然后用U 1
+ U 2 =n 1 n 2 核对计算 (6)给出显著性水平α,从秩和检验表(附表10)中查出临界值U α,如果计算出的U 值小于或等于从附表10中查出的临界值U α(n 1 ,n 2),则零假设被拒绝。
第四节 游程检验
游程检验是适用于独立样本的另一种检验法。游程检验的基本原理和计算方法很简单:先把两个样本混合起来,按大小排列,并赋予其秩。那么,当样本所属的总体是同分布的话,是不大可能出现来自总体1的样本全是高秩、而来自总体2的样本全是低秩的情况;反之亦然。可能性最多的情况是,来自总体1和总体2的样本,其秩是随机交错的。因此,根据混合样本中两样本交错的次数来检定秩交错次数是随机的零假设,这就是游程检验。其具体步骤如下:
(1) 设从两个未知的总体1和总体2中分别独立、随机地各抽取1个样本,样本 1的容量为n 1,样本2的容量为n 2 。
(2) 把样本1和样本2混合起来,并按数值从小到大顺序编号,每个数据的编号 就是它的秩。
(3)点算游程数目。一个游程指混合样本中接连属于一个样本的一串秩,其前后是另一个样本的秩。
(4)根据显著性水平α确定否定域αr ( n 1,n 2)。游程数目r 的抽样分布(见附表11)可用于建立否定零假设的否定域。
(5)检定零假设。以混合样本中的游程数目r 为检验统计量:如果游程的数目很大,就表明两个样本混合得很好,不能否定零假设;相反,如果游程的数目较小,零假设就很可能是错的,应该否定。
第五节 累计频数检验
累计频数检验是另一种双样本的非参数检验,它所需要的假定同秩和检验和游程检验一样。以上各种非参数检验,对于定序变量,都要求等级分得较多较细,实际上用的是未分组资料。但在社会研究中,对定序变量往往也用分组资料。在样本容量较大而等级划分又很有限的情况下,累计频数检验就显得十分有用了。
累计频数检验的原理很简单:如果独立随机样本取自两个形式完全相同的总体的零假设正确,即可期望两个样本累计相对频数分布基本上相似。累计频数检验使用的检验统计量是由两个累计频数分布构成的一系列差值之最大值D ,即
D =max(2
211n F n F -) 如果D 大于零假设前提下偶然性作用的期望值,就表明两个分布相差太大,以致应否定零假设。
如果已经预测方向,检验统计量应改用卡方近似法求得,即
2χ=4D 22
121n n n n + ~ 2χ(2) 累计频数检验可以检验经验分布和理论分布拟合到了什么程度。要检验的零假设是,样本来自一个已知分布函数F (x )的总体。对立的备择假设是,样本来自不具有分布函数F (x )的总体。基本方法是:先算出零假设下各期望值的频数f e ,这些值的累计频数为F e 。并且列出各观察值的频数f o ,这些值的累计频数为F o 。然后可得到差(F o ―F e ),以及差的最大绝对值max(|F o ―F e |)。用此最大值除以样本容量n ,即为累计频数检验用于拟合优度检验(参见第十三章第一节)时的检验统计量
D =n F F e o )
max(- 或者 D =max(n
F n F e o -)
SPSS非参数检验之卡方检验
SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q ()2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示 观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧
第七章 非参数检验习题 医学统计学习题
第七章非参数检验习题 一、 选择题 1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说()。 A.正秩和与负秩和的绝对值不会相差很大B.正秩和与负秩和的绝对值相等C.正秩和与负秩和的绝对值相差很大D.不能得出结论 E.以上都不对 2.设配对资料的变量值为1X 和2X ,则配对资料的秩和检验是()。 A.把1X 和2X 的差数从小到大排序B.分别按1X 和2X 从小到大排序C.把1X 和2X 综合从小到大排序D.把1X 和2X 的和数从小到大排序E.把1X 和2X 的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点()。 A.不受总体分布的限制B.适用于等级资料C.适用于未知分布型资料 D.适用于正态分布资料 E.适用于分布呈明显偏态的资料4.等级资料的比较宜采用()。A.秩和检验 B.F 检验 C.t 检验 D.2 检验 E.u 检验 5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的()。 A.两样本均数相同 B.两样本的中位数相同C.两样本对应的总体均数相同D.两样本对应的总体分布相同 E.两样本对应的总体均数不同 6.以下检验方法中,不属于非参数检验方法的是()。 A.Friedman 检验B.符号检验C.Kruskal-Wallis 检验 D.Wilcoxon 检验 E.t 检验 7.成组设计两样本比较的秩和检验中,描述不正确的是()。 A.将两组数据统一由小到大编秩 B.遇有相同数据,若在同一组,按顺序编秩C.遇有相同数据,若不在同一组,按顺序编秩D.遇有相同数据,若不在同一组,取其平均值 E.遇有相同数据,若在同一组,取平均致词 二、简答题 1.简要回答进行非参数统计检验的适用条件。2.你学过哪些设计的秩和检验,各有什么用途?3.试写出非参数统计方法的主要有缺点。三、计算题 1.对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH),结果见表7-1。问两种仪器所得结果有无差别?
假设检验——非参数检验
假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2 χ检验 2χ检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何 假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2χ检验的方法主要包括适合性检验和独立性检验。 (一)2 χ检验概述 2χ是实得数据与理论数据偏离程度的指标。其基本公式为: ∑-=e e f f f 2 02 )(χ (公式11—9) 式中,0f 为实际观察次数,e f 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2 χ。观察公式可发现,如果实际观察
第二讲-非参数统计检验教学内容
第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=??第个个体中新方法优于对照方法第个个体中新方法劣于对照方法1,2,,i N =L 统计量1N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24N N N N E S Var S ==。拒绝域为:{}N N S S c > (2)由中心极限定理可知,当2 ,1N N S N - →∞的零分布趋于标准正态分布。
拒绝域为 :N S u α??????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n ==?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00{}{}s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2}{}{2100α =≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如
第二讲-非参数统计检验
第二讲非参数检验 1. 实验目的 1. 了解非参数假设检验基本思想; 2. 会用SAS 软件中的proc nparlway 过程进行非参数假设检验和 proc freq 过程 进行列联表的独立性检验。 2. 实验要求 1. 会用SAS 软件建立数据集,并进行统计分析; 2. 掌握proc nparlway 过程进行非参数假设检验的基本步骤; 3. 掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1符号检验 H 0:两种方法的处理效果无显著性差异 令 li = * 1 第i 个个体中新方法优于对照方法 .0 第i 个个体中新方法劣于对照方法 i=1,2,|||,N 统计里S N N =瓦I i i T S N 表示新方法的处理效果优于对照方法的配对组总数。 若新方法的处理效果显著的优于对 照方法,则S N 的值应明显偏大。因此,若对给定的置信水平 [,有 P 「S N - 八 则拒绝H 0。 1 N N (1) S N 服从二项分布b(N ,-) E(S N ) ,Var (S N ) 。拒绝域为: 2 2 4 'S N S N c ; H 。为真时, (2)由中心极限定理可知,当 的零分布趋于标准正态分布