Mann-Kendall法(非参数检验方法)程序

Mann-Kendall法(非参数检验方法)程序
Mann-Kendall法(非参数检验方法)程序

Mann-Kendall法(非参数检验方法)程序

统计知识2009-02-02 13:47:51 阅读986 评论1 字号:大中小订阅

Mann-Kendall法(非参数检验方法)用于气候突变检测

program main

implicit none

c This is a program for testing climate jump i by use of

c 'Mann-Kendall test'.

c-------------------------------------------------

integer,parameter :: iy=100

integer i

real x(iy),u1(iy),u2(iy)

c-------Read Data

c-------

open(31,file='d: mk.txt ',form='formatted')

do i=1,50

x(i)=0.5

x(i+50)=-0.5

end do

c-------Mann-Kendall test method

call MKtest (iy,x,u1,u2)

c------

do i=1,iy

write(31,10)i,x(i),u1(i),u2(i)

end do

10 format(1x,i4,4f8.2)

stop

end

!c------------------------------------------------------------------

subroutine MKtest(m,x,u1,u2)

dimension x(m),u1(m),u2(m)

dimension xr(m),ur(m) !work array

do i=1,m

xr(i)=x(m+1-i)

end do

call MKrank(m,x,u1)

call MKrank(m,xr,ur)

do i=1,m

u2(i)=-ur(m+1-i)

enddo

return

end

!c------------------------------------------------------------------

!c-------Mann-Kendall Rank Statistic subroutine MKrank(m,x,u)

dimension x(m),u(m)

u(1)=0.0

d=0.0

do i=2,m

num=0

do j=1,i

if(x(i).gt.x(j))then

num=num+1

endif

enddo

d=d+float(num)

e=i*(i-1.)/4.

var=i*(i-1.)*(2.*i+5.)/72.

u(i)=(d-e)/sqrt(var)

enddo

return

end

第二讲 非参数统计检验

第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=? ?第个个体中新方法优于对照方法第个个体中新方法劣于对照方法 1,2,,i N = 统计量1 N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对 照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24 N N N N E S Var S = =。拒绝域为: {}N N S S c > (2) 由中心极限定理可知,当 2 , N N S N - →∞的零分布趋于标准正态分布。

拒绝域为 :N S u α?? ????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n == ?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00 {}{} s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2 }{}{2100α = ≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为 ,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2 χ检验 2χ检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何 假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2χ检验的方法主要包括适合性检验和独立性检验。 (一)2 χ检验概述 2χ是实得数据与理论数据偏离程度的指标。其基本公式为: ∑-=e e f f f 2 02 )(χ (公式11—9) 式中,0f 为实际观察次数,e f 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2 χ。观察公式可发现,如果实际观察

STATA 多组计量 比较的非参数检验命令与输出结果说明

第五章多组计量资料比较的非参数检验命令与输出结果说明本节STATA? 命令摘要 秩和检验 ( Mann,Whitney and Wilcoxon 非参数检验) 对于计量资料不满足正态分布要求或方差不齐性,但样本资料之间是独立抽取的,则可以应用秩和检验方法进行比较两组资料的中位数是否有差异。STATA命令为:ranksum?? 观察变量, by( 分组变量) 例:研究不同饲料对雌鼠体重增加的关系。表中用x表示雌鼠体重增加(克),用group=1表示高蛋白饲料组以及用group=2 表示低蛋白饲料组。 无效假设 Ho:两组增加体重的中位数相同。 ranksum x,? by(group)

①为第二组(低饲料组)的秩的和;② 若效假设成立,则第二组的秩的和期望值为70; ③秩和统计检验量z;④对于无效假设Ho对应的p值。 在本例中,虽然第二组的秩和为49.5而期望值估计为70,但p值为0.0832,所以根据该资料和统计结果一般不能认为用高蛋白饲料喂养能明显增加雌鼠的体重。 多组资料中位数比较(完全随机化设计资料的检验) 对于完全随机化设计资料的比较,若各组资料不全服从正态分布(即:至少有一组的资料均不服从正态分布)或各组的资料方差不齐性,则可以用Kruskal and Wallis方法进行检验(Ho:各组的中位数相同)。STATA命令为: kwallis?观察变量,by(分组变量)

例:50只小鼠随机分配到5个不同饲料组,每组10只小鼠。在喂养一定时间后,测定鼠肝中的铁的含量(mg/g)如表所示:试比较各组鼠肝中铁的含量是否有显着性差别。用x?表示鼠肝中铁的含量以及用group=1,2,3,4,5分别表示对应的5个组。 kwallis? x, by(group)

第五章假设检验

第五章假设检验 本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。通过学习,要求: 1.掌握统计检验的基本概念,理解该检验犯两类错误的可能; 2. 熟练掌握总体均值与总体成 数指标的各种检验方法;包括:z 检验、t 检验和p- 值检验;4. 掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验; 5. 能利用Excel 进行假设检验。 第一节假设检验概述 一、假设检验的基本概念 假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。 进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理” ,对假设的正确性做出判断。这种思维方法与数学里的“反证法” 很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。其实,我们在日常生活中,不仅不肯接受概率为0 的事件,而且对小概率事件,也持否定态度。比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。 所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件” 。 小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平 a 0<加1) 作为小概率的界限,a的取值与实际问题的性质有关。所以,统计检验又称显著性检验。 下面通过一个具体例子说明假设检验是怎样进行的。 【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢? 上述例子中,消费者协会实际要进行的是一项统计检验工作,检验总体平均容量是否等于包装上注明的250 毫升。即,检验总体平均=250 是否成立。这就是一个原假设(null hypothesis) ,通常用 H 0 表示,即: H 0 :=250 与原假设对立的是备选假设( alternative hypothesis) H 1 ,备选假设是在原假设被否定时另一 种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。上例中可能的备选假设有三种:

第二讲-非参数统计检验

第二讲非参数检验 1. 实验目的 1. 了解非参数假设检验基本思想; 2. 会用SAS 软件中的proc nparlway 过程进行非参数假设检验和 proc freq 过程 进行列联表的独立性检验。 2. 实验要求 1. 会用SAS 软件建立数据集,并进行统计分析; 2. 掌握proc nparlway 过程进行非参数假设检验的基本步骤; 3. 掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1符号检验 H 0:两种方法的处理效果无显著性差异 令 li = * 1 第i 个个体中新方法优于对照方法 .0 第i 个个体中新方法劣于对照方法 i=1,2,|||,N 统计里S N N =瓦I i i T S N 表示新方法的处理效果优于对照方法的配对组总数。 若新方法的处理效果显著的优于对 照方法,则S N 的值应明显偏大。因此,若对给定的置信水平 [,有 P 「S N - 八 则拒绝H 0。 1 N N (1) S N 服从二项分布b(N ,-) E(S N ) ,Var (S N ) 。拒绝域为: 2 2 4 'S N S N c ; H 。为真时, (2)由中心极限定理可知,当 的零分布趋于标准正态分布

3.2 Wilcox on 秩和检验 (1)单边假设检验 H o :两种方法的处理效果无显著性差异 as H i ::新方法优于对照方法。 n 用于检验H o 的统计量为:W s I i i 4 若对给定的置信水平,有P [W s - C 「:〉,则拒绝H o 。且W s 的分布列为: P H °{W S = w #{w ;n ,m} ' 了 N 、 1 1 n 根据观测结果计算W s 的观测值W s 0,计算检验的p 值: p= P H o {W s - W s }八 P H °{W S 二 k} k _w s 然后将p 值与显著水平:?作比较,若p ::: :?,则拒绝H 0,否则接受H 0。 (2)双边假设检验 给定的显著水平:-,C |和c 2应该满足: P H 0{W A 乞 c 1} P H 0{W A - c 2} = 仅由上式还不能唯一确定 &和C 2,当我们对两种方法谁优谁劣不得而知时,通常取 P H °{W A 22 c 1} = P H °{W A - c 2} = ~ 若利用p 值进行检验,设 W A 的观测值为'A ,计算概率值 P H °{W A - A }或P H °{W A 「A } 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如 0 乞 P H °{ W A - ' A ^V 2 则 p = 2P H 0{W A - ? ■ A }。求出 p 值后,若 p

非参数检验

非参数检验 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*第五章非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*主要内容参数检验与非参数检验的比较单样本的非参数检验独立样本非参数检验相关样本的非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较参数检验和非参数检验的区别参数检验和非参数检验最本质的区别:参数检验需要事先确定或假定总体的分布非参数检验则不需要假定总体的分布而是直接用样本来推断总体的分布。 可以通过是否假定总体的分布来区分参数检验和非参数检验除此之外二者之间还可以从很多方面来区分。 ()研究的对象和目标不同。 参数检验研究的是总体的参数不涉及总体的分布检验一旦总体的参数确定总体的分布也就确定了非参数检验的目标是直接从样本推导总体的分布或两个总体的分布是否相同。 ()研究的统计量有所不同。 参数检验中很少用到秩来构造统计量无论样本量大小都能对总体进行推断非参数检验中常用秩、秩和等来构造统计量且常要求样本量较大。 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较非参数检验的优点()它对总体分布一般不做过多的限制性假设任何分布都可以用非参数检验进行研究从应用范围

看其应用范围大于参数检验。 ()由于非参数检验不依赖于总体的分布形式因而它天然具有稳健性特征。 ()对资料的测量水平要求不高这给资料的搜集带来了很大的方便可以大大减轻统计资料的搜集工作量。 同时也为属性资料研究提供了广泛的基础。 ()非参数检验比较直观很容易理解不需要太多数学知识和统计理论。 多数非参数检验的运算比较简单可以较快地取得统计结果。 非参数检验的上述优点表明在实际问题的研究中它是一种比较有用的统计方法。 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较非参数检验的缺点有些人主张用非参数检验取代参数检验这种看法有点偏激因为非参数检验毕竟存在着一些自身难以克服的不足表现在:()两者的效率有差距。 非参数检验主要处理定序资料这类资料的测量尺度比较低如果把那些能够用参数检验处理的资料转化为定类和定序资料必然会丢失检验数据的一部分信息因此非参数检验的有效性或检验效率不如参数检验。 ()当样本容量比较大时非参数检验的计算也比较繁杂、困难。 ()参数检验与非参数检验各有各的特点并非所有的参数检验都能转用非参数检验。

非参数假设检验法及其运用

非参数假设检验法及其运用 摘要:在国际金融危机下,以中国股市数据为依据,运用S-plus 统计分析软件和Excel ,对中国股市正态分布假设进行了Kolmogorv拟合优度检验,运用方差平方秩检验方法,比较分析了上证指数和深证综指的波动性。 关键字:股市;Kolmogorov拟合优度检验;秩检验。 引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验。王金玉、李霞、潘德惠(2005)通过引入一种新的估计方法“非参数假设检验方法”,以达到对证券投资咨询机构,对证券市场大盘走势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验,对上证指数与深成指间协整关系进行了研究,结论是:上证指数与深圳成指之间确实存在非线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市波动性特征的合适的统计模型。 在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用Kolmogorov拟合优度检验,对中国股市进行了正态分布假设检验;运用方差平方秩检验方法,比较分析了上海指数和深圳综指的波动性。 正文: 一、Kolmogorov拟合优度检验以及方差的平方秩检验方法。 (一)Kolmogorov拟合优度检验 1. 原假设和备择假设 原假设H :样本来自于正态分布总体。 备择假设H 1 :样本不是来自于正态分布总体。 2. 检验统计量 令S (x) 是样本X 1、X 2 、…X n 、的经验分布函数,F*(x)是完全已知的假设分布函数, 则检验统计量T为S (x) 与F*(x)的最大垂直距离,即:T = sup| F*(x)- S (x)|。 3. P值计算 近似P值可以通过在表A13中插值得到,或者利用2倍的单边检验的P值。 单边P值= 1 )] 1( [ 1 1 - - - = ? ? ? ? ? + ? ? ? ? ? - - ?? ? ? ? ? ∑j j n t n j n j t n j t j n 这里t的是检验统计量的观测值,[n(1-t)] 且是小于等于n(1-t)的最大整数。当给定的显著性水平α大于或等于P值时,拒绝原假设。 在本文中,该检验是运用S-plus 统计分析软件实现的。 (二) 方差的平方秩检验 1. 原假设和备择假设 ( 1 ) 双边检验 1 原假设H :除了它们的均值可能不同外,X和Y同分布。

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检 验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5 )非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2检验 2 检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2 2 检验的方法主要包括适合性检验和独立性检验。 (一)2检验概述 2 是实得数据与理论数据偏离程度的指标。其基本公式为: 2 ( f0 f e)(公式11—9) f e 式中,f0 为实际观察次数,f e 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。观察公式可发现,如果实际观察

数理统计 实验三 非参数假设检验

西北农林科技大学实验报告 学院名称:理学院专业年级: 姓名:学号: 课程:数理统计学报告日期: 实验三非参数假设检验 一.实验目的 1.验证某产品的合格率是否是否低于0.9. 2.检验某地区儿童身高是否符合正态分布。 3.为研究心脏病猝死人数与日期的关系,收集到168个观测数据, 利用这批样本数据推断猝死人数与日期的关系是否为2.8:1:1:1:1:1:1. 4.某工厂用甲乙两种工艺生产同一种产品,利用样本数据检验两种 工艺下产品使用寿命是否存在显著差异。 二.实验要求 用spss实现非参数假设检验,包括二项式检验,单样本正态分布检验,两个独立样本检验,卡方检验。 三.实验内容 (一)验证某产品的合格率是否是否低于0.9. 打开文件“非参数检验(产品合格率)”,点击分析->非参数检验->旧对话框->二项式,把数据“是否合格”添加到检验变量列表,把检验比例默认的0.5该为题目要求的0.9(如图所示)。

点击确定得到结论(如图所示)。 结论: 0.80.90.1930.05(1p) 0.90.123w p P p n ????--??≥=>??-??????? 由上表知,SPSS 的悖假设检验案例比例小于0.9的,并且在精确显著(单侧)值sig=0.193>0.05,即接受原假设检验,即二项式检

验的案例比例是大于0.9的。 (二)检验某地区儿童身高是否符合正态分布。 打开文件“非参数检验(单样本KS-儿童身高)”,点击分析->非参数检验->旧对话框->1样本,把数据“周岁儿童的身高(sg)”添加到检验变量列表,检验分布默认为常规,即正态(如图所示)。 点击确定得到结论(如图所示)。

第五章多组计量资料比较的非参数检验命令与输出结果说明

第五章多组计量资料比较的非参数检验命令与输出结果说明 对于计量资料不满足正态分布要求或方差不齐性,但样本资料之间是独立抽取的,则可以应用秩和检验方法进行比较两组资料的中位数是否有差异。STATA 命令为: ranksum 观察变量, by( 分组变量) 例:研究不同饲料对雌鼠体重增加的关系。表中用x表示雌鼠体重增加 . ranksum x, by(group) Two-sample Wilcoxon rank-sum (Mann-Whitney) test group obs rank sum expected 1 1 2 140.5 120 2 7 49.5 70 combined 19 190 190 unadjusted variance 140.00 adjustment for ties -0.12 adjusted variance 139.88 Ho: x(group==1) = x(group==2) z = 1.733 Prob > |z| = 0.0830 望值为70;③秩和统计检验量z;④对于无效假设Ho对应的p值。 在本例中,虽然第二组的秩和为49.5而期望值估计为70,但p值为0.0832,所以根据该资料和统计结果一般不能认为用高蛋白饲料喂养能明显增加雌鼠的体重。 多组资料中位数比较(完全随机化设计资料的检验)

对于完全随机化设计资料的比较,若各组资料不全服从正态分布(即:至少有一组的资料均不服从正态分布)或各组的资料方差不齐性,则可以用Kruskal and Wallis方法进行检验(Ho:各组的中位数相同)。STATA命令为: kwallis 观察变量,by(分组变量) 例:50只小鼠随机分配到5个不同饲料组,每组10只小鼠。在喂养一定时间后,测定鼠肝中的铁的含量(mg/g)如表所示:试比较各组鼠肝中铁的含量是否有显著性差别。用x 表示鼠肝中铁的含量以及用group=1,2,3,4,5分别表 Kruskal-Wallis equality-of-populations rank test group Obs Rank Sum 1 10 188.50 2 10 280.50 3 10 420.00 4 10 95.00 5 10 291.00 chi-squared = 27.856 with 4 d.f. probability = 0.0001 chi-squared with ties = 27.858 with 4 d.f. probability = 0.0001 p 值。 本例结果表明:5组的中位数有显著的差异。即:5个不同饲料组的小鼠肝脏中铁的含量有显著差异,说明小鼠肝脏中铁的含量与喂养的饲料有关。

两个独立样本的非参数检验方法有哪四种

两个独立样本的非参数检验方法有哪四种 两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。 一、Mann-Whitney U检验 主要通过对平均秩的研究来实现推断。 将数据按照升序进行排序,每一个具体数据都会有一个在整个数据中的名次或排序序号,这个名次就是该数据的秩。 相同观察值(即相同秩,ties),取平均秩。 两独立样本的Mann-Whitney U检验的零假设 H0:两个样本来自的独立总体均值没有显著差异。 将两组样本(X1 X2 …… Xm)(Y1 Y2 …… Yn)混合升序排序,每个数据将得到一个对应的秩。 计算两组样本数据的秩和Wx ,Wy 。 N=m+n Wx+Wy= N(N+1)/2 如果H0成立,即两组分布位置相同,Wx应接近理论秩和 m(N+1)/2; Wy 应接近理论秩和n(N+1)/2)。 如果相差较大,超出了预定的界值,则可认为H0不成立。 二、两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。

最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 三、游程检验(Wald-Wolfwitz Runs) 零假设是H0:为样本来自的两独立总体分布没有显著差异。 样本的游程检验中,计算游程的方法与观察值的秩有关。首先,将两组样本混合并按照升序排列。在数据排序时,两组样本的每个观察值对应的样本组标志值序列也随之重新排列,然后对标志值序列求游程。 如果计算出的游程数相对比较小,则说明样本来自的两总体的分布形态存在较大差距;如果得到的游程数相对比较大,则说明样本来自的两总体的分布形态不存在显著差距。 SPSS将自动计算游程数得到Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为两个样本来自的总体分布无显著差异。 四、极端反应检验 从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。

两个独立样本的非参数检验方法有4种

两个独立样本的非参数检验方法有4种 曼-惠特尼U检验(Mann—whitney U) 两个独立的曼-惠特尼U检验可用于对两个总体分布的比较判断。其零假设是两组独立样本来自的总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现推断秩简单的说就是变量值排序的名次。 两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。主要差别在于:这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。 ③最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 两独立样本的游程检验 单样本游程检验用来检验变量值的出现是否随机,而两个独立变量游程检验则用来检验两个独立样本来自的两个总体的分布是否存在显著差异。其零假设是两组独立样本来自的两个总体的分布无显著差异。 两独立样本的游程检验与单样本游程检验的基本思想相同,不同的是计算游程数的方法。两独立样本的游程检验中,又程数依赖于变量的秩。 步骤如下:首先,将两组样本混合并按升序排列,在变量值排序的同时,对应的组标记值也会随之重新排列。 然后,对组标记只序列按前面讨论的游程的方法计算游程数容易理解:如果两总体的分布存在较大的差距,那么游程数会相对比较少,如果游程数比较大,则应是两组样本充分混合的结果,那么总体的分布不会存在显著差异。 再次,根据游程数据计算Z统计量,该统计量近似服从正态分布。 极端反应检验 极端反应检验从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。 第1 页共1 页

完整word版,非参数统计分析方法总结,推荐文档

非参数统计分析方法 一单样本问题 1,二项式检验:检验样本参数是否与整体参数有什么关系。 样本量为n,给定一个实数M0(代表题目给出的分位点数),和分位点∏(0.25,0.5,0.75)。用S-记做样本中比M0小的数的个数,S+记做样本中比M0大的数的个数。如果原假设H0成立那么S-与n的比之应为∏。 H0:M=M0 H1:M≠MO或者M>M0或者M

长度长) Spss步骤:分析—非参数检验—游程 得出统计量R和p值 当p值小于0.05时拒绝原假设,没有充足理由证明该数据出现是随机的 二,两个样本位置问题 1,Brown—Mood中位数检验 给出两个样本比较两个样本的中位数或者四分位数等是否相等或者有一定关系,设一个中值为M1,一个为M2 H0:M1=M2. H1:M1≠M2或者M1>M2或者M1

非参数检验 SPSS操作

非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample

第5章 K个相关样本的非参数检验

1 第五章 K 个相关样本的非参数检验 §5.1 几个概念 在参数检验中,我们常常对三个或三个以上的总体的均值进行相等性检验,使用的方法是方差分析,在非参数分析中也会遇到同样的问题,检验多个总体的分布是否相同。更严密的说,当几个总体的分布相同的条件下,讨论其位置参数是否相等。方差分析过程需要假定条件,F 检验才有效。可有时候所采集的数据常常不能满足这些条件,像多样本比较时一样,我们不妨尝试将数据转化为秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。秩方法在方差分析中的应用。 1、 处理—样本; 2、 区组—因素 在K 个不同的条件下,对n 个受试者进行试验。得下列数据: §5.2 Kruskal Wallis 检验 在比较两个以上的总体时广泛使用的Kruckal-Wallis 检验,就是对两个以上的秩样本进行比较的非参数方法,实质上它是两样本比较时的Wilcoxon 方法在多于两个样本时的推广。 在该测验中,首先计算全体样本中的秩,遇到数据出现相等,即存在“结”的 情况时,采用“平均秩”手段让它们分享它们理应所得的秩和,再对数据(秩)进行方差分析,但构造的统计量并不是组间平均平方和除以组内平均平方和,而是KW=组间平方和/总平方和的平均数,KW 表示Kruskal-Wallis 统计量。 k M M M H === 210: 。至少一对位置参数不等 :1H

2 KW 统计量的观察值是我们判定各组之间是否存在差异的有力依据,因为我们需要检验的原假设是各组之间不存在差异,或者说各组样本来自的总体具有相同的中心(均值或中位数)。Kruskal-Wallis 统计量的计算步骤为: 将 k 组数据混合,并从小到大排列,列出等级,如有相同数据则取平均等级,如果原假设为不真,某个总体的位置参数太大,则其观测值也倾向于取较大的值,则该总体的观测值的秩和也会偏大,因而导致 ∑=+- += N i i i N N R n N N S 1 2 )2 1() 1(12 偏大,其中j n j ij i n R R j /1 ∑== 。 S N 的含义是:∑=+- N i i i N R n 1 2 )21(是组间离差平方和 2 1 )2 1(1 1 ∑=+- -N i N i N ?? ????+--=∑=212 )21(11N i N N i N 12 )1(+= N N ∑=+- += N i i i N N R n N N S 1 2 )2 1() 1(12 在原假设为真的条件下,只要k 大于3, KW 很快地依分布趋于自由度为(k-1)的)1(2 -k χ分布。 例:从我国上市公司中分别随机抽取了工业、商业、建筑业、交通运输业等四个行业,其在1999年的总资产报酬率如下: 问四个行业资产报酬率是否有显著性差异.

相关文档
最新文档