第五章 非参数检验

合集下载

非参数检验

非参数检验


等级资料的分析方法是否和 一般计数资料的检验方法相同呢?
等级资料的分析应该选用什么方法?
实例1 考察硝苯地平治疗老年性支气管炎的疗效,治疗组 60人,用硝苯地平治疗,对照组58人,常规治疗,两组患
者的性别、年龄、病程无显著性差异,治疗结果见表1。
表 1 治疗组与对照组疗效比较 组别 治疗组 对照组 例数 60 58 例 数 无效 6 14 有效 19 20 显效 35 24 百分比(%) 无效 10.00 24.14 有效 31.67 34.48 显效 58.33 41.38
Test Statistics Chi-Squarea df Asymp. Sig. 身 体状 况 12.135 4 .016
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 5.0.
分布类型检验
分布位置检验
Nonparametric Test菜单(1)
• 分布类型检验方法
–Chi-Square 检验二项/多项分布 分类资料 –Binomial 检验二项分类变量分布 –Runs 检验样本序列随机性(游程检验) –1-Sample K-S 检验样本是否服从各种分布
Nonparametric Test菜单(2)
ill 1.00 num 1.00
1
2
0.00
399.00
• 1.weight cases by:num • 2.analyze-nonparametric test-binomial
Binomial Test Category 1.00 .00 N 1 399 400 Observed Prop. .00 1.00 1.00 Test Prop. .01 Asymp. Sig. Exact Sig. (1-tailed) (1-tailed) a,b .090 .090

非参数检验的概念

非参数检验的概念

者创伤较大,极易导致患者出现围术期应激反应,进而引起血压升高、心跳加速、肾上腺素及去甲肾上腺素升高[7-8]。

临床针对这一现状,通常采用加深麻醉药物来改善,但是术后会延迟患者肺功能恢复,同时,由于术后患者创口疼痛导致患者惧怕咳嗽,极易引发肺部感染,影响患者预后。

椎旁神经阻滞是通过将麻醉溶剂导入到脊神经附近,将该侧运动神经、交感神经及感觉神经同时麻醉,该技术镇痛部位准确,相较常规麻醉,减少了麻醉药物对其他神经系统的伤害,具有良好的麻醉效果。

随着医疗技术的不断发展,临床推出了超声引导连续胸椎旁神经阻滞,该技术的推出,对于穿刺方向及穿刺深度均有了进一步提高,同时,通过超声引导,还能在患者体内留置导管便于术后镇痛,不但可以缓解患者术后痛苦,还能提高手术效果[9-10]。

该研究结果显示,研究组麻醉有效率为94.87%,高于对照组71.79%,组间对比差异有统计学意义(P<0.05);研究组患者血流动力学指标为(109.5±14.2)mmHg;(87.3±15.4)次/min优于对照组(96.5±14.7)mmHg;(79.7±14.3)次/min,差异有统计学意义(P<0.05);研究组收缩压(134.36±12.24)mmHg及舒张压(89.23±6.78)mmHg显著优于对照组(123.37±10.65)mmHg,(81.24±7.23)mmHg,组间对比差异有统计学意义(P<0.05)。

在刘媛媛等[11]的研究中,研究组患者麻醉有效率为95.39%,血流动力学指标为(105.7±12.8)mmHg,(88.1±14.9)次/min,研究组收缩压(134.36±12.24)mmHg及舒张压(89.23±6.78)mmHg,相较对照组结果更为突出,该研究研究组麻醉效果、血流动力学指标、收缩压及舒张压均优于对照组,与刘媛媛等[11]研究结果相差无几,具有可靠性。

第5讲SPSS非参数检验

第5讲SPSS非参数检验
二、操作
数据文件:“糖果中的卡路里.sav” 菜单:“分析→非参数检验→旧对话框→K个独立样本”
多独立样本非参数检验整体分析与设计的内容
输入最大值、 最小值。
Kruskal-Wallis H检 验:是曼-惠特尼U 检验在多个独立样 本下的推广。
检验各个样本是否来自有相同中位数的 总体。--- 这种检验的效能最低。
2)对数据的测量尺度无约束,对数据的要求也不严格,任何数据类型 都可以。
3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
注:若参数检验模型的所有假设在数据中都能满足,而且测量达到了所 要求的水平,那么,此时用非参数检验就浪费了数据。
因此,若所需假设都满足的情况下,一般就选择参数检验方法。
卡方检验
此时,零假设:两总体的 均值无显著性差异;就可 能不成立。
K-S检验。以变量的秩 作为分析对象;而非变 量值本身。
也需要先将两组样本混 合、升序排列。
两独立样本非参数检验整体分析与设计的内容 二、操作
该检验有特定用途,给出的结果均为单侧 检验。若施加的处理时的某些个体出现正 向效应,而另一些个体出现负向效应时, 就应当采用该检验方法。 基本思想为:将一组样本作为控制样本, 另一组作为试验样本。以控制样本为对照, 检验试验样本相对于控制样本是否出现了 极端反应。若无极端反应,则认为两总体 分布无显著性差异;否则,有显著性差异。
选择分布
“结”的处理
单样本K-S检验
整体分析与设计的内容
三、补充描述性统计的P-P图和Q-Q图
P-P图的输出样子: P-P图
期望(理论)累计 概率值
去势P-P图
样本数据实际累计 概率值
实际与期望的差值
样本数据实际累计 概率值

非参数检验

非参数检验
200
200
取显著性水平为0.05,查 2 分布表得临界值
2 0.05
(4)
9.488
,由于
2统计量大于临界值,所以应该拒
绝原假设,即认为消费者对各种品牌茶叶的偏好是有差
别的。
二、符号检验
1. 单样本位置的符号检验
一个随机样本,有 n 个数据
x1,x2,…,xn,其实际的总体中位数为
M,假定的中位数是某个特定值,记 做 M0 。位置检验是检验真实的中位 数和假定的中位数的关系:大于、等 于还是小于。
品牌,每一种只标上A、B、C、D、E,随机抽取1000消费 者,每人都品尝五种茶叶,然后把最偏好的茶叶的字母 写下来。下表是整理后的消费者偏好的频数分布。要求 判断消费者对这几种品牌茶叶的偏好有没有差异?
各种品牌茶叶爱好者的频数分布
喜欢的品牌
A B C D E
合计
人数
220 302 175 80 223
一、 检验
属于拟合程度检验,它是利用随机 样本对总体分布与某种特定
分布拟合程度 的检验 。
检验步骤:
① 确立原假设和备择假设。 ② 按照“原假设为真”的假定,导出 一组期望频数或理论频数。 ③ 计算 2 统计量 。
2 k ( fi ei )2
i1
ei
若统计量的值较大,拒绝原假设。
【例10.14】假定有五种不同牌号的茶叶,但都未标明
市场调查
【例10.15】领导者的领导水平是可以训练的吗?
根据人的聪明程度、人品、受教育状况等,随机抽取30 人配成15对,每对中有一人随机选择受训,另一人不受 训。经过一段时间后,按被设计好的问题评价他们的领 导水平,结果如下表所示。
领导水平评价表

非参数检验

非参数检验

两种方法治疗扁平足效果观察
建立假设
病例号
原始记录 A法 B法
量化值 A法 B法
差值
秩次
H0:两法疗效差值的总体中位数
1 2
为0;
3
4
H1:差值的总体中位数不为0。
5
6
=0.05
7
8
计算检验统计量
9
10
编秩:
11
12
求秩和:T+=61.5,T-
13
=4.5
14 15
















秩和(rank sum): 同组秩次之和;在一定程度上反映了等级 的分布位置。
秩和检验:就是通过秩次的排列求出秩和,进行假设检验。
11
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test ) 利用秩的大小进行推断就避免了不知道背景分布的
困难。这也是非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩的性质;
但也有一些非参数方法没有涉及秩的性质。 掌握对数据进行编秩的方法是学习秩和检验的基本
要求。
12
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test )
A组: - 、、+、+、+、+、++、++、++、++、+++、+++
适用条件: (1)上述两种设计类型的资料不满足参数检 验条件。 (2)配对设计等级资料的比较。

非参数检验

非参数检验

组别 95-99 90-94 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49
fo 4 12 18 28 44 72 46 40 22 18 10 314
组上限 99.5 94.5 89.5 84.5 79.5 74.5 69.5 64.5 59.5 54.5 49.5
fe 行合计数 列合计数 总次数
, fb , fd
( a b )( b d ) abcd ( c d )( b d ) abcd
注意:2×2列联表的自由度df=(2-1)(2-1)=1
例 为比较某新药与传统药物治疗脑动脉硬化的疗效, 临床试验结果见表,问两种药物的疗效有无差异? 表 两种药物治疗脑动脉硬化的疗效 处理措施 新药组 有效 无效 合计 44 24 68
41(38.18) 3(5.82)
传统药物组 18(20.82) 6(3.18) 合计 59 9
• 4、关于2×2列联表在数据合并上应注意 的问题 • 2×2列联表只是 的一个特例,实际上, 在很多情况下,变量的分类不止两个,当 我们把各部分数据合并成2×2列联表来表 达时,可能会忽略其中一些重要的变量, 造成 检验的失真,即可能会出现这样的 情况:单独分析每一个2×2列联表所得的 结果与合并成一个2×2列联表所做的 分 析结果相矛盾。
2

( 69 74 . 4 ) 74 . 4

(16 11 . 6 ) 11 . 6
22 . 2748
• 3、推断:
取 0 . 05 , df 5 1 4 , 查表得: 22 . 2748
2 2 0 . 05 ( 4 ) 2 0 . 05 ( 4 )

非参数检验

非参数检验

非参数检验非参数检验是一种统计方法,用于比较两组或多组数据的差异或关联性,它并不依赖于数据的分布假设。

相比于参数检验,非参数检验通常更为灵活,可应用于各种数据类型和样本量,尤其在数据不满足正态分布的情况下表现优势。

本文旨在介绍非参数检验的基本原理、应用领域以及常见方法。

首先,非参数检验的基本原理是依赖于样本中的秩次,即将原始数据转化为秩次数据进行统计分析。

秩次是数据在全体中的相对位置,将数据转化为秩次可以消除异常值对统计结果的影响,并使数据的分布不再成为限制因素。

非参数检验的应用领域广泛,包括但不限于以下几个方面。

一、假设检验非参数检验可用于假设检验,比如检验两组样本的中位数是否存在差异。

常见的方法有Wilcoxon符号秩检验、Mann-Whitney U检验等。

在实际应用中,如果数据的分布无法满足正态分布假设,非参数检验则是一种理想的选择。

二、相关性分析非参数检验可用于判断两个变量之间的关联性。

常见的方法有Spearman秩相关系数检验、Kendall秩相关系数检验等。

这些方法的核心思想是将原始数据转化为秩次数据,通过秩次数据之间的比较来判断两个变量之间是否存在显著相关。

三、分组比较非参数检验可用于比较多个样本之间的差异。

常见的方法有Kruskal-Wallis检验、Friedman检验等。

这些方法可用于比较三个以上的样本组之间的差异,而不依赖于数据的分布假设。

在实际应用中,非参数检验需要注意以下几个问题。

一、样本容量非参数检验对样本容量的要求相对较低,适用于小样本和大样本。

然而,在样本容量较小的情况下,非参数检验可能会产生较大的误差,因此应根据实际情况选择合适的方法。

二、数据类型非参数检验可应用于各种数据类型,包括连续型数据和离散型数据。

但对于有序分类数据、定序数据和名义数据,非参数检验相较于参数检验有更好的适用性。

三、分布假设非参数检验不需要对数据的分布做出假设,这使得它更加灵活。

但是,如果数据满足正态分布假设,参数检验也是一种较为有效的选择。

非参数检验

非参数检验
非参数检验又称为任意分布检验 (distribution-free test),它不考虑 研究对象总体分布具体形式,也不对总体 参数进行统计推断,而是通过检验样本所 代表的总体分布形式是否一致来得出统计 结论。
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
低于参数检验。
6.3 多个样本比较的秩和检验
6.3.2 中位数检验
例 用两种不同的方式饲养鸡,检测鸡粪样中球虫 卵的数量,得如下数据,试检验这两种饲养方式 鸡感染球虫的程度是否相同。
6.3 多个样本比较的秩和检验
6.3.2 中位数检验
① DPS 输入数据,选择数据,点击菜单试验统计→非 参数检验→中位数检验:
6.2 符号秩检验
符号秩检验是改进的符号检验,也叫 Wilcoxon检验,其效能远高于符号检验, 因为它除了比较各对数值的差值的符号外, 还比较各对数据差值大小的秩次高低。但 符号秩检验的效率仍然低于t检验,大约为t 检验的96%。
6.2.1 配对样本符号秩检验
当5≤n≤25时,计算T+与T-; 当n>25时,采用正态近似法,计算Z值。 当n<5时不能得出有差别的结论。
第五章 非参数检验
非参数检验对总体分布的具体形式不作任 何限制性的假定,不宜总体参数具体数值 估计或检验为目的。非参数检验最大的特 点是对样本资料无特殊要求,但检验的效 率要低于参数检验。如对非配对资料的秩 和检验,其效率仅为t检验的86.4%,也就 是说,以相同概率判断出显著差异,t检验 所需样本含量要比秩和检验少13.6%。
6.2.2 非配对样本符号秩检验
例 研究两种不同能量水平饲料对5-6周龄肉仔鸡 增重(克)的影响,资料如下表所示。问两种不 同能量水平的饲料对肉仔鸡增重的影响有无差异?
饲 料 肉仔鸡增重(g)
高能量 低能量
603 489
585 457
598 512
620 567
617 512
650 585
591
531
Minitab 输入数据,点击菜单统计→非参数→单 样本符号:
6.1 符号检验
Minitab 弹出对话框,将含砷量选择到变量中,选 择检验中位数,后面输入1,备择选择大于:
6.1 符号检验
Minitab 点击确定,即可得到结果:
p=0.1445>0.05,表明水库中鱼肉的含砷量未超 过食用标准1mg/kg。
6.4 Kendall协同系数检验
例4个独立的环境研究单位对15个学校排序,问4 个单位对不同学校的排序知否有一致性?
Kendall协同系数检验的零假设是:这些对于 不同学校的排序是不相关的或者是随机的;而备 选假设为:这些对不同学校的排序是正相关的或 者是多少一致的。
6.4 Kendall协同系数检验
p=0.0210<0.05,表明给药前后灌流滴数有显著 差异。
6.2.2 非配对样本符号秩检验
非配对样本的秩检验是关于 分别抽自两个总体的两个独立样 本之间秩次的比较,它比配对样 本的秩次检验的应用更为普遍。 常用的有两样本的Wilcoxon秩和 检验以及在此基础上发展的MannWhitney检验。
6.3 多个样本比较的秩和检验
6.3.1 Kruskal-Wallis 检验
① DPS 输入数据,选择数据,点击菜单试验统计→非 参数检验→Kruskal Wallis检验:
6.3 多个样本比较的秩和检验
结果:
经近似卡方分布的显著 性检验, p=0.007271<0.01,表 明三组小鼠之间的3H 吸收量有非常显著的差 异。
表中,10名学生各方面能力分成1~10进行等级顺序排列。
6.6.2 Kendall等级相关
在DPS中输入数据,选择数据,点击菜单多元分 析→相关分析→两变量相关分析:
6.6.2 Kendall等级相关
弹出对话框,选择Kendal秩相关:
6.6.2 Kendall等级相关
结果:
结果表明,x1(艺术)与x2(文学)之间相关非常显著(p=0.0004<0.01), 相关系数τ=0.7778;x1(艺术)与x3(音乐)之间相关不显著 (p=0.6007>0.05);x2(文学)与x3(音乐)之间相关不显著 (p=0.4843>0.05)。
6.3 多个样本比较的秩和检验
6.3.2 中位数检验
① DPS 立即得到结果
卡方值为7.1429,p=0.0075<0.01,表明两种饲 养方式下鸡粪样中球虫卵的数量有非常显著的差 异。
6.4 Kendall协同系数检验
Kendall协同系数检验适用于几个个分类变 量均为有序分类的情况。在实践中,常需要按照 某些特别的性质来多次对一些个体进行评估或排 序;比如几个(m个)评估机构对一些(n个) 学校进行排序。人们想要知道,这些机构的不同 结果是否一致。如果很不一致,则该评估多少有 些随机,意义不大。这可以用Kendall协同系数检 验。像学生的能力有动手能力、文学能力、数学 能力、办事能力、艺术能力等等;工人各方面的 素质有责任心、身体状况、操作熟练程度等,而 这些方面属于平行的顺序等级。
在进行完全随机设计的多组均数比较 时,试验观测结果有时会严重偏离正态分 布,或组间方差不齐,或者观测结果是有 序的,这时就要用多个样本比较的秩和检 验。
6.3 多个样本比较的秩和检验
6.3.1 Kruskal-Wallis 检验
例 为了研究精氨酸对小鼠截肢后淋巴细胞转 化功能的影响,将21只昆明种小鼠随机等分成3 组:对照组A、截肢组B、截肢后用精氨酸治疗组 C。实验观测脾淋巴细胞对HPA刺激的增值反应, 测量指标是3H吸收量,数据如下:
① DPS 输入数据,选择数据,点击菜单试验统计→非 参数检验→Kendall协同系数检验:
6.4 Kendall协同系数检验
① DPS 立即得到结果:
协同系数W=0.4911,近似卡方值为27.5000, p=0.0166<0.05,表明不同机构对学校的排序是 正相关的,是有显著一致性的。
6.5 二元响应的Cochran检验
6.1 符号检验
例6.1 某水库因采矿收到污染,为研究对渔 业的影响,现随机抽取8个鱼肉样品,测定 鱼肉中有害物质砷的含量(mg/kg)为: 1.032,1.045,1.056,1.028,0.985, 0.996,1.058,1.063。问该水库的鱼肉含 量是否超过食用标准1mg/kg?
6.1 符号检验
6.6.1 Spearman秩相关
例 调查了某地区10个乡的钉螺密度与血吸虫感 染率(%)数据如表14-7。试分析该地区螺密度 与感染率之间有无相关关系?
6.6.1 Spearman秩相关
DPS 输入数据,选择数据,点击菜单多元分析→相 关分析→两个变量相关分析:
6.6.1 Spearman秩相关
467
6.2.2 非配对样本符号秩检验
DPS 输入数据,选择数据,点击菜单试验统计→非 参数检验→两样本WilcoxonS 即可得到结果:
p=0.003<0.01,表明两种不同能量水平的饲料对 肉仔鸡增重有非常显著的差异。
6.3 多个样本比较的秩和检验
6.5 二元响应的Cochran检验
① DPS 输入数据,选择数据,点击菜单试验统计→非 参数检验→Cochran检验:
6.5 二元响应的Cochran检验
① DPS 结果:
Qc=12.3443,p=0.0063<0.01,表明4种瓶装引 用水在顾客眼中是有非常显著的差别。
6.6 秩相关
两个连续变量间呈线性相关时,使用 Pearson相关系数,不满足线性相关分析的适用 条件时,可以使用非参数秩相关系数来描述。常 用的秩相关有Spearman相关与Kendall等级相关。 Spearman相关是利用两变量的秩次大小作 线性相关分析,对原始变量的分布不作要求。对 于服从Pearson相关系数的数据亦可计算 Spearman相关系数,但统计效能要低一些。 Kendall等级相关适用于两个分类变量均为有 序分类的情况。
DPS 弹出对话框,选择Spearman秩相关:
6.6.1 Spearman秩相关
DPS 点击确定,得到结果:
相关系数=0.817088,p=0.0082<0.01,相关是 非常显著的。
6.6.2 Kendall等级相关
某大学抽取10名学生艺术、文学、音乐三方面方 面能力进行测试,试分析学生三方面能力之间有 无一致性。
当观测值只取诸如0或1两个可能值时,由于
有太多同样的数目(只有0和1),排序的意义就
很成问题了。这里要引进的Cochran检验。
6.5 二元响应的Cochran检验
例 20名顾客对4种瓶装饮用水进行了认可(记为 1)和不认可(记为0)的表态。问这4种瓶装水 在顾客眼中是否有区别。
这里的零假设是这些瓶装水(处理)在顾客(区 组)眼中没有区别。
第1组(A组)为对照组,多重比较显示,第1组与第2 组差异显著(p=0.0102<0.05),第1组与第2组差异显著 (p=0.0172<0.05)
6.3 多个样本比较的秩和检验
6.3.2 中位数检验
当2个或2个以上的资料不服从正态分布时, 我们可以使用这一方法进行检验。当资料服从正
态分布时,用中位数检验方法进行检验其效率总
6.2.1 配对样本符号秩检验
例6.3 为豚鼠注入肾上腺素前后的每分钟灌流滴 数,试比较给药前后灌流滴数有无显著差别。
6.2.1 配对样本符号秩检验
① DPS 输入数据,选择数据,点击菜单试验统计→非 参数检验→两样本配对Wilcoxon符号-秩检验:
6.2.1 配对样本符号秩检验
① DPS 立即得到结果:
相关文档
最新文档