统计学第13讲 第13章 非参数检验

合集下载

统计学第13讲 第13章 非参数检验

统计学第13讲 第13章 非参数检验

13.3 单变量的χ2 检验 肥胖与健康问题有关,亚特兰大疾控中心定期进行全 国青少年危机监督调查,对11631名男女青年(9到12年 级)自身体重观的部分调查结果。
表13-1 女生的自身体重观
偏瘦 419
正常 3402
过胖 1995
合计 5816
这个问题可以使用单变量χ2 检验或拟合优度检验 (goodness-of-fit test) 观测值与虚无假设下的期望值之间是否存在差异? 观测值分布是否与理论分布相吻合?
56
2
81
=56+36-81 =11
检验步骤如下: 1. H0: U U 两组等级差异是机遇所致
2. H1: U 两组等级差异不是随机的 U 3. 统计检验:曼-惠特尼 U 检验 4. 显著水平:α=0.05 5. 抽样分布:曼-惠特尼U:N1=8 , N2=7 6. 拒绝H0的判别区域:U≤10 或 U≥46,如果U在此 范围之外,就拒绝H0,否者不拒绝H0。 因为U=11>10,所以不拒绝H0 。这种药物对反应 时没有影响。
例如:研究两男两女4位朋友看电影的情况,
电影类型 被试1 被试2 男性 男性 电影类型 男性 女性
被试3 被试4
女性 女性
喜剧 6 4 1 0
悲剧 1 0 3 2
合计
喜剧 10 1 11
悲剧 1 5 6
合计 11 6 17
4≠17,这类数据不能列成交叉表,宜用参数检验
13.5 顺序量表变量—非参数检验
df=(行数-1)(列数-1)=(2-1)(2-1)=1
表13-5 男女青年体重自我感觉的期望次数 单元格的期望次数
性别 女性 男性 合计
过轻 786.78 591.22 1378.00

医学统计学非参数检验秩和检验详解(ppt)

医学统计学非参数检验秩和检验详解(ppt)
T 与平均秩和应相差不大
T = 较小例数组的秩和, n1 ≠n 2 min( R1, R 2 ), n1 = n 2
4.确定P值和作出推断结论
当n1<=10或(n2-n1)<=10时,查表P值
当n1>10或(n2-n1)>10时,则可采用正 态近似法求u(Z)值来确定P值,其公式
如下:
1
T - 2 n1 (n +1) - 0.5
• 排队的优点 广泛适用于多种分布
• 排队的结果 将原始数据的比较转化为秩次的比较
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到强 所排列的序号。
例1 11只大鼠存活天数: 存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次
3 6 4 9 2 8 1 5 7 10 11 10.5 10.5
应用非参数检验的情况
1.不满足正态和方差齐性条件的小样本资料; 2.总体分布类型不明的小样本资料; 3.一端或两端是不确定数值(如<0.002、>
65等)的资料(必选); 4.单向(双向)有序列联表资料; 5. 各种资料的初步分析。
方法的起点--排队与秩次
• 统计描述中排秩思想的成功应用 百分位数、中位数
• 第三步:非参数检验(2)
• 第四步:结果解读(1)
结果解读:例数、均数、标准差、中位数、四分 位间距等。标准差较大
• 第四步:结果解读(2)
结果解读: Z=3.630,P=0.000
【例2】20名正常人和32名铅作业工人尿铅定性检 查结果如表。问铅作业工人尿铅是否高于正常人?
结果
-
+
++ +++ ++++

统计学中的非参数检验方法

统计学中的非参数检验方法

统计学中的非参数检验方法统计学是一门应用广泛的科学领域,它的应用范围涉及到社会、经济、医学、科学等各个领域。

非参数检验方法是统计学中的一种基于数据分布情况的假设检验方法,它不仅可以应用于各个领域的研究中,也是数据分析领域中不可或缺的一部分。

什么是非参数检验非参数检验是一种基于统计数据分布情况做出判断的方法,在对特定类别的数据进行假设检验的时候,不依赖于数据分布的形状,而且它可以处理许多小样本或者没有熟知的总体参数的数据。

非参数检验方法的应用范围广泛,可以用于数据汇总、逻辑推理、实验设计以及其他数据分析中的问题。

非参数检验的优势传统的统计假设检验方法是基于大样本数据的总体参数进行推断的,其可以直接获得总体参数值,但是对于小样本数据而言,则需要使用比较多的假设、术语和统计量、偏差的值来判断出研究问题的可行性,而非参数检验则可以用较少的假设来完成数据分析,避免了数据误判,降低了数据分析的难度。

非参数检验的应用非参数检验方法在实际生活中的应用,主要表现在以下几个方面:1. 样本分布非正态:如果样本数据分布不满足正态分布,这时是可以应用非参数检验方法的。

2. 样本数据较少:如果样本数据较少,传统假设检验方法会有较高的错误率,可以使用非参数检验方法来避免这种情况。

3. 样本数据有异常值:若样本数据存在严重的异常值,应用传统的假设检验方法可能会导致数据误判,此时可以应用非参数检验方法进行数据分析。

常见的非参数检验方法常见的非参数检验方法有:1. Wilcoxon符号秩检验:适合偏差没达到正态分布的样本。

2. Mann-Whitney U检验:主要用于2组样本数据非独立的情况。

3. Kruskal-Wallis检验:用于3组及以上的样本比较,判断样本总体是否有差别。

4. Friedman秩和检验:主要用于分析多组数据的内部联系。

5. Kolmogorov-Smirnov拟合检验:用于检验给定的样本是否符合特定分布。

统计学:非参数检验

统计学:非参数检验

例10-1 某研究者欲研究保健食品对小鼠抗 疲劳作用,将同种属的小鼠按性别和年龄相 同、体重相近配成对子,共10对,并将每对 中的两只小鼠随机分到保健食品两个不同的 剂量组,过一定时期将小鼠杀死,测得其肝 糖原含量(mg/100g),结果见表10-1, 问 不同剂量组的小鼠肝糖原含量是否不同?
5
表10-1 不同剂量组小鼠肝糖原含量(mg/100g) 小鼠对号 中剂量组 高剂量组 差值 d (1) (2) (3) (4)=(3)-(2) 1 620.16 958.47 338.31 2 866.50 838.42 -28.08 3 641.22 788.90 147.68 4 812.91 815.20 2.29 5 738.96 783.17 44.21 6 899.38 910.92 11.54 7 760.78 758.49 -2.29 8 694.95 870.80 175.85 9 749.92 862.26 112.34 10 793.94 805.48 11.54
15
表 10-3 某河流甲乙断面亚硝酸盐氮含量(mg/L)监测
河流甲断面 亚硝酸盐氮 秩次 含量 0.014 1.0 0.018 2.5 0.024 8.5 0.025 10.5 0.027 12.0 0.034 15.0 0.038 19.0 0.043 20.0 0.064 22.5 0.100 25.0 n1=10 T1=136 亚硝酸盐氮 含量 0.018 0.019 0.020 0.022 0.023 0.024 0.025 0.028 0.030 0.035 河流乙断面 秩次 亚硝酸盐氮 含量 2.5 0.036 4.0 0.037 5.0 0.055 6.0 0.064 7.0 0.067 8.5 10.5 13.0 14.0 16.0 n2=15 秩次 17.0 18.0 21.0 22.5 24.0

医学统计学-非参数检验

医学统计学-非参数检验
10
无效
8
合计
B(10-12天)
9
10
7
4
C(21-30天) 16
10
3
1
视分组为无序,即为单向有序表
三总体分布位置相同
三总体分布位置不全同
2. SPSS中实现过程
在菜单中选择“K Independent Samples”命令
“Several Independent Samples:Define Range”对话框
2. SPSS中实现过程
研究问题 对19只小鼠中的9只接种第一种伤寒杆菌,其 余接种第二种伤寒杆菌,接种后的存活天数见 表,判定两种伤寒杆菌的存活天数是否不同。
两总体分布位置相同
两总体分布位置不同
2. SPSS中实现过程
3. 结果
不能认为两总体分布 位置不同,不能认为 接种两种伤寒杆菌的 存活天数不同。
各总体分布位置相同
各总体分布位置不全同
2. SPSS中实现过程
在菜单中选择“K Independent Samples”命令
“Several Independent Samples:Define Range”对话框
3.结果
三个总体分布位置不 全同,三种药物杀灭 钉螺的效果有差别。
三. 两配对样本非参数检验(配对秩和)
post_2 70.00 71.00 75.00 68.00 74.00 70.00 63.00 70.00 65.00 70.00 70.00
post_3 69.00 70.00 75.00 70.00 70.00 69.00 61.00 70.00 65.00 60.00 69.00
实现步骤
(Wilcoxon Signed Rank Test)

非参数检验综合概述PPT(30张)

非参数检验综合概述PPT(30张)


9、别再去抱怨身边人善变,多懂一些道理,明白一些事理,毕竟每个人都是越活越现实。

10、山有封顶,还有彼岸,慢慢长途,终有回转,余味苦涩,终有回甘。

11、人生就像是一个马尔可夫链,你的未来取决于你当下正在做的事,而无关于过去做完的事。

12、女人,要么有美貌,要么有智慧,如果两者你都不占绝对优势,那你就选择善良。
多个独立样本的非参数检验
例3 14名新生儿出生体重按其母亲的吸烟习惯分组(A组: 每日吸烟多于20支;B组:每日吸烟少于20支;C组:过去 吸烟而现已戒烟;D组:从不吸烟),具体如下。试问四个 吸烟组出生体重分布是否相同?数据见npc.sav:
A组: 2.7 2.4 2.2 3.4 B组: 2.9 3.2 3.2 C组: 3.3 3.6 3.4 3.4 D组: 3.5 3.6 3.7
两独立样本的非参数检验 (2) 检验统计量
分析结果
给 出 Mann-Whitney U 、 Wilcoxon W 统 计 量 和 Z 值 , 近 似 值 概 率 (Asymp.Sig)和精确概率值(Exact.sig)均小于0.05,结论一致,表明 猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫 (15.7)、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。

3、命运给你一个比别人低的起点是想告诉你,让你用你的一生去奋斗出一个绝地反击的故事,所以有什么理由不努力!

4、心中没有过分的贪求,自然苦就少。口里不说多余的话,自然祸就少。腹内的食物能减少,自然病就少。思绪中没有过分欲,自然忧就少。大悲是无泪的,同样大悟无言。缘来尽量要惜,缘尽就放。人生本来就空,对人家笑笑,对自己笑笑,笑着看天下,看日出日落,花谢花开,岂不自在,哪里来的尘埃!

生物统计学:非参数检验

生物统计学:非参数检验

{ n+,n-}= n+=2 。
3、统计推断 当n=15时, 查附表11 得 临 界 值K0.05(15)=3 , K0.01(15) = 2 , 因 为 K = 2 = K0.01(15),P≤0.01,表明噪数与总体中位数比较的符号检验
1、建立假设 HO:样本所在的总体中位数=已知总体中 位数; HA :样本所在的总体中位数≠已知总体 中位数。 (若将备择假设 HA 中的“≠”改为“<” 或“>”,则进行一尾检验)
依赖于特定分布类型, 比较的是参数
优点:方法简便、易学易用,易于推广使用、应用范围广;可 用于参数检验难以处理的资料(如等级资料,或含数值 “>50mg”等)。 缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数 检验会损失部分信息,其检验效能低;样本含量较大时,两者 结论常相同。
第一节 符号检验
非参数检验的弱点 可能会浪费一些信息 特别当数据可以使用参数模型的时候 大样本手算相对麻烦 一些表不易得到
参数检验 (parametric test)
非参数检验 (nonparametric test)
已知总体分布类型,对 未知参数进行统计推断
对总体的分布类型不作严 格要求 不受分布类型的影响, 比较的是总体分布位置
124.3 147.9 -15.7 7.9 +
1、提出无效假设与备择假设
HO :该地成年公黄牛胸围的平均数=140厘米, HA :该地成年公黄牛胸围的平均数≠140厘米。
2、计算差值、确定符号及其个数 样本各观测值与总体 平均数的差值及其符号列于表 11-2 ,并由此得 n+=6 ,n-=4 ,
非参数统计的名字中“非参数”意味着其方法不 涉及描述总体分布的有关参数;

非参数检验教学课件

非参数检验教学课件

如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普 遍偏小得组,秩和也必然偏小,各组得秩之间就 会存在显著差异。如果各样本得平均秩大致相 当,那么可以认为各组得总体分布 没有显著差 异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样 本得非参数检验,但分析得角度不同。多配对 样本得Kendall协同系数检验主要用在分析评 判者得判别标准就是否一致公平方面。她将每 个评判对象得分数都看作就是来自多个配对总 体得样本。一个评判对象对不同被判定对象得 分数构成一个样本,其零假设为:样本来自得多 个配对总体得分布无显著差异,即评判者得评 判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总 体分布未知或无法确定。因为有得数据不就是 来自所假定分布得总体,或者数据根本不就是 来自一个总体,还有可能数据因为某种原因被 严重污染,这样在假定分布得情况下进行推断 得做法就有可能产生错误得结论。此时人们希 望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系 可以分为单样本非参数检验、两独立样本非参数检 验、多独立样本非参数检验、两配对样本非参数检 验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公 式 定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种 拟合优度得非参数检验方法。单样本K-S检验 就是利用样本数据推断总体就是否服从某一理 论分布得方法,适用于探索连续型随机变量得 分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。 如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个 评委判定标准不一致,也就就是判定结果不一 致。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

体重偏低 419(7%) 1938.667 -1519.667
体重正常 3402(58%) 1938.667 1463.667
体重偏重 1995(34%) 1938.667 56.333
合计 5816 5816 0 χ2=2297.138
因为χ2=2297.138>> 9.210,拒绝H0。
13.4 独立类别变量的χ2检验 问题1. 不同社会经济背景的儿童,其暴力犯罪的概 率是否存在差异? 暴力犯罪与社会经济背景是独立的?还是暴力犯罪 部分取决于社会经济背景。 问题2. 男女青年对于自身体重观念存在差异吗? 人们对自身体重的观念与性别有关吗? 上述诸多问题归纳为两点: 1. 对两个或多个称名变量的研究 2. 每个类别的变量绘制成交叉表 交叉表的缺点:没有明显办法计算期望值
科研中。虚无假设、备择假设、统计检验、抽样分布 以及显著性水平都必须在数据搜集之前就要确定下来 。如果先搜集数据,再“货比三家”地考虑统计分析 方法,我们会为了“差异显著”而夸大偶然造成的差 异效应,会增大犯Ⅰ类错误的概率。 13.2 类别变量 分类变量的数据就是计数数据,非参数检验适合小样 本的计数数据。但是当大样本时,计数数据也可考虑 使用参数检验。 测量、等距、比率量表,当样本小并且分布不明朗 ,不服从正态分布,可考虑非参数检验。
13.3 单变量的χ2 检验 肥胖与健康问题有关,亚特兰大疾控中心定期进行全 国青少年危机监督调查,对11631名男女青年(9到12年 级)自身体重观的部分调查结果。
表13-1 女生的自身体重观
偏瘦 419
正常 3402
过胖 1995
合计 5816
这个问题可以使用单变量χ2 检验或拟合优度检验 (goodness-of-fit test) 观测值与虚无假设下的期望值之间是否存在差异? 观测值分布是否与理论分布相吻合?
1 …. — …… - - 2 N=40,α=0.05 … — ,因为X=28 - > - 18,拒 2 绝 …. — …… - - H0,认为教导主任是对的 2 …. — - - …. …. … …. … …. 3 …. 20 … 26 26 4 ….. 18 … 28 28 … … … … … … 4 5 ……. 21 23 … … 31 33 31 34
随机抽取40名同学,询问发现其中有12名吸烟。则 不吸烟的同学数量为: X=28 用 P0 表示总体吸烟比例 1. 虚无假设:吸烟学生总体比例P0≥0.7 2. 备择假设:样本所在总体比例P0<0.7 3. 显著水平:α=0.05,单尾检验 4. 统计检验: 二分总体 , 采用二项式检验 5. 抽样分布: 统计量为 X , 在附表N中列出N≤50时, 不同p,q的单侧临界值。 6. 临界区间:参照表N,N=40,p=0.30,q=0.70,发 现0.05的临界值为18,单尾检验。 7. 因为X=28>18,拒绝H0,认为教导主任是对的
偏瘦 f1
正常 f2
2 k
过胖 f3
2
合计 5816
H0: f1=f2=f3
( fo fe ) fe i 1
如果观察值与期望值比较接近,则χ2 很小,不拒绝 H0 , 否者χ2 会增大, χ2 越大,则越有可能拒绝H0. 在 t 分布中,自由度与样本量有关,而χ2 分布的自 由度与类别 k 有关,单变量,df=k-1。此题的k=3 当N比较大时,二项分布近似正态曲线 当p=q=0.5,或p、q接近0.5时,二项分布接近正 态分布 简便法则:当pq接近0或1时,Npq至少等于9,当 p=q=0.5时,N≥25。 此时,二项变量X~N(Np, Npq ) 的正态分布
X Np z Npq
13-1
z ~N(0, 1 ) ,X的概率= z 对应的概率
例题 已知 X=5,N=20,p=q=0.5,α=0.05,双尾检验 。计算P(X≤5) 或P(X≥15)
z
5 20 0.5 5 5 / 2.24 2.23 20 0.5 0.5 5
当α=0.05,双尾检验时,| z |>1.96,所以拒绝H0 如果我们从附表M中查找, X=5,N=20,双尾检验 ,发现:拒绝H0需要N-X≥15,本题N-X=15,所 以拒绝H0。这和利用正态分布计算是一致的。表M 只列出了N=50的临界值,建议N>50时才使用正态分 布。
判断方法,如果χ2≥ χ2临界值,则拒绝H0。
表13-2 χ2 部分临界值表
34%远远超过7%,这些 女生有80%正在减肥 表13-3 女生对自身体重观念,H0下的期望值及χ2 值计算表
实际值 期望值 fo- fe 2309387.70 2141343.40 3173.41 (fo-fe)2 1104.544 1.370 (fo-fe)2/fe 1191.224
第13章 非参数检验
13.1 导言 科研中不是所有的变量都可以采用参数检验,如 果变量严重偏离已知分布,可考虑采用非参数检验。 即便在小样本情况下,非参数检验仍然和参数检验一 样有效。 在选择检验方法时要小心,如果是试探性的,可 选择一些样本,使用多种检验方法进行统计分析, 借以了解不同检验方法的差异。 但是要避免下列错误做法:先搜集数据,在“货 比三家”后选择一个有利于自己科研结果的,并且能 带来统计显著性的统计方法
表N 当N=2~49时, α=0.01和0.05时,p和q各种取值下的临界值 N 2 p q 0.01 0.02 0.99 0.98 1 1 1 2 ….. 3 3 … 3 4 … … 0.30 0.70 … … 0.49 0.50 0.51 0.50
0.01 0.05 3 0.01 0.05 …. … 40 0.01 0.05 … … 49 0.01 0.05
13.2.1 二项检验 称名量表的测量水平最低,常用二分类,(twocategory)或二分总体(dichotomous population) 请同学举例说明有那些二分总体? 男女,对错,正反,阴阳,有无文化…………. 定义:二分总体中, p 为一类所占的比例,q=1-p 为另一类所占比例。 例题:某大学教导主任说,自从学校禁售香烟以来 ,吸烟学生比例下降到70%以下。但是对其他学校 观察发现,禁售对吸烟影响不大,仍然有70%的人 在吸烟。请检验教导主任的说法是否正确。
相关文档
最新文档