医学统计学,第8章 非参数统计法
非参数统计

例外
例外
有的统计问题,从不同的角度,可以理解为参数性的,也可以理解为非参数性的。例如线性回归(见回归分 析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可以看成是参数性的。但是,如果对随机误差 的分布类型没有作任何假定,则从问题的总体分布这个角度看,也可以看成是非参数性的。
统计方法
统计方法
谢谢观看
重要的非参数统计方法秩方法是基于秩统计量(见统计量)的一类重要的非参数统计方法。设有样本 X1,X2,…,Xn,把它们由小到大排列,若Xi在这个次序中占第Ri个位置(最小的占第1个位置),则称Xi的秩为 Ri(i=1,2,…,n)。1945年F.威尔科克森提出的"两样本秩和检验"是一个有代表性的例子。设X1,X2,…,Xm 和Y1,Y2,…,Yn分别是从分布为 F(x)和 F(x-θ)的总体中抽出的样本,F连续但未知,θ也未知,检验假设 H:θ=0,备择假设为θ>0(见假设检验)。记Yi在混合样本(X1,X2,…,Xm,Y1,Y2,…,Yn)中的秩为Ri, 且为诸秩的和,当W >C时,否定假设H,这里C决定于检验的水平。这是一个性能良好的检验。秩方法的一个早期 结果是C.斯皮尔曼于1904年提出的秩相关系数。设(X1,Y1),(X2,Y2),…,(Xn,Yn)是从二维总体(X,Y) 中抽出的样本,Ri为Xi在(X1,X2,…,Xn)中的秩,Qi为Yi在(Y1,Y2,…,Yn)中的秩,定义秩相关系数为 (Ri,Qi)(i=1,2,…n)的通常的相关系数(见相关分析)。它可以作为X、Y之间相关程度的度量,也可用于检 验关于X、Y独立性的假设。
次序统计量和U统计量在非参数统计中也有重要应用。前者可用于估计总体分布的分位数(见概率分布)、 检验两总体有相同的分布及构造连续总体分布的容忍限和容忍区间(见区间估计)等。后者主要用于构造总体分 布的数字特征的一致最小方差无偏估计(见点估计)及基于这种估计的假设检验。
非参数统计方法介绍

非参数统计方法介绍非参数统计方法是一种不依赖于总体分布形态的统计方法,它不对总体分布做出任何假设,而是直接利用样本数据进行统计推断。
非参数统计方法的优势在于适用范围广,可以处理各种类型的数据,不受总体分布形态的限制。
本文将介绍非参数统计方法的基本原理和常用的方法。
一、非参数统计方法的基本原理非参数统计方法是基于样本数据进行统计推断的方法,不对总体分布形态做出任何假设。
其基本原理是通过对样本数据的排序、排名或计数等操作,来获得总体的统计特征。
非参数统计方法主要包括秩和检验、分布自由度检验和重抽样方法等。
二、秩和检验秩和检验是一种常用的非参数统计方法,它主要用于比较两个独立样本的差异。
秩和检验的基本思想是将两个样本合并后,对样本数据进行排序,然后根据排序结果计算秩和统计量,再通过对比临界值来判断两个样本是否存在显著差异。
三、分布自由度检验分布自由度检验是一种用于检验总体分布是否符合某种特定分布的非参数统计方法。
它不依赖于总体分布形态的假设,而是通过对样本数据的排序、排名或计数等操作,来获得总体的统计特征。
常见的分布自由度检验方法包括Kolmogorov-Smirnov检验、Anderson-Darling检验和Cramér-von Mises检验等。
四、重抽样方法重抽样方法是一种通过对样本数据进行有放回抽样来获得总体统计特征的非参数统计方法。
重抽样方法的基本思想是通过对样本数据的重复抽样,来模拟总体分布,并通过对模拟样本数据的分析,得到总体的统计特征。
常见的重抽样方法包括自助法、Jackknife法和Bootstrap法等。
五、非参数统计方法的应用领域非参数统计方法广泛应用于各个领域的数据分析中。
在生物医学领域,非参数统计方法常用于比较不同治疗方法的疗效、评估药物的副作用等。
在金融领域,非参数统计方法常用于风险评估、投资组合优化等。
在环境科学领域,非参数统计方法常用于分析环境污染物的浓度分布、评估环境质量等。
非参数统计在医学研究中的应用(八)

非参数统计在医学研究中的应用引言医学研究是一个复杂而严谨的领域,其目的在于通过科学的方法探索和解决人类健康问题。
随着统计学的发展,非参数统计方法在医学研究中的应用越来越广泛。
本文将探讨非参数统计在医学研究中的应用,以及其在这一领域中的价值和意义。
非参数统计在医学研究中的应用医学研究中常常需要处理的数据通常是非正态分布的,这使得传统的参数统计方法可能不适用。
因此,非参数统计方法成为了医学研究中重要的工具之一。
首先,非参数统计方法可以用于分析医学研究中的定序数据。
在临床试验中,病人的症状、疼痛程度等往往是定序数据,这些数据不满足正态分布的要求,因此需要使用非参数统计方法进行分析。
例如,Wilcoxon秩和检验可以用于比较两组定序数据的差异,Mann-Whitney U检验可以用于比较两组独立样本的定序数据。
其次,非参数统计方法还可以用于处理医学研究中的生存数据。
生存数据常常具有右偏性和离散性,不满足正态分布假设。
在这种情况下,Kaplan-Meier生存曲线和Log-rank检验成为了处理生存数据的常用非参数统计方法。
这些方法可以帮助研究人员比较不同治疗方案对患者生存时间的影响,评估预后因素的影响等。
此外,非参数统计方法还可以用于处理医学研究中的重复测量数据。
在临床研究中,往往需要对同一组患者在不同时间点进行重复测量,这种数据不满足正态分布的要求。
Friedman检验和Wilcoxon符号秩检验等非参数统计方法可以用于处理这种类型的数据,帮助研究人员评估治疗效果、疾病进展等。
非参数统计方法的价值和意义非参数统计方法在医学研究中的应用具有重要的价值和意义。
首先,非参数统计方法不依赖于总体分布的假设,因此对数据分布的要求较低,可以更加灵活地应用于各种类型的医学数据。
这使得非参数统计方法成为了处理非正态分布数据的有力工具。
其次,非参数统计方法在小样本情况下也能够提供可靠的结果。
在医学研究中,由于种种限制,样本量通常较小,这使得传统的参数统计方法可能不够精确。
非参数统计方法

非参数统计方法非参数统计方法是一种统计学中常用的方法,它不依赖于对总体分布的特定假设,而是基于数据自身的性质进行分析。
与参数统计方法相比,非参数统计方法更加灵活,适用范围更广。
本文将介绍非参数统计方法的基本概念、应用领域以及与参数统计方法的比较。
一、基本概念非参数统计方法是一种基于观测数据的统计分析方法,它不对总体的概率分布做出具体的假设。
它的基本思想是从样本数据本身获取统计信息,并利用这些统计信息进行总体参数的推断。
与参数统计方法相比,非参数统计方法更加自由,可以适应更广泛的情景。
二、应用领域非参数统计方法在各个领域中都有广泛的应用。
下面介绍一些常见的应用领域。
1. 生态学研究:非参数统计方法可以用于对生物种群的数量、分布和相互关系进行分析。
例如,可以利用非参数统计方法评估不同环境因素对生物多样性的影响。
2. 医学研究:非参数统计方法在医学研究中也起到了重要的作用。
例如,在临床试验中,可以使用非参数方法对不同治疗方案的效果进行比较。
3. 金融分析:非参数统计方法也常被用于金融行业中。
例如,可以利用非参数方法对股票价格的波动性进行建模,进而进行风险管理和投资决策。
4. 社会科学研究:非参数统计方法也广泛应用于社会科学领域。
例如,在问卷调查中,可以使用非参数方法进行数据的分析和解释。
三、与参数统计方法的比较非参数统计方法相对于参数统计方法有一些优点。
1. 不依赖于分布假设:非参数统计方法不需要事先对总体分布做出特定的假设,更加灵活适用于各种分布类型。
2. 更广泛的适用性:非参数统计方法可以适用于各种数据类型和样本量。
而参数统计方法对数据类型和样本量有一定的要求。
4. 不受异常值的影响:非参数统计方法对异常值不敏感,即使存在异常值,也不会对结果造成较大的影响。
然而,非参数统计方法也存在一些限制。
1. 需要较大的样本量:非参数统计方法通常需要较大的样本量才能获得准确的结果。
2. 计算复杂度高:非参数统计方法的计算复杂度较高,在处理大规模数据时可能会面临一些挑战。
第8章 非参数统计法

定量变量
5
二、秩和检验(rank sum test)
是非参数检验中效率较高,而且比较系统 完整的一种。
两组资料比较 配对设计——Wilcoxox signed rank test 成组设计——Wilcoxon Mann-Whitney test
多组资料比较 完全随机设计——Kruskal-Wallis H test 随机区组设计——Friedman M test
两因素方差分析
析因方差分析, 等
2
一、基本概念
(一)非参数统计 不依赖于总体分布形式,不须考虑被研究对象为何 种分布及分布是否已知,不是参数间的比较,而 是用于分布之间的比较。
(二)参数统计 依赖于总体分布形式,总体分布是已知,而且有规 律可循,是总体参数间的比较。
3
(三) 两类统计方法的优缺点:
Ran ks
b - a Negat ive Rank s P ositiv e Ran ks T ies T otal
a. b < a b. b > a c. b = a
N
Mean Ran k Sum of Rank s2a来自4.008.00
9b
6.44
58 .0 0
1c
12
Te st S tati sti csb
7
25.0
24.4
0.6
1
8
23.4
36.2
-12.8 -8
9
44.1
45.2
-1.1
-2
10
399.8 404.1 -4.3
-4
11
25.9
39.3
-13.4 -9.5
12
535.6 544.8 -9.2
非参数统计方法

非参数统计方法非参数统计方法是一种统计学中的重要概念,它不依赖于总体的具体分布形式,而是利用样本数据进行推断和分析。
与参数统计方法相比,非参数统计方法更加灵活和广泛适用,并且不需要对总体进行特定的假设。
本文将介绍非参数统计方法的原理、常用的方法和应用领域。
一、非参数统计方法的原理非参数统计方法的核心思想是基于样本数据来进行推断,而不需要对总体的分布形式做出先验假设。
非参数统计方法主要利用统计排序和秩次来进行推断分析,因此非参数统计方法也常被称为秩次统计方法或分布自由方法。
非参数统计方法的基本原理包括以下几个方面:1. 统计排序:对样本数据进行排序,将每个观测值按照大小进行排列,得到一系列秩次。
2. 秩次:将每个观测值与排序后的位置相对应,得到每个观测值的秩次。
3. 检验统计量:通过计算秩次之间的差异来判断总体分布是否存在差异。
4. 非参数假设检验:通过计算检验统计量的概率分布,判断总体分布是否符合我们的假设。
二、常用的非参数统计方法1. 秩和检验(Mann-Whitney U检验):用于比较两个独立样本是否来自同一总体。
2. 秩和差检验(Wilcoxon符号秩检验):用于比较两个相关样本是否来自同一总体。
3. 克鲁斯卡尔-瓦里斯检验:用于比较三个或更多独立样本是否来自同一总体。
4. 费希尔精确检验:用于比较两个分类变量之间的关联性。
5. 秩和相关检验(Spearman等级相关系数):用于比较两个变量之间的相关性。
三、非参数统计方法的应用领域非参数统计方法在各个领域都有广泛的应用,以下列举几个常见的应用领域:1. 医学研究:非参数统计方法可以用于比较两种治疗方法的效果,判断是否存在显著差异。
2. 经济学研究:非参数统计方法可以用于分析收入差距、失业率等经济指标的差异。
3. 生态学研究:非参数统计方法可以用于比较不同区域的生物多样性指标,评估生态系统的稳定性。
4. 社会科学研究:非参数统计方法可以用于分析社会调查数据,比较不同群体的行为差异。
统计学中的非参数统计方法

统计学中的非参数统计方法统计学是一门研究如何收集、整理、分析和解释数据的学科。
在统计学中,参数统计方法和非参数统计方法是两种常见的数据分析方法。
本文将重点介绍统计学中的非参数统计方法。
一、非参数统计方法的概念和特点非参数统计方法是指不对总体分布做出特定假设的一类统计方法,它不要求总体服从特定的概率分布,因此被广泛应用于各种实际问题的数据分析中。
与参数统计方法相比,非参数统计方法的主要特点包括灵活性高、使用范围广以及对数据的分布假设不敏感等。
二、非参数统计方法的应用领域非参数统计方法在各个学科领域都有广泛的应用,包括但不限于以下几个方面:1. 生物学领域:非参数统计方法常被用于生物医学研究中,比如在药物试验中评估不同治疗方案或药物的疗效。
2. 经济学领域:非参数统计方法在经济学研究中也有重要应用,比如用于分析收入分配的不平等性、评估政策的效果等。
3. 环境科学领域:非参数统计方法在环境科学领域的应用也较为常见,例如用于分析水质、空气质量等指标在不同区域的差异性。
4. 工程学领域:非参数统计方法在工程学中也被广泛使用,比如用于分析制造过程中的质量控制和性能评估等。
5. 社会学领域:非参数统计方法在社会学研究中的应用较多,如用于分析人口统计数据、教育程度对收入的影响等。
三、非参数统计方法的常见技术非参数统计方法包括多种常见的技术,以下介绍其中几个常用的技术:1. 秩和检验(Mann-Whitney U检验):用于比较两组独立样本的位置差异,特别适用于小样本情况或数据不服从正态分布的情况。
2. 威尔科克森秩和检验(Wilcoxon Signed-Rank Test):用于比较两组配对样本数据的位置差异。
3. 克鲁斯卡尔-瓦利斯检验(Kruskal-Wallis Test):用于比较多组独立样本间的位置差异,常用于替代方差分析。
4. 皮尔逊相关系数(Pearson Correlation):用于衡量两个连续变量之间的线性相关性。
统计学中的非参数统计方法介绍

统计学中的非参数统计方法介绍统计学是一门研究如何收集、分析和解释数据的学科。
它的应用范围广泛,可以帮助我们了解数据背后的规律和趋势。
在统计学中,参数统计方法和非参数统计方法是两种常用的统计分析方法。
本文将重点介绍非参数统计方法的定义、优点和应用领域。
一、非参数统计方法的定义非参数统计方法是一种基于数据本身的分布特征进行统计推断的方法,不需要对总体参数进行假设。
与之相对的是参数统计方法,它需要对总体参数进行假设并进行推断。
非参数统计方法主要采用排序、秩次、重复采样等技术来推断总体的特征。
二、非参数统计方法的优点1. 相对灵活性更大:非参数统计方法不对总体分布形态做任何假设,因此在数据分布未知或非正态的情况下,非参数方法是一种很好的选择。
2. 更广泛的适用性:非参数统计方法适用于有序数据、等级数据和分类数据等不需要具体数值的数据类型,使其在许多领域中都有应用,如医学、经济学、环境科学等。
三、非参数统计方法的应用领域1. 秩和检验:用于比较两个独立样本的总体中位数是否相等,常用于药物疗效的比较。
2. Mann-Whitney U检验:用于比较两个独立样本的总体分布形态是否相同,常用于医学研究中。
3. Wilcoxon符号秩检验:用于比较两个配对样本的总体中位数是否相等,常用于心理学研究中。
4. Kruskal-Wallis检验:用于比较多个独立样本的总体中位数是否相等,常用于统计学实验中。
5. Friedmann检验:用于比较多个配对样本的总体中位数是否相等,常用于行为学实验中。
6. 非参数回归:用于研究自变量和因变量之间的关系,常用于金融和市场研究中。
总结:非参数统计方法是一种基于数据本身的分布特征进行统计推断的方法,其灵活性和适用性使其在许多领域中都得到广泛应用。
它不像参数统计方法那样对总体分布形态有严格的假设要求,因此在实际问题中具有更强的适应能力。
在实际应用中,我们可以根据具体问题选择合适的非参数统计方法进行数据分析和推断,以帮助我们更好地理解和解释数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
St d. Error of Sk ewn ess
Kurt osis
St d. Error of Kurt osis
12 0
-1.92 0 .637
5.64 0 1.23 2
1.92 u1 0.637 3.01
p 0.01
u2
5.64 1.232
4.58
P 0.01
7
基本步骤:
(1)建立检验假设,确定检验水准:
查表确定P值:
(1)若组数 k = 3,且每组例数ni5时,查H界值表。 (2)若超过H界值表范围,如k > 3 或 ni > 5, 此时H分布近似 服从自由度为 k-1的X2分布。
(3)若相同秩次较多,需对H值校正:
H HC C
t
3 j
t
j
C 1 N3 N
(一)原始资料多组比较
(二)等级资料或频数表资料的多组比较
1.3
7.9
7.5
0.4
0
5.2
20.8
2.8
0.4
10.3
11.3
2.8
1.3
5.6
18.5
0.8
2.5
3.9
5.6
1.3
3.7
6.6
12.5
2.5
7.0
7.5
0
7.0
7.5
0
3.7
3.7
6.6
16.7
9.8
10.8
9.8
11.6
ni 12 R 144.5
8 105.5
13 381.5
14 496.5
表 1.2 两种方法尿铁蛋白(ug /L)结果
对象号 A 法
B法
差值 d 秩
1
30.6
30.6
0
--
2
59.9
63.1
-3.2
-3
3
46.0
58.0
-12.0 -6
4
23.0
10.9
12.1
7
5
20.3
33.7
-13.4 -9.5
6
48.6
99.5
-50.9 -11
7
25.0
24.4
0.6
1
8
23.4
例11.1 某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺 炎患者和正常人若干名,并测得血铁蛋白值(ug/L)如下 表。因难以确定数据分布情况,故决定用秩和检验。
两组人群血铁蛋白测定结果
肺炎患者 31 68 237 174 457 492 199 515
正常人
599 238 177 172 34 47 132 54 47 52
98 .0 00
W ilcoxon W
30 8.00 0
Z
-4.50 3
Asym p. Si g. (2-tai l e d)
.000
a. Grou pi ng Vari a bl e: 处 理
20
四.多组资料比较——Kruskal-Wallis test
H 12 Ri2 3(N 1)
N (N 1) ni
a. Kruskal Wallis T est b. Grouping Variable: group
23
例 某医师为研究早产、足月产及过期产者在产后一个月
内泌乳量的差别,收集了如下资料,问三种产妇乳量有 无差别?
H
12 993(993
1)
383352 97
4238762 838
313102 58
8
结果判断: (1)查表法:当n<25时,查T界值表(符号秩和检验
用),得: T0.05,11= 10~56,( T0.01, 11 = 5~61)
若T+或T-:落在范围内,则P>0.05; 落在范围外, 则P<0.05; 等于界值, 则P=0.05。
9
(2)正态近似法: 若 n>25时, 可近似认为T分布逼近正态分布。
SPSS
253(993 1)Fra bibliotek14.30
24
考虑到相同秩次很多,需要进行校正 (ti3 - ti)= (1723 - 172)+ (3423 - 342)+
(4793 -479)=154991382 Hc = 14.30/(1 - 154991382)/(9933 -993)= 17.0 所以 P < 0.01,按α=0.05水准,拒绝H0,接受H1,可 认为三种产妇的乳量不全相同。
2
(三) 两类统计方法的优缺点:
参数统计——检验效率较高,但使用条件较严格. 非参数统计——由于对资料无特殊要求,因此适用
范围广,资料收集和分析比较简便。但统计效率 较低(β较大)。 选择: 首先考虑参数检验,当条件不符,才选择非参数 统计方法。
3
(四) 非参数统计适用情况
(1)偏态分布资料; (2)总体分布不明资料; (3)数据一端或两端有未确定值; (4)等级资料; (5)方差不齐资料。
.011 .009 a
a. Not corrected fo r ti e s.
b. Gro upin g Vari a bl e: grou p
18
(二) 等级资料或频数表资料两组比较
问铅作业工人尿棕色素是否高于正常人?
u=4.493, P < 0.0005 故铅作业工人尿棕色素(1070/32=33.4)高于正常人(308/20=15.4)。
a. b < a b. b > a c. b = a
N
Mean Ran k Sum of Rank s
2a
4.00
8.00
9b
6.44
58 .0 0
1c
12
Te st S tati sti csb
b-a
Z
-2.22 4a
Asymp . Sig. (2 -t ailed)
.026
a. Based on negat iv e ranks.
13
(二)成组设计两样本比较
—Wilcoxon Mann-Whitney test
基本思想方法:
总体分布函数:
f(x)
f(y)
样本例数: 混合编秩: 分组求秩和: 取检验统计量: 确定概率P:
↓
↓
n1
≤
n2
秩号为1,2,……( n1 + n2 )
T1
T2
T=T1
当n1 ≤10, n2 - n1 ≤10 时,查P.825。 当n1 >10, n2 - n1 >10 时,计算u值。
19
SPSS Mann-Whitney Test
结果
处理 正常人 患者
To tal
Ran ks
N 20 32 52
Me an Ra nk 15 .4 0 33 .4 4
Sum of Ranks 30 8.00
10 70.0 0
Te st Sta ti s ti csa
结果
Ma nn -W hi tn ey U
14
正态近似法:
当超过附表10的范围时(n1>10, n2 - n1 >10) u检验公式为:
u
T
n1N 1/ 2 0 5 n1n2 N 1/ 12
相同秩次较多时,需要校正:
u
T n1N 1/ 2 0 5
n1n2
12N N 1
N3 N
t
3 j
t
j
15
(一) 原始数据两组比较:
u 检验的公式为:
T nn 1/ 4 0 5 u nn 12n 1/ 24
如果相同秩次较多,则需要进行校正,校正公式为:
T nn 1/ 4 0 5
u
nn 12n 1
t
3 j
tj
24
48
10
Wilcoxon Signed Ranks Test
Ran ks
b - a Negat ive Rank s P ositiv e Ran ks T ies T otal
x
1
10
18 .3 5
18 3.50
2
16
10 .4 7
16 7.50
To tal
26
Te st S tati sti csb
Ma nn -W hi tn ey U
x 31 .5 00
W ilcoxon W
16 7.50 0
Z
-2.55 9
Asym p. S i g. (2-tai l ed) Ex act Si g . [2* (1-tai l ed Si g.)]
47 294 68 43 277 44 43 95
患者组:均数为301,标准差为199
正常组:均数为101,标准差为 85 16
T=183.5, n1 =10, n2 - n1 =6 , 查表得:
0.01<P<0.02
SPSS
17
Ran ks
gr ou p
N
Me an Ra nk S um o f Ran k s
差值 2 0 2 1 - 1 1 1 2 0 0 0 0 1 1 1 1
秩次 10 10 4.5 -4.5 4.5 4.5 10
4.5 4.5 4.5 4.5
T+ = 61. 5,T- = 4. 5
查表得: T0.05, 11 = 10~56, T0.01, 11 = 5~61 P < 0.01
SPSS
H0:差值的总体中位数为0; 即Md=0 H1:差值的总体中位数不为0。即Md≠0 (2)求检验统计量T :
α=0.05