研究生医学统计学-两样本定量资料的比较共65页
07多组定量资料的比较(研121009)PPT课件

单 样 本
配 对 设 计
两 多 独 立 样 本
等 级 资 料Biblioteka 前提条件t / Z检验
方差分析
秩和检验
两 多配 组 组对 二 多设 分 分计 类类
四格表 R×C表 配对 四格表
2检验
教学内容
1.1 单因素方差分析 1.2多个样本均数间的两两比较
1.3 Kruskal-Wallis检验
1.5 随机区组设计资料的方差分析
2
S总 S =STS = (xij-x), v总 =vT=N -1
j= 1i= 1
⒉ 组间变异
各处理组的样本均数 X1、 X2、 X3、 X4不等,这 种变异称为组间变异。同理,组间的变异也与 每组的样本含量(自由度)有关。
k
S组 S= 间 SA S = n i(x i- x )2 , v 组= 间 v 1= k- 1 i= 1
i= 1
3. 组内变异:组内离差平方和
k nj
2
S组 S= 内 SES = (xij-xi), v组= 内 vW =N -k
i= 1j= 1
随机误差
三部分变异的关系:
变异的关系:
k nj
2
SS 总 =
( x ij - x )
i=1 j=1
k nj
=
[( x i - x ) ( x ji - x i)] 2
差分析,F=21.142,P <0.001,可认为 4 个总体小白鼠生存时间的均
数不全相同,即至少不两个不同。
附表 4 组小白鼠平均耐缺氧存活时间比较/min
组别
n
体重前后差值(g)
对照组
15
21.54 ±3.43
第6章 两组定量资料比较

H 1 : m1 ¹ m 2
(2)计算检验统计量:
t ' =
X 1 - X
2
2 2 s 1 s 2 + n 1 n 2
分母
S1 S 2 是 X - X 的标准误。 1 2 + n n 1 2
2
2
本例:
t ' = X 1 - X 2 s 2 s 2 1 + 2 n n 1 2
(3)确定P值,判断结果: v = n - 1 1 1
1 2
v = n - 1 2 2
当F>临界值 F0.1, v , v 时,则可以认为 两总体方差不齐,反之不能否认方差齐性 的无效假设。
例61的方差齐性检验统计量为
S 2 ( 较大 4 560 2 ) . 1 F = 2 = = 1 426 . 2 S 2 ( 较小) 3 818 .
S =1.35mmol/L 1
, 对照组: n2 = 50 X 2 = 13.2mmol/L,
S =4.20mmol/L 2
试问两种处理疗效的总体均数是否相同?
认为两组资料方差不齐: 进行校正t 检验。
(1)建立检验假设确定检验水准
H 0
: m1 = m2
a = 0. 05
H :资料服从正态分布 0 H :资料不服从正态分布 1
(四)两组独立样本的秩和检验
1. 问题的提出:
前面学习了连续型资料两组样本均数差 异的假设检验方法: ★小样本用t检验,条件是变量服从正态分 布和方差齐。 ★大样本用Z检验(中心极限定理)。
例63 某医师为研究血铁蛋白与肺炎的关系,随机 抽查了肺炎患者10名和正常人16名,并测得血铁蛋 白(μg/L)含量。 问肺炎患者与正常人平均血铁蛋白含量有无差 别? 肺炎患者:31 68 237 174 457 492 199 515 599 238 正常人:177 172 34 47 132 54 47 52 47 294 68
医学统计学各种资料比较选择方法小结(学医的都有用哦)

医学统计学各种资料比较选择方法小结(学医的都有用哦)第一篇:医学统计学各种资料比较选择方法小结(学医的都有用哦) 医学统计学各种资料比较选择方法小结(学医的都有用哦)来源:徐萌的日志一、两组或多组计量资料的比较 1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。
如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。
如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。
2.四格表资料1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验3)n£40或存在理论数<1,则用Fisher’s 检验3.2×C表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验4.R×C表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验三、Poisson分布资料 1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。
医科大学精品课件:两样本定量资料的比较(研)

H0
:
2 1
2 2
,即新药组和常规组血红蛋白的总体方差相等
H
1
:
2 1
2 2
,即新药组和常规组血红蛋白的总体方差不等
0.10
(2)选定检验方法,计算统计量
F
S12 (较大) S22 (较小)
4.5602 3.8182
1.426,1
9, 2
9
(2)确定 P 值,作出推断结论
查 F 界值表,F 0.1,(9,9) =3.18,故 P>0.1。按α=0.1 水准,不能拒
是否相等,即验证
2 1
?
2 2
用F 检验
F
S12 (较大) S22 (较小)
求得F值后,查附表C6 (P572 ) F界值,得 Fα(v1,v2)值
用F值与Fα(v1,v2)界值相比:
若F≥ Fα(v1,v2),则P≤α,拒绝H0,接受H1,提示两总体方差不齐 若F< Fα(v1,v2), 则P> α,不拒绝H0,提示不能认为两总体方差不齐
1 , 1
未知
新药 (总体)
常规药 (总体)
2, 2
未知
抽样30例
抽样30例
X1 5.28mmol / L
样 本
两者差别 是什么原 因引起?
样 本
X 2 6.04mmol/L
产生差异的原因:抽样误差或是本质差异?
假设检验
单 样 例数 本
σ已知或n >=50
正态
n <50 偏态
t 检验 t X 0 n 1
Байду номын сангаас
Sc
2
(
1 n1
1 n2
)
研究生医学统计学-两样本定量资料的比较

1、建立检验假设,确立检验水准
H
0:
2 1
2 2
,
H1
:
2 1
2 2
(双侧)
0.1
2、计算统计量:
F
SS(1222 (较较大小))
4.202 1.352
9.87
1 81 7
2 12 1 11
3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数
1147.30
454.97
7
980.01
1379.59
399.58
8
691.01
1091.46
400.45
9
910.39
1360.34
449.95
10
568.56
1091.83
523.27
11
1105.52
1728.03
622.51
12
757.43
1398.86
641.44
1、建立检验假设,确立检验水准 H0:d 0 H1 : d 0 0.05
23 2
53 5
33 3
150
j
第六章 两样本定量资料的比较
第一节 配对设计定量资料的比较 第二节 两组独立样本的比较 第三节 两组二项分布资料的比较 第四节 两组Possion分布资料的比较
一、两组独立样本资料的t检验 条件:两小样本均来自正态总体且方差齐
正态性检验 方差齐性检验
表6-3 两种药物治疗贫血患者结果
治疗 药物
血红蛋白增加量/g•L-1
新药 30.5 21.4 25.0 34.5 33.0 32.5 29.5 25.5 24.4 23.6 组
两样本定量资料的比较课件

2、求检验统计量T值:
①编秩。把两组数据混合从小到大统一编秩,
遇相同数据不同组者取平均秩次;
②求各组秩和。以样本例数较小者为n1,对应的
秩和为T1。
③确定检验统计量T。 T1+T2=N(N+1)/2
若n1<n2,则 T=T1,
若n1= n2 ,则T=T1或T2均可。
本例n1=10,n2 =12, 取T=T1=75.5。
H1 :两治疗组疗效不相同
=0.05
2、求检验统计量T值:
①编秩。把两组数据按等级顺序从小到大编秩,
两组相同等级的数据须取平均秩次。❖先计算各等
级的合计,再确定秩次范围及平均秩次。
②求各组秩和。
③确定检验统计量T。
n1=129 , T1=17408.0 , n2=133 , T2=17045.0 ,
不受总体参数的影响,它检验的是分布,
而不是参数,这种方法称为非参数检验。
又称为任意分布检验。
非参数检验适用资料:
➢ 总体分布不易确定;
➢ 分布呈非正态,又无适当的数据变换方法;
➢ 一端或两端有不确定数值(如<0.1,>15.0)的开口资料 ;
➢ 出现少量异常值的小样本数据;
➢ 等级资料(有序分类变量资料)。
表
T=T1=17408.0。
④
公式
计算Z值
(t
3
j
t j ) ( 228 228) (17 17) (10 10)
1
2
59.02 59
2
2
2
2
s1
s2
n
n
1 2
医学统计学-定量资料的统计分析 PPT课件

从资料提供的信息来看,样本均数150与总体 均数132并不相等,其原因可有以下两个方面: 1. 样本对应的总体均数等于132,差别仅仅是 由于抽样误差所致; 2. 除抽样误差外,病人与正常人存在本质上的 差异。 两种情况只有一个是正确的,且二者必居其一, 需要我们作出推断。一般来说,抽样误差比本质上 的差别要小,且抽样误差是有规律的。究竟是哪种 原因导致与 间的差别,可以通过假设检验作出判 断。其步骤如下。
t
X 0 s n
150 132 16.5 25
5.4545
(4)确定概率P(与统计量t值对应的概率):根据第 (3)步算得现有样本与已知总体的标准t离差为 5.4545。该信息是否支持零假设H0 ? 需要通过查表确 定P值,即在H0成立的前提下,获得现有这么大的标 准t离差以及更大离差 | t | ≥5.4545的可能性。即 P=P(| t | ≥5.4545) 按 =25-1=24,查t界值表得t0.05,24=2.064,故P<0.05。
第五节 定量资料的统计分析
—— t 检验
假设检验的方法通常是以选定检验统计量而命 名的,例如本节的 t 检验就是用特定公式计 算 t 统计量而命名
一、样本均数与总体均数的比较
此处的总体均数是指:已知的理论值或经 大量观察所得到的稳定值,记作μ0。 在此,样本均数与总体均数比较的目的是 推断样本所代表的未知总体μ与已知的总体均 数μ0是否有差别。 例4-5-1 测得25例某病女性患者的血红蛋 白(Hb),其均数为150(g/L),标准差为 16.5(g/L)。而该地正常成年女性的Hb均数 为132(g/L)。问该病女性患者的Hb含量是 否与当地正常女性Hb含量不同?
(1)建立假设: H0:= 0 =132,病人与正常人的平均血红 蛋白含量相等; H1:≠ 0≠ 132,病人与正常人的平均血红 蛋白含量不等。
医学统计学课后案例分析答案:第6章 两样本定量资料的比较

第6章两样本定量资料的比较案例辨析及参考答案案例6-1 为研究直肠癌患者手术前后血清CEA含量有无差异,作者收集了以下资料:术前(24例):31.5 30.0 28.6 39.7 45.2 20.3 37.3 24.0 36.2 20.5 23.1 29.033.1 35.2 28.9 26.4 25.9 23.8 30.4 31.6 27.9 33.0 34.0 32.7 术后(12例):2.0 3.2 2.3 3.1 1.9 2.2 1.5 1.8 3.2 3.0 2.8 2.1 (1)有人采用了两独立样本的t检验,结果t=15.92,ν=34,P<0.05。
从而得出结论:手术前后血清CEA含量有差异,术前CEA含量高于术后。
(2)也有人觉得上述分析方法不对,应该采用两独立样本的秩和检验,结果为:=,P<0.05。
Z-4.83(3)还有人认为应该采用校正t检验,结果:t'=22.51,P<0.05。
(4)有人将上述三种方法作一比较,认为既然三者结论是一致的,所以采用哪种分析方法都无所谓。
对此你有何看法?案例辨析(1)属于盲目套用两独立样本的t检验,因为未检查定量资料是否满足参数检验的前提条件。
(2)若定量资料满足参数检验的前提条件,直接用秩和检验会降低检验功效。
(3)若定量资料不满足正态性要求,直接用校正的t检验也是不妥当的。
(4)应当采用哪种统计分析方法不应仅看结论是否一致,而应根据分析目的、设计类型、资料是否满足参数检验的前提条件等方面综合考虑,事先选定统计分析方法,不能等到计算结果出来了,再确定统计分析方法。
正确做法此案例涉及完全随机设计两小样本资料的假设检验,统计方法的选择一定要结合数据特征。
通过对两组数据进行正态性检验,发现两样本均来自正态总体,但方差齐性检验结果表明,两总体方差不齐,所以最好的办法就是t'检验,此种情况一般不主张采用秩和检验,因为检验功效会大大降低。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
921.69
1293.36
371.67
3
1294.08
1711.66
417.58
4
945.36
1416.70
471.34
5
721.36
1204.55
483.19
6
692.32
1147.30
454.97
7
980.01
1379.59
399.58
8
691.01
1091.46
400.45
9
910.39
1360.34
2、同一样品分成两份,随机分别接受不同处理(或测 量);
3、同一受试对象处理前后,数据作对比。
基本思想:理论上,若两种处理无差别时,差值d的 总体均数μd应为0。
适用条件:差值服从正态分布
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
t d0 ~t, n1
4 812.91 815.20 2.29 1.5
5 738.96 783.17 44.21 6
6 899.38 910.92 11.54 3.5
7 760.78 758.49 - 2.29
-1.5
8 694.95 870.80 175.85 9
9 749.92 862.26 112.34 7
10 793.94 805.48 11.54 3.5
表6-2 不同剂量组的小鼠肝糖 原含量(mg/100g)
小鼠号 中剂量组 高剂量组 差值d 差值为正 差值为负
(1) (2) (3) (4) 秩次(5) 秩次(6)
1 620.16 958.47 338.31 10
2 866.50 838.42 -28.08
-5
3 641.22 788.90 147.68 8
Tn(n1)/4 0.5
Z
n(n1)(2n1) t3j tj
24
48
式中tj:第j个相同差值的个数,假定差值中 有2个4,5 个6,3个7则t1=2,t2=5,t3=3,
tj3 tj 2 3 2 5 3 5 3 3 3 150
j
第六章 两样本定量资料的比较
第一节 配对设计定量资料的比较 第二节 两组独立样本的比较 第三节 两组二项分布资料的比较 第四节 两组Possion分布资料的比较
27931.18626570.9752
d2 27931.1862,6Sd
12 84.2747 121
t 47.5660 19.55(2mg/d)l, 12111
84.274/712
3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数
值以及更不利于H0的数值的可能性(概率)有多大。
表6-3 两种药物治疗贫血患者结果
治疗 药物
血红蛋白增加量/g•L-1
新药 30.5 21.4 25.0 34.5 33.0 32.5 29.5 25.5 24.4 23.6 组
常规 19.5 19.0 13.0 24.7 21.5 22.0 19.0 15.5 24.5 23.4 药组
一为统计量T;双侧检验时,以绝对值较小者为统计量T。 本题取T=min(T+ ,T- )=6.5
4 确定P值作结论 :5≤n≤25 →查表法 n > 25 →正态近似法 / 校正
若n>25超过附表C8的范围,可用Z 检验。
Tn(n1)/40.5 Z
n(n1)(2n1)/24
若多次出现相持现象,用下式计算:
Sd n
例6-1 某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛 细支气管炎。用药前后患儿血清中免疫球蛋白IgG(mg/dl)含 量如表所示。试问用药前后IgG有无变化?
表6-1 用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
序号
用药前
用药后
差值d
1
1206.44
1678.44
Hale Waihona Puke 472.00查t临界值表:t0.05/2,11=2.201,t>t0.05/2,11,得P<0.05, 按α=0.05水准拒绝H0,接受H1。认为用药后小儿IgG增高。
二、配对资料的符号秩和检验
基本思想:假定两种处理效应相同,则差值的总体分布是 对称的,总体中位数为0。对于样本的正秩和与负秩和之间的 差异是一些随机因素造成的抽样误差,这些差异一般不会太大。 如果差别太大,超出了规定的范围,就拒绝H0,接受H1,认为 差值的总体中位数不等于0。
适用条件:差值不服从正态分布或分布型未知。
例6-2 某研究欲研究保健食品对小鼠抗疲劳作 用,将同种属的小鼠按性别和年龄相同、体重相近 配成对子,共10对,并将每对中的两只小鼠随机分 到保健食品两个不同的剂量组,过一定时期将小鼠 杀死,测得其肝中糖原含量(mg/100g),结果见表 10-1,问不同剂量组的小鼠肝糖 原含量有无差别?
检验步骤:
1 建立假设
H0:差值总体中位数Md=0
H1: Md≠0
α=0.05
2 根据差值编秩:按差值的绝对值由小到大编秩,并按
差值的正负给秩次加上正负号。编秩时,若差值为0,
舍去不计;若差值的绝对值相等时取平均秩次。
3 求秩和并确定检验统计量:分别求出正、负差 值秩次之和,以T+和 T-表示 ,单侧检验时任取其
449.95
10
568.56
1091.83
523.27
11
1105.52
1728.03
622.51
12
757.43
1398.86
641.44
1、建立检验假设,确立检验水准
H0: d0 H1:d0 0.05
2、计算统计量:根据资料类型和检验方法选择
n12,d570.975,dd n570.975/1247.566
第六章 两样本定量资料的比较
第一节 配对设计定量资料的比较 第二节 两组独立样本的比较 第三节 两组二项分布资料的比较 第四节 两组Possion分布资料的比较
一、配对资料的t检验
配对设计是研究者为了控制可能存在的主要非处理因素而采用 的一种试验设计方法。 形式:1、将受试对象配成特征相近的对子,同对的两个受试 对象随机分别接受不同处理;
一、两组独立样本资料的t检验 条件:两小样本均来自正态总体且方差齐
正态性检验 方差齐性检验
H 0 : 12 H 1:12 (单1 侧 2 或 12 )
t
X1X2 ,
Sc(n11
1) n2
n1
n2
2
sc2
(n11)S12(n21)S22 n1n22
例6-3 为研究某种新药治疗贫血患者的疗效,将20名 贫血患者随机分成两组,一组用新药治疗,另一组用常 规药物治疗,测得的血红蛋白增加量(g/L)见表6-3。 问新药与常规药治疗贫血患者后的血红蛋白平均增加量 有无差别?