四格表资料的Fisher确切概率法

合集下载

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。

这类资料在医学研究中较为多见。

例如比较两种方法治疗某种疾病的有效率是否相同?治疗结果如下:有效无效有效率(%)试验组12 1 92.31对照组 3 8 27.27可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离.5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。

这类资料在医学研究中较为多见。

例如比较两种方法治疗某种疾病的有效率是否相同治疗结果如下:有效无效有效率(%)试验组 12 1对照组 3 8可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。

定性资料常用的统计学方法

定性资料常用的统计学方法

定性资料常用的统计学方法一、χ2检验χ2检验(chi-square test)是一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。

(一)四格表资料的χ2检验例17:为了解吲达帕胺片治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用吲达帕胺片加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表4 -5-1,试分析吲达帕胺片治疗原发性高血压的有效性。

表4 -5-1 两种疗法治疗原发性高血压的疗效1.四格表χ2检验的原理:对于四格表资料,χ2检验的基本公式为:式中,A为实际频数(actual frequency),T为理论频数(theoreticalfrequency)。

理论频数T根据检验假设H0:π1=π2确定,其中π1和π2分别为两组的总体率。

计算理论频数T的公式为:式中Tij 为第i行第j列的理论频数,ni+和n+j分别为相应行与列的周边合计数,n为总例数。

现以例17为例说明χ2检验的步骤:(1)建立检验假设并确定检验水准。

H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.05(2)计算检验统计量。

按式(4 -5-2)计算T11,然后利用四格表的各行列的合计数计算T12、T21和T22,即T11=(44×41)/70=25.77,T12=44-25.77=18.23T21=41-25.77=15.23,T22=26-15.23=10.77按式(4 -5-3)计算χ2值(3)确定P值,作出推断结论。

以ν=1查χ2分布界值表,得P<0.005。

按α=0.05水准,拒绝H,接受H1,可以认为两组治疗原发性高血压的总体有效率不等,即可以认为吲达帕胺片治疗原发性高血压优于对照组。

2.四格表资料χ2检验的专用公式:在对两样本率比较时,当总例数n≥40且所有格子的T≥5时,可用χ2检验的通用公式(4 -5-1)。

四格表资料的Fisher确切概率法资料讲解

四格表资料的Fisher确切概率法资料讲解
(goodness of fit)中也发现了这一相同的 分 布,可用于检验资料的实际频数和理论频数 是否相符等问题。
33
2 分布的密度函数
f
(
2)
1
2(
)
(
2
2
1 2
)2 e 2
2
0 2 , 1,2,3,...
34
2 分布曲线
2 分布
(=1,2,3,4,6)
卡方检验基本思想
2 分布的概念
例11 某省肿瘤研究所分别在甲、乙两县随机抽 查10万育龄妇女,进行追踪观察。三年中甲县 死于宫颈癌的有28人,乙县死于宫颈癌者47人。 问甲乙两县宫颈癌死亡率有无差别?
23
两样本阳性数的比较
例12 某车间在改革生产工艺前,随机测量三次 车间空气中的粉尘浓度,每次取1升空气,分别测 得有38、29、36颗粉尘;改革生产工艺后又测量3 次,每次取1升空气,分别测得有25、18、21颗粉 尘。问工艺改革前后粉尘浓度是否有变化?
2分布的分位数
2
2 ,
2
2 ,
P P
2(,)
38
卡方检验基本思想
2. 2 检验的基本思想(以两个样本率的比较为例)
例14 某院欲比较异梨醇口服液(试验组)和 氢氯噻嗪+地塞米松(对照组)降低颅内压的 疗效。将200例颅内压增高症患者随机分为两 组,结果如下。问两组降低颅内压的总体有效
率有无差别?
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
12
☆二项分布的应用☆
1. 估计总体率的可信区间 (1)查表法 (n50,特别是p远离0.5时) (2)正态近似法 (n>50 且 np5 和n(1-p) 5 ) 2. 样本率与已知总体率比较的假设检验 (1)直接计算概率法( π0偏离0.5较远, X 较小, 单侧检验 )

四格表的确切概率法

四格表的确切概率法

例7-6 设有56份咽喉涂抹标本,把每一份标本 一分为二,依同样的条件分别接种于甲、乙两种白 喉杆菌培养基上,观察白喉杆菌的生长情况,结果 如表7-10,问两种培养基上白喉杆菌的生长概率有 无差别?
表7-10 两种培养基白喉杆菌生长情况
甲培养基
阳性 阴性 合计
阳性
22 (a) 2 (c) 24
乙培养基 阴性 18 (b) 14 (d) 32
20
由 2临界值表,
2 0.05(1)

3.84,11.25

3.84,
P

0.05,
按 0.05 水准拒绝 H0 ,差别有统计学意义, 可以认为,两种培养基上白喉杆菌生长的阳性
概率不相等。鉴于甲培养基阳性频率为
40/56==71.4%,乙培养基为24/56=42.9%,可以认为,
甲培养基阳性概率高于乙培养基。
bc
(7-12)
若 b c 40,需对 公式(7-14)校正公式为
2 ( b c 1)2 v 1
bc
(7-13)
对于例7-6数据,因为 b c 40, 按式(7-15)计算
2 (18 2 1)2 225 11.25, v 1
18 2
检验水准 0.05
变量1
1 2 … R 合计
表7-13 配对设计下多分类资料的R×R列联表
变量2
1
2

R
合计
A11
A12

A1c
n1(固定值)
A21
A22

A2c
n2(固定值)





AR1
AR2

四格表资料的fisher确切概率法公式

四格表资料的fisher确切概率法公式

四格表资料的fisher确切概率法公式
我们要了解四格表资料的Fisher确切概率法公式。

首先,我们需要了解什么是四格表资料和Fisher确切概率法。

四格表资料是指一个包含四个单元格的数据表格,通常用于展示两个分类变量之间的关系。

Fisher确切概率法是一种用于计算四格表中每个单元格概率的方法。

假设四格表的四个单元格分别为 A, B, C 和 D。

则Fisher确切概率法公式为:
P(A) = (a+b+c)!(a+b+c+d)! / (a!b!c!d!),
P(B) = (a+c)!(a+c+d)! / (a!b!c!d!),
P(C) = (a+b)!(a+b+d)! / (a!b!c!d!),
P(D) = (b+c)!(a+b+c+d)! / (a!b!c!d!)。

其中,a, b, c 和 d 分别表示四格表中的四个单元格的计数。

这个公式可以用于计算四格表中每个单元格的概率,从而帮助我们了解两个分类变量之间的关系。

计数资料常用检验方法

计数资料常用检验方法

.219
1
.640
N of Valid Cases
24
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum exp is 2.50.
三组疗法有效率比较
分组 有效数 无效数 合计
在R×C表中,如T<5的格子数超过基本格 子的1/5时,不能直接用R×C表公式。
两组病人某项指标分级构成
组别 I 甲组 72
II III 28 5
IV


2(1.46) 107
乙组 74
32 6
1(1.54) 113
合计 146 60 11 3
220
表中有两个基本格子的理论数小于5
处理的方法 ①增加观察单位数目 ②合并相邻的两列(或两 行) ③去掉某行或某列
计数资料常用检验方法
BIM
当两组样本较大(n>100), 而率又不太小时(比如np或n(1p)均大于5,此时率的分布近似正 态分布),可选择u检验(或X2
检验)见公式
1.计数资料两大样本u检验
u=
p1 − p2
PQ( 1 + 1 )
n1 n2
或 u =
p1 − p2 , u = 1.96, P = 0.05
Value Pearson Chi-Square 4.326b Continuity Correctaio 4.067
Asymp. Sig. Exact Sig. Exact Sig.
df
(2-sided) (2-sided) (1-sided)

四格表卡方检验

四格表卡方检验

四格表确切概率法的基本思想
在四格表周边合计固定不变的条件下,改 变某一格子的实际频数,列出a、b、c、d各种 组合的四格表,按公式8-9计算每个四格表的概 率,然后计算单侧或双侧累积概率,并与检验 水准α比较,作出是否拒绝H0的结论。
P (a b)!(c d )!(a c)!(b d )! a! b! c! d ! n!
第13页/共42页
例8-1 用专用公式 计算 2 值:
2 (271 26 5 74)2 376 56.77 , df 1
276100 345 31

2界



2 0.05,1
3.84
下结论:
2
2 0.05,1
3.84;
P 0.05,按 0.05水准,

绝H

0

受H

1






四格表确切概率法系英国统计学家fisher于1934年提出又称fisher精切概率法fiserexacttest在四格表周边合计固定不变的条件下改变某一格子的实际频数列出abcd各种组合的四格表按公式89计算每个四格表的概率然后计算单侧或双侧累积概率并与检验水准比较作出是否拒绝h组别改善无效合计红花散1520安慰剂1417181937例83研究中药制剂红花散改善周围血管闭塞性病变患者的皮肤微循环状况以安慰剂作对照将37个病例随机分到两组结果如表85分析红花散的疗效
第6页/共42页
一、卡方检验的基本思想
例8-1 对表8-1资料推断两药的疗效有无差别
H0:
1
,即两药总体有效率相等
2
由于总体有效率未知,将两组数据合并,计算合并
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
近似
u
n 0 1 0
X n 0
p 0 u 0 (1 0 ) / n
8
样本率与总体率的比较-----正态近似法
例3 据报道,某常规疗法对某种疾病的治愈率为65%。现
某医生用中西医结合疗法治疗了100例该病患者,共治愈80
人。问该中西医结合疗法的疗效是否比常规疗法好?
(2)正态近似法(X>50) 2. 样本平均数与已知总体平均数比较的假设检验
(1)直接计算概率法( μ0<20, X 较小, 作单侧检验)
(2)正态近似法( μ0≥20) 3. 两样本平均数比较的假设检验( X1, X2 均大于20 ) (1)两样本观察单位相同 (2)两样本观察单位不同
29
§3 卡方检验
5
样本率与已知总体率的比较----直接计算概率法
H0成立时,随机抽查的10人中治愈人数x 的分布
本例π0=0.80,1-π0=0.20,n=10, 根据题意需求最少治愈9人的概率。
6
样本率与总体率的比较----直接计算概率法
例2 据以往经验,新生儿染色体异常率一般为1%, 某医生观察了当地400名新生儿,发现有1例染色体 异常,问该地新生儿染色体异常率是否低于一般?
H0(=0=50) 成立时,1小时内该装置发出的质点数的概率分布
20
样本阳性数与总体平均数的比较----直接计算概率法
例10 某省肺癌死亡率为35.2/10万,在该省某 地抽查10万人,进行三年死亡回顾调查,得肺
癌死亡数为82人。已知该地人口年龄别构成与
全省基本相同。问该地肺癌死亡率与全省有无 差别?
得有38、29、36颗粉尘;改革生产工艺后又测量3
次,每次取1升空气,分别测得有25、18、21颗粉
尘。问工艺改革前后粉尘浓度是否有变化?
25
两样本阳性数的比较----u检验
2. 两样本观察单位(时间、面积、容积等 )不同 需先将观察单位化为相等,即分别计算出两样本阳 性数的平均数。
u
X1 X2 X 1 n1 X 2 n2
表 6-1 两组降低颅内压有效率的比较
组别 试验组 对照组 合计
有效 99(90.48) a 174 (a c)
无效 5(13.52) b 26 (b d )
合计 104 (a b) 96 (c d ) 200 (n)
23
两样本阳性数的比较
例11 某省肿瘤研究所分别在甲、乙两县随机抽 查10万育龄妇女,进行追踪观察。三年中甲县 死于宫颈癌的有28人,乙县死于宫颈癌者47人。 问甲乙两县宫颈癌死亡率有无差别?
24
两样本阳性数的比较
例12 某车间在改革生产工艺前,随机测量三次 车间空气中的粉尘浓度,每次取1升空气,分别测

根据资料的具体情况,可选用: 1. 直接计算概率法 2. 正态近似法
4
样本率与总体率的比较
1. 直接计算概率法

应用条件:π0偏离0.5较远,且阳性数X 较小 作单侧检验时。 例1 根据以往长期的实践,证明某常用药的

治愈率为80%。现在某种新药的临床试验中,
随机观察了10名用该新药的患者,治愈9人。 问该新药的疗效是否比传统的常用药好?
Xi
u u u
2 2 1 2 2
2
ui

33
卡方检验基本思想
2 分布的拓展与应用

2 分布的概念
1875年,F. Helmet得出:来自正态总体的样 本方差的分布服从 2 分布;

1900年K. Pearson又从检验分布的拟合优度 (goodness of fit)中也发现了这一相同的 2 分 布,可用于检验资料的实际频数和理论频数
H0成立时, 400名新生儿中染色体异常例数的概率分布
7
样本率与总体率的比较
2. 正态近似法

应用条件:当π0不太靠近0或1,且样本含量n
足够大;或nπ0≥5且n(1-π0)≥5时,
X ~ N n 0 , n 0 1 0
近似
可利用二项分布的正态近似原理做检验。
1 0 p ~ N 0 , 0 n
(1)直接计算概率法( π0偏离0.5较远, X 较小, 单侧检验 )
n2p25 , n2(1-p2) 5
14
§2 服从Poisson分布资料的假设检验
样本阳性数与总体平均数的比较 两样本阳性数的比较
15
一、样本阳性数与总体平均数的比较

目的:推断样本所代表的未知总体平均数 μ 与 已知总体平均数 μ0 是否相等。 根据资料的具体情况,可选用: 1. 直接计算概率法 2. 正态近似法
一、 2 检验的基本思想
二、四格表资料的 2检验 三、行×列表资料的 检验
2
四、配对四格表资料的 2检验 五、多个样本率比较的 2分割法
六、有序分组资料的线性趋势检验
七、频数分布拟合优度的 2 检验 八、四格表资料的Fisher确切概率法
30
x2 检验(chi-square test)是以 x2分布为理论依据,
17
样本阳性数与总体平均数的比较----直接计算概率法
例8 卫生标准规定, 生活饮用水大肠杆菌数不得 超过3个/ml。现对某饮用水进行抽检,抽取1ml 水样培养得到5个大肠杆菌。问该水样中的大肠 杆菌是否超标?
H0(=3)成立时, 每毫升水中大肠杆菌数的概率分布
18
样本阳性数与总体平均数的比较
当H0成立时, 100例患者中治愈人数的概率分布
9
样本率与总体率的比较-----正态近似法
例4 经长期临床观察, 发现胃溃疡患者发生胃出血症状 的占20%。现某医院观察了304例65岁以上的老年胃溃疡 患者,有96例发生胃出血症状,占31.58%。问老年胃溃 疡患者是否较一般患者更易发生胃出血?
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布
2 ③ 当自由度ν →∞时, 曲线逼近于正态曲线。
38
卡方检验基本思想
2分布的分位数 (Percentile)

2分布的概念
当ν 确定后, 2分布曲线下右侧尾部的面积为 2 时,横轴上相应的 2 值,记为 , ,如下图。
实际应用时,可根据ν 由 2 界值表 (percentage
用途颇广的假设检验方法。可用于: 两个或多个样本率的比较; 两个或多个样本构成比的比较; 两个分类变量间关联性的检验; 有序分组资料的线性趋势检验; 频数分布的拟合优度检验。
31
2 检验的基本思想 一、

2 分布的概念
2 检验的基本思想
P 值的确定
2 检验的基本检验步骤
pc =(70+60)/(100+120)=0.5909
13
☆二项分布的应用☆
1. 估计总体率的可信区间
(1)查表法 (n50,特别是p远离0.5时) (2)正态近似法 (n>50 且 np5 和n(1-p) 5 ) 2. 样本率与已知总体率比较的假设检验 (2)正态近似法(n>50 且 n05 和n(1-0) 5 ) 3. 两大样本率比较的假设检验 正态近似法 n1, n2>50 且 n1p15 , n1(1-p1) 5
2. 正态近似法

当μ0≥20时, x ~ N ( 0 , 0,可利用Poisson分 )
布的正态近似原理做检验。
近似
u
X 0
0
19
样本阳性数与总体平均数的比较----直接计算概率法
例9 质量控制标准规定某装置平均每小时发出质点
数不超过50个。今抽查一次,在1小时内测得该装置
发出的质点数为58个,问该装置是否符合要求?
2 分布曲线
2 分布
(=10,20,30,50)
2分布的概念
=10 =20 =30 =50
37
卡方检验基本思想
2 分布特点

2分布的概念
2 分布的形状依赖于自由度ν 的大小:
2 ① 当自由度ν≤2时, 曲线呈“L”型;
2曲线逐渐趋于对称; ② 随着ν 的增加,

16
样本阳性数与总体平均数的比较
1. 直接计算概率法

应用条件:μ0<20,且样本阳性数 X 较小作单侧检
验时。

例7 已知接种某疫苗时,一般严重反应率为1‰。 现用某批号的该种疫苗接种150人,有2人发生严重
反应,问该批号疫苗的严重反应率是否高于一般?
H0(=0.001)成立时150人中发生严重反应人数的概率分布
21
二、两样本阳性数的比较

目的:推断两个样本各自代表的两总体平
均数是否相等。

当两个样本阳性数X1, X2 均大于20时,可
用 u 检验。
22
两样本阳性数的比较----u检验
1. 两样本观察单位(时间、面积、容积等 )相同
X1 X 2 u X1 X 2

X 1 X 2 u X 1 X 2
32
卡方检验基本思想
2分布的概念 1.

2分布是一种连续型分布(Continuous distribution),
v 个相互独立的标准正态变量(standard normal
2 变量, variable) ui (i 1,2,, ) 的平方和称为
其分布即为 为v 。 分布;自由度(degree of freedom) 2
10
二、两样本率比较


目的:推断两个样本各自代表的两总体率是否相等
应用条件:当两个样本率均满足正态近似条件时,
可用u检验。
p1 p2 u s p1 p2
相关文档
最新文档