15-2配对四格表资料差别检验的精确概率方法_刘玉秀

15-2配对四格表资料差别检验的精确概率方法_刘玉秀
15-2配对四格表资料差别检验的精确概率方法_刘玉秀

南京大学学报(自然科学)

第34卷 第5期 JOU RN AL OF NAN JING U NIV ERSIT Y Vol.34,No.5 1998年9月 (N ATU RAL SCIENCES ) Sept .,1998

配对四格表资料差别检验的精确概率方法

刘玉秀 刘 钧

(

南京大学医学院临床学院

南京军区南京总医院

 医务部,210002,南京)

摘 要 探讨用于配对四格表资料差别检验的精确概率方法。方法:在配对四格表资料两组率差为0的无效假设下,根据两项分布的原理,可导出假设检验用的精确概率计算公式,借此公式经逐一计算,给出b ≤20和c ≤10不同组合时的单、双侧检验精确概率值。提供了配对四格表资料差别检验的精确概率计算公式,并构造出b ≤20和c ≤10的精确概率速查表。结论:M cN emar 卡方检验方法仅适于b +c >20情形,当b +c ≤20时宜用本文介绍的精确概率方法:或通过公式计算或直接查表。

关键词 配对四格表,假设检验,精确概率分类法 R311a

0 引 言

医学研究中经常会遇到配对形式的四格表资料,该类资料数据处理的目的一般为推断两因素(处理)间有无关联或两处理的结果间有无差异(此种情况更为多见),前者可采用通常四格表资料处理的卡方检验法或Fisher 精确概率法,后者常规应用的方法为M cNem ar 卡方检验法,但此方法需满足一定的条件,当配对四格表中(b+c)较小(<20)时不宜使用,应考虑选用配对四格表资料差别检验的精确概率计算方法。

表1 A 、B 两种检验方法对血中某抗体的检出情况T able 1 T he o utcome o f two test matho ds

A B +-合 计+

461460-43640合计

50

50

100

1 举 例

欲比较两种检验方法对血样中某抗体的检出率,将100份血样同时用两种方法进行检测,结果为阳性或阴性。根据检测的结果,应以血样本为基本单位,整理成数据对子数为100的配对形式的四格表资料(表1)进行两方法间检出率

a

收稿日期:1997-07-14;修回日期:1998-03-03

第一作者简介:刘玉秀,男,1966年2月生,主治医师,现从事科研管理,曾发表“生物检定数据效价比

值的广义线性模型估计”等论文

差异的检验时,应进行专用于配对四格表资料的检验方法。

一般,可供应用的检验方法为M cNemar 卡方检验,连续性校正的公式为:

V 2

=(?b-c ?-1)2

b+c

,自由度df =1该式的使用有一定的限制条件,不适于b+c<20的情形。对配对四格表资料差别的检验可

基于参数P =0.5的两项分布,用直接计算概率的方法进行,称为精确概率计算法〔1,2〕

2 精确概率计算的通用步骤

a b c

d

2.1 构造出配对的四格表资料 假设比较的两组结果为属阳性或阴性的两分类数据,以a 代表两组均为阳性的对子数,d 代表两组均为阴性的对子数,b 代表一组为阳性另一组为阴性的对子数,c 代表一组为阴性而另一组为阳性的对子数,n 为总对子数,n=a+b +c+d 。配对的四格表可简单示意为如右的形式:

2.2 建立检验假设 由配对四格表资料可知,第1组的阳性率为(a+b)/n,第2组的阳性率为(a+c)/n 。比较两组的阳性率,也即是对两组阳性率的差异进行假设检验。假设为:

H 0:P

1-P 2=0,两组的阳性率相等;H 1:P 1-P 2≠0,两组的阳性率不等;显著性水平A =0.05。因两组样本率的差值为(b-c)/n,故两组率差异的假设检验实际上等价于b 和c 差异的假设检验。在零假设下,对于给定的(b+c)个对子,b 或c 可认为服从于参数P =0.5的两项分布。以下的精确概率计算方法即是根据此原理而导出的。

2.3 精确概率计算 若b >c ,单侧检验的P 值为〔3,4〕

:

P 单=

∑c

i =0(b+c)!i!

(b+c-i)!

×0.5b +c

式中“!”为阶乘的数学符号,指其前整数逐次减少1以后的连乘积。约定:0!=1。∑指对

其后的算式求和,下同。若b ≤c,单侧检验的P 值为〔3,4〕:

P 单=

∑b

i =0(b+c)!i!

(b+c-i)!

×0.5b +c

因P =0.5的两项分布为对称分布,故双侧检验的P 值为:P 双=2×P 单

2.4 推断结论 根据精确概率的P 值大小,按一定的显著性水平即可对结论进行推断。事实上,以上的精确概率计算法适于任何情况下配对四格表资料差别的假设检验,只是当b +c >20时的计算量较大,故可选用不失准确性、且简便易用的M cNemar 卡方检验法。

3 例算过程

上例采用连续性校正的M cNemar 卡方检验,可计算出检验统计量V 2=4.50,df=1,P =0.0339(<0.05),差异显著,A 方法的检出率高于B 方法。由于b +c =18<20,故结论的准确性值得怀疑。为此,最好使用配对四格表资料差别检验的精确概率计算法。

若有足够的理由认为A 方法的检出率不会低于B 方法,应计算单侧精确概率。将b=14和c=4代入上述公式得:

?

628?南京大学学报(自然科学)第34卷 

P 单=

∑4

i =0

18!

i!

(18-i)!

×0.518=0.01544

通常应采用双侧检验,其精确概率为:P 双=2×P 单=2×0.01544=0.03088 按0.05的显著性水平,可拒绝零假设,认为A 方法的检出率比B 方法的检出率高。此统计结论和采用M cNem ar 卡方检验的结论一致。当M cNemar 卡方检验法和精确概率计算法的结论不一致时,应以精确概率计算法的推断结论为准。

4 精确概率数值表及其使用

为了方便使用者,作者已根据上述的公式,对b ≤20和c ≤10不同组合下的配对四格表计算了单侧和双侧的概率(表2)。实用中,对配对四格表资料的差别检验不需再进行复杂的计算,直接查表即可获得精确概率P 值。例如,本例的b=14,c=4,也可直接查配对四格表资料差别检验的精确概率数值表,得单侧P =0.0154,双侧P =0.0309,与计算结果仅存在舍入误差。

表2 配对四格表资料差别检验的精确概率数值表

T able 2 Exact pr obability for paired four fold t ables of b ≤20and c ≤10

b c

01

2

3

4

5

6

7

8

9

10

1.50001.0000

2.2500.5000.5000 1.0000

3.1250.3125.5000.2500.6250 1.0000

4.062

5.1875.3438.5000.1250.3750.6875 1.00005.0313.1094.226

6.3633.5000.0625.2188.4531.7266 1.00006.0156.0625.1445.2539.3770.5000.0313.1250.2891.5078.7539 1.0000

7.007

8.0352.0898.171

9.2744.3872.5000.0156.0703.1797.3438.5488.7744 1.00008.0039.0195.0547.1133.1938.2905.3953.5000.0078.0391.1094.2266.3877.5811.7905 1.00009.0020.0107.0327.0730.1334.2120.3036.4018.5000.0039.0215.0654.1460.2668.4240.6072.8036 1.000010.0010.0059.0193.0461.0898.1509.2272.3145.4073.5000.0020.0117.0386.0923.1796.3018.4545.6291.8145 1.000011.0005.0032.0112.0287.0592.1051.1662.2403.3238.4119.5000.0010.0063.0225.0574.1185.2101.3323.4807.6476.8238 1.000012.0002.0017.0065.0176.0384.0717.1189.1796.2517.3318.4159.0005.0034.0129.0352.0768.1435.2379.3593.5034.6636.831813

.0001.0009.0037.0106.0245.0481.0835.1316.1917.2617.3388

?

629?第5期 刘玉秀等: 配对四格表资料差别检验的精确概率方法

b c 01234567891014.0001.0005.0021.0064.0154.0318.0577.0946.1431.2024.2706.0001.0010.0042.0127.0309.0636.1153.1892.2863.4049.541315.0000.0003.0012.0038.0096.0207.0392.0669.1050.1537.2122.0001.0005.0023.0075.0192.0414.0784.1338.2100.3075.424416.0000.0001.0007.0022.0059.0133.0262.0466.0758.1148.1635.0000.0003.0013.0044.0118.0266.0525.0931.1516.2295.326917.0000.0001.0004.0013.0036.0085.0173.0320.0539.0843.1239.0000.0001.0007.0026.0072.0169.0347.0639.1078.1686.247818.0000.0000.0002.0007.0022.0053.0113.0216.0378.0610.0925.0000.0001.0004.0015.0043.0106.0227.0433.0755.1221.184919.0000.0000.0001.0004.0013.0033.0073.0145.0261.0436.0680.0000.0000.0002.0009.0026.0066.0146.0290.0522.0872.136020

.0000.0000.0001.0002.0008.0020.0047.0096.0178.0307.0494.0000

.0000

.0001

.0005

.0015

.0041

.0094

.0192

.0357

.0614

.0987

(b>c;上行:单侧概率,下行:双侧概率)

本精确概率数值表仅给出b>c 的情形,若遇b0.05,故此处从略,实际中遇此情形,毋需查表,可按0.05的显著性水平直接得出两组差别无统计学意义的结论。

对配对四格表差别检验的方法,亦有学者基于两项分布的原理提出了显著性界值法〔5〕

,可在0.05和0.01的概率水平下进行统计推断。本文方法直接给出精确概率值,较之显著性界值法更为方便、直观。

(本文经杨友春主任审校,谨谢!)

参考文献

1 R osner B.F undamentals o f Biostat istics.2nd Editio n.Dux bur y P ress,1986:333~339

2 A mitage P .Stat istical M ethods in M edical Research .2nd Editio n .Blackwell Scientific Publicatio ns ,

1987.120~1323 熊宗

,王纪亮,苏炳华.配对计数资料的统计分析方法.上海预防医学杂志,1993,5(4):46

4 汤旦林,李晓强,王松柏.统计在生命科学中的实践与认识(Ⅱ):四格表的“物理”意义和数据处理

(上).数理统计与管理,1997,16(2):59

5 张志军,王广义.配对离散变量的统计分析方法.中华预防医学杂志,1983,17(2):65

?

630?南京大学学报(自然科学)

第34卷 

A METHOD OF EXACT PROBABILITY OF HYPOTHESIS TEST

FOR MATCHED FOURFOLD TABLES

L iu Yux iu Liu J un

(Clinical Scho ol o f M edica l College,Na njing U niver sity

D epar tment o f M edical A ffair ,N anjing G ener al Ho spital of P LA ,210002,N anjing ,PR C )

Abstract T o sear ch fo r a method of ex act pr obability o f hy pothesis test for ma tched fourfo ld tables.U n-der the null hypot hesis that the popula tion r ate differ ence bet ween tw o gr oups wa s zer o in matched four-fold tables ,t he for mula o f ex act pr obability fo r statistical inference co uld be achiev ed acco r ding to t he prin-ciple o f binomial distr ibutio n,fr om which t he exact pr obability w as computed for b ≤20and c ≤10.T he for mula o f ex act pro ba bility for hypothesis test in matched four fold tables w as pr ov ided,and a table o f ex-act pr obabilit y of b ≤20and c ≤10was constr ucted.M cN emar Chi-squar e t est w as only indicated fo r b+c >20,w hen b +c ≤20,the method of ex act pro bability int ro duced by this art icle should be considered .Keywords M atched four fold t able, Hy pothesis test , Ex act pr obability

?

631?第5期 刘玉秀等: 配对四格表资料差别检验的精确概率方法

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计 最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加

最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广. 个独立样本率比较的χ2检验属四格表资料χ2检验。这类资料在医学研究中较为多见。 例如比较两种方法治疗某种疾病的有效率是否相同治疗结果如下: 有效无效有效率(%) 试验组 12 1 对照组 3 8 可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。在读取统计结果时,应当注意χ2检验的适用条件,正确选择Pearson卡方检验、Yates校正卡方检验、Fisher 精确概率法(本法不属于χ2检验)。 第三节四格表资料的Fisher确切概率法 前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4)计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。该法是由年)提出的,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴。但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章。 下面以例8-1介绍其基本思想与检验步骤。 例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。问两组新生儿的HBV总体感染率有无差别?

配对卡方检验及Kappa检验一致性检验

一、配对卡方检验 把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时要用配对卡方检验。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择McNemanr复选框,进行McNemanr检验。即配对卡方检验,只能针对方形表格进行。不能给出卡方值,只能给出P值。 二、一致性检验(Kappa检验) 诊断试验的一致性检验经常用在下列两种情况中:一种是评价待评价的诊断实验方法与金标准的一致性;另一种是评价两种化验方法对同一个样本(化验对象)的化验结果的一致性或两个医务工作者对同一组病人的诊断结论的一致性或同一医务工作者对同一组病人前后进行两次观察作 出的诊断的一致性等等。 Kappa值即内部一致性系数(inter-rater,coefficient of internal consistency),是作为评价判断的一致性程度的重要指标。取值在0~1 之间。Kappa≥两者一致性较好;>Kappa≥两者一致性一般;Kappa<两者一致性较差。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择Kappa复选框。计算Kappa值。 如果选择Risk复选框,则计算OR值(比数比)和RR值(相对危险度)。 病例对照研究(case control study)是主要用于探索病因的一种流行病学方法。它是以某人群内一组患有某种病的人(称为病例)和同一人群内未患这种病但在与患病有关的某些已知因素方面和病例组相似的人(称为对照)作为研究对象;调查他们过去对某个或某些可疑病因(即研究因子)的暴露有无和(或)暴露程度(剂量);通过对两组暴露史的比较,推断研究因子作为病因的可能性:如果病例组有暴露史者或严重暴露者的比例在统计学上显着高于对照组,则可认为这种暴露与患病存在统计学联系,有可能是因果联系。究竟是否是因果联系,须根据一些标准再加以衡量判断。 所谓联系(associatiom)是指两个或更多个变量间的一种依赖关系,可以是因果关系,也可以不是。

统计软件配对卡方检验教程

1. 配对四格表的卡方检验 (1) 当b+c≥40 c b c b +-=2 2 )(χ 1=υ (2) 当b+c<40 c b c b +--= 2 2 )1(χ 1=υ 例.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等? 表5 两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 + - 合计 + 11 1 12 - 9 7 16 合计 20 8 28 例6.某医院用三种方案治疗急性无黄疸型病毒性肝炎结果如下,问三种疗法的有效率是否一致? 表6 三种方案治疗肝炎疗效的结果比较 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组 35 45 80 43.75 中西结合 59 15 74 79.73 145 109 254 57.09 卡方分割:(а必须校正,然后P 值和α’进行比较) 多个实验组间的两两比较:1 2' += k C α α 实验组与同一个对照组比较:() 12' -= k α α 1 输入值 2. 权重 3.计算卡方值 4.结果 Asymp.sig.的那一列就是P 值:表示三者间不全相同 5.卡方分割 输入条件 选择相应的组别计算相应的卡方值 例7. 测得某地5801人的ABO 血型和MN 血型结果如表7-10,问两种血型系统之间是否有关联? 表7 某地5801人的血型 ABO 血型 MN 血型 合计 M N MN O 431 490 902 1823

A 388 410 800 1598 B 495 587 950 2032 AB 137 179 32 348 合计1451 1666 2684 5801 此题为双向无序,用卡方检验,计算列联系数: 计算步骤相同 唯一不同之处:多选两项(contigency coefficient为列联系数) 结果 结果解释:卡方值显示两者间有联系,Linear-by- Linear Association 中P<0.0001,所以数据符合线性;论文统计时还需要计算偏离线性回归分量=213.162-51.336即可,相应的自由度为6-1=5,算出的P值越大越说明符合线性。 例8. 某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将278例尸解资料整理成表7-13,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势? 表8 年龄与冠状动脉硬化的关系 年龄(岁) (X) 冠状动脉硬化等级(Y) 合计—+ ++ +++ 20~70 22 4 2 98 30~27 24 9 3 63 40~16 23 13 7 59 ≥50 9 20 15 14 58 合计122 89 41 26 278 双向有序但属性不同,进行线性趋势检验(test for linear trend): 1. 计算总的X 2值 2. 计算线性回归分量X 2回归 3. 计算偏离线性回归分量X 2偏 4. 列2x分解表,确定p值 变异来源df p 总变异(R-1)(C-1) 线性回归分量若小于0则相 关 偏离线性回归分量若小于0则为非直线相关 输入值进行线性趋势检验 结果 结果解释:卡方值即总变异为71.432 回归值为63.389 然后在EXCEL手工计算 配对四格表的扩展即例9 例9. 以血清法作为金标准评价滤纸片法的准确性,检测指标为检测标本的抗体阳性反应等级,结果如下表33-4,试进行效度评价。 表9 滤纸片法与血清法比较

5习题-卡方检验

计数资料统计分析————习题 1.220.05,n x x ≥ 则( ) A.P ≥0.05 B.P ≤0.05 C.P <0.05 D.P =0.05 E.P >0.05 2.2x 检验中,自由度v 的计算为( ) A.行×列(R ×C ) B.样本含量n C.n-1 D.(R -1)(C -1) E.n 2.四格表卡方检验中,2x <20.05(1)x ,可认为 A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时,最常用的显著性检验方法是( ) A.t 检验法 B.正态检验法 C.秩和检验法 D.2 x 检验法 E.方差分析 4.在卡方界值(2x )表中,当自由度一定时,2x 值愈大,P 值( ) A.不变 B.愈大 C.愈小 D.与2x 值相等 E.与2x 值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x 检验结果,甲论文 2x >20.01(1)x 2x >2 0.05(1)x 。若甲乙两论文的样本量相同,则可认为( ) A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R ×C 表的专用公式是( ) A. 22 ()()()()()ad bc n x a b a c b d c d -=++++ B. B. 2 2 ()b c x b c -=+ C . 2 2 1R C A x n n n ??=- ???∑ D. ()220.5b c x b c --=+ E. 2 2 ()A T x T -=∑

15-2配对四格表资料差别检验的精确概率方法_刘玉秀

南京大学学报(自然科学) 第34卷 第5期 JOU RN AL OF NAN JING U NIV ERSIT Y Vol.34,No.5 1998年9月 (N ATU RAL SCIENCES ) Sept .,1998 配对四格表资料差别检验的精确概率方法 刘玉秀 刘 钧 ( 南京大学医学院临床学院 南京军区南京总医院  医务部,210002,南京) 摘 要 探讨用于配对四格表资料差别检验的精确概率方法。方法:在配对四格表资料两组率差为0的无效假设下,根据两项分布的原理,可导出假设检验用的精确概率计算公式,借此公式经逐一计算,给出b ≤20和c ≤10不同组合时的单、双侧检验精确概率值。提供了配对四格表资料差别检验的精确概率计算公式,并构造出b ≤20和c ≤10的精确概率速查表。结论:M cN emar 卡方检验方法仅适于b +c >20情形,当b +c ≤20时宜用本文介绍的精确概率方法:或通过公式计算或直接查表。 关键词 配对四格表,假设检验,精确概率分类法 R311a 0 引 言 医学研究中经常会遇到配对形式的四格表资料,该类资料数据处理的目的一般为推断两因素(处理)间有无关联或两处理的结果间有无差异(此种情况更为多见),前者可采用通常四格表资料处理的卡方检验法或Fisher 精确概率法,后者常规应用的方法为M cNem ar 卡方检验法,但此方法需满足一定的条件,当配对四格表中(b+c)较小(<20)时不宜使用,应考虑选用配对四格表资料差别检验的精确概率计算方法。 表1 A 、B 两种检验方法对血中某抗体的检出情况T able 1 T he o utcome o f two test matho ds A B +-合 计+ 461460-43640合计 50 50 100 1 举 例 欲比较两种检验方法对血样中某抗体的检出率,将100份血样同时用两种方法进行检测,结果为阳性或阴性。根据检测的结果,应以血样本为基本单位,整理成数据对子数为100的配对形式的四格表资料(表1)进行两方法间检出率 a 收稿日期:1997-07-14;修回日期:1998-03-03 第一作者简介:刘玉秀,男,1966年2月生,主治医师,现从事科研管理,曾发表“生物检定数据效价比 值的广义线性模型估计”等论文

配对卡方检验及Kappa检验一致性检验完整版

配对卡方检验及K a p p a 检验一致性检验 集团标准化办公室:[VV986T-J682P28-JP266L8-68PNN]

一、配对卡方检验 把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时要用配对卡方检验。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择McNemanr复选框,进行McNemanr检验。即配对卡方检验,只能针对方形表格进行。不能给出卡方值,只能给出P 值。 二、一致性检验(Kappa检验) 诊断试验的一致性检验经常用在下列两种情况中:一种是评价待评价的诊断实验方法与金标准的一致性;另一种是评价两种化验方法对同一个样本(化验对象)的化验结果的一致性或两个医务工作者对同一组病人的诊断结论的一致性或同一医务工作者对同一组病人前后进行两次观察作出的诊断的一致性等等。 Kappa值即内部一致性系数(inter-rater,coefficientofinternalconsistency),是作为评价判断的一致性程度的重要指标。取值在0~1之间。Kappa≥0.75两者一致性较好;0.75>Kappa ≥0.4两者一致性一般;Kappa<0.4两者一致性较差。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择Kappa复选框。计算Kappa值。 如果选择Risk复选框,则计算OR值(比数比)和RR值(相对危险度)。 病例对照研究(casecontrolstudy)是主要用于探索病因的一种流行病学方法。它是以某人群内一组患有某种病的人(称为病例)和同一人群内未患这种病但在与患病有关的某些已知因素方面和病例组相似的人(称为对照)作为研究对象;调查他们过去对某个或某些可疑病因(即研究因子)的暴露有无和(或)暴露程度(剂量);通过对两组暴露史的比较,推断研究因子作为病因的可能性:如果病例组有暴露史者或严重暴露者的比例在统计学上显着高于对照组,则可认为这种暴露与患病存在统计学联系,有可能是因果联系。究竟是否是因果联系,须根据一些标准再加以衡量判断。 所谓联系(associatiom)是指两个或更多个变量间的一种依赖关系,可以是因果关系,也可以不是。 例如,对一组肺癌病人(病例组)和一组未患肺癌但有可比性的人(对照组)调查他们的吸烟(暴露)历史(可包括现在吸烟否,过去吸过烟否,开始吸烟年龄,吸烟年数,最近每天吸烟支数;如已戒烟则为戒烟前每日吸烟支数,已戒烟年数,等等)。其目的为通过比较两组吸烟史的差别,检验吸烟(可疑病因)与疾病(肺癌)有因果联系的假设。这就是病例对照研究。 如果选择Cochran'sandMantel-Haenszelstatistics复选框,则可以为两个二分类变量进行独立性检验和同质性(齐性)检验,同时可进行分层因素的调整。包括:χ2MH统计量(分层卡

Q:如何在SPSS中实现四格表的卡方检验

Q:如何在SPSS中实现四格表的卡方检验? A:在多数统计软件中,四格表(和行*列表)的数据格式均为行变量、列变量和频数变量。如下面这个四格表的数据及相应格式如下: 分析时首先选择菜单Data->Weight Cases,将频数变量选入Frequency格中,按OK确认。此时系统就会以频数表的形式来读取所输入的数据,既记录数应为34+12+23+26=95例,而不是4例。然后选择菜单Analyze->Descriptive Statistics->Cross Tables,将行、列变量分别选入相应的Row、Column格中,再按下方的Statistics钮,选中左上角的Chi-square复选框,按Continue钮,最后按OK即可。 Spss电脑实验-第三节(1) 您要打印的文件是:Spss电脑实验-第三节(1) 打印本文 Spss电脑实验-第三节(1) 作者:佚名转贴自:本站原创点击数:74

第三节不同对象有关指标发生率 (百分比)间的比较 Ⅰ.两种对象率(百分比)间的比较—四格表χ2 检验 χ 2 检验(chi-square test),χ为希腊文字母,读作 [kai](卡); chi-square读作“卡方”;χ2 检验即“卡方检验”。它是一种用途较广的假设检验方法,是分析计率或百分 比及某些等级资料常用的方法,可分析两个或两个以上率(或百分比)差别的显著性。 1. 两个样本率(百分比)比较—一般四格表的χ2检验 四格表的χ2检验用于分析两组或两组以上率(或百分比)差别的显著性。 χ2 = ∑[(∣A - T∣)2 / T ] .....................................(3-1) 式中 A 为四格表各格子中的实际数,T 为理论数。 χ2 =(ad-bc)2 n / [(a+b)(c+d)(a+c)(b+d)] .........................(3-2) 例如: 某医院用两种疗法(drug)治疗慢性肾炎病人,结果(effect)西药 组有效率为 79.7%(63/79);中药组有效率为 87.0(47/54),见表 3-1-a。问中药治疗的有效率是否较高?(引自何清波等 主编,医学统计学及其软件包,2002 年,P.183)。 表3-1-a 两种疗法治疗慢性肾炎病人的结果 治疗用药治疗例数有效例数有效率(%) 西药 79 63 79.7中药 54 47 87.0--------------------------------------------------------------------- -----------合计 133 110 82.7 表 3-1是学术论文或总结报告中的常用形式;而在进行χ2检验时,不能用这 个表的形式,必须列出象表 3-1-b 的表格形式,其中要从“治疗例数合计”中分出“无效例数”,这才是所谓著 名的“四格表”(fourfold table,或2×2表,即 a = 63、b = 16、c = 47、d = 7 这 4 格),而不是表 3-1-a 中的 79、63、54、 47 这 4 格! 表3-1-b 两种疗法治疗慢性肾炎病人的结果 治疗结果(effect)治疗用药 ---------------------------------(drug)有效例数 (1) 无效 例数 (2) 治疗例数合计有效率(%) 西药 (1) 63 (a) 16 (b) 79 (a+b) 79.7中药 (2) 47 (c) 7 (d) 54 (c+d)

习题卡方检验图文稿

习题卡方检验 集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)

计数资料统计分析————习题 1.220.05,n x x ≥ 则( ) A.P ≥0.05 B.P ≤0.05 C.P <0.05 D.P =0.05 E.P >0.05 2.2x 检验中,自由度v 的计算为( ) A.行×列(R ×C ) B.样本含量n C.n-1 D.(R -1)(C -1) E.n 2.四格表卡方检验中,2x <20.05(1)x ,可认为? A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时,最常用的显着性检验方法是( ) A.t 检验法 B.正态检验法 C.秩和检验法 D.2x 检验法 E.方差分析 4.在卡方界值(2x )表中,当自由度一定时,2x 值愈大,P 值( ) A.不变 B.愈大 C.愈小 D.与2x 值相等 E.与2x 值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x 检验结果,甲论文 2x >20.01(1)x ,乙论文2x >20.05(1)x 。若甲乙两论文的样本量相同,则可认为( ) A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R ×C 表的专用公式是( ) A. 22 ()()()()()ad bc n x a b a c b d c d -=++++

B. B. 2 2 () b c x b c - = + C. 2 21 R C A x n n n ??=- ? ?? ∑ D. ()2 2 0.5 b c x b c -- = + E. 2 2 () A T x T -=∑ 7.关于行×列表2x检验,正确的应用必须是() A.不宜有格子中的实际数小于5 B.不宜有格子中的理论数小于5 C.不宜有格子中的理论数小于5 或小于1 D.不宜有1/5 以上的格子中的理论数小于5 或有一个格子中的理论数小于l E.不宜有1/5 以上的格子中的实际教小于5 或有一个格子中的实际数小于1 8.R×C 表的2x检验中,P<0.05 说明() A.被比较的n 个样本率之间的差异有显着性 B.样本率间差别没有显着性 C.任何两个率之间差别均有显着性 D.至少某两个样本率是差别有显着性 E.只有两个样本率间差别有显着性 9.四个样本率作比较, 22 0.01,(3) χχ >,可认为() A.各总体率不等或不全相等 B.各总体率均不相等 C.各样本率均不相等

卡方检验习题

2 χ检验 练习题 一、最佳选择题 1.四格表的周边合计不变时,如果实际频数有变化,则理论频数()。 A.增大B.减小C.不变 D.不确定E.随a格子实际频数增减而增减 2.有97份血液标本,将每份标本一分为二,分别用血凝试验法和ELISA法对轮状病毒进行诊断,诊断符合情况见下表,欲比较何种诊断方法的诊断符合率较高,用()统计方法? 两种诊断方法的诊断结果 血凝试验法 ELISA法 合计符合不符合 符合74 8 82 不符合14 1 15 合计88 9 97 A.连续性校正2 χ检验B.非连续性校正2 χ检验C.确切概率法D.配对2 χ检验(McNemar检验)E.拟合优度2 χ检验 3.做5个样本率的χ2检验,每组样本量均为50,其自由度为()。 A 249 B 246 C 1 D 4 E 9 4.对四格表资料做2 χ检验时,如果将四格表的行与列对调,则对调前后的()。 A.校正2 χ值不等B.非校正2 χ值不等 C.确切概率检验的P值不等D.非校正2 χ值相等 E.非校正2 χ值可能相等,也可能不等 二、问答题

1.简述2 χ检验的基本思想。 2.四格表2 χ检验有哪两种类型?各自在运用上有何注意事项? 3.什么情况下使用Fisher确切概率检验两个率的差别? 4.在回顾性研究和前瞻性研究的四格表中,各自如何定义优势比? 三、计算题 1.前列腺癌患者121名中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症者1人。试分析两种手术的合并症发生率有无差异? 2.苏格兰西南部两个地区献血人员的血型记录见下表,问两地的血型分布是否相同? 两地献血人员的血型分布 地区 血型 合计A B O AB Eskdale 33 6 56 5 100 Annandale 54 14 52 5 125 合计87 20 108 10 225 3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见下表,问4种镇痛方法的效果有无差异? 4种镇痛方法的效果比较 镇痛方法例数有效率(%) 颈麻100 41 注药100 94 置栓100 89 对照100 27

Fisher确切概率法

第三节四格表资料的Fisher确切概率法 前面提及,当四格表资料中出现久,或,或用公式(8-1)与公式(8-4) 计算出工值后所得的概率巴:::二时,需改用四格表资料的Fisher确切概率 (Fisher probabilities in 2 x 2 table)。该法是由R.A.Fisher(1934 年)提出的,其理论依据是超几何分布(hypergeometric distributen) ,并非工检验的范畴 但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章< 下面以例8-1介绍其基本思想与检验步骤。 例8-1某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。问两组新生 儿的HBV总体感染率有无差别? 表8-3 两组新生儿HBV感染率的比较 组别阳性阴性合计感染率(%) 预防注射组 4 18 22 18.18 非预防组 5 6 11 45.45 合计9 24 33 27.27 、基本思想 在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率厂;再按检验假设用单侧或双侧的累计概率匸,依据所取的检验水准- 做出推断。 1 ?各组合概率厂的计算在四格表周边合计数不变的条件下,表内4个实际频数

变动的组合数共有“周边合计中最小数+1 ”个。如例7-4,表内4个 实际频数变动的组合数共有卢-1-个,依次为: (1) (2) (3) (4) (5) 0 22 1 21 2 20 3 19 4 18 9 2 8 3 7 4 6 5 5 6 ad-bc = -198 ad-bc = -165 ad-bc =:-132 ad-bc =-99 ad-bc = -66 ⑹(7) (8) (9) (10) 5 17 6 16 7 15 8 14 9 13 4 7 3 8 2 9 1 10 0 11 ad-bc = -33 ad-bc =0 ad-bc =33 ad-bc =66 ad-bc = 99 各组合的概率'服从超几何分布,其和为1。可按公式(8-9)计算 仗+b)!0 十+ 厂dblcld M 式中;等符号的意义同表7-1 ;!为阶乘符号。 2 ?累计概率产的计算单、双侧检验不同设现有样本四格表中的交叉积差-二",其概率为丄?,其余情况下的组合四格表的交叉积差记为 ",概率记为匚。 (1)单侧检验若现有样本四格表中-■,须计算满足i 一乙和厂’条件的各种组合下四格表的累计概率。若\则计算满足二空和:' 厂条件的各种组合下四格表的累计概率。 (2)双侧检验计算满足I卜丁丨和:' 条件的各种组合下四格表的累计概

Fisher确切概率法

第三节四格表资料的Fisher确切概率 法 前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4) 计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。该法是由,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴。但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章。 下面以例8-1介绍其基本思想与检验步骤。 例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。问两组新生儿的HBV总体感染率有无差别? 表8-3两组新生儿HBV感染率的比较 组别阳性阴性合计感染率(%) 预防注射组 4 18 22 18.18 非预防组 5 6 11 45.45 合计9 24 33 27.27 一、基本思想 在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准 做出推断。 1.各组合概率的计算在四格表周边合计数不变的条件下,表内4个实际频数, ,,变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有个,依次为: (1) (2) (3) (4) (5) 0 22 1 21 2 20 3 19 4 18 9 2 8 3 7 4 6 5 5 6

ad-bc= -198ad-bc= -165ad-bc= -132ad-bc =-99ad-bc= -66 (6) (7) (8) (9) (10) 5 17 6 16 7 15 8 14 9 13 4 7 3 8 2 9 1 10 0 11 ad-bc= -33ad-bc=0ad-bc=33ad-bc=66ad-bc= 99 各组合的概率服从超几何分布,其和为1。可按公式(8-9)计算 (8-9) 式中,,,,等符号的意义同表7-1;!为阶乘符号。 2.累计概率的计算单、双侧检验不同。 设现有样本四格表中的交叉积差,其概率为,其余情况下的组合四格表的交叉积差记为,概率记为。 (1)单侧检验若现有样本四格表中,须计算满足和条件 的各种组合下四格表的累计概率。若,则计算满足和条件的各种组合下四格表的累计概率。 (2)双侧检验计算满足和条件的各种组合下四格表的累计概率。若遇到或时,四格表内各种组合的序列呈对称分布,此时按单侧检验规定条件只计算单侧累计概率,然后乘以2即得双侧累计概率。 二、检验步骤 本例,宜用四格表资料的Fisher确切概率法直接计算累计概率。检验步骤为: (1):,即两组新生儿HBV的总体感染率相等

Excel用于Fisher确切概率法(一)

Excel用于Fisher确切概率法(一) 【摘要】给出用Excel电子表格计算确切概率的方法。 【关键词】Excel电子表格;确切概率法;实际频数与理论频数 在医药试验中常常进行病例对照研究,用以检验对照组和处理组之间是否有显著性异,这类问题的原始数据如果属于计数资料,可以将资料整理成如下四格表。 表1四格表 组别具有某种特征不具有某种特征合计对照组aba+b处理组cdc+d合计a+cb+da+b+c+d 在统计处理上,根据样本容量n(n=a+b+c+d)的大小选取统计方法3]:①当样本容量n>40,且理论频数T>5时,用χ2检验;②当n>40,但1 1Fisher确切概率法 其检验步骤如下3]: ①先计算四格表的实际频数T0=|ad-bc|/n; ②保持表1的第4行和第4列的合计值不变,让四格表中的数据发生变化,得到一系列四格表; ③按T0的公式计算每个四格表的实际频数与理论频数之差的绝对值作为Ti; ④计算Ti≥T0对应的四格表发生的概率: Pi=(a+b)!(a+c)!(d+b)!/ai!bi!ci!di!n! ⑤令

⑥由P的大小做出推断。 2Excel电子表格用于确切概率法的操作 下面用具体的实例介绍其操作步 例1在某牧区观察慢性布鲁氏病患者植物血凝素(PHA)皮肤试验反应,资料如下表2,问活动型与稳定型患者PHA反映阳性率有无差异1]?表2两型慢性布鲁氏病的PHA皮试反应 病人分型阳性数阴性数合计活动型11415稳定型3710合计42125 ①打开Excel新建一个电子表格。 ②计算T0 在A1中输入T0=,在B1中输入=ABS(1*7-3*14)/25,回车。B1中显示结果为1.4,这里ABS表示绝对值。

配对卡方检验及Kappa检验(一致性检验)教学提纲

配对卡方检验及 K a p p a检验(一致性检 验)

精品文档 一、配对卡方检验 把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时要用配对卡方检验。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择McNemanr复选框,进行McNemanr检验。即配对卡方检验,只能针对方形表格进行。不能给出卡方值,只能给出P值。 二、一致性检验(Kappa检验) 诊断试验的一致性检验经常用在下列两种情况中:一种是评价待评价的诊断实验方法与金标准的一致性;另一种是评价两种化验方法对同一个样本(化验对象)的化验结果的一致性或两个医务工作者对同一组病人的诊断结论的一致性或同一医务工作者对同一组病人前后进行两次观察作出的诊断的一致性等等。 Kappa值即内部一致性系数(inter-rater,coefficient of internal consistency),是作为评价判断的一致性程度的重要指标。取值在0~1之间。Kappa≥0.75两者一致性较好;0.75>Kappa≥0.4两者一致性一般;Kappa<0.4两者一致性较差。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择Kappa复选框。计算Kappa值。 如果选择Risk复选框,则计算OR值(比数比)和RR值(相对危险度)。 病例对照研究(case control study)是主要用于探索病因的一种流行病学方法。它是以某人群内一组患有某种病的人(称为病例)和同一人群内未患这种病但在与患病有关的某些已知因素方面和病例组相似的人(称为对照)作为研究对象;调查他们过去对某个或某些可疑病因(即研究因子)的暴露有无和(或)暴露程度(剂量);通过对两组暴露史的比较,推断研究因子作为病因的可能性:如果病例组有暴露史者或严重暴露者的比例在统计学上显著高于对照组,则可认为这种暴露与患病存在统计学联系,有可能是因果联系。究竟是否是因果联系,须根据一些标准再加以衡量判断。 所谓联系(associatiom)是指两个或更多个变量间的一种依赖关系,可以是因果关系,也可以不是。 例如,对一组肺癌病人(病例组)和一组未患肺癌但有可比性的人(对照组)调查他们的吸烟(暴露)历史(可包括现在吸烟否,过去吸过烟否,开始 收集于网络,如有侵权请联系管理员删除

统计软件配对卡方检验教程

统计软件配对卡方检验 教程 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

1.配对四格表的卡方检验 (1) 当b+c≥40 c b c b +-=2 2 )(χ 1=υ (2) 当b+c<40 c b c b +--= 2 2 )1(χ 1=υ 例.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等 表5 两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 + - 合计 + 11 1 12 - 9 7 16 合计 20 8 28 例6.某医院用三种方案治疗急性无黄疸型病毒性肝炎结果如下,问三种疗法的有效率是否一致 表6 三种方案治疗肝炎疗效的结果比较 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 中药组 35 45 80 中西结合 59 15 74 145 109 254 卡方分割:(а必须校正,然后P 值和α’进行比较) 多个实验组间的两两比较:1 2'+= k C α α 实验组与同一个对照组比较:() 12'-= k α α 1 输入值

2. 权重 3.计算卡方值 4.结果 .的那一列就是P值:表示三者间不全相同 5.卡方分割 输入条件 选择相应的组别计算相应的卡方值 例7. 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联 表7 某地5801人的血型 ABO血型 MN血型 合计M N MN O 431 490 902 1823 A 388 410 800 1598 B 495 587 950 2032 AB 137 179 32 348 合计1451 1666 2684 5801 此题为双向无序,用卡方检验,计算列联系数: 计算步骤相同 唯一不同之处:多选两项(contigency coefficient为列联系数) 结果 结果解释:卡方值显示两者间有联系,Linear-by- Linear Association 中P<,所以数据符合线性;论文统计时还需要计算偏离线性回归分量=即可,相应的自由度为6-1=5,算出的P值越大越说明符合线性。 例8. 某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将278例尸解资料整理成表7-13,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势 表8 年龄与冠状动脉硬化的关系 年龄(岁) 冠状动脉硬化等级(Y) 合计

卡方检验习题

2检验 练习题 一、最佳选择题 1.四格表的周边合计不变时,如果实际频数有变化,则理论频数()。 A.增大B.减小C.不变 D.不确定E.随a 格子实际频数增减而增减 2.有97 份血液标本,将每份标本一分为二,分别用血凝试验法和ELISA 法对轮状病毒进行诊断,诊断符合情况见下表,欲比较何种诊断方法的诊断符合率较高,用()统计方法? 两种诊断方法的诊断结果 血凝试验法 ELISA 法 合计符合不符合 符合74882 不符合14115 合计88997 A.连续性校正2检验B.非连续性校正2检验 C .确切概率法 D .配对2检验(McNemar 检验) E .拟合优度2检验 3.做5 个样本率的2检验,每组样本量均为50,其自由度为()。 A 249 B 246 C 1 D 4 E 9 4.对四格表资料做2检验时,如果将四格表的行与列对调,则对调前后的()。 A.校正2值不等B.非校正2值不等 C.确切概率检验的P 值不等D.非校正2值相等 E.非校正2值可能相等,也可能不等 二、问答题 1.简述2检验的基本思想。

2.四格表2检验有哪两种类型?各自在运用上有何注意事项? 3.什么情况下使用Fisher 确切概率检验两个率的差别? 4.在回顾性研究和前瞻性研究的四格表中,各自如何定义优势比? 三、计算题 1.前列腺癌患者121 名中,82 名接受电切术治疗,术后有合并症者11 人;39 名接受开放手术治疗,术后有合并症者 1 人。试分析两种手术的合并症发生率有无差异? 2 .苏格兰西南部两个地区献血人员的血型记录见下表,问两地的血型分布是否相同? 地区 血型 合计A B O AB Eskdale336565100 Annandale5414525125 合计872010810225 3. 某医院以400 例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4 组,每组 100 例,分别给予不同的镇痛处理,观察的镇痛效果见下表,问4 种镇痛方法的效果有无差异? 4 种镇痛方法的效果比较 镇痛方法例数有效率(%) 颈麻10041 注药10094 置栓10089 对照10027

统计学教案习题08卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容 频数分布拟合优度的2χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想 1.2χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H : 21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的 检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。四格 表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算 表8-1 2检验的用途、假设的设立及基本计算公式 01四格表 ①独立资料两 样本率的比较 ②配对资料两 样本率的比较 0H :两总体率相等 1H :两总体率不等 ①专用公式 )(22 n bc ad -= χ

5习题-卡方检验

计数资料统计分析————习题 1. 22 0.05,n x x ≥ 则() A.P≥0.05 B.P≤0.05 C.P<0.05 D.P=0.05 E.P>0.05 2.2x检验中,自由度v的计算为( ) A.行×列(R×C) B.样本含量n C.n-1 D.(R-1)(C-1) E.n 2.四格表卡方检验中,2x< 2 0.05(1) x ,可认为 A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时,最常用的显著性检验方法是() A.t 检验法 B.正态检验法 C.秩和检验法 D.2x检验法 E.方差分析 4.在卡方界值(2x)表中,当自由度一定时,2x值愈大,P 值() A.不变 B.愈大 C.愈小 D.与2x值相等 E.与2x值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x检验结果,甲论文 2x > 2 0.01(1) x ,乙论文 2x> 2 0.05(1) x 。若甲乙两论文的样本量相同,则可认为() A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R×C 表的专用公式是() A. 2 2 () ()()()() ad bc n x a b a c b d c d - = ++++ B. B. 2 2 () b c x b c - = + C. 2 21 R C A x n n n ??=- ? ?? ∑ D. ()2 2 0.5 b c x b c -- = + E. 2 2 () A T x T -=∑

Fisher确切概率法

第三节四格表资料的Fisher确切概率法前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4) 计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。该法是由R.A.Fisher(1934年)提出的,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴。但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章。下面以例8-1介绍其基本思想与检验步骤。 例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。问两组新生儿的HBV总体感染率有无差别? 表8-3两组新生儿HBV感染率的比较 组别阳性阴性合计感染率(%) 预防注射组 4 18 22 18.18 非预防组 5 6 11 45.45 合计9 24 33 27.27 一、基本思想

在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断。 1.各组合概率的计算在四格表周边合计数不变的条件下,表内4个实际频数,,,变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有个,依次为: (1) (2) (3) (4) (5) 0 22 1 21 2 20 3 19 4 18 9 2 8 3 7 4 6 5 5 6 ad-bc= -198ad-bc= -165ad-bc= -132ad-bc =-99ad-bc= -66 (6) (7) (8) (9) (10) 5 17 6 16 7 15 8 14 9 13 4 7 3 8 2 9 1 10 0 11 ad-bc= -33ad-bc=0ad-bc=33ad-bc=66ad-bc= 99 各组合的概率服从超几何分布,其和为1。可按公式(8-9)计算 (8-9) 式中,,,,等符号的意义同表7-1;!为阶乘符号。 2.累计概率的计算单、双侧检验不同。

相关文档
最新文档