医学统计学6卡方检验资料讲解
医学统计学卡方检验讲课稿

第一页PPT:同学们好,我们今天来一起学习卡方检验的基本思想。
第二页PPT:我们看一个研究案例,某神经内科医师欲比较A、B两种药物治疗脑血栓病人的疗效,将病情轻重、病程相近且满足实验人选标准的200例脑血管栓塞患者随机分为两组,结果见表1。
问两药治疗近期有效率是否有差别?请同学们思考一个问题,结合已学的知识关于两个率的比较我们会使用什么方法呢,那我们继续带着这个问题进入到我们今天的课程学习。
第三页PPT:这节课需要掌握的理论知识有:1.X2检验的定义、主要用途2.X2分布、X2检验的基本思想(这是重点内容)以及应用完全随机设计的四格表X2检验方法是我们这节课的难点内容。
第四页PPT:离散型概率分布有二项分布和泊松分布基于二项分布的假设检验方法可以做两样本率比较的检验问题,条件是np、n(1-p)均大于5,可以做Z检验进行,也是解决我们的案例问题。
第五页PPT:在医学研究中,进行两组或多组样本的总体率(或构成比)之间的差别是否具有统计学意义,X2检验(chi-square test)是解决此类问题较为常用的统计方法,。
X2检验是英国统计学家K.Pearson提出的一种具有广泛用途的假设检验方法,常用于分类变量资料的统计推断。
第六页PPT:X2检验主要用于:1.推断两个及多个总体率或总体构成比之间有无差别2.两种属性或两个变量之间有无关联性3.频数分布的拟合优度检验4.百分率线性趋势检验第七页PPT:我们来继续看我们的案例,两药有效率的比较问题。
表中我们A 药、B药的有效和无效分别为99、5、75、21,我们可以用a.b.c.d 来表示,表中其余的数据是由abcd这4个数据推算出来,我们习惯将这种资料形式称为四格表。
为什么叫四个表因为它有效的就是四个格子。
a.b.c.d是我们实际观察所得到的频数,我们叫实际频数(actual frequency),用A表示。
根据我们的研究目的,我们要比较两个率是否有差别的问题。
卡方检验医学统计学

卡方检验医学统计学卡方检验是医学统计学中最常用的检验方法之一,它可用于测量两组数据之间的关联性。
在研究中,我们常常需要探究二者之间是否存在某种关联,卡方检验就是我们解决这个问题的利器。
卡方检验的原理卡方检验的原理是基于期望频数和实际频数的差异来检验两个变量之间的关系。
期望频数指的是在假设两个变量独立的情况下,我们可以根据样本量和其他条件,计算出不同组之间的理论值。
而实际频数则是实验中观察到的实际结果。
卡方检验的步骤如下:1.建立零假设和备择假设。
零假设指的是假设两个变量之间不存在任何关系,备择假设则是反之。
2.确定显著性水平 alpha,通常取值为0.05。
3.构建卡方检验统计量。
计算方法为将所有观察值与期望值的差平方后,再除以期望值的总和。
4.根据自由度和显著性水平,查卡方分布表得到 P 值。
5.如果 P 值小于显著性水平,拒绝零假设;否则无法拒绝零假设。
卡方检验的应用卡方检验可以应用于多个领域,其中医学统计学是最为常见的一个。
卡方检验可以用来分析两个疾病之间的相关性或者测量一种治疗方法的效果。
举个例子,某药厂要研发一种新的药物来治疗心脏病。
为了验证该药的疗效,实验组和对照组各50 人。
在 6 个月的治疗后,实验组和对照组中分别有 10 人和 15 人痊愈了。
卡方检验的作用就在于此时可以用来检验两组之间的差异是否具有统计学意义。
除了医学统计学之外,卡方检验在社会学、心理学、市场营销、物理等领域也都有广泛应用。
卡方检验的限制虽然卡方检验被广泛应用于各种实验和研究中,但它也有着自己的限制。
其中比较明显的一点就是对样本量有一定的要求。
当样本量较小的时候,期望频数的计算就会出现一定的误差,进而导致检验结果不准确。
此外,在面对非常态分布数据时,卡方检验也会出现问题。
当数据呈现正态分布时,卡方检验的准确性最高。
然而,实际上,很多数据都呈现出非正态分布,这时需要使用一些修正方法来解决。
卡方检验是医学统计学中最常用的统计方法之一,它可以用来测量两个变量之间的关联性。
医学统计学6卡方检验

卡方检验的卡方值
卡方值是卡方检验的统计量,用于衡量实际观测值和期望值之间的差异。 卡方值越大,就表示观测值与期望值之间的差异越大,这意味着结论更可信。
如何进行卡方检验
第一步
确定研究的问题和相关变量, 并给出所需的假设。
第二步
收集数据并整理成交叉列联 表。
第三步
计算卡方值和自由度。
第四步
查阅卡方分布表,确定相应置信度水准下的临 界值。
2
应用
概率常用于医学研究中,以测量一种治疗对患者的疗效。
3
公式
概率=事件发生的次数/总次数。
统计学中的假设
在统计学中,我们需要制定一个或多个假设进而做出相应的决策。常见的假设有零假设和备择假设。
零假设
零假设是指不存在两个群体之间的差异。
备择假设
备择假设是指存在两个群体之间的差异。
什么是卡方检验
卡方检验是一种用于比较两个或多个群体在某些因素上的分布情况的方法。
卡方检验与其他假设检验的区 别
卡方检验主要用于回答多个分类变量间是否有关联的问题,而 T 检验和 Z 检 验主要用于回答单变量的问题。
卡方检验对于数据的类型并无太多的要求,而 T 检验和 Z 检验只适用于概率 分布为正态分布的数据。
卡方检验的计算公式
卡方检验的计算公式如下: χ² = ∑(O-E)²/E
为什么需要统计学
准确
统计学可以让我们从收集到的数据中得出真正 准确可靠的结论。
决策
统计学有助于做出决策并帮助我们更好地理解 数据背后的信息。
推断
统计学允许我们通过对大量数据的推断得到新 的信息。
掌握
掌握医学统计学对于实现优质医保研究至关重 要。
概率
医学统计学课件-卡方检验

联合治疗 39 34.44 8 12.56 47 73.3 单纯治疗 57 61.56 27 22.44 84 73.3
合计
96
35
131 73.3
Trc
nr nc n
理论频数= 84 73.3%
χ2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反 映两样本率的差别!
实际数A
39
8
57
27
污染率 (%)
甲
6
23
29
79.3
乙
30
14
44
31.8
丙
8
3
11
27.3
合计
44
40
84
47.6
理论数的计算
实际数A
6
23
29
30
14
44
8
3
11
44
40
84
(52.4%) (47.6%)
理论数T
15.2 13.8
23.0 21.0
5.8
5.2
T
nR
nC N
nR nC N
2值的计算
实际数A
χ2检验相关问题-应用条件
某矿石粉厂当生产一种矿石粉石时,在数天内即有 部分工人患职业性皮肤炎,在生产季节开始,随机 抽取15名车间工人穿上新防护服,其余仍穿原用的 防护服,生产进行一个月后,检查两组工人的皮肤 炎患病率,结果如表 ,问两组工人的皮肤炎患病 率有无差别?
χ2检验相关问题-应用条件
Total
When the variables are independent, the proportion in
both groups is close to the same size as the proportion
卫生统计学卡方检验

卫生统计学卡方检验
26/94
(一) 多个样本率比较
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度 高血压疗效,将年纪在50~70岁240例轻、中度高血压患 者随机等分为3组,分别采取三种方案治疗。一个疗程 后观察疗效,结果见表11.4。问三种方案治疗轻、中度 高血压有效率有没有差异?
卫生统计学卡方检验
卫生统计学卡方检验
29/94
④ 确定P值
υ=(3-1)(2-1)=2,查 2 界值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05水准,拒绝H0,接收 H1,差异有统计学意义。即可认为三种方案治疗轻 、
中度高血压有效率不等或不全等
卫生统计学卡方检验
30/94
例 某市重污染区、普通污染区和农村出生婴儿致畸情 况以下表,问三个地域出生婴儿致畸率有没有差异?
① 建立假设 H0:π1=π2 H1:π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2 值
2(2 62-73 6-7 1/2 )27 12 .7 5 3 33 86 29
④ 确定P值
υ=(2-1) (2-1)=1,查 2界值表得P>0.05。
卫生统计学卡方检验
24/94
⑤ 下结论 因为P>0.05,按α=0.05水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良治愈率不等。
9/94
TRC
nR nC n
n R 为对应行累计
n C 为对应列累计
n 为总例数。
卫生统计学卡方检验
10/94
表1 两药治疗消化道溃疡4周后疗效
卫生统计学卡方检验
11/94
医学统计学:卡方检验

CM C N M P( x ) n CN
式中X的取值是从0与(n-N+M)之较大者开始直到n与M之较小者为止。
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 超几何分布
x n x CM CN M P( x ) n CN
C
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。 例 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组) 降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表1 。问两组降低颅内压的总体有效率有无差别?
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 Fisher确切概率法的基本思想
在四格表周边合计数不变的条件下, 利用超几何分布直接计算样本事件及 比样本事件更极端情形发生的概率。
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 Fisher确切概率法的基本思想
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。
医学统计学6卡方检验资料讲解

【例5】某中医师将某病患者随机分为三组,分别用新 药、传统药物和安慰剂治疗,结果见表。问三种方法治 疗该病的有效率是否有差别?
A
nR
nC
SPSS软件操作
• 第1步:定义变量
• 第2步:输 入原始数据
• 第3步:定义频数
• 选择数据→加权个案 • 频数→加权个案(频
数变量)
• 第4步:x2检验(1)
• 第4步:x2检验(3)
• 选择单元 格按钮
• 在交叉表: 单元显示 对话框: 勾上观察 值、百分 比:行、 列
• 第5步:结果解读(1)
• 结果解读:行与列均为无序变量,行、列百 分比均有各自专业意义。
• 第5步:结果解读(2) • 结果解读:x2=64.059,p=0.000
• 第5步:结果解读(3)
行×列表卡方检验注意事项
• 当多个样本率(或构成比)作卡方检验, 结论为拒绝零假设时,只能认为各总体率 (或总体构成比)之间总的有差别,不能 说明两两之间有差别;两组间的比较需进 一步做多个样本率或构成比的两两比较, 即多重比较。
行×列表卡方检验注意事项
• R×C表可以分为双向无序 、单向有序、双向有序属 性相同和双向有序属性不 同等4类。
卡方值的计算
➢卡方值的影响因素: • 1、格子数 • 2、实测值与理论值的差距
专用公式的推导
T11=(a+c)/(a+b+c+d)*(a+b) T12=(b+d)/(a+b+c+d)*(a+b) T21=(a+c)/(a+b+c+d)*(c+d) T22=(b+d)/(a+b+c+d)*(c+d)
医学统计学——卡方检验

• ⑵χ2分布具有可加性:如果两个独立的 随机变量X1和X2分别服从ν1和ν2的χ2分 布,那么它们的和(X1+X2)也服从(ν1+ ν2)的χ2分布。
χ2 界值
• ν确定后,如果分布曲线下右侧尾部的 面积为α时,则横轴上相应的χ2值就记 作χ2 α,ν ,即χ2界值。其右侧部分的 面积α表示:自由度为ν时, χ2值大 于界值的概率大小。χ2值与P值的对应 关系见χ2界值表(附表6)。χ2值愈大,P 值愈小;反之,χ2值愈小,P值愈大。
• T22=(c+d)×(1- PC)=(c+d)×(b+d)/n = 56×17/112=8.5
χ2检验的基本思想
• χ2检验实质上是检验A的分布与T的分 布是否吻合及吻合的程度,χ2越小,表
明实际观察次数与理论次数越接近。
• 若检验假设成立,则A与T之差不会很 大,出现大的χ2值的概率P是很小的, 若P≤α,就怀疑假设成立,因而拒绝 它;若P>α,则没有理由拒绝它。
不同自由度的χ2分布曲线图
图 8-1 不同自由度的χ2 分布曲线图
二、χ2检验的基本思想
• 例8-1 某中医院将112例急性肾炎 病人随机分为两组,分别用西药和 中西药结合方法治疗,结果见表8-1, 问两种方法的疗效有无差别?
表8-1 两种方法治疗急性肾炎的结果
组 别 治愈例数 未愈例数 合计 治愈率(%)
例8-2
• 某医师将门诊的偏头痛病人随机 分为两组,分别采用针灸和药物 两种方法治疗,结果见表8-3 , 问两种疗法的有效率有无差别?
两种疗法对偏头痛的治疗结果
疗 法 有效例数 无效例数 合计 有效率(%)
针 灸 33(30.15) 2(4.85) 35 94.29
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
行×列表卡方检验注意事项
• 当多个样本率(或构成比)作卡方检验, 结论为拒绝零假设时,只能认为各总体率 (或总体构成比)之间总的有差别,不能 说明两两之间有差别;两组间的比较需进 一步做多个样本率或构成比的两两比较, 即多重比较。
行×列表卡方检验注意事项
• R×C表可以分为双向无序 、单向有序、双向有序属 性相同和双向有序属性不 同等4类。
• 第5步:结果解读(1)
• 结果解读:甲药组的有效率为92.9%,乙药 组的有效率为64.3%。
• 第5步:结果解读(2)
• 结果解读:有2个格子的期望值小于5,不符 合卡方检验的条件。
• 第5步:结果解读(3)
• 结果解读:四格表中有期望值小于5,选连 续校正的卡方。x2=3.621,p=0.057?
医学统计学 (6)
《中华医学杂志》对来稿统计学处理的有关要求
卡方检验(chi-square test)
• χ2检验是现代统计学的创始人之一,英国人 Karl . Pearson于1900年提出的一种具有广 泛用途的统计方法。
• 可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
2、卡方值的校正值 3、似然比卡方,一 般用于对数线性模 型。 4、fisher的精确检 验 5、线性趋势检验
➢输出2种相关 系数: 1、pearson相关系
数 2、spearman相关系 数
➢列联系数:分 析行与列之间的 关联程度
➢Kappa:一 致性检验
➢风险:计算 相对危险度( RR)和比数比 (OR)。 ➢McNemar: 优势性检验。
• 第4步:x2检验(3)
• 选择单元 格按钮
• 在交叉表: 单元显示 对话框: 勾上观察 值、百分 比:行、 列
• 第5步:结果解读(1)
• 结果解读:行与列均为无序变量,行、列百 分比均有各自专业意义。
• 第5步:结果解读(2) • 结果解读:x2=64.059,p=0.000
• 第5步:结果解读(3)
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数
• 选择数据→加权个案 • 例数→加权个案(频
数变量)
• 第4步:x2检验
• 选择分析→非参数检验→ 卡方
• 中医证型→检验变量列表
• 第5步:结果解读
• 结果解读: x2=392.514, p=0.000,说明 原发性高血压患 者中医证型内部 构成不相同。
• 通常情况下只有双向无序 的资料(例如多个样本率 的比较、多个样本构成比 的比较)可以使用R×C列 联表卡方检验。
• 右上表格使用卡方检验分 析不同疗法间疗效是否有 别,右下表格分析不同的 血型分类结果是否有关联 (不同的血型分类是否相 互独立);它们都属于双 向无序的列联表,都可使 用卡方检验分析
卡方值的计算
➢卡方值的影响因素: • 1、格子数 • 2、实测值与理论值的差距
专用公式的推导
T11=(a+c)/(a+b+c+d)*(a+b) T12=(b+d)/(a+b+c+d)*(a+b) T21=(a+c)/(a+b+c+d)*(c+d) T22=(b+d)/(a+b+c+d)*(c+d)
• 在中医药科研中,经常遇到同一个样本中 两个或多个构成比比较的问题,在满足卡 方检验的要求条件下,可用卡方检验来分 析实际频数的比率是否符合理论比率。
【例1】为探索高血压患者中医证型构成,调查原发性 高血压患者3578例,中医证型构成见表。问原发性高血 压患者中医证型内部构成是否相同?
A
T
• X2=392.514 • V=5-1=4 • P=1-CDF.CHISQ(392.514,4)=0.000
• 结果解读:新药组的有效率为88.9%,传统药物组 的有效率为86.7%,安慰剂组的有效率为70.9%。
• 第5步:结果解读(2) • 结果解读:x2=13.238,p=0.001
•进一步的两两比较
•P<0.017才有 统计学意义!!
【例6】某中医院用三种治疗方法治疗413例糖尿病患者, 资料见表。为避免中医不同证型对疗效比较的影响,分 析3种疗法治疗的病人按3种中医分型的构成比有无差别?
注意事项
➢进行拟合优度 x2 检验,一般要求有足够的 样本含量,理论频数不小于 5 。
➢理论频数小于 5 时,需要合并计算。
x2检验
• 单个样本构成比的x2检验 • 独立样本四格表的x2检验 • 行×列的x2检验 • 配对设计分类资料的x2检验 • 多维分类资料的x2检验
➢四格表的卡方检验,也是通过计算代表实 际频数A与理论频数T之间的吻合程度的卡 方值来进行检验的。
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数• 选择数据加权个案 • 频数→加权个案(频
数变量)
• 第4步:x2检验(1)
• 选择分析→交叉表
• 交叉表对话框:组别和感染结果分别进入行和列
• 第4步:x2检验(2)
• 选择统计 量按钮
• 在交叉表: 统计量对 话框:勾 上卡方
➢理论频数T采用两组的合并情况来计算。
【例2】某医院把慢性支气管炎患者376名,随机分为2 组,分别用中西医结合法和西医法治疗,结果见表。问 两种疗法治疗慢性支气管炎病人的治愈率是否有差别?
理论值T的计算
345/376(总的治愈率)*276=253.24 276-253.24=22.76 345/376(总的治愈率)*100=91.76 100-91.76=8.24
• 第5步:结果解读(3)
• 结果解读:选Fisher的精确检验p(exact)=0.121
x2检验
• 单个样本构成比的x2检验 • 独立样本四格表的x2检验 • 行×列的x2检验 • 配对设计分类资料的x2检验 • 多维分类资料的x2检验
行×列卡方检验计算公式
• n为总例数;R和C分别为行数和列数; A为第R行、第C列位置上的实际频数; nR为实际频数所在行的行合计;nC为 实际频数所在列的列合计。
• 结果解读:rp=0.473,p=0.000 • 两者有关联,但关联度不高。
行×列表卡方检验注意事项
• 同四格表资料一样,R×C表的卡方分布是 建立在大样本的假定上的,要求总例数不 可过少,不能有1/5以上的格子理论频数小 于5,且不能有一个格子的理论频数小于1 。
• 如果出现上述情况,可以考虑:增大样本 量;根据专业知识合理地合并相邻的组别 ;删除理论数太小的行列 ;改用其它方法 分析,例如确切概率法或似然比卡方检验 。
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数
• 选择数据→加权个案 • 频数→加权个案(频
数变量)
• 第4步:x2检验(1)
• 选择分析→交叉表 • 交叉表对话框:组别和中医分型分别进入行和列
• 第4步:x2检验(2)
• 选择统计 量按钮
• 在交叉表: 统计量对 话框:勾 上卡方
➢CMH多维卡 方检验
• 第4步:x2检验(2)
• 选择统计 量按钮
• 在交叉表: 统计量对 话框:勾 上卡方
• 第4步:x2检验(3)
• 选择单元 格按钮
• 在交叉表: 单元显示 对话框: 勾上观察 值、百分 比:行、 列
• 第5步:结果解读(1)
• 结果解读:中西医组的治愈率为98.2%,西 医组的治愈率为74.0%。
➢行变量和列变量均为无序分类变量。 ➢可分析行、列两变量之间有无关联,关联
的密切程度。 ➢可进行多个样本率或构成比的比较。
关联性分析
➢ 列联系数的意义
• |rp|<0.4,关联程度低 • 0.4≤|rp|<0.7,关联程度中等 • |rp|≥0.7,关联程度高
SPSS软件操作
• 第1步:定义变量
• 第4步:x2检验(3)
• 选择单元 格按钮
• 在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行
• 第5步:结果解读(1)
• 结果解读:预防注射组的感染阳性率为4/22, 非预防组的感染阳性率为5/11。
• 第5步:结果解读(2)
• 结果解读:四格表中有期望值小于5,总例 数小于40。
疗法
物理疗法 药物治疗 外用膏药
合计
疗效
有效
无效
199
7
164
18
118
26
481
【例5】某中医师将某病患者随机分为三组,分别用新 药、传统药物和安慰剂治疗,结果见表。问三种方法治 疗该病的有效率是否有差别?
A
nR
nC
SPSS软件操作
• 第1步:定义变量
• 第2步:输 入原始数据
• 第3步:定义频数
• 选择数据→加权个案 • 频数→加权个案(频
数变量)
• 第4步:x2检验(1)
x2检验
• 单个样本构成比的x2检验——拟合优度检验 • 独立样本四格表的x2检验
• 行×列的x2检验
• 配对设计分类资料的x2检验 • 多维分类资料的x2检验
x2检验
• 单个样本构成比的x2检验——拟合优度检验 • 独立样本四格表的x2检验
• 行×列的x2检验
• 配对设计分类资料的x2检验 • 多维分类资料的x2检验
• 第4步:x2检验(3)
• 选择单元 格按钮
• 在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行
• 第5步:结果解读(1) • 结果解读:各组的中医分型构成比。