计数资料的统计描述及卡方检验

合集下载

计数资料统计分析卡方检验

计数资料统计分析卡方检验

统计量
应用条件:b+c≥40 时 应用条件:b+c<40时
独立样本与配对样本的区别 资料仅供参考,不当之处,请联系改正。
例8.11 有28份咽喉涂抹标本,把每份标本一分为二,分别接种在 甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况。问两种 培养基的阳性检出率是否相等?
配对资料的数据格式
随机资料的数据格式
合计
9
未治愈 2 6 8
合计 9 8 17
治愈率(%) 77.78 25.00 52.94
P=0.057
资料仅供参考,不当之处,请联系改正。
配对资料 2 检验(McNemar检验)
实验设计形式:配对设计 数据类型:定性(计数)资料
例:现有198份痰标本,每份标本资料分仅供别参考,用不当之A处,、请联B系改两正。种培养基培养结核菌
资料仅供参考,不当之处,请联系改正。
四格表 2 检验的确切概率检验法
➢ 例:有17名腰椎间盘脱出资料症仅供参患考,不当者之处,,请联系其改正。中有9人志愿接受一种新 的疗法,治愈率为77.78%,其它8人接受保守疗法,治愈率为
25.00%,问:两种疗法的疗效是否有差别?
疗 法 治愈
新疗法 7
保守疗法 2
资料仅供参考,不当之处,请联系改正。
行x列表 2检验
2检验不仅能用于由两个样本率来推断两个总体率是否 相同,还可以用于检验多个样本率或构成比以推断多个总
体率或构成比是否相同。将2检验用于行×列表资料的 方法又称为行×列表2检验。 行×列表2检验的简化公式为:
2 n(
A2 1)
nRnC
自由度为:v=(行数-1)(列数-1)
资料仅供参考,不当之处,请联系改正。

计数资料的描述和x2检验

计数资料的描述和x2检验

(4)χ2界值
当自由度ν确定后,χ2分布曲线下右侧尾 部的面积为α时,横轴上相应的χ2值即为χ2
界值,表示为 χα2,ν 。
χ2界值可以通过查χ2界值表得到,当自 由度一定时,χ2值越大,P值越小;χ2值越 小,P值越大。
一、四格表资料的χ2检验
1。四格表资料(完全随机设计)
四格表的格式
分组 +
116
130
85
41
29
776
305
人口数
(ni)
241 315 175
农村 预期患病人数
( niPi)
51 145 115
58
42
789
353
④ 计算城乡两地的SMR及标准化患病率
城市SMR:
SMR = 322 = 1.05 305
城市标准化患病率: p ' = 42.1% ×1.05 = 44.2%
③ 求预期治愈人数
表5-5 直接法计算标准化率
标准治
甲疗法
病型 疗人数 原治愈率 预期治愈数
(Ni) (pi) ( Nipi)
普通型 400 60.0
240
乙疗法
原治愈率 预期治愈数
(pi)
65.0
( Nipi)
260
重型 400 35.0
140
41.7
167
合计 800
-
380
-
427
④ 计算甲、乙两种疗法的标准化治愈率
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9

中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2

中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2

(四)注意资料的可比性 用以比较的资料应是同质的,除 了要比较的处理因素外,其它条件应 基本相同。对于不同时期、地区、条 件下的资料应注意是否齐同。
• (五)对比不同时期资料应注意客观 条件是否相同 例如,疾病报告制度完善和资料完整 的地区或年份,发病率可以“升高”; 居民因医疗普及,就诊机会增加,或诊 断技术提高,也会引起发病率“升高” 。因此在分析讨论时,应根据各方面情 形全面考虑,慎重对待。
2 ( A T ) 2 RC RC TRC
=
[b- (b+c)/2]2
+
[c- (b+c)/2]2
(b+c)/2 [(c- b)/2]2 (b+c)/2
(b+c)/2
= [ (b-c)/2]2 +
(b+c)/2
= (b-c)2/2
(b+c)/2
(b c) 2 bc
H0:总体B = C H1:总体B≠C α= 0.05 b + c = 12 + 2 = 14 < 40。
本资料若不校正时,X2=4.35,P<0.05,结 论与之相反。
最小理论频数TRC的判断: R行与C列中,行合计数中的最小 值与列合计数中的最小值所对应
格子的理论频数最小。
如本例,第2行与第2列所对应的格子 理论频数最小(4.67)。
第二节 配对设计的四格表资料的χ2检验
(一)配对四格表形式 B 甲种属性 + 合计 A乙种属性 + 合计 a b a+b c d c+d a+c b+d n=a+b+c+d
无效 b d b+d

计数资料的统计描述与卡方检验

计数资料的统计描述与卡方检验

25
41 45 50 28 31

男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常

++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。

卡方检验

卡方检验
1.png
计数资料:又称为定性资料或无序分类变量资料,也称 名义变量资料,是将观察单位按某种属性或类别分组计 数,分别汇总各组观察单位数后而得到的资料,其变量 值是定性的,表现为互不相容的属性或类别。
计量资料:又称定量资料或数值变量资料,为观测每个 观察单位某项指标的大小而获得的资料。其变量值是定 量的,表现为数值大小,一般有度量衡单位(cm、mmhg、 次/分、单位等)。
2
(2 1)(2 1) 1
3. 确定P值,作出统计推断
查2界值表,得2 0.005,1=7.88, 2 > 2 0.005,1,P <0.005,按 = 0.05水准,拒绝H0 ,接受H1,差 异有统计学意义,可以认为两组的显效率不等
四格表资料2检验的条件
例:为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合 研究标准的110例慢性支气管炎患者随机分为两组(两组具有可比 性),西药组86例,中药组24例。服药一个疗程后,观察患者的 疗效,结果见下表。根据显效率,该医师认为中西药治疗慢性支 气管炎的疗效有差别,中药组的疗效好于西药组
表1 中西药治疗慢性支气管炎的显效率
等级资料:将观察单位按某种属性或某个标志分组,然 后清点各观察单位个数得来。具有等级顺序。(-、+、++、 +++;治愈、好转、无效、死亡)
独立样本:一般情况下,比较两个(类)人之间的差异 就是独立样本。(实验组、控制组)
配对样本:1. 一个人的不同部位进行测试。2.前测后测 的情况属于相关样本(同一人先后测试a、b两种药物)。 3. 两个匹配样本的比较。(测试两人智力,控制语文成 绩相等)
组别 西药组 中药组 合 计 治疗人数 86 24 110 显效人数 35 18 53 显效率(%) 40.70 75.00 48.18

计数资料常用检验方法

计数资料常用检验方法

.219
1
.640
N of Valid Cases
24
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum exp is 2.50.
三组疗法有效率比较
分组 有效数 无效数 合计
在R×C表中,如T<5的格子数超过基本格 子的1/5时,不能直接用R×C表公式。
两组病人某项指标分级构成
组别 I 甲组 72
II III 28 5
IV


2(1.46) 107
乙组 74
32 6
1(1.54) 113
合计 146 60 11 3
220
表中有两个基本格子的理论数小于5
处理的方法 ①增加观察单位数目 ②合并相邻的两列(或两 行) ③去掉某行或某列
计数资料常用检验方法
BIM
当两组样本较大(n>100), 而率又不太小时(比如np或n(1p)均大于5,此时率的分布近似正 态分布),可选择u检验(或X2
检验)见公式
1.计数资料两大样本u检验
u=
p1 − p2
PQ( 1 + 1 )
n1 n2
或 u =
p1 − p2 , u = 1.96, P = 0.05
Value Pearson Chi-Square 4.326b Continuity Correctaio 4.067
Asymp. Sig. Exact Sig. Exact Sig.
df
(2-sided) (2-sided) (1-sided)

计数资料描述和χ2检验

计数资料描述和χ2检验

四、动态数列及其分析指标
动态数列是一系列按时间顺序排列起来的 统计指标(指标可以是绝对数、相对数或平 均数),用以观察和比较该事物在时间上的 变化和发展趋势。
表5-9 某医院1991-2019年日门诊量
年份 1991 1992 1993 1994
日门诊人次 指标符号(ai)
1200
a0
1500
a1
例5-6 经研究表明,女性原发行性骨质疏松随年龄 增长患病率增高。2019年某省在城市和农村分别 抽样调查了50岁以上的老年妇女776例和789例, 这些人中患有原发性骨质疏松症者城市为322例, 农村为335例,总患病率分别为41.5%和42.5%。 由于本次调查的城乡老年妇女的年龄构成不同,请 对总患病率进行标准化,然后比较。
动态数列的分析不仅可以总结过去,而且可以 进行预测,即根据平均发展速度的公式,计算几 年后达到的指标值。
如:预测2019年的日门诊量
根据资料可知2019年的日门诊量为a10,平均 发展速度为:n an a0 1.141
1 0a 1 01 2 0 01 .1 4 1 a 1 04 4 8 8
第二节 χ2检验
计数资料的描述和χ2检验
第一节 计数资料的统计描述
一、常用相对数
相对数:两个有关联的数值之比就称为相对数, 用以说明事物的相对水平。
常用的相对数: 强度相对数(率)、结构相对数(构成比)、相对比
表5-2 已婚育龄妇女不同情况下放环失败率的比较
放环情况 放环人数 失败人数 失败人数比(%) 失败率(%)
二、四格表资料的确切概率法
Fisher确切概率法的理论依据是超几何分布,
三、率的标准化
表5-4 甲乙两种疗法治疗某病的治愈率比较

计数资料常用检验方法

计数资料常用检验方法

计数资料行×列(R ×C)表卡方检验 公式:
X2=35.81> , 差异有显著性,P<0.01,可以认为三组疗效不同,中西药结合组较其他两组高,若要进一步作两两比较,可分成三个四格表再进行比较。
中西药结合组
组别
有效
无效
合计
46
12
02
Pearson列联系数(P)
Cramer(修正)列联系数(C)
演讲人姓名
列联表计数资料的相关分析数据格式 (PEMS软件包)
卡方值 = 74.4015
自由度 v = 4
概率 P = 0.0000
Pearson 列联系数 = 0.2597
各个格子的理论数均大于 5
结果
列联表计数资料的相关分析.一致性检验.Kappa值(PEMS软件包)
66
12
78
0.05,差异无统计学意义,可以认为甲、乙两组有效率相同,如用X2值一般公式计算X2=2.85
(3) 、当总例数n>40,但有理论数0<T<1,或总例数n<40,有实际观察数为0的情况,此时应采用确切概率法直接算出概率P
两种药物治疗结果
组别
治愈
未愈
合计
新药
5(1.82)
、当总例数n>40,1<T<5时,由于理论数偏小,往往使得X2值偏大,此时可应用四格表X2值校正公式:
甲 、乙两组有效率比较
表中有一个理论数 4.62((30×12)/78=4.62)大于1小于5,可采用X2值校正公式计算
分组
有效数
无效数
合计数
甲组
38
10
48
乙组
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、计数资料的统计描述方法
(一)图表: 频数表,直条图,饼图
变量类型的判断
病例号
1 2 3 4 5 6 7 8 9
年龄 (岁)
35 44 26 25 41 45 50 28 31
性别
身高 (m)
血型
心电图
尿WBC
女 1.65 A
正常

男 1.74 B
正常

男 1.80 O
正常

女 1.61 AB 正常
率又包括频率指标(frequency)和强度指标 (rate),用来测量一定时期内,某人群特 定事件发生的频率或强度。
• 率=(发生某现象的观察单位数)/(某时间段 可能发生某现象的观察单位数)
• 常用百分率(感染率)、千分率、10万分 率(肿瘤发病率)表示。
✓率是一个动态指标,在观察期内看特定人群 中某事件的变化。
治疗组 90
10 100 0.1
对照组 80
20 100 0.2
某种抗生素预防院内感染的疗效分析
本例OR=0.44。
OR、RR临床(实际)意义
• OR、RR>1,表明暴露因素为危险因素,偏 离1越远,表示危险性越强
• 0<OR、RR<1,表明暴露因素为保护因素, 离0越近,表示保护性越强
• OR、RR=1,表明暴露因素与结果无关
–是一个静态指标
–无时间单位
3、相对比 (ratio)
相对比是A、B两个指标之比,是比较两独立事件数 量大小关系指标(独立指互不包含):比=A/B
– 两个指标可性质相同,可不同;绝对数、相对数或平均数。 – 是一个静态指标,反映一特定时间(time point)的情况。 – 无时间单位
计数资料的统计描述:率与比的综合应用 例1 某医院院内感染汇总分析
60
40
轻 100 5
5% 1000 100
50
合计 1100 185 16.8% 1600 220 110
计算标准化感染比(SIR)=(实际感染数与预期感
染数比)=220/110=2;SIR<1, 表示被标化组的感染 率低于标准组; SIR>1, 表示被标化组的感染率高 于标准组。
2、标准化率的注意事项
月份 1月份 2月份 3月份 4月份 5月份 6月份 合计
出院人数 584 571 714 748 942 1095
感染人数 8 10 12 16 21 24 91
感染率 1.37 1.75 1.68 2.14 2.23 2.19
构成比 8.8 11.0 13.2 17.6 23.0 26.4
相对比 -1.28 1.23 1.56 1.63 1.60
注意:暴露因素和结果的赋值标准化:1表示暴露, 0表示未暴露;1表示感染,0表示未感染。否则结 论可能刚好相反。
相对危险度与比数比的关系
例6:治疗组感染率=10/100=0.1;对照组感染率0.2
RR=0.5 OR=0.44
例7:治疗组感染率=5/100=0.05;对照组感染率 =10/100=0.1
绝对危险度实例计算
• 对于感染率研究: 绝对危险度为:20%-10%=0.1 (常用百分数表示:10%)
• 治疗能使感染率的危险度减少10%左右
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR)
* 二分类变量: 0,1
* 有序多分类:多采用等间距赋值
如 -、+、++、+++(0、1、2、3)
* 少量非线性关系有序多分类赋值:考虑哑变量
* 无序多分类变量赋值: A、B、AB、O
12
3
4?
采用哑变量方法:dummy variable
革阳菌的哑变量赋值为(1,0,0),革阴菌哑变量 赋值为(0,1,0),真菌哑变量赋值为(0,0,1)
例4 甲、乙两个医院感染率比较
病情程度
甲医院
乙医院
例数 感染数 感染率 例数 感染数 感染率
重 800 160
20% 100 30 30%
中 200
20
10% 400 60 15%
轻 100
5
5% 1000 100 10%
合计 1100 185 16.8% 1500 190 12.7%
1、标准化法的基本方法
计数资料的分类
• 无序分类: 二项或二分类:对立、不相容的两类。 如疗效:病死与未愈,感染与否等。 多项或多分类:互不相容的多类。 如感染部位、感染分型等
• 有序分类:类间不相容且有程度差别。 如疗效:痊愈、显效、好转、无效。
特点:无度量衡单位;定性测量
计数资料的分类赋值
在赋值时应考虑类型而定。
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT)
• 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类:
<5mmHg
无效
5-10mmHg
有效
10-20mmHg
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
RR=0.5 OR=0.48
• 当率较低,如小于10%时, RR值与OR值近似相等。 率值越小(罕发事件),越接近。
• 对大规模临床随机对照试验:OR、RR可使用。
3、绝对危险度(率差)
•对照组感染率40%,试验组20%,RR=0.5? •对照组感染率10%,试验组5%,RR=0.5?
AR为两个率的绝对差值:即对照组率-治 疗组率
轻 100 5
5% 100 10
合计 1100 185 16.8% 1100 280
30% 15%
10% 12.7%
25.4%
2)、间接法:分组标准率
病情程度
甲医院
乙医院
例数 感染数 感染率 例数 实际 预期 感染数 感染数
重 800 160 20% 100
30
20
中 200 20 10% 400
✓率有时间单位—观察时间影响率的大小。
反应停销售量 畸形儿发生率
与医院感染有关的率
• 医院感染发生率 • 医院感染罹患率 • 医院感染患病率(即现患率)
医院感染发生率
• 是指一定时间内某人群中新发病例的频率。
– 公式=(同一时期内新发生医院感染例数/同一时期内处于 危险中病人数)×100%
– 或公式=(同期新发生医院感染例数/同期住院病人人数或 出院病人数)×100%
0.5 0 工人 干部 职员 军人 农民 教师
直条图(bar 条形图):分类变量资料的频数图, 条与条间独立,顺序可不固定。与Histgram不同
饼图/圆饼图/圆图/pie图
百分条图 (percent bar)
工人
干部
1
职员
军人
农民
教师
0%
50%
100%
(二)率、比 (构成比、相对比)
1、率 (rate, frequency)
(三)、计数资料统计描述的 注意事项
1. 计算率时要求分母不宜过小。少于10 例则直接描述。
例2 血清TPS检出率与消化道肿瘤淋巴结转移关系
肿瘤
淋巴结转移
n TPS 阳性率
食管癌 7
7
100
胃癌 9
6
66.7
大肠癌 10
7
70.0
合计 26 20
76.9
(7/7),(6/9),7/10,0/1
无淋巴结转移
实例(例5)分析
组别 未感染 感染 合计 感染率
治疗组 90
10 100 0.1
对照组 80
20 100 0.2
某种抗生素预防院内感染的疗效分析。
RR计算的实例演示
• 治疗组发生感染的危险度(率) =10/100=0.10
• 对照组发生感染的危险度(率) =20/100=0.20
• 相对危险度(RR)=0.5
部分原始数据
9名感染病例的职业状况
编号
性别
身高 职业状况
1

1.65
教师
2

1.74
工人
3

1.80
职员
4

1.61
农民
职业状况 工人 干部 职员
频数 3 2 1
5

1.71
工人
6

1.58
工人
7

1.60
干部
8

1.76
干部
9

1.62
军人
军人
1
农民
1
教师
1
合计
9
2、直条图
3.5 3
2.5 2
1.5 1
• 率与比可用来描述某事件发生机会的大小。
• 二分类变量资料描述
–相对危险度(RR)与比数比(OR)是用来描述 两组间事件发生的机会之比。
• 当事件的发生机会较大时,RR与OR相差较大;当为罕 发事件时, RR OR。
–绝对危险度是指率差,NNT为避免一例不良事件 发生而需要治疗的病例数。
二、计数资料的假设检验
✓条件:比较双方应同质、同时、同地,比较 的两组应选用同一标准。
✓标准选用不同,标化率可不同。标准化率只 是两组的相对水平,不反映实际的情况,只 能用于比较。
✓总体标准化率比较也需进行假设检验。
(五)以率/比基础的二级指标
• 相对危险度(RR) • 比数比(OR) • 绝对危险度(AR) • NNT 用来表达危险度的大小或关联程度
相关文档
最新文档