第五讲 循证医学实践中常用的统计指标与方法(2010秋)

合集下载

循证医学实践中常用的统计分析指标和方法

循证医学实践中常用的统计分析指标和方法

循证医学实践中常用的统计分析指标和方法循证医学是一种基于科学方法、临床经验和病患价值观的医学实践方法。

在循证医学中,统计分析是非常重要的一环,帮助医生和研究人员判断不同治疗方法的有效性和副作用。

本文将介绍循证医学中常用的统计分析指标和方法。

一、描述性统计指标1. 平均数(Mean):平均数是一组数据的总和除以数据的个数,用来表示样本或总体的中心位置。

2. 中位数(Median):中位数是一组数据按顺序排列后位于中间的数值,可以用来衡量数据的分布偏移程度。

3. 众数(Mode):众数是一组数据中出现次数最多的数值,常用于表达数据的集中趋势。

4. 方差(Variance):方差衡量数据集中在平均值附近的程度,是各数据离平均值的偏差平方的平均,用来衡量数据的离散程度。

5. 标准差(Standard Deviation):标准差是方差的平方根,用来度量数据偏离平均值的平均距离,标准差越大表示数据的离散程度越大。

二、推断统计方法1. 假设检验(Hypothesis Testing):假设检验用于判断两组数据之间的差异是否具有统计学意义,常用于对比不同治疗方法的疗效。

2. 置信区间(Confidence Interval):置信区间是用来表示样本估计值的不确定性范围,通常以95%的置信水平表示。

3. 相关分析(Correlation Analysis):相关分析用来研究两组变量之间的关系强度和方向,常用于评估治疗方法与结果之间的关联性。

4. 回归分析(Regression Analysis):回归分析用来建立预测模型,通过研究自变量与因变量之间的关系,预测结果变量的数值。

5. 生存分析(Survival Analysis):生存分析用来研究某一事件发生时间与其他因素之间的关系,常用于评估治疗方法对患者生存时间的影响。

三、实例应用以某种药物疗效评估为例,研究者收集了100位患者的数据,其中50位接受药物A治疗,50位接受药物B治疗。

循证医学PPT课件 常用统计指标与方法

循证医学PPT课件 常用统计指标与方法
统计方法中的公式和定理,是建立在数据的资料类型、设 计方案和分布特征等基础之上的,也就是说再应用每种统计 方法时,应注意它的应用条件。
表6-7 数值变量资料比较的假设检验方法
分析目的
应用条件
单样本与已知总 来自正态总体,n小
体均数比较
正态总体,n>100
两组比较
正态总体,方差齐,n<50
统计方法
t检验 U检验 t检验
因此,在临床研究中应尽可能地选择量化指标反映其 效应,尽可能少用分类变量,一般不宜将数据变量的指标 转变为分类变量后再做统计分析。
4. 配对资料 同体配对:自身前后对照试验,分别测量同
一个体干预前后的一些指标。 异体配对:试验组和对照组按照性别、年龄
等混杂因素进行配对。
配对的比例:1:1、1:2…...1:4 配对资料的价值优于非配对、成组设计的变量 资料,真实性更好。 统计方法:配对设计的t检验或秩和检验、配伍 设计的方差分析或秩和检验、McNemar 2 检 验。
将受试对象按混杂因素配对后,随机分配到两组。一组 先进行A处理后进行B处理,另一组则先进行B处理后进行A处理。 两种处理在两个阶段中交叉进行,但是注意两个阶段之间要有 一个洗脱期,来消除或减少第一阶段的处理对第二阶段处理效 果的影响。
四、数理统计条件
是指数据分布、方差齐性、资料类型、线性问题、理论数 大小等。常见概率分布:二项分布、Poisson分布、正态分布 等。
表6-5 病例对照研究资料数据格式
组别
暴露
非暴露
合计
病例组
a
b
a+b
对照组
c
d
c+d
合计
a+c
b+d

循证医学中常用的统计指标

循证医学中常用的统计指标

循证医学中常用的统计指标在循证医学中,统计指标是评估研究结果和证据强度的关键工具。

通过统计指标,我们可以了解治疗效果、疾病发生率以及其他医学问题的具体情况。

本文将介绍循证医学中常用的统计指标,包括相对风险、绝对风险、数值需要治疗的人数等。

1. 相对风险(Relative Risk,RR)是循证医学中常见的统计指标之一。

它用于评估治疗干预对疾病风险的影响。

相对风险是治疗组发生某种结果的概率与对照组发生该结果的概率之比。

例如,一项研究发现,接受某种治疗的患者相对于未接受治疗的患者,患上某种疾病的风险降低了40%,那么相对风险就是0.6。

相对风险越接近于1,表示治疗组和对照组之间的差异越小。

2. 绝对风险(Absolute Risk,AR)是描述患病率或死亡率的统计指标。

绝对风险是特定群体中发生某种结果的概率,通常用百分比来表示。

例如,一项研究发现,未接受治疗的患者患上某种疾病的风险为10%,而接受治疗的患者患病的风险为5%,那么绝对风险就是5%。

通过比较绝对风险,可以评估治疗干预对疾病发生率的影响。

3. 数值需要治疗的人数(Number Needed to Treat,NNT)是评估治疗效果的重要指标之一。

它表示需要治疗的患者人数,才能预防一个不良事件或者获益一个良性结果。

例如,一项研究发现,某种治疗方法的NNT为10,意味着需要治疗10个患者,才能防止一个不良事件的发生或者获益一个良性结果。

NNT越小,表示治疗效果越显著。

除了上述常见的统计指标,循证医学中还有其他一些重要的统计指标,比如绝对风险减少(Absolute Risk Reduction,ARR)、相对风险减少(Relative Risk Reduction,RRR)和数值需要治疗的人数减少(Number Needed to Treat Reduction,NNTR)等。

- 绝对风险减少(ARR)是治疗组和对照组之间绝对风险的差异,反映了治疗对疾病风险的真实改变。

循证医学中常用的统计指标

循证医学中常用的统计指标
ARR可用于度量试验组使用某干预 措施后,某负性事件的发生率比对照 组减少的绝对量:ARR=|EER-CER|
ARR的可信区间计算与RD相同
ARR应用条件
满足以下条件,可以使用ARR: (1)试验组-某治疗措施,对照组-安慰剂 (2)主要疗效指标:使用如病死率、复发
率等负性指标 (3)目的:试验组使用某治疗措施后,这
NNT的计算及意义
NNT的其计算公式为:
NNT=1/|EER-CER| =1/ARR 该公式中的EER和CER定义为采用某干预措
施之后,某疗效事件的发生率,如阿斯匹林 预防心肌梗死的病死率。因此,NNT的值越 小,表示该防治效果就越好,其临床意义也 就越大。
NNT的可信区间
NNT的95%的可信区间,由于无法计算 NNT的标准误,但NNT= 1/ARR,故NNT 的95%的可信区间的计算可利用ARR的 95%的可信区间来计算。
NNT95%CI的下限: 1/ARR的上限值 NNT95%CI的上限: 1/ARR的下限值
注意:
NNT中的对照组通常是安慰剂对照,如 果对照组是阳性对照,则不同阳性对照 组的多个NNT间不能比较,如:
CER EER ARR NNT
0.7
0.4
0.3 3.3
0.6
0.4
0.2 5.0
0.5
NNH的计算式为: NNH =1/|EER-CER|=1/ARI
该公式中的EER和CER定义为采用某干 预措施之后,某不利结果的发生率。因 此,NNH的值越小,表示该某治疗措施 引起的不利结果(不良事件或副反应)就越 大。
注意:
NNH中的对照组通常是安慰剂对照,如果 对照组是阳性对照,则不同阳性对照组的 多个NNH间不能比较,如:

统计方法在循证医学中的应用循证医学常用统计指标

统计方法在循证医学中的应用循证医学常用统计指标

11. 防治性措施受益与危害的似然比 (LHH, like hood of being helped VS harm)
该指标反映了防治措施给受试者带来的收益与危害的比 例。LHH>1,利大于弊;反之,LHH<1时,弊大于利。 其计算公式为:
LHH=NNH/NNT
27
Eg:某防治措施的NNT为9,其NNH为4,其 LHH为:
该例RR的95%可信区间为:(0.272,0.846),该区间小于1,可以认 为阿司匹林可降低心肌梗死
14
5. 比值比(OR)及可信区间
是测量疾病与暴露联系强度的一个重要指标。是某 组中某事件的比值与另一组内该事件的比值比 (odds ration, OR), 又称机会比、优势比等。。
OR=1 表示比较组间没有差异。当研究结局为不利事 件时,OR<1 表示暴露可能会降低结局风险。
循证医学中常用的是总体率的可信区间、总体均 数的可信区间和总体相对危险度(RR)的可信区 间等。
6
(一)分类资料的指标
7
1. 试验组事件发生率(EER, experimental event rate)
即试验组中某事件的发生率,如对某病采用某 些防治措施后该疾病的发生率。
例如:某医师研究了阿司匹林治疗心肌梗死的效果
ORi
ai di bici
SE[ln(ORi )]
11果 其OR和可信区间为: OR= ad /bc = 15×90 / 30× 110 =0.409 ㏑OR= ㏑(0.409)=-0.894 SE (㏑OR)= √1/30+1 /90 + 1 /15 + 1/110 = 0.347 ㏑OR的95%可信区间为:
si

循证医学实践中常用的统计分析指标和方法

循证医学实践中常用的统计分析指标和方法

p
(1 )
n
如果总体率π未知,用
样本率p估计
sp
p(1 p) n
举例:标准误的计算
观例察5-某1医观院察产某妇医1院06产人妇,10其6中人行,剖其中腹行产剖者腹62产人者,62 人, 剖腹剖产腹率产为率58为.55%8.,5%试,估试计估剖腹计产剖率腹的产标率准的误标。准误。
解:解已:知已n知=1n0=61,06p,=0p.5=805.,58其5,标其准标误为准:误为:
OR=ad/bc ,或配对病例对照研究时,OR=c/b
意义同RR
非匹配病例对照研究
配对病例对照研究
对照
病例
合计
暴露
非暴露
暴露
a
非暴露
c
合计
a+c
b
a+b
d
c+d
b+d
N
➢可信区间 可以推断OR有无统计学意义(是否包含1)
➢ 计算:
ln(OR) Z SE(ln OR)
SE(lnOR)= 1 1 1 1
Sp
p(1 p) n
0.585 (1 0.585 ) 0.048 4.8% 106
总体率的可信区间
总体率的可信区间 (confidence interval of rate): 根据样本率推算总体率可能所在的范围
当n足够大,且n p 和n(1- p)均大于5时,p的抽样分布逼近正态分布。 其可信区间为: 双侧: (p - Zα/2Sp, p + Zα/2 Sp) (Z0.05/2=1.96) 单侧: p- Zα Sp 或 p + Zα Sp (Z0.05=1.645) 试估计p=0.585,Sp =0.048的总体率双侧95%可信区间。 解: Z0.05/2=1.96, (p - Zα/2 Sp, p + Zα/2 Sp) = (0.585-1.96×0.048,0.585+1.96×0.048)=(0.491,0.679) 即总体率的95%可信区间为49.1%~67.9%。 注意:如果计算获得的可信区间下限小于0%,上限大于100%, 则将下限直接定为0%,上限直接定为100%

循证医学中常用的统计指标

循证医学中常用的统计指标

3. RR及可信区间
相对危险度RR(relative risk,RR) 是前瞻性研究中较常见的指标,它是 试验组某事件发生率与对照组(或低 暴露)的发生率之比,用于说明前者 是后者的多少倍,常用来表示试验因 素与疾病联系的强度及其在病因学上 的意义大小。
其计算方法为:
RR P1 / P0 EER / CER
11. NNT、NNH及可信区间
NNT (The number needed to treat)的临床含义 为:对病人采用某种防治措施处理,得到一例有 利结果需要防治的病例数(the number of patients
who needed to be treated to achieve one additional favorable outcome, NNT)。
ARR的标准误:
SE p1(1 p1) p2 (1 p2 )
n1
n2
ARR的可信区间:
ARR u SE (ARR u SE, ARR u SE)
例如:试验组某病发生率为15/125=12%, 而对照组人群发生率为30/120=25%,其 ARR=25%-12%=13%,标准误为:
RRI EERb CERb / CERb
该指标可反映采用试验因素处理后, 患者的不利结果增加的百分比。
7.RBI
RBI,相对获益增加率(relative benefit increase,RBI),试验组中某有益结果的发 生率为EERg,对照组某有益结果的发生 率为CERg,RBI可按下式计算:
1 1 1 1 0.289 15 30 125 120
RR的95%可信区间为:
expIn(RR) 1.96SE(InRR)
=exp(-0.734±1.96×0.289) =(0.272,0.846)

第五章 循证医学实践中常用统计学方法

第五章  循证医学实践中常用统计学方法
二项分类 多项分类
有序分类 Ordered Categorical 等级变量:仅有顺序,无单 位;取值间的差异是不可度量的
28
资料类型的判断
病例号
1
年龄 (岁)
35
性别

身高 (cm)
1.65
血型
A
心电图
正常
尿WBC

职业
教师
2
44 男 1.74 B
正常

工人
3
26
男 1.80 O
正常

职员
观察的对象是否同质研究的方法如检测手段抽样方法是否相同观察的时间是否一致等
循证医学 Evidence-Based Medicine
第五章 循证医学实践中常用统计方法
(Statistical methods commonly used in the practice of evidence-based medicine)
同质,研究的方法(如检测手段、抽样方法)是 否相同,观察的时间是否一致等;被比较的总体 是否具有可比性 对相对数的统计推断
39
2. 分类变量资料的统计推断
参数估计:点估计 区间估计
假设检验: 2检验、u检验
非参数检验
40
无序分类资料统计方法
比较目的
应用条件
统计方法
样本与总体检验
np>5,n(1-P)>5 n很小
– 同质和异质是相对的概念 – 不同质的个体不能笼统地混在一起分析 – 个体的同质性是构成研究总体的必备条件 – 研究内容(指标/变量)不同,对同质性的要求不同
14
同质和异质示例
在研究事物的形颜状色时
15
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

由于RR与OR=1时为试验因素与疾病无关,故其
可信区间不包含1时为有统计学意义;反之,其
可信区间包含1时为无统计学意义
试验组<对照组
无统计学意义 1 无效线
试验组>对照组
RR、OR可信区间的图示
实例分析1
阿司匹林治疗心肌梗死的效果
治疗组病死率p1=15/125 对照组病死率p0=30/120 RR= p1 /p0 = 0.48 RR的95%可信区间为:exp㏑(RR)±1.96SE ㏑(RR) =(0.272,0.846)
A
45 异常 严重贫血
B
87 异常 中度贫血
C
117 异常 轻度贫血 特 点
D
143 正常 正常
E
175 异常 血红蛋白 增高
1、有单位;2、连续性变量 无大小、强弱、优劣的差异 有大小、强弱、优劣的差异
数值变量资料包含了最多的统计信息。因此,在临 床研究中应尽可能地选择量化指标反映其效应,尽 可能少用分类变量,一般不宜将数值变量的指标转 变为分类变量后再做统计分析。
OR的计算

回顾性研究的数据可由下表表达: OR计算的四格表
组别 病例组 对照组 暴露 a c 非暴露 b d 例数 n1 n2
ad OR bc
4、EER与CER
EER(experimential event rate)——试验组中
某事件的发生率,如对某疾病采取某些治疗措施 后该疾病的发生率
例如:某医师研究了阿司匹林治疗心肌梗死的效果
EER=a/n1 =15 /125=12%
EER与CER
Hale Waihona Puke CER (control event rate)——对照组中某事件 的发生率,如对某疾病不采取某些治疗措施的发 生率。
例如:某医师研究了阿司匹林治疗心肌梗死的效果
CER=c/n2 = 30 /120=25%
RR的意义及解释(一)
当RR=1,表示试验因素与疾病无关。
当RR≠1,表示试验因素与疾病有关。 当RR>1,表示试验组的发生率大于对照组 当RR<1,表示试验组的发生率小于对照组
RR的意义及解释(二)
当发生率是描述疾病对人群的有害指标(如发病 率、死亡率等)时, RR>1,表示试验因素是有 害因素,且RR越大,试验因素对疾病有害的影响 就越大;当RR <1,表示试验因素是保护因素, 且RR越小,试验因素的保护作用就越大 当发生率是描述疾病对人群的有益指标(如有效 率、缓解率等)时, RR>1,表示试验因素是有 益因素,且RR越大,试验因素对疾病的有益影响 就越大;当RR <1,表示试验因素是有害因素, 且RR越小,试验因素的有害作用就越大
三、科研设计方案

以时间来划分设计方案
横断面 回顾
前瞻
过去

现在
将来
以统计模型来划分 完全随机设计(成组)、配对设计、随机区组 设计、交叉设计等
不同设计方案应选择不同的统计方法
四、数理统计条件

统计方法中的公式和定理,是建立在数据 的资料类型、设计方案和分布特征等基础 之上,也就是说在应用每种统计方法时, 应注意它的应用条件(见表6-7,表6-8)
二、数值变量资料的统计指 标
数值变量资料的常用描述指标
三、可信区间
可信区间的概念

可信区间(confidence interval,CI)是按一定 的概率(1-)估计总体参数所在的范围,这 个范围被称为所估计参数值的可信区间。如95 %可信区间指总体参数被包含在该区间的可能 性是95%,没有被包含的可能性为5%
统计在医学研究中的意义



医学统计学贯穿于医学研究中的资料搜集、整理、 分析与结果解释等全过程。 设计阶段(根据研究目的与资料特点,预设统计分析方 法,确定临床指标;同时进行样本含量估算) 实施、资料收集与整理阶段: 用相应统计分析方法,评估质量控制效果; 检查数据资料的完整性、失访与原因统计 检查极端值与异常值,分析原因与正确处理 分析资料阶段:检查资料是否满足预设统计方法的应 用条件,选用统计学方法。 临床研究的结果表达与评价:真实性、适用性、重要 性,均需要借助统计学知识。

参数估计 利用样本指标估计总体参数。常用 95%可信区间 (如:用120名成都市2003年8岁男孩身高的平 均水平估计总体的平均水平)

假设检验 利用样本提供的信息比较两个或多 个总体之间有无差别。如:t 检验、2检验等
二、数据资料的类型
分两大类:
1. 数值变量资料:用定量的方法对每个观察
对象某项指标数值的大小进行测定,所得 的资料。带有度量衡单位。 例如:身高(cm),体重(kg),血红蛋白 (g%)等。
2. 分类变量资料: 将观察单位按某种属性或类别分组,清 点各组的观察单位数,所得的资料。 例如:血型,性别,阴性/阳性等。
依据类别之间是否有程度上的差别分为
两类:无序分类变量,有序分类变量
无序分类变量:各类别之间性质不同,无
程度上的差别。 例如:性别(男/女),血型(A,B,O, AB)
有序分类变量:各类别之间有程度上的差
注意:病死率与死亡率的区别
例: 截止6月23日公布的累计数字计算,中 国内地感染非典5326人,死亡347人,死亡 率为6.5%,而香港有1755人感染,死亡296 人,死亡率高达16.86%。
2、相对危险度
相对危险度(relative risk,RR)是前瞻性
研究(队列研究)中较常用的指标,它是 试验组(暴露组)的发病率P1与对照组 (非暴露组)的发病率P0之比
统计学假设检验方法的正确选择
常用计量资料的假设检验方法
统计学假设检验方法的正确选择
常用计数资料的假设检验方法
总之,在临床科研工作中,正确地选择 统计分析方法,应充分考虑分析目的、临 床科研设计方法、收集的数据资料类型、 分布特征与所涉及的数理统计条件等。其 中任何一个问题没考虑到或考虑有误,都 有可能导致统计分析方法的抉择失误,由 此可能得出错误的结论。
该例RR小于1( RR=0.48),可认为试验组(阿 司匹林治疗组)的病死率小于对照组 该例RR的95%可信区间小于1,可以认为阿司匹 林可降低心肌梗死

实例分析2
阿司匹林治疗心肌梗死的效果


OR= ad/bc = 15×90/30×110 =0.409 OR的95%可信区间为:exp㏑(OR)±1.96SE ㏑(OR) =(0.207,0.807) 该例OR的95%可信区间为:(0.207,0.807),该区 间小于1,可以认为阿司匹林可降低心肌梗死
可信区间的主要用途
2、可信区间也可用做假设检验 95%的可信区间与α为0.05的假设检验等价,9 9%的可信区间与α为0.01的假设检验等价
RR和OR的可信区间

RR的95%可信区间为:
exp[㏑(RR)±1.96SE ㏑(RR)]

OR的95%可信区间为:
exp[㏑(OR)±1.96SE ㏑(OR)]
第三节
循证医学中的常用统计指标 及可信区间
一、分类资料的统计指标
分类变量资料的描述指标

常用的率:
发病率、患病率、病死率、死亡率等 EER(试验组事件发生率)、CER(对照组事件发生 率)、率差( RD )

常用的相对比:
相对危险度(RR) 比值比(OR) 相对危险度降低率(RRR) 绝对危险度降低率(ARR) NNT(得到一例有利结果需要防治的病例数) NNH(引起一例副作用需要处理的病例数)
循证医学实践中常用的 统计指标与方法
潘晓放
成都中医药大学第二临床医学院 临床流行病学与循证医学教研室 2010.09
本章要求
掌握 熟悉
了解
常用统计指标的意义及正确使用 可信区间的意义、用途及计算结果解 释 统计方法抉择的基本原则
第一节
医学统计学的概念与主要内容
定义
统计学(statistics)是运用数理统计的 原理和方法,研究数据资料的收集、整理、 分析与推断的科学 将统计学原理与方法应用于医学科学研 究中,就衍生出了医学统计学

3、比值比



比值比(odds ratio,OR )是指病例组某因素的暴露 比值与对照组该因素的暴露比值之比,反映了病例组 某因素的暴露比例为对照组的若干倍。OR是病例对 照研究中描述暴露与疾病联系强度的指标。 在回顾性研究(病例对照研究)中,由于无法计算发 生率、死亡率等率的指标,也就无法计算RR,但可 用OR估计RR 而在前瞻性研究中,当所研究疾病的发病率较小时, 即a和c均较小时, OR与RR的计算结果非常近似 在实际应用中,常用OR估计RR,其结果解释与RR 相同
患病率与发病率的区别
比较项目 分子 获得渠道 患病率 新旧病例总和 横断面调查 发病率 新发病例数 发病报告或队列研究
指标性质
静态指标
动态指标
常用的率
某时期内因某病死亡人数 某病死亡率= —————————————×K 同期平均人口数
某时期内因某病死亡人数 某病病死率= —————————————×100% 同期患某病的人数
RR= P1 / P0
RR可描述暴露组的发病率是非暴露组的多
少倍,常用来表示暴露与疾病联系的强度 及其在病因学上的意义大小
RR的计算

前瞻性研究的数据可由下表表达: RR计算的四格表
组别 试验组 对照组 发病 a(r1) c(r2) 未发病 b d 例数 n1 n2
试验组的发生率 P r1 / n1 RR 1 对照组的发生率 P0 r2 / n2
1、统计描述
统计描述是利用统计指标、统计图或统计 表,对数据资料所进行的最基本的统计分析, 使其能反映样本资料的数量特征及分布规律, 使研究者能准确、全面的了解数据所包涵的信 息,以便对资料做进一步的分析。 统计图表:各类表格或图示 基本指标:均数/标准差;率、构成比
相关文档
最新文档