计数资料的统计描述与卡方检验

合集下载

卡方检验解释

卡方检验解释

(四)卡方检验的连续性校正问题
反对依据是:经连续性校正后,P值有过分 保守之嫌。此外,Fisher确切概率法建立在 四格表双边固定的假定下,而实际资料则 是单边固定的四格表,连续性校正卡方检 验的P值与Fisher确切概率法的P值没有可 比性。
• 就应用而言,无论是否经过连续性校 正,若两种检验的结果一致,无须在 此问题上纠缠。但是,当两种检验结 果相互矛盾时,如例7-2,就需要谨 慎解释结果了。
24.08, P0.05
结论与之相反。
(四)卡方检验的连续性校正问题
赞成依据是:这样做可使卡方统计量抽样 分布的连续性和平滑性得到改善,可以降 低I类错误的概率,连续性校正后的卡方检 验,其结果更接近于Fisher确切概率法。不 过,校正也不是无条件的,它只适合于自 由度为1时,样本含量较小,如n<40,或 至少有一个格子的理论频数太小,如T<5 的情形。
• 为客观起见,建议将两种结论同时报 告出来,以便他人判断。当然,如果 两种结论一致,如均为或,则只报道 非连续性检验的结果即可。
第二节、两相关样本率检验 (McNemar检验)
配对四格表资料的 2 检验
与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
理论频数由下式求得:
TRC
nR nC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
检验统计量 2 值反映了实际频数与 理论频数的吻合程度。
若检验假设H0:π1=π2成立,四个格子的实际 频数A 与理论频数T 相差不应该很大,即统计量
不应该很大。如果 2 值很大,即相对应的P 值很

中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2

中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2

(四)注意资料的可比性 用以比较的资料应是同质的,除 了要比较的处理因素外,其它条件应 基本相同。对于不同时期、地区、条 件下的资料应注意是否齐同。
• (五)对比不同时期资料应注意客观 条件是否相同 例如,疾病报告制度完善和资料完整 的地区或年份,发病率可以“升高”; 居民因医疗普及,就诊机会增加,或诊 断技术提高,也会引起发病率“升高” 。因此在分析讨论时,应根据各方面情 形全面考虑,慎重对待。
2 ( A T ) 2 RC RC TRC
=
[b- (b+c)/2]2
+
[c- (b+c)/2]2
(b+c)/2 [(c- b)/2]2 (b+c)/2
(b+c)/2
= [ (b-c)/2]2 +
(b+c)/2
= (b-c)2/2
(b+c)/2
(b c) 2 bc
H0:总体B = C H1:总体B≠C α= 0.05 b + c = 12 + 2 = 14 < 40。
本资料若不校正时,X2=4.35,P<0.05,结 论与之相反。
最小理论频数TRC的判断: R行与C列中,行合计数中的最小 值与列合计数中的最小值所对应
格子的理论频数最小。
如本例,第2行与第2列所对应的格子 理论频数最小(4.67)。
第二节 配对设计的四格表资料的χ2检验
(一)配对四格表形式 B 甲种属性 + 合计 A乙种属性 + 合计 a b a+b c d c+d a+c b+d n=a+b+c+d
无效 b d b+d

医学统计学 问答题

医学统计学  问答题

1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。

3、简述直线回归与直线相关的区别。

1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。

2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。

第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。

(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。

(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。

(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。

由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。

每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。

需要作“样本例数估计”。

3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。

实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。

卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。

统计学常用概念:T检验、F检验、卡方检验、P值、自由度

统计学常用概念:T检验、F检验、卡方检验、P值、自由度

统计学常⽤概念:T检验、F检验、卡⽅检验、P值、⾃由度1,T检验和F检验的由来⼀般⽽⾔,为了确定从样本(sample)统计结果推论⾄总体时所犯错的概率,我们会利⽤统计学家所开发的⼀些统计⽅法,进⾏统计检定。

通过把所得到的统计检定值,与统计学家建⽴了⼀些随机变量的概率分布(probability distribution)进⾏⽐较,我们可以知道在多少%的机会下会得到⽬前的结果。

倘若经⽐较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信⼼的说,这不是巧合,是具有统计学上的意义的(⽤统计学的话讲,就是能够拒绝虚⽆假设null hypothesis,Ho)。

相反,若⽐较后发现,出现的机率很⾼,并不罕见;那我们便不能很有信⼼的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。

F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。

统计显著性(sig)就是出现⽬前样本这结果的机率。

2,统计学意义(P值或sig值)结果的统计学意义是结果真实程度(能够代表总体)的⼀种估计⽅法。

专业上,p值为结果可信程度的⼀个递减指标,p值越⼤,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。

p值是将观察结果认为有效即具有总体代表性的犯错概率。

如p=0.05提⽰样本中变量关联有5%的可能是由于偶然性造成的。

即假设总体中任意变量间均⽆关联,我们重复类似实验,会发现约20个实验中有⼀个实验,我们所研究的变量关联将等于或强于我们的实验结果。

(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效⼒有关。

)在许多研究领域,0.05的p值通常被认为是可接受错误的边界⽔平。

3,T检验和F检验⾄於具体要检定的内容,须看你是在做哪⼀个统计程序。

举⼀个例⼦,⽐如,你要检验两独⽴样本均数差异是否能推论⾄总体,⽽⾏的t检验。

统计背诵版(三份整合)

统计背诵版(三份整合)

统计学资料背诵版一、单选题:第二章:计量资料的统计描述1、描述一组偏态分布资料的变异度,以四分位数间距指标较好。

2、用均数和标准差可以全面描述正态分布资料的特征。

3、各观察值均加(或减)同一数后标准差不变。

4、比较某地1~2岁和5~5.5岁儿童身高的变异程度,宜用变异系数。

5、偏态分布宜用中位数描述其分布的集中趋势。

6、各观察值同乘以一个不等于0的常数后,变异系数不变。

7、正态分布的资料,均数等于中位数。

8、对数正态分布是一种右偏态分布(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)9、横轴上,标准正态曲线下从0到2.58的面积为49.5%10、当各观察值呈倍数变化(等比关系)时,平均数宜用几何均数。

第三章:总体均数的估计与假设检验1、均数的标准误反映了样本均数与总体均数的差异。

2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明越有理由认为两总体均数不同。

3、甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S 12、X2和S22,则理论上由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括04、在参数未知的正态总体中随机抽样,丨X-μ丨≥t0.05/2,vS X的概率为5%5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围为74±1.96×46、关于以0为中心的t分布,叙述错误的是相同时,丨t丨越大,P越大。

7、在两样本均数比较的t检验中,无效假设为两总体均数相等。

8、两样本均数比较作t检验时,分别取以下检验水准,犯第二类错误概率最小的是α=0.309、正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率等于β,而β未知。

10、关于假设检验,说法正确的是采用配对t检验还是两样本t检验是由试验设计方案所决定的。

计数资料的统计描述与卡方检验

计数资料的统计描述与卡方检验

25
41 45 50 28 31

男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常

++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。

医学统计学复习题答案

35、当总体率λ很小时,当n很大时,二项分布可用泊松分布来近似。
36、率的标准化的计算方法有直接标准化方法和间接标准化方法。
37、Χ2检验的用途:(1)推断两个总体率或构成比之间有无差别;(2)多个总体率或构成比之间有无差别;(3)两分类变量间有无关联性;(4)多个样本间的多重比较;(5)频数分布拟合优度的Χ2检验。
22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。
23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。
33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。
34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。
35、概率:概率是描述随机事件发生可能性大小的一个度量。
5、CV(变异系数):常用于度衡量单位不同和均数相悬殊的多组资料变异度的比较。
6、统计推断是从总体中随机抽样本,由样本信息推断总体特征的过程,包括参数估计和假设检验两方面内容。参数估计包括点估计和区间估计。
7、可信区见估计的优劣取决于两要素:(1)可信度1-α(准确度),即区间包含总体均数µ的理论概率大小,可信度愈接近1愈好。(2)区间宽度β(精密度),即区间的长度,区间愈窄愈好。
16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。

医学科研论文统计方法


3. 抽样误差 因个体差异及样本只能是总体 的一部分,而产生的样本统计量与 总体参数之间的差异。 抽样误差愈小,用样本推断总 体的精确度愈高
统计量 依据样本观察值所定 出的量。如:样本均数、样本标 准差 、样本率。
参数 总体的统计指标数值。 如:总体均数、总体标准差、 总 体率。
4. 概率 probability
2.计数资料,enumeration data
由无序分类变量组成
将观察单位按某种属性或类别分组 所得各组的观察单位数
1)二项分类:阳性、阴性
2)多项分类:A、B、O、AB血 型。
3.等级资料
半定量资料
介于计量和计数资料之间,由有序 分类变量组成。观察单位的分组是 按照程度上的差异或等级大小来分。
3、线条:无竖线及斜线
4、数字:对齐;如缺失用“-” 或“…”表示
5、如有备注: 出,写在 用“*”标
表1 某医院1998年各科住院危重病 人抢救成功率
科别 内科
外科
危重人数 315
322
抢救成功数 252
249
成功率% 80.0
77.3
医学统计学研究的 基本步骤
1.资料设计 3.资料整理 2.资料收集 4.资料分析
1、资料设计,design 按研究者是否对观察对象施加 干预分为: (1)、调查设计,survey design 研究者只是“被动”地观察 客观实际情况 ( 2 ) 、 实 验 设 计 , experiment design 研究者主动地施加干预
2.统计推断: 1)推断总体均数的可信区间 2)假设检验:
t检验,u检验,秩和检验和方差 分析(检验)
1)样本推断总体 95%或者99%总体均数可信区间估计 注意:该方法表示在一个总体中,用 统计量如何来估计总体水平的大致范 围,不能用来评价个体的 水平。 最常用的 公式: X 1.96 S x 表示在大样本情况下95%总体均数可

医学统计学__问答题

1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。

3、简述直线回归与直线相关的区别。

1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。

2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。

第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。

(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。

(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。

(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。

由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。

每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。

需要作“样本例数估计”。

3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。

实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。

卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。

卡方检验


卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较
例题 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面 神经麻痹的疗效,资料见下表。问三种疗法的有效率有无差别?
卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较
卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较
卡方检验
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 步骤:
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 步骤:
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 步骤:
样本构成比的比较
卡方检验
■ 行×列表资料的χ2检验
双向无序分类资料的关联性检验
卡方检验
■ 行×列表资料的χ2检验
双向无序分类资料的关联性检验 例题 测得某地5801人的ABO血型和MN血型结果如下表,问两种血型系统 之间是否有关联?
卡方检验
■ 行×列表资料的χ2检验
双向无序分类资料的关联性检验
Coxhran Armitage 趋势检验(Cochran Armitage trend test )
卡方检验
■ 有序分组资料的线性趋势 χ2检验
卡方检验
■ 有序分组资料的线性趋势 χ2检验
例 某研究者欲研究年龄与冠状动脉粥样硬化等级间的关系,将278例尸 解资料整理成下表,问年龄与冠状动脉粥样硬化等级间是否存在线性变化 趋势?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

结论:说明60岁年龄组最容易发生感染。
(四)、率的标准化
例4 甲、乙两个医院感染率比较
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 20% 10% 5% 16.8% 例数 100 400 1000 1500
乙医院
感染数 30 60 100 190 感染率 30% 15% 10% 12.7%
观察时间可为年、季、月,一般为年。 年发病率/月发病率/季发病率
医院感染罹患率(同发生率)
• 公式:(同期新发生医院感染例数/观察期间 具感染危险的住院病人数)×100%
• 计算医院感染率时,分子确定要注意:
–病例的感染时间要“落入”观察期内,即必须是 新病例。 –注意病例与病人的区别。 –感染必须确诊
例1 某医院院内感染汇总分析
月份 出院人数 1月份 584 2月份 571 3月份 714 4月份 748 5月份 942 6月份 1095 合计 感染人数 8 10 12 16 21 24 91 感染率 1.37 1.75 1.68 2.14 2.23 2.19 构成比 8.8 11.0 13.2 17.6 23.0 26.4 相对比 -1.28 1.23 1.56 1.63 1.60
– 现患率主要在基线调查研究中使用,一般用调查 病人数作为分母。也用于评价感控效果。
• 计算现患率时应注意: – 分子包括新、老感染病人,只要调查时正处于 感染状态,均计算在内。 – 分母调查人数
可分为时点现患率与期间现患率 point prevalence period prevalence 调查时应尽量缩短调查时间
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
NNT实例演示
• 如果治疗一个病人能减少感染的0.10危险度,即 我们能挽救0.1个人。 • 那么为挽救一个完整的人,需要治疗多少病人? NNT=1/0.110 • 需要治疗10个病人,才能比对照组多减少1个感 染病例。
计数资料统计描述小结
一、计数资料的统计描述方法
(一)图表: 频数表,直条图,饼图
变量类型的判断
病例号
1
2 3
年龄 (岁)
35
44 26
性别

男 男
身高 血型 心电图 尿WBC (m)
1.65
1.74 1.80
职业
教师
工人 职员
RBC 1012/L
4.67
5.21 4.10
A
B O
正常
正常 正常

- +
4
5 6 7 8 9
–是一个静态指标 –无时间单位
3、相对比 (ratio)
相对比是A、B两个指标之比,是比较两独立事件数 量大小关系指标(独立指互不包含):比=A/B
– – – 两个指标可性质相同,可不同;绝对数、相对数或平均数。 是一个静态指标,反映一特定时间(time point)的情况。 无时间单位
计数资料的统计描述:率与比的综合应用
实际 预期 感染数 感染数
30 60 100 220 20 40 50 110
计算标准化感染比(SIR)=(实际感染数与预期感 染数比)=220/110=2;SIR<1, 表示被标化组的感染 率低于标准组; SIR>1, 表示被标化组的感染率高 于标准组。
2、标准化率的注意事项
条件:比较双方应同质、同时、同地,比较 的两组应选用同一标准。 标准选用不同,标化率可不同。标准化率只 是两组的相对水平,不反映实际的情况,只 能用于比较。 总体标准化率比较也需进行假设检验。
新感染 新感染 新感染 已感染 新感染 感染
观察期
2009.1.1 2009.1.31
• 分母:可能发生感染的人数,其范围界定很关键 暴露人群又称危险人群,指发生感染的可能人群 应排除那些已感染或因年龄、免疫等因素而不会感 染的病人?
现患率
• 也称患病率或流行率,指某特定时间某人群中 感染人数所占比重或比例。 • 公式=(特定时间存在的医院感染例数/观察期间 处于感染危险中的病人数)×100%
编号 1 性别 身高 职业状况
9名感染病例的职业状况 职业状况 工人 干部 职员 军人 农民 教师 合计 频数 3 2 1 1 1 1 9
1.65 教师

2
3 4 5 6 7 8

男 女 男 女 女 男
1.74
1.80 1.61 1.71 1.58 1.60 1.76
工人
职员 农民 工人 工人 干部 干部
乙医院
感染数 240 30 10 280 感染率 30% 15% 10% 12.7%
重 中 轻 合计
800 200 100 1100
25.4%
2)、间接法:分组标准率
病情程度 甲医院 乙医院
例数 感染数 感染率 例数
重 中 轻 合计 800 200 100 1100 160 20 5 185 20% 10% 5% 16.8% 100 400 1000 1600
(五)以率/比基础的二级指标
• • • • 相对危险度(RR) 比数比(OR) 绝对危险度(AR) NNT
用来表达危险度的大小或关联程度
OR、RR
• OR(比数比)、RR(相对危险度) • 适用条件: 对于RCT试验:可以计算OR、RR 对于病例对照研究:只能计算OR
1、相对危险度(率比)
组别 感染 未感染 合计 感染率 治疗组 a b a+b Pe 对照组 c d c+d Pc 合计 a+c b+d a+b+c+d RR(相对危险度)为治疗组与对照组的感染 率之比。RR=Pe/Pc
cross-sectional study /Cohort study
2、构成比 (proportion)
• 说明某一事物内部各组成部分所占的比重和分布, 常用百分数表示(0%-100%)。
• 构成比是一特定时间(time point)某 特定事件在总体事件数中所占的比重。 proportion=a/(a + b + c+„„)
相对危险度与比数比的关系
例6:治疗组感染率=10/100=0.1;对照组感染率0.2
RR=0.5 OR=0.44
例7:治疗组感染率=5/100=0.05;对照组感染率 =10/100=0.1
RR=0.5
OR=0.48
• 当率较低,如小于10%时, RR值与OR值近似相等。 率值越小(罕发事件),越接近。 • 对大规模临床随机对照试验:OR、RR可使用。
计数资料的分类
• 无序分类: 二项或二分类:对立、不相容的两类。 如疗效:病死与未愈,感染与否等。 多项或多分类:互不相容的多类。 如感染部位、感染分型等 • 有序分类:类间不相容且有程度差别。 如疗效:痊愈、显效、好转、无效。 特点:无度量衡单位;定性测量
计数资料的分类赋值

在赋值时应考虑类型而定。
* 二分类变量: 0,1 * 有序多分类:多采用等间距赋值 如 -、+、++、+++(0、1、2、3) * 少量非线性关系有序多分类赋值:考虑哑变量 * 无序多分类变量赋值: A、B、AB、O
1 2 3 4?
采用哑变量方法:dummy variable
革阳菌的哑变量赋值为(1,0,0),革阴菌哑变量 赋值为(0,1,0),真菌哑变量赋值为(0,0,1)
实例(例5)分析
组别 未感染 感染 合计 感染率 治疗组 90 10 100 0.1 对照组 80 20 100 0.2 某种抗生素预防院内感染的疗效分析。
RR计算的实ቤተ መጻሕፍቲ ባይዱ演示
• 治疗组发生感染的危险度(率) =10/100=0.10 • 对照组发生感染的危险度(率) =20/100=0.20 • 相对危险度(RR)=0.5
1
0%
50%
100%
(二)率、比 (构成比、相对比)
1、率 (rate, frequency)
率又包括频率指标(frequency)和强度指标 (rate),用来测量一定时期内,某人群特 定事件发生的频率或强度。
• 率=(发生某现象的观察单位数)/(某时间段 可能发生某现象的观察单位数)
• 常用百分率(感染率)、千分率、10万分 率(肿瘤发病率)表示。
3、绝对危险度(率差)
•对照组感染率40%,试验组20%,RR=0.5? •对照组感染率10%,试验组5%,RR=0.5? AR为两个率的绝对差值:即对照组率-治 疗组率
绝对危险度实例计算
• 对于感染率研究: 绝对危险度为:20%-10%=0.1 (常用百分数表示:10%) • 治疗能使感染率的危险度减少10%左右
大肠癌 10
合计 26
20
76.9
4
1
25.0
(7/7),(6/9),7/10,0/1
2. 分析时不能以构成比代率 例3 某作者调查医院感染病例,获得如下数据:
年龄组(岁) 30 40 50 60 70-80 感染数 47 198 330 434 18 % 4.6 19.3 32.1 42.3 1.7
率是一个动态指标,在观察期内看特定人群 中某事件的变化。 率有时间单位—观察时间影响率的大小。
反应停销售量
畸形儿发生率
与医院感染有关的率 • 医院感染发生率 • 医院感染罹患率 • 医院感染患病率(即现患率)
医院感染发生率
• 是指一定时间内某人群中新发病例的频率。
– 公式=(同一时期内新发生医院感染例数/同一时期内处于 危险中病人数)×100% – 或公式=(同期新发生医院感染例数/同期住院病人人数或 出院病人数)×100%
相关文档
最新文档