医学科研论文中的统计学问题汇总分析

医学科研论文中的统计学问题汇总分析
医学科研论文中的统计学问题汇总分析

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学科研论文中的统计学问题汇总分析医学科研论文中的统计学问题汇总分析作者:

郑华宾ARS 医学统计学是一门帮助人们透过偶然现象,分析和判断事物内在规律的科学。

随着医学科研工作的深入,医学统计学的应用越来越广泛。

由于统计学的内容非常丰富,并且仍在不断发展,而医务工作者常因各种原因不愿花费许多精力钻研统计学知识,故医学论文中误用统计学的现象较为严重。

为了减少这一现象,提高论文的水平,现就论文中常见的统计学错误,分析讨论如下。

1 . 文中未交待所用统计方法论文中应将所用的统计方法交待清楚,例如,是配对设计的 t 检验还是成组设计的 t 检验,是Ridit 分析还是卡方检验,是作相关分析还是作回归推断。

使用不正确的统计方法会得出错误的结论,所以统计方法交待不清或根本不予交待,会使读者对论文结论的正确与否无法判断。

有的作者只提一句经统计学处理后,就写出结论;有的甚至于直接用 P 值说明问题了事。

正确的做法应写明具体的统计方法,如有特殊情况,还应说明是否采用了校正,这样才有说服力。

严格地说,应写明精确的统计量值和 P 值,如 t 值、 F 值、 2 值等,不应笼统地以 P0.05 或 P0.05 代替。

1 / 8

此外,最好能交待所使用的计算工具与统计软件名称。

因采用公认的统计软件(如 SAS、 SPSS 等)或程序型计算器进行计算,与手工计算相比,既准确又快捷,其计算结果易于被人接受。

2. 使用统计方法时不考虑其应用条件每一种统计方法都有其适用条件。

在表示数值变量资料(计量资料)的平均水平时常用到平均数。

然而平均数有算术平均数(均数)、几何均数和中位数,各有其应用条件。

应用均数时,必须首先确定数据为正态分布。

如果数据是偏态分布,仍用均数表示其平均水平势必导致错误的结论,不少作者没有注意到这一点。

对于偏态分布的数据,应该用几何均数或中位数表示其平均水平。

t 检验要求样本来自正态总体,作两样本均数比较时还要求方差齐。

如果不符合这些条件,则应考虑进行数据转换或用非参数检验;当两小样本均数比较方差不齐时,可采用 t检验。

例如临床研究中常涉及病人的病程,有的论文中病程 5d 至 24 年的平均水平和离散度为(311613)年,这种标准差接近或大于均数的数据显然属于严重的正偏态,直接进行t 检验,无疑是错误的。

t 检验是最常用的统计方法之一,但有许多误用的情况。

t 检验不能用于三组或三组以上的组间比较,即使资料符合 t

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 检验的条件也是不行的。

因为一则将原来的多组整体设计割裂,失去了总变异和总剩余误差,与原设计思想不符;二则损失了部分信息,降低了检验效率。

t 检验误用于方差分析的现象还不少见。

对于三组或三组以上组间的均数或分布的比较可以用以下方法:⑴如果各样本来自正态总体,且方差齐,可用方差分析;⑵如果各样本来自正态总体,但方差不齐,则可作数据转换,待方差齐后再用方差分析;⑶如果各样本分布不清或分布不明,则可考虑用秩和检验。

在 t 检验中,把配对设计的资料作成组比较的 t 检验,是常见的失误之一。

有的作者误将配对数据分为两个独立的组,分别设计两组各自的均数,并按两组均数作成组比较的 t 检验。

这样使原来只有差值之间的变异扩大为两个样本各自的变异,错误地增大了标准差和标准误,同时样本含量也从原来的对子数变成了两个样本的例数之和。

其结果大多使 t 检验所得 P值增大,可导致差异从有统计学意义变为无统计学意义。

卡方检验中的计算公式较多,各有其适用条件,稍有不慎,即有误用的可能,应根据实验设计和资料性质进行正确选择。

常见的失误是:⑴四格表资料,当 1T(理论频数)5,n(总例数)40时,没有计算校正 2 值;⑵四格表资料,当 T1 或 n40 时,没有选用

3 / 8

四格表确切概率法;⑶行列表资料,由于例数太少,致理论频数太小,没有采有适当的处理方法,而是直接计算 2 值,导致分析的偏性。

例如两组共计 15 例,就不宜用一般的卡方检验公式计算,应该使用确切概率法。

3. 统计学的基本概念不清楚在作统计推断时,对样本例数有一定的要求,一般认为,样本例数太少,所得到的数值不稳定,不能轻易下结论。

有的论文中三组数据均为 2 例,便作出推断,其推断是不妥的。

有一个常见的统计问题是多组间比较时的两两比较问题。

统计学上,三组或以上的比较称为一揽子比较,在作这种比较时,应先将所有的组一起比较。

在得出差别有统计学意义的基础上,再进一步作两两比较或多个处理与同一对照组比较。

论文中常见的错误是将三组或以上组拆开分别作两两比较。

正确的方法是:定量资料在方差分析 P0.05 后,再用 Q 检验或Dunnett 法作两两比较;定性变量在 RC 表资料 2 检验 P0.05 后,再作 2 分割法分析。

对于有序分类资料(即等级资料)的统计处理,在比较各处理组的效应有无差别时,宜用秩和检验、 Rid2it 分析或交叉积差法及等级相关法,但有些作者则误用卡方检验,此时作卡方检验只能说明各处理组的效应在构成比上有无差异。

部分作者对于率与比的概念不清,常将构成比误认为是发病率、

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 患病率、死亡率。

这三种率均为疾病统计指标,要做人群的流行病学调查才能得到。

在临床疗效研究中,一般无法计算出这三种率。

4. 相关回归分析中的问题相关分析是分析自变量 x 与因变量 y 的关系,医学领域里完全相关(相关系数 r=1 或-1)的事件极少,有作者将一组变量既作为自变量又作为因变量,r=1,认为有完全相关性,这说明对相关的概念还不十分清楚。

不能把相关、回归关系直接看作因果关系。

两事物间有数量关系,可能是因果关系,也可能不存在因果关系,而仅仅是伴随关系。

如果求得了两个变量间数量关系的回归方程式,或算出了 r,在做结论之前,应先作统计检验;若 P0.05,此回归方程并无实际意义。 r 的实际意义如何,还要看 r 绝对值的大小,因 r 的统计学检验,不论 P 值多么小,只能提供两个变量是否相关的信息,却不提供相关是否密切的信息。

相关的密切程度常以 r 的数值大小为指标。

r 的绝对值越接近于 1,两变量的相关关系越密切;越接近 0,越不密切。

r 的平方即 r2(决定系数)也可表示因变量 y 与自变量 x 的关系密切程度,如果 r2=0.22=0.04,说明因变量 y 的变异中仅有 4%与

5 / 8

x 有联系;此时若 P0.01,仍不能认为两者明显相关。

5. 统计说法不严格统计学上对差异作是否有显著性意义的推断与日常生活中对差异作是否显著的推断完全是两个概念。

主观感觉两个样本均数间的差异并不显著而统计学上作出差异有显著意义的推断,主观感觉两个样本均数间的差异很大而统计学作出其间差异无显著意义的推断都是有可能的。

既往所用的差异显著、差异非常显著等字句,容易与日常生活判断的字句相混淆,故现在一般认为用差异有或无统计学意义较为清楚明白。

对于假设检验的结果,不仅要恰当的解释、正确地分析,还要准确地予以表达。

差异有无统计学意义,在检验水准 =0.05 时,一般是以 P0.05 或 P0.05 为界线,有作者的结果为 P0.01,由此判断差异无统计学意义,但 P0.01 不一定就是 P0.05,也可能 0.01P0.05,只有在 P0.01 同时也0.05,才能判断为差异无统计学意义。

还有作者的假设检验结果为 P=0.100000,虽然不能说是错误,可是不符合习惯用法。

6. 数据统计的准确性文内所给出的各种数据及统计要准确无误,不能前后有别。

有论文的文题是 45 例患者,而在统计表中相加为 47 例,但讨论中又说是 46 例,究竟是多少例患者似乎论文作者自己也说不清,只好退修;更有甚者,修改稿中数字错误更多。

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 对于相对数,当例数较少时,一定要有相应的绝对数,如有的组只有 4 例,治愈 2 例,即报道治愈率为 50%,这显然是不妥的。

在计算构成比或有些率时,一定要注意合计必须是 100%,有的时候因为四舍五入,合计为 99.18%或 100.11%,此时要作调整。

严格地说,要按有效数字的运算法则四舍六入,逢五前位奇进偶舍计算。

数据错误多,说明作者缺乏严肃认真的科学态度。

7. 统计表不规范统计表的设计合理与否,对论文的质量和科学性有重大的影响。

统计表存在的问题主要有⑴表题过于简略,甚至不写表题;或过于繁琐以及标题不确切;⑵标目过多,层次不清;⑶线条过多;⑷表内同一指标的小数位数不一致。

表题应扼要说明统计表的内容, 一般不宜超过 15 个字。

横标目说明各横行数字的涵义,纵标目说明各纵列数字的涵义,必要时在横、纵标目上可冠以总数目。

通常把主语置于横标目,谓语置于纵标目。

表的线条宜少勿多,常用三线表;除顶线、底线以及隔开纵标目与数字的横线外,其余线条均可省去,绝对不要用竖线,特殊情况下加辅助横线。

表内数字一律用阿拉伯数字,同一指标的小数位数应一致,位次对齐。

7 / 8

统计表强调以最小的篇幅说明最多的问题,避免一切不必要的线条与数字、符号和脚注,力戒繁琐,且勿堆累。

若用简洁的文字已能说明问题,则尽量不用表。

如用了统计表,则文中不宜再完全重复其数据,只需强调或描述其主要发现。

同一资料,还要避免统计表与统计图之间的重复。

总之,医学科研论文中所存在的统计学失误,大部分并非是深奥的数学问题,相当部分甚至是些统计学基础知识。

只要我们加强医学统计学继续教育,打下扎实的医学统计学基础,就能减少统计学的失误,进一步提高论文的质量。

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将 27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表 1-4。 经检验,得连续性校正 2 =3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12(9.33) 6(8.67)无效 2(4.67) 7(4.33)合计 14 13 27 有效率(%) 85.7 46.2 66.7 18 9 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数 n=27<40,该医师用 2 检验是不正确的。 当 n<40 或 T<1时,不宜计算 2 值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率案例分析-卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取 140 例胃炎患者分成中药组和西药组,结果中药组治疗 80 例,有效 64 例,西药组治疗 60例,有效 35 例。 1 / 5

医学统计学论文

医学统计学论文 【摘要】大学生是当今社会中的新鲜血液,是新生代的力量。当代大学生的道德素质的层次会直接左右我们的身心健康水平,同时也影响到社会的前进发展。对于当代大学生道德现状的分析调查可以直接的反映出当今社会所存在的问题。大学生的道德取向则是一个社会道德的风向标。所以,提高当代大学生道德素质是当今社会刻不容缓的问题,同时对于社会主义现代化建设也有很重要的意义。本文基于调查问卷所得出的严谨数据,对学校内的大学生道德现状进行客观分析,并得出相应数据。 一、调查目的 1了解现在大学生的社会道德水平。 2关注大学生的发展,以总结现大学生存在的问题。 3分析原因,找到相关的原因。 二、调查设计 1调查对象:郑州大学继续教育学院 2调查时间:2016年9月—2016年10月 3调查方法:采用问卷调查(问卷共30题) 4问卷:发放出书面问卷200份,回收问卷179份 三、数据分析 数据经整理后,采用SPSS17.0统计软件包录入数据并运用独立样本t检验、方差分析和卡方检验进行数据分析。 四、影响因素的分析 为了能更好的来参照男女性别以及年级的不同,从而对调查问卷涉及的问题所给出的不同回答,我们做了诸多的关于性别差异,年纪差异的数据分析。其中也包括了T检验,交叉表等形式,当然,对于道德素质的选材,我们也没有一个硬性的指标来衡量乃至划分层次的高低。一方面,这给我们的调查统计造成了难以精准的障碍,另一方面,在我们的论文阐述中也不易找到相似的文献资料供以参考。尽管有这些不可避免的问题存在,我们小组还是尽量在数据统计分析出的结果中找到相关性。 1,年级差异对道德水平的影响 针对我们调查问卷主要涉及大学生群体的三个年级、大一、大二、大三,我们采用了不同的交叉表等形式来进行分析。

医学论文中统计学处理相关要求

医学论文中统计学处理相关要求 1.统计研究设计: 2.资料的表达与描述: 用x±s表达近似服从正态分布的定量资料、用M(QR)表达呈偏 态分布的定量资料;用统计表时,要合理安排纵横标目,并将数据的含义表达清楚;用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;用相对数时,分母不宜小于20,要注意区分百分率与百分比。 医学论文中统计学处理相关要求 3.统计分析方法的选择: 对于定量资料,应根据所采用的设计类型、资料所具备的条件和 分析目的,选用合适的统计分析方法,不应盲目套用t检验和单因素 方差分析;对于定性资料,应根据所采用的设计类型、定性变量的性 质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用χ2检验。对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实 验数据的回归分析资料,不应简单化处理;对于多因素、多指标资料,要在一元分析的基础上,尽可能运用多元统计分析方法,以便对因素 之间的交互作用和多指标之间的内在联系作出全面、合理的解释和 评价。 4.统计结果的解释和表达: 当P<0.05(或P<0.01)时,应说对比组之间的差异具有显著性(或非常显著性)的意义,而不应说对比组之间具有显著性(或非常显著性)的差别;应写明所用统计分析方法的具体名称(如:成组设计资料的t 检验、两因素析因设计资料的方差分析、多个均数之间两两比较的 q检验等),统计量的具体值(如:t=3.45,χ2=4.68,F=6.79等),应尽

可能给出具体的P值(如:P=0.0238);当涉及到总体参数(如总体均数、总体率等)时,在给出显著性检验结果的同时,再给出95%置信区间。

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

医学统计学-知识梳理

均数±标准差:表示集中位置、离散程度均数±标准误:表示平均水平、抽样误差大小P75 一、标准差的主要作用是估计正常值的范围 实际应用中,估计观察值正常值范围应该用标准差(s),表示为“Mean±SD”。此写法综合表达一组观察值的集中和离散特征的变异情况,说明样本平均数对观察值的代表性。s 的大或小说明数据取值的分散或集中。s与样本均数合用, 主要是在大样本调查研究中, 对正态或近似正态分布的总体正常值范围进行估计。如果不是为了正常值范围估计,一般不用。当数据与正态分布相差很大,或者虽为正态分布, 但样本容量太小(小于30 或100),也不宜用估计正常值范围。 二、标准差还可用来计算变异系数(CV) 当两组观察值单位不同, 或两均数相差较大时,不能直接用标准差比较其变异程度的大小, 须用变异系数系数来做比较。: 标准误的正确使用 一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。在抽样调查中,往往通过样本平均数来推论总体平均数,样本标准误适用于正态或近似正态分布的数据, 是主要描述小样本试验中,样本容量相同的同质的多个样本平均均数间的变异程度的统计量。即如果多次重复同一个试验, 它们之间的变异程度用。显然它越小,样本平均数变异越小,越稳定,用样本平均数估计总体均数越可靠。因此,为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的),应当用描述数据。实际应用中应该写成“平均数±标准误”或而英文表示为“Mean±SE”的形式。 二、标准误还可以进行总体平均数的区间估计与点估计(置信区间)。 根据正态分布原理,与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间,例如常用(其中 (n-1) 为样本容量是n的t界值)表示总体均值的95%可信区间, 意指总体平均数有95%的把握在所给范围内。 三、标准误还可用来进行平均数间的显著性检验,从而判断平均数间的差别是否是由抽样误差引起的。例如:某当地小麦良种的千粒重=34克,现在从外地引入一新品种,通过多小区的田间试验得到千粒重的平均数=克,问新引进品种千粒重与当地良种有无显著差异新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起,所以要进行显著性检验,这里用t测验进行检验,而,由于,故,所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样 误差引起,因此他们之间无显著差异。所以在进行平均数间的显著性检验是必须用到。 总之,标准差和标准误最常用的统计量,二者都是衡量样本变量(观察值) 随机性的指标,只是从不同角度来反映误差,二者在统计推断和误差分析中都有重要的应用。如果没有标准差,人们就无法看出一组观察值间变异程度有多大,这些数字到底有无代表性,如果没有标准误又很难看出我们的样本平均数是否可以代表总体平均数。所以二者都非常重要。 定量资料的统计描述:

医学论文中统计学内容表达的一般要求

医学论文中统计学内容表达的一般要求----医学统计分析 相信大家在临床科研工作中一定遇到过这样的问题:如何在我的医学论文中恰当地报告统计学的有关内容?随着国内外医学期刊审稿标准的日益提高,医学论文统计结果的标准化报告变得越来越重要。今天,小编就跟大家一起分享一下医学论文中统计学内容表达的一般要求。 医学论文除了必备高度概括研究内容的“题目”外,其主体结构主要是由“摘要”、“对象与方法”(有时用“材料与方法”)、“结果”和“讨论”所组成。在论文的不同部分几乎都会涉及到统计学的内容。 一、“题目”及“摘要”中的统计学内容报告 “题目”要求简明扼要,能体现出研究设计的特点。在临床实验报告的“题目”中应能显露出研究设计的信息,比如是平行、交叉或析因设计,是安慰剂对照还是阳性对照,是开放研究还是盲法研究,是否为双盲研究等。 “摘要”是论文核心内容的浓缩,此部分应提供研究设计的信息,表示研究结果的主要统计量的数值、可信区间及假设检验结果,叙述要精炼。 二、“对象与方法”中的统计学内容报告 在此部分中要把统计学的内容充分反映出来,主要包括以下几个方面: 1、统计研究设计的类型和主要做法。 如果属于实验设计,应该指出采用的是完全随机设计、配对设计、交叉设计还是其他类型的设计,给出处理因素及水平、各组样本含量及随机化方法等;如果属于临床试验设计,应指出采用的是随机平行设计、交叉设计、析因设计等,属于第几期临床试验,样本含量如何估计,受试对象如何分组,采用了何种盲法措施等。 2、研究对象的选择及观测方法。 应明确研究对象的特征,有明确的入选和排除标准,确定的主要和次要指标。研究指标的观察方法和测量技术要给予详细说明,以便让读者理解各种措施的合理性和可靠性,并使他人可重复。 3、数据管理及统计分析方法。 对数据收集和整理过程中使用的方法,以及在此过程中使用的质量控制方法进行描述。 三、“结果”中的统计学内容报告 此部分包括了描述和分析两方面内容,可以用文字、表格和图展示研究结果。需要注意以下几个问题: (1)数据结果的精确度。应根据不同分析指标的精度要求而有所不同。 (2)假设检验结果报告及解释。写明所用统计方法的具体名称、统计量的具体值并尽可能给出具体的P值。 (3)可信区间报告。通常给出95%可信区间(国际上许多医学期刊的论文似乎已更倾向于使用可信区间,甚至在有些论文中已找不到P值)。 (4)统计表与统计图。这部分小编准备在下一期给大家详细地介绍一下~ (5)多变量分析结果报告。在进行回归分析时应该给出相应的变量赋值表(需要详细了解各类回归分析的报告模式,就给小编留言吧)。

医学统计学研究生题库

医学统计学复习练习题库 研究生教材使用 一、最佳选择题 1.卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距

E.方差

7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为 A.μ+1.96σ B.μ-1.96σ C.μ+2.58σ D.μ+1.64σ E.μ-2.58σ 12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标 (如血糖水平)的正常值范围一般指 A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围 14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. x s x μ- 2.统计分析的主要内容有

研究生医学统计学上机考试习题

医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1. 某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录 见下表,问左、右肾重量有无不同? 表1: 20例男性尸解时左、右肾的称重记录 编号左肾(克)右肾(克) 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

表2各剂量组48小时部分凝血活酶时间(s) 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13 例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义? 4.某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘 进行监测,结果如下,试检验两者有无相关? 表4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度 城市编号肺癌标化死亡率(1/10万)苯并(a)芘(卩g/100m3) 1 5.60 0.05 2 18.50 1.17 3 16.23 1.05 4 11.40 0.10 5 13.80 0.75 6 8.13 0.50 7 18.00 0.65 8 12.10 1.20

医学统计学案例分析

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3) 该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1 时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见 表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10(7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值

医学统计学论文范文:《医学统计学》与《医学科研方法》内在联系的探讨

医学统计学论文范文:《医学统计学》与《医学科研方法》内在联系的探讨《医学统计学》是运用数理统计学的基本原理与方法,结合医学实际,阐述医学领域研究设计、收集资料、整理资料、分析资料、结果报告与结论表达的一门学科[1]对科研过程中手机的数据进行统计分析,从而得出科研结论。 《医学科研方法》的主要内容包括医学基本科研方法的讲解、医学文献的阅读、医学科研论文的写作等,可以使医药专业的学生了解医学科研的基本方法和基本程序,开阔学生的视野,激发学生对医学科学研究的兴趣以及对专业的热爱。为今后的就业和继续深造做好铺垫。——医生职称论文写作与发表搜论文斧正老师扣号1550116010 等你咨询相关写作和投稿事宜。一次牵手终生相伴,诚信是我们生存的基础,论文创新与质量是我们的前行的动力。加好友咨询吧,在线等您。 随着高校人才培养模式的转变,从原来的培养临床医生转变到了培养全面的医学创新人才。医学创新型人才应有浓厚的创新意识、高尚的创新人格、丰富的创新知识、饱满的创新精神、活跃的创新思维、高超的创新能力、科学的创新实践[2-3]。为了适应这种转变,很多医学类院校都在研究生中开设了《医学统计学》、《医学科研方法》这两门课程,以达到培养全面型人才的目的。近年来,逐渐在本科学生中也开设了这两门课程。 在医学科研相关内容的学习中,《医学统计学》、《医学科研方法》是相辅相成、相互促进的两门课程[4-6],但是我在教学中发现,我校的医学类专业学生的课程设置中,有的专业两门课程都学习了,有的专业只学习了一门课程,两门课程都学习的专业中,有的设置在同一学期,有的设置在不同的学期。为了探讨课程设置的最佳效果,我对这几类班级做了调查。 一、对象与方法 1.1 研究对象 以2012级医学本科本学期开设了《医学统计学》的班级为研究对象,分成三大类,分别是在学习《医学统计学》之前没有学习过《医学科研方法》的班级、在学习《医学统计学》之前的某学期学习过《医学科研方法》的班级、以及在学习《医学统计学》的同时正在学习《医学科研方法》的班级,在这三类中分别随机选择一个班级作为研究对象,称为甲班、乙班和丙班,共208人。这三个班级所使用的《医学统计学》和《医学科研方法》的教材一致,授课学时、内容相同。 1.2 研究方法 采用问卷调查的方式,给研究对象发放调查问卷。 1.3 统计学处理 资料录入和分析均采用SPSS17.0软件,计数资料采用卡方检验的方法进行统计分析。 二、结果 2.1 调查问卷结果 在整个学期的教学结束以后,对所选三个班的同学进行问卷调查,结果见表1、表2。 三、讨论 《医学科研方法》这门课程主要的教学内容为:科研设计的基本概念、科研设计的三要素、科研设计的原则、科研设计的类型、动物实验、医学文献的阅读、医学论文的写作等。《医学统计学》的主要教学内容为:医学统计学的基本概念、数据的分类、t检验、方差分析、卡方检验、非参数检验等。 在本次调查中,上过《医学科研方法》的班级对科研的兴趣和了解比未上过《医学科研方法》的班级要高,差别有统计学意义(P<0.05),这说明医学科研方法确实有开设的必要,能让学生们在本科的学习阶段对科研有所了解,为以后的深造打下基础。 在内容上,医学统计学中学生们会学习到的统计学方法,都是与医学科研方法中学习到的科研设计类型相对应的,在没有上过医学科研方法课程的班级中,就需要教师额外给学生

如何快速准确发现稿件或论文中的统计学错误

https://www.360docs.net/doc/ca11034254.html,/docview-4375.html 如何快速准确发现稿件或论文中的统计学错误 军事医学科学院生物医学统计学咨询中心胡良平刘惠刚 稿件或论文中统计学应用的质量如何,是科研工作者或临床医生撰写论文时,以及杂志编辑或审稿专家审阅论文时,都不可回避的一个问题。一提起统计学,很多人都感到很棘手,认为统计学内容涉及面很宽,应用起来又十分灵活,掌握起来就更困难了,非统计学工作者怎能看出稿件或论文中存在的统计学错误呢!其实不然,只要你具备一些起码的统计学知识,再加上大胆发挥“常识”的作用,你就可以很容易地发现一些常见的统计学错误。本文将教你一些这方面的技巧,请在审阅稿件或论文的统计学错误时试用一下,其效果会让你大为惊喜! (一)检查有无过失误差 很多人在稿件或论文中出现了一些“过失错误”。例如,数据抄写错误或仪器未校准或试剂过期等造成数据不准;同一张表内同一个指标的小数位不一致;统计图中坐标轴上的刻度值违反数学原则(两轴交汇处不是坐标原点、等长的间隔代表不等的数量、横轴上左大右小、纵轴上上小下大);各分项数据之合计与文中所写的合计值不等;正文中所描述的数据与统计表中所列的数据不一致。 例1:原文作者研究非脱垂子宫切除微创手术在妇科的临床应用价值,研究对象的基本情况见表1(略)。 对差错的辨析与释疑:根据原作者在文字叙述部分的介绍可知,CISH组总病例数应为228例,其中子宫>8孕周病例数应为208例,而表1中将总病例数写成208例,将子宫>8孕周病例数写成188例;将TAH写成TAHP,且该组中子宫>8孕周病例数应为182例,而表1中却写成112例。如此多的过失误差出现在同一张表格中,是不应该的。 (二)检查统计学部分的写法 关于文中所用的统计学的交代应非常清楚,不应含糊其词。例如一项研究描述了以下内容:(1)运用SAS(或SPSS)软件进行统计分析;(2)用t检验和方差分析处理定量资料;(3)用χ2检验处理定性资料;(4)用相关和回归分析研究变量之间的关系;(5)用Logistic 回归分析研究各因素对结果的影响。 对差错的辨析与释疑:从(1)的写法只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号,更没有交代文中的资料究竟是采用了哪些统计分析方法处理的。 从(2)的写法只能得知原作者处理定量资料用了两类参数检验方法,即t 检验和方差分析,至于这些统计分析方法选用得是否正确则不得而知。因为通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的t检验有3种、方差分析有10种之多,它们之间的区别体现在定量资料所对应的“实验设计类型”上。讲t检验时,应注明是“单组设计定量资料的t检验”、“配对设计定量资料的t检验”还是“成组设计定量资料的t检验”;讲方差分析时,应注明是“单因素多水平设计定量资料的方差分析”、“随机区组设计定量资料的方差分析”、“拉丁方设计定量资料的方差分析”、“交叉设计定量资料的方差分析”、“x因素析因设计定量资料的方差分析”、“具有x个重复测量的x因素设计定量资料的方差分析”,等等。况且,t检验和方差分析都属于参数检验方法,资料是否满足检验的前提条件,也没有考察。若不满足,即使实验设计类型碰巧对了,计算方法也是错误的。应该选用相应设计定量资料的非参数检验方法,找不到相应的非参数检验方法

生物医学论文中统计结果的表达及解释

生物医学论文中统计结果的表达及解释 【摘要】统计学是生物医学研究所必需的重要手段, 生物医学研究的实验设计、资料收集、数据处理分析以及结论都离不开统计学应用。生物医学研究论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成, 各个部分都涉及统计结果的表达和解释, 统计学是专业结论成立与否的重要依据。统计学应用不当不仅影响论文的科学性, 还有可能得出错误的专业结论。 【关键词】统计学科研论文统计分析统计表达 近年来, 统计学在生物医学科研中的应用越来越受到重视, 统计分析结果的表达及解 释已成为医学科研论文中不可缺少的重要组成部分。除论文涉及的专业(如细胞与分子免疫学杂志为免疫学专业)和表述的文字2个方面外, 统计学是评价论文质量优劣的重要依据, 然而国内生物医学论文中统计学应用仍存在着较为严重的问题[1-4], 如2003年某大学学报拟发表论著中统计方法误用率为57%[3]。细胞与分子免疫学杂志虽然在国内生物医学系列杂志中具有较高的学术地位[5], 但拟发表及刊出论文在科研设计、统计学分析、结果解释等方面也不同程度地存在一些问题, 作者的统计学应用水平有待进一步提高。许多生物医学杂志, 如国外著名杂志JAMA、新英格兰医学杂志(NEJM)和英国医学杂志(BMJ)等, 以及国内中华医学会系列杂志及细胞与分子免疫学杂志等, 对来稿都有统计学表达的基本要 求或统计学指导原则。国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学表达的基本要求。生物医学研究性论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成, 各个部分或多或少都涉及到统计结果的表达和解释问题。例如在论文的“引言”部分需要给出文献复习的综合结果, 如文献报告的组间差别及P值等。其他重要的统计表达和解释主要集中在论文的“摘要”、“材料和方法”、“结果”及“讨论”4个部分[6]。 1 摘要 “摘要”中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设检验结果(P值)。如处理组和对照组的均数(中位数)、标准差(标准误)、率、P值, 或2组均数(率)之差、95%可信区间、OR值及多个观察指标的相关系数等。这些数据是循证医学Meta分析的基本依据。 2 材料和方法 “材料和方法”中的统计学描述包括以下两个方面。 2.1 描述研究设计的内容内容包括研究类型、观察对象类型、入选和剔除标准、观察方法和测量技术以及实验、试验或调查资料的搜集过程等。尤其应具体地描述研究对象的来源和选择方法(如是否配对、随机抽样), 包括观察对象的基本情况、有无随机分组(随机抽样)、随机化分组方法、样本含量及其估计的依据等。对于非随机化分组的观察性研究(含调查研究), 还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。对于临床试验, 还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、依从性如何、

《医学统计学》练习题

《医学统计学》练习题 单选题(在四个答案中选择一个最佳答案) 1. 要反映某市连续5年甲肝发病率的变化情况,宜选用 A.直条图B.直方图C.线图D.百分直条图 2. 下列哪种统计图纵坐标必须从0开始, A. 普通线图 B.散点图 C.百分分直条图 D.直条图 3. 关于统计表的列表要求,下列哪项是错误的? A.横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧 B.线条主要有顶线、底线及纵标目下面的横线,不宜有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用“*”标出,写在表的下面 4. 医学统计工作的基本步骤是 A.统计资料收集、整理资料、统计描述、统计推断 B.调查、搜集资料、整理资料、分折资料 C.设计、搜集资料、整理资料、分析资料 D.设计、统计描述、统计推断、统计图表 5. 统计分析的主要内容有 A. 描述性统计和统计学检验 B.统计描述和统计推断 C.统计图表和统计报告 D.描述性统计和分析性统计 6 制作统计图时要求 A.纵横两轴应有标目。一般不注明单位 B. 纵轴尺度必须从0开始 C.标题应注明图的主要内容,一般应写在图的上方 D. 在制作直条图和线图时,纵横两轴长度的比例一般取5:7 7. 痊愈、显效、好转、无效属于 A. 计数资料 B. 计量资料 C. 等级资料 D.以上均不是 8. 均数和标准差的关系是 A.x愈大,s愈大B.x愈大,s愈小 C.s愈大,x对各变量值的代表性愈好D.s愈小,x对各变量值的代表性愈好 9. 对于均数为μ,标准差为σ的正态分布,95%的变量值分布范围为 A. μ-σ ~ μ+σ B. μ-1.96σ ~ μ+1.96σ C. μ-2.58σ ~ μ+2.58σ D. 0 ~ μ+1.96σ

医学论文常见统计学错误与纠正

医学论文常见统计学错误与纠正 一、设计与实施 1.对象合格标准不明确 ●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论; ●事前未规定合格标准和排除标准,事后排除; ●不报告按照合格标准和排除标准筛选对象的过程。 2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。 常见错误:终点指标过多, 大海捞针 临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!” 生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!” 许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!” 哪些指标可能有组间差异,必须心中有数。 假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说” ●指标多,实验工作量大。大海捞针——碰运气,不是科研! ●指标多,翻来覆去分析,制造假阳性! Nature杂志统计学指南: ?常见错误之一。仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假 阳性)=1 - 0.952 ≈ 0.10, 同时分析 3 个指标时, P(假阳性)=1 - 0.953 ≈ 0.14 同时分析 10个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40 ?常见错误之一(Nature) ----多重比较不校正 多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数) 3 不重视对照 为何必需对照? ●消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同,使两组 的差异主要反映研究因素的效应。 ●鉴别研究因素的效应和自然发展结果。例如,研究某药物对口腔溃疡模型兔的疗效, 口腔溃疡有自愈的倾向,必须有对照扣除自愈效应。 常见错误 ?没有对照!千方百计省去对照组,以减少一半工作量!? 自身前后对照/历史对照/文献对照/ “标准”对照 ?对照不当对照太弱:安慰剂对照/对照过强:西药+加中药~西药/对照剂量有争议:试验药,大剂量~对照药,中小剂量 /对照基线不可比:试验组年轻、病轻 ~ 对 照组年老、病重 应当如何?

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

相关文档
最新文档