常见统计学错误共32页文档

合集下载

医学科研中常见统计学错误(朱继民)总论

医学科研中常见统计学错误(朱继民)总论

第十五章医学科研中常见的统计学错误第一节科研设计中的常见错误一、抽样设计二、实验设计中的随机原则三、实验设计中的对照原则四、实验设计中的重复原则五、实验设计中的均衡原则第二节科研数据描述中的常见错误一、统计指标的选取二、统计图表第三节医学科研统计推断中的错误一、t检验二、方差分析三、卡方( 2)检验四、相关与回归分析五、结论表达不当第十五章医学科研中常见的统计学错误医学科研中,研究者关心的研究对象的特征往往具有变异性;如年龄、性别皆相同的人其身高不尽相同、体重、血型等也都存在类似的现象。

同时,由于研究对象往往很多,或者不知到底有多少,或者研究对象不宜全部拿来做研究;所以人们往往借助抽样研究,即从总体中抽取部分个体组成样本,依据对样本的研究结果推断总体的情况。

恰恰是这种变异的存在,以及如何用样本准确推断总体的需求,使得统计学有了用武之地和发展的机遇。

诚然,合理恰当地选用统计学方法,有助于人们发现变异背后隐藏的真面目,即一般规律。

但是,如果采用的统计学方法不当,不但找不到真正的规律,反而可能得出错误的结论,进而影响研究的科学性,甚至会使错误的结论蔓延,造成不良影响。

作为医学工作者,尤其是科研工作者,必须了解当前医学科研中常见的统计学错误,以便更好地开展科研和利用科研成果。

本章借助科研中统计学误用实例,介绍常见的错用情况,以帮助读者避免类似错误的发生。

第一节科研设计中的常见错误统计学是一门重要的方法学,是一门研究数据的收集、整理和分析,从而发现变幻莫测的表面现象之后隐含的一般规律的科学。

医学科研是研究医学现象中隐含规律的科学,包括基础医学研究、临床医学研究和预防医学研究等,不管哪类医学科研都离不开统计学的支持。

要想做好医学科研,必须掌握一定的统计学知识,如总体与样本、小概率原理、资料的类型和分布、科研设计类型、统计分析的主要工作、常用统计方法以及方法的种类和应用条件等,尤其要了解当前医学科研中常见的统计学错误。

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域,统计分析方法的正确应用对于得出科学、可靠的结论至关重要。

然而,在实际的医学论文中,我们常常能发现各种各样的统计分析方法错误,这些错误不仅影响了研究结果的准确性和可信度,还可能导致错误的临床决策。

下面,我们就来详细梳理一下医学论文中常见的统计分析方法错误。

一、样本量不足样本量的大小直接关系到研究结果的可靠性和普遍性。

如果样本量过小,可能无法准确反映总体的特征,导致统计效能不足,从而得出错误的结论。

例如,在比较两种治疗方法的疗效时,如果每组的样本量只有十几例,那么很可能因为偶然因素而得出错误的差异结论。

二、数据类型错误医学研究中数据类型多种多样,包括计量数据(如身高、体重、血压等)、计数数据(如治愈人数、死亡人数等)和等级数据(如病情的轻、中、重)。

如果对数据类型的判断错误,就会选择错误的统计分析方法。

例如,将本来应该是计数数据的治愈率当作计量数据进行 t 检验,这是不正确的。

三、忽视数据分布许多统计方法都有其适用的数据分布条件。

例如,t 检验和方差分析要求数据服从正态分布。

如果数据不服从正态分布而强行使用这些方法,就会得出错误的结果。

在这种情况下,应该先对数据进行正态性检验,如果不满足正态分布,可以考虑使用非参数检验方法,如秩和检验。

四、多重比较问题在医学研究中,常常需要进行多个组之间的比较。

如果不注意控制多重比较带来的误差,就会增加得出错误阳性结果的概率。

例如,在比较多个药物剂量组的疗效时,如果不进行适当的校正(如 Bonferroni 校正),就可能因为多次比较而错误地认为存在显著差异。

五、相关与回归分析的错误相关分析用于研究两个变量之间的线性关系,但不能得出因果关系。

在医学论文中,有时会错误地将相关关系解释为因果关系。

回归分析中,自变量的选择、模型的拟合度评估等方面也容易出现错误。

例如,没有考虑自变量之间的共线性问题,导致回归结果不准确。

六、生存分析的错误生存分析常用于研究疾病的发生、发展和预后。

常见统计学错误

常见统计学错误

不恰当做法: 视纵向4列为4组数据,进行4组间比较。
多次t检验 ?!
分别作两组比较的t检验,得
A与B t值 P值 3.30 0.02 A与C 2.60 0.03 A与D 3.61 0.01 B与C 0.96 0.37 B与D 0.51 0.63 C与D 1.43 0.19
认为:A与B,A与C,A与D 差异具有统计学意义; B与C,B与D,C与D 差异无统计学意义。
结论:B因素(培养天数)的效应具有统计学意义。
检验 A的主效应:F=1.37,P=0.26 ; B的主效应: F=47.13,P=0.00 A与B的交互效应:F=0.03,P=0.87 结论:B因素(培养天数)的效应具有统计学 意义。
3.剂量-反应关系 不能用单因素方差分析
例3 有人分析蛇毒因子(CVF)的剂量对血液白细 胞噬菌率的影响,得表3的数据,欲讨论剂量-反应 关系。
为什麽不对?
这是典型的两因素2水平的析因设计! i) 有负初衷——分析各因素的效应! ii)直接比较四组资料,组间变异大,不敏感!
正确作法:析因设计的方差分析
i) 主效应:某一因素各水平间的平均差别。 A因素的主效应 =[(第三组均数+第四组均数)(第一组均数+第二组均数)] / 2 =[(2.2+1.9)(2.5+1.8)]/2 = 0.1 ii) 交互效应:若某因素的单独效应随另一因素水平的变化而 有较大变化,则称这两个因素间存在交互效应。
正确作法:随机区组资料的方差分析
将处理间的差别与扣除区组间变异后的随机误差 进行比较,识别差异的能力大大提高。 本例, 处理组间 F=8.23, P=0.003 差别有统计学意义 区组间 F=1.21,P=0.36 差别无统计学意义

常见统计学错误

常见统计学错误

常见统计学错误在人类社会发展的过程中,数据的重要性越来越被人们所重视。

统计学作为一门应用于数据处理、分析和解释的学科,被广泛运用于各个领域。

然而,由于统计学的复杂性和数据的多样性,常常会出现一些常见的统计学错误。

本文将会从统计学的角度对一些常见的错误进行分析。

错误一:关联误解许多人将相关性错误地解释为因果性,这是一个常见的误解。

例如,某个人认为他成功的原因是他经常使用的运动饮料,因为他发现当他使用该饮料时,他通常表现出更好的成绩。

然而,这种关联并不代表因果性。

在这种情况下,运动饮料与优秀的表现可能只是因为二者之间存在其他因素的原因。

错误二:回归分析回归分析是一种非常有用的分析方法,可以用来探索变量之间的关系。

但是,如果分析方法不正确,就可能会导致错误的结论。

例如,如果回归模型中使用了错误的自变量或母体数据,甚至丢失了一些因素,那么得到的结果就可能是不准确的。

错误三:样本选择偏差样本选择偏差是指样本失去代表性,不符合总体规律的现象。

这种情况可能会导致结果的不准确,因为样本无法代表总体。

例如,在研究城市居民身体健康的研究中,如果仅仅选择某一小部分正常体型、有规律的情况,而忽略了任何超出这个范围的人,那么这个研究的结果将忽略其他身体健康状况的可能性。

错误四:误差概率统计分析必须包括在结果中发现的误差概率。

虽然有时误差会被忽略,但没考虑误差的影响会导致结果的不确定性和不准确性的增加。

例如,考虑一个零件生产厂家使用的质量控制方法。

如果该厂家仅仅进行一次样本检查,而没有考虑样本选取的偶然性,那么可能无法获得正确的结果。

错误五:推断推断通常用于从一个样本中推广一个总体结论。

但是,如果样本不够大或者不够代表性,那么结果就不能代表总体。

例如,在某一工厂中,如果只从少数员工中调查了病假的问题,那么结果可能并不具有代表性,不能推广到整个员工群体。

总之,正确的统计分析至关重要,结果的准确性直接影响到实际应用的结果。

因此,在进行统计分析时,务必要注意常见的统计学错误,避免这些错误并提高数据分析和结论推断的准确性。

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域,准确合理地运用统计分析方法对于得出可靠的研究结论至关重要。

然而,在实际的医学论文中,却存在着各种各样的统计分析方法错误,这些错误可能会导致研究结果的偏差,甚至得出错误的结论。

下面,我们就来详细探讨一下医学论文中常见的统计分析方法错误。

一、数据类型判断错误数据类型的正确判断是选择合适统计分析方法的基础。

医学研究中常见的数据类型包括计量资料、计数资料和等级资料。

然而,很多研究者在数据类型判断上出现失误。

例如,将原本应该是计数资料的数据(如疾病的治愈、好转、无效等)当成计量资料进行分析,错误地使用了均值和标准差等统计指标,而应该使用频率和百分比等指标,并采用卡方检验等方法。

二、样本量计算不合理样本量的大小直接影响到研究结果的可靠性和准确性。

一些医学论文在研究设计阶段没有充分考虑样本量的计算,导致样本量过小或过大。

样本量过小,可能会使研究结果缺乏统计学意义,无法检测出真实存在的差异;样本量过大,则会造成资源的浪费,同时增加研究的难度和成本。

正确的样本量计算应该综合考虑研究的设计类型、预期效应大小、检验水准和检验效能等因素。

三、选择错误的统计方法这是医学论文中常见的错误之一。

例如,对于两组独立样本的均数比较,应该使用 t 检验,但如果两组数据的方差不齐,就需要使用校正的 t 检验或者非参数检验方法(如 Wilcoxon 秩和检验)。

然而,很多研究者在这种情况下仍然使用了普通的 t 检验,导致结果不准确。

再比如,对于多组均数的比较,如果方差分析结果有统计学意义,还需要进一步进行多重比较。

但有些研究在这一步没有进行恰当的多重比较方法选择,导致结论不够准确。

四、忽视数据的正态性检验在进行某些统计分析(如 t 检验、方差分析等)时,要求数据服从正态分布。

然而,很多研究者在使用这些方法之前,没有对数据进行正态性检验。

如果数据不服从正态分布,却仍然使用基于正态分布假设的统计方法,就会得出错误的结论。

医学论文中的常见统计学错误

医学论文中的常见统计学错误
医学论文中 的常见统计学错误
中国疾病预防控制中心 金水高
精品课件
正确的统计学方法必须贯 穿于从课题的统计设计 到论文撰写的全过程。
精品课件
不管是实验室研究、临床研究还是现场调查, 其数据的归纳整理,都要列成一定的标准格 式,以便于进行计算机的录入及统计分析。 其基本要求为: 1. 横为记录,纵为变量 2. 对每个变量要起合适的变量名 3. 对分类变量中用字符表示的取值在进行计 算机录入时必须按照一定的规矩将其转换为 数值。
一、计数资料分析中的常见错误举例
1.率与构成比 2.某研究想了解筛查与自查相比发现的肝癌病例分期是 否存在差异,是否筛查更能发现早期肝癌病人。
精品课件
一、计数资料分析中的常见错误举例
1. 率与构成比(续)
精品课件
一、计数资料分析中的错误举例
2. 样本量/阳性例数较少时的统计分析
年龄别 123451015合计
对照(一水平) 1
1.56 3.56
0.86
二水平
0.64
1
0.44
1.81
三水平
0.28
2.28
1
4.14
四水平
1.16
精品课件
0.55 0.24
三、 Logistic 回归中的主要统计学错误
4. 比数比及相对危险度的正确解释 某文献在研究影响妇女产前检查的可能因素时,拟合了
一个Logistic回归模型。在进行分析后,认为‘由于 量纲相同’,可以由回归系数的绝对值‘直接判定’ 它们与产前检查关联强弱。其结论为:孕产期卫生知 识〉妇女文化程度〉妇女年龄〉丈夫文化程度〉丈夫 职业〉家庭距卫生院距离。
2.这些数据的属性:是定性还是定量资料。 确定了所关心的研究产出后,其它的变量就都可以解释为是这

医学期刊论文中常见统计学错误

医学期刊论文中常见统计学错误
l . 4. 01
c r n r c l in i P te t t ne me it ibii o o a o cuso n a ins wi i tr d ae v a l— y h t y:v le o o d s d b tm ie a d c nr s—nh n e au flw— o e o u a n n o ta te a c d 3一 RIi r dc igf ncin lr c v r n P te t - TM n P e itn u to a e o e i a insun y d r on ru a e usrv s u a iai nwihdr —l tn e g ig Pec t n o e a c l rs to t ug eui g
gn n me i s h mi a d o 0 ah . a d - i g i n w t ic e c c r i my P ty Am J C r i h
o , 0 4, l 2 0 93: 461 1 64. 1 —4
F o c i F,S u a F,DiGio a , t a . Ch o i o a ic h g r r l mo A e 1 r nc ttl
l to a i n,2 0 1 0 4, 09: 7 21 4. 21 2— 7
[ 3 赵蕾 , 1] 张兆 琪 . 血 管 分 子影 像 学 成 像 对 比 剂 的 新 进 心
展 . 肺血 管 病 杂 志 ,0 9 2 :3 —3 . 心 2 0 ,8 17 1 9
(0 9—0 2 20 7— 8收 稿 ; 0 9—0 0 20 9— 7修 回)
活 的研 究 [ 4 附 7例 分 析 ] 中华 放射 学 杂 志 ,0 28 . 20 ,:

常见统计学错误

常见统计学错误

资料表达与描述中存在的统计学错误
• 误用正态分布法描述呈偏态分布的资料 • 以“比”代“率”或以“率”代“比” • 计算相对数时分母太小
• 统计表不规范:纵、横标目颠倒,统计表中数据含义不清、 同一表中表达不同的内容
• 统计图不规范:同一个复式条图表达多个指标、用复式条 图表达适合用线图表达的资料、用线图表达适合用复式条 图表达的资料、统计图坐标轴上的刻度不符合验科 张家明
• 常见的错误涉及到统计研究设计、统计
资料的收集与整理、统计描述、定量资
料统计分析、定性资料统计分析、直线
相关与回归分析、统计资料综合分析和
统计分析结果解释等。
设计、收集和整理方面的统计学错误
• 缺乏完善的实验设计方案 • 设计时未遵循实验设计的基本原则: -对照:缺乏对照组、重复设置对照组、对照不全、 对照组的设立与研究目的不符 -随机:以随意代替随机 -重复:样本含量过小、仅测量一个样品即做出结论 -均衡:组间的均衡性差 • 缺乏与设计类型相匹配的收集实验数据的表格 • 未按照实验数据类型的要求进行实验和收集数据
定量资料分析中存在的统计学错误
• • • • • • 应用参数统计分析方法分析非参数资料 2 用 检验分析定量资料 用成组设计资料的 t 检验分析配对设计的资料 用 t 检验分析多样本均数的资料 用 t检验和一般方差分析处理带有协变量的资料 用单因素多水平设计资料的方差分析处理析因设 计资料或具有一个重复测量的两因素设计资料
定性资料分析中存在的统计学错误
• 误用定量资料统计分析方法,如:误用 t 检验分 析四格表资料、双向无序列联表资料、单向有序 列联表资料
2 • 用 检验分析单向有序的列联表资料
• 用 2检验分析双向有序且属性相同的列联表资料 • 用一般 2检验分析三维列联表资料
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档