常见统计学错误
医学期刊论文中常见统计学错误

心肺血管病杂 志 2 0 1 4年 1 月第 3 3卷第 1期
J o u r n a l o f C a r d i 0 v a s c u l a r&P u l mo n a r  ̄ D i s e a s e s , J a n u a r y 2 0 1 4 , V o 1 . 3 3 , N 0 . 1
发症死 亡者 占 3例 ( 2 5 %) , 说 明术 后抗 凝 是 换瓣 术
[ 3] R o b e t r s WC .Mo r p h o l o g y i c f e a t u r e s o f t h e n o r m a l a n d a b n o ma r l
mi t r a l v a l v e . Am J Ca r d i o 1 .1 9 8 3. 5 1: 1 0 0 5.
[Байду номын сангаас4] Z i l e MR, T o m i t a M,I s h i h a r a K, e t 1. a C h a n g e s i n d i a s t o l i c f u n c ・
( L A D) : ( 6 8 . 4±6 . 5 ) m m等。 5 . 随访 结果 分 析
[ 2] G e n g Z J .A t e n y e a r s e x p e i r e n c e w i t h 6 1 3 mi t r a l v a l v e r e p l a c e —
me n t s . Ch u n g Hu a Wa i Ko Ts a C h i h, 1 9 8 9, 2 7: 5— 8.
本组患者术后 1 3年 的存 活率达 6 2 . 2 %, 该结
医学期刊论文中常见统计学错误

型 中 , 手术 时 间 控制 在 2 i , 低 度 肝 素化 若 0mn内 则 (0 / g 既 可保 证 手 术 的安 全 性 又可 缩 短 徒 手 10U k )
Bic mpai lt o ph s hoy e oi e o t d tn s n oo tbi y f i o p rl h ln c ae se t i
验操作 中应根 据所 建 模 型 的情 况 , 择合 适 的肝 素 选
剂量 , 免大 出血 的风险 。 避 总之 , 该研 究 证 明在 冠状 动 脉再 狭 窄小 型 猪模
1 统计表达 和描述方面存在 的错误 : 1 统 计表 中数 据 的含义未表 达清楚 , . () 令人 费解 。( ) 2 统计 图方面 的主要错 误有 2
个, 其一 , 坐标轴上 的刻度值是随意标上去的 , 横 等长 的间隔代表 的数 量不等 , 在直角 坐标 系 中, 从任何一 个数值开 始作为横 轴或纵轴上的第 一个 刻度值 ; 其二 , 用条 图或复式条图表达 连续 性变量的变化趋势 ; 3 运用相 对数时 , 常混 淆“ () 经 百分 比” 与
陈 明 , 新 刚 , 博 , . 状 动 脉 再 狭 窄 家 猪 模 型 中 王 郑 等 冠
普通肝 素 用 量 的探 讨 . 国 介 入 心 脏 病 学 杂 志 , 中
20 08, 6: 25・ 7. 1 2 22
Wh ln DM , n e e s nW J Kr b e d m C,ta. ea Va d rGis e , a b n a S e 1
医学期刊论文中常见统计学错误

V a l v e 系统 也 在 临 床 应 用 , 小 儿 常 用 于肺 动 脉 瓣 ,
主 动脉 瓣 主要应 用于 老年人 。近年来 还 出现 了超声
总之 , 心 脏瓣 膜 成形 手术 仍是 先 天性 瓣 膜疾 病 的首选 治疗 手段 , 但术 后残余 狭 窄 、 反流 发生概 率仍 较高 , 特别 是远期 疗效 不确 实 , 二 次成形 或瓣膜 置换
肺血管病杂志 2 0 1 3 年1 1 月第 3 2卷第 6 期
J o u m a 1 o f c a r d i o v a s c u 1 a r &P u l m o n a r y D i s e a s e s , N o v b e r 2 0 1 3 , V 0 1 . 3 2 , N n . 6
t 检 验或 单 因素 多水平设 计 定量 资料 的方差 分析 。 3 . 定性 资 料统计 分析 方面存 在 的错误 : ( 1 ) 把x 检验误认 为是处 理定性 资料 的万 能 工具 ; ( 2 ) 忽视 资 料 的前 提条 件而 盲 目套 用 某些定 性 资料 的统计 分析 方法 ; ( 3 ) 盲 目套 用秩 和检验 ; ( 4 ) 误用 x 检 验 实现定 性 资 料 的相关 分析 。 4 . 简 单线 性相关 与 回归分 析 方面存 在 的错误 : ( 1 ) 缺乏专 业 知识 , 盲 目研 究某 些 变量 之 间 的相互 关 系和 依赖 关 系 ; ( 2 ) 不绘 制 反 映 2个 定 量 变量 变 化趋 势 的散 布 图 , 盲 目进行 简 单线 性相 关 与 回归分 析 , 常 因某 些 异常 点 的存在 而得 出错 误 的结论 ; ( 3 ) 常用 直 线 取代 2定量 变 量 之 间事 实上 呈 “ s形 或 倒 s形 ” 的 曲线 变 化
几种常见医学统计学错误辨析报告

小组分工组长:房军伟:整个报告的统筹安排组员:王利苹 、郑宁宁:PPT的制作 周文斌:演讲涂亮星及其他组员:解答问题组长:房军伟(22011043)组员:涂亮星(22011037)、王利苹(22011038)、 周文斌(22011039)、郑宁宁(22011044)报告内容实验设计存在的典型错误统计方法误用实验设计原则均衡重复对照随机违反均衡性原则“重复取样”替代“独立重复”缺乏对照、对照不全或不当未遵循随机原则未遵循随机原则实例:在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎 99 例,采用同期的、接受一般治疗的 73 例该病患者作为对照,治疗组选择发病在 5 d 以内的患者,加用干扰素和三氮唑核苷静滴,疗程 5 ~7 d 。
两组比较疗效差异有显著意义,结论是在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎的疗效优于一般治疗的疗效两组治疗效果比较组别例数治愈好转死亡病死率(%)治疗组9988101 1.01对照组736085 6.85丁思美.小剂量干扰素加三氮唑核苷治疗流行性乙型脑炎 99 例分析[J].江苏医药,1997,23(6):428.未遵循随机原则辨析作者人为地选择发病在 5 d 以内的患者进入治疗组,而对照组则没有此限制根据常识,早期治疗对疾病的预后具有重要影响,往往具有较高的治愈率和较低的病死率因而治疗组和对照组由于人为因素的干扰和影响,在病程这一重要的非实验因素上并没有达到均衡,不具有可比性正确做法对照组也应选择发病在 5 d 以内的患者在实验分组时遵循随机的原则,使患者都有相同的机会进入治疗组和对照组对照不全实例:将24只大鼠随机分成3组,每组8只。
正常对照组用生理盐水灌胃,激素组用氢化可的松灌胃,补骨1号合用激素组用氢化可的松灌胃的同时加用补骨1号。
实验一段时间后,测定骨小梁面积等定量指标,经分析认为补骨1号有防治类固醇性骨质疏松的作用辨析此实验涉及两个因素,即“激素用与否”和“补骨1号用与否”若此两因素存在着交互作用,则第三组的效应就包括激素的效应、 补骨1号 的效应 、以及他们共同作用的效应本实验只安排了激素组,并没有安排单用补骨1号组,实际分析时就 不能将两因素之间可能存在的交互作用的效应反映出来,而有可能 将交互作用的效应归结为单用补骨1号的效应对照不全实例:将24只大鼠随机分成3组,每组8只。
统计学常见的三种误差

统计学常见的三种误差
抽样误差指的是抽取样本时,由于样本的随机性,导致样本与总体存在偏差的情况。
解决抽样误差的方法是增加样本容量、使用更好的抽样方法和减少样本的偏倚。
测量误差是指测量工具本身存在的误差,如人的主观判断、仪器的误差、实验方法的误差等。
解决测量误差的方法是使用更准确的测量工具、改进实验方法和使用多种测量方法。
非随机误差是指由于未知因素的影响,导致数据存在偏差的情况,如偏差选择、数据处理不当等。
解决非随机误差的方法是在实验设计中减少偏差选择、使用合适的数据处理方法和进行数据验证。
- 1 -。
医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域,准确合理地运用统计分析方法对于得出可靠的研究结论至关重要。
然而,在实际的医学论文中,却存在着各种各样的统计分析方法错误,这些错误可能会导致研究结果的偏差,甚至得出错误的结论。
下面,我们就来详细探讨一下医学论文中常见的统计分析方法错误。
一、数据类型判断错误数据类型的正确判断是选择合适统计分析方法的基础。
医学研究中常见的数据类型包括计量资料、计数资料和等级资料。
然而,很多研究者在数据类型判断上出现失误。
例如,将原本应该是计数资料的数据(如疾病的治愈、好转、无效等)当成计量资料进行分析,错误地使用了均值和标准差等统计指标,而应该使用频率和百分比等指标,并采用卡方检验等方法。
二、样本量计算不合理样本量的大小直接影响到研究结果的可靠性和准确性。
一些医学论文在研究设计阶段没有充分考虑样本量的计算,导致样本量过小或过大。
样本量过小,可能会使研究结果缺乏统计学意义,无法检测出真实存在的差异;样本量过大,则会造成资源的浪费,同时增加研究的难度和成本。
正确的样本量计算应该综合考虑研究的设计类型、预期效应大小、检验水准和检验效能等因素。
三、选择错误的统计方法这是医学论文中常见的错误之一。
例如,对于两组独立样本的均数比较,应该使用 t 检验,但如果两组数据的方差不齐,就需要使用校正的 t 检验或者非参数检验方法(如 Wilcoxon 秩和检验)。
然而,很多研究者在这种情况下仍然使用了普通的 t 检验,导致结果不准确。
再比如,对于多组均数的比较,如果方差分析结果有统计学意义,还需要进一步进行多重比较。
但有些研究在这一步没有进行恰当的多重比较方法选择,导致结论不够准确。
四、忽视数据的正态性检验在进行某些统计分析(如 t 检验、方差分析等)时,要求数据服从正态分布。
然而,很多研究者在使用这些方法之前,没有对数据进行正态性检验。
如果数据不服从正态分布,却仍然使用基于正态分布假设的统计方法,就会得出错误的结论。
统计学中的误差类型

统计学中的误差类型统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。
在进行统计分析时,我们常常会遇到误差。
误差是指由于各种原因导致的数据与真实值之间的差异。
了解误差类型对于正确解释和使用统计数据至关重要。
本文将介绍统计学中常见的误差类型。
一、抽样误差抽样误差是由于样本选择不完全代表总体而引起的误差。
在统计学中,我们通常通过从总体中随机选择样本来进行研究。
然而,由于样本的随机性,样本可能无法完全代表总体。
因此,样本统计量与总体参数之间会存在差异,这就是抽样误差。
抽样误差的大小取决于样本的大小和抽样方法的选择。
二、测量误差测量误差是由于测量工具或测量方法的不准确性而引起的误差。
在统计学中,我们经常需要测量各种变量,如身高、体重、温度等。
然而,由于测量工具的限制或人为因素的影响,测量结果可能与真实值存在差异。
测量误差可以通过校准仪器、提高测量技术和减少人为因素来减小。
三、随机误差随机误差是由于随机因素引起的误差。
在统计学中,我们经常使用概率模型来描述随机现象。
然而,由于随机性的存在,我们无法预测每次实验或观察的具体结果。
随机误差是由于随机因素的影响而导致的数据波动。
通过多次重复实验或观察,我们可以通过统计方法来估计随机误差的大小。
四、系统误差系统误差是由于系统性因素引起的误差。
与随机误差不同,系统误差是由于固定因素的影响而导致的数据偏差。
系统误差可能是由于测量仪器的偏差、实验条件的变化或操作者的主观判断等原因引起的。
系统误差是一种常见的误差类型,它可能导致数据的偏差和不准确性。
减小系统误差的方法包括校准仪器、标准化实验条件和培训操作者等。
五、非响应误差非响应误差是由于样本中某些个体选择不回答或提供不准确信息而引起的误差。
在调查研究中,我们通常通过问卷、访谈等方式收集数据。
然而,由于个体的主观意愿或其他原因,一些个体可能选择不回答或提供不准确的信息,从而导致非响应误差。
非响应误差可能导致样本的代表性受到影响,从而影响统计结果的准确性。
医学期刊论文中常见统计学错误

c r n r c l in i P te t t ne me it ibii o o a o cuso n a ins wi i tr d ae v a l— y h t y:v le o o d s d b tm ie a d c nr s—nh n e au flw— o e o u a n n o ta te a c d 3一 RIi r dc igf ncin lr c v r n P te t - TM n P e itn u to a e o e i a insun y d r on ru a e usrv s u a iai nwihdr —l tn e g ig Pec t n o e a c l rs to t ug eui g
gn n me i s h mi a d o 0 ah . a d - i g i n w t ic e c c r i my P ty Am J C r i h
o , 0 4, l 2 0 93: 461 1 64. 1 —4
F o c i F,S u a F,DiGio a , t a . Ch o i o a ic h g r r l mo A e 1 r nc ttl
l to a i n,2 0 1 0 4, 09: 7 21 4. 21 2— 7
[ 3 赵蕾 , 1] 张兆 琪 . 血 管 分 子影 像 学 成 像 对 比 剂 的 新 进 心
展 . 肺血 管 病 杂 志 ,0 9 2 :3 —3 . 心 2 0 ,8 17 1 9
(0 9—0 2 20 7— 8收 稿 ; 0 9—0 0 20 9— 7修 回)
活 的研 究 [ 4 附 7例 分 析 ] 中华 放射 学 杂 志 ,0 28 . 20 ,:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常见错误
只报告来源和时间段,总体不清晰:大杂 烩,得不到科学结论;
事前未规定合格标准和排除标准,事后排 除;
不报告按照合格标准和排除标准筛选对象 的过程。
应当如何? ---- 防止总体的异质性
在Kenyatta National Hospital 家庭福利中心要求 宫内避孕装置IUCD的所有妇女, 有正常月经,年龄 在20与44岁之间均可纳入研究。如果发生以下任何 一项,不可进入研究:(1)异位妊娠史,(2)前42天内 怀孕,(3)子宫平滑肌瘤,(4)现患骨盆炎性疾病PID, (5)宫颈或子宫内膜恶性肿瘤,(6)已知四环素过敏, (7)前14天内用过任何抗生素或曾用长效注射青霉素, (8)弱感染反应,(9)Nairobi以外的居民,随访地址不 详,或不愿返回做随访。
(3)允许犯假阳性错误的机会 5%
(4)允许犯假阴性错误的机会 20%
计算: 176 例
5. 随机化,说而不做,做而不严
处理分配的随机化为什么这么重要? (1) 消除分配处理有意或无意的偏倚。 (2) 为实施盲法创造条件。 (3) 使得有可能利用概率论来说明:各干预组
之间的差异有多大可能仅仅是由偶然性 造
消除非研究因素的混杂
实验组和对照组受非研究因素的影响尽可能 相同,使两组的差异主要反映研究因素的效应。
常见错误 1:没有对照!
千方百计省去对照组,以减少一半工作量!? 自身对照 历史对照 文献对照 “标准”对照
常见错误 2:对照不当
对照太弱:安慰剂对照 对照过强:西药+加中药~ 西药 对照剂量有争议:
2. 结局指标多而杂
“primary outcome measure”是事先规定的最重要 的结局指标,通常以此为准来计算样本量。
“secondary outcome measure” 可以几个,但不宜 太多
常见错误:终点指标过多, 大海捞针
临床试验时,不知道哪个指标在组与组间有差异; “确定某个指标后,万一组间没有差异,岂不被 动!”
试验药,大剂量~ 对照药,中小剂量 对照基线不可比:
试验组年轻、病轻~ 对照组年老、病重
பைடு நூலகம் 应当如何?
事先明确研究假说 XX 比 YY 好 : 以 YY为对照
设计: 研究组 XX ~ 对照组YY 研究组与对照组: 基线可比、过程可比、终点可比
措施: 干预性研究: 随机化 观察性研究:匹配
4. 样本量无根据
Bonfferoni 校正
当同一组数据同时作k次分析时,
若 限定犯假阳性错误的概率总共不超过 ,
则 每次分析要用 / k 来控制假阳性的概率。
例
0.05, k 10,
0.005
k
3. 不重视对照
为何必需对照? 鉴别研究因素的效应和自然发展结果
例如,研究某药物对口腔溃疡模型兔的疗效, 口腔溃疡有自愈的倾向,必须有对照扣除自愈效应
干预性研究: “ xx 例患者随机分成两组……” 为什麽xx 例?不多不少? xx 例从天而降?现成送上门来?
观察性研究: “ 10年期间A组3000例,B组258例……” ---- 有多少用多少!?
应当如何? ---- 报告最小样本量估算及其依据 1. 比较两组测定值的均数
依据:
(1)预计欲比较的两总体参数的差值
(2)预计总体标准差 (3)允许出现假阳性结果的机会 (4)允许出现假阴性结果的机会
例:格列美脲、 格列苯脲对比研究 以HbA1c 为主要终点
报告依据 1. 欲检出HbA1c临床差异≥0.65% 2. 假定标准差为1.3% 3. 双侧检验水平0.05 4. 功效80% 退出率20% 计算:157例
应当如何? ---- 报告最小样本量估算及其依据
2. 比较两组达标率 依据:
(1)预计一组发生某结局的百分比为 1 (2)预计另一组发生某结局的百分比为 2
(3)允许犯假阳性错误的机会
(4)允许犯假阴性错误的机会
例:格列美脲、 格列苯脲对比研究 以HbA1c达标为主要终点
(1)预计一组发生某结局的百分比为 45% (2)预计另一组发生某结局的百分比为 25%
同时分析 3 个指标时,
P(假阳性)=1 - 0.953 ≈ 0.14
同时分析 10 个指标时,
P(假阳性)=1 - 0.9510 ≈ 0. 40
常见错误之一(Nature) ----多重比较不校正
多重比较: 对一组数据作多项比较时,必须 说明如何校正α 水平,以避免增大第一类错 误的机会
如何校正?
生理、生化、组织学、基因,都做; “内容丰富,显得水平高!”
许多仪器一下子可以做许多项目; “许多项目一一分析,哪个有意义,就报告哪个指 标!”
错在哪里?
哪些指标可能有组间差异,必须心中有数。 假说:预计将要得到的结论 —— 假说是科研的灵魂 心中无数,不要“先上马再说”
指标多,实验工作量大。 大海捞针—— 碰运气,不是科研!
指标多,翻来覆去分析,制造假阳性! Nature杂志统计学指南:常见错误之一。
翻来覆去分析,会制造假阳性?!
仅分析一个指标时,
P(假阳性)=0.05,
P(一次分析不犯错误)=0.95
同时分析 2 个指标时,
P(2 次分析均不犯错误)= [P(一次分析不犯错误)]2
P(假阳性)=1 - 0.952 ≈ 0.10
成的。
说错和做错
将随机化当作“廉价名词”,实际没做, 却写: “随机分成两组” —— 科研道德?
将“随意分组”当作随机化 将“机械分组”当作随机化 略去筛选过程,简单地报告将多少人随机分
组 略去实施过程中丢失对象,将最后两组人数
说成是随机分组人数
应当如何?
成功的随机化取决于: (1)产生一个不可预见的分配序列; (2) “隐蔽” (allocation concealment )这个 序列,直到分配完毕(必须建立一个分配处 理的系统) 。
医学论文常见统计学错误与纠正
I. 设计与实施 II.分析与结果
1. 对象合格标准不明确
“Eligibility criteria”:年龄、性别、临床诊断 、 病情…
“Exclusion criteria”:常为保障病人安全 目的: 1. 读者据此判断研究结果可以应用到什么范围 2. 统计学:明确总体