几则很有趣的医学统计学故事
统计学小故事-1

统计学小故事-1今天的临床工作中经常遇到统计问题,绝大部分是在科研和实验当中遇到,不过说起来我们临床实际工作中的指南和课本上的理论,在现代的医学来讲也是用无数和科学的统计得到的理论体系和或者共识意见。
虽然这些理论和共识意见有可能很快就被更新。
说了些没有太多用的套话,实际一点的就是,我们在读文章的时候总会遇到统计学内容和成分。
虽然有些文章和文献快速阅读的方法是阅读文章摘要和看看结论,甚至更细致一些的会看看讨论;而具体文章中所用的统计学方法和计算理论往往是不熟悉的,比如卡方检验、T检验、meta分析等;说实话,每当读到这一块的时候,很多人会选择自然略过。
今天就“科学的工作”开一个头,或者做个引子。
以后会陆续对于统计学的内容进行一点一点复习。
今天的主要内容是听个统计学有关历史的故事。
这部分来源于《罗辑思维》的脱口秀。
当我听到这段内容时还是非常敬佩的,非医学专业的人在医学统计学的历史方面有如此的见识,值得点赞。
虽然这期内容“你还信中医吗?”带有明显的“反中医”色彩,也遭到了“中医粉”的谩骂,但这些并不重要,而他所讲的的这个随机双盲对照实验(RCT)讲得通俗易懂,逻辑流畅,是我们“复习”的典范。
这里主要讲了通过放血疗法退出历史舞台等内容自然引出“对照-双盲(盲测)-随机-大样本”的叙述流程。
之前还讲述了如何发现确切治疗坏血病的方法,这里没有引用。
这里所讲述的内容,在科学研究方面讲的还是比较明白的。
这里说的了“中医”是“朋友翻脸,割席断交”的话题。
首先我们既不是中医粉也不是完全反对中医,只是客观地看待历史文化与现代科学引领下的医学体系。
我们只是学习统计的小知识,带着学习的态度去阅读某一方面的内容,目前不涉及有关话题的立场问题。
以免真的惹出麻烦。
放血疗法退出历史舞台、安慰剂对照与RCT有10分钟的内容,不喜欢的直接略过,建议WIFI观看其实除了读文献资料可以遇到统计问题之外,那么在写文章时是必然会遇到的(除综述与个案报道外),比如实验设计,统计指标的选择,统计方法的选择,题目立意的选择等都可能与统计相关。
有趣的医学故事1000

有趣的医学故事1000最经典的也是最广为流传的上世纪医学最伟大的发现青霉素。
弗莱明的丘吉尔的基情轶事。
然而二十世纪对科学贡献最大的人或许另有其人现代做医学研究的一定听说过海拉细胞系一位来自美国农村的黑人妇女她促成了二十世纪的重大医学突破,包括小儿麻痹症的疫苗(十年前国内影视作品中很多出现小儿麻痹症,现在已经在中国消灭了),癌症化疗,基因复制,基因图谱,体外人工受精。
被带到太空里研究细胞融合,也被用于原子弹对细胞伤害的评估研究。
本世纪五个诺贝尔奖是基于海拉细胞系的研究。
1951年1月,30岁的Lacks发现自己的腹部出现了一个硬块,随即前往约翰·霍布金斯大学医院接受治疗。
诊断结果显示,Lacks患上了子宫颈癌。
在其不知情的情况下,其主治医生采集了Lacks身上的癌组织标本。
同年10月,Lacks去世了,但是从Lacks身上采集的细胞却没有死亡,出现了生长迹象,每隔24小时细胞数量就增加一倍,并被称为“不死”细胞。
1973年科学家找到了海拉的家人,海拉家人开始追回海拉细胞系的所有权。
终于在62年后的2013年取回的海拉细胞所有权。
在以后的岁月中,海拉细胞被提供给了世界各地的研究机构,用于癌症研究和制药等。
海拉细胞曾被用于调查原子弹爆炸对人体造成的影响,也曾搭载美国和苏联的火箭升空,被人们用于研究失重状态下的细胞增殖。
据医学及生物学数据库“PubMed”显示,与海拉细胞有关的论文数超过了65000份。
进入21世纪以来,已经有5个基于海拉细胞的研究成果获得了诺贝尔奖,其中包括“发现HPV”、“发现及开发绿色荧光蛋白质”等。
海拉细胞已经成为医学研究中十分重要的工具。
迄今为止,海拉细胞已在单细胞状态下活了18000代,相当于人类的45万年!据推算,迄今为止培养出的海拉细胞已经超过了5000万吨,其体积相当于100多幢纽约帝国大厦。
当年,Lacks并不知道自己的细胞已经被用于医学研究,直到20多年之后,Lacks的家属才知道海拉的细胞至今依然存活,继续为人类健康发挥着积极作用。
分享医学统计学科研实验中的几个小故事

医学统计学是一门很值得医生朋友们学习的科学。
只要熟练掌握了,绝大多数的科学研究都不在话下。
然而,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。
很多医生朋友在学习医学统计学时,都抱着一副“比葫芦画瓢”的态度,试图套用统计学方法来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。
笔者在这里和大家分享几则与医学统计学相关的小故事,并加以分析说明,希望可以帮助大家学到更多的知识。
1、甲经历数十年的研究,动用了各种高精尖的研究手段,发现了一个新的蛋白(命名为蛋白A)。
在肝癌患者中展开的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相关性,其相关程度之好,几乎可以用“一塌糊涂”来形容,相关系数达到了0.99(P<0.0001)。
甲欣喜若狂,尽管蛋白A的检测过程还十分繁琐,检测费用还十分高,但是甲还是把持不住内心的激动,日夜兼程地撰写论文,宣称自己找到了一个新的肝癌标志物。
乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:统计结果表明蛋白A和AFP的相关性十分明显。
如果是这样,在临床实践中,通过检测AFP完全就可以得知蛋白A的浓度了,蛋白A在肝癌中的临床价值完全可以被AFP代替,还不说蛋白A的检测过程繁琐,费用太高的问题,你说蛋白A还有什么价值?小故事大道理:统计学阳性的结果未必是“好结果”。
2.甲发明了两套诊断肺癌的方案,分别命名为A和B。
为了明确这两种方到底谁“更胜一筹”,甲找了100个肺癌患者和100个疑似肺癌患者(结核、肺炎等),分别用A、B两套方案去进行鉴别诊断。
在200个研究对象中(100个肺癌和100个非肺癌),方案A正确了100回,准确率50%,方案B仅仅正确了50回,准确率仅为25%。
卡方检验表明:方案A和B准确率之间的差异有统计学意义(P<0.01)。
很明显,方案A的准确性要高于方案B。
甲赶紧发表论文,指出:方案A诊断肺癌的准确性优于方案B。
中医药小故事

中医药小故事
故事一,《针灸神奇的力量》。
在古代,有一位名叫华佗的医生,他精通中医药,尤其擅长针灸疗法。
有一次,有位皇帝因患有急性头痛而找华佗求医。
华佗为皇帝施行了针灸疗法,不久皇帝的头痛便得到了缓解。
皇帝对华佗的医术大为赞赏,从此,针灸疗法在中医药中被广泛应用,成为了中医药中不可或缺的一部分。
故事二,《草药的神奇功效》。
在古代,有一位名叫神农的医者,他发现了很多草药的神奇功效。
有一次,神农在山中发现了一种名叫黄芪的草药,他尝试使用黄芪治疗了很多患者,效果非常显著。
后来,黄芪被广泛用于中医药中,成为了一种重要的草药材料之一。
故事三,《中医药在抗击疫情中的作用》。
在近年来的抗击疫情中,中医药发挥了重要的作用。
许多中医药医生奋战在抗击疫情的一线,他们运用中医药的理论和方法,成
功治愈了很多患者。
中医药在疫情中的作用得到了充分的肯定,也让更多的人认识到了中医药的重要性。
故事四,《中医药的传承与创新》。
中医药作为中华民族的宝贵文化遗产,一直以来都得到了精心的传承与创新。
许多中医药学者和医生不断地钻研中医药的理论和临床实践,不断地创新中医药的疗法和药物。
这些传承与创新,使得中医药在现代医学中依然具有重要的地位和作用。
中医药小故事,让我们更加深入地了解了中医药的历史、理论和实践,也让我们对中医药有了更加深刻的认识和理解。
中医药的神奇力量,不仅体现在治疗疾病上,更体现在中医药文化的传承与创新中。
让我们一起珍惜和传承中医药这一宝贵的文化遗产,让中医药的光芒继续闪耀在人类医药史的长河中。
医学统计学案例分析

医学统计学案例分析医学统计学是应用数理统计学原理和方法对医学研究进行分析的学科。
下面介绍一个医学统计学案例分析。
某医院开展了一项针对心脏病患者的新药临床实验。
实验分为两组,A组为接受新药治疗的患者,B组为接受常规治疗的患者。
为了评估新药的疗效,研究者采集了每组患者的治疗前和治疗后的心脏功能数据。
实验结果如下表所示:组别治疗前心脏功能治疗后心脏功能A组 70 85B组 65 80为了分析和评估新药的疗效,可以采用配对样本T检验进行统计分析。
配对样本T检验是一种适用于两个相关样本的统计检验方法。
首先,可以计算出每组患者的差值(治疗后心脏功能-治疗前心脏功能):差值A组 = 85-70 = 15差值B组 = 80-65 = 15接下来,计算这些差值的平均值和标准差:平均值差值A组 = 15/1 = 15平均值差值B组 = 15/1 = 15标准差差值A组= sqrt(Σ(xi-平均值差值A组)²/(n-1)) = 0标准差差值B组= sqrt(Σ(xi-平均值差值B组)²/(n-1)) = 0然后,可以计算T值:T = (平均值差值A组-平均值差值B组)/sqrt((标准差差值A组²/样本容量)+(标准差差值B组²/样本容量))T = (15-15)/sqrt((0²/1)+(0²/1)) = 0最后,根据自由度和显著性水平可以查找T值对应的临界值。
假设显著性水平为0.05,查表可得临界值为1.96。
由于计算得到的T值为0,小于临界值1.96,所以可以得出结论:新药治疗和常规治疗在心脏功能上没有显著差异。
通过以上医学统计学案例分析,我们可以对新药的疗效进行客观评估,为临床医学提供科学依据。
姜晶梅医学统计学案例讨论

姜晶梅医学统计学案例讨论医学统计学是应用统计学原理和方法来分析医学数据、评估医学假设和支持医学决策的学科。
在医学统计学中,姜晶梅是一个常用的案例,它可以用来讨论不同的统计学概念和方法。
以下是对姜晶梅医学统计学案例的多角度全面回答。
1. 背景介绍:姜晶梅是一位医学研究人员,她正在进行一项研究,旨在探究某种新药对心脏病患者的疗效。
她随机选取了200名心脏病患者,将其分为两组,一组接受新药治疗,另一组接受传统药物治疗。
她收集了两组患者的相关数据,并进行了统计分析。
2. 研究设计:姜晶梅采用了随机对照试验的设计,这是医学研究中常用的一种设计。
通过随机分组,可以减少实验结果的偏倚,增加实验的可靠性和可比性。
3. 数据收集:姜晶梅收集了两组患者的基本信息,如年龄、性别、病史等,并记录了治疗前后的心脏功能指标,如心率、血压、心电图等。
这些数据可以用来评估新药治疗的效果。
4. 数据分析:姜晶梅使用了多种统计学方法对数据进行分析。
她首先进行了描述性统计,计算了两组患者的平均值、标准差等指标,以了解两组之间的差异。
然后,她进行了假设检验,比较了两组患者在心脏功能指标上的差异是否显著。
此外,她还进行了生存分析,评估了新药对患者生存率的影响。
5. 结果解释:姜晶梅根据数据分析的结果得出结论。
她发现,接受新药治疗的患者在心脏功能指标上表现出显著改善,与传统药物治疗组相比,差异具有统计学意义。
此外,生存分析结果显示,新药组的患者生存率更高。
6. 结果讨论:姜晶梅对结果进行了讨论,并提出了可能的解释。
她认为,新药可能具有更好的疗效,可以改善心脏病患者的生存和心脏功能。
她进一步讨论了研究的局限性和未来的研究方向。
7. 实践意义:姜晶梅的研究结果对临床医学具有重要的实践意义。
它为心脏病患者的治疗提供了新的选择,并为进一步的研究和开发新药提供了依据。
综上所述,姜晶梅医学统计学案例涵盖了研究设计、数据收集、数据分析、结果解释、结果讨论和实践意义等多个方面。
医学统计学案例分析

医学统计学案例分析医学统计学是医学研究中不可或缺的重要组成部分,它通过对医学数据的收集、整理、分析和解释,为医学研究提供了有力的支持。
本文将通过一个具体的医学统计学案例,来说明统计学在医学研究中的应用和意义。
某医院进行了一项针对心脏病患者的临床研究,研究对象分为两组,一组接受传统治疗,另一组接受新型药物治疗。
研究的目的是比较两种治疗方法在降低心脏病发作率方面的差异。
在研究开始前,研究人员首先收集了参与者的基本信息、病史、生活方式等数据,然后在一定时间内对两组患者的心脏病发作情况进行了观察和记录。
通过对收集到的数据进行统计分析,研究人员得出了如下结论,新型药物治疗组的心脏病发作率明显低于传统治疗组。
经过统计检验,这一差异被证实具有显著性。
此外,研究人员还发现,新型药物治疗组的患者在心脏病发作后的恢复速度也更快,住院时间更短。
这个案例充分展示了医学统计学在临床研究中的重要作用。
首先,通过对参与者的基本信息和病史等数据进行描述性统计分析,研究人员可以更清楚地了解研究对象的特征和分布情况。
其次,通过对不同治疗组的心脏病发作率进行比较,可以得出治疗效果的初步结论。
最后,通过统计检验等方法,可以验证结论的显著性,为临床实践提供科学依据。
在医学研究中,统计学还可以帮助研究人员解决一些实际问题,比如样本量的确定、研究设计的选择、数据分析方法的应用等。
同时,统计学方法的运用也使得研究结果更加客观、可靠,提高了研究的科学性和说服力。
总之,医学统计学在医学研究中发挥着不可替代的作用,它为医学研究提供了科学的数据支持和分析手段,为临床实践提供了科学依据。
希望医学界的研究人员能够更加重视统计学的学习和运用,不断提高自身的统计学素养,从而更好地开展医学研究工作,为保障人民健康做出更大的贡献。
和统计有关的10个小故事知音

和统计有关的10个小故事知音统计是一项重要的工作,它可以帮助人们了解世界、做出决策和规划未来。
在各行各业中,统计都扮演着重要角色。
下面我们将通过10个小故事,来了解统计在日常生活中的应用。
第一个故事发生在一家大型超市。
这家超市想要了解顾客们对新推出的产品的反应,于是他们进行了一次问卷调查。
通过对收集到的数据进行分析,他们得出了顾客们的满意度,并且做出了相应的调整。
这个故事告诉我们,统计可以帮助企业了解市场需求,从而做出更好的经营决策。
第二个故事发生在医院里。
一名医生想要了解某种药物对患者的治疗效果,于是他进行了一项临床试验,并对实验结果进行了统计分析。
通过统计,医生得出了该药物的疗效,并且为患者的治疗提供了参考依据。
这个故事告诉我们,统计可以帮助医生进行科学的医疗决策,提高治疗效果。
第三个故事发生在学校里。
一名老师希望了解学生们的学习情况,于是她进行了一次考试,并对成绩进行了统计分析。
通过统计,老师得知了学生们的学习水平,并且可以根据统计结果进行有针对性的教学。
这个故事告诉我们,统计可以帮助老师了解学生,提高教学质量。
第四个故事发生在政府部门。
一家政府部门希望了解市民对某项政策的满意度,于是他们进行了一次问卷调查,并对数据进行了统计分析。
通过统计,政府部门得出了市民对政策的态度,并且可以根据统计结果进行政策调整。
这个故事告诉我们,统计可以帮助政府了解民意,制定更好的政策。
第五个故事发生在科研领域。
一名科学家希望了解某种新发现的规律,于是他进行了一系列实验,并对实验数据进行了统计分析。
通过统计,科学家得出了新的规律,并且可以为进一步的研究提供指导。
这个故事告诉我们,统计可以帮助科学家发现新知识,推动科学进步。
第六个故事发生在金融行业。
一家投资公司希望了解股市的走势,于是他们对股票数据进行了统计分析。
通过统计,投资公司可以了解股市的变化趋势,并且可以做出相应的投资决策。
这个故事告诉我们,统计可以帮助投资者找到投资机会,获得更好的投资回报。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
几则很有趣的医学统计学故事医学统计学是一门很奇妙的科学。
要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。
要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。
很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。
究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。
本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。
1、两个指标诊断疾病的问题路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。
路人甲以A和B的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。
结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。
路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。
诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。
文章的结论到底是想说明A优秀还是B优秀呢?Reject!这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。
稿件被退了,路人甲有些许郁闷。
经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。
路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。
路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。
路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。
你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。
Reject!这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。
稿件被退了,路人甲很是郁闷。
他吸取了经验教训,自学了很多统计学理论,终于弄清楚了采用何种方法去比较曲线下面积。
接下来的事情就是改稿,然后另选杂志继续投稿。
路人甲在文稿中特别注明了,曲线下面积是经过了统计学检验的,B的曲线下面积(0.82)与A的曲线下面积(0.80)之间的差异是有统计学意义的,而且还大摇大摆地在后面加了个括号,写明P=0.01。
路人甲仰天长叹了一口气,很郑重地给自己的研究下了结论:本研究表明B 的诊断效率是优于A的。
路人丁是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:B是常见的诊断指标,其检测结果并不对临床医师设盲,在很大程度上可以检测影响临床医师对疾病的诊断。
A是新进发现的诊断指标,其结果完全对临床医师设盲,不可能影响医生的诊断。
所以作者的结论(B比A优秀)是不可靠的。
再说得通俗点,如果把A和B分别理解成法庭上的原稿和被告,那B无疑既充当了辩护律师,又充当了法官的角色。
在这种情况下,A输掉了官司是十分正常的。
如果换一个公平的、独立的法官来断案,B能否胜出就不好说了。
Reject!这个故事说明:实(试)验设计有缺陷,再优秀、再正规的统计学方法也于事无补。
稿件又被退了,路人甲的心情极度郁闷。
思来想去,决定把实验重做一遍,让A和B在一个公平的环境中比较(为便于描述,此处忽略医学伦理学问题)。
在新开展的研究中,A和B都是对临床医生设盲的,不可能影响金标准。
这下A和B的比较结果应该比较可靠了吧,路人甲又仰天长叹了一口气,感觉自己如释重负了。
科研太折腾人了,太不容易了!统计结果很快出来,A的曲线下面积是0.80,B的曲线下面积则变成了0.77,经过统计学检验后发现,A的诊断效能确实是高于B的。
整个研究的试验设计滴水不漏,统计学过程天衣无缝,我就不信还有人敢拒这篇稿件,路人甲心中开始暗喜。
路人戊是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:A和B的检测并不矛盾,他们之间的关系不应该是竞争关系,而应该是合作关系。
读者最关心的问题显然不是A和B“孰强孰弱”的问题,虽然这个问题有一定的专业价值。
如果我是坐诊医生,我会说:A和B谁强谁弱关我什么事?总之来一个病人我就A和B都检测,我的患者都不差钱!作者的研究重点应该是明确A和B能否互补,联合使用是否能有助于提高诊断准确性的问题,而非A和B“孰强孰弱”的问题。
简单地说,就是明确1+1是否大于1的问题。
Reject!文章又被拒稿了。
这个故事说明:研究方向错了,即使是无懈可击的实(试)验设计和天衣无缝的统计方法,也是无济于事。
这四个故事说明:医学科研是很痛苦的,不重视统计学和科研设计,会走很多弯路的。
2、降糖药的研究、学生自杀事件路人甲长期从事降糖药的研究,最近他发现了一种药物,可以降低患者的血糖。
为了评价该药的降糖效果,路人甲费尽心机地设计了一个看似完美的随机对照试验(RCT),为了保证结果可靠,路人甲严格遵守RCT设计准则,包括随机、双盲、安慰剂对照等措施。
研究结果表明,实验组和对照组在接受药物治疗前血糖浓度的均值都是10mmol/L,差异无统计学意义,表明两组研究对象的基线特征具有可比性。
对照组未经任何药物治疗(为便于描述,此处忽略医学伦理学问题),血糖浓度还是10mmol/L;实验组经过药物干预后,血糖浓度变成了9mmol/L。
统计学检验结果表明,实验组和对照组治疗后的血糖浓度的差异是有统计学意义的(P<0.01)。
路人甲赶紧撰写论文,并毫不客气地给研究下了个结论:该药可以降低患者血糖。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:却要确实可以降低血糖,但是一个只能降低1mmol/L的降糖药有何临床价值?Reject!这个故事说明:有统计学意义不一定有专业意义。
路人甲做了一个调查,同处一地的A和B两所中学,各有1000名学生,过去的一年,A校有5名学生自杀(自杀率为0.5%),B校没有学生自杀(自杀率为0%)。
统计学结果表明,两校自杀率的差异无统计学意义(P=0.07,Fisher确切概率法,笔者进行了统计)。
于是路人甲得出结论:A和B两校的自杀率是没有差异的,A校5名学生自杀纯属小概率事件。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:5个鲜活的生命就这样没有了,5个家庭就这样毁了,你却告诉我这纯属小概率事件,你就不怕“人神共愤”吗?Reject!这个故事说明:有专业意义不一定有统计学意义。
这两个故事说明:做医学科研,不能死磕统计。
看完这两个故事,也许有的读者会有疑问:前面还强调“没有经过统计学检验的结论多半是不科学的”,为什么这里却淡化统计学的作用呢?对此,笔者认为:统计学仅仅是一种工具,用得好当然可以事半功倍,但是在某些情况下,工具往往就是个累赘,也许徒手干活才是最好的选择。
3、如何看待统计学结果路人甲经历数十年的研究,动用了各种高精尖的研究手段,发现了一个新的蛋白(命名为蛋白A)。
在肝癌患者中展开的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相关性,其相关程度之好,几乎可以用“一塌糊涂”来形容,相关系数达到了0.99(P<0.0001)。
路人甲欣喜若狂,尽管蛋白A的检测过程还十分繁琐,检测费用还十分高,但是路人甲还是把持不住内心的激动,日夜兼程地撰写论文,宣称自己找到了一个新的肝癌标志物。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:统计结果表明蛋白A和AFP的相关性十分明显。
如果是这样,在临床实践中,通过检测AFP 完全就可以得知蛋白A的浓度了,蛋白A在肝癌中的临床价值完全可以被AFP代替,还不说蛋白A的检测过程繁琐,费用太高的问题,你说蛋白A还有什么价值?Reject!这个故事说明:统计学阳性的结果未必是“好结果”。
路人甲发明了两套诊断肺癌的方案,分别命名为A和B。
为了明确这两种方到底谁“更胜一筹”,路人甲找了100个肺癌患者和100个疑似肺癌患者(结核、肺炎等),分别用A、B 两套方案去进行鉴别诊断。
在200个研究对象中(100个肺癌和100个非肺癌),方案A 正确了100回,准确率50%,方案B仅仅正确了50回,准确率仅为25%。
卡方检验表明:方案A和B准确率之间的差异有统计学意义(P<0.01)。
很明显,方案A 的准确性要高于方案B。
路人甲赶紧发表论文,指出:方案A诊断肺癌的准确性优于方案B。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:如果我(审稿人本人)是坐诊医生,他就会反着看方案B的结果,凡是方案B认为是肺癌的,他就认为病人不是肺癌;反之亦然。
这样下来,200个病人中,方案B应该能正确识别150个人,准确率为75%。
统计学结果表明,方案B的准确率(75%)是高于方案A(50%)的,所以真实的情况是方案B优于方案A。
实际上,当面对这200名患者的时候,随便到城隍庙找个瞎子来“算命(猜患者是否患病)”,按照统计学理论,准确率也应该是50%,方案A的价值可以说是“一无是处”。
Reject!这个故事说明:统计学阴性的结果未必是“坏结果”。
还是那个AFP与蛋白A的例子。
路人甲发现蛋白A和甲胎蛋白(AFP)之间有很好的相关性,也开始撰写论文,但是他的结论并不是“蛋白A是诊断肝癌的标记物”。
他认为,既然蛋白A与AFP之间有很强的相关性,那提示AFP和蛋白A之间可能存在十分密切的“调节”或者“被调节”关系。
最终,路人甲围绕“蛋白A与AFP之间的调节或者被调节关系”做了很多分子生物学试验,指出蛋白A是调节AFP表达的唯一(注意“唯一”这两个字)因子,因此二者之间才会呈现如此强烈的相关性。
这是一项基础研究,虽然未能直截了当地地指出蛋白A的临床价值,但是这个研究形象生动地讲述了一个完整的分子生物学事件,丰富了我们对于肝癌发生与发展分子机制的认识。