真实世界研究的统计学问题汇总

利用统计学解决科学研究结果无法重复的问题

利用统计学解决科学研究结果无法重复的问题在某一癌症新药的试验中，50名患者中有44%的人在使用这种药物后病情得到了缓解。

如果不使用这种药物，只有32%的病人病情会得到缓解。

新的疗法听上去很有前景，但它真的比原来的疗法更好吗？这个问题很难回答，所以统计学家选择换一种方式来回答这个问题。

他们对结果进行观察并计算“p值”。

如果p值小于0.05，则结果在统计学上具有显著性；换句话说，这不太可能是随机结果。

但目前的问题是，许多在统计学上有显著性的结果都无法重复。

比如说，某一疗法在某次试验中有显著疗效，但在下一次试验中却没有任何作用。

这个问题已经非常严峻，以致有的期刊已完全禁止在文章中出现“p值”。

瓦伦·约翰逊（Valen E. Johnson）团队也研究了这个问题，他们认为，仅用统计显著性来分析实验结果是远远不够的。

大部分研究假设是错误的开放科学协作（Open ScienceCollaboration，OSC）是一个专注于科学研究的非营利性组织。

他们试图重复100个发表于期刊上的心理学实验。

根据报道，其中97 个在最初的实验中都具有统计显著性，但开放科学协作却只能成功重复36个实验。

瓦伦·约翰逊和他的学生用实验数据来估算随机选择的心理学实验可以重复的概率。

他们发现只有7%的实验具有可重复性。

经济学家安娜·德雷贝（Anna Dreber）也做了类似的研究，她估算仅有9%的实验可以重复。

这两项分析表明，心理学领域中大约只有7.7%的实验可被成功重复，或许在其他社会科学领域也是如此。

他们的研究对于解释p值具有重要意义，尤其是p值接近0.05时。

贝叶斯因子其实p值接近0.05是随机结果的概率比人们所以为的概率要大。

为了更好地理解这个问题，让我们回到开始提到的药物试验。

我们知道，50位试用新疗法的病人中有22位病人病情得到缓解；若使用旧疗法，则有16位病人病情得到缓解。

如果新疗法没有旧疗法作用好，那么50位病人中有22位甚至更多病人的病情得到缓解的可能性为0.05。

统计学中的几个问题

记者
一八一二一0 九四二
第一选择 A B四 C二九 D E E
第二选择 D
E
B CBC
第三选择 E
D
E
EDD
第四选择 C
C
D BCB
第五选择 B
A
A AAA
逐论选举
采用这种方式的有
奥斯卡奖评选爱尔兰议会选举，澳大利亚上院选举
博尔达记分法
规则：对每种选择赋予一定分值，然后累加出总分值，以最高分者获胜。一八世纪法国数家博尔达首先提出，故命名之。
药物安慰剂
试验次数三00 五四0
成功次数二四六四五四
平均八二% 八四%
辛普森悖论
以上三个悖论的实质是相同的。这类问题在二0实际初就有人讨论。
一九五一年E.H.辛普森在他发表的论文中，对此现象进行了正式描述。于是，就把这类悖论统称为“辛普森悖论”
这类悖论表明这样一个事实：在某些情况下，在分组比较中都占优势的一方，会在合并后的总评中成为失势的一方。
数值。如果数值有奇数个，则中位数就简单取中间项的值。如果有偶数项，中位数往往取中间两项的算术平均众数：数项中出现次数最多的值
平均数的陷阱
算术平均容易受少数极端数值的影响，事实上，很多和钱有关的分布，如收入房价财富等，都有很强的右偏现象，用算术平均往往会给人以歪曲的印象。
从统计角度看，用中位数和众数表达，最大的好处是不受两头的影响。对一些有偏的分布，用中位数和众数往往能更好地反映情况。一般而言，有关收入的统计若用中位数和众数来表述，较为公平。
魔术家的数魔术
魔术家大卫.科波菲尔提出一个数魔术：只要走动一个人，就可以使整整两个国家增加他们的平均国民收入

真实世界研究方法在中药临床评价中的应用

真实世界研究方法在中药临床评价中的应用一、引言随着生物技术和数据科学的快速发展，真实世界研究（Real-World Research，RWR）方法在医药领域中的应用日益广泛。

特别是在中药临床评价中，RWR方法能够提供丰富的真实世界数据，对药物的疗效、安全性、经济性等进行全面评估。

本文将探讨RWR方法在中药临床评价中的应用，以期为中药的研发和使用提供新的视角和方法。

二、真实世界研究概述真实世界研究是一种以实际临床环境为基础的研究方法，它的是在现实条件下，对患者的实际病情、治疗方案、治疗效果等进行的研究。

这种研究方法不仅疾病的生物学特性，还考虑到了患者的社会学、心理学、经济学等因素，因此能够更全面地评估药物的疗效和安全性。

三、真实世界研究在中药临床评价中的应用1、疗效评估：在中药临床评价中，RWR方法可以提供对药物疗效的全面评估。

在传统的临床试验中，往往只药物的生物学效应，而忽视了患者的个体差异和疾病的多因素性。

而RWR方法则能够从患者的实际病情出发，综合考虑药物的疗效、副作用、生活质量等多方面因素，从而更准确地评估药物的疗效。

2、安全性评估：RWR方法能够通过收集和分析大量真实世界数据，发现传统临床试验中可能忽略的药物安全性问题。

例如，某些中药可能存在潜在的肝肾毒性或过敏反应，而这些问题可能在传统的短期临床试验中无法被发现。

通过RWR方法，可以更全面地了解中药的安全性，为医生和患者提供更准确的药物使用信息。

3、经济性评估：RWR方法还可以用于中药的经济性评估。

传统的药物经济学研究往往依赖于模型和假设，而RWR方法则可以通过对真实世界中的治疗费用、医疗资源消耗等数据的分析，更准确地评估中药的治疗成本和经济效益。

这有助于为决策者提供更全面的药物经济学证据，以支持药物的选择和使用。

四、挑战与展望虽然RWR方法在中药临床评价中具有广泛的应用前景，但也面临着一些挑战。

真实世界中的数据质量可能受到多种因素的影响，如数据收集的完整性、准确性、一致性等。

真实世界研究的方法与实践

真实世界研究的⽅法与实践真实世界研究的⽅法与实践黄卓⼭, 罗艳婷, 刘⾦来中⼭⼤学附属第三医院⼼内科, ⼴州510630通讯作者:刘⾦来,Tel： 020-********; E-mail：i@作者简介：黄卓⼭（1988-）,男,⼴州⼈,硕⼠研究⽣,从事冠⼼病的基础与临床研究。

摘要随机对照临床试验是⽬前获得证据、制定诊疗策略的主要依据之⼀,但是,随机对照试验并不总能代表临床实践中的真实情况。

真实世界研究是观察性研究,通过“真实世界样本”来反映真实世界总体。

临床试验关注效⼒研究,⽽真实世界研究则关注效果研究。

真实世界研究需要使⽤多重倾向性评分来减少协变量在组间分布的不均衡性。

近年来,真实世界研究正越来越多地应⽤到临床研究中,可将经验医学与循证医学结合起来。

临床试验和真实世界研究是承启关系,前者的结果需要后者的进⼀步验证及拓展,⼆者综合考虑才是最佳选择。

关键词: 真实世界研究; 随机对照临床试验; 倾向性评分; 效果研究中图分类号:R195.1;R544.1 ⽂献标识码:AMethod and Practice of Real World StudyHUANG Zhuo-shan, LUO Yan-ting, LIU Jin-laiDivision of Cardiovascular Medicine, The Third Affiliated Hospital of Sun Yat-sen University, Guangzhou 510630, ChinaAbstractRandomized controlled trial （RCT） is so far considered as an important way to provide evidence to make up therapeutic strategy. However, sometimes it is limited to represent the authentic condition during clinical practice. Whereas, Real world study（RWS）, a kind of observational studies, is applied to present the real world population through analysis of “real world sample”. RCT pays more attention to efficacy trials. While RWS more concentrates on effectiveness trials. RWS requires giving propensity scores to decrease covariant malconformation among groups. In the past few years, RWS has been increasingly applied in clinical studies to integrate experience medicine with evidence-based medicine. Results of RCT need to be tested and expanded forward in real world study. Therefore, comprehensive evaluations by both RCT and RWS are supposed to be the best selection.Key words: real world study; randomized controlled trial; propensity score; effectiveness trialsShow Figures 1 从⼤型研究结果引出的思考Symplicity HTN-1是⾸个肾交感神经消融（renal sympathetic denervation, RSD）治疗⾼⾎压的临床研究[1], 45例难治性⾼⾎压患者接受了RSD治疗, 结果显⽰术后即刻与术前相⽐平均诊室⾎压降低, 术后1个⽉显著降低。

临床试验中的统计学若干问题

临床试验中的统计学若干问题——《小胖说统计》系列日志节选（一）前言“统计学基本上是寄生的。

靠研究其他领域内的工作而生存。

这不是对统计学的轻视，这是因为对很多寄主来说，如果没有寄生虫就会死。

对有的动物来说，如果没有寄生虫就不能消化它们的食物。

因此，人类奋斗的很多领域，如果没有统计学，虽然不会死亡，但一定会变得很弱”－L.J.Savage“统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。

”－H.G.Wells统计学研究的是来自各领域的数据，由解决其他领域内的问题而存在并发展。

这一点对临床试验生物统计学也不例外，临床试验的大力发展催生并发展了统计在制药行业的应用。

对于每个从事临床试验工作的人来说，我们并不都需要你通晓每种统计方法的由来，我们需要的是你用一种统计的思维方式来看待和判断临床试验中的问题。

基于此小胖结合自己在临床试验生物统计方面微不足道的经历，于2008年6月推出了自己的日志系列《小胖说统计》，初衷在于在不侧重复杂的统计理论和计算的基础上，通过一些浅显易懂的语言，简单介绍一下临床试验中一些生物统计的基本知识，并希望能成为和广大临床试验同行进行交流的平台。

承蒙广大网友的抬爱，《小胖说统计》推出后受到了大家的认可，至今已发表约180篇博文。

为了方便大家的阅读，应广大网友的要求，特对《小胖说统计》中的主要内容加以节选，所有内容均属个人观点，仅供参考，欢迎大家批评指正。

《小胖说统计》系列日志将会继续进行持续更新，详细内容可参见以下链接： /2113/ucenterhome/5612在此对长期关注和支持《小胖说统计》系列日志的公卫论坛和药物临床试验论坛的广大坛友表示感谢。

统计学是一门科学、一种技术和一门艺术，小胖也只是个入门者，最后借用一论坛网友的话，我是一只小蜗牛，笨笨的，不懈的……小胖（Michael Wen，闻增玉）2009年10月目录前言 (2)一、认识α和β (5)二、临床试验生物统计的BIBLE (6)三、如何从统计角度来review研究方案 (8)四、验证性试验和探索性试验 (11)五、临床试验研究人群的选择 (13)六、主要终点和次要终点 (14)七、复合终点 (17)八、盲法 (20)九、随机化 (23)十、研究设计 (33)十一、多中心临床试验 (38)十二、优效性试验 (42)十三、非劣效试验 (47)十四、非劣效试验和优效试验的转换 (55)十五、从临床试验实例来看样本量的计算 (57)十六、中期分析 (78)十七、分析集 (99)十八、缺失值 (114)十九、离群值 (138)二十、参数估计、可信区间和假设检验 (146)二十一、基线数据分析 (152)二十二、协变量 (155)二十三、亚组分析 (162)二十四、临床试验中的多重性问题 (171)一、认识α和β要了解生物统计在临床试验中的应用，首先需从认识α,β开始，就是这两个不起眼的符号几乎贯穿了临床试验生物统计的始终。

工作生活中常见的统计学问题

（一）代表性
样本中的每一个体必须符合总体的规定。
（二）随机性
确保总体中的每一个体有相同的概率被抽作样本。
（三）可靠性
用样本结果推测总体的结论的可信度。确保可靠性，样本含量必须“足够大”。
（四）可比性
如果进行两个或多个样本之间的比较，要求资料具有可比性。
配对设计的优缺点
优点：需用样本数量少，而效率比完全随机设计高；
缺点：在实验的时间太长，受试者处理因素自身发生明显变化时，不能采用同源配对设计。如0-3岁儿童身高、体重等受时间因素影响较大。
（三）随机区组设计（配伍组设计）
配伍设计：
将实验对象按某些特征或相似条件按1：X配成相应对子，来减少实验误差。分同源配伍和异源配伍。
四、完全随机设计与随机区组设计
（一）完全随机设计
将受试对象随机分配到各个处理组或对照组中，或分别从不同总体中随机抽样进行研究。
优点：简单;
缺点：效率不高，需要较多的例数才能得到与其他设计相似的结果。
配对设计的优缺点
优点：需用样本数量少，而效率比完全随机设计高；
缺点：在实验的时间太长，受试者处理因素自身发生明显变化时，不能采用同源配对设计。如0-3岁儿童身高、体重等受时间因素影响较大。
（三）随机区组设计（配伍组设计）
配伍设计：
将实验对象按某些特征或相似条件按1：X配成相应对子，来减少实验误差。分同源配伍和异源配伍。
（1）同源配伍:即实验者自身实验前、后若干时间作对比。
编号治疗前 1周 2周 3周 4周
1 9.9 11.3 12.7 13.2 14.5
2 8.9 12.3 11.7 14.4 15.5

医学论文中统计学处理常见问题及应对措施

医学论文中统计学处理常见问题及应对措施1存在问题1)统计软件名称和版本不全。

最常见的问题是作者只写统计软件名称而漏掉了统计软件版本。

2)统计数据描述含糊不清。

如笼统说“用-x±s 表示”,而不分定量资料或定性资料。

3)误用统计学方法并且统计方法描述不详细。

例如:对定量资料盲目套用t检验,多组均数比较没有采用方差分析和q检验;对定性资料,盲目套用χ2检验;非参数检验资料没有采用秩和检验或Ridit检验; 对回归分析没有结合专业知识和散点图选用合适的回归类型,而盲目套用简单直线回归分析;在逻辑上无明显相关的2个或2个以上指标检测结果勉强进行相关性分析等;对随访资料没有使用生存分析等。

另一个问题是统计学方法的描述不详细。

例如: 使用t检验,没有说明是完全随机设计资料的t检验, 还是配对设计资料的t检验;使用方差分析时,没有说明是完全随机设计资料的方差分析,还是随机区组设计资料的方差分析,或是巢式设计资料的方差分析;对于四格表资料,没有交代是一般四格表资料χ2检验, 还是四格表资料的校正的χ2检验。

4)假设检验结果的表达和解释中存在的问题。

假设检验的结果表达没有根据不同的统计分析方法, 给出相应的检验统计量的实际值及相应的值,如t检验的t值、方差分析的F值、卡方检验的χ2值、相关分析的相关系数及相应的r值等。

此外,统计结果的解释存在如下问题:假设检验是在“无效假设”正确(比如2种药物的疗效没有差异) 的前提下,用P值大小说明实际观察结果是否符合“无效假设”。

P值小(如P<0·05或P<0. 01)则怀疑“无效假设”的正确性,应得2种药物疗效的差异有统计学意义或差异有高度统计学意义的结论,而不应得差异显著或差异非常显著的结论;P值大(如P> 0·05),则不能拒绝“无效假设”,应得2种药物疗效的差异无统计学意义的结论,而不应得无差异的结论。

这是典型地把统计结论作为专业结论而犯的错误。

真实世界研究

01
CONTENTS
真实世界研究是什么真实世界研究思路和流程真实世界研究的应用
02 03
常见真实世界研究的证据等级
提高真实世界研究证据等级的关键因素
1 有效数据的样本量足够 2 前瞻性设计，治疗/暴露因素和健康结局时间跨度合理 3 研究人群的选择具有代表性 4 有明确合理的纳入及排除标准，保证研究的内部有效性 5 对治疗/暴露因素、健康结局和主要混杂因素评估准确 6 控制和分析偏倚、混杂因素和数据缺失 7 数据收集的完整性高 8 数据来源可靠、准确 9 有清晰的质量控制 10 随访成功率高，对不完整数据或失访病例进行评估* 11 使用统计分析方法适当 12 对结果的分析客观可靠 13 研究结论与研究问题相关性高 14 横向比较既往同类研究 15 研究结果得到既往作用机制和动物实验等证据支持 16 罕见疾病研究**
常见研究类型的优劣势比较
研究设计回顾性队列研究前瞻性队列研究拟解决的研究问题 • 病因研究 • 预后研究 • 治疗性研究常见临床场景 • 临床治疗和疗效/结局的生存分析 • 预测研究 • 临床治疗和疗效/结局的生存分析优势 • 可以直接获得发病率，直接估计相对危险度 • 因果时序合理，检验病因假说的能力较强 • 了解疾病的自然史 • 获得一种暴露与多种疾病结局的关系 • 相比前瞻性队列研究，省时省成本 • 因果时序合理，检验病因假说的能力较强 • 了解疾病的自然史 • 获得一种暴露与多种疾病结局的关系 • 所收集的资料相对完整可靠，一般不存在回忆偏倚劣势 • 不适于发病率很低的疾病的病因研究 • 数据和信息的缺失 • 偏倚和混杂 • 矛盾数据需要特别注意和处理 • 不适于发病率很低的疾病的病因研究 • 要求随访观察，时间周期长 • 失访难以避免 • 随着时间推移，未知的变量引入人群可能导致结局受影响 • 研究的设计要求高，实施难度大，费用高

真实世界临床研究

问题：获得的所谓真实结果并非适合于所有病例个体外部真实性问题
RCT设计模式:
E
Rs T
E
Ｎ
Ｎe
or
RC
E
E
4
RCT的局限性：
1）研究对象经过纳入、排除标准的筛选，代表性较差，所获得的疗效不能代表疾病的全貌，其代表性及外部真实性有一定的局限性。
2）伦理学问题。RCT设计可使半数病人未能接受新疗法。安慰剂使用不当或研究的某种有害致病危险因子若主动暴露于人体，违背伦理原则。
倾向性匹配(propensity-matched)
1. 定义Y，凡出现在某促泌剂组,Y=1，凡出现在二甲双胍组,Y=0；
2. 以基线信息中可能的影响因素(起始年份X1, 年龄X2, 性别X3, 治疗时长X4, 共患疾病X5,
合组用和心二血甲管双P药胍(Y物组 1的 X) 6资)1为料e解作(0释二11X变分 1量类 6,Xl6o利 ) g用is某tic促回泌归剂
倾向性匹配后，各组人数
Table I Baseline Characteristics for Matched Pairs of Individual Insulin Secretagogues and Metformin in Propensity Analyses*
Numbers (%)
Year of initiation: 1997-1999 (%) 2000-2002 (%) 2003-2005 (%)
院时记录了主要诊断（以及必要时, 次要诊断） “全国死因注册”，记录死因信息
研究设计
Date
Slide No 29
研究目的：评估与二甲双胍相比，常用的胰岛素促泌剂（包括瑞格列奈）的死亡率和心血管风险。

医学科研论文中的统计学问题汇总分析

------------------------------------------ 最新资料推荐------------------------------------ 医学科研论文中的统计学问题汇总分析医学科研论文中的统计学问题汇总分析作者：郑华宾ARS医学统计学是一门帮助人们透过偶然现象，分析和判断事物内在规律的科学。

随着医学科研工作的深入，医学统计学的应用越来越广泛。

由于统计学的内容非常丰富，并且仍在不断发展，而医务工作者常因各种原因不愿花费许多精力钻研统计学知识，故医学论文中误用统计学的现象较为严重。

为了减少这一现象，提高论文的水平，现就论文中常见的统计学错误，分析讨论如下。

1 .文中未交待所用统计方法论文中应将所用的统计方法交待清楚，例如，是配对设计的t检验还是成组设计的t检验，是Ridit 分析还是卡方检验，是作相关分析还是作回归推断。

使用不正确的统计方法会得出错误的结论，所以统计方法交待不清或根本不予交待，会使读者对论文结论的正确与否无法判断。

有的作者只提一句经统计学处理后，就写出结论;有的甚至于直接用P值说明问题了事。

正确的做法应写明具体的统计方法，如有特殊情况，还应说明是否采用了校正，这样才有说服力。

严格地说，应写明精确的统计量值和P值,如t值、F值、2 值等,不应笼统地以P0.05或P0.05代替。

此外,最好能交待所使用的计算工具与统计软件名称。

因采用公认的统计软件（如SAS、SPSS等）或程序型计算器进行计算，与手工计算相比,既准确又快捷，其计算结果易于被人接受。

2.使用统计方法时不考虑其应用条件每一种统计方法都有其适用条件。

在表示数值变量资料（计量资料）的平均水平时常用到平均数。

然而平均数有算术平均数（均数）、几何均数和中位数，各有其应用条件。

应用均数时，必须首先确定数据为正态分布。

如果数据是偏态分布，仍用均数表示其平均水平势必导致错误的结论，不少作者没有注意到这一点。