临床试验中样本量确定的统计学考虑_陈平雁

临床试验样本量的估算

临床试验样本量的估算样本量的估计涉及诸多参数的确定，最难得到的就是预期的或者已知的效应大小（计数资料的率差、计量资料的均数差值），方差（计量资料）或合并的率（计数资料各组的合并率），一般需通过预试验或者查阅历史资料和文献获得，不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发，保证能发现多少的不良反应率；统计的计算主要是从power出发，保证有多少把握能做出显著来。但是中国的国情？有多少厂家愿意多做？建议方案里这么写：从安全性角度出发，按照SFDA××规定，完成100对有效病例，再考虑到脱落原因，再扩大20%，即120对，240例。或者：本研究为随机双盲、安慰剂平行对照试验，只有显示试验药优于安慰剂时才可认为试验药有效，根据预试验结果，试验组和对照组的有效率分别为65.0%和42.9%，则每个治疗组中能接受评价的病人样本数必须达到114例（总共228例），这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%，则需要纳入病人的总样本例数为250例。非劣性试验（α=0.05，β=0.2）时：

计数资料：平均有效率（P）等效标准（δ） N= 公式：N=12.365×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=12.365× (S/δ)2 等效性试验（α=0.05，β=0.2）时：计数资料：平均有效率（P）等效标准（δ） N= 公式：N=17.127×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=17.127× (S/δ)2 上述公式的说明： 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2，N1 和N2 分别为试验药和参比药的例数； 3) P 是平均有效率，

临床试验中的统计学若干问题

临床试验中的统计学若干问题 ——《小胖说统计》系列日志节选（一）

前言 “统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视，这是因为对很多寄主来说，如果没有寄生虫就会死。对有的动物来说，如果没有寄生虫就不能消化它们的食物。因此，人类奋斗的很多领域，如果没有统计学，虽然不会死亡，但一定会变得很弱” －L.J.Savage “统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。” －H.G.Wells 统计学研究的是来自各领域的数据，由解决其他领域内的问题而存在并发展。这一点对临床试验生物统计学也不例外，临床试验的大力发展催生并发展了统计在制药行业的应用。对于每个从事临床试验工作的人来说，我们并不都需要你通晓每种统计方法的由来，我们需要的是你用一种统计的思维方式来看待和判断临床试验中的问题。基于此小胖结合自己在临床试验生物统计方面微不足道的经历，于2008年6月推出了自己的日志系列《小胖说统计》，初衷在于在不侧重复杂的统计理论和计算的基础上，通过一些浅显易懂的语言，简单介绍一下临床试验中一些生物统计的基本知识，并希望能成为和广大临床试验同行进行交流的平台。承蒙广大网友的抬爱，《小胖说统计》推出后受到了大家的认可，至今已发表约180篇博文。为了方便大家的阅读，应广大网友的要求，特对《小胖说统计》中的主要内容加以节选，所有内容均属个人观点，仅供参考，欢迎大家批评指正。《小胖说统计》系列日志将会继续进行持续更新，详细内容可参见以下链接： https://www.360docs.net/doc/9f13375942.html,/2113 https://www.360docs.net/doc/9f13375942.html,/ucenterhome/5612 在此对长期关注和支持《小胖说统计》系列日志的公卫论坛和药物临床试验论坛的广大坛友表示感谢。

ICH E9临床试验的统计学指导原则解析

ICH E9临床试验的统计学指导原则解析 ICH E9 Statistical principles for clinical trials （临床试验的统计学指导原则）可谓生物统计师的bible，目的在于协调欧洲、日本和美国在进行药品上市申请的临床试验时所应用的统计学方法的指导原则。虽说中国是协调三方之外的国家，SFDA还为此另外制定了自己的《化学药物和生物制品临床试验的生物统计学技术指导原则》，但其内容基本还是照抄翻译了ICH E9的内容。首先，我们先看一下ICH E9的内容概况： 1．引言 2．整个临床试验的基本考虑 3．试验设计中的基本考虑 4．试验进行中的基本考虑 5．数据分析 6．安全性与耐受性评价 7．研究报告临床研发计划中的统计思维众所周知，药物临床研究的主要目标就是以最小的成本和最快的时间，科学地评估有希望进入市场的药物的风险－效益。万事计划为先，为了保证药物研发的成功，制定一个临床研发计划（clinical development plan）是十分必要的。那什么是临床研发计划包括哪些内容呢？通常地，临床研发计划包括研发依据、试验的一些基本情况、时间表、预算以及所需的人力物力财力资源等。在大多数公司，在开展一项临床试验前，可能不会有一项正规的成文的临床研发计划，但总会考虑到上述这些内容。尽管临床研发计划的确定主要基于医学和科学的正确合理，但其他方面比如生物统计、注册、市场甚至管理层的影响也同等重要。在这里我们重点讨论一下，统计在临床研发中的作用。首先，管理者在做临床研发计划时希望从生物统计师这里获得一些有助于他们决策的有用的信息。他们需要在市场销售、医学、注册等各方面追求一个平衡。他们需要明确知道药物研发的风险收益。 Confirmatory Trial（验证性试验）和Exploratory Trial （探索性试验）对整个临床试验的角度考虑，我们通常可以把临床试验分为Confirmatory Trial（验证性试验）和Exploratory Trial （探索性试验）两种类型。什么是验证性试验呢？简单地讲，验证性试验就是检验假设（hypothesis-testing）的试验，是一种事先提出假设，并对其进行检验的有对照组的试验。可以提供疗效和安全性方面的确定的证据。我们进行的验证性试验包括所有的III期试验、大多数IV期试验以及一些晚期的II期试验。当然对于验证性试验，我们接触最多的便是III期注册试验。其中验证性试验最核心的部分就是假设（Hypothesis），而对于它必须做到： 1．假设必须直接根据试验的主要目的确定 2．假设必须在试验前事先确定 3．假设必须在试验完成后进行检验与之对应的探索性试验，对数据作一些探索分析，可能会做一些假设检验，但这些假设不需要是事先确定的，而是根据数据的特点而定的，因此不能作为证实疗效的正式依据。虽然说

【科研】如何确定临床实验设计中的样本量

【科研】如何确定临床实验设计中的样本量？在临床实验研究中，无论是实验组还是对照组都需要有一定数量的受试对象。这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的。仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题。必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来，并且可以对抽样误差做出客观地估计。但重复观测次数越多(即样本含量越大)试验所要消耗的人力、物力、财力和时间越多，可能会使试验研究成为不可能。而且，样本含量过大还会增加控制试验观测条件的难度，有可能引入非随机误差，给观测结果带来偏性(bias)。所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本量。由于在各对比组例数相等时进行统计推断效能最高，因此多数情况下都是按各组样本含量相等来估计。但在个别情况下，也可能要求各组样本含量按一定比例来估计。 1 与样本含量估计有关的几个统计学参数在估计样本含量之前，首先要对以下几个统计学参数加以确定或作出估计。 1.1 规定有专业意义的差值δ，即所比较的两总体参数值相差多大以上才有专业意义。δ是根据实验目的人为规定的，

但必须有一定专业依据。习惯上把δ称为分辨力或区分度。δ值越小表示对二个总体参数差别的区分度越强，因而所需样本含量也越大。 1.2 确定作统计推断时允许犯Ⅰ类错误(“弃真”的错误)的概率α，即当对比的双方总体参数值没有差到δ。但根据抽样观测结果错误地得出二者有差别的推断结论的可能性，α确定的越小，所需样本含量越大。在确定α时还要注意明确是单侧检验的α，还是双侧检验的α。在同样大小的α条件下；双侧检验要比单侧检验需要更大的样本含量。 1.3 提出所期望的检验效能power，用1-β表示。β为允许犯Ⅱ类错误(“取伪”的错误)的概率。检验效能就是推断结论不犯Ⅱ类错误的概率1-β称把握度。即当对比双方总体参数值间差值确实达到δ以上时，根据抽样观测结果在规定的α水准上能正确地作出有差别的推断结论的可能性。在科研设计中常把1-β定为0.90或0.80。一般来说1-β不宜低于0.75，否则可能出现非真实的阴性推断结论。 1.4 给出总体标准差σ或总体率π的估计值。它们分别反映计量数据和计数数据的变异程度。一般是根据前人经验或文献报道作出估计。如果没有前人经验或文献报道作为依据，可通过预实验取得样本的标准差s或样本率P分别作为σ和π的估计值。σ的估计值越大，π的估计值越接近0.5，所需样本含量越大。

临床试验中的统计学讲解

小胖说统计之一：认识α,β 要了解生物统计在临床试验中的应用，首先需从认识α,β开始，就是这两个不起眼的符号贯穿了临床试验生物统计的始终。α和β的定义是比较拗口的，特别是对于那些没学过统计的人来说，这两个东西是怎么也搞不明白具体是怎么回事。虽然比较拗口，但咱还得在这里重复一下α和β的科学定义：α又称第I类错误或显著性水平，指拒绝了实际上成立的H0，β又称第II类错误，指不拒绝实际上不成立的H0。对应β的还有一个概念叫power，国内翻译为把握度，它等于1－β，指拒绝实际上不成立的H0的概率。说得通俗一点，临床试验中你会犯俩错误，一种错误就是两种药本来没啥区别，却说成您的药优于人家的药，这就是α；另一种错误就是你的药的确优于人家的药，却说成两种药没啥区别，这就是β。那1－β呢，就是咱的优秀药物被发现的概率啊。不知道，上边的解释，您听明白了吗？如果听明白了，小胖要问您了，谁应该最关心α啊，那又谁应该最关心β啊？最关心α的当然是我们伟大的SFDA以及诸如FDA之类的药品审批机构啊，为啥？他们当然不希望一种药明明和别的药没啥区别，却被药厂说成疗效更好，换言之，他们可不希望审批无效的药物进入市场。所以啊，它们要限定这种错误发生的概率，也就是我们的α了，一般情况下，α被限定为0.05。最关心β的当然是我们的药厂了，为啥？为钱，哈哈！药厂当然不希望明明他的药优于别人的药，却被说成两种药没啥区别吧，所以它们希望降低这种错误发生的概率，也就是降低β了。换言之，他希望提高把握度（1－β），使自己的药能有更高的概率作出来优于别的药物，从而进入市场，赚取钞票。。。一般情况下，β应小于0.2，甚至0.1，对应的把握度为80％或90％。当然药厂降低β，也就是提高把握度，会提高你试验成功的概率，但这也同时意味着同等条件下样本量的增加，样本量的增加就意味着money的增加，这些都是矛盾的，没办法，谁让这世界本来就是一个矛盾的世界呢，你只好去权衡利弊，找个平衡点呗。。。今天就到这里吧，休息，休息。。。

临床试验样本量的估算

临床试验样本量的估算 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

临床试验样本量的估算样本量的估计涉及诸多参数的确定，最难得到的就是预期的或者已知的效应大小（计数资料的率差、计量资料的均数差值），方差（计量资料）或合并的率（计数资料各组的合并率），一般需通过预试验或者查阅历史资料和文献获得，不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发，保证能发现多少的不良反应率；统计的计算主要是从power出发，保证有多少把握能做出显着来。但是中国的国情有多少厂家愿意多做建议方案里这么写：从安全性角度出发，按照SFDA××规定，完成100对有效病例，再考虑到脱落原因，再扩大20%，即120对，240例。或者：本研究为随机双盲、安慰剂平行对照试验，只有显示试验药优于安慰剂时才可认为试验药有效，根据预试验结果，试验组和对照组的有效率分别为%和%，则每个治疗组中能接受评价的病人样本数必须达到114例（总共228例），这样才能在单侧显着性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%，则需要纳入病人的总样本例数为250例。非劣性试验（α=，β=）时：

计数资料：平均有效率（P）等效标准（δ） N= 公式：N=×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=× (S/δ)2 等效性试验（α=，β=）时：计数资料：平均有效率（P）等效标准（δ） N= 公式：N=×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=× (S/δ)2 上述公式的说明： 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2，N1 和N2 分别为试验药和参比药的例数； 3) P 是平均有效率，

临床试验中常用统计分析方法

临床试验中常用统计分析方法 ---统计分析的质量是与临床试验的设计、实施和数据管理密切相关的。就统计分析本身而言，其指导思想是使偏差最小和避免I类错误的增大。定性资料的统计分析方法统计学试验设计：包括确定样本量的大小、试验设计方法（盲法/开放）（具体见有关章节） 1. 定性资料的概念： ---统计资料中按品质和属性分组计数所得的资料，由定性变量和频数两部分组成。定性变量可分为名义变量(如治疗方法分甲、乙、丙等)和有序变量(如疗效结果分治愈、显效、有效、无效)。 ---新药临床研究中，定性资料常用的统计检验方法有卡方检验、校正的卡方检验、Fisher精确检验及Ridit检验、秩和检验。 2. 定性资料的统计描述计算率、比等指标，如试验组和对照组的有效率，并可用各种统计图来表示。 3. x2检验 ---治疗前年龄、性别、病程、病情等一般情况组间均衡性比较，治疗后计数资料的改善情况比较均为双向无序R×C 表资料，用x2检验。当表中理论频数小于5的格子数超过

全部格子数的1／5时，应用Fisher精确检验。 ---如果为2×2表资料，当总样本含量n≥40，且理论频数T均大于5时，用x2检验；当总样本含量n≥40，单有理论频数满足1≤T＜5时，用校正的x2检验；当总样本含量n ＜40或有理论频数＜l时，用Fisher精确检验。 ---目前，各种计算机统计软件的应用(如SAS)使统计学分析中复杂得运算过程简单化，有条件将双向无序R×C表资料均进行Fisher精确检验。 4. 秩和检验 ---进行组间疗效比较或对量化的症状、体征的改善进行组间比较以及考察疗效与年龄、性别等相关性分析时，这些资料属于单向有序R×C表资料，应采用与"有序性"有联系的秩和检验或Ridit检验。 ---秩和检验的优势在于它不仅可判断各组间是否有显著性差异，而且可说明对比各组的效果优劣和强弱是x2检验无法做到的。 ---对于单向有序R×C表资料，Ridit检验和秩和检验的意义完全相同，根据试验者的习惯及熟练程度选一种即可。 5. 定性资料统计分析注意事项 (1) 不可用x2检验分析一切列联表资料，要根据列联表中定性变量的性质决定统计分析方法。 (2) x2检验中资料要满足公式的要求，不可盲目套用。

临床试验样本量的估算

临床试验样本量的估算 Document serial number【LGGKGB-LGG98YT-LGGT8CB-LGUT-

临床试验样本量的估算样本量的估计涉及诸多参数的确定，最难得到的就是预期的或者已知的效应大小（计数资料的率差、计量资料的均数差值），方差（计量资料）或合并的率（计数资料各组的合并率），一般需通过预试验或者查阅历史资料和文献获得，不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发，保证能发现多少的不良反应率；统计的计算主要是从power出发，保证有多少把握能做出显着来。但是中国的国情有多少厂家愿意多做建议方案里这么写：从安全性角度出发，按照SFDA××规定，完成100对有效病例，再考虑到脱落原因，再扩大20%，即120对，240例。或者：本研究为随机双盲、安慰剂平行对照试验，只有显示试验药优于安慰剂时才可认为试验药有效，根据预试验结果，试验组和对照组的有效率分别为%和%，则每个治疗组中能接受评价的病人样本数必须达到114例（总共228例），这样才能在单侧显着性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%，则需要纳入病人的总样本例数为250例。非劣性试验（α=，β=）时：计数资料：平均有效率（P） ? ? ? 等效标准（δ） N=

公式：N=×P(1-P)/δ2 计量资料：共同标准差（S） ? ? ? ? ? 等效标准（δ） N= 公式：N=× (S/δ)2 等效性试验（α=，β=）时：计数资料：平均有效率（P） ? ? ? ? 等效标准（δ） N= 公式：N=×P(1-P)/δ2 计量资料：共同标准差（S） ? ? ? ? 等效标准（δ） N= 公式：N=× (S/δ)2 上述公式的说明： 1) ? ? 该公式源于郑青山教授发表的文献。 2) ? ? N 是每组的估算例数N1=N2，N1 和N2 分别为试验药和参比药的例数； 3) ? ? P 是平均有效率， 4) ? ? S 是估计的共同标准差， 5) ? ? δ 是等效标准。 6) ? ? 通常都规定α=，β=（把握度80％）

临床试验样本量的估算

临床试验样本量的估算The final revision was on November 23, 2020

临床试验样本量的估算样本量的估计涉及诸多参数的确定，最难得到的就是预期的或者已知的效应大小（计数资料的率差、计量资料的均数差值），方差（计量资料）或合并的率（计数资料各组的合并率），一般需通过预试验或者查阅历史资料和文献获得，不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发，保证能发现多少的不良反应率；统计的计算主要是从power出发，保证有多少把握能做出显着来。但是中国的国情有多少厂家愿意多做建议方案里这么写：从安全性角度出发，按照SFDA××规定，完成100对有效病例，再考虑到脱落原因，再扩大20%，即120对，240例。或者：本研究为随机双盲、安慰剂平行对照试验，只有显示试验药优于安慰剂时才可认为试验药有效，根据预试验结果，试验组和对照组的有效率分别为%和%，则每个治疗组中能接受评价的病人样本数必须达到114例（总共228例），这样才能在单侧显着性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%，则需要纳入病人的总样本例数为250例。非劣性试验（α=，β=）时：计数资料：平均有效率（P）等效标准（δ） N=

公式：N=×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=× (S/δ)2 等效性试验（α=，β=）时：计数资料：平均有效率（P）等效标准（δ） N= 公式：N=×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=× (S/δ)2 上述公式的说明： 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2，N1 和N2 分别为试验药和参比药的例数； 3) P 是平均有效率， 4) S 是估计的共同标准差， 5) δ是等效标准。 6) 通常都规定α=，β=（把握度80％）

临床试验中的统计学要求(DOC)

临床试验中的统计学要求临床试验是以病人为研究对象，比较临床治疗干预措施和对照措施的效果及其临床价值的前瞻性研究。临床试验以人为研究对象，与动物实验不同。在临床试验中，研究者不能完全支配病人的行为，只能要求病人避免采用某些干扰试验的治疗或行为，因此必须考虑病人的依从性问题。临床试验还必须考虑医学伦理学问题，当新药已被证实对病人弊大于利，尽管试验仍未完成，也要中止。当已经存在经医学验证对试验疾病有效的药物时，使用安慰剂对照是不适当的。当病人出现紧急情况需要额外治疗措施时，也必须给予。因此临床试验要面对比动物实验更多的问题，在设计上有着更严格的特殊要求。新药的临床试验分为Ⅰ、Ⅱ、Ⅲ、Ⅳ期：Ⅰ期临床试验是初步的临床药理学及人体安全性评价试验，观察人体对于新药的耐受程度和药物代谢动力学，为制定给药方案提供依据；Ⅱ期临床试验是随机盲法对照临床试验，对新药有效性及安全性作出初步评价，推荐临床给药剂量；Ⅲ期临床试验是扩大的多中心临床试验，遵循随机对照原则，进一步评价有效性和安全性；Ⅳ期临床试验是新药上市后的监测，在广泛使用条件下考察疗效和不良反应，尤其是罕见不良反应。本节主要讨论II期和III期临床试验的统计学要求。例11.1 临床观察发现急性心肌梗塞后，梗塞区膨出和左心室重构常导致左心室增大和心功能不全。为研究急性心肌梗塞后长期使用卡托普利治疗对心脏的保护作用，需设计一个药物疗效评价的临床试验，在设计中要考虑以下问题。 1．观察变量的选择 (1)主要变量和次要变量主要变量 (primary variable)又称目标变量(target variable),即能够为临床试验目的提供可信证据的变量。临床试验的主要变量一般只有一个，必要时可有多个。主要变量应易于量化、客观性强、被相关研究领域所公认。次要变量（secondary variable)是指与试验主要目的有关的附加的变量，也可以是与试验次要目的有关的变量。两种变量均应在临床试验的设计方案中明确定义，并说明其被选择的理由。临床试验的样本含量估计、疗效或安全性评价应以主要变量为依据。 (2)复合变量(compound variable) 当与临床试验主要目的有关的变量很多,难以确定单一的主要变量时，可预先确定一种综合计算方法(如求和，加权求和等)，或用多元分析的方法(如主成分分析等)将多个变量综合成一个复合变量，如临床研究中采用的各种量表就是一种复合变量。当组成复合变量的某些单项变量具有临床意义时，也可以单独进行统计分析。 (3)全局评价变量(global assessment variable) 将客观指标和研究者对病人的病情及其改变总的印象综合起来所设定的变量称为全局评价变量，它通常是有序分类变量。全局评价变量往往带有一定的主观成份。因此，如果需选择全局评价变量，应在方案中明确说明它与试验的主要目的有关，有选择的依据和可靠的基础，同时具有明确判断等级的方法。客观性较好的全局评价变量应该作为主要变量之一单独加以考虑。例11.1中，研究目的是为评价卡托普利治疗对左心室容量、收缩功能和舒张充盈的作用，因此主要指标是用多普勒超声心动图测定左心室容量和射血分数。次要变量可选择左心室充盈速率。评价左心室容量和充盈速率的变量有多个，各变量的结果不一致时，难以对药物作总的结论。因此在统计分析时可以将多个变量综合成一个变量进行分析，这综合变量就是复合变量。上例中研究的最终目的是卡托普利治疗对心功能的保护作用，因此可以选择心功能级别作为全局评价变量。２．对照组的选择临床试验中对照组与试验组唯一的差别是试验组中受试者接受新药治疗, 而对照组的受试者则接受对照药物的治疗。临床试验要求试验组和对照组来自相同的受试者总体。两组受试者不但在试验开始时要求基本情况相似, 而且在试验进行中除了试验药物不同外, 其它条件均需保持一致。临床试验中常用的对照组设置有以下3种类型: （１）安慰剂对照安慰剂(placebo)是一种虚拟药物, 其外观剂型、大小、颜色、重量、气味和口味等都与试验药尽可能保持一致, 但不含有试验药物的有效成份。设置安慰剂对照的目的在于消除研究者、受试者和参与评价人员等由心理因素等影响而形成的偏倚，分离出由试验药物所引起的真正的效应和不良反应。安慰剂可以用于平行对照或自身交叉对照。（2）阳性药物对照在临床试验中采用已知的、已批准上市的有效药物作为试验药的对照, 称为阳性药物对照。阳性对照药物必须是合法的、公认有效的、并对所研究的适应症最为有效安全的药物。设计方案可以是平行对照也可以是自身交叉对照。（3）剂量-反应对照将试验药物设计成几个剂量, 而受试者随机地分入其中一个剂量组；它可以包括安慰剂对照即零剂量，也可以不包括安慰剂组。剂量-反应对照主要用于研究剂量与疗效和不良反应的关系, 或者仅用于说明疗效。剂量-反应对照有助于回答给药方案中采用的剂量是否合适。例11.1中急性心肌梗塞病人不适宜采用安慰剂对照，因此采用常规治疗包括溶栓剂、阿斯匹林等作阳性药物

6.《体外诊断试剂临床试验技术指导原则》(国食药监械2014年第16号)2014.10.1施行

CFDA关于发布体外诊断试剂临床试验技术指导原则的通告（2014年第16号）为指导体外诊断试剂的临床试验工作，根据《体外诊断试剂注册管理办法》（国家食品药品监督管理总局令第5号），国家食品药品监督管理总局组织制定了《体外诊断试剂临床试验技术指导原则》，现予发布。自2014年10月1日起，原国家食品药品监督管理局发布的《体外诊断试剂临床研究技术指导原则》（国食药监械〔2007〕240号）废止。特此通告。附件：体外诊断试剂临床试验技术指导原则 2014年体外诊断试剂临床试验技术指导原则一、概述体外诊断试剂的临床试验（包括与已上市产品进行的比较研究试验）是指在相应的临床环境中，对体外诊断试剂的临床性能进行的系统性研究。申请人应在符合要求的临床单位，在满足临床试验最低样本量要求的前提下，根据产品临床预期用途、相关疾病的流行率和统计学要求，制定能够证明其临床性能的临床试验方案，同时最大限度地控制试验误差、提高试验质量并对试验结果进行科学合理的分析。临床试

验报告是对临床试验过程、结果的总结，是评价拟上市产品有效性和安全性的重要依据，是产品注册所需的重要文件之一。本指导原则仅对体外诊断试剂临床试验提出了一般性的要求。由于体外诊断试剂产品具有发展快、专业跨度大、临床预期用途各异的特点，不同临床预期用途产品的临床试验方法及内容不尽相同。申请人应根据产品特点及临床预期用途，制定合理的临床试验方案。国家食品药品监督管理总局也将根据体外诊断试剂发展的需要，适时修订本指导原则。二、临床试验的基本原则（一）基本要求 1．临床试验必须符合赫尔辛基宣言的伦理学准则,必须获得临床试验机构伦理委员会的同意。研究者应考虑临床试验用样本，如血液、羊水、胸水、腹水、组织液、胸积液、组织切片、骨髓等的获得或试验结果对受试者的风险性，应提交伦理委员会的审查意见及受试者的知情同意书。对于例外情况，如客观上不可能获得受试者的知情同意或该临床试验对受试者几乎没有风险，可经伦理委员会审查和批准后免于受试者的知情同意。 2．受试者的权益、安全和健康必须高于科学和社会利益。 3．为受试者保密，尊重个人隐私。防止受试者因检测结果而受到歧视或伤害。 4．临床前研究结果支持进行临床试验。（二）临床试验机构及人员的要求

临床试验中的统计学知识

数据统计方法与临床试验方案 5．1．1统计在新药临床试验中的重要作用医药产品的有效性和安全性最终应当由按照GCP原则实施的临床试验来确证。在临床试验的设计和分析中，统计学家起着必不可少的重要作用。GCP、GMP、GLP、GRP和GVP都与统计有关。统计学是一门处理来自群体或个体的大量资料的科学，也是处理资料中变异性的科学和艺术，其目的在于取得可靠的结果。例如，一个医生偶然发现一例患偏头痛病人在喝了橙汁以后感觉有所改善，但这并不是说从这单一个病例观察就可以认为橙汁是治疗偏头痛的有效方法。医生需要统计学资料证明，是否有一组病人在服橙汁后报告症状改善者比采用其他治疗后更多。又如一个每天吸烟50支且嗜酒的人活了95岁并健康良好，但人们不能相信他的习惯能导致健康和长寿。个体对疾病的敏感性变异很大。要研究这些问题，就应当研究不同生活习惯的人群组的发病率和死亡率；也就是说应当进行统计学研究。收集数据、并用统计图表或简单统计量来描述资料的特征称之为描述性统计。但统计学的任务远不止于此，统计学可以通过仔细制订试验计划来提高数据质量；统计推断方法则是从所研究问题的大量数据中得出结论的主要客观手段。应当明白，统计学是在收集、归类、分析和解释大量数据的过程中完成使命的。如果在试验设计阶段不考虑统计原则，所获结果的统计分析不管做的如何精巧都挽救不了一个设计糟糕的临床研究这是一个必须执行的基本原则。表8 可能导致临床试验失败的原因在新药研制过程中，按科学原则进行的临床试验是评价一种新治疗方法的有效性和安全性的惟一可靠的基础。一个临床试验，如果不能恰当地评价试验药物的安全性和/或效性，不能提供关于新药的最好使用方式的充分信息或者提供了误导信息，因而不能对药物的研制、管理、上市和安全有效地使用做出有益贡献，那么这就是一个失败的临床试验。可能导致临床试验失败的原因很多，有些原因是可以控制的，有些则是较难控制的。其中试验设计对于临床试验的成功与否起着极其重要的作用。试验假设（阳性对照）选择不当，随机化及盲法

临床试验样本量的估算

临床试验样本量得估算样本量得估计涉及诸多参数得确定,最难得到得就就是预期得或者已知得效应大小(计数资料得率差、计量资料得均数差值),方差(计量资料)或合并得率(计数资料各组得合并率),一般需通过预试验或者查阅历史资料与文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不就是想做就能做得。SFDA得规定主要就是从安全性得角度出发,保证能发现多少得不良反应率;统计得计算主要就是从power出发,保证有多少把握能做出显著来。但就是中国得国情？有多少厂家愿意多做？建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组与对照组得有效率分别为65、0%与42、9%,则每个治疗组中能接受评价得病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%得情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人得总样本例数为250例。非劣性试验(α=0、05,β=0、2)时:

计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=12、365×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=12、365× (S/δ)2 等效性试验(α=0、05,β=0、2)时: 计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=17、127×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=17、127× (S/δ)2 上述公式得说明: 1) 该公式源于郑青山教授发表得文献。 2) N 就是每组得估算例数N1=N2,N1 与N2 分别为试验药与参比药得例数; 3) P 就是平均有效率,

临床试验数据统计分析概述

临床试验数据统计分析概述㈠、统计分析计划书统计分析计划书由生物统计学专业人员起草，并与主要研究者商定，其内容比试验方案中所规定的统计分析更为详细。统计分析计划书上应列出统计分析集的选择、主要指标、次要指标、统计分析方法、疗效及安全性评价方法等，按预期的统计分析结果列出统计分析表备用。统计分析计划书应形成于试验方案和病例报告表完成之后。在临床试验进行过程中，可以修改、补充和完善。在盲态审核时再次修改完善。但是在第一次揭盲之前必须以文件形式予以确认，此后不能再作变动。㈡、统计分析集用于统计的分析集需在试验方案的统计部分中明确定义，并在盲态审核时确认每位受试者所属的分析集。在定义分析数据集时，需遵循以下两个原则：①使偏倚达到最小；②控制I类错误的增加。根据意向性分析（简称ITT）的基本原则，主要分析应包括所有随机化的受试者。即需要完整地随访所有随机化对象的研究结果，但实际操作中往往难以达到。因此，常采用全分析集进行分析。全分析集（简称FAS）是指尽可能接近符合意向性治疗原则的理想的受试者集。该数据集是从所有随机化的受试者中，以最少的和合理的方法剔除受试者后得出的。在选择全分析集进行统计分析时，对主要指标缺失值的估计，可以采用最接近的一次观察值进行结转(last observation carry forward,简称LOCF)。受试者的“符合方案集” (简称PP)，亦称为“可评价病例”样本。它是全分析集的一个子集，这些受试者对方案更具依从性，依从性包括以下一些考虑，如接受治疗，主要指标可以测定以及没有对试验方案大的违反等。将受试者排除在符合方案集之外的理由应在盲态审核时阐明，并在揭盲之前用文件写明。在确证性试验中，对药物的有效性评价时，宜同时用全分析集和符合方案集进行统计分析。当以上两种数据集的分析结论一致时，可以增强试验结果的可信性。当不一致时，应对其差异进行清楚的讨论和解释。如果从符合方案集中排除受试者的比例太大，则对试验的总的有效性会产生疑问。

中国现行临床试验生物统计学指导原则与《ICH E9》的关键异同点

中国现行临床试验生物统计学指导原则与《ICH E9》的关键异同点摘要：我国现行《化学药物和生物制品临床试验的生物统计学技术指导原则》（以下简称国内指导原则）是基于《ICH E9 Statistical Principles for Clinical Trials》（以下简称ICH E9）指南的基本原则，根据当时国内临床试验的水平和特点起草制订的，自颁布以来，对我国临床试验技术的发展起到了极大的促进作用。近年来，随着我国创新药物研发水平的发展和提高，以及临床研究者对国际多中心临床试验的广泛参与，临床试验的复杂性和科学性对生物统计学工作提出了更高的要求，有必要针对目前情况对现行指导原则进行修订和完善。2010年，ICH中国研究组开展了将国内指导原则与ICH E9进行深入比较的研究工作，本文正是基于该研究的结果就两者的关键异同点进行介绍，下面以三部分连载方式发布。 1.整个临床试验的基本考虑两者均明确要求在方案中明确每个试验的特定目的、设计、执行和拟采用的统计分析方法。均明确临床试验分为确证性试验和探索性试验，其目的和意义不同。与国内指导原则相比，ICH E9特别提出了为方便多个试验结果的合并，应对医学术语、主要指标的定义、方案偏离的处理原则等做出一致的规定。强调任何试验都含有确证性和探索性的成分，在试验方案中应对试验的角色进行清晰的区分，明确试验的结果是作为确定性研究的证据还是仅是为探索性分析提供数据。强调探索性试验并没有事先确定的统计假设。ICH E9还建议：在确证性试验中，受试者的选择应能够更好地反映药物应用的目标人群。应尽量减少其他因素对于试验结果推广性的影响，放宽目标人群的入选和排除标准。对于评价指标问题，两者对主要指标的选择及应用原则等有相同的要求。此外，ICH E9 中还提出，应在方案中说明主要指标的定义及选择的理由。当主要指标有多种测量方法时，应在方案中确定本研究中选择的方法，并解释其合理性。在揭盲后，不得更改主要指标。当

样本量估算

1.单因素二水平设计定量资料的非劣效性检验时样本量的估算 1.1计算公式：非劣效性检验应当采用单侧的检验水准α，假定允许的第二类错误概率不超过β，则非劣效性检验每组需要的样本含量为： 22211)/()(2θδβα-+=--L S u u n （1-1）[1] 2221）/（)(2δβαe s z z n n ?+==（1-2）[2] 1.2式中各参数代表的意义，n 为每组样本含量，α-1u 、β-1u 为单侧标准正态离差界值，S 为估计的共同标准差，L δ为非劣界值，且L δ＜0，θ为试验组与对照组总体均值差值的估计值。说明：单因素二水平设计定量资料的非劣效性检验时样本量的估算公式与上式完全类似，只需将非劣界值L δ（L δ＜0）替换成优效界值u δ（u δ＞0）即可。 1.3例题：某利尿新药拟进行Ⅱ期临床试验，与阳性药按1:1的比例安排例数，考察24h 新药利尿量（ml ）是否不差于阳性药。根据以往的疗效和统计学的一般要求，取α=0.05，β=0.20，非劣效界值L δ=﹣60ml ，已知两组共同标准差S =180ml ，假定新药与阳性对照药总体利尿量的差值θ=﹣20ml ，问每组需要多少病例？将05.01-u =1.645，20.01-u =0.845，s=180，L δ=﹣60，θ=﹣20代入公式，得： 22211)/()(2θδβα-+=--L S u u n =2（1.645+0.845）2×1802/（﹣60﹣（﹣20））2≈251.1，取n=252，即每组需要252例。 2.单因素二水平设计定性资料的非劣效性检验时样本含量的估算 2.1计算公式：非劣效性检验应当采用单侧检验，检验水准为α，假定允许的第二类错误概率不超过β，试验组与对照组总体率的差值为C T ππθ -=（T π、C π未知时可用样本频率估计），两组的平均有效率为2/)(C T πππ+=，非劣界值为u δ＜0，则在两组样本含量相等的情况下，非劣效性检验每组需要的样本含量为： 2211)/()1()(2θδππβα--+=--L u u n （2-1）[1] 2合合221/）-1（)(2δβαp p z z n n +==（2-2）[2] 说明：单因素二水平设计定性资料的优效性检验时样本含量的估计公式与式（2-1）完全类似，只需将非劣界值L δ（L δ＜0）替换成优效界值u δ（u δ＞0）即可。 2.2例题：某新药拟进行Ⅱ期临床试验，与阳性药按1:1的比例安排例数，考察新药临床治愈率是否不差于阳性药。根据以往的疗效和统计学的一般要求，取α=0.05，β=0.20，非劣界值δ=﹣0.15，平均有效率P=0.80，并假定两组总体有效率相等，问每组需

临床试验中样本量确定的统计学考虑_陈平雁

临床试验样本量的估算

临床试验中的统计学若干问题

ICH E9临床试验的统计学指导原则解析

【科研】如何确定临床实验设计中的样本量

临床试验中的统计学讲解

临床试验样本量的估算

临床试验中常用统计分析方法

临床试验样本量的估算

临床试验样本量的估算

临床试验样本量的估算

临床试验中的统计学要求(DOC)

最新临床试验 各期l临床试验周期及案例数量

6.《体外诊断试剂临床试验技术指导原则》(国食药监械2014年第16号)2014.10.1施行

临床试验中的统计学知识

临床试验样本量的估算

临床试验数据统计分析概述

中国现行临床试验生物统计学指导原则与《ICH E9》的关键异同点

样本量估算

最新临床试验各期l临床试验周期及案例数量