如何确定非劣效试验的判断界值
非劣效界值的确定

1)非劣效性界值为15%的确定依据非劣效性界值可理解为在非劣效性试验中,试验组与对照组疗效差别的临床上可接受的最大值,通常用Δ来表示。
界值的确定需要由主要研究者从临床意义上和统计学专业人员从统计学意义上共同审慎的商定,要考虑到临床特性、同类产品的临床疗效、安全性、安慰剂效应等因素。
欧洲药物评审组织(EMEA)发布的《非劣效界值选择的指导原则》1(索引号:EMEA/CPMP/EWP/2158/99),以及人用药品注册技术要求国际协调会(ICH)发布的E9、E10指导原则对非劣效性界值的设置提供了基本的指导,但因该值的确定需建立在具体疾病特征、临床意义、风险/效益分析等要素基础上,所以一直缺乏具体的方法和标准。
我国学者发表的文章、著作中对该问题的阐释极少,基本为对上面两个指导原则的理解,无具体方法及实例。
而对于无法实施安慰剂效应的医疗器械产品,该如何采用以上两指导原则,仍然是临床研究中的盲区。
由于EMEA和ICH指导原则强调确定非劣效界值时不能忽略安慰剂效应,难以适用无“安慰器械”的医疗器械产品。
故本临床试验采用美国FDA对抗感染药物临床试验推荐的递减方程(Step-down function)的方法,当同类产品疗效反应率(有效率)分别为90%、<90%但≥80%、<80%但≥70%时,推荐Δ值分别为10%、15%、20%。
查询近年来椎间融合术临床疗效相关文献,得到:结合调查数据可知,我国近年来应用椎间融合器治疗脊柱损伤、退行性病变类手术的有效率能达到80%以上,未见有效率低于80%的报道。
本临床试验相关研究者认为,学术研究更多关注于某一集中症状人群的术后疗效评价,从而在研究样本中剔除了复杂的危重病例样本。
而鉴于我国实际国情,就诊患者大多为危重病例,故将实际临床中的同类产品的临床有效率定为80%~90%之间更为保守稳妥,可一定程度消除研究者的偏倚性认识。
根据以上结论,北京大学人民医院、中国人民解放军总医院第一附属医院主要研究者以及相关统计人员研究后认为将该项目的非劣效界值定为15%比较恰当,该值所体现的临床意义及统计学意义都比较明显。
如何确定非劣效试验的判断界值

如何确定非劣效试验的判断界值LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】发布日期化药药物评价>>临床安全性和有效性评价栏目如何确定非劣效试验的判断界值标题黄钦作者部门正文内容审评四部审评八室黄钦摘要:非劣效试验中判断试验药和阳性对照药疗效相当的疗效差异至关重要,也比较复杂,下文探讨了非劣效性试验界值确定的考虑要点及审评中的主要关注点。
关键词:非劣效性试验判断界值(margin)非劣效、等效和优效性试验的区间检验与传统假设检验最大的不同是考虑了临床意义,以临床意义的差异Δ来进行假设检验,那么,如何确定这个疗效差异的判断界值至关重要,若Δ太大,将把疗效远不如对照药的药物判断为有效或等效;若Δ太小,则可能将本来可以推广应用的有效药物误判为无效而得不到及时上市,并且所需的样本含量可能会大的不切实际,因此Δ的确定应当合适,理论上应该是药效间具有临床意义的最大允许差异值。
但实际确定起来往往较为困难和复杂,需要根据已有的文献数据,设计类型及数据的分布类型,临床认识水平及成本效益来综合考虑,是统计学推理和临床判断相结合的结果。
没有哪本书或指导原则能够给出一个精确无疑的算法。
非劣效试验的Δ值的确定最为复杂,通常参考阳性对照药与安慰剂间的疗效差异即阳性对照药的绝对疗效来判定,需要达到两个目标(满足两个条件)才是适合的判断界值:使试验药物(A)的疗效既要优于安慰剂(P)以保证药物的有效性(A-P>0),又要好到不差于阳性对照药(B)(A-B>-Δ)。
因此,ICH及EMEA等均推荐同时包括安慰剂对照和阳性对照药的三个试验组设计的研究,试验药必须证明在统计学意义上优于安慰剂(试验产品与安慰剂差异的双侧95%可信区间的下限必须大于0,如果试验药和参照药均未能显示在统计学意义上优于安慰剂,可能提示试验不灵敏或者是测定方法不灵敏),然后要用临床判断来评价所观察到的与安慰剂的差异是否具有临床意义。
非劣效、等效和优效性检验及其适用范围

发布日期20061120栏目化药药物评价>>临床安全性和有效性评价标题非劣效、等效和优效性检验及其适用范围作者黄钦部门正文内容审评四部审评八室黄钦摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围.关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0:A药的疗效—B药的疗效=0备择假设H1:A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。
目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1: μ1-μ2〉0(或μ1—μ2〈0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P〉0.05,表示两药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的.因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。
非劣效、等效性、优效性

非劣效、等效和优效性检验及其适用范围摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0: A药的疗效-B药的疗效=0备择假设H1 : A 药的疗效≠B 药的疗效H0假设,如结论:如P>0.05, 按α=0.05的检验水准不能拒绝P≤0.05 ,则接受 H1 假设。
目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面, 一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分, 如单侧为H0:μ1- μ2=0,H1: μ1- μ2>0( 或μ1- μ2<0), 但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如 P>0.05, 表示两药疗效的差别无统计学意义 , 不拒绝 H0 假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受 H0 假设,并非认为 H0 假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如 P≤0.05 ,两药疗效的差别有统计学意义 , 也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
如何确定非劣效试验的判断界值

如何确定非劣效试验的判断界值非劣效试验(non-inferiority trial)是一种用于比较两种治疗方法是否在效果上存在差异的试验设计。
与传统的优越性试验不同,非劣效试验的目标是证明新的治疗方法不会比已有的治疗方法差。
在确定非劣效试验的判断界值时,需要考虑以下几个因素:2.需要有先前研究的基础:在确定非劣效边界时,需要参考已有的临床研究结果和相关的指南或政策。
先前的研究可以提供关于治疗方法的效果差异的有价值信息,有助于确定非劣效试验的判断界值。
3.需要制定明确的零假设和备择假设:在非劣效试验中,零假设表示新治疗方法的效果不如已有治疗方法,备择假设表示新治疗方法的效果不劣于已有治疗方法。
制定明确的零假设和备择假设有助于确定非劣效试验的判断界值。
4.需要考虑实际可行性:在确定非劣效试验的判断界值时,需要考虑实际可行性。
例如,对于一些疾病或治疗方法,可能存在严重的安全风险或不可逆的后果,因此,在确定非劣效边界时需要更加保守。
此外,样本量、研究设计和统计分析方法等因素也需要与实际可行性相匹配。
5.需要进行灵敏度分析:灵敏度分析可以用来评估非劣效试验结果对于判断界值的敏感性。
通过改变判断界值进行灵敏度分析,可以确定各种不同情况下的非劣效试验结果,从而更好地理解和解释试验结果。
总之,确定非劣效试验的判断界值是一个复杂的过程,需要综合考虑临床意义、安全性、成本效益等因素。
在确定判断界值之前,需要进行严谨的科学分析,并参考已有的研究结果和相关指南。
同时,灵敏度分析也是一个重要的工具,用来评估非劣效试验结果对于判断界值的敏感性。
最终确定的判断界值应当是合理、可接受和符合实际可行性的。
非劣效、等效性、优效性

非劣效、等效和优效性检验及其适用范围摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设 H0: A药的疗效-B药的疗效=0备择假设 H1: A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。
目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1: μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。
非劣效性、等效性临床试验

优效性试验(superiority)—显示优效性的设计通过安慰剂对照试验显示优于安慰剂或优于阳性药,或由剂量反应关系证实疗效是最可信的。
此类试验称为优效性试验。
非劣效性(non-inferiority)—试验/等效性(equivalence)试验—显示非劣效性或等效性的设计,以阳性药物为对照,试验的目标是显示试验药物的疗效与某种已知的阳性药物“不差”或“相当”,分别称为非劣效性试验和等效性试验稳定性假设(constancy assumption)—指阳性对照药物在既往研究(对安慰剂)中的效应量在当前的非劣效性或等效性试验保持不变。
检测灵敏度(assay sensitivity)—分辨某种治疗与较差的治疗或无效的治疗之间差别的能力,对优效性试验、非劣效性试验与等效性试验具有不同的意义。
优效性试验如果是成功的,即试验显示出试验药与安慰剂之间的差别,则检验灵敏度自然成立;对非劣效性和等效性试验而言,如果阳性药没有检测灵敏度,一个无效的试验药可能会因为非劣效性而错误地确认其疗效。
{无效药如何得出非劣效性}一、非劣效性/等效性试验中的样本含量估计(一)决定非劣效性/等效性试验样本含量估计的要素1. 非劣效性(non-inferiority)/等效性(equivalence)界值从临床意义上确认药物的疗效,需要事先确认评价的界值。
在优效性试验中,界值指试验药和对照药之间相差的临床上认可的最小值。
在非劣效性试验中指临床上可接受的最大值。
对非劣效性和等效性试验,它必须小于阳性对照药与安慰剂比较时的效应差值(如果已知,可取去1/3或1/2)。
界值的确定需要由主要研究者从临床意义上和统计学专业人员才统计学意义上共同商定,而不是单独依赖于主要研究者或统计学专业人员。
优效性试验和非劣效性试验仅用一个界值,用δδ01和δ02 0表示;而等效性试验要用劣侧和优侧两个界值,分别用表示,理论上两侧界值可以取不等距,但实际上有一般取等距。
如何确定非劣效试验的判断界值

发布日期20061120栏目化药药物评价>〉临床安全性和有效性评价标题如何确定非劣效试验的判断界值作者黄钦部门正文内容审评四部审评八室黄钦摘要:非劣效试验中判断试验药和阳性对照药疗效相当的疗效差异至关重要,也比较复杂,下文探讨了非劣效性试验界值确定的考虑要点及审评中的主要关注点。
关键词:非劣效性试验判断界值(margin)非劣效、等效和优效性试验的区间检验与传统假设检验最大的不同是考虑了临床意义,以临床意义的差异Δ来进行假设检验,那么,如何确定这个疗效差异的判断界值至关重要,若Δ太大,将把疗效远不如对照药的药物判断为有效或等效;若Δ太小,则可能将本来可以推广应用的有效药物误判为无效而得不到及时上市,并且所需的样本含量可能会大的不切实际,因此Δ的确定应当合适,理论上应该是药效间具有临床意义的最大允许差异值。
但实际确定起来往往较为困难和复杂,需要根据已有的文献数据,设计类型及数据的分布类型,临床认识水平及成本效益来综合考虑,是统计学推理和临床判断相结合的结果。
没有哪本书或指导原则能够给出一个精确无疑的算法。
非劣效试验的Δ值的确定最为复杂,通常参考阳性对照药与安慰剂间的疗效差异即阳性对照药的绝对疗效来判定,需要达到两个目标(满足两个条件)才是适合的判断界值:使试验药物(A)的疗效既要优于安慰剂(P)以保证药物的有效性(A-P〉0),又要好到不差于阳性对照药(B)(A—B〉-Δ)。
因此,ICH及EMEA等均推荐同时包括安慰剂对照和阳性对照药的三个试验组设计的研究,试验药必须证明在统计学意义上优于安慰剂(试验产品与安慰剂差异的双侧95%可信区间的下限必须大于0,如果试验药和参照药均未能显示在统计学意义上优于安慰剂,可能提示试验不灵敏或者是测定方法不灵敏),然后要用临床判断来评价所观察到的与安慰剂的差异是否具有临床意义.因为有阳性药参照组,可有助于做出这一判断,如果参照药是经注册管理部门批准的药物,并且已知在同类型的试验中通常能得到具有临床意义的效果,那么这一试验中所见的参照药与安慰剂之间的差异有助于评价安慰剂与试验药品之间差异的临床意义.例如,如果试验中试验组的表现优于参照组,则断定试验产品具有临床意义是合理的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
发布日期20061120
栏目化药药物评价>>临床安全性和有效性评价
标题如何确定非劣效试验的判断界值
作者黄钦
部门
正文内容
审评四部审评八室黄钦
摘要:非劣效试验中判断试验药和阳性对照药疗效相当的疗效差异至关重要,也比较
复杂,下文探讨了非劣效性试验界值确定的考虑要点及审评中的主要关注点。
关键词:非劣效性试验判断界值(margin)
非劣效、等效和优效性试验的区间检验与传统假设检验最大的不同是考虑了临床意义,以临床意义的差异Δ来进行假设检验,那么,如何确定这个疗效差异的判断界值
至关重要,若Δ太大,将把疗效远不如对照药的药物判断为有效或等效;若Δ太小,
则可能将本来可以推广应用的有效药物误判为无效而得不到及时上市,并且所需的样
本含量可能会大的不切实际,因此Δ的确定应当合适,理论上应该是药效间具有临床
意义的最大允许差异值。
但实际确定起来往往较为困难和复杂,需要根据已有的文献
数据,设计类型及数据的分布类型,临床认识水平及成本效益来综合考虑,是统计学
推理和临床判断相结合的结果。
没有哪本书或指导原则能够给出一个精确无疑的算
法。
非劣效试验的Δ值的确定最为复杂,通常参考阳性对照药与安慰剂间的疗效差异即阳性对照药的绝对疗效来判定,需要达到两个目标(满足两个条件)才是适合的判断界值:使试验药物(A)的疗效既要优于安慰剂(P)以保证药物的有效性(A-P>0),又要好到不差于阳性对照药(B)(A-B>-Δ)。
因此,ICH及EMEA等均推荐同时包括安慰剂对照和阳性对照药的三个试验组设计的研究,试验药必须证明在统计学意义上优于安慰剂(试验产品与安慰剂差异的双侧95%可信区间的下限必须大于0,如果试验药和参照药均未能显示在统计学意义上优于安慰剂,可能提示试验不灵敏或者是测定方法不灵敏),然后要用临床判断来评价所观察到的与安慰剂的差异是否具有临床意义。
因为有阳性药参照组,可有助于做出这一判断,如果参照药是经注册管理部门批准的药物,并且已知在同类型的试验中通常能得到具有临床意义的效果,那么这一试验中所见的参照药与安慰剂之间的差异有助于评价安慰剂与试验药品之间差异的
临床意义。
例如,如果试验中试验组的表现优于参照组,则断定试验产品具有临床意义是合理的。
但是国内研究设计中更多见的是仅为试验药组和阳性对照组,而没有安慰剂对照组的二试验组研究,而且阳性对照药的绝对疗效常常不易确定,这时就要检索充分的文献,参考历史数据,并进行荟萃分析等以找出所采用的阳性对照药和安慰剂进行比较的同类研究,估计在目标患者人群中阳性对照药物和安慰剂之间的差异,确定药效灵敏度(Sensitivity to Drug Effects)。
关于对照药的选择原则及其优缺点的考虑请参见ICH-E10的详细阐述。
需要注意的是,药效灵敏度和试验的检测灵敏度(Assay Sensitivity)是不同的,很多情况下药效灵敏度难以维持恒定不变,由于临床实践可
能发生了变化,或者测量效果的标准或方法的不同,某些既往的研究结论可能会毫无意义。
当前试验的设计中应当考虑和既往的试验进行比较,看看是否有可能会影响治疗结果的变化。
例如入选标准、诊断方法、允许的合并治疗、参照产品的给药方案、测定的终点、评价的时间等。
当前试验的设计应当尽可能与既往设计良好的阳性对照药与安慰剂相比较的试验有着一致性。
如果试验设计间有不可避免的差异,那么其差异的意义应当认真考虑,这有可能导致无法确定合适的非劣效性界值。
另外,还应当考虑阳性对照药的疗效随时间发生了变化。
例如在某些情况下,可能由于医疗水平总体改善,疾病或事件的发生率降低了,计算时只能采用比较近期的研究,如果不能确保近期的试验与当前试验中治疗效果的恒定性,那么选择非劣效性边界时应当保守一些。
此外,为保持已确定的Δ值的可靠性,应当重视试验的检测灵敏度和严格控制试验的质量,保证阳性对照药在试验中显示出其应有的疗效。
注意试验中的以下因素常常能够降低试验的检测灵敏度,如研究人群对药物作用的反应较差;对治疗的依从性差;同时合并其他用药干扰了或降低了对受试药物的反应范围、程度;部分受试者有自发改善而不会对药物有反应;诊断标准不明确而入选了无所研究疾病的阴性患者;疗效指标不敏感;疗效指标测量变异太大;盲法不严格导致评价偏倚等等。
在充分分析和考虑了以上因素的基础上,当试验的目的是通过与阳性对照药的比较来间接说明试验药优于安慰剂时,在确保试验药和安慰剂间接疗效差异的95%可信区间的下限大于0时,Δ可选为试验药与对照药疗效差异95%可信区间的下限,但通常选择比这一间接计算提示的数值小的一些值。
对于试验目的是为说明试验药可以代替阳性对照药而疗效无显著降低时(非劣效性试验最常见的目的),通常的做法是以阳性对照药与安慰剂之间预期疗效差异的百分
比来确定Δ值,如FDA有文章认为应该不大于有效药物与安慰剂间疗效差异值的1/2;有些学者提出选定疗效指标测定的1/5-1/2个标准差或阳性对照药疗效均数的1/10-1/5,对于相对数(如率、比值)最大不超过阳性对照组样本率的1/5,但如此确定的理由尚不充分,还须通过临床证据来确认和认可Δ值无重要差异的意义。
一种实际的做法(尤其对市场上目前只有一个有效药物时)是对临床医生进行调查,了解他们认为无关紧要的差异有多大范围,根据对他们回答结果的分析来选择Δ。
如果预期试验药的安全性优于阳性对照药(这样考虑的其他情况包括给药途径更方便、剂量更方便、次要疗效终点更优等),由于有安全性方面的受益作为补偿,可稍微降低疗效,选择较大的Δ值,但应能证明疗效优于安慰剂。
这种情况下,选择复合的主要终点十分有用,可以一个终点证明安全性的优效性,另一个终点证明疗效的非劣效性。
审评部门对于非劣效界值的确定依据非常关注,因此要求申请人对此详细分析论证,其数值的计算和假定应合理有据,虽然没有精确统一的算法,却应是统计学推理和临床判断综合考虑的结果,并在设计阶段确定,研究中一般不得更改。