CCTS非劣效临床试验的统计学考虑-中国卫生统计,2012,29(2):270-274
- 格式:pdf
- 大小:280.77 KB
- 文档页数:5
【干货分享】CCTS:临床试验统计分析计划及统计分析报告中国临床试验生物统计学组(CCTS)成员(按姓名拼音排序):陈峰、陈平雁、陈启光、贺佳、黄钦、金丕焕、李康、李宁、李卫、李晓松、凌莉、刘玉秀、苏炳华、孙高、王武保、王彤、魏朝晖、夏结来、姚晨、易东、尹平、于浩、张罗漫、赵耐青。
统计分析计划统计分析计划(statistical analysis plan,SAP)是对临床试验的统计学考虑及拟对数据进行统计分析的清晰描述。
统计分析计划可以是独立的文件,其内容涵盖试验中所涉及的所有统计学考虑,且具有技术性和可操作性,包括了设计的类型、比较的类型、随机化与盲法、主要指标和次要指标的定义与测量、检验假设、数据集的定义、疗效及安全性评价和统计分析的详细计划。
另外,临床试验方案中也包括统计分析计划或统计学考虑部分,其内容是独立的统计分析计划的主要部分。
统计分析报告统计分析报告(statistical analysis report,SAR)是依据统计分析计划,对试验数据进行统计分析后形成的报告,是临床试验结果的重要呈现手段’是撰写临床研究报告(clinical study report,CSR)的关键依据。
针对统计分析计划和统计分析报告所涉及的内涵,中国临床试验生物统计学工作小组(CCTS)经过充分讨论,形成如下共识。
一、意义为了有效地控制分析偏倚,保证试验结论的科学性,应在试验设计阶段计划最终的统计分析策略,数据锁定前应确定统计分析计划,数据锁定后按计划进行统计分析。
统计分析报告是提供给主要研究者撰写临床试验总结报告的关键文件,是科学、完整、准确、合理地撰写临床试验报告的依据。
本文主要针对药物临床试验的要求进行阐述,相关内容也可以作为医疗器械等临床试验的参考。
二、统计分析计划的制定时间试验方案中的统计分析计划应与试验方案同时完成,是统计分析的核心内容。
作为独立文件的统计分析计划初稿应形成于试验方案和病例报告表确定之后,是方案中的统计分析计划的扩展,在临床试验进行过程中以及数据盲态审核时,可以进行修改、补充和完善,不同时点的统计分析计划应标注版本,正式文件在数据锁定之前完成并予以确认。
优效性试验(superiority)—显示优效性的设计通过安慰剂对照试验显示优于安慰剂或优于阳性药,或由剂量反应关系证实疗效是最可信的。
此类试验称为优效性试验。
非劣效性(non-inferiority)—试验/等效性(equivalence)试验—显示非劣效性或等效性的设计,以阳性药物为对照,试验的目标是显示试验药物的疗效与某种已知的阳性药物“不差”或“相当”,分别称为非劣效性试验和等效性试验稳定性假设(constancy assumption)—指阳性对照药物在既往研究(对安慰剂)中的效应量在当前的非劣效性或等效性试验保持不变。
检测灵敏度(assay sensitivity)—分辨某种治疗与较差的治疗或无效的治疗之间差别的能力,对优效性试验、非劣效性试验与等效性试验具有不同的意义。
优效性试验如果是成功的,即试验显示出试验药与安慰剂之间的差别,则检验灵敏度自然成立;对非劣效性和等效性试验而言,如果阳性药没有检测灵敏度,一个无效的试验药可能会因为非劣效性而错误地确认其疗效。
{无效药如何得出非劣效性}一、非劣效性/等效性试验中的样本含量估计(一)决定非劣效性/等效性试验样本含量估计的要素1. 非劣效性(non-inferiority)/等效性(equivalence)界值从临床意义上确认药物的疗效,需要事先确认评价的界值。
在优效性试验中,界值指试验药和对照药之间相差的临床上认可的最小值。
在非劣效性试验中指临床上可接受的最大值。
对非劣效性和等效性试验,它必须小于阳性对照药与安慰剂比较时的效应差值(如果已知,可取去1/3或1/2)。
界值的确定需要由主要研究者从临床意义上和统计学专业人员才统计学意义上共同商定,而不是单独依赖于主要研究者或统计学专业人员。
优效性试验和非劣效性试验仅用一个界值,用δ0表示;而等效性试验要用劣侧和优侧两个界值,分别用δ01和δ02表示,理论上两侧界值可以取不等距,但实际上有一般取等距。
此文发表于:中国新药杂志2003;12(5): 368-371新药临床非劣及等效性试验中的例数估计和等效标准郑青山1,孙瑞元1,陈志扬2(1安徽省药物临床评价中心、皖南医学院弋矶山医院,芜湖 241001;2华中科技大学同济医学院,武汉 430030)[摘要] 本文根据新药临床研究的要求和特点,提出临床非劣及等效性试验例数估计的简算法和查表法,并探讨确定等效标准(δ)的几种方法,可供例数估算时参考。
[关键词] 临床试验;非劣性试验;等效性试验;样本含量;等效标准Sample size estimation and equivalence margin in noninferiority and equivalence trialsZHENG Qing-shan1, SUN Rui-yuan1, CHEN Zhi-yang2(1 Anhui Provincial Center for Drug Clinical Evaluation & Yijishan Hospital of Wannan Medical College, Wuhu 241001,China; 2 Tongji Medical College, Huazhong University of Science and Technology, Wuhan 430030,China)[Abstract] Based on the character and requirements of new drug clinical trials, a simple algorithm for estimating sample size and some methods for determination of equivalence margin (δ) in noninferiority and equivalence clinical trials were provided in this paper.[Key words] noninferiority trial; equivalence trial; sample size; equivalence margin临床试验中作两药等效判别,不能依据“显著性检验P>0.05”,而应采用“非劣或等效性试验(noninferiority or equivalence trials) 的P<0.05” [1-3]。
Bootstrap 法与H-L 法中位数差值区间检验在非劣效试验中的模拟比较研究**基金项目:四川养老与老年健康协同创新中心项目(YLZBZ1818);成都医学院教育教学改革研究项目(JG201944)△通信作者:陈卫中,E-mail : wejone@ 126. com成都医学院公共卫生学院(610500)毛昂曾子倩魏敏陈晓芳陈卫中△【提 要】目的 比较Bootstrap 法和Hodges-Lehmann 法(H-L 法)在中位数差值非劣效性检验中的特点,为相关研 究中统计学方法的选择提供依据。
方法以某临床试验中试验组与对照组咽痛消失时间的比较为基础,通过计算机模拟 生成单组样本量分别为20、30、50、100、200各500个两独立样本,分别服从参数为90h(试验组)、100 h(对照组)的Poisson 分布。
针对每个样本采用基于正态近似和百分位数的Bootstrap 法、H-L 法求得中位数差值的置信区间,并通过置信区间 下限与非劣性界值进行比较,得岀三种方法的检验效能。
结果 三种方法均随着样本量增加,检验效能增加。
在样本量为20时,H-L 法与正态近似法检验效能相当(25% vs. 24% ),且都高于百分位数法(19% )。
在样本量为30,50,100时,H-L 法检 验效能高于正态近似法与百分位数法,且正态近似法高于百分位数法。
在样本量为200时,三种方法的检验效能相当,均在 95%以上。
结论 整体来看,H-L 法获得的区间最窄且最稳定,检验效能最高,尤其在样本量不大时建议选择H-L 法。
【关键词】非参数检验非劣效性试验中位数差值的置信区间检验Bootstrap Hodges-Lehmann 【中图分类号】R195.1 【文献标识码】A DOI 10. 3969/j.issn. 1002 -3674. 2020.06.012非劣效性试验(non-inferiority trials )被广泛应用 于药物临床试验研究。
COMPARZ研究再解读:非劣效研究中的几个统计学问题在晚期肾癌治疗领域,靶向药物已成为一线的主要治疗选择,作为指南推荐的两种一线治疗药物,培唑帕尼和舒尼替尼的疗效和安全性是否存在差异?大型随机对照研究——COMPARZ研究,采用非劣效设计,头对头比较了两类药物的疗效和安全性,给临床治疗提供了参考依据。
因此,对COMPARZ研究结果的解读,也直接影响到临床对两类药物的疗效和安全性的评估。
非劣效研究设计知多少?非劣效研究的设计在于证明干预组不劣于对照组,即为证实新干预措施劣于对照组的程度,不超过预先设定的基于主要研究终点的一个较小量,这个量被称为非劣效性界值(non-inferiority margin)或称为Δ。
Δ是非劣效研究设计成败的关键,如果Δ过大,超过临床普遍接受的范围,即使研究结果为阳性,也很难被广泛接受;如果Δ过小,则所需样本量非常大,研究可能无法进行。
因此,Δ的选择需经过临床专家和统计学家共同讨论确定。
以COMPARZ研究为例,由于标准治疗组舒尼替尼在干扰素对照的临床研究中,主要研究终点PFS的HR为0.42,经过临床专家和统计学专家的共同讨论,最终将COMPARZ的非劣效界值确定为0.25,一个理由是,综合考虑样本量对临床研究的可行性的影响,以及临床认可的中位PFS缩短时间2个月是极限接受水平。
另外一个理由是,通过两步法确保试验组疗效有足够把握优于安慰剂或干扰素治疗,1.25的界值足够保证证明试验组是相对安慰剂、干扰素治疗优效的药物。
在非劣效研究中,要求存在一个已被证实有效的或已广泛使用的标准治疗。
人群入组要求和主要研究终点方面,应与证实标准治疗疗效的关键III期临床保持一致,必须避免任何可能影响干预组和标准治疗组疗效差异的行为,得出错误的非劣效结论。
如COMPARZ研究中,标准治疗组舒尼替尼一线治疗中显著延长晚期肾透明细胞癌患者的无进展生存期(PFS),则新药培唑帕尼,在研究设计中必须入组未接受治疗的晚期肾透明细胞癌患者,主要研究终点设为PFS。
临床非劣效性与等效性评价的统计学方法以安慰剂作为对照的随机双盲临床试验一直被视为药物开发中的金标准,它在确认新的试验药物的疗效优于安慰剂方面发挥着重要的作用。
然而,如果有现成的疗效肯定的药物,仍用安慰剂对照做临床试验,会面临伦理上的困难。
随着愈来愈多可供应用的有效药物的出现,疗效有突破的新药愈来愈少,因而药物临床研究的目的发生了转变。
在阳性对照试验中,更多的情形是探求新药与标准的有效药物相比其疗效是否不差或疗效相等(严格地说,疗效相等应该是既不比标准药差,也不比标准药好),而并不一定要知道新药是否优于标准药,由此而提出了非劣效性/等效性试验(noninfer_iority/equivalencetrials)[1]。
非劣效性/等效性试验与通常意义下的优效性试验(superioritytrials)在设计和统计分析上是有区别的。
近年来,尽管对设计和分析该类试验已给予强调,但遗憾的是,许多非劣效性/等效性临床试验的评价缺少针对性,仍仿照安慰剂对照试验的方式进行,因而导致了非劣效性/等效性试验的样本含量估计、无效假设和备选假设确定、统计学分析和结论推断等方面的不够合理,难以达到设想的目的[2]。
本文拟主要介绍有关非劣效性/等效性试验中涉及的统计学分析方面的一些具体问题,至于在设计时还必须考虑的有关对照的选定等问题可参考文献[2]及ICH文件E10:“临床试验对照的选择”[3]。
1非劣效性/等效性界值从临床上讲,一种新药的药效不比标准对照药差,到底临床上可接受的最大允许的范围是多少呢?或者说,新药比对照药最低到多大程度才能算“非劣效(noninferiority)”呢?类似地,新药和对照药的疗效相比,最低不能低于多少以及最高不能超过多少才可认为是“等效(equivalence)”呢?这就涉及到临床非劣效性/等效性界值(nonferiority/equivalencemargin)的问题。
为叙述方便,我们统一用δ表示界值,并以-δ表示劣侧界值,以δ表示优侧界值。
非劣效临床试验的统计学考虑在医学研究和药物开发领域,临床试验是至关重要的环节,用于评估新疗法或新设备的有效性和安全性。
其中,非劣效临床试验旨在验证新疗法或新设备与现有标准疗法或设备的比较效果,本文将详细介绍非劣效临床试验中的统计学考虑。
非劣效临床试验是指通过比较新疗法或新设备与现有标准疗法或设备的疗效,来评估新疗法或新设备是否非劣于现有疗法或设备。
非劣效临床试验通常采用双盲、随机、对照的设计,以消除偏倚和增加试验的可靠性。
在非劣效临床试验中,统计学原理是试验设计和数据分析的基础。
通过运用随机化和对照原则,能够减少偏倚、提高试验的内部效度和外部效度,并最终得出可靠的结果。
在非劣效临床试验中,样本的选取是至关重要的。
通常,研究人员会根据研究目的、研究假设、研究人群和研究资源等因素来制定样本的选取原则。
在确定样本的选取原则后,研究人员需要选择适当的试验组和对照组。
试验组为接受新疗法或新设备的患者,对照组为接受现有标准疗法或设备的患者。
在选择试验组和对照组时,研究人员需要考虑匹配和随机化的原则,以减少偏倚对试验结果的影响。
研究人员还需要评估试验结果的置信区间。
置信区间是用于描述试验结果不确定性的指标,通常是指从样本统计量加减一定比例的抽样误差所得到的一个范围。
在非劣效临床试验中,置信区间的评估对于判断新疗法或新设备的非劣效性具有重要意义。
在非劣效临床试验中,常用的统计学方法包括但不限于以下几种:意向性分析:这是非劣效临床试验中最重要的统计学方法之一。
它按照患者的原始分组进行统计分析,从而能够充分利用所有收集到的数据。
随机化分组和盲法:这些技术有助于减少偏倚,提高试验的内部效度和外部效度。
参数估计和假设检验:这些技术用于描述和解释试验结果,以及推断新疗法或新设备是否非劣于现有疗法或设备。
结论与启示非劣效临床试验在评估新疗法或新设备的疗效方面具有重要意义。
通过运用统计学原理和方法对试验结果进行分析,研究人员可以得出可靠的结论,从而为临床医生和患者提供更多有效的治疗选择。
临床试验中的非劣效性试验设计与分析临床试验是评估新药物、新治疗方法或新诊断工具疗效与安全性的重要手段。
在传统的临床试验中,通常采用的是非劣效性试验设计与分析方法,以确定新治疗方法是否不劣于标准治疗或对照组。
一、非劣效性试验设计非劣效性试验是一种特殊的临床试验设计,与传统的优劣效性试验有所不同。
在传统的优劣效性试验中,目标是证明新治疗方法是否优于对照组,而在非劣效性试验中,目标是证明新治疗方法对效果的损失是可以接受的,即新治疗方法不劣于标准治疗或对照组。
在非劣效性试验设计中,需要确定两个重要的参数:非劣效性边界和样本大小。
非劣效性边界是一个预先确定的差异值,表示新治疗方法与标准治疗或对照组之间所允许的最大差异。
样本大小的确定则需要根据研究的目的、预计效应大小和统计学方法来进行。
通常,为了保证试验的统计学功效,需要选择足够大的样本大小。
二、非劣效性试验分析在非劣效性试验中,需要进行合适的统计学分析来评估新治疗方法与标准治疗或对照组之间的差异。
常见的分析方法包括置信区间法和假设检验法。
1. 置信区间法:置信区间法是常用的非劣效性试验分析方法之一。
通过计算相应的置信区间,可以判断新治疗方法与标准治疗或对照组之间的差异是否超过了预先设定的非劣效性边界。
如果置信区间完全位于非劣效性边界的左侧,则可以推断新治疗方法不劣于标准治疗或对照组。
2. 假设检验法:假设检验法是另一种常用的非劣效性试验分析方法。
通过设定适当的零假设和备择假设,进行统计检验来判断新治疗方法与标准治疗或对照组之间的差异是否超过了预先设定的非劣效性边界。
如果零假设被拒绝,即新治疗方法与标准治疗或对照组之间存在显著差异,那么可以推断新治疗方法不劣于标准治疗或对照组。
三、实施非劣效性试验的注意事项在进行非劣效性试验时,需要注意以下几个关键问题:1. 非劣效性边界的选择:选择合适的非劣效性边界是非常重要的,它决定了新治疗方法与标准治疗或对照组之间差异的允许范围。