非劣效临床试验样本量计算
- 格式:xlsx
- 大小:11.30 KB
- 文档页数:3
样本量计算教程:非劣效性试验+生存分析医咖会之前推送过的“非劣效性试验的样本量计算”教程中,研究结局是连续变量或者分类变量,那如果是生存数据,又该如何计算样本量呢?一、研究问题与数据某研究者拟开展一项非劣效的随机对照试验,探讨某免疫抑制剂对肺癌的疗效。
估计对照组的中位生存时间(mOS)为8月,假设试验组相对于对照组的HR的非劣效性界值为1.3。
研究的入组时间预计为T1=10月,随访时间计划为T2=12月。
试验组对照组比例1:1。
取α=0.025(单侧),把握度1-β=0.8。
则需要多少样本量?二、对问题的分析在介绍样本量计算之前,首先介绍几个参数的概念。
1. 中位生存时间mOS:即50%的患者死亡时所对应的时间。
如果将所有患者生存时间按从小到大排序,中位生存时间即顺序处于中间的患者的生存时间。
2. 入组时间:入组患者很难瞬间完成,尤其对于发病率比较低的肿瘤,因此患者入组往往要经过相对较长的时间。
入组时间为第1例患者入组到最后一例患者入组所经历的时间。
3. 随访时间:在最后一例患者入组完成后,还需对所有患者随访一段时间。
从最后一例患者入组,到试验截止日期的间隔称为随访时间。
注意,这里的随访时间,跟患者的观察时间意义不同。
如果一个临床试验入组时间为12个月,随访时间为24个月,那么对于第一例入组的患者,其观察时间最长为12+24=36个月(尽管该患者可能在试验截止前就已死亡)。
而对于最后一例入组的患者,其最长观察时间为24个月,即各个患者观察时间不同。
观察时间越长,观察到结局发生的可能性越大。
如图1的3号患者,其观察时间(33个月)大于研究的随访时间(24个月)。
图1. 入组时间、随访时间和观察时间示意图4. 入组模式是指研究对象入组的速度是匀速(等比例)还是非匀速。
常见的入组模式是匀速入组,即单位时间内,研究对象入组的数量相等(图2)。
图2. 匀速入组示意图5. HR:风险比,是两组患者瞬时死亡概率之比,是衡量干预效果最常用的参数。
临床试验中的样本量计算在临床试验的设计中,样本量计算是一个关键的环节,它对试验结果的可靠性和推广性起着至关重要的作用。
本文将介绍一些常用的样本量计算方法和相关的原理,以帮助研究人员正确、准确地进行样本量估计。
一、概述样本量计算是在进行临床试验之前进行的一项基础性工作,它通过科学合理的统计方法来确定所需的参与试验的患者数量。
样本量的大小直接影响到试验结果的可靠性,过小的样本量可能导致结果不具有统计学意义,而过大的样本量则会造成资源的浪费。
二、常用的样本量计算方法1. 总体比例样本量计算总体比例样本量计算常用于有两个互补结果的试验,比如药物治疗与安慰剂治疗的对比试验。
通过确定所需的显著性水平、统计功效和预期的疗效差异,可以利用二项分布来计算样本量。
2. 总体均数样本量计算总体均数样本量计算常用于比较两个治疗组的平均值,比如药物治疗组和对照组的平均生存时间。
在这种情况下,需要确定所需的显著性水平、统计功效、疗效差异和总体的标准差,利用正态分布来计算样本量。
3. 非劣效性与超劣效性试验样本量计算非劣效性与超劣效性试验样本量计算常用于评估新药物或治疗方法的非劣效性或超劣效性。
在这种情况下,需要确定所需的非劣效或超劣效边界、显著性水平和统计功效,利用二项分布或正态分布来计算样本量。
4. 多组样本量计算多组样本量计算常用于比较两个以上治疗组的平均值或比例。
在这种情况下,需要确定所需的显著性水平、统计功效、疗效差异和总体标准差,利用方差分析或多项式分布来计算样本量。
三、样本量计算原理样本量计算的原理基于统计学中的假设检验理论和置信区间理论。
在假设检验中,通过设定显著性水平和统计功效,可以估计出所需的样本量。
而在置信区间中,通过设定置信水平和效应量,可以估计出所需的样本量。
样本量的计算是基于对试验对象总体的假设和对试验结果的预期,并且要求样本具有代表性和随机性。
四、注意事项在进行样本量计算时,需要注意以下几点:1. 合理选择显著性水平和统计功效,一般显著性水平取0.05,统计功效取0.8,但也需根据具体研究的目的和研究领域的惯例进行选择。
医学样本量计算公式
医学研究中样本量的计算是非常重要的,因为样本量的大小会影响到研究结果的可信度和准确性。
下面介绍几种常见的医学样本量计算公式。
1. 根据效应大小计算样本量:样本量的大小取决于研究的效应大小,即研究变量之间的差异大小。
一般来说,效应大小越大,需要的样本量也就越小。
计算公式为:
n = (Zα/2 + Zβ) x 2 x σ / Δ
其中,n表示样本量大小,Zα/2和Zβ是正态分布函数的值,可以根据置信水平和统计功效确定,σ表示总体方差,Δ是研究变量之间的最小显著差异。
2. 根据错误率计算样本量:错误率是指在假设检验中犯错的概率,包括第一类错误和第二类错误。
通常将第一类错误的概率控制在5%以下,第二类错误的概率控制在20%以内。
计算公式为:
n = (Zα/2 + Zβ) x (P(1-P) + P(1-P)) / (P - P) 其中,P和P分别表示两组样本的预期比例,其他符号含义与上述公式相同。
3. 根据相关系数计算样本量:在进行相关分析时,需要确定样本量的大小以保证结果的精确性。
计算公式为:
n = (Zα/2 + Zβ) x (1 + r) / (1 - r)
其中,r表示两个变量之间的相关系数,其他符号含义与上述公式相同。
通过以上公式计算得出样本量大小后,还需要注意样本选择时的随机性、多样性和代表性,以充分保证研究结果的可靠性。
临床非劣效性与等效性评价的统计学方法二第一步:非劣效性评价单侧假设检验:z=(2+3)/1.033=4.84>1.645(z0.95),P<0.05单侧95%可信区间下限:CL=2-1.645×1.033=0.301>-3两种方法均显示,在抗高血压效果方面新药AII拮抗剂与标准药ACE抑制剂相比具有非劣效性。
第二步:优效性评价单侧假设检验:z=2/1.033=1.936>1.645,P<0.05单侧95%可信区间下限:CL=0.301>0结果表明,新药AII拮抗剂比标准药ACE 抑制剂的抗高血压效果具有统计学意义优效性。
ICHE9指导原则中的建议[1]更保守些,若按α取0.025的标准判断,非劣效性评价的z=4.84>1.96(z0.975),P<0.025,可下非劣效性结论。
但是,因优效性评价的z=1.936<1.96,P>0.025,尚不能认为具有统计学优效性,更达不到临床意义上的优效性。
有一种情况值得注意,即求得的可信区间的下限大于-δ,但上限却比0小,管理当局比如美国的FDA可能仍然把试验药看作和标准药不等效,甚至比标准药还差,尽管非劣效性的标准已经达到了。
这一额外增加的标准之严格,似乎并不是从统计学意义上考虑的。
事实上,这对很高效地完成试验而出现了窄小的CI可能是不公正的。
4非劣效性/等效性试验样本含量估计及检验效能对服从正态分布的数据(定量指标)和服从二项分布的数据(率指标)分别介绍。
4.1定量指标4.1.1非劣效性试验按照单侧的检验水准α,要求允许的二类误差概率不超过β,在T=S的条件下,非劣效性试验每组需要的样本含量为:n=2[(Z1-α+z1-β)(s/δ)]2检验效能为: 1-β=Ф[δ(2s2/n)-1/2-z1-α] 式中s为两组的合并标准差。
n 为每组的样本含量。
Ф[x]代表标准正态分布下x 左侧的概率Pr[X≤x]。
样本量估算系列02--基于PASS两样本率非劣效比较样本量计算题记:今天我们用一个案例介绍基于PASS软件的两样本率非劣效比较的样本量计算方法。
1. 基础知识各位可参考我们上一篇文章 (样本量估算系列 01 -- 基于PASS两样本率比较的样本量计算),此处不再赘述。
2. 案例分析[案例] 一个新的抗肿瘤药物A与标准药物B对照进行III期临床试验。
已知药物B的有效率为30%。
根据临床应用的实际情况,设置非劣效性的限值为10%。
根据预实验,估计新药A有效率为25%。
按照1:1平行非劣效性设计,单侧检验,alpha=0.025,power=90%,每组需要多少样本?总计需要多少样本?分析:按照非劣效设计,A药只要不比B药的有效性低10%则认为A药有用。
这种情况临床很常见,B药作为标准治疗虽然效果很好,但可能存在一些不足,比如价格昂贵、副反应大等。
A药作为一种替代药品具有价格便宜,安全性高等优势,如果疗效上不比B药差,或者仅仅比B药差那么一点,当然也有可能优于B药,我们则认为A药有效。
我们可根据专业知识或者文献回顾设定一个非劣效性的界值,此处设为10%,即A药的有效率只要不低于10%,我们都认为B药与A药疗效一致。
此外,还要已知其他参数:A药的实际有效率(根据文献回顾或预实验获得)25%,1:1平行设计,单侧检验,alpha=0.025,power=90%。
3. PASS计算过程第一步,如图依次点击:图1. 依次选择Proportions--Two IndependentProportions--Non-Inferiority -- Non-Inferiority Test For the Difference BetweenTwo Proportions第二步,如图依次填入参数图2. 如图依次设置参数参数解释:Sample Size表示待计算的试验组样本量,此处为选择项;Higher Proportions Are: Better,此处为选择项,相当于告诉软件后面填入的Proportion越大表示效果越好。
非劣效临床试验样本量计算非劣效临床试验(Non-inferiority clinical trial)是指在对比两种治疗方案时,试验者预先设定了一定的非劣效边界(non-inferiority margin),试验的目的是证明新的治疗方案与对照方案之间的差异小于这个非劣效边界,从而能够判断新的治疗方案的有效性。
样本量计算通常依赖于以下几个因素:1. 非劣效边界(non-inferiority margin):非劣效边界的设定应该根据临床经验和先前的研究结果来确定。
非劣效边界越小,要求的样本量越大。
因此,在样本量计算中非劣效边界的选择非常重要。
2. 预计的事件率(event rate):试验中需要估计两种治疗方案的事件发生率,即对照方案的事件发生率和新方案的事件发生率。
这可以根据先前的研究结果或者临床经验来估计。
3. 验证所需的统计功效(statistical power):试验者需要设定试验的统计功效,即试验能够检测到非劣效边界之内的差异的概率。
通常情况下,统计功效的设定为80%或90%。
4. 显著性水平(significance level):显著性水平是指试验中拒绝原假设的概率。
常用的显著性水平是0.05根据上述因素,样本量计算可以使用统计学方法,如Z检验、F检验或卡方检验。
在非劣效非劣效临床试验中,样本量计算通常使用Z检验。
样本量计算的公式可以如下表示:n=[(Z1-α/2+Z1-β)×(p1×(1-p1)+p2×(1-p2))]/(p2-p1)²其中n为总样本量,Z1-α/2为1-α/2分位数的Z值,Z1-β为1-β分位数的Z值,p1为对照方案的事件率,p2为新方案的事件率。
通过样本量计算,试验者可以得到所需的总样本量,从而招募足够的患者参与试验。
然而,样本量计算只是试验设计的一部分,还有其他的因素也需要考虑,如试验的可行性、临床实际情况等。
总之,非劣效临床试验样本量计算是一个重要的步骤,它可以帮助试验者确定所需的总样本量,从而保证试验结果的可靠性和准确性。
⾮劣效临床试验样本量计算
计算⾮劣效性试验样本量需预先指定的参数:
实验组率:0.650注:率不可随意指定,应当:1,根据⽂献回顾获得;2,根据对照组率:0.650注:率不可随意指定,应当:1,根据⽂献回顾获得;2,根据⾮劣效性界值:0.150注:即实验组⽐对照组差多少可以接受。
α(I类错误):0.025注:通常取单侧0.025
检验效能:0.800注:通常取β(II类错误)单侧0.20,此空为1-β
实验组与对照组例数⽐: 2.000注:通常令两组例数相同
单组样本量:119.0413注:该公式已锁定,如需修改,请先解除锁定。
总样本量:238.0827注:最终样本量可能还需考虑研究过程中剔除病例的⼀个率,参考⽂献:
1. 邓伟,贺佳. 临床试验设计与统计分析. 201
2.9.
2. BJ Kullberg,JD Sobel,et al. Voriconazole versus a regimen of amphotericin B followed by
回顾获得;2,根据切实的临床资料。
根据⽂献回顾获得;2,根据切实的临床资料。
20,此空为1-β
先解除锁定。
过程中剔除病例的⼀个率,例如,需多招募10%等。
photericin B followed by fluconazole for candidaemia in non-neutropenic patients: a randomised non-inferiorit
mised non-inferiority trial. October 2005.。
临床试验样本量的估算样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。
因此样本量估计有些时候不是想做就能做的。
SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。
但是中国的国情?有多少厂家愿意多做?建议方案里这么写:从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。
或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。
假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。
非劣性试验(α=0.05,β=0.2)时:计数资料:平均有效率(P)等效标准(δ)N=公式:N=12.365×P(1-P)/δ2计量资料:共同标准差(S)等效标准(δ)N=公式:N=12.365× (S/δ)2等效性试验(α=0.05,β=0.2)时:计数资料:平均有效率(P)等效标准(δ)N=公式:N=17.127×P(1-P)/δ2计量资料:共同标准差(S)等效标准(δ)N=公式:N=17.127× (S/δ)2上述公式的说明:1) 该公式源于郑青山教授发表的文献。
2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数;3) P 是平均有效率,4) S 是估计的共同标准差,5) δ 是等效标准。
样本量估算1.单因素二水平设计定量资料的非劣效性检验时样本量的估算1.1计算公式:非劣效性检验应当采用单侧的检验水准α,假定允许的第二类错误概率不超过β,则非劣效性检验每组需要的样本含量为:22211)/()(2θδβα-+=--L S u u n (1-1)[1]2221)/()(2δβαe s z z n n ?+==(1-2)[2]1.2式中各参数代表的意义,n 为每组样本含量,α-1u 、β-1u 为单侧标准正态离差界值,S 为估计的共同标准差,L δ为非劣界值,且L δ<0,θ为试验组与对照组总体均值差值的估计值。
说明:单因素二水平设计定量资料的非劣效性检验时样本量的估算公式与上式完全类似,只需将非劣界值L δ(L δ<0)替换成优效界值u δ(u δ>0)即可。
1.3例题:某利尿新药拟进行Ⅱ期临床试验,与阳性药按1:1的比例安排例数,考察24h 新药利尿量(ml )是否不差于阳性药。
根据以往的疗效和统计学的一般要求,取α=0.05,β=0.20,非劣效界值L δ=﹣60ml ,已知两组共同标准差S =180ml ,假定新药与阳性对照药总体利尿量的差值θ=﹣20ml ,问每组需要多少病例?将05.01-u =1.645,20.01-u =0.845,s=180,L δ=﹣60,θ=﹣20代入公式,得:22211)/()(2θδβα-+=--L S u u n =2(1.645+0.845)2×1802/(﹣60﹣(﹣20))2≈251.1,取n=252,即每组需要252例。
2.单因素二水平设计定性资料的非劣效性检验时样本含量的估算2.1计算公式:非劣效性检验应当采用单侧检验,检验水准为α,假定允许的第二类错误概率不超过β,试验组与对照组总体率的差值为C T ππθ-=(T π、C π未知时可用样本频率估计),两组的平均有效率为2/)(C T πππ+=,非劣界值为u δ<0,则在两组样本含量相等的情况下,非劣效性检验每组需要的样本含量为:2211)/()1()(2θδππβα--+=--L u u n (2-1)[1]2合合221/)-1()(2δβαp p z z n n +==(2-2)[2]说明:单因素二水平设计定性资料的优效性检验时样本含量的估计公式与式(2-1)完全类似,只需将非劣界值L δ(L δ<0)替换成优效界值u δ(u δ>0)即可。
计算非劣效性试验样本量需预先指定的参数:
实验组率:0.650注:率不可随意指定,应当:1,根据文献回顾获得;2,根据对照组率:0.650注:率不可随意指定,应当:1,根据文献回顾获得;2,根据非劣效性界值:0.150注:即实验组比对照组差多少可以接受。
α(I类错误):0.025注:通常取单侧0.025
检验效能:0.800注:通常取β(II类错误)单侧0.20,此空为1-β
实验组与对照组例数比: 2.000注:通常令两组例数相同
单组样本量:119.0413注:该公式已锁定,如需修改,请先解除锁定。
总样本量:238.0827注:最终样本量可能还需考虑研究过程中剔除病例的一个率,参考文献:
1. 邓伟,贺佳. 临床试验设计与统计分析. 201
2.9.
2. BJ Kullberg,JD Sobel,et al. Voriconazole versus a regimen of amphotericin B followed by
回顾获得;2,根据切实的临床资料。
根据文献回顾获得;2,根据切实的临床资料。
20,此空为1-β
先解除锁定。
过程中剔除病例的一个率,例如,需多招募10%等。
photericin B followed by fluconazole for candidaemia in non-neutropenic patients: a randomised non-inferiorit
mised non-inferiority trial. October 2005.。