临床试验样本量的估算

  • 格式:doc
  • 大小:32.00 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

临床试验样本量的估算

样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。

但是中国的国情?有多少厂家愿意多做?

建议方案里这么写:

从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。

或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。

非劣性试验(α=0.05,β=0.2)时:

计数资料:

平均有效率(P)等效标准(δ)

N=

公式:N=12.365×P(1-P)/δ2

计量资料:

共同标准差(S)等效标准(δ)

N=

公式:N=12.365× (S/δ)2

等效性试验(α=0.05,β=0.2)时:

计数资料:

平均有效率(P)等效标准(δ)

N=

公式:N=17.127×P(1-P)/δ2

计量资料:

共同标准差(S)等效标准(δ)

N=

公式:N=17.127× (S/δ)2

上述公式的说明:

1) 该公式源于郑青山教授发表的文献。

2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数;

3) P 是平均有效率,

4) S 是估计的共同标准差,

5) δ 是等效标准。

6) 通常都规定α=0.05,β=0.2(把握度80%)

上述计算的例数若少于国家规定的例数,按规定为准;多于国家规定的则以计算值为准。

具体规定的最小样本量如下:

II期,试验组100例;III期,试验组300例;随机对照临床验证(如3类化药)试验组100例。IV期,2000例。疫苗和避孕药与上述要求不同。

例1:某新药拟进行II 期临床试验,与阳性药按1:1 的比例安排例数,考察新药临床治愈率不差于阳性药。根据以往的疗效和统计学的一般要求,取α=0.05,β=0.2,等效标准δ=0.15,平均有效率P=0.80,每组需要多少病例?

由公式计算得,N=12.365×0.8(1-0.8)/0.152=88(例)

以上88 例低于我国最低例数(100 例)的规定,故新药至少取100 例进行试验。如上例作等效性分析,则得,

N=17.127×0.8(1-0.8)/0.152=122(例)。

例2:某利尿新药拟进行II 期临床试验,与阳性药按1:1 的比例安排例数,考察24h 新药利尿量不差于阳性药。根据以往的疗效和统计学的一般要求,取α=0.05,β=0.2,等效标准δ=60 ml,已知两组共同标准差S=180 ml,每组需要多少病例?

由公式得,N=12.365× (180/60)2=111 例。

故本次试验新药和阳性药的例数均不少于111 例。如上例作等效性分析,则得,N=17.127×

(180/60)2=154(例)。[s:11]

临床试验研究中,无论是实验组还是对照组都需要有一定数量的受试对象。这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的。仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题。必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来,并且可以对抽样误差做出客观地估计。一般说来重复观测次数越多,抽样误差越小,观测结果的可信度越高。一定数量的重复还可起到部分抵消混杂因素影响的作用,增强组间的可比性。但重复观测次数越多(即样本含量越大)试验所要消耗的人力、物力、财力和时间越多,可能会使试验研究成为不可能。而且,样本含量过大还会增加控制试验观测条件的难度,有可能引入非随机误差,给观测结果带来偏性(bias)。所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本含量。由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量相等来估计。但在个别情况下,也可能要求各组样本含量按一定比例来估计。

1 与样本含量估计有关的几个统计学参数

在估计样本含量之前,首先要对以下几个统计学参数加以确定或

作出估计。

1.1 规定有专业意义的差值δ,即所比较的两总体参数值相差多大以上才有专业意义。δ是根据试验目的人为规定的,但必须有一定专业依据。习惯上把δ称为分辨力或区分度。δ值越小表示对二个总体参数差别的区分度越强,因而所需样本含量也越大。

1.2 确定作统计推断时允许犯Ⅰ类错误(“弃真”的错误)的概率α,即当对比的双方总体参数值没有差到δ。但根据抽样观测结果错误地得出二者有差别的推断结论的可能性,α确定的越小,所需样本含量越大。在确定α时还要注意明确是单侧检验的α,还是双侧检验的α。在同样大小的α条件下;双侧检验要比单侧检验需要更大的样本含量。

1.3 提出所期望的检验效能power,用1-β表示。β为允许犯Ⅱ类错误(“取伪”的错误)的概率。检验效能就是推断结论不犯Ⅱ类错误的概率1-β称把握度。即当对比双方总体参数值间差值确实达到δ以上时,根据抽样观测结果在规定的α水准上能正确地作出有差别的推断结论的可能性。在科研设计中常把1-β定为0.90或0.80。一般来说1-β不宜低于0.75,否则可能出现非真实的阴性推断结论。

1.4 给出总体标准差σ或总体率π的估计值。它们分别反映计量数据和计数数据的变异程度。一般是根据前人经验或文献报道作出估计。如果没有前人经验或文献报道作为依据,可通过预实验取得样本的标准差s或样本率P分别作为σ和π的估计值。σ的估计值越大,π的估计值越接近0.5,所需样本含量越大。