15样本含量估计

格式：pdf
大小：151.08 KB
文档页数：16

下载文档原格式

样本例数的统计学要求

质的改变的制剂，临床试验的病例数
不少于100对
(只作生物等效性试验的可不作临床试验)
6
注册办法中样本含量的要求(V)
申请已有国家标准的注射剂、中药、天然药物制剂注册，应当进行临床试验，病例数不少于100对。
7
注册办法中样本含量的要求(VI)
避孕药 Ⅰ期临床试验20～30例； Ⅱ期：100对6个月经周期； Ⅲ期：1000例12个月经周期； Ⅳ期临床试验应当充分考虑该类药品的可变因素，完成足够样本量的研究工作。
3、样本数量不足。 4、试验数据存在质量问题。
9
总体和样本
总体: 根据研究目的确定的有代表性的、所
有研究对象的全体。(例：高胆固醇患者)
样本：从特定的研究总体中，随机选择一部
分个体。(例：一个临床试验中150例高胆固醇患者) 统计分析的目的是基于样本资料的信息，推论一个总体的规律。
10
总体和样本
2
注册办法中样本含量的要求(I)
临床试验的最低病例数(试验组)要求： Ⅰ期: 20～30例， Ⅱ期: 100例， Ⅲ期: 300例， Ⅳ期: 2000例。
3
注册办法中样本含量的要求(II)
生物利用度: 18～24例；已获境外上市许可的药品，应当进行
人体药代动力学研究和至少100对随机
临床试验。多个适应症的，每个主要
8
一个临床试验例子
在一个治疗高血压新药临床试验中，两组各观察30例患者，对舒张压治疗前后的变化统计分析得，平均降低血压的效果：试验药为 8mmHg , 安慰剂为5mmHg。两组差异检验结果为P>0.05, 差异无统计学意义。
有四种可能的解释：
1、试验药有降压作用，偶然原因造成此差别。 2、试验设计存在偏倚。

临床试验样本含量的计算

临床试验样本含量的计算1.样本容量计算基本原理：样本容量计算的目标是要控制两种可能的误差，即假阳性误差（Type I error）和假阴性误差（Type II error）。

假阳性误差是指在实际没有效果的情况下错误地认为有效果，假阴性误差是指在实际有效果的情况下错误地认为没有效果。

通常用统计学中的显著性水平（α）和检验的功效（1-β）来控制这两种误差。

2.样本容量计算的步骤：（1）确定显著性水平（α）：通常将α值设置为0.05，对应于95%的置信水平。

（2）确定试验的效果大小：效果大小可以通过先前的研究或者临床经验来确定。

（3）确定检验的功效（1-β）：通常将检验的功效设置为0.8或0.9（4）选择合适的统计检验方法和相应的方差估计方法。

（5）根据所选择的统计检验方法和方差估计方法使用相应的公式计算样本容量。

3.常见的样本含量计算方法：（1）t检验样本容量计算方法：假设需要比较两个独立样本的均值，可以使用t检验的样本容量计算方法。

这里需要确定两个组之间的均值差异、标准差和显著性水平等参数。

（2）χ²检验样本容量计算方法：假设需要比较两个或多个分类变量的分布差异，可以使用χ²检验的样本容量计算方法。

这里需要确定所需的显著性水平、检验功效、预期的效应大小等参数。

（3）生存分析样本容量计算方法：假设需要比较两组生存曲线的差异，可以使用生存分析的样本容量计算方法。

这里需要确定两组之间的生存曲线差异、显著性水平、检验功效等参数。

4.样本容量计算的软件工具：（1）PASS软件：是一个常用的用于样本容量计算和统计功效分析的软件。

（2）G*Power软件：是一个免费的统计功效和样本容量计算软件。

（3）R语言：是一个流行的统计计算与数据可视化的编程语言，可以使用其中的各种包和函数进行样本容量计算。

总之，样本含量计算是临床试验设计的重要一步，通过合理地确定样本容量，可以提高试验结果的准确性和可靠性，并确保试验结果具有一定的代表性。

常用样本含量估计

常用样本含量估计
第28页
例3、某项研究，观察某中药治疗某病患者，以血沉作为疗效指标，临床前该中药可使病人血沉平均下降3.3mm/h ，标准差为1.94 mm/h，西药可使病人血沉平均下降4.9 mm/h ，标准差为2.97 mm/h，为了深入观察该中药疗效，拟申请一项课题，问预计需观察多少病例数？
n1 n2 1641.6sin1
1.96 1.282 0.15 sin1
2
0.45
46
常用样本含量估计
第18页
计算得每组观察病例数为46 例，预计15％失访率，每组需观察病例数53例，两组共需观察106例。
常用样本含量估计
第19页
两样本率比较所需样本含量检
验水 α = 0.05(双侧) 检
验效能 1-β = 0.9000
第一总体率(预计值)π1 = 0.15 第二总体率(预计值)π2 = 0.45 每组所需样本例数 n = 47
两组所需总例数
N = 94
按15%失访率预计 N = 108
常用样本含量估计
第20页
完全随机设计多个率样本比较样本含量预计
（公式一）
n
2
(2 sin1 pmax 2 sin1 pmin )2
常用样本含量估计
第21页
例2、某医院观察三种治疗方法治疗某病效果，初步观察结果A法有效率54.8%，B法 28.46%，C法14.9%，问正式试验需要观察
多少例病人？
常用样本含量估计
第22页
本研究最大样本率Pmax=0.548,最小样本率Pmin=0.149, =0.05,=0.1,=k-1=3-1, 查表=12.56
注：本公式采取三角函数弧度计算

生物医学研究的统计学方法课后答案(案例分析)

第1章绪论案例辨析及参考答案案例1-1某研究者的论文题目为“大学生身心健康状况及其影响因素研究”，以某地职业技术学院理、工、文、医学生（三年制）为研究对象，理、工、文、医学生分别挑选了60、38、19和46人，以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。

得出的结论是：“大学生身心健康状况不容乐观，学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。

请问其结论合理吗？为什么？应该如何？案例辨析①样本不能代表总体。

总体是“大学生”，而样本仅为某地三年制职业技术学院学生；②社会学调查的样本含量显得不足；③“理、工、文、医学生分别挑选……”这种说法中隐含人为“挑选”的意思，不符合统计学要求。

正确做法应在论文的题目中明确调查的时间范围和地点，还应给“大学生”下一个明确的定义，以便确定此次调查的“总体”；对“大学生身心健康状况”可能有影响的因素很多，应结合具体问题拟定出少数最可能有影响的因素（如学科、在学年限等）进行分层随机抽样，以保证样本有较好的代表性；还应根据已知条件找到估计样本含量的计算公式，不可随意确定各学科仅调查几十人；当然，调查表中项目的设置也是十分重要的，此处从略。

案例1-2两种药用于同一种病，A药治疗5例，4例好转；B药治疗50例，36例好转。

结论是：A药优于B药。

请问其结论合理吗？为什么？应该如何？案例辨析①A药样本仅5例，样本含量太少；②得出“A药优于B药”没有交待是否采用了统计学推断方法，若用目测法得出结论，则结论没有说服力；③未明确研究目的和研究结果将被使用的范围。

正确做法①应明确研究目的和研究结果将被使用的范围，若是个别研究者或临床医生想了解这两种药的大致疗效，属于小规模的临床观察，其结论仅供少数人在今后临床实践中参考，其样本含量可能不需要很大，因为观察指标是定性的（有效、无效），一般来说，每个药物组也需要几十例（以不少于20例为宜）；若属于新药的Ⅱ期临床试验，那就要严格按有关规定，比较准确地估计出所需要的样本含量，不仅如此，还有很多严格的要求，详见本书中临床试验设计一章；②从明确定义的总体中随机抽样进行实验研究，得到的实验结果不能仅凭数据大小作出判断，应进行假设检验，以提高结论的可信度。

样本含量估计范文

样本含量估计范文样本含量估计是统计学中的一个重要概念，它是根据总体的一些特征，如总体方差、置信水平、置信区间宽度等，来估计所需的样本数量。

样本含量的大小直接影响到研究结果的可靠性和推广性，因此选择适当的样本量对于研究设计非常重要。

在样本含量估计中，需要考虑以下几个因素：1.总体方差：总体方差是指总体数据的变异程度，它的大小将直接影响样本含量的估计。

如果总体方差较大，通常需要收集更多的样本才能准确估计总体参数；反之，如果总体方差较小，样本量可以适当减少。

2.置信水平：置信水平是指统计推断的可靠程度，一般常用的置信水平有95%和99%。

置信水平越高，所需的样本量就越大。

3.置信区间宽度：置信区间是指对总体参数的估计范围。

置信区间的宽度与样本量有关，样本量越大，置信区间的宽度越小，估计结果的准确性越高。

4.效应大小：效应大小是指总体参数与我们感兴趣的理论值之间的差异。

效应大小越大，所需的样本量就越小。

为了进行样本含量估计，通常可以采用以下方法：1.样本容量计算：根据总体方差、置信水平和置信区间宽度，使用统计软件或公式计算所需的样本量。

2.类似研究的样本规模：参考类似研究中使用的样本量，尤其是相关文献中提到的样本容量。

3. Pilot研究：通过进行小规模的试验或调查来估计总体参数的值，并根据得到的结果确定所需的样本量。

4.经验法则：根据经验法则进行样本估计，如根据总体大小估计样本比例，或使用常见的样本量规模。

总结起来，样本含量估计是在进行统计推断时所必需的，它可以帮助研究者确定所需的样本数量，以保证研究结果的准确性和可靠性。

通过考虑总体方差、置信水平、置信区间宽度和效应大小等因素，研究者可以选择合适的样本量，并根据所需的统计方法进行具体计算。

最终确定的样本量应该能够满足研究目的，并保证结果的可靠性和推广性。

第15章样本含量估计案例辨析及参考答案

第15章样本含量估计案例辨析及参考答案案例15-1某研究者为了证明A（HP-1000型超声诊断仪）、B（研究者自制的成像系统）两台仪器测定的结果无差别，作了如下的实验设计：选一个健康人作为受试对象，用A、B 两台仪器前后两次（间隔为1个月）对此人分别重复测定4次,其数据格式如教材表15-9所示。

观测的定量指标分别是：①二尖瓣前叶EC幅度；②左室后壁运动幅度；③ R-R间期。

数据处理方法是：每个指标下有4组数据，既作了方差齐性检验，又作了配对比较的t 检验，P值均大于0.1。

结论：两台仪器的测定结果无差别，可用自制的成像系统取代费用很高的同类进口仪器。

教材表15-9 对一名健康人某一项指标（如二尖瓣前叶EC幅度）测定的结果重复测定顺序号二尖瓣前叶EC幅度A仪器第1次测B仪器第1次测A仪器第2次测B仪器第2次测1 X X X X2 X X X X3 X X X X4 X X X X注：“X”代表各次测定的具体值。

请辨析下列问题：（1）根据研究者的实验实施情况及对实验数据的处理，判断研究者采用的实验设计有何不妥？你认为应该如何设计？（2）按照你的设计，如何确定应选取对象的数量？案例辨析(1)根据研究者的实验实施情况及对实验数据的处理(既作了方差齐性检验，又作了配对比较的t检验)，可以判断研究者自己认为其所采用的实验设计类型为配对设计，即对同一个指标，A、B两台仪器每一次测定的结果配成一对。

但是，采用配对设计时，不能考察受试对象接受A、B两台仪器对各项指标的测量的先后顺序对测量结果有无影响。

本研究涉及3个因素，其中1个是实验因素（即仪器），另外两个是区组因素（即测定时间和受试对象），因此，为了实现研究者的实验目的，最好采用交叉设计来安排实验。

采用交叉设计时，选足够数量的健康人，将其随机分为两组，其中一组先接受A 仪器测量后接受B 仪器测量，另一组则按相反顺序接受测量。

(2)研究者在实施实验时仅选一个健康人，用A 、B 两台仪器前后两次（间隔为1个月）对此人分别重复测定4次，从研究者的角度来看，他认为每次每台仪器都作了4次独立重复实验，其实不然。

样本量计算

99次试验显示有显著性差异 1次试验成功率为99%-power
12

比较90%和80%的事件发生率，是否有显著性差异？不仅看率，例数也起关键作用
有效率（A VS B） 9 vs. 8 每组N 10 p值 0.53
45 vs.40
90 vs. 80
50
100
0.16
0.048
P：在试验组与对照组事件发生率相差10%的情况下，犯假阳性错误的概率
23
u 1 1 / k u n
2
2

2
解析：①式中整体方差σ2可用样本方差S2估计，
s
2
( se k sc ) /(1 1 / k )
c
2
2
②差值 x x
e
③试验组样本量为n，对照组样本含量为kn，
当k=1时两组样本含量相等。
24
例4：某一项研究吲达帕胺治疗原发性高血压的治
27

当目标事件发生率为0.2-0.8（0.3-0.7）时，用下列公式： 2
N (u u ) P1 P
2
例6：某医师研究药物对产后宫缩、外阴创伤的镇痛效果，若新药比公认稳定有效的老药物（镇痛率 55%）高于20%，可说明新药优于标准药物,需治疗多少例数？（设α=0.05，β=0.20）查表u0.05=1.6449, u0.02=0.8417
临床试验样本含量的估算方法
柴倩云北京中医药大学循证医学中心
1
概述公式计算及练习查表计算及练习软件计算方法举例
2

理论上，验证某一干预措施与对照之间的差异，样本量越大，试验结果越接近于真实值，即结果越可靠。大样本试验还有助于探讨亚组疗效，发现罕见结局。

样本含量估计

• 一、单纯随机抽样的样本含量估计
– （一）估计总体均数的样本含量
– （二）估计总体率的样本含量
• 二、其它概率抽样方法的样本含量估计
– （一）分层抽样所需样本含量估计
– （二）整群抽样所需样本含量估计
2015/11/23
18
• 分层抽样所需样本含量估计
– 按比例分配
• 是按各层观察单位数 N i 占总体观察单位数N的比例抽取样本，使各层样本含量n i 与总样本含量n 之比等于各层观察单位数 N i 与总体观察单位数N 之比,可按下式计算：
z0.05 1.96 0.10
p2 0.1449
2015/11/23
ky 2
p1 0.2536
m 4180 4970 2 4575
p 1060 720 4180 4970 0.1945
K 55
25
2 2 2 2 4970 0.1449 0.1945 2 4182 0.2536 0.1945 k0 1.96 2 2 2 1 4575 0 . 1 2.24 3
• 一、定量资料的样本含量估计
– （一）样本均数与总体均数比较所需样本含量的估计
– （二）完全随机设计两样本均数比较样本含量估计
– （三）配对设计均数比较时所需样本含量估计 – （四）完全随机设计多组均数比较所需样本含量估计 – （五）随机区组设计均数比较时所需样本含量估计
2015/11/23
32
– （一）分层抽样所需样本含量估计
– （二）整群抽样所需样本含量估计
2015/11/23
12
• 估计总体率的样本含量
– 公式：

样本含量估计

用统计学检验时，当研究结果高于和低于效应指标的界限均有意义时，应该选择双侧检验，所需样本量就大；当研究结果仅高于或低于效应指标的界限有意义时，应该选择单侧检验，所需样本量就小。当进行双侧检验或单侧检验时，其α 或β的U界值通过查标准正态分布的分位数表可得。
检验效能（1-β）
又称把握度，为1-β，即在特定的α 水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。β 即假设检验第二类错误出现的概率，为假阴性错误出现的概率。检验效能即避免假阴性的能力，β越小，检验效能越高，所需的样本量越大，反之就要越小。β水平由研究者具情决定，通常取β为0.2，0.1或0.05。即1－β=0.8，0.9或0.95，也就是说把握度为80%，90%或95%。
u n
22

2
σ为总体标准差，一般用样本标准差s表示；δ为容许误差，即样本均数与总体均数间的容许差值；α取双侧，u值可以查表。
1.1估计总体均数所需样本含量
例1：某医院拟用抽样调查评价本地区健康成人白细胞数
的水平，要求误差不超过0.2*109/L。根据文献报告，健
康成人的白细胞数的标准差约1.5*109/L。问需要调查多
双侧α/2 0.80 0.60 0.40 0.20 0.10 0.05 0.02 0.01
β
0.40 0.30 0.20 0.10 0.05 0.025 0.01 0.005
1-β
0.60 0.70 0.80 0.90 0.95 0.975 0.99 0.995
u值
0.2532 0.5243 0.8417 1.2816 1.6449 1.960 2.3263 2.5758
2.4.2 两样本率比较

样本含量的估计与检验效能.

1.96 n 0.08 (1 0.08) 707 0.02
2
即需调查707人。
2. 样本均数与总体均数比较
( z z ) s n
2
【例3】用某药治疗矽肺患者可增加尿矽的排出量，标准差为89.0mmol/L,取α=0.05，β=0.10，能
样本含量的估计与检验效能
一、样本含量的估计
（一）样本含量（sample size）每个样本所包含的调查或受试对象数。样本含量估算是在保证研究结论具有一定可靠性的条件下，确定最小的实验或调查单位数。
（二）样本含量的确定因素
1. 检验水准。，则n
2. 检验效能1-β。（1-），则n ，（1-）> 0.75，通常取0.8。
3.两样本均数比较
( z z ) n1 n2 2
2
【例4】为研究某地正常成年男、女末稍血液的红细胞
的差别，据文献报道，男性红细胞均数为465万/mm3 ，女性红细胞均数为422万/mm3，标准差为52万/mm3，取双侧α=0.05，把握度（1-β）=0.9，问要抽查多少人才能发现男女间红细胞的差别？
2
2.估计检验效能 z
3. 估计总体参数的差异
n2Biblioteka z2( z z ) n
Zα：检验水准所对应的z值，单侧Z0.05=1.645，双侧Z0.05=1.96 Zβ：第二类错误概率β所对应的Z值，Z0.1=1.282
δ ：两总体均数间的差值
σ：总体标准差
（四）样本含量的估计 1.抽样调查（1）均数抽样
间的差别。
4. 配对计量资料比较
( z z ) d n

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(0.8 − 0.6)2
n2=n1=109，故可认为每组需要观察 109例患者。
样本含量的常用软件：
SAS nQuery Advisor PASS Excel Sample power EGRET SIZ SASA
理论课结束
下周实习课开始。。。。有什么建议通过管理部门提出，非常感谢！
c= n2/n1 ，p=(p1+cp2)/(c+1)
]
2
Zα / 2 为Z分布的双侧临界值；单侧检验时用 Zα
Z β 不论双侧还是单侧检验，均取单侧临界值
例15-5
拟研究两种抗菌药物对某感染性疾病的治疗效果，经预实验，实验药有效率为80%，对照药为60%，今要作正式试验，问每组需要观察多少例患者（采用双侧检验）？
总体概率π越近于0.50，说明资料变异度越大，则所需样本含量也愈多。
σ或π的数值由预实验，或文献、专业知识决定。
此外，样本含量大小与下列因素也有关系：
分组的多少、变量多少和抽样方法有关。
参考有关教科书和参考文献。
样本含量的估计方法：
1. 经验法：根据前人的研究结果或咨询同行专家的方法来确定样本例数，该方法较为粗略。 2. 查表法：方便，但受到列表的限制； 3. 计算法：采用专用公式计算，可根据检验效能的公式反推过来求样本含量。
⎡ 2 × 0 .24 × 0 .04 ⎢ 1 .96 2 × 0 .14 + 1 .282 × 0 .14 n=⎢ 0 .24 − 0 .14 ⎢ ⎢ ⎣ ⎤ ⎥ ⎥ = 57 .146 ≈ 58 ⎥ ⎥ ⎦
2
因此，需要58对。
⑶两样本频率检验见公式：15-8
[ Z n=
1
α/2
p(1− p)(1+ c) / c + Zβ p1(1− p1) + p2 (1− p2 ) / c ( p1 − p2 )2
⑵配对设计二分类χ2检验基本格式：
乙法方法 + + 甲法 — c d a — b
公式：
⎡ ⎢ Zα /2 n = ⎢ ⎢ ⎢ ⎢ ⎣ 2π
c
+ Zβ
2π
πc
+−
π −+ ⎤
⎥ ⎥ ⎥ ⎥ ⎥ ⎦
2
π −+ − π +−
15-7
π +− + π −+ b c , π −+ = ,π c = , π +− = 2 a+b a+c ٛٛٛٛٛٛٛٛٛ
2. β ：第 II 类错误概率，或检验效能1- β 所设β小或检验效能1- β 高，则所需样本量大；一般设β在0.80 以上。
3. δ ：容许误差
容许误差δ小，所需样本含量大；反之。
δ的数值由问题的性质决定，如：血压值早晚不一样。
4. σ 和π ：总体标准差或总体概率π
σ反映资料的变异度，σ 愈大所需样本含量愈多。
(1)单样本均数检验：
双侧检验：
⎡⎛ Ζ ⎢⎜ ⎝ N = ⎢ ⎢ ⎣
α
2
+ Ζ
β
δ
⎞ ⎟σ ⎤ ⎥ ⎠ ⎥ ⎥ ⎦
2
15-2
(Ζ 单侧检验： N = ⎡ ⎢
⎣
α
+ Ζ
β
)σ
δ
⎤ ⎥ ⎦
2
15-1
Ζα / 2 为标准正态分布的双侧临界值； Ζα 为单侧检验时的。
Ζ β 均取单侧临界值
举例：用某药治疗高胆固醇血症, 已知血清胆固醇降低0.52mmol/L专业上有意义，若σ=1.28mmol/L, 单侧α=0.05，检验功能0.90时，需多大样本含量？
解析：
本例p1=0.8,p2=0.6,p=(0.8+0.6)/2=0.7, 设α=0.05，β=0.10，Z0.05/2 =1.96, Z0.10 =1.282，取c=1,代入公式得：
2 1
[ 1.96 0.7(1− 0.7)(1+1) / 1 +1.282 0.8(1− 0.8) + 0.6(1− 0.6) / 1] n = = 108.27 ≈ 109
解： α=0.05 单侧，β＝0.10，
δ=0.52mmol/L，σ =1.28 mmol/L 1.645 Ζ β＝Ζ 0.10＝1.282 查表： Ζα＝Ζ0.05＝
⎡ (1.645+1.282)×1.28⎤ ≈ 52 代入公式：Ν = ⎢ ⎥ 0.52 ⎦ ⎣
2
故需检测52位高胆固醇患者，才有90%的概率发现该药有专业意义的疗效。
例15-4
某菌种接种于甲、乙两种培养基的结果如下：甲阳性乙阴性的概率为π+- =0.04，甲阴性乙阳性的概率为π-+ =0.24，设 α=0.05（双侧），β=0.10，问应该用多少样本对子数？
解析：
π+- =0.04, π-+ =0.24, πc =(0.04+0.24) /2=0.14, Z0.05/2 =1.96, Z0.10 =1.282 代入公式得：
第15章样本含量估计
影响样本含量估计的四个主要因素：
α ：第 I 类错误概率，也是检验水准； β ：第 II 类错误概率β，或检验效能1- β δ ：容许误差 σ ：总体标准差σ 或总体概率π
1.
ቤተ መጻሕፍቲ ባይዱ
α ：第 I 类错误概率，也称检验水准α
所设α小，所需样本含量大；相同α，双侧检验比单侧检验所需样本含量多；所以要注意单双侧；一般设α为0.05，0.01

15样本含量估计

合集下载

样本例数的统计学要求

临床试验样本含量的计算

常用样本含量估计

生物医学研究的统计学方法课后答案(案例分析)

样本含量估计范文

第15章样本含量估计案例辨析及参考答案

样本量计算

样本含量估计

样本含量估计

样本含量的估计与检验效能.

文档推荐

最新文档

15样本含量估计

合集下载

样本例数的统计学要求

临床试验样本含量的计算

常用样本含量估计

生物医学研究的统计学方法 课后答案(案例分析)

样本含量估计范文

第15章 样本含量估计案例辨析及参考答案

样本量计算

样本含量估计

样本含量估计

样本含量的估计与检验效能.

文档推荐

最新文档

生物医学研究的统计学方法课后答案(案例分析)

第15章样本含量估计案例辨析及参考答案