当前位置:文档之家› 第15章 样本含量估计思考与练习参考答案

第15章 样本含量估计思考与练习参考答案

第15章 样本含量估计思考与练习参考答案
第15章 样本含量估计思考与练习参考答案

第15章 样本含量估计

思考与练习参考答案

一、最佳选择题

1. 在假设检验中,样本含量的确定( C )。

A. 只与Ⅰ类错误概率α有关

B. 只与Ⅱ类错误概率β有关

C. 与α、β都有关

D. 与α、β都无关

E. 只与α、β有关

2. 以下关于检验功效的描述,不正确的是( C )。

A. 假设检验中,若0H 客观上不成立,但根据假设检验的规则,将有β大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为β-1,称为检验功效。

B. 检验功效受客观事物差异的大小、个体间变异的大小、样本量和α值等要素的影响。

C. 假设检验的“阴性”结果(P >0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。

D. 假设检验得出“阴性”结果(P >0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。

E. 当假设检验出现“阴性”结果(P >0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。

3.在调查研究中,计算配对设计均数比较所需样本含量的公式为( A )。

A. 2])([δβαS

t t n += B. 2])([2δβαS

t t n +?= C. 2])([δβαS

t t N += D. 2

2

21)()

)(1(2p p Z Z p p n -+-=βα

E. =n 22212211)(]

)1()1()1(2[p p p p p p Z p p Z --+-+-βα

4. 在调查研究中,计算两样本率比较所需样本含量的公式为( E )。

A. 2])([δβαS

t t n += B. 2])([2δβαS

t t n +?= C. 2])([δβαS

t t N += D. 2

221)

()

)(1(2p p Z Z p p n -+-=βα

E. 22212211)(]

)1()1()1(2[p p p p p p Z p p Z n --+-+-=βα

5. 有很多人都认为,只要样本含量大于30就可以称其为大样本,可用大样本条件下推导出来的一切公式进行相应的统计分析。下列说法中( C )最正确。

A. 题中所说的条件和结论都正确

B. 题中所说的条件正确,但结论不正确

C. 题中所说的条件和结论都不正确

D. 题中所说的条件不正确,但结论正确

E. 题中所说的条件和结论正确概率为70%,错误概率为30%

6.在研究一个因变量依赖多个自变量变化规律时,估计样本含量非常复杂,有人提供了一个经验估算方法,即样本含量N (即拟观测的个体数目)至少应当是自变量个数的10倍。下列说法中( B )最正确。

A. 此法无任何参考价值

B. 在没有精确算法时,此法有一定的参考价值

C. 此法根本不能用

D. 此法永远是正确的

E. 此法正确的概率为80%,错误的概率为20%

二、思考题

1. 决定样本含量的依据有哪些?

答:决定样本含量的依据有:① 犯Ⅰ类错误的概率α,即检验水准。② 犯Ⅱ类错误的概率β。③ 总体平均数μ(或总体概率π)、总体标准差σ。μ(π)、σ一般未知,通常以样本的)(p X 、S 作为估计值,多由预实验、查阅文献、经验估计而获得。④ 处理组间的差别δ(所比较的两个总体参数间的差别δ),如21μμδ-=或12μμδ-=。若研究者无法得到总体参数的信息,可作预实验来估计,也可根据专业要求由研究者规定。

2. 当假设检验的结果为“阴性”(P >0.05)时,对样本含量和检验功效进行复核有何意义?

答:当假设检验的结果为“阴性”(P >0.05)时,对样本含量和检验功效进行复核具有重要意义。通过对样本含量和检验功效进行复核(主要是计算检验功效),可以检查样本含量和检验功效是否偏低,以便正确认识假设检验的结果,避免得出错误的研究结论。若检验功效偏低,则说明样本含量不足,应加大样本含量,重新进行实验。

三、计算题

1. 据说某民族正常人体温平均高于37℃,为了进行核实,拟进行抽样调查。如果就总体而言平均高出0.1℃便不可忽略,而已知正常人体温的标准差约为0.2℃,那么,为了将Ⅰ、Ⅱ类错误的概率控制在05.0=α和05.0=β,试估计样本含量。

解:据题意,要核实某民族正常人平均体温是否高于37℃,就是要通过抽样对该民族正常人的平均体温作出估计,并检验该平均体温是否高于37℃。很显然,应采用单侧检验。又已知δ=0.10,σ=0.20,05.0=α,05.0=β,先取∞=df ,则

)

(05.0)(∞∞=t t α=1.645,)(05.0)(∞∞=t t β=1.645,将数据代入公式(15-1),得 2)1()(??????+=δβαS t t n =2

1.02.0)645.1645.1(???????+=43.3≈44

431)1(=-=n df ,则 (43)0.05(43) 1.681

t t α==,(43)0.05(43) 1.681t t β==,代入公式算得: 2)2()(??????+=δβαS t t n =2

(1.681 1.681)0.20.1+???????=45.2≈46

(1)145df n =-=,则 (45)0.05(45) 1.679

t t α==,(45)0.05(45) 1.679t t β==,代入公式计算得:

2)2()(??????+=δβαS t t n =2(1.679 1.679)0.20.1+???????=45.1≈46

可取46=n ,即需从该民族的正常人群中随机抽取46人进行调查。

2. 某人在进行上述调查之前未经估算便人为决定取样本量25=n 。试估计检验功效。

解:据题意,有25=n ,δ=0.10,σ=0.20,05.0=α,645.105.0==Z Z α,将数据代入公式(15-20),得

855.0645.12

.0251.0=-=-=αβσδZ n Z 查表,得检验功效 21805.03802.01+≈

-β=0.803 7。 3. 为了比较两类片剂的溶解速率,决定各随机抽取10片,测定 5 min 溶解量,然后作05.0=α水平的检验。据预实验,两类片剂的变异性相同,标准差约为6个单位,均数之差也约为6个单位,问该项研究的功效有多大?欲使功效达到95%,样本量应当多大?

解:已知101=n ,102=n ,6=δ,6=σ,双侧05.0=α,96.12/05.02/==Z Z α,将数据代入公式(15-23),得

2/21/1/1αβσδ

Z n n Z -+==96.110/110/166-+=0.276 1

查表,得检验功效

4608.02

)3610.04606.0(1=+≈-β 要使功效达到95%,需重新估计样本含量:

将数据6=δ,6=σ,96.1)(2/05.0)(2/==∞∞t t α,)(05.0)(∞∞=t t β=1.645代入公式(15-6),得

5298.5166)645.196.1(4)(42222

2

22/)1(≈=?+=+=δβαS t t N 取502)1(=-=N df ,则

()5

010.22/)000.2021.2()60(2/05.0)40(2/05.0)50(2/05.0)50(2/=+=+≈=t t t t α()5677.12/)671.1684.1()60(05.0)40(05.0)50(05.0)50(=+=+≈=t t t t β

将有关数据代入公式(15-6),得

5641.546

6)5 677.15 010.2(4)(422222

22/)2(≈=?+=+=δβαS t t N (取比计算结果稍大的偶数)

取542)2(=-=N df ,则

000.2)60(2/05.0)54(2/05.0)54(2/=≈=t t t α

671.1)60(05.0)54(05.0)54(=≈=t t t β

将有关数据代入公式(15-6),得

5490.536

6)671.1000.2(4)(422222

22/)3(≈=?+=+=δβαS t t N 至此,可取54=N ,即2721==n n 。也就是说,欲使功效达到95%,当双侧05.0=α,单侧05.0=β时,样本含量应为每类片剂各27片。

4. 甲、乙两医院的内科分别随机调查了30名住院患者,甲医院中对医疗服务表示满意者有20名,乙医院中表示满意者有23名。经统计检验,尚不能认为两医院内科住院患者的满意率不等。如想考查两医院内科住院患者的满意率是否相差10%以上,至少应当各调查多少患者?

解:667.030/201≈=p ,767.030/232≈=p ,100.0%10==δ,取双侧

05.0=α,单侧10.0=β,960.12/05.0=Z ,282.110.0=Z ,取1/12==n n c ,则717.02/)767.0667.0(2/)(21=+=+=p p p ,将数据代入公式(15-9),得

2212

22112/1)(]/)1()1(/)1)(1([p p c p p p p Z c c p p Z n --+-++-=βα =22

)100.0(]1/)767.01(767.0)667.01(667.0282.11/)11)(717.01(717.0960.1[-+-++-

=424.46

≈425

12cn n ==1n =425

因此,可以认为在双侧05.0=α,单侧10.0=β,两医院随机调查的病例数相等的条件下,想考查两医院内科住院患者的满意率是否相差10%以上,至少应当各调查425例患者。

5. 第4题样本中满意率分别为20/30=67%和23/30=77%,相差10%,差别似乎不小,但统计检验却不能拒绝总体满意率相等的假设。如果调查人数和满意人数均为现在的10倍,样本

中满意率仍分别为67%和77%,再作统计检验却能够拒绝总体满意率相等的假设。如何解释这种现象?从以上现象中可以得到什么启示?(提示:试从检验功效的角度予以解释。)

解:取双侧05.0=α,960.12/05.0=Z ,当3021==n n ,6021=+=n n N 时,67.01=p ,77.02=p ,72.02/)(21=+=p p p ,将有关数据代入公式(15-27),得

)]1()1([2)

1(2||22112/21ππππππππαβ-+----=Z N Z

)].(.).(.[)

.(..|..|77017706701670272017209601260770670-+--?--=

≈-1.10

查表,得检验功效β-1=0.135 7。

此时,检验功效非常低,犯Ⅱ型错误(即假阴性错误)的概率非常大(38640.=β),导致总体参数本来存在的差异未能检测出来,出现非真实的阴性结果。

当调查人数和满意人数均为现在的10倍,即30021==n n ,60021=+=n n N 时,仍取双侧050.=α,960.12/05.0=Z ,保持67.01=p ,77.02=p ,72.02/)(21=+=p p p 不变,将有关数据代入公式(15-27),得

)]1()1([2)

1(2||22112/21ππππππππαβ-+----=Z N Z

)].(.).(.[)

.(..|..|770177067016702720172096012600770670-+--?--=

≈0.77

查表,得检验功效β-1=0.779 4。

此时,检验功效达到了0.75以上,而犯Ⅱ型错误(即假阴性错误)的概率降到了0.25以下,因而总体参数本来存在的差异就比较容易被检测出来,也就比较容易拒绝“总体参数相等”这一假设。

从以上现象中可以得到一条重要启示,那就是:当假设检验的结果为“阴性”(P >0.05)时,对样本含量和检验功效进行复核具有重要意义。而且,当假设检验的结果为“阴性”时,应该对样本含量和检验功效进行复核(主要是计算检验功效),以便检查样本含量和检验功效

是否偏低,从而正确认识假设检验的结果,避免得出错误的研究结论。若检验功效偏低,则说明样本含量不足,应加大样本含量,重新进行实验。

6. 用某药降低心肌梗死患者血压的双盲实验结果如下(教材表15-10),假设检验结果54.1=t ,2.01.0<

教材表15-10 两组心肌梗死患者治疗后的收缩压/kPa

药物

n X S 实验药

15 14.4 1.6 对照药 15 15.3 1.6

解:由于假设检验结果为阴性(05.01.0>>P ),因而有必要计算出检验功效,以检查样本含量是否偏低。

已知1521==n n ,9.0|4.143.15|=-=δ,6.1=c S ,取单侧05.0=α,645.105.0==Z Z α,将数据代入公式(15-22),得

αβσδ

Z n n Z -+=21/1/1645.115/115/16.19.0-+==-0.10

查表,得β-1=0.460 2<0.75,检验功效很低,因此该假设检验“阴性”结论的可靠性较差。

7. 观察急性白血病患者化疗缓解与并发感染的关系,根据检验结果(教材表15-11),05.0>P ,即两组之间的差别无统计学意义。05.0=α,问检验功效是否充分?

教材表15-11 急性白血病患者化疗缓解与并发感染的关系

化疗后

缓解情况

n 感染发生频率/% P 缓解

17 88.2 >0.05 未缓解 27 70.3

解:两组患者感染发生频率分别为88.2%和70.3%,经假设检验,两组之间的差别无统计学意义(P >0.05),此时,应检查检验功效是否足够。

又171=n ,272=n ,882.01=p ,703.02=p ,)703.027882.017(?+?=p /(17+27)=0.772,取05.0=α,96.12/05.0=Z (双侧)。代入公式(15-29),得

222111212/21/)1(/)1()

/1/1)(1(n n n n Z Z ππππππππαβ-+-+---=

277030170301788201882027117177201772096170308820/).(./).(.)

//)(.(....-+-+---=

=-0.642 2

查表,得1261.01=-=βPower <0.75, 检验功效不够充分,需增加样本含量进一 步扩大实验。

(胡良平 周诗国 宇传华 王家春)

如何确定抽样统计的最小样本量

如何确定抽样统计的最小样本量(附:随机抽样统计的抽样误差Excel计算表格) 在电视节目中经常看到关于选举的报道中经常会后有支持率的数字,例如:调查结果为 ?a方支持率为%; ?b方支持率为%; ?c方支持率为%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况); 最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采 样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为 1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=,置信度为90%时,=,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样为y 相对抽样误差h = E / y C= σ / y 以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 置信度相对抽样误差(假设:C=

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

《医学统计学》辅导:样本含量的估计

公卫执业医师《医学统计学》辅导:样本含量的估计 一、估计样本含量的意义及条件 我们在第一节里曾提到重复的原则。所谓重复,是指各处理组(对照在实验研究中也被看作是一种处理,而且是必不可少的)的受试对象都应有一定的数 量,例数不能太少,所以在抽样调查、临床观察或实验研究中,首先总要考虑样本含量(或叫样本大小)问题。样本太小,使应有的差别不能显示出来,难以获得正 确的研究结果,结论也缺乏充分的依据;但样本太大,会增加实际工作中的困难,对实验条件的严格控制也不易做到,并且造成不必要的浪费。所以这里所说的样本 含量估计,系指在保证研究结论具有一定可靠性的条件下,确定最少的观察或实验例数。 但是,样本含量又是个比较复杂的问题。要讲清在各种情况下估计样本含量的方法和原理,那是很繁杂的。而且,不同的参考书上介绍的计算公式和工具表往往不一样,以致同一问题所得的结果也可能有出入。所以,不论按哪种公式或工具表求得的结果,也只能是个近似的估计数。 估计样本含量,必须事先明确一些条件与要求: (一)根据研究目的与资料性质,要先知道一些数据。例如要比较几组计数资料,先要知道百分数或率;要比较几组计量资料,先要知道平均数及标准差。这些数据可从以往的实践,预备试验的结果、兄弟单位的经验或文献资料里得来。 (二)确定容许误差。由于抽样误差的影响,用样本指标估计总体指标常有一定的误差,因而要确定一个样本指标与总体指标相差所容许的限度。此值要求越小,所需例数就越多。 (三)确定把握度(1—β)。β是第二型错误的概率;而1—β的意思是:如果两组确有差别,则在每100次实验中平均能发现出差别来的概率。把握度可用小数(或百分数)表示,一般取0.99、0.95、0.90、0.80、0.50.要求把握度越高,则所需例数直多。 (四)确定显著性水平,即第一型错误的概率(α)。这就是希望在α=0.05的水准上发现差别,还是希望在α=0.01的水准上发现差别。α越少,所需例数越多。 此外,估计样本含量时还应当根据专业知识确定用单侧检验或双侧检验。同一实验,若既可用单侧检验又可用双侧检验,则前者所需例数要少些。 二、用计算法估计样本含量

样本量的确定

样本量的确定 北京广播学院新闻传播学院 调查统计研究所 二零零一年五月 沈浩 本讲主要内容 如何计算简单随机抽样的样本量确定 如何实现分层抽样中各层样本单位数的分配样本容量的确定 样本量=费用+精度 (函数) 确定样本容量,需要处理好预定的精度与现有经费,同时也要考虑资源和时间等限 制条件,最终的样本量确定是在上述因素之间的权衡关系。分层抽样分配样本的标准 总的样本容量事先确定 估计值要求达到的精度预先给定 影响调查样本容量的因素 调查估计值所希望达到的精度 调查估计值所能允许的误差。 估计量的抽样方差较小,估计值是精确的 估计值的精度越高,所需的样本容量就越大 影响精度的因素也同样影响着样本容量的大小 所研究指标在总体中的变异程度 总体的大小

样本设计和所使用的估计量 无回答率 客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少 除了估计值的精度以外,调查实际操作的限制条件也许是影响样本容量的最大因 素。 11>(给定精度水平下样本容量的确定样本容量的大小与调查估计值所要求的精度紧密相关 数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。标准误差 误差界限 变异系数 抽样方差的几种计量方法 抽样调查中样本容量的确定,也经常会使用一种或多种这样的计量方法来对精度进 行说明。 非抽样误差 非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑

样本量计算

样本量计算 Last revision date: 13 December 2020.

1.估计样本量的决定因素 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。 显着性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取或。 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为,或。即1-β=,或,也就是说把握度为80%,90%或95%。 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 总体标准差(s) 一般因未知而用样本标准差s代替。 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。

(完整版)第18章样本含量的估计

无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物 学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。这就是样本含量估计(estimation of sample size)。本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。 第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。因此,尽量减小抽样误差是提高统计推断精度的必然要求。在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。 但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。另外,由于所施加干预措施可能存在的不良事件反应尚属未知,让过多的临床病例面临风险,亦有悖医学伦理原则。 因此,恰当的样本含量应该是满足医学科研统计学要求,保证一定推断精度 和检验效能的前提下的最少研究对象数。

第18章样本含量的估计

第十八章样本含量估计 无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。这就是样本含量估计(estimation of sample size)。本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。 第一节样本含量估计的意义及方法 一、样本含量估计的意义 由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。因此,尽量减小抽样误差是提高统计推断精度的必然要求。在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。 但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。另外,由于所施加干预措施可能存在的不良事件反应尚属未知,让过多的临床病例面临风险,亦有悖医学伦理原则。 因此,恰当的样本含量应该是满足医学科研统计学要求,保证一定推断精度

样本量估计

样本含量估算方法及其软件实现(一) 样本含量(sample size)即观察例数的多少,又称样本大小。在保证研究结论具有一定的可靠性(精度和检验功效)的前提下,常需要在设计阶段就人估计最少的受试对象。在医学科研中,只要是抽样研究,就要考虑样本含量的估计。 样本含量估计充分反映了科研设计中“重复”的基本原则,过小过大都有其弊端。样本含量过小,所得指标不稳定,用于推断总体的精密度和准确度差;检验的功效性低,应有的差别不能显示出来,难以获得正确的研究结果,结论也缺乏充分的证据;样本含量过大,会整加实际工作的困难,浪费人力、物力、财力和时间。由于过分追求数量,可能会引起更多的混杂因素,从而影响数据的质量。 影响假设检验时样本含量估计的因素有四个: 1.第一类错误概率的大小α也称检验水准。α越小所需样本含量越多,对于相同α,双侧检验比单侧检验所需要的样本含量更多。 2.检验功效(1-β)或第二类错误概率的大小β检验功效越大,第二类错误的概率愈小,所需要样本含量愈多。 3.容许误差δ容许误差δ愈大,所需的样本含量愈小。 4.总体标准差σ或总体概率σ愈大,所需样本含量自然愈多。总体概率越接近0.5,则所需样本含量愈多。 样本含量的估算方法有查表法和计算法两种。随着计算机的普遍使用,统计学家也开发了一些专门的样本含量估算软件。其算法都是根据上述影响因素结合统计学原理求得。 我就通过实例的样本含量的计算过程,使大家对样本含量有一个更加直观

的认识。 1 计量资料单组设计基于t检验的差异性检验 举例:已知中国50-70岁男性的平均收缩压为158 mmHg,标准差为18,用药物AAA干预,平均收缩压下降10 mmHg 则认为有临床意义,α=0.05, Power=90%,Power =1-β, 双側检验,需要多少病例数。 启动医学研究样本含量估算系统SASA1.0,在桌面上双击SASA1.0快捷方式或点击开始 \ 所有程序 \ Sample Size Adviser \ Sample Size Adviser,进入SASA1.0主窗口。在Goal栏目中选定Means(计量资料)在Group栏目中选定1,在Analysis Method栏目中选定Test(差异性检验)。

样本量的确定方法

样本量的确定方法(2008-10-14 09:12:34)一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内 样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量 计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的 公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。 1 / 5 1.简单随机抽样确定样本量主要有两种类型: (1)对于平均数类型的变量 对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量。已知期望调查结果的精度(E), 期望调查结果的置信度(L),以及总体的标准差估计值σ的具体数据,总体单位数N。2222/N) σ/(e/Z+σ计算公式为:n=222/e特殊情况下,如果是很大总体,计算公式变为:n= Zσ95%调查结果在例如希望平均收入的误差在正负人民币30元之间,95%的置信范围以内,其。根据估计总体的标准差为150元,总体单位数为1000。的统计量为的置信度要求 Z1.96:n=150*150/(30*30/(1.96*1.96))+150*150/1000)=88 样本量 (2)于百分比类型的变量(E),,一般根据下列步骤计算样本量。已知调查结果的精度值百分比对于已知数据为百分比。,的精度即样本变异程度,总体数为N以及置信度(L),比例估计(P)22+ P(1-P)/N) :n=P(1-P)/(e/Z则计算公式为22公式为:n= ZP(1-P)/e同样,特殊情况下如果不考虑总体, 。取其样本变异程度最大时的值为我们不知道,P的取值,0.5一般情况下的置信95%,其的置信范围以内之间例如:希望平均收入的误差在正负0.05,调查结果在95%。样本量0.5,1.96度要求Z的统计量为,估计P为总体单位数为

临床试验样本量的估算

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。 但是中国的国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA XX规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,贝S每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(a =0.05, (3 =0.2)时:

计数资料: 平均有效率(P)等效标准(S) N= 公式:N=12.365X P(1-P)/ 52 计量资料: 共同标准差(S)等效标准(5)N= 公式:N=12.365X (S/ 5 )2 等效性试验(a =0.05, (3 =0.2)时: 计数资料: 平均有效率(P)等效标准(5)N= 公式:N=17.127X P(1-P)/ 5 2 计量资料: 共同标准差(S)等效标准(5)N= 公式:N=17.127X (S/ 5 )2 上述公式的说明: 1)该公式源于郑青山教授发表的文献。

如何确定抽样统计的最小样本量

?a方支持率为45.3%; ?b方支持率为30.2%; ?c方支持率为8.5%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±2.5%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合标准正态分布的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况);

最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :方差,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=1.96,置信度为90%时,=1.645,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样均值为y 相对抽样误差h = E / y 变异系数C= σ / y

以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 相对抽样误差(假设:C=0.4) π为按照经验得出的最后比例,在未知时π可取50%,待算出结果后再重新拟合,比例越悬 从而看出大部分的电话抽样调查:95%置信度的情况下,误差要控制在2%以内取样量一般在2000-5000;为了方便计算抽样调查的误差和估算抽样量,制作了一个Excel表格附后,调整颜色框中的抽样量数字就可以得到相应的误差或根据指定的误差范围估算出抽样量;

样本量估算

1.单因素二水平设计定量资料的非劣效性检验时样本量的估算 1.1计算公式: 非劣效性检验应当采用单侧的检验水准α,假定允许的第二类错误概率不超过β,则非劣效性检验每组需要的样本含量为: 22211)/()(2θδβα-+=--L S u u n (1-1)[1] 2221)/()(2δβαe s z z n n ?+==(1-2)[2] 1.2式中各参数代表的意义,n 为每组样本含量,α-1u 、β-1u 为单侧标准正态离差界值,S 为估计的共同标准差,L δ为非劣界值,且L δ<0,θ为试验组与对照组总体均值差值的估计值。 说明:单因素二水平设计定量资料的非劣效性检验时样本量的估算公式与上式完全类似,只需将非劣界值L δ(L δ<0)替换成优效界值u δ(u δ>0)即可。 1.3例题:某利尿新药拟进行Ⅱ期临床试验,与阳性药按1:1的比例安排例数,考察24h 新药利尿量(ml )是否不差于阳性药。根据以往的疗效和统计学的一般要求,取α=0.05,β=0.20,非劣效界值L δ=﹣60ml ,已知两组共同标准差S =180ml ,假定新药与阳性对照药总体利尿量的差值θ=﹣20ml ,问每组需要多少病例? 将05.01-u =1.645,20.01-u =0.845,s=180,L δ=﹣60,θ=﹣20代入公式,得: 22211)/()(2θδβα-+=--L S u u n =2(1.645+0.845)2×1802/(﹣60﹣(﹣20))2≈251.1, 取n=252,即每组需要252例。 2.单因素二水平设计定性资料的非劣效性检验时样本含量的估算 2.1计算公式: 非劣效性检验应当采用单侧检验,检验水准为α,假定允许的第二类错误概率不超过β,试验组与对照组总体率的差值为C T ππθ -=(T π、C π未知时可用样本频率估计),两组的平均有效率为2/)(C T πππ+=,非劣界值为u δ<0,则在两组样本含量相等的情况下,非劣效性检验每组需要的样本含量为: 2211)/()1()(2θδππβα--+=--L u u n (2-1)[1] 2合合221/)-1()(2δβαp p z z n n +==(2-2)[2] 说明:单因素二水平设计定性资料的优效性检验时样本含量的估计公式与式(2-1)完全类似,只需将非劣界值L δ(L δ<0)替换成优效界值u δ(u δ>0)即可。 2.2例题:某新药拟进行Ⅱ期临床试验,与阳性药按1:1的比例安排例数,考察新药临床治愈率是否不差于阳性药。根据以往的疗效和统计学的一般要求,取α=0.05,β=0.20,非劣界值δ=﹣0.15,平均有效率P=0.80,并假定两组总体有效率相等,问每组需

抽样调查样本量确定.

抽样调查样本量确定.

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1研究对象的变化程度,即变异程度; (2要求和允许的误差大小,即精度要求; (3要求推断的置信度,一般情况下,置信度取为95%; (4总体的大小; (5抽样的方法。

也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样 本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算 样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根 据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。 1.简单随机抽样确定样本量主要有两种类型: (1对于平均数类型的变量 对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量。已知期望调查 结果的精度(E, 期望调查结果的置信度(L,以及总体的标准差估计值σ的具体数据,总体

样本量的确定

样本量的确定 1. 二值分布(估计比例时的样本容量) 这种情况下,表明可能的采样结果只有两种情况,即是与非的问题。比如调查某一批产品的合格率。样本量的确定主要受以下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N ;通过置信水平即可查表确定z 。 通常情况下置信水平选择95%。抽样偏差为±5%,不过也不完全一定,抽样偏差的确定还是要考虑实际情况,比如最小的调查估计值p=5%,此时抽样偏差就应该小于5%。 这时,就可以确定样本量: 22 2 (1)(1)z p p n z p p e N -=-+ P 值的确定:用以前类似样本得到的结果来近似,如果完全不知道就设p=0.5,因为此时方差最大,可求得一个比较保守的样本容量。 样本容量和在p=0.5时运用简单随机抽样估计p 值得到的抽样偏差 e

如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 (1)z p p n e -= 事实上当总体容量很小时,不会采用抽样调查,而是普查了。 2. 正态分布(估计均值时的样本容量) 在这种情况下,表明采样的结果是具有多样性的,并不局限在0、1上。比如对某一城市老年人的患病年龄进行统计。这个时候,样本量同样受如下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N 。 样本量为: 22 22 2 z S n z S e N =+ S 表明的是总体标准差,这个可以用以前类似样本得到的S 或是实验调查样本的S 来近似。 同样,如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 2 z S n e = 理论基础: 根据数理统计知识,样本均值对总体均值可构造如下统计量: x X u σ-,他满足标准正态分 布,查表即可得到某一显著性水平下这个统计量的值,这里面的x σ表示总体均值估计量的标准误差。 在无放回简单随机抽样情况下,总体均值估计量的标准误差表达式:

最新第15章-样本含量估计思考与练习参考答案

第15章 样本含量估计 思考与练习参考答案 一、最佳选择题 1. 在假设检验中,样本含量的确定( C )。 A. 只与Ⅰ类错误概率α有关 B. 只与Ⅱ类错误概率β有关 C. 与α、β都有关 D. 与α、β都无关 E. 只与α、β有关 2. 以下关于检验功效的描述,不正确的是( C )。 A. 假设检验中,若0H 客观上不成立,但根据假设检验的规则,将有β大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为β-1,称为检验功效。 B. 检验功效受客观事物差异的大小、个体间变异的大小、样本量和α值等要素的影响。 C. 假设检验的“阴性”结果(P >0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。 D. 假设检验得出“阴性”结果(P >0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。 E. 当假设检验出现“阴性”结果(P >0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。 3.在调查研究中,计算配对设计均数比较所需样本含量的公式为( A )。 A. 2])([δβαS t t n += B. 2])([2δβαS t t n +?= C. 2])([δβαS t t N += D. 2 221) () )(1(2p p Z Z p p n -+-=βα E. =n 22212211)(] )1()1()1(2[p p p p p p Z p p Z --+-+-βα 4. 在调查研究中,计算两样本率比较所需样本含量的公式为( E )。

相关主题
文本预览
相关文档 最新文档