样本量计算(DOC)
- 格式:doc
- 大小:83.00 KB
- 文档页数:7
1.估计样本量的决定因素1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。
1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.3 研究因素的有效率有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。
1.4 显著性水平即假设检验第一类(α)错误出现的概率。
为假阳性错误出现的概率。
α越小,所需的样本量越大,反之就要越小。
α水平由研究者具情决定,通常α取0.05或0.01。
1.5 检验效能检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。
即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。
β水平由研究者具情决定,通常取β为0.2,0.1或0.05。
即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。
1.6 容许的误差(δ)如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。
容许误差越小,需要样本量越大。
一般取总体均数(1-α)可信限的一半。
1.7 总体标准差(s)一般因未知而用样本标准差s代替。
1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其α或β的Ua 界值通过查标准正态分布的分位数表即可得到。
2.样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
卫生统计学样本量计算公式
卫生统计学中,样本量的计算是非常重要的,它涉及到研究的
可靠性和有效性。
样本量的计算公式可以根据研究的具体设计和目
的而有所不同,但是在大多数情况下,可以使用以下公式来计算样
本量:
n = (Z^2 p (1-p)) / E^2。
在这个公式中,n代表所需的样本量,Z代表所选置信水平的Z
值(例如95%置信水平对应的Z值约为1.96),p代表研究中所关
注的特征在总体中的估计比例,E代表允许的误差范围。
这个公式的推导涉及到统计学中的抽样理论和置信区间的计算,其基本思想是通过控制置信水平和误差范围来确定所需的样本量,
以确保研究结果的可靠性和有效性。
需要注意的是,样本量的计算还可能受到其他因素的影响,例
如预期的效应大小、研究的统计方法等。
因此,在实际应用中,可
能会有一些修正或调整公式的参数,以适应具体的研究需求。
总之,样本量的计算是卫生统计学中非常重要的一部分,通过合理计算样本量,可以提高研究的科学性和可靠性,从而更好地为卫生领域的决策和实践提供支持。
样本量计算1.估计样本量的决定因素1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。
1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.3 研究因素的有效率有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。
1.4 显著性水平即假设检验第一类(α)错误出现的概率。
为假阳性错误出现的概率。
α越小,所需的样本量越大,反之就要越小。
α水平由研究者具情决定,通常α取0.05或0.01。
1.5 检验效能检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。
即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。
β水平由研究者具情决定,通常取β为0.2,0.1或0.05。
即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。
1.6 容许的误差(δ)如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。
容许误差越小,需要样本量越大。
一般取总体均数(1-α)可信限的一半。
1.7 总体标准差(s)一般因未知而用样本标准差s代替。
1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其α或β的Ua 界值通过查标准正态分布的分位数表即可得到。
2.样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
1.估计样本量的决定因素1.1资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。
1.2研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.31.41.5度为1.61.71.8双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。
2.样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。
研究的类型不同,则样本量也有所不同。
2.1描述性研究护理研究中的描述性研究多为横断面研究,横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、分层抽样和整群抽样。
分层抽样的样本量大小取决于作者选用的对象是用均数还是率进行抽样调查。
例.要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调查,采用分层多级抽样,选用的是均数抽样的公式,Uα为检验水准α对应的υ值,σ为总体标准差,δ为容许误差,根据预实验得出标准差σ=1.09,取α=0.05,δ=0.1,样本量算得520例,考虑到10%-15%的失访率和抽样误差,样本扩展到690例。
2.2分析性研究2.2.1探索有关变量的影响因素研究有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。
欢迎阅读1.估计样本量的决定因素1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。
1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.3 1.4 1.5 检验水平由80%,1.6 1.7 一般因未知而用样本标准差s 代替。
1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。
2.样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。
研究的类型不同,则样本量也有所不同。
2.1描述性研究护理研究中的描述性研究多为横断面研究,横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、调查。
例.δ10%-15%2.22.2.15-10倍。
方式、60-120例。
资料的样本量估算可用公式,根据预实验中的数据,2.2.2 研究某变量对另一变量的影响对于研究某变量对另一变量的影响来说,样本量可以根据直线相关的公式获得,μα与μβ与分别为检验水准α和第Ⅱ类错误的概率β相对应的U值,ρ为总体相关系数。
例.要做一项血透患者自我管理水平对其健康状况影响的研究,假设α=0.05,power=0.80,查表得μα=1.96,μβ=0.84,总体相关系数可选用文献报道中血液透析患者自我管理水平与健康调查简表得分相关系数为0.274,代入公式就可算出所需样本量为103例。
1.估计样本量的决定因素1.1资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例;讣数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。
1. 2研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越拓,所需的样本量越小,反之就要越大。
1.3研究因素的有效率有效率越疡,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。
1.4显着性水平即假设检验第一类(a)错误出现的概率。
为假阳性错误出现的概率。
a越小,所需的样本量越大,反之就要越小。
a水平由研究者具情决定,通常a取0.05 或0. Olo 1. 5检验效能检验效能乂称把握度,为1 一0,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。
即在特定的a水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能力,B越小,检验效能越高,所需的样本量越大,反之就要越小。
B水平曲研究者具悄决定,通常取B 为0. 2, 0.1或0. 05o即1-B二0. 8, 0. 1或0. 95,也就是说把握度为80%, 90%或95%o 1.6容许的误差(6 )如果调查均数时,则先确定样本的均数()和总体均数(m)之间最大的误差为多少。
容许误差越小,需要样本量越大。
一般取总体均数(l-a )可信限的一半。
1.7总体标准差(s)一般因未知而用样本标准差s代替。
1. 8双侧检验与单侧检验采用统汁学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其a 或B的Ua界值通过查标准正态分布的分位数表即可得到。
2.样本量的估算山于对变量或资料采用的检验方法不同,具体设讣方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估讣样本量决定因素的参数,便可进行估算。
样本量计算样本量的估算与研究的目的有关。
对于描述性研究,如横断面调查,其目的是描述疾病的分布情况或现况调查,样本量的估算需要考虑误差控制和设计均衡。
对于计量资料,如果设计均衡且误差控制得好,样本可以小于30例;对于计数资料,即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。
2.2分析性研究对于分析性研究,其目的是分析比较发病的相关因素或影响因素。
样本量的估算需要考虑研究事件的发生率和因素的有效率。
研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。
2.3实验性研究对于实验性研究,即队列研究或干预实验,样本量的估算需要考虑容许的误差和总体标准差。
容许误差越小,需要样本量越大。
一般取总体均数(1-α)可信限的一半。
总体标准差一般因未知而用样本标准差代替。
2.4双侧检验与单侧检验在进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。
采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
3.样本量估算方法由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,才能进行估算。
在护理中的量性研究中,可以分为描述性研究、分析性研究和实验性研究,样本量的估算需要考虑不同的因素,如误差控制、设计均衡、研究事件的发生率、因素的有效率、容许的误差和总体标准差等。
在进行双侧检验或单侧检验时,需要根据研究结果的高低界限选择不同的检验方法,从而确定所需的样本量。
护理研究通常采用描述性研究方法,其中横断面研究的抽样方法包括单纯随机抽样、系统抽样、分层抽样和整群抽样。
1. 估计样本量的决定因素1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100 例。
1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.3 研究因素的有效率有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。
1.4 显著性水平即假设检验第一类(α)错误出现的概率。
为假阳性错误出现的概率。
α越小,所需的样本量越大,反之就要越小。
α水平由研究者具情决定,通常α取0.05 或0.01 。
1.5 检验效能检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。
即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。
β水平由研究者具情决定,通常取β为0.2,0.1 或0.05 。
即1-β=0.8,0.1 或0.95 ,也就是说把握度为80%,90%或95%。
1.6 容许的误差(δ)如果调查均数时,则先确定样本的均数()和总体均数(m)之间最大的误差为多少。
容许误差越小,需要样本量越大。
一般取总体均数(1-α)可信限的一半。
1.7 总体标准差(s)一般因未知而用样本标准差s 代替。
1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时, 应该选择双侧检验, 所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其α或β的Ua 界值通过查标准正态分布的分位数表即可得到。
2. 样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
1.估计样本量的决定因素1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。
1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.3 研究因素的有效率有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。
1.4 显着性水平即假设检验第一类(α)错误出现的概率。
为假阳性错误出现的概率。
α越小,所需的样本量越大,反之就要越小。
α水平由研究者具情决定,通常α取0.05或0.01。
1.5 检验效能检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。
即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。
β水平由研究者具情决定,通常取β为0.2,0.1或0.05。
即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。
1.6 容许的误差(δ)如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。
容许误差越小,需要样本量越大。
一般取总体均数(1-α)可信限的一半。
1.7 总体标准差(s)一般因未知而用样本标准差s代替。
1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。
2.样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
样本量的确定方法.样本量的计算公式为:样本量= (Zα/2 * σ / E)²,其中Zα/2为置信水平对应的标准正态分布值,σ为总体标准差,E 为允许的误差。
2)对于比例类型的变量,样本量的计算公式为:样本量= (Zα/2)² * p * (1-p) / E²,其中Zα/2为置信水平对应的标准正态分布值,p为总体比例,E为允许的误差。
2.分层抽样确定样本量,需要先将总体划分为若干层,然后根据每层的变异程度和大小,计算出每层的样本量,最后将各层样本量相加得到总样本量。
3.整群抽样确定样本量,需要先将总体分为若干群,然后根据群内变异程度和群大小,计算出每群的样本量,最后将各群样本量相加得到总样本量。
总之,样本量的确定需要综合考虑多个因素,包括调查目的、性质、精度要求、实际操作的可行性和经费承受能力等,同时需要根据不同的抽样方法和变量类型选择相应的样本量计算公式。
本文介绍了如何确定抽样调查方案的样本量。
对于已知数据为绝对数的情况,需要根据期望调查结果的精度、置信度、总体标准差估计值和总体单位数来计算样本量。
计算公式为n=σ/(e/Z+σ/N)。
如果是很大总体,则公式变为n=Zσ/e。
例如,如果希望平均收入误差在正负人民币30元之间,调查结果在95%的置信范围以内,置信度为1.96,估计总体标准差为150元,总体单位数为1000,则样本量为88.对于已知数据为百分比的情况,需要根据调查结果的精度值百分比、置信度、比例估计的精度和总体数来计算样本量。
计算公式为n=P(1-P)/(e/Z+ P(1-P)/N)。
如果不考虑总体,则公式为n=ZP(1-P)/e。
一般情况下,取样本变异程度最大值0.5作为P的取值。
例如,如果希望平均收入误差在正负0.05之间,调查结果在95%的置信范围以内,置信度为1.96,估计P为0.5,总体单位数为1000,则样本量为278.确定样本量后,需要进行样本量分配。
(完备版)样本量测算(DOC)引言样本量测算是研究设计中的重要环节,它涉及到研究结果的可靠性和统计推断的准确性。
本文档旨在提供一个完备的样本量测算样本,以确保研究结果具有足够的信度和效度。
测算方法我们将使用以下步骤进行样本量测算:1. 确定显著性水平:根据研究的需要选择合适的显著性水平,通常为0.05或0.01。
2. 确定效应大小:基于研究的研究目的和预期效应,选择合适的效应大小。
3. 选择统计方法:根据研究设计和变量类型选择适当的统计方法。
4. 确定假设测试:明确研究假设,并据此选择合适的假设测试方法。
5. 进行样本量测算:使用统计软件(例如G*Power)进行样本量测算,根据上述参数输入相应的值,得出样本量估计结果。
参考资料本文档的样本量测算方法参考以下几个经典参考资料:1. Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum Associates.2. Faul, F., Erdfelder, E., Lang, A. G., & Buchner, A. (2007).G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods, 39(2), 175-191.结论通过完成上述步骤,我们能够得到一个完整的样本量测算样本,确保研究结果的统计推断具有充分的信度和效度。
在实际研究中,我们鼓励研究者根据具体情况进一步调整和优化样本量测算的方法,以确保研究的科学性和可靠性。
常用的样本量计算方法我跟你说啊,常用的样本量计算这事儿,我一开始也是一头雾水。
我就自己瞎捉摸,那真的是走了不少弯路。
就说最基本的公式法吧,我第一次用的时候,好多参数我都弄不明白。
比如说总体标准差这个参数,我当时根本不知道怎么估计。
我就随便填了个数字,结果算出来的样本量完全不合理。
后来我才知道,你要是有以往类似研究的数据,那就可以根据那个数据来估计总体标准差。
要是没有啊,你可以做个预调查,先获取一小部分数据来估计一下这个标准差。
这就好比你要做一大锅汤,你得先尝尝味道,确定个大概的盐分(参数)怎么加才合适。
还有根据预期的效应大小来计算样本量呢。
我当时没搞清楚这效应大小是啥意思,又失败了几次。
这个效应大小啊,你可以理解成你想看到的两组之间的差别有多显著。
比如说,你想知道某种新的药比原来的药效果能好多少,这个好的程度就是效应大小。
我后来知道了,你可以查文献,看看类似研究中的效应大小大概是多少,然后再确定自己的。
这就像是你跟着菜谱炒菜,参考别人做这道菜(研究)的时候放多少盐(效应大小)似的。
再有的方法就是根据置信区间来计算。
我自己试的时候,经常把置信水平和置信区间的关系弄混。
置信水平呢,就像是你对自己结果的信任程度。
比如说你设定95%的置信水平,那就是说你有95%的把握你的结果是正确的。
而置信区间就是这个结果的一个范围。
你得根据你想要的置信水平和置信区间的宽度来确定样本量。
还有一种情况我也遇到过,就是有些时候研究比较复杂,可能会涉及到多个组或者多个变量。
我最开始完全懵了,不知道该怎么办才好。
后来我发现啊,其实每个组或者变量之间是有联系的,你只要把这些关系梳理清楚,然后根据前面说的那些基本的思路,给每个组或者变量分别设定合理的参数去计算就好了。
不过说真的,这个真的挺难的,我也不敢说自己每次都能算对。
有时候就算按照这些方法来,结果可能因为一些特殊情况还是不太合适,这个时候可能就需要根据经验和实际情况再做调整了。
1.估计样本量的决定因素1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。
1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.3 研究因素的有效率有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。
1.4 显著性水平即假设检验第一类(α)错误出现的概率。
为假阳性错误出现的概率。
α越小,所需的样本量越大,反之就要越小。
α水平由研究者具情决定,通常α取0.05或0.01。
1.5 检验效能检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。
即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。
β水平由研究者具情决定,通常取β为0.2,0.1或0.05。
即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。
1.6 容许的误差(δ)如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。
容许误差越小,需要样本量越大。
一般取总体均数(1-α)可信限的一半。
1.7 总体标准差(s)一般因未知而用样本标准差s代替。
1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其α或β的Ua 界值通过查标准正态分布的分位数表即可得到。
2.样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。
研究的类型不同,则样本量也有所不同。
2.1描述性研究护理研究中的描述性研究多为横断面研究,横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、分层抽样和整群抽样。
分层抽样的样本量大小取决于作者选用的对象是用均数还是率进行抽样调查。
例.要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调查,采用分层多级抽样,选用的是均数抽样的公式,Uα为检验水准α对应的υ值,σ为总体标准差,δ为容许误差,根据预实验得出标准差σ=1.09,取α=0.05,δ=0.1,样本量算得520例,考虑到 10%-15%的失访率和抽样误差,样本扩展到690例。
2.2分析性研究2.2.1 探索有关变量的影响因素研究有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。
例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。
这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计算,计量资料的样本量估算可用公式,根据预实验中的数据(也可以依据其他文献的结果)得出标准差S和容许误差δ,代入公式最终计算出样本量,计数资料资料可用公式,P为样本率。
2.2.2 研究某变量对另一变量的影响对于研究某变量对另一变量的影响来说,样本量可以根据直线相关的公式获得,μα与μβ与分别为检验水准α和第Ⅱ类错误的概率β相对应的U值,ρ为总体相关系数。
例.要做一项血透患者自我管理水平对其健康状况影响的研究,假设α=0.05,power=0.80,查表得μα=1.96,μβ=0.84,总体相关系数可选用文献报道中血液透析患者自我管理水平与健康调查简表得分相关系数为0.274,代入公式就可算出所需样本量为103例。
2.2.3 两变量或多变量的相关研究对于两变量或多变量相关的研究,样本量与自变量的多少有关,一般是其10倍,也可以采用公式计算。
Uα为检验水准α相对应的U值,S为标准差,δ为容许误差。
例. 研究慢性腰背痛患者认知-情感应对、自我和谐与适应水平的关系.设定显著性水平α= 0.05,则Uα=1.96,标准差和容许误差可从预实验中获得,根据预实验的S和δ值,算出S/δ=5,样本量则为99例.2.3 实验性研究实验性研究样本量的估算公式,也分计量资料和计数资料两种。
计量资料可采用两样本均数的计算公式N1=N2=,计数资料可采用率的计算公式。
式中N1、N2分别为两样本含量,一般要求相等,S为两总体标准差的估计值,一般假设其相等或取合并方差的平方根,δ为两均数之差值(若为自身对照,δ也可以写为d),tα/2和tβ/2分别为检验水准α和第Ⅱ类错误概率β相对应的t值。
α有单双侧之分,而β只取单侧。
例.一项心肌梗死患者院外自助式心脏康复的效果研究,可以采用此公式计算,其中的d 可以选取文献中报道的、自助式康复手册的随机对照研究中的干预组和对照组在普通健康问卷GHQ的得分:d=10.7-5.3=5.4,计算Sc为8.78,双侧α=0.05,β=0.1,查表得tα/2=1.96,tβ=1.282,代入公式得出两组各需样本为56例。
附临床研究样本量的估计:1.计量资料1.1 对总体平均数m做估计调查的样本估计公式:公式:n=(Uασ/δ)(式2.1.2.1)式中:n为所需样本大小;Ua为双侧检验中,a时U的界值,当a=0.05时,U0.05 =1.96,a=0.01时,U0.01 =2.58;s为总体标准差;δ为容许的误差。
例1:某学校有学生3500人,用单纯随机抽样调查学生的白细胞水平,根据预查标准差为950个/ mm ,允许误差不超过100个/mm ,应调查多少人?N=3500 d=100个/mm s=950个/mma=0.05(双侧) Ua=1.96n=(1.96×950/100) ≈3471.2对样本均数与总体均数的差别做显著性检验时,所需样本的估计。
单侧检验用:单侧检验用:n=[(U2α + U2β)s/δ](式1.2-1)双侧检验用:n=[(Uα + U2β)s/δ](式1.2-2)式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、U2α、U2β分别为α、2α、2β检验水准的t值。
2 计数资料2.1 对总体率π做估计调查的样本大小公式:n=(Uα/δ)/P(1-P)(式2.1)式中:δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。
P为样本率。
例2:对某地HBsAg阳性率进行调查,希望所得的样本率(p)和总体率(P)之差不超过2%,基于小规模预调查样本率P=14%,应调查多少人? (规定a=0.05)已知:δ=0.02, P=0.14,a=0.05 , Ua=1.96n=(1.96/0.02)2/ ×0.14(1-0.14) =1156需调查约1160人.2.2 对样本率与总体率的差别做显著性检验时,所需样本的估计。
单侧检验用:n=(U2α + U2β/δ2)(式2.2-1)双侧检验用:n=(Uα + U2β/δ )(式2.2-2)式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、U2α、U2β分别为α、2α、2β检验水准的t值。
2.3对样本均数与总体均数的差别做显著性检验时,所需样本的估计。
单侧检验用:n=[(U2α + U2β)s/δ] P(1-P)式2.3-1)双侧检验用:n=[(Uα + U2β)s/δ] P(1-P)(2.3-2)式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、U2α、U2β分别为α、2α、2β检验水准的U值。
3 病例对照研究的样本量估计选择患有特定疾病的人群作为病例组,和未患这种疾病的人群作为对照组,调查两组人群过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。
3.1设置估算样本量的相关值①人群中研究因素的暴露率(对照组在目标人群中估计的暴露率);②比值比 (odds ratio,OR) 估计出的各研究因素的相对危险度或暴露的比值比(即RR或OR)③α值,检验的显著性水平,通常取α=0.01或0.05;④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。
根据以上有关参数查表或代公式计算公式为:n=(U +U )/(p1 -p0 )2(式3.1)p1 =p0 ×OR/1-p0 +OR×P0=1/2(p1 +p0)=1-q1 =1-p1 q0 =1-p0p0与P1分别为对照组及病例组人群估计的暴露率;OR为主要暴露因子的相对危险度或暴露的比值比(RR或OR)。
q0 =1-P0 , q1 =1-P1 ;为两组暴露史比例的平均值,既 =(P1 +P2 )/2, Q1 =1-P1 ;例:拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。
估计孕妇有30%暴露于此因子。
现要求在暴露造成相对危险度为2时,即能在95%的显著性水平以90%的把握度查出,病例组和对照组各需多少例?p0=0.3 OR=2,设α=0.05, β=0.10,用双侧检验Uα=1.96 Uβ=1.282p1 =(0.3×2)/[1+0.3(2-1)]=0.46q0 =1-0.3=0.7 =1/2(0.3+0.46)=0.38q1 =1-0.46=0.54 =1-0.38=0.62n=(1.96 +1.282 )2/(0.46-0.3)2 ≈192 ,即病例组与对照组各需192人.4实验研究的样本量计算4.1 计量资料: 计量资料指身高、体重、血压、血脂和胆固醇等数值变量。
估计公式为:(式4.1)n为计算所得一个组的样本人数,如果两组的人数相等,则全部试验所需的样本大小为2n;Uα为显著性水平相应的标准正态差;Uβ为β相应的标准正态差;δ为估计的标准差,δ2 =(δ1 2 +δ2 2 )/2;d为两组数值变量均值之差,例题:某新药治疗高血压,将研究对象随机分为治疗组和对照组。
假设:a=0.05,β=0.10,血压的标准差分别为9.7与12.3mmHg,检测两组的血压差为2.6mmHg。
查表:zα=1.96,zβ=1.282(双侧检验),需要多大样本。