当前位置:文档之家› 第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量
第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量

? 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。 ? 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。

5.1 两类错误与功效

1. 两类错误的概率

H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0-

(5.2) (略) ? 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为

第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ? 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病

第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ? 两类错误的背景:

拒绝H 0时可能犯第Ⅰ类错误

不拒绝H 0时可能犯第Ⅱ类错误

? 两类错误的后果:

第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ? 一般α, β的数值要在科研设计时事先确定

2. 功效 (power)

? 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β

(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β

(5.5) ? 功效就是真实有效的药物被发现的概率∕疾病被诊断出

来的概率

5.2 影响功效的四要素

? 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ? 功效的影响因素为:δ=0μ-x ,σ,n ,α

X ≥μ0+Z αn σ (5.7) (略) ? 现用X 分布图形来定性地讨论四要素对功效的影响

1. 客观差异越大,功效越大

X ~N(μ,σ2/n) (5.8) (略)

若H 0为真,X ~N(μ0,σ2/n) (5.9) (略)

若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) (略)

2. 个体间标准差越小, 功效越大。

3. 样本量越大,功效越大

4. α值越大,功效越大

? 筛选新药时α大些,以免漏掉有苗头的新药(α=0.10/0.20) 新药上市前α小些,以免误将真实无效的新药大量生产(α=0.01)

(a)个体标准差s 1较大或样本量n 1较小; (b)个体标准差s 2较小或样本量n 2较大 图5.2 个体间标准差越小或样本量越大,功效越大

(a) α1较小; (b) α2较大

图5.3 α值越大,功效越大

(a)均数间实际距离d 1较小 (1.5); (b)均数间实际距离d 2较大(1.8) 图5.1 均数间差异越大,功效越大

5.3 功效与四要素的定量关系

1. 单组样本均数的检验

()()βασδμσμZ n n Z -=+-+00 (5.11) (略) 简化后得到

例5.1 某药的平均有效时间原为6小时,现改进了配方,据称可延长至7小时。为核实这一点,某研究组观察了25例该病患者,得到的却是阴性结果(P >0.05),即不能认为平均有效时间长于6小时,试分析原因。

解 这个问题实际上是检验假设 H 0:μ=6, H 1: μ>6 据题意,不妨令δ=1。σ的数值可参考此次25例的观察结果,设连同以往经验猜测σ=2。

将δ=1,σ=2,n =25和单侧Z 0.05=1.64代入(5.12)式 Z β=05.02

125Z Z n -?=-ασδ

= 0.86 查标准正态分布表得()8051.086.0=Φ,即1-β=0.8051 果表明,此项检验的功效为80.51%

2. 两组样本均数的检验 欲检验假设

图5.4 两组样本均数检验示意图

例5.2 一项关于降血压药的临床试验分设两组随机样本,各含15例同病患者。一组服用常规药,另一组服用新药。如果新药的降压效果至少比常规药平均高出0.8kPa 方可考虑在临床推广; 据以往经验,不论常规药还是这种新药,个体降压值的标准差约为1kPa 。经α=0.05水平的两组均数比较的统计检验,两组平均降压效果的差异尚无统计学意义,此事如何理解?

解 据题意,这是关于两组均数的一项单侧检验 δ=0.8,σ=1,n =15,单侧Z 0.05=1.64,代入(5.18)式得 Z β =21518.0??

? ??- Z 0.05 = 0.5509

查标准正态分布表,得()7088.05509.0=Φ,即1-β=0.7088只有70.88%的机会被此检验得出有差异的结论。

3. 两组样本频率的检验(大样本)

欲检验假 H 0:π1=π2, H 1:π1>π2 (5.19) (略) 根据正态近似两组样本均数的检验,有功效的计算公式

其中,δ=π1-π2

例5.3 一项关于维生素C 预防感冒作用的研究随机抽取两组正常人各30名,一组服用维生素C ,另一组服用安慰剂,欲比较一定时期内发生感冒的频率。结果,安慰剂组有6人发生感冒,维生素C 组有3人发生感冒,经α=0.05水平的检验,差异无统计学意义,此事如何理解?

解 π1=20%,假定π2=10%或更低时认为值得重视,n =30和α=0.05代入(5.19)式,

()()

5446.0645.110.0110.020.0120.03010.0-=--+-=βZ

查标准正态分布表得()2929.05446.0=-Φ,即1-β=0.2929,功效只有29.29%。

5.4 常用统计检验的样本量估算

1.

单组样本均数的检验 改写功效估计公式(5.12)得 ? 估计样本含量的影响因素,类似于功效:α,β,δ,σ

例5.4 为较好地解决例5.1中的新药论证问题,至少需要多大样本量?

解 α=0.05, β=0.01, δ=1, σ=2,以及Z 0.05=1.64,单侧Z 0.01=2.33,代入公式,

n =2

201.005.05.033.264.121??? ??+=???? ??+Z Z =63.0436≈63

以n =63查t 界值表,得t 0.05(62)与t 0.01(62)再次代入公式计算,如此多次迭代计算,当结果变化很小时便获得n 的估计值。

? 近似计算:在据Z α和Z β求得的n 值基础上再增补0.5Z 2α作

为最终的样本量估算值。这样,例5.3的样本量可取为

n =63.0436+0.5(1.64)2=64.3884≈65。

2. 两组样本均数的检验

类似地,改写(5.18)式,我们又有

例5.5 为较好地解决例5.2中新药论证问题,至少需要多大样本量?

解 仍象例5.2那样取δ=0.8,σ=1,单侧Z 0.05=1.64。为减少埋没较好药物的机会,令β=0.05,代入(5.21)式, n =22

205.005.08.064.164.118.0??? ??+=???? ??+Z Z =33.62≈34 类似地近似计算得

n =33.62+0.25(1.64)2=34.2924≈35。

3. 两组样本频率的检验(大样本)

改写(5.20)式,我们有样本量的计算公式

例5.6 为较好地进行例5.3中维生素C 预防作用的研究,至少需要多大样本量?

解 仍取π1=20%,π2=10%。为了不致埋没维生素C 的预防作用,取β=0.01。将单侧Z 0.05=1.64, 单侧Z 0.01=2.33连同π1和π2的数值代入(5.22)式,

n =210.033.264.1??? ??+ [0.20(1-0.20)+0.10(1-0.10)]

=394.0225≈394

5.5 实例点评

? 新药强力新甘草甜素(SNMC)治疗慢性乙型肝炎的效果, ? 资料与方法:

1.病人选择 2.试验药物及使用方法

表5.1 治疗前的基本资料

对照组 28±8.4 23 1 26.2 24 0 23 0 1

表5.2 治疗前的主要肝功能指标(8项)

?点评要点:

(1)作者设计周密

(2)因样本含量过小,功效很低(国家药监局规定每组n>100)

结论:尚不能认为新药与对照药疗效相同

结语:

重点是对两类错误、功效、样本含量估计的理解(计算次要)

1. 对总体推论时要时刻想着两类错误问题

2. 试验设计时必须事先估计检验功效与样本含量

功效和样本量

功效和样本量 一、概述: 使用Minitab 的功效和样本数量功能在设计和运行试验之前(预期)或执行试验之后(回顾)评估功效和样本数量。 预期研究在收集数据之前使用以考虑设计敏感度。您要确保功效足够大,以检测出您确定为重要的差值(效应)。例如,您可以通过增大样本数量或采取措施降低错误方差来提高设计敏感度。 回顾研究在收集数据之后使用以帮助了解已执行的检验的功效。例如,假设您进行一项试验,但数据分析并未显示任何在统计意义上显著的结果。然后可以根据所希望检测到的最小差异(效应)计算功效。如果检测此差值的功效较低,则您可能要修改试验设计以提高功效并继续评估相同问题。但是,如果功效值较高,则您可能要断定不存在有意义的差值(效应),并停止试验。 什么是功效 功效是当确实存在显著差值(效应)时能够将其认定的可能性。假设检验有四种可能的结果。结果取决于原假设(H0) 为真还是假,以及您决定“否定”还是“不能否定”H0。检验的功效就是当H0为假时正确地将其否定的概率。 这四种可能的结果总结如下: 原假设 决策真假 不能否定H0正确决策 p = 1 类型II 错误p = 否定H0类型I 错误 p = 正确决策p = 1 当H0为真而却否定它时,就发生了类型I 错误。发生类型I 错误的概率(p) 称为alpha (),有时称为检验的显著性水平。 当H0为假却没有否定它时,就发生了类型II 错误。发生类型II 错误的概率称为beta ()。 选择概率水平

当确定检验的和值的时候,应该考虑 发生错误的严重程度错误越严重,越希望少发生这种情况。因此,应该向更严重的错误指定更小的概率值。 要检测的效应的量值功效是当H0为假时正确否定它的概率(p = 1 - )。理想状态下,您检测所关注的差值时要有高功效,检测没有意义的差值时要有低功效。 例如,假设您制造储存容器,并要评估一种潜在更耐高温的新型塑料。如果新型塑料将产品的平均熔点提高20°或更多,则这项支出就值得考虑。检验更多的样本可以增大检测出此类差异的机会,但是检验过多的样本会增加时间和费用,还可能检测到不重要的差异。您可以使用双样本t 的功效和样本数量来估计检测具有足够功效的差值20°需要多少样本。 影响功效的因子 许多因子都影响功效: ,发生类型I 错误的概率(也称为显著性水平)。当增大时,发生类型II 错误() 的概率减小。因此,当增大时,功效(等于 1 )也随之增大。 ,总体的变异性(或试验变异性)。当减小时,功效也随之减小。 效应的大小。当效应大小增大时,功效也随之增大。 样本数量。当样本数量增大时,功效也随之增大。 补充内容:估计标准误 对于“功效和样本数量”的计算,(总体标准差或试验变异性)的估计值取决于您是否已经收集了数据。 预期研究在收集数据前进行,因此必须估计。您可以使用相关研究、初步研究或学科知识来估计。 回顾研究在数据收集后进行,因此可以使用数据估计。 对于单样本Z 或单样本t,使用样本的标准差。 对于双样本t,如果假设方差相等,则使用合并标准差。

统计学习题 第十章 双样本假设检验及区间估计

第十章 双样本假设检验及区间估计 第一节 两总体大样本假设检验 两总体大样本均值差的检验·两总体大样本成数差的检验 第二节 两总体小样本假设检验 两总体小样本均值差的检验·两总体小样本方差比的检验 第三节 配对样本的假设检验 单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相关检验的评论 第四节 双样本区间估计 σ12和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互( )地抽取的。 2.如果从N (μ1,σ12)和N (μ2,σ22 )两个总体中分别抽取容量为n 1和n 2的独立随机样本,那么两个样本的均值差(1X ―2X )的抽样分布就是N ( )。 3.两个成数的差可以被看作两个( )差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作( )样本,也称关联样本。 5.配对样本均值差的区间估计实质上是( )的单样本区间估计 6.当n 1和n 2逐渐变大时,(1X ―2X )的抽样分布将接近( )分布。 7.使用配对样本相当于减小了( )的样本容量。 8. 在配对过程中,最好用( )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于( )。 10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( )侧。 二、单项选择

1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。 A N (μ1―μ2,121n σ―2 22n σ) B N (μ1―μ2,121n σ+22 2n σ) C N (μ1+μ2,121n σ―2 22n σ) D N (μ1+μ2,121n σ+22 2n σ) 2.两个大样本成数之差的分布是( )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 22n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 22n q p ) 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。 A F 分布 B Z 分布 C t 分布 D 2 χ分布 4.配对小样本的均值d 的抽样分布是( ) A Z 分布 B 自由度为n 的t 分布 C 自由度为(n —1)的t 分布 D 自由度为(n —1)的2 χ分布 5.若零假设中两总体成数的关系为p 1=p 2,这时两总体可看作成数p 相同的总体,它 们的点估计值是( ) A p 1 + p 2 B p 1p 2 C p 1 -p 2 D 2 12 211n n p n p n ++∧ ∧ 6.在σ 1 2和σ 2 2未知,但可假定它们相等的情况下,σ的无偏估计量∧ S 是( ) A 2 212 2 211-++n n nS S n B 2212 2211-++n n nS S n ?2 12 1n n n n + C 2 12 1n n n n +σ D 2 22 1 2 1n n σσ+ 三、多项选择 1.两个成数之差的假设检验所使用的测量尺度包括( )。 A 定类尺度 B 定序尺度 C 定距尺度 D 定比尺度 2.在单一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额外变量影响的基本做法包括( )。

多个样本率地卡方检验及两两比较 之 spss 超简单

SPSS:多个样本率的卡方检验及两两比较来自:医咖会 医咖会之前推送过“两个率的比较(卡方检验)及Fisher精确检验的SPSS教程”,小伙伴们都掌握了吗?如果不止两个分组,又该如何进行卡方检验以及之后的两两比较呢?来看详细教程吧! 1、问题与数据 某医生拟探讨药物以外的其他方法是否可降低患者的胆固醇浓度,如增强体育锻炼、减少体重及改善饮食习惯等。 该医生招募了150位高胆固醇、生活习惯差的受试者,并将其随机分成3组。其中一组给予降胆固醇药物,一组给予饮食干预,另一组给予运动干预。经过6个月的试验后,该医生重新测量受试者的胆固醇浓度,分为高和正常两类。 该医生收集了受试者接受的干预方法(intervention)和试验结束时胆固醇的风险程度(risk_level)等变量信息,并按照分类汇总整理,部分数据如下: 注释:本研究将胆固醇浓度分为“高”和“正常”两类,只是为了分析的方便,并不代表临床诊断结果。

2、对问题的分析 研究者想判断干预后多个分组情况的不同。如本研究中经过降胆固醇药物、饮食和运动干预后,比较各组胆固醇浓度的变化情况。针对这种情况,我们建议使用卡方检验(2×C),但需要先满足5项假设: 假设1:观测变量是二分类变量,如本研究中试验结束时胆固醇的风险程度变量是二分类变量。 假设2:存在多个分组(>2个),如本研究有3个不同的干预组。 假设3:具有相互独立的观测值,如本研究中各位受试者的信息都是独立的,不会相互干扰。 假设4:研究设计必须满足:(a) 样本具有代表性,如本研究在高胆固醇、生活习惯差的人群中随机抽取150位受试者;(b) 目的分组,可以是前瞻性的,也可以是回顾性的,如本研究中将受试者随机分成3组,分别给予降胆固醇药物、饮食和运动干预。 假设5:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5。 经分析,本研究数据符合假设1-4,那么应该如何检验假设5,并进行卡方检验(2×C)呢? 3、思维导图

临床试验样本量的估算

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。 但是中国的国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(α=0.05,β=0.2)时:

计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=12.365×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=12.365× (S/δ)2 等效性试验(α=0.05,β=0.2)时: 计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=17.127×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=17.127× (S/δ)2 上述公式的说明: 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数; 3) P 是平均有效率,

影响样本量大小的几个因素1

IFN2γ广泛应用于抗病毒、抗肿瘤和免疫调节。体内外实验研究表明还具有抗vS MCs增生和抑制血管内膜形成的作用。在我们的实验体系中,给予实验动物皮下注射rIFN2γ(1万U?kg-1?d-1),结果显示rIFN2γ可显著抑制1周和2周时内膜面积,抑制率分别为60100%和66167%;考虑内膜增生与管腔大小的关系更能反映内膜形成对血管腔的影响,我们计算了内膜面积与管腔面积的比值,发现rIFN2γ显著抑制1周和2周时内膜面积与管腔面积比值,抑制率分别为66167%和76170%;抑制1周和1个月时内膜vS MCs表达PC NA,抑制率分别为88150%和58189%。在一份研究报告中显示,IFN2γ可抑制大鼠再狭窄模型病变中75%的血管vS MCs增生,血管内膜面积减少50%。本实验中,rIFN2γ对早期(1周和2周)的内膜形成具有显著抑制作用,但对后期(1月)改变作用不明显,从我们对病变的动态观察发现,在损伤后第2周细胞间质已经开始增多,仅靠近管腔的vS MCs保持增生状态,于1个月时细胞外基质逐渐成为新生内膜的主要成分,因此可能对rIFN2γ的作用不甚敏感。可见rIFN2γ早期治疗决定了内膜增生的远期效应。另外,rIFN2γ对2周时内膜PC NA表达的影响无显著性可能与vS MCs增生周期有关;或许是损伤后第2周内膜细胞开始以合成细胞外基质为主,此时rIFN2γ可能主要参与vS MCs 分化的调节而对其增生不甚敏感之故[5]。根据近几年的研究结果,IFN2γ可能主要通过以下几个途径抑制血管vS MCs增生和内膜病变形成的:(1)IFN2γ刺激后以一氧化氮(NO)依赖性机制诱导vS MCs的凋亡,即NO对vS MCs发挥了局部细胞毒作用[6]; (2)通过活化可溶性鸟苷酸环化酶来增加vS MCs中cG MP水平,抑制vS MCs增殖的第二信使系统使vS MCs的DNA合成能力下降[7];(3)通过抑制白细胞介素Ⅰ和血小板衍生生长因子诱导的vS MCs DNA 合成抑制vS MCs增生;抑制PDG F2BB诱导的c2fos高表达并通过改变c2fos表达来控制调节vS MCs由中膜向内膜的迁移和转化[8];此外,IFN2γ减少vS MCs 中表皮细胞生长因子受体的表达;在其它细胞因子共同作用下也可减少血管紧张素Ⅱ受体mRNA表达,认为这亦是通过NO依赖机制而实现的[9];(4)诱导2’25’2寡腺嘌呤合成酶mRNA表达及酶的生成,此酶可激活内源性RNA酶使RNA降解,抑制多种生长因子的mRNA表达和蛋白合成,从而抑制vS MCs的增生[8]。值得重视的是血管局部产生的IFN2γ可能是vS MCs的内源性抑制剂,在维持再狭窄血管内膜vS MCs量的动态平衡中可能具重要作用。我们也观察到在内膜受损后的各个时期,增生的内膜中除了主要有vS MCs构成外还可见少数散在浸润的淋巴细胞和巨噬细胞等,这些细胞可能是内源性IFN2γ的主要来源。因此,面临的问题是怎样利用基因工程技术发挥内源性IFN2γ的作用。 我们的研究结果表明,虽然IFN2γ可显著抑制血管vS MCs的增生,但仅部分限制了新生内膜的形成。血管壁vS MCs的增生和新生内膜的形成,最终导致再狭窄的发生机制是极其复杂的,尽管如此,我们为再狭窄的防治寻找到又一可行的途径。 4 参考文献 1 袁晋青.分子生物学与经皮冠状动脉腔内成形术后再狭窄的预防.中国循环杂志,1996,11(11):697~700. 2 钱济先,钱兆奇.γ干扰素抑制血管平滑肌细胞增生.国外医学创伤与外科基本问题分册,1998,19(3):146~148. 3 M orim oto S,M izuno Y,H iramitsu S,et al.Restenosis after PTCA2a histopathological study using autopsied hearts.Jpn Circ J,1990,54:43~ 56. 4 W ilcox JN.M olecular biology:Insight into the causes and prevention of restenosis after arterial intervention.Am J Cardiol,1993,72:88~95E. 5 Shim okado K,Y okota T,K ato N,et al.Bidirectional regulation of sm ooth muscle cell proliferation by IFN2gamma.J Atheroscler Thromb,1994, (suppl1):29~33. 6 S irsjo A,S oderkvist P,Sundqvist T,et al.Different induction mechanisms of mRNA for inducible nitric oxide synthase in rat sm ooth muscle cells in culture and in aortic strips.FE BS Lett,1994,338(2):191~196. 7 Beasley D,M cguiggin M.Interleukin1activates s oluble guanylate cyclase in human vascular sm ooth muscle cells through a novel nitric oxide2inde2 pendent pathway.J Exp M ed,1994,179(1):71~80. 8  W amer S JC,Fiedman G B,Libby P.Immune interferon inhibits prolifera2 tion and induce2’25’2olig oadenylate synthetase gene expression in human vascular sm ooth muscle cells.J Clin Invest,1989,83:1174~1182. 9 Sasamura H,Z akazato Y,Hayashida T,et al.Regulation of vascular type 1angiotensin receptors by cytokines.Hypertension,1997,30(1pt1):35 ~41. 影响样本量大小的几个因素 样本量的大小,一般与以下几个因素有关:①处理效果:效果越明显,所需的样本量越小;②实验误差:误差越小,越易达到统计学显著性,所需样本越小;③抽样误差:样本的个体差异越小,反应越一致,所需样本越小;④资料的性质:一般计数资料样本需要大些,计量资料样本量相对小些。 本刊编辑部 11实用医学杂志2000年第16卷第1期

多个样本率的卡方检验及两两比较之spss超简单

多个样本率的卡方检验及两两比较之s p s s超简单 The following text is amended on 12 November 2020.

S P S S:多个样本率的卡方检验及两两比较来自:医咖会 医咖会之前推送过“两个率的比较(卡方检验)及Fisher精确检验的SPSS教程”,小伙伴们都掌握了吗如果不止两个分组,又该如何进行卡方检验以及之后的两两比较呢来看详细教程吧! 1、问题与数据 某医生拟探讨药物以外的其他方法是否可降低患者的胆固醇浓度,如增强体育锻炼、减少体重及改善饮食习惯等。 该医生招募了150位高胆固醇、生活习惯差的受试者,并将其随机分成3组。其中一组给予降胆固醇药物,一组给予饮食干预,另一组给予运动干预。经过6个月的试验后,该医生重新测量受试者的胆固醇浓度,分为高和正常两类。 该医生收集了受试者接受的干预方法(intervention)和试验结束时胆固醇的风险程度(risk_level)等变量信息,并按照分类汇总整理,部分数据如下: 注释:本研究将胆固醇浓度分为“高”和“正常”两类,只是为了分析的方便,并不代表临床诊断结果。 2、对问题的分析 研究者想判断干预后多个分组情况的不同。如本研究中经过降胆固醇药物、饮食和运动干预后,比较各组胆固醇浓度的变化情况。针对这种情况,我们建议使用卡方检验 (2×C),但需要先满足5项假设:

假设1:观测变量是二分类变量,如本研究中试验结束时胆固醇的风险程度变量是二分类变量。 假设2:存在多个分组(>2个),如本研究有3个不同的干预组。 假设3:具有相互独立的观测值,如本研究中各位受试者的信息都是独立的,不会相互干扰。 假设4:研究设计必须满足:(a) 样本具有代表性,如本研究在高胆固醇、生活习惯差的人群中随机抽取150位受试者;(b) 目的分组,可以是前瞻性的,也可以是回顾性的,如本研究中将受试者随机分成3组,分别给予降胆固醇药物、饮食和运动干预。 假设5:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5。 经分析,本研究数据符合假设1-4,那么应该如何检验假设5,并进行卡方检验(2×C)呢 3、思维导图 4、SPSS操作 数据加权 在进行正式操作之前,我们需要先对数据加权,如下: (1)在主页面点击Data→Weight Cases 弹出下图: (2)点击Weight cases by,激活Frequency Variable窗口

多个样本率的卡方检验及两两比较--之-spss-超简单教学文稿

多个样本率的卡方检验及两两比较--之-s p s s-超简单

SPSS:多个样本率的卡方检验及两两比较 来自:医咖会 医咖会之前推送过“两个率的比较(卡方检验)及Fisher精确检验的SPSS教程”,小伙伴们都掌握了吗?如果不止两个分组,又该如何进行卡方检验以及之后的两两比较呢?来看详细教程吧! 1、问题与数据 某医生拟探讨药物以外的其他方法是否可降低患者的胆固醇浓度,如增强体育锻炼、减少体重及改善饮食习惯等。 该医生招募了150位高胆固醇、生活习惯差的受试者,并将其随机分成3组。其中一组给予降胆固醇药物,一组给予饮食干预,另一组给予运动干预。经过6个月的试验后,该医生重新测量受试者的胆固醇浓度,分为高和正常两类。 该医生收集了受试者接受的干预方法(intervention)和试验结束时胆固醇的风险程度(risk_level)等变量信息,并按照分类汇总整理,部分数据如下:

注释:本研究将胆固醇浓度分为“高”和“正常”两类,只是为了分析的方便,并不代表临床诊断结果。 2、对问题的分析 研究者想判断干预后多个分组情况的不同。如本研究中经过降胆固醇药物、饮食和运动干预后,比较各组胆固醇浓度的变化情况。针对这种情况,我们建议使用卡方检验(2×C),但需要先满足5项假设: 假设1:观测变量是二分类变量,如本研究中试验结束时胆固醇的风险程度变量是二分类变量。 假设2:存在多个分组(>2个),如本研究有3个不同的干预组。 假设3:具有相互独立的观测值,如本研究中各位受试者的信息都是独立的,不会相互干扰。 假设4:研究设计必须满足:(a) 样本具有代表性,如本研究在高胆固醇、生活习惯差的人群中随机抽取150位受试者;(b) 目的分组,可以是前瞻性的,也可以是回顾性的,如本研究中将受试者随机分成3组,分别给予降胆固醇药物、饮食和运动干预。 假设5:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5。 经分析,本研究数据符合假设1-4,那么应该如何检验假设5,并进行卡方检验(2×C)呢? 3、思维导图

多个样本率的卡方检验及两两比较之spss超简单

SPSS:多个样本率的卡方检验及两两比较 来自:医咖会 医咖会之前推送过“两个率的比较(卡方检验)及Fisher精确检验的SPSS教程”,小伙伴们都掌握了吗?如果不止两个分组,又该如何进行卡方检验以及之后的两两比较呢?来看详 细教程吧! 1、问题与数据 某医生拟探讨药物以外的其他方法是否可降低患者的胆固醇浓度,如增强体育锻炼、减少体重及改善饮食习惯等。 该医生招募了150位高胆固醇、生活习惯差的受试者,并将其随机分成3组。其中一组给予降胆固醇药物,一组给予饮食干预,另一组给予运动干预。经过6个月的试验后, 该医生重新测量受试者的胆固醇浓度,分为高和正常两类。 该医生收集了受试者接受的干预方法(intervention)和试验结束时胆固醇的风险程度(risk_level)等变量信息,并按照分类汇总整理,部分数据如下: 注释:本研究将胆固醇浓度分为“高”和“正常”两类,只是为了分析的方便,并不代表临 床诊断结果。

2、对问题的分析 研究者想判断干预后多个分组情况的不同。如本研究中经过降胆固醇药物、饮食和运动干预后,比较各组胆固醇浓度的变化情况。针对这种情况,我们建议使用卡方检验(2×C),但需要先满足5项假设: 假设1:观测变量是二分类变量,如本研究中试验结束时胆固醇的风险程度变量是二分 类变量。 假设2:存在多个分组(>2个),如本研究有3个不同的干预组。 假设3:具有相互独立的观测值,如本研究中各位受试者的信息都是独立的,不会相互 干扰。 假设4:研究设计必须满足:(a) 样本具有代表性,如本研究在高胆固醇、生活习惯差 的人群中随机抽取150位受试者;(b) 目的分组,可以是前瞻性的,也可以是回顾性的,如 本研究中将受试者随机分成3组,分别给予降胆固醇药物、饮食和运动干预。 假设5:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5。 经分析,本研究数据符合假设1-4,那么应该如何检验假设5,并进行卡方检验(2×C)呢? 3、思维导图

临床试验样本量的估算

临床试验样本量的估算样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、 计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power 出发,保证有多少把握能做出显著来。 但是中国的国情有多少厂家愿意多做 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100 对有效病例,再考虑到脱落原因,再扩大20%,即120 对,240 例。或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为%和%,则每个治疗组中能接受评价的病人样本数必须达到114 例(总共228 例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250 例。

非劣性试验(α=,β=)时:计数资料: 平均有效率(P) N= 公式:N=×P(1 - P)/ δ2 计量资料: 共同标准差(S) N= 公式:N=× (S/ δ)2 等效性试验(α=,β=)时:计数资料: 平均有效率(P) N= 公式:N=×P(1 - P)/ δ2 计量资料: 共同标准差(S) N= 公式:N=× (S/ δ)2 上述公式的说明:等效标准(δ) 等效标准(δ)等效标准(δ) 等效标准(δ) 1)该公式源于郑青山教授发表的文献。 2)N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数;

Excel中双样本t检验之等方差异方差假设

Excel 中双样本t 检验之等方差异方差假设 成组资料(非配对资料)的t 检验,是生物统计中必须掌握的基本技能贮备之一。在Excel 完全安装情况下,加载“分析工具库”,之后会在菜单上出现“数据分析”选项,我们会发现“分析工具”中有两个选项,分别是:“t 检验:双样本等方差假设”、“t 检验:双样本异方差假设”。 那么,对于成组资料t 检验,什么时候用等方差,什么时候用异方差呢?最好的办法就是进行“F 检验 双样本方差”齐性检验。如果通过检验,两个样本方差差异不显著,则选用“t 检验:双样本等方差假设”,如果两样本方差差异显著,则选用“t 检验:双样本异方差假设”。 例:有人曾对公雏鸡作了性激素效应试验。将22只公雏鸡完全随机地分为两组,每组11只。一组接受性激素A (睾丸激素)处理;另一组接受激素C (雄甾烯醇酮)处理。在第15天取它们的鸡冠个别称重,所得数据如下表。 题解:在excel 中录入数据,在菜单“数据分析”中,选择“F 检验 双样本方差”,选择A1:A12”所在区域为“变量1的区域”,选择“B1:B12”区域为“变量2 的区域”。勾选标志“a (A )”,默认为0.05,在输出区域中随便找一个单元格(如单元格D1), “确定”(见图1)。 图1 双样本方差的F-检验

图2 t-检验:双样本等方差假设检验 从上图可以看出,p=0.4452221﹥0.05,表示激素A 与激素C 的对应的鸡冠,方差差异不显著。换言之,就是样 本A 与样本B 为等方差,在t 检验 时,就选择“t 检验:双样本等方 差假设”,得到图2结果。 从图2输出结果可以看出,t 检验的结果是p=0.003000143﹤ 0.01,表明差异极显著。也就是说, 激素A 处理的鸡冠重(97mg )极显 著地高于激素C 处理的鸡冠重 (56mg )。 目前不管是本科教材,还是高 职高专教材,生物统计仍是以公式手动计算为主,所采用的基本都是按照“t 检验:双样本等方差假设”,而且很多资料也表示,如果双样本都来源于同一总体,可以采用“t 检验:双样本等方差假设”。但,严格意义而言,应该进行“F 检验 双样本方差”之后,再判断t 检验时,到底是用等方差还是异方差。 例:用甲型流感病毒活疫苗进行预防,一组用气雾法,另一组用鼻腔喷雾法,免疫后采血,分别测定血凝抑制抗体滴度,结果如下,问两法免疫的效果有无差别? 气雾组 40 20 30 25 10 15 25 30 40 10 15 30 鼻腔喷雾法 50 40 30 35 60 70 30 20 25 70 35 25 录入数据,通过“F 检验 双样本方差”,可以看出p=0.04845332﹤0.05,所以t 检验时,应该用双样本异方差假设(见图3)。 通过“t 检验:双样本异方差假设”(见图4),得到p=0.01113641﹤0.05,所以说两种免疫的效果有显著差异。 值得说明的是:本科教材与高职教材,在利用公式手动计算时,不存在双样本方差是相等还是不相等,都采用“等方差”。所以,原教材中用传统的公

样本均数比较的假设检验

《实用卫生统计学》教案 任课教师:毛绍泽 教学目标: 了解:统计工作基本步骤,频率表的编制12频数分布特征,标准正态分布概念。 熟悉: 标准正态变换。 掌握: 各种平均数指标,离散指标使用条件及计算,标准正态曲线下面积分布规律和正态分布资料95%和99%的个体观察值所在范围。 教学重点、难点: 各种均数和标准差的计算 教学资源: 实用卫生统计学教材(北京大学医学出版社、康晓平主编)挂图、计算器等。 课后记: 重点辅导,举例计算、学员自学,使学员们掌握各种均数,标准差的计算方法。

一、统计工作的基本步骤 基本步骤 内 容 计划与设计 是开展医学研究的前提和依据。调查设计和实验设计均包括专业设计和统计学设计两个方面,主要内容有资料的收集、整理和分析 收集资料 概括为经常性资料和一时性资料两大类。收集的资料要求①完整、正确和及时;②要有足够的数量;③资料的代表性和可比性 整理资料 原始资料的检查与核对①数据的取值范围检错;②数据间的逻辑关系检错。以及资料的分组设计与归纳汇总①质量分组或数量分组;②编制频数分布表 分析资料 ①统计描述:用一些统计指标,统计图表等方法对资料的数量特征和分布规律进行测定和描述,不涉及由样本推论总体问题。②统计推断:对样本统计指标作参数估计和假设检验,结合专业知识解释分析结果,目的是用样本信息推断总体特征。 第一节 计量资料的频数表 一、频数表编制的步骤 表2.1 频数表编制的步骤 二、频数分布的类型 1.对称分布:是指集中位置在正中,左右两侧频数分布大体对称的分布。 2.偏态分布:偏态分布是指集中位置偏向一侧,两侧频数分布不对称。 3.对数正态分布:有些偏态分布的资料,其原始数据经过对数转换后(如用原始数据的对数值lgX 代替X)服从正态分布,称为对数正态分布。 三、频数表的用途 1.便于观察资料的分布类型和分布特征。根据分布类型可以选择合适的统计指标进行计算和分析。 步骤 具体操作 注意事项 1 极差R 一最大值一最小值 根据观察单位的多少酌情增减组数 2 ①组数:一般8~1 5组 ②组距t=极差/组数 ③组段:指每组的下限~上限 组距一般取整数,可等组距,也可不等组距,一般多采用等组距。 一般只写下限,不用写上限。第一组段要包括最小观察值,最后一个组段包括最大观察值。 3 列表划记:采用划记法或计算机汇总将原始数据归人各组

双样本假设检验及区间估计练习题(1)

第十章 双样本假设检验及区间估计 第一节 两总体大样本假设检验 两总体大样本均值差的检验·两总体大样本成数差的检验 第二节 两总体小样本假设检验 两总体小样本均值差的检验·两总体小样本方差比的检验 第三节 配对样本的假设检验 单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相关检验的评论 第四节 双样本区间估计 σ12和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互( )地抽取的。 2.如果从N (μ1,σ12 )和N (μ2,σ22 )两个总体中分别抽取容量为n 1和n 2的独立随机样本,那么两个样本的均值差(1X ―2X )的抽样分布就是N ( )。 3.两个成数的差可以被看作两个( )差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作( )样本,也称关联样本。 5.配对样本均值差的区间估计实质上是( )的单样本区间估计 6.当n 1和n 2逐渐变大时,(1X ―2X )的抽样分布将接近( )分布。 7.使用配对样本相当于减小了( )的样本容量。 8. 在配对过程中,最好用( )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于( )。

10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( )侧。 二、单项选择 1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。 A N (μ1―μ2, 12 1n σ―2 22n σ) B N (μ1 ―μ2 ,121n σ+ 2 2 2 n σ) C N (μ1 +μ2 , 1 2 1n σ― 2 2 2 n σ) D N (μ1+μ2, 1 21n σ+ 2 2 2n σ) 2.两个大样本成数之差的分布是( )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 2 2n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 2 2n q p ) 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。 A F 分布 B Z 分布 C t 分布 D 2χ分布 4.配对小样本的均值d 的抽样分布是( )。 A Z 分布 B 自由度为n 的t 分布 C 自由度为(n —1)的t 分布 D 自由度为(n —1)的2 χ分布 5.若零假设中两总体成数的关系为p 1=p 2,这时两总体可看作成数p 相同的总体,它们的点估计值是( )。 A p 1 + p 2 B p 1p 2 C p 1 -p 2 D 2 12 211n n p n p n ++∧ ∧ 6.在σ12 和σ22 未知,但可假定它们相等的情况下,σ的无偏估计量∧ S 是( )。 A 2212 2 211-++n n nS S n B 2212 2211-++n n nS S n ?2 12 1n n n n + C 2 12 1n n n n +σ D 2 22 1 2 1n n σσ+ 三、多项选择

小概率事件及假设检验好资料

第五章假设检验 第一节标准误 【教学目的】理解标准误的概念,掌握标准误的计算方法. 【教学重点】标准误的概念 【教学难点】标准误与标准差的区别 【导言】 在随机抽样中,抽样误差是不可避免的。抽样误差的大小是用统计量标准误来描述的,标准误愈大,抽样误差也愈大,反之愈小。【教学内容】 一、均数的标准误( S) x 1、定义:由于随机抽样而造成的样本统计量x之间或样本统计量x与 总体均数参数 之间的误差为均数的标准误。(样本均数的离 散程度的标准差) 2、 S与S的区别 x 【相同点】都表示变量的离散程度 【不同点】 (1) 描述的对象不同:S描述个体的离散程度 S描述样本均数的离散程度 x (2) 代表的意义不同:S大,说明个体间的离散程度大 S大,表示用样本均数推断总体均数的可靠小 x (3) 用途不同:S用来计算 S x S用于两均数的差异性检验 x

3、计算 n S S x = (n 愈大,个体间差异愈小,样本的代表性就愈高) 【举例】某地150名14岁女孩的肺活量的 x = 2406m l , S =404ml , 求 标准误。 解:99.32150 404≈== n S S x 二、率的标准误( S P ) 1、率:某现象在其可能发生的范围内实际发生的次数。 率= 100?可能发生的次数 实际发生的次数 % (样本含量要大) 2、率的标准误:由随机抽样而造成的样本率P 之间或样本率P 与总 体率π之间的误差. 3、计算 n p p S p ) 1(-= 【举例】在某中学随机抽取200人进行国家体育锻炼标准达标测验,其中达标者150人,求标准误? 解:75.0200 150=== n m p 031.0200 ) 75.01(75.0) 1(=-=-= n p p S p 【作业】标准误与标准差有什么区别与联系?

第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量 ? 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。 ? 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。 5.1 两类错误与功效 1. 两类错误的概率 H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0- (5.2) (略) ? 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为 第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ? 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病 第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ? 两类错误的背景: 拒绝H 0时可能犯第Ⅰ类错误 不拒绝H 0时可能犯第Ⅱ类错误 ? 两类错误的后果: 第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ? 一般α, β的数值要在科研设计时事先确定 2. 功效 (power) ? 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β (5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β (5.5) ? 功效就是真实有效的药物被发现的概率∕疾病被诊断出 来的概率 5.2 影响功效的四要素 ? 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ? 功效的影响因素为:δ=0μ-x ,σ,n ,α X ≥μ0+Z αn σ (5.7) (略) ? 现用X 分布图形来定性地讨论四要素对功效的影响 1. 客观差异越大,功效越大

第十章 双样本假设检验及区间估计练习题

第十章 双样本假设检验及区间估计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互(独立 )地抽取的。 2.如果从N (μ1,σ12 )和N (μ2,σ22 )两个总体中分别抽取容量为n 1和n 2的独立随机样本,那么两个样本的均值 差(1X ―2X )的抽样分布就是N ((μ1―μ2,121n σ+2 2 2n σ) )。 3.两个成数的差可以被看作两个(均值 )差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作(一个 )样本,也称关联样本。 5.配对样本均值差的区间估计实质上是( μd )的单样本区间估计 6.当n 1和n 2逐渐变大时,(1X ―2X )的抽样分布将接近(正态 )分布。 7.使用配对样本相当于减小了(一半 )的样本容量。 8. 在配对过程中,最好用(掷硬币 )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于(实验刺激 )。 10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( 右 )侧。 二、单项选择 1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是(B )。 A N (μ1―μ2,121n σ―222n σ) B N (μ1―μ2,121n σ+222n σ) C N (μ1+μ2,121n σ―2 22n σ) D N (μ1+μ2,121n σ+222n σ) 2.两个大样本成数之差的分布是(B )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 22n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 22n q p ) 7.关于配对样本,正确的说法有[ ] A . 它只有一个样本; B 对样本中每个个体要观测两次; C 样本来自于两个总体; D 样本来自于同一个总体 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是(A )。 A F 分布 B Z 分布 C t 分布 D 2 χ分布 4.配对小样本的均值d 的抽样分布是( C )。 A Z 分布 B 自由度为n 的t 分布

(完整版)T检验F检验和卡方检验

什么是Z检验? Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数>平均数的差异是否显著。 当已知标准差时,验证一组数的均值是否与某一期望值相等时,用Z检验。 Z检验的步骤 第一步:建立虚无假设,即先假定两个平均数之间没有显著差异。 第二步:计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。 1、如果检验一个样本平均数()与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为: 其中: 是检验样本的平均数; μ0是已知总体的平均数; S是样本的方差; n是样本容量。 2、如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为: 其中: 是样本1,样本2的平均数; S1,S2是样本1,样本2的标准差; n1,n2是样本1,样本2的容量。 第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如下表所示: 第四步:根据是以上分析,结合具体情况,作出结论。 Z检验举例 某项教育技术实验,对实验组和控制组的前测和后测的数据分别如下表所示,比较两组前测和后测是否存在差异。 实验组和控制组的前测和后测数据表 前测实验组n1 = 50 S1a = 14

控制组n2 = 48 S2a = 16 后测实验组n1 = 50 S1b = 8 控制组n2 = 48 S2b = 14 由于n>30,属于大样本,所以采用Z检验。由于这是检验来自两个不同总体的两 个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的Z检验方法。 计算前要测Z的值: ∵|Z|=0.658<1.96 ∴ 前测两组差异不显著。 再计算后测Z的值: ∵|Z|= 2.16>1.96 ∴ 后测两组差异显著。 T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 t检验是对各回归系数的显著性所进行的检验,是指在多元回归分析中,检验回归系数是否为0的时候,先用F检验,考虑整体回归系数,再对每个系数是否为零进行t检验。t检验还可以用来检验样本为来自一元正态分布的总体的期望,即均值;和检验样本为来自二元正态分布的总体的期望是否相等) 目的:比较样本均数所代表的未知总体均数μ和已知总体均数μ0。 自由度:v=n –1 T检验注意事项 要有严密的抽样设计随机、均衡、可比 选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布) 单侧检验和双侧检验 单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能 性大。 假设检验的结论不能绝对化 不能拒绝H0,有可能是样本数量不够拒绝H0 ,有可能犯第Ⅰ类错误 正确理解P值与差别有无统计学意义P越小,不是说明实际差别越大,而 是说越有理由拒绝H0 ,越有理由说明两者有差异,差别有无统计学意义和有无 专业上的实际意义并不完全相同 假设检验和可信区间的关系结论具有一致性差异:提供的信息不同区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H 0成立与否的概率。 适用条件

相关主题
文本预览
相关文档 最新文档