分类资料的假设检验
- 格式:ppt
- 大小:338.00 KB
- 文档页数:40
常用的假设检验方法
常用的假设检验方法包括:1. 单样本t检验:用于比较一个样本的均值是否与已知的总体均值有显著差异。
2. 双样本t检验:用于比较两个独立样本的均值是否有显著差异。
3. 配对样本t检验:用于比较两个相关样本的均值是否有显著差异。
4. 卡方检验:用于比较观察频数与期望频数之间的差异,适用于分类数据。
5. 方差分析(ANOVA):用于比较多个样本的均值是否有显著差异。
6. Wilcoxon符号秩检验:用于比较两个相关样本的中位数是否有显著差异。
7. Mann-Whitney U检验:用于比较两个独立样本的中位数是否有显著差异。
8. Kruskal-Wallis H检验:用于比较多个独立样本的中位数是否有显著差异。
9. McNemar检验:用于比较两个相关样本的比例是否有显著差异,适用于二项分布数据。
10. Fisher精确检验:用于比较两个独立样本的比例是否有显著差异,适用于二项分布数据。
以上是常用的假设检验方法,根据不同的情况和数据类型选择不同的方法进行统计分析。
定性资料常用的统计学方法一、χ2检验χ2检验(chi-square test)是一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。
(一)四格表资料的χ2检验例17:为了解吲达帕胺片治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用吲达帕胺片加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表4 -5-1,试分析吲达帕胺片治疗原发性高血压的有效性。
表4 -5-1 两种疗法治疗原发性高血压的疗效1.四格表χ2检验的原理:对于四格表资料,χ2检验的基本公式为:式中,A为实际频数(actual frequency),T为理论频数(theoreticalfrequency)。
理论频数T根据检验假设H0:π1=π2确定,其中π1和π2分别为两组的总体率。
计算理论频数T的公式为:式中Tij 为第i行第j列的理论频数,ni+和n+j分别为相应行与列的周边合计数,n为总例数。
现以例17为例说明χ2检验的步骤:(1)建立检验假设并确定检验水准。
H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.05(2)计算检验统计量。
按式(4 -5-2)计算T11,然后利用四格表的各行列的合计数计算T12、T21和T22,即T11=(44×41)/70=25.77,T12=44-25.77=18.23T21=41-25.77=15.23,T22=26-15.23=10.77按式(4 -5-3)计算χ2值(3)确定P值,作出推断结论。
以ν=1查χ2分布界值表,得P<0.005。
按α=0.05水准,拒绝H,接受H1,可以认为两组治疗原发性高血压的总体有效率不等,即可以认为吲达帕胺片治疗原发性高血压优于对照组。
2.四格表资料χ2检验的专用公式:在对两样本率比较时,当总例数n≥40且所有格子的T≥5时,可用χ2检验的通用公式(4 -5-1)。
常⽤的假设检验⽅法(U检验、T检验、卡⽅检验、F检验)⼀、假设检验假设检验是根据⼀定的假设条件,由样本推断总体的⼀种⽅法。
假设检验的基本思想是⼩概率反证法思想,⼩概率思想认为⼩概率事件在⼀次试验中基本上不可能发⽣,在这个⽅法下,我们⾸先对总体作出⼀个假设,这个假设⼤概率会成⽴,如果在⼀次试验中,试验结果和原假设相背离,也就是⼩概率事件竟然发⽣了,那我们就有理由怀疑原假设的真实性,从⽽拒绝这⼀假设。
⼆、假设检验的四种⽅法1、有关平均值参数u的假设检验根据是否已知⽅差,分为两类检验:U检验和T检验。
如果已知⽅差,则使⽤U检验,如果⽅差未知则采取T检验。
2、有关参数⽅差σ2的假设检验F检验是对两个正态分布的⽅差齐性检验,简单来说,就是检验两个分布的⽅差是否相等3、检验两个或多个变量之间是否关联卡⽅检验属于⾮参数检验,主要是⽐较两个及两个以上样本率(构成⽐)以及两个分类变量的关联性分析。
根本思想在于⽐较理论频数和实际频数的吻合程度或者拟合优度问题。
三、U检验(Z检验)U检验⼜称Z检验。
Z检验是⼀般⽤于⼤样本(即⼤于30)平均值差异性检验的⽅法(总体的⽅差已知)。
它是⽤标准的理论来推断差异发⽣的概率,从⽽⽐较两个的差异是否显著。
Z检验步骤:第⼀步:建⽴虚⽆假设 H0:µ1 = µ2 ,即先假定两个平均数之间没有显著差异,第⼆步:计算Z值,对于不同类型的问题选⽤不同的计算⽅法,1、如果检验⼀个样本平均数(X)与⼀个已知的总体平均数(µ0)的差异是否显著。
其Z值计算公式为:其中:X是检验样本的均值;µ0是已知总体的平均数;S是总体的标准差;n是样本容量。
2、如果检验来⾃两个的两组样本平均数的差异性,从⽽判断它们各⾃代表的总体的差异是否显著。
其Z值计算公式为:第三步:⽐较计算所得Z值与理论Z值,推断发⽣的概率,依据Z值与差异显著性关系表作出判断。
如下表所⽰:第四步:根据是以上分析,结合具体情况,作出结论。
第六章 分类资料的假设检验题库一、选择题1.2χ分布的形状( )。
A. 同正态分布B. 同t 分布C.为对称分布D. 与自由度ν有关E. 与样本含量n 有关 2.四格表的自由度( )。
A. 不一定等于1B. 一定等于1C. 等于行数×列数D. 等于样本含量-1E. 等于格子数-13.5个样本率作比较,24,01.02χχ>,则在α=0.05的检验水准下,可认为( )。
A. 各总体率不全相等 B. 各总体率均不等 C. 各样本率均不等 D. 各样本率不全相等 E. 至少有两个总体率相等4.测得某地6094人的两种血型系统,结果如下。
欲研究两种血型系统之间是否有联系,应选择的统计分析方法是( )。
某地6094人的ABO 与MN 血型ABO 血型MN 血型M N MN O431 490 902 A 388 410 800 B 495 587 950 AB137 17932A.秩和检验B.2χ检验C.Ridit 检验D.相关分析E.Kappa 检验 5.假定两种方法检测结果的假阳性率和假阴性率均很低。
现有50份血样用甲法检查阳性25份,用乙法检查阳性35份,两法同为阳性和阴性的分别为23份和13份。
欲比较两种方法检测结果的差别有无统计学意义,应选用( )。
A. u 检验B. t 检验C. 配对t 检验D. 配对四格表资料的2χ检验 E. 四格表资料的2χ检验6.某医师欲比较两种疗法治疗2型糖尿病的有效率有无差别,每组各观察了30例,应选用( )。
A.两样本率比较的u 检验B.两样本均数比较的u 检验C. 四格表资料的2χ检验 D. 配对四格表资料的2χ检验 E. 四格表资料2χ检验的校正公式7.用大剂量Vit.E 治疗产后缺乳,以安慰剂对照,观察结果如下:Vit.E 组,有效12例,无效6例;安慰剂组有效3例,无效9例。
分析该资料,应选用( )。
A. t 检验 B.2χ检验 C.F 检验 D.Fisher 精确概率法 E. 四格表资料的2χ检验校正公式8.欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为2组,结果如下。