两样本均值比较共21页
- 格式:ppt
- 大小:215.50 KB
- 文档页数:21
两样本均数的比较可用在统计学中,比较两个样本的均数是一项常见且重要的任务。
这种比较能够帮助我们了解两组数据之间的差异,从而为决策提供依据。
首先,让我们来理解一下什么是样本均数。
简单来说,均数就是一组数据的平均值。
比如,我们有一组数字 10、20、30、40、50,那么这组数据的均数就是(10 + 20 + 30 + 40 + 50)÷ 5 = 30 。
而样本均数呢,就是从总体中抽取的一部分样本数据的平均值。
那为什么要比较两样本均数呢?想象一下,我们想要研究两种不同药物对治疗某种疾病的效果。
我们给一组患者使用药物 A ,给另一组患者使用药物 B ,然后分别测量他们的康复时间。
通过比较这两组患者康复时间的样本均数,我们就能初步判断哪种药物可能更有效。
比较两样本均数的方法有很多,其中比较常用的是t 检验和z 检验。
t 检验适用于样本量较小(通常 n < 30 )且总体方差未知的情况。
它通过计算 t 值来判断两个样本均数之间的差异是否具有统计学意义。
比如说,我们想比较两组学生的数学考试成绩,每组只有 20 个学生。
我们先计算出两组成绩的均数和标准差,然后代入 t 检验的公式,得到t 值。
再根据自由度和预先设定的显著性水平(比如 005 ),查 t 分布表,就能确定这个 t 值是否达到了显著差异。
z 检验则适用于样本量较大(通常n ≥ 30 )或者总体方差已知的情况。
它的原理和 t 检验类似,但是计算过程相对简单一些,因为不需要考虑自由度的问题。
不过,在进行两样本均数比较之前,还有一些重要的前提条件需要满足。
一是独立性。
也就是说,两组样本中的数据应该是相互独立的,一个样本中的数据不会影响到另一个样本的数据。
二是正态性。
通常要求样本数据来自于正态分布的总体。
虽然在样本量较大的情况下,这个条件可以适当放宽,但对于小样本,正态性的要求就比较严格了。
三是方差齐性。
即两组样本的总体方差应该相等。
如果方差不齐,可能需要对数据进行转换或者使用其他特殊的检验方法。
R的两均值⽐较检验(⾮参数检验)1.两独样本参数的⾮参数检验1.1.Welcoxon秩和检验先将两样本看成是单⼀样本(混合样本)然后由⼩到⼤排列观察值统⼀编秩。
如果原假设两个独⽴样本来⾃相同的总体为真,那么秩将⼤约均匀分布在两个样本中,即⼩的、中等的、⼤的秩值应该⼤约被均匀分在两个样本中。
如果备选假设两个独⽴样本来⾃不相同的总体为真,那么其中⼀个样本将会有更多的⼩秩值,这样就会得到⼀个较⼩的秩和;另⼀个样本将会有更多的⼤秩值,因此就会得到⼀个较⼤的秩和。
R:wilcox.test##################独⽴样本的曼-惠特尼U检验Forest<-read.table(file="ForestData.txt",header=TRUE,sep=" ")Forest$month<-factor(Forest$month,levels=c("jan","feb","mar","apr","may","jun","jul","aug","sep","oct","nov","dec"))Tmp<-subset(Forest,Forest$month=="jan" | Forest$month=="aug")wilcox.test(temp~month,data=Tmp)Wilcoxon rank sum test with continuity correctiondata: temp by monthW = 2, p-value = 0.01653alternative hypothesis: true location shift is not equal to 01.2.K-S检验##################独⽴样本的K-S检验x1<-subset(Forest,Forest$month=="jan")x2<-subset(Forest,Forest$month=="aug")ks.test(x1$temp,x2$temp)Two-sample Kolmogorov-Smirnov testdata: x1$temp and x2$tempD = 0.99457, p-value = 0.03992alternative hypothesis: two-sided1.3.两配对样本分布###############配对样本的Wilcoxon符号秩检验ReportCard<-read.table(file="ReportCard.txt",header=TRUE,sep=" ")ReportCard<-na.omit(ReportCard)wilcox.test(ReportCard$chi,ReportCard$math,paired=TRUE)sum(outer(ReportCard$chi,ReportCard$math,"-")<0)sum(outer(ReportCard$math,ReportCard$chi,"-")<0)Wilcoxon signed rank test with continuity correctiondata: ReportCard$chi and ReportCard$mathV = 1695.5, p-value = 8.021e-11alternative hypothesis: true location shift is not equal to 0>> sum(outer(ReportCard$chi,ReportCard$math,"-")<0)[1] 332> sum(outer(ReportCard$math,ReportCard$chi,"-")<0)[1] 30262.两样本均值置换检验我们在实验中经常会因为各种问题(时间、经费、⼈⼒、物⼒)得到⼀些⼩样本结果,如果我们想知道这些⼩样本结果的总体是什么样⼦的,就需要⽤到置换检验。