教育科研中的统计方法——Z检验和t检验
- 格式:doc
- 大小:168.00 KB
- 文档页数:5
一文搞懂Z检验,T检验,x2检验作者:Bob大叔,香港精益六西格玛黑带
三种检验方法的介绍
Z检验举例:
某产品,其装量服从N(2.1,0.012),即均值2.1,标准差0.01。
抽取15个样品,其测量值如下:
2.08 2.10 2.10
2.09 2.10 2.10
2.09 2.09 2.11
2.09 2.12 2.10
2.10 2.10 2.10
建立假设H0:μ=2.1,H1 μ≠2.1,由于σ已知,故选择Z检验
操作如下:
P=0.36>0.05,无法拒绝原假设H0, 所以认为取样的平均装量没有变化。
t检验举例:
某设备的OEE目标为70%,连续15天的OEE如下,请判断OEE是否已达到70%目标?
由于σ(标准差)未知,且为小样本,故而选择,t检验
建立假设:HO: μ=70%, H1>70%,
操作如下:
P=0.252>0.05,无法拒绝原假设,说明0EE并未大于70%。
X2检验举例:
已知某产品装量,符合N(μ,σ2)分布,μ未知,但是要求标准差不能超过0.01,随机抽取30个样品,请问标准差是否有变化?
由于μ未知,故而选择X2检验,
建立假设:H0:σ=0.01, H1:σ≠0.01
操作如下:
(weixin gongzhonghao: HK_BobUncle)
P=0.303>0.05, 无法拒绝原假设,说明标准差无变化。
z 检验/u 检验、t 检验、F 检验、卡方检验使用条件1. z 检验/u 检验(1)当样本容量30n >,即大样本时,样本相关系数r 就近似服从正态分布,经过对r 标准化变换后,则得到检验统计量:r r u σ= 或 σ=r rz 式中,r σ表示样本相关系数r 的抽样平均误差,即样本相关系数与总体相关系数之间的平均偏差。
(2)当在0ρ≠的总体中随机抽样时,样本相关系数r 并不呈正态分布,若要测定相关系数与0ρ≠的数值是否显著,或测定两个相关系数之间的差异是否显著,即从两个已知样本相关系数推断其总体相关系数是否相等的假设,费歇(Fisher )在1921年提出了如下方法: 012:H ρρ= 112:H ρρ≠11ln 21r r z r +=- 经过对r 变化,则r z 就接近正态分布。
r z 的标准差为:()r z σ= 在简单直线方程式中只有两个参数,故2m =,则()r z σ=因此,此时可用正态分布方法进行检验。
The general form of a lower-tail test, whereis the stated value for the population mean, follows.Large-Sample (30≥n ) Hypothesis Test About a Population Mean for a One-Tailed Test of the Form00:μμ≥H 0:μμ<a HTest Statistic :σ Assumed Knownn x z /0σμ-=Test Statistic :σ Estimated by s0μn s x z /0μ-=Rejection RuleUsing test statistic :Reject 0H if α<-z zUsing -p value :Reject 0H if α<-value p2.t 检验当样本容量30n <,即小样本时,如果总体相关系数0ρ=,则样本相关系数r 的抽样分布随着样本容量n 的增大而逐渐地趋近于自由度为n m -的t 分布。
z检验和t检验的区别
卡方检验是对两个或两个以上样本率(构成比)进行差别比较的统计方法。
t检验,主要是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。
它是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
t检验的适用条件:正态分布资料。
1、卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,
包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡仿检验以及分
类资料的相关分析等。
2、t检验,亦称student t检验( student's ttest) ,主要用作样本含量较小(比
如n大于30) ,总体标准差o未明的正态分布。
t检验就是用t原产理论去推断差异出现
的概率,从而比较两个平均数的差异与否明显。
t检验
3、t检验共分成三种方法,分别就是单一制样本t检验,接合样本t检验和单样本t
检验。
单一制样本t检验和单因素方差分析功能上基本一致,但是单一制样本t检验就可
以比较两组选项的差异,比如说男性和女性。
相对来讲,独立样本t检验在实验比较时使用频率更高,尤其是生物、医学相关领域。
针对问卷研究,如果比较的类别为两组,独立样本t检验和单因素方差分析均可实现,研
究者自行选择使用即可。
4、卡方分析:卡方检验用作分析定类数据与定类数据之间的关系情况。
比如研究人
员想要晓得两组学生对于手机品牌的偏好差异情况,则必须采用卡方分析。
卡方就是通过
分析相同类别数据的相对挑选频数和比重情况,进而展开差异推论,单选题或多选题均可
以采用卡方分析展开对照差异分析。
统计学检验方法比较统计学检验方法是在统计学中用来判断研究假设是否成立的一种方法。
它通过分析样本数据来推断总体参数,并根据结果得出判断。
在进行统计学检验之前,我们首先需要明确研究问题和研究假设。
接下来,我将介绍一些常见的统计学检验方法的比较。
1.T检验和Z检验T检验和Z检验都是用来推断一个样本的均值是否与总体均值有显著差异。
T检验主要用于小样本,而Z检验适用于大样本。
相较于Z检验,T检验考虑到了样本的自由度,因此对于小样本的推断更加准确。
2.单样本检验和双样本检验单样本检验用于比较一个样本的均值是否与一个已知的总体均值有显著差异。
双样本检验则用于比较两个样本的均值是否存在显著差异。
双样本检验可以进一步分为独立样本检验和配对样本检验。
独立样本检验适用于两个独立的样本,而配对样本检验适用于同一组个体在不同时间或不同处理下的两次测量。
3.卡方检验和F检验卡方检验主要用于判断两个分类变量之间是否存在相关性。
它将观察频数与期望频数进行比较,以确定差异的显著性。
F检验则用于比较两个或更多个总体方差是否相等。
它将组间离散度与组内离散度进行比较,从而推断总体方差是否存在显著差异。
4.非参数检验和参数检验非参数检验不依赖于总体的特定分布,而是对总体的分布进行较少的假设。
它通过对数据的排序和秩次转换来进行推断。
非参数检验一般适用于数据不服从正态分布或样本量较小的情况。
参数检验则建立在对总体参数分布的假设上,通常假设数据服从正态分布。
参数检验的推断结果相对较为准确,但对数据的假设要求较高。
综上所述,不同的统计学检验方法适用于不同的研究问题和数据类型。
选择合适的统计学检验方法可以提高推断结果的准确性。
因此,在进行统计学检验之前,我们需要充分理解研究问题的背景,研究假设的特点以及数据的类型和分布,从而选择适当的检验方法。
同时,还需要注意检验过程中的假设和限制,以及结果的解释和推断的合理性。
t检验和z检验的比较
检验类型单样本资料的t检验配对设计资料的t检验两独立样本资料的t检验两独立样本资料的z检验
应用条件当样本例数n较小,样本来自正态总体,总体标准差未知。
在作两个样本均数比较时,还要求两样本
相应的两总体方差相等。
(用于定量资料)
两个样本含量n较大(均大于50)
的情况
举例已知一个样本的指标的真值,现
在重复测定15次,问此法测得的
均数与真值有无差别(P296例)
用某药治疗8例高血压患者,观
察治疗前后舒张压的变化情况,
问该药是否对高血压患者治疗前
后舒张压变化有影响(P297例)
两组雄性大鼠(n1=12,n2=12)
分别用高蛋白和低蛋白饲料喂
养,问体重的增加有无差别
(P299例)
某医院用120名2型糖尿病患者
分成两组,用不同降血糖药,比
较两种降糖药的降血糖效果是否
不同(P299例)
假设(注意单侧和双侧假设区别)H 0:μ=μ0
H 1:μ≠μ0 α= 0.05
H 0:μd=0
H 1:μd≠0 α= 0.05
H 0:μ1=μ2
H 1:μ1≠μ2 α= 0.05
H 0:μ1=μ2
H 1:μ1≠μ2 α= 0.05
计算公式
比较,结论t>t界值(z>z界值),p≤0.05,拒绝Ho,接受H1,差异有统计学意义,可以认为······
t<t界值(z<z界值),p>0.05,不拒绝Ho,差异无统计学意义,尚不能认为······(根据题目下结论)。
一、背景介绍统计学是一门研究数据收集、分析和解释的学科,统计检验方法是统计学的重要应用之一。
在统计学中,t值、z值和x2值是常见的统计指标,它们对应着不同的统计检验方法,用于检验样本数据是否符合特定的分布或者是否存在差异。
本文将对t检验、z检验和卡方检验进行详细介绍,分析它们的应用场景、计算方法和实际意义。
二、 t检验t检验是一种用于比较两个样本均值是否存在显著差异的统计方法。
当样本数据符合正态分布且方差未知时,可以采用t检验进行假设检验。
t检验分为单样本t检验和双样本t检验两种。
1. 单样本t检验单样本t检验用于检验样本均值是否等于已知的总体均值。
它的计算公式为:t = (样本均值 - 总体均值) / (标准误差)其中,标准误差的计算需要用到样本标准差和样本容量。
2. 双样本t检验双样本t检验用于比较两个独立样本的均值是否存在显著差异。
在双样本t检验中,需要计算t值和自由度,然后查找t分布表得出显著性水平。
如果t值大于临界值,则拒绝原假设,认为两组样本均值存在显著差异。
三、 z检验z检验是一种用于比较样本均值与总体均值差异的统计方法。
当样本容量较大且符合正态分布时,可以采用z检验进行假设检验。
z检验通常用于总体标准差已知且样本容量较大的情况。
z检验的计算公式为:z = (样本均值 - 总体均值) / (总体标准差 / 样本容量的平方根)根据z值查找标准正态分布表可以得出样本均值的显著性水平。
如果z 值落在临界值之外,则可以拒绝原假设,认为样本均值存在显著差异。
四、卡方检验卡方检验是一种用于检验观察频数与期望频数之间是否存在显著差异的统计方法。
在实际应用中,卡方检验通常用于分析分类数据的拟合度或者独立性。
1. 卡方拟合度检验卡方拟合度检验用于检验观察频数与期望频数之间的拟合度。
计算公式为:X2 = Σ((观察频数 - 期望频数)2 / 期望频数)根据卡方分布表可以得出显著性水平,从而判断观察频数是否符合期望频数的分布。
统计检验的具体操作
①Z检验
Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。
它是用标准正态分布的理论来推断差异发生的概率,从而比较两个独立大样本平均数的差异是否显著。
②t检验(计量)
t检验是用于小样本(样本容量小于30)时的平均值差异程度检验方法。
它是用t分布理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
③χ2检验(计数)
Z检验与t检验,通常用于计量资料的分析,而在教育研究中还常有计数资料,如按品质分类,然后按类评等计数,如优良中差,甲乙丙丁,或同意、反对、弃权等。
这种计算资料检验就要利用χ2检验的方法。
χ是希腊字母,读chi ,通常把χ2读作“卡方”。
χ2检验是通过对所得的计数资料与依据某种假设而确定的理论次数二者之间的差异来进行检验的。
χ2值是检验实测次数与理论次数之间差异程度的指标。
两者相差越大,χ2值就越大;两者越接近,则χ2值就越小:如果两者完全相同,那么χ2值就等于零,χ2值永远是非负值。
χ 2值与P值及差异显著性的关系
χ 2(计算值)P 差异显著性
χ 2>χ2(df)0.01P<0.01 差异非常显著χ 2≥χ2(df)0.05 P≤0.05 差异显著
χ 2<χ2(df)0.05P≥0.05 差异不显著4秩计算(0用分等级资料分析)。
语言教学研究常用统计方法一、为什么要用统计方法对数据进行分析如果不利用统计方法对数据进行分析,就不能从原始数据中得出可靠的结如果不使用统计方法进行分析,我们很难说两个班的成绩有显著差异。
二、几种常用的统计方法(一)T检验(T test)使用目的:比较两组数据的平均值是否有显著差异数据类型:数值数据注意事项:独立样本与配对样本;单侧检验与双侧检验例1:独立样本T检验:检验实验班与控制班的平均成绩是否有显著差异。
方法1:使用Excel中的TTEST方法2:使用SPSS中的Analyze→Compare means→Independent samples例2:配对样本T检验:检验实验前与实验后的成绩是否有显著差异。
方法1:使用Excel中的TTEST方法2:使用SPSS中的Analyze→Compare means→Paired samples T test(二)单方向方差检验(One-way Anova)使用目的:比较两组以上数据的平均值是否有显著差异,比如比较三个班的成绩。
数据类型:数值数据注意事项:1个自变量,1个因变量例3:单方向方差检验(One-way Anova):检验三种教学的效果(成绩)是否有显著差异方法:使用SPSS中的Analyze→Compare means→One-way Anova(三)双方向方差检验(Two-way Anova)使用目的:比较两组以上数据的平均值是否有显著差异,并且需要考察两个变量之间的交互作用,比如调查地区与性别是否影响学生的成绩。
数据类型:数值数据注意事项:2自变量,1个因变量例4:双方向方差检验(Two-way Anova):检验学生的性别和他们来自的地区是否相互作用影响学生的成绩。
方法:使用SPSS中的Analyze→General linear model→Univariate (1)依次点击SPSS中的Analyze→General linearmodel→Univariate(2)把因变量(成绩)放入DEPENDENT VARIABLE 方格中;把所有自变量放入FIXED FACTORS方格中;(3)点击OPTIONS,然后在ESTIMATED MARGINAL MEANS 中把所有的因素拖到DISPLAY MEANS FOR的方格中;(4)在DISPLAY区域选中DESCRIPTIVE STATISTICS和ESTIMATES OF EFFECT SIZE boxes;然后点击Contintue回到Univariate主窗口;(5)如何任何变量有3个或3个以上的情况,则需要点击POST-HOCS,把超过3种情况的变量拖入POST-HOCTESTS FOR方格。
教育科研中的统计方法——Z检验和t检验
乌海市海勃湾区教研室王根运
通常我们用平均分比较两个班的成绩的优劣是不妥的。
即某次考试中初二、二班数学成绩平均分低于初二、五班的平均分,不一定说明初二、二班数学真实成绩比初二、五班的差。
这是因为一个班的的平均成绩具有统计意义,存在抽样误差,其平均成绩在一定范围内波动,假如再进行一次考试也许初二、二班数学成绩平均分高于初二、五班的平均分。
所以比较成绩时应用平均数差异的显著性检验更科学。
统计学中平均数差异的显著性检验时规定一个显著性水平,经过检验所得差异超过这个显著性水平,表明这个差异不属于抽样误差,确实存在差异,反之属于抽样误差。
这个平均数差异的显著性检验在教育科研统计中总结为Z检验或t 检验。
一般地样本容量大于30时,用Z检验;样本容量小于30时,用t检验。
当问题所给的条件用t检验方便时,样本容量虽然大于30,也可以用t检验。
下面是样本容量大于30时的Z检验和样本容量小于30时的t检验案例。
一、样本容量大于30时的Z检验
案例:比较初三第一学期期末实验班和对比班的化学成绩
表1、初三、八班(实验班)第一学期期末化学成绩表
表2、初三、七7班(对比班)第一学期期末化学成绩表
时间:2010年1月
实验班和对比班学生人数均为52,样本容量大于30,用Z 检验看实验班和对比班成绩有无显著性差异(用计算机处理)。
实验班:初三、八班,据表1,样本容量:n 1=52,平均分:1X =
1
1
n X
∑=69.84
每个学生分数与平均分离差的平方和:∑21d ==-∑211)(X X 13243.86 标准差:S 1=
1
2
1n d ∑
=15.96
对比班:初三、七班,据表2,样本容量:n 2=52, 平均分 :2
X =
2
2
n X ∑=66.92
每个学生分数与平均分离差的平方和:∑2
2d ==-∑222)(X X 7967.19
标准差:S 2=
2
2
2
n d ∑
=12.38, Z=
2
22
121
21n S n S X X +-=1.043
Z 检验的判断方法: 0<Z <1.96时,两个班的成绩无显著性差异;1.96<Z <2.58时,两个班的成绩成绩有显著性差异。
本题0<Z=1.043<1.96,所以:实验班和对比班化学成绩无显著性差异。
点评:初三、八班(实验班)第一学期期末化学成绩表平均分
1
X =
1
1
n X ∑=69.84,初三、七班(对比班)第一学期期末化学成绩表平均分
2
X =
2
2
n X ∑=66.92。
虽然X —1〉X —
2,但不能说明初三、八班(实验班)比初三、七
班(对比班)的化学成绩好,这是抽样误差导致的结果。
事实上根据上面平均数
差异的显著性检验得出结论:两个班第一学期期末化学成绩无显著性差异。
二、相关样本,容量小于30的t 检验
同一批学生在实验前后进行两次测试得到两次成绩,若把这两次成绩看成两个样本的话,则这两个样本之间相互不是独立的,称为相关样本。
案例:王老师在初二、三班进行《语文口头作文对语文成绩影响的实验研究》,他每节课用10分钟的时间让学生进行口头小作文比赛,实验前进行一次语文成绩测试,随机抽取10名学生语文成绩(实验前成绩)记录如表,一个学期后用同样难度的试题又进行测试记录这10名学生的语文成绩(实验后成绩)记录如表。
该案例是相关样本,样本容量为10,小于30,用相关样本的t 检验看实验前和实验后初二、三班随机抽取10名学生语文成绩有无显著性差异(用计算机处理)。
样本1(实验前)成绩总和∑X 1=710 样本2(实验后)成绩总和∑X 2=795
d =∣2X -1
X ∣=∣n X X 2
1
∑∑-∣=∣10
795710-∣=8.5
样本1(实验前)和样本2(实验后)第i 个学生成绩差:d=X 2-X 1
∑d 2=∑-)(X X 122
=1267
(∑d )2=85
t=
)
1()
(0
2
2
--
-∑∑n n n d d
d =
()
110101085126705.82
---=3.456
若显著性水平α定为0.05,根据df=n-1=10-1=9查t 表:t α/2=2.262。
因为t=3.456> t α/2说明实验后学生的成绩有显著的提高。
点评:初二、三班实验前语文成绩表平均分1X =
1
1
n X
∑=71,初二、三班实
验后语文成绩表平均分2
X =
2
2
n X ∑=79.5。
虽然X —1<X —
2,但不能说明初二、三班实
验后比实验前的语文成绩好,上面平均数差异的显著性检验具有科学依据,得出的结论(两次成绩存在显著性差异)才符合事实。
即初二、三班实验后比实验前的语文成绩好。
三、不同样本,容量小于30的t 检验
案例:比较初二、一班和初二、二班第二学期期末物理成绩
表1、初二、一班第二学期期末物理物理成绩表
表2、初二、二班第二学期期末物理成绩表
初二、一班和初二、二班学生人数分别为27和29,样本容量小于30,用t
检验看两个班成绩有无显著性差异(用计算机处理)。
初二、一班:均分: 1
X =
1
1
n X ∑=70.22
每个学生分数与平均分离差的平方和:∑21d ==-∑211)(X X 6620.67 初二、二班:均分:2X =
2
2
n X
∑=67.3
每个学生分数与平均分离差的平方和:∑2
2d ==-∑222)(X X 6004.21
t=
)1
1(
2
d 2
12122
2
1
2
1n n n n d
X X +-++-∑∑=
⎪
⎭
⎫
⎝⎛+-++-2912712292721.600467.66203
.6722.70=0.1746
自由度df=n 1+n 2-2=27+29-2=54,若取α=0.05,查t 值表,0<t ≤2.014无显著差异,2.014<t ≤2.670有显著差异。
上面计算的0<t=0.1746≤2.014,说明初二、一班和初二、二班第二学期期末物理成绩无显著差异。
点评:初二、一班第二学期期末物理成绩平均分1X =
1
1
n X
∑=70.22,初二、
二班第二学期期末物理成绩平均分2
X =
2
2
n X ∑=67.3。
虽然X —
1〉X —
2,但不能说明
初二、一班比初二、二班的物理成绩好,这是抽样误差导致的结果。
事实上根据
上面平均数差异的显著性检验得出结论:两个班第二学期期末物理成绩无显著性差异。
参考书目
1、佟庆伟,教育科学中量化,中国科学技术出版社,1997。
2、王孝玲,教育测量,华东师范大学出版社,1989。