当前位置:文档之家› 均值比较与t检验

均值比较与t检验

均值比较与t检验
均值比较与t检验

第3章均值比较与t检验(t代表平均值间的差距p代表的是可信度)

3.1样本平均数与总体平均数差异显著性检验

在实际工作中,我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体,已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值,比较的目的是推断样本所代表的未知总体均数与已知总体均数有无差别。

例题:已知玉米单交种群单105的平均穗重为300g,喷药后随机抽取9个果穗称重,穗重分别为:308、305、311、298、315、300、321、294、320g,问喷药前后果穗穗重差异是否显著。

具体操作可参看多媒体教程-3.1单一样本t检验,例题中的数据编号为data-01。

操作步骤:Analyze→Compare Means→点击One-Sample T Test,进人对话框→将要分析的变量选入Test Variables→Test Value项填入已知总体均数→点击Options按钮,进入Options子对话框,Confidence Interval选项中填入95或99,确定显著水平后返回上一对话框→点击OK键运行,显示结果界面。

结果界面包括描述性统计量表(One-Sample Statistics) 和t检验表(One-Sample Test)两个表格。描述性统计量表中输出样本含量、均数、标准差和标准误;t检验表中显示t 值(t)自由度(df)、双尾P值(Sig.2-tailed)、样本均数与已知总体均数的差值(Mean Difference)、差

值的95%或99%置信区间的上限与下限(95%Confidence Interval of the Difference,Lower,Upper)。

3.2独立样本t检验

在实际工作中,还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。因试验设计不同,一般可分为:非配对或成组设计两样本平均数的差异显著性检验和配对设计两样本平均数的差异显著性检验。

非配对设计或成组设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的两个样本相互独立,其含量不一定相等。

例题:某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重结果如下,问两种饲料对粤黄鸡的增重效果有无显著差异?

件中录入的分类变量值一致)→点击Options按钮,进入Options子对话框,Confidence Interval选项系统默95,也可根据需要改为99,确定置信水平后返回上一对话框→点击OK键运行,显示结果界面。结果界面中,描述统计表(Group Statistics)给出两组变量的基本情况描述,内容简单,不再赘述。

t检验表(Independent-Samples Test)较为复杂,第一部分列出的是两样本方差齐性检验(Levene'sTest for Equality of Variances)的F值(F)和显著概率值(Sig.)。除此之外的两行数据分别表示方差同质(Equal variances assumed)与方差不齐(Equal variances not assumed)时的t检验结果与差异置信区间。当齐性检验显著时,选下一行的结果;检验不显著时,选上一行结果。

3.3配对样本t检验

配对设计是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机的分配到两个处理组中。配对的要求是:配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对的方式有两种:自身配对和同源配对。

例题:用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见下表,设体温服从正态分布,问注射前后体温有无显著性差异。(单位:℃)

问卷调查数据共有207个样本:按教育程度小学样本个数49个,平均WTP为18.33;初中样本个数95个,平均WTP为30.00;高中样本个数46个,平均WTP为50.61;大专及以上样本个数17个,平均WTP为70.22; 想要的结果是:随教育程度提高WTP呈现递增趋势,t 检验结果(t1,2=-3.075,P=0.004;t1,3=-5.499,P=0.000;t1,4=-8.595,P=0.000;) 如何做出来?

你的分析结果有T值,有sig值,说明你是在进行平均值的比较。也就是你在比较两组数据之间的平均值有没有差异。从具有t值来看,你是在进行T检验。T检验是平均值的比较方法。

T检验分为三种方法: 1. 单一样本t检验(One-sample t test),是用来比较一组数据的平均值和一个数值有无差异。例如,你选取了5个人,测定了他们的身高,要看这五个人的身高平均值是否高于、低于还是等于1.70m,就需要用这个检验方法。

2. 配对样本t检验(paired-samples t test),是用来看一组样本在处理前后的平均值有无差异。比如,你选取了5个人,分别在饭前和饭后测量了他们的体重,想检测吃饭对他们的体重有无影响,就需要用这个t检验。注意,配对样本t检验要求严格配对,也就是说,每一个人的饭前体重和饭后体重构成一对。

3. 独立样本t检验(independent t test),是用来看两组数据的平均值有无差异。比如,你选取了5男5女,想看男女之间身高有无差异,这

样,男的一组,女的一组,这两个组之间的身高平均值的大小比较可用这种方法。总之,选取哪种t检验方法是由你的数据特点和你的

个中间过程产生的数据,不必理他,你只需要看sig值就可以了。sig

的。一般将这个sig值与0.05相比较,如果它大于0.05,说明平均值在大于5%的几率上是相等的,而在小于95%的几率上不相等。我们认为平均值相等的几率还是比较大的,说明差异是不显著的,从而认为两组数据之间平均值是相等的。如果它小于0.05,说明平均值在小于5%的几率上是相等的,而在大于95%的几率上不相等。我们认为平均值相等的几率还是比较小的,说明差异是显著的,从而认为两组数据之间平均值是不相等的。

总之,只需要注意sig值就可以了。

昼夜发病率=发病例数/天数/总观察人数(取千分数)

均数差别比较的t检验

均数差别比较的
t检验
样本均数间的差别原因
z 总体均数不同 z 总体均数相同,差别仅仅由抽样误
差引起 z 一般做法是计算某个统计量(如t
值),然后根据相应的概率作出推 断
t检验(student’s t test)
t检验常用于样本含量较小,并且总 体标准差σ未知时
三种t检验 z样本均数 X 与已知某总体均数μ0
的比较; z两组样本均数 X 1 与 X 2 的比较; z 配对设计资料均数的比较。
t检验的应用条件
z 1.当样本含量较小时(n<60),理论上 要求样本为来自正态分布总体的随机 样本;
z 2.当做两样本均数比较时,还要求两 总体方差相等(方差齐性,即 σ12=σ22)。 在实际工作中,若上述条件略有偏 离,仍可进行t检验分析。
一、样本均数和总体均数比较的t检验 (one sample t test)
z 目的是推断样本所代表的未知总体 均数μ与已知总体均数μ0有无差 别。
z 已知的总体均数μ0一般为理论值、 标准值或经过大量观察所得的稳定 值等。
z 条件:当n较小时,要求样本来自于 正态分布总体
假设检验的独特逻辑
例 : 某病患者20人,其血沉 (mm/h)均数为 9.15,标准差为2.13,问是否该病患者血 沉与以往文献报道的均数10.50有差别?
x ± t0.05/ 2,19s / n
= 9.15 ± 2.093× 2.13 / 20 = (8.15,10.15)
1

1.两个假设,决策者在其中作出抉择
该病患者血沉总体均数与10.50无差别, 该病患者血沉总体均数与10.50有差别。 简写
H0:μ=10.50 H1:μ≠10.50 单凭一份样本不可能证明哪一个正确,
一般利用小概率反证法思想,从问题的对 立面出发(H0)间接判断要解决的问题(H1) 是否成立。
H0:μ=10.50
μ = 10.50
X
H1:μ≠10.50
μ
10.50
X
2. H0成立时会怎样? 所得t值因样本而 异,但其绝对值多数情况下落在0附近。 t的分布规律可由t界值表查出
t=
|X
? 10 .50 sx
|=
|X
? 10 .50
s n
| ,ν
= n ?1
3.当前状况如何,发生的可能性(P值)有 多大?
n=20, X =9.15,S=2.13, μ0 =10.50 得t=2.8345, ν=19
P值系指在H0成立的假设前提下,出现 当前检验统计量以及更极端情况的概 率。 查表,对于自由度为19的t分布曲线,当 前t值以外的双侧尾部面积 P ( t ≥ 2 .8345 ) 介于0.01和0.02之间
4.决策 决策者需要事先规定一个可以忽略 的小概率值α。如取0.05,那么上述P值 可认为很小。即H0成立时,几乎不可能 出现当前的状况。
于是,面临两种抉择,一是认为H0是成 立的,而当前情况又恰好偶然发生了;
二是怀疑H0的正确性。通常选择后者。 本例,可认为该病患者血沉总体均数与
10.50有差别。 当然,此时决策者也可能
错误地拒绝H0,通常称之为第Ⅰ类错 误,概率为P。
例 某医生测量了36名从事铅作业男性工人的 血红蛋白含量,算得其均数为130.83g/L,标 准差为25.74g/L。问从事铅作业工人的血红 蛋白是否不同于正常成年男性平均值 140g/L?
1.建立假设。
H0:μ=μ0 ,从事铅作业工人的血红蛋白与 正常成年男性平均值相等。
H1:μ≠μ0,从事铅作业工人的血红蛋白与 正常成年男性平均值不相等。
α=0.05
2

用SPSS进行单因素方差分析和多重比较

方差分析 方差分析可以用来检验来多个均值之间差异的显著性,可以看成是两样本t检验的扩展。统计学原理中涉及的方差分析主要包括单因素方差分析、两因素无交互作用的方差分析和两因素有交互作用的方差分析三种情况。虽然Excel可以进行这三种类型的方差分析,但对数据有一些限制条件,例如不能有缺失值,在两因素方差分析中各个处理要有相等的重复次数等;功能上也有一些不足,例如不能进行多重比较。而在方差分析方面SPSS的功能特别强大,很多输出结果已经超出了统计学原理的范围。 用SPSS检验数据分布的正态性 方差分析需要以下三个假设条件:(1)、在各个总体中因变量都服从正态分布;(2)、在各个总体中因变量的方差都相等;(3)、各个观测值之间是相互独立的。 在SPSS中我们很方便地对前两个条件进行假设检验。同方差性检验一般与方差分析一起进行,这一小节我们只讨论正态性的检验问题。 [例7.4] 检验生兴趣对考试成绩的影响的例子中各组数据的正态性。 在SPSS中输入数据(或打开数据文件),选择Analyze→Descriptive Statistics→Explore,在Explore对话框中将统计成绩作为因变量,兴趣作为分类变量(Fator),单击Plots按钮,选中“Histogram”复选框和“Normality plots with Test”,单击“Continue”按钮,在单击主对话框中的“OK”,可以得到分类别的描述统计信息。从数据的茎叶图、直方图和箱线图都可以对数据分布的正态性做出判断,由于这些内容前面已经做过讲解,这里就不再进一步说明了。 图7-2 用Expore过程进行正态性检验 top↑

spss教程第二章均值比较检验与方差分析要点

第二章均值比较检验与方差分析 在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。 ◆本章主要内容: 1、单个总体均值的 t 检验(One-Sample T Test); 2、两个独立总体样本均值的 t 检验(Independent-Sample T Test); 3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test); 4、单因素方差分析(One-Way ANOVA); 5、双因素方差分析(General Linear Model Univariate)。 ◆假设条件:研究的数据服从正态分布或近似地服从正态分布。 在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。如图2.1所示。 图2.1 均值的比较菜单选择项 §2.1 单个总体的t 检验(One-Sample T Test)分析 单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。

例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。 首先建立假设:H0:国有企业工资为10000元; H1:国有企业职工工资不等于10000元 打开数据库SY-2,检验过程的操作按照下列步骤: 1、单击Analyze →Compare Means →One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示。 图2.2 一个样本的t检验的主对话框 2、从左边框中选中需要检验的变量(国有单位)进入检验框中。 3、在Test Value框中键入原假设的均值数10000。 4、单击Options按钮,得到Options对话框(如图2.3),选项分别是置信度(默认项是95%)和缺失值的处理方式。选择后默认值后返回主对话框。 图2.3 一个样本t检验的Options对话框 5、单击OK,得输出结果。如表2.1所示。 表2.1(a).数据的基本统计描述 One-Sample Statistics

均值比较和T检验

Spss16.0与统计数据分析均值比较和T检验 2013年6月13日

均值比较和T 检验 统计分析常常采取抽取样本的方法,即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。但是,由于抽取的样本不一定具有完全代表性,样本统计量与总体参数间存在差异,所以不能完全的说明总体的特性。同时,我们也可以知道,均值不等的两个样本不一定来自均值不同的整体。对于如何避免这些问题,我们自然可以想均值比较和T 检验 1、Means 过程 1.1 Means 过程概述 (1)功能:对数据进行进行分组计算,比较制定变量的描述性统计量包括均值、标准差 、总和、观测量数、方差等一系列单列变量描述性统计量,还可以给出方差分析表和线性检验结果。 (2)计算公式为: n x x n i i ∑==1 11 1.2问题举例: 比较不同性别同学的体重平均值和方差。数据如下表所示:

体重表 1.3用SPSS操作过程截图:

1.4 结果和讨论 p{color:black;font-family:sans-serif;font-size:10pt;font-weight:normal} Your trial period for SPSS for Windows will expire in 14 days.p{color:0;font-fami ly:Monospaced;font-size:13pt;font-style:normal;font-weight:normal;text-decoration:none} MEANS TABLES=体重BY 性别 /CELLS MEAN COUNT STDDEV VAR.

均值比较与实验法常用的统计检验

均值比较与实验法常用的统计检验 总结与范例 理论基础: 一、描述性统计与推断性统计 二、抽样分布:样本统计量的分布 三、假设检验的(1)原理(小概率事件反证法),(2)步骤(原假设与备择假设、计算统计量、显著性水平、拒绝或接受原假设、I类错误和II类错误),(3)实用条件(总体正态分布、独立随机抽样、方差齐性)。 四、样本均值的抽样分布—t分布 1.单样本t检验(样本均值与总体均值的差异显著性检验) 例1:医学界测得正常人的每分钟脉搏次数为72,下面是本年度体检时随机抽查的20位电子科大教职工的每分钟脉搏次数,分别为:72,76,68,78,62,59,64,85,70,75,61,74,87,83,54,76,56,66,68,62。请问电子科大教职工的脉搏次数与正常人是否有显著差异? 2.独立样本t检验(实验组\控制组,完全随机分组,被试间设计) 例2:在一项关于反馈对知觉判断(直线长度判断)的影响的研究中,将被试随机分成两组,其中一组20人,每一次知觉判断后将结果告诉被试。另一组20人,每次知觉判断后不将结果告诉被试。测量被试判断线段长度的准确度,并按一定的评分标准打分,分值越高表明长度判断的准确度越高。两组被试的实验得分如下: 反馈组:78 82 83 77 78 81 85 84 86 75 78 86 84 88 75 90 88 70 69 80 不反馈组:74 80 70 65 72 80 66 73 82 83 69 85 66 75 74 78 69 70 71 79 请问给不给反馈会不会显著影响被试的长度判断的准确度? 3.配对样本t检验(重复测量\前后测、匹配\配对组设计、被试内设计) 例3:从某小学三年级随机抽取20名儿童,分别在学期初和学期末进行瑞文推理测验,结果如下: 学生编号 1 2 3 4 5 6 7 8 9 10 学期初12 13 12 11 10 13 14 15 15 11 学期末14 14 11 15 11 14 14 17 15 14 学生编号11 12 13 14 15 16 17 18 19 20 学期初13 12 11 10 13 14 15 15 11 12 学期末14 14 11 15 14 14 16 18 15 14 请问经过一学期的学习,学生的瑞文推理测验成绩是否有显著提高? 五、样本方差的抽样分布—F分布 方差分析(Analysis of Variance, ANOV A) 1.单因素方差分析(事后比较,post hoc)、 例4:喝酒会不会使一个人的认知判断更容易受外界影响呢?Gustafson(1987)设计了一个实验探讨这个问题。在实验中,被试的任务是进行线段长度判断,三十九名被试随机分成三组:其中,第一组被试喝果汁,第二组被试也喝果汁,但告诉他们果汁中加入了一定量的酒,第三组被试依其体重喝一定量的酒。饮用15分钟之后开始进行线段长度判断任务,每个被试进行75次重

均值比较和T检验

Sp SS16.0与统计数据分析均值比较和T 检验 2013 年 6 月13 日

均值比较和T检验 统计分析常常采取抽取样本的方法,即从总体中随机抽取一定数 量的样本进行研究来推论总体的特性。但是,由于抽取的样本不一定具有完全代表性,样本统计量与总体参数间存在差异,所以不能完全的说明总体的特性。同时,我们也可以知道,均值不等的两个样本不 定来自均值不同的整体。对于如何避免这些问题,我们自然可以想均值比较和T检验 1、Means 过程 1.1 Mea ns过程概述 (1) 功能:对数据进行进行分组计算,比较制定变量的描述性统计 量包括均值、标准差、总和、观测量数、方差等一系列单列变量描述性统计量,还可以给出方差分析表和线性检验结果。 n _ X1i (2) 计算公式为:X? q— n 1.2问题举例: 比较不同性别同学的体重平均值和方差。数据如下表所示: 体重表 用操作过程截图:

Cell Statistics ; Mean Grouped Median std. Error of Mean Sum Number oi Coses Slsndard Deviation 卜 nr-isnce Mnimum Maximum R AFI 酉 e Last Kurtosis Std. Error of Kurtosis Skewness std. Error of Skewness Harmonic Mean Geometric Mean rSt^istics for First Laryer- I I Anova table antJ eta I I Test for lirearity 1.4结果和讨论 p {color:black;font-family:sans-senf;font-size:10 pt;font-weight:normal} Your trial p eriod for SPSS for Windows will expire in 14 days .p {color:0;font -family:Monos paced;font-size:13 pt;font-style:normal;font-weight:normal;textdecoration:none} MEANS TABLES=体重 BY 性别 /CELLS MEAN COUNT STDDEV VAR. Mea ns [~~ ontiFiue 11 Cancel JL Median

spss第五章,两总体均值比较

第5章两总体均值比较 Means:两个总体均值的比较 One samples T Test:单样本T检验 Independent –Samples T Test:独立样本T检验 Paried-Samples T Test:配对样本T检验 One –Way ANOV A:单因素方差分析 5.1单样本T检验 单样本检验是检验样本均值与已知总体均值是否存在差异。统计的前提是样本总体服从正态分布。 spss将自动计算t值(自己理解意思) 例5.1 分析某班级学生高考数学成绩与全国的平均成绩70分之间

是否存在显著性差异。数据如下:85 74 86 95 86 82 75 78 88 86 98 56 64 63 80 ----Analyze----Computer Means----One Sample T Test 红色部分填(输入已知的总体均数------此题在Tset Value中写70) -------点击options后出现如下: exclude case analysis by analysis:带有缺失值的观测值(当它与分析有关时才被剔除,它为默认状态) exclude cases listwise:表示剔除带有缺失值的所有观测值 -------设置置信度,默认95%。------continue -------回到前一个对话框------单击“OK” 结果如表5.1 5.2 独立样本T检验(使用表5.2)

----Analyze----Computer Means----Indenpendent Sample T Test ------如下图选择数据 ------单击“define groups”---并在“Groups 1“中输入“1”在“Groups 2“中输入“2”

均值比较与t检验

第3章均值比较与t检验(t代表平均值间的差距p代表的是可信度) 3.1样本平均数与总体平均数差异显著性检验 在实际工作中,我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体,已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值,比较的目的是推断样本所代表的未知总体均数与已知总体均数有无差别。 例题:已知玉米单交种群单105的平均穗重为300g,喷药后随机抽取9个果穗称重,穗重分别为:308、305、311、298、315、300、321、294、320g,问喷药前后果穗穗重差异是否显著。 具体操作可参看多媒体教程-3.1单一样本t检验,例题中的数据编号为data-01。 操作步骤:Analyze→Compare Means→点击One-Sample T Test,进人对话框→将要分析的变量选入Test Variables→Test Value项填入已知总体均数→点击Options按钮,进入Options子对话框,Confidence Interval选项中填入95或99,确定显著水平后返回上一对话框→点击OK键运行,显示结果界面。 结果界面包括描述性统计量表(One-Sample Statistics) 和t检验表(One-Sample Test)两个表格。描述性统计量表中输出样本含量、均数、标准差和标准误;t检验表中显示t 值(t)自由度(df)、双尾P值(Sig.2-tailed)、样本均数与已知总体均数的差值(Mean Difference)、差

值的95%或99%置信区间的上限与下限(95%Confidence Interval of the Difference,Lower,Upper)。 3.2独立样本t检验 在实际工作中,还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。因试验设计不同,一般可分为:非配对或成组设计两样本平均数的差异显著性检验和配对设计两样本平均数的差异显著性检验。 非配对设计或成组设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的两个样本相互独立,其含量不一定相等。 例题:某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重结果如下,问两种饲料对粤黄鸡的增重效果有无显著差异?

均值比较和T检验

均值比较和T检验

Spss16.0与统计数据分析均值比较和T检验 2013年6月13日

均值比较和T 检验 统计分析常常采取抽取样本的方法,即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。但是,由于抽取的样本不一定具有完全代表性,样本统计量与总体参数间存在差异,所以不能完全的说明总体的特性。同时,我们也可以知道,均值不等的两个样本不一定来自均值不同的整体。对于如何避免这些问题,我们自然可以想均值比较和T 检验 1、Means 过程 1.1 Means 过程概述 (1)功能:对数据进行进行分组计算,比较制定变量的描述性统计量包括均值、标准差 、总和、观测量数、方差等一系列单列变量描述性统计量,还可以给出方差分析表和线性检验结果。 (2)计算公式为: n x x n i i ∑==1 11 1.2问题举例: 比较不同性别同学的体重平均值和方差。数据如下表所示: 体重表 性别 体重 男 56,62,58,45,49,53,44,61,64,60,67,59 女 43,45,39,42,48,51,40,38,40,53,37,50 1.3用SPSS 操作过程截图:

1.4 结果和讨论 p{color:black;font-family:sans-serif;font-size:10pt;font-weight:normal} Your trial period for SPSS for Windows will expire in 14 days.p{color:0;font -family:Monospaced;font-size:13pt;font-style:normal;font-weight:normal;text-decoration:none} MEANS TABLES=体重 BY 性别 /CELLS MEAN COUNT STDDEV VAR. Means Case Processing Summary Cases Included Excluded Total N Percent N Percent N Percent 体重* 性别24 100.0% 0 .0% 24 100.0%

SPSS-比较均值-独立样本T检验_案例解析

SPSS-比较均值-独立样本T检验案例解析 2011-08-26 14:55 在使用SPSS进行单样本T检验时,很多人都会问,如果数据不符合正太分布,那还能够进行T检验吗?而大样本,我们一般会认为它是符合正太分布的,在鈡型图看来,正太分布,基本左右是对称的,一般具备两个参数,数学期望和标准方差,即:N(p, Q) 如果你的样本数非常少,一般需要进行正太分布检验,检验的方法网上很多,我就不说了 下面以“雄性老鼠和雌性老鼠分别注射了某种毒素,经过观察分析,进行随机取样,查看最终老鼠是否活着。 问题:很多人认为,雄性老鼠和雌性老鼠分别注射毒液后,雌性老鼠存活下来的数量会比雄性老鼠多? 我们将通过进行统计分析来认证这个假设是否成立。 下面进行参数设置:a 代表:雄性老鼠 b代表:雌性老鼠 tim 代表:生存时间,即指经过多长时间后,去查看结果 0 代表:结果死亡 1 代表:结果活着 随机抽取的样本,如下所示:

打开SPSS- 分析---检验均值---独立样本T检验,如下图所示:

将你要分析的变量,移入右边的框内,再将你要进行分组的变量移入“分组变量”框内,“组别group()里面的两个参数,不能够随意设置,必须要跟样本里面的数字一致 点击确定后,分析结果,如下所示: 从组统计量可以看出,雄性老鼠的存活下来的均值为0.73,但是雌性老鼠存活下来的均值为1.00,很明显,雌性老是存活下来的个数明显比雄性老鼠多,但是一般我们不看这个结果,为什么?因为样本不够大,如果将样本升至10000个?也许这个均值将会发生变化,不具备统计学意义, 我们一般只看独立样本检验的结果。 独立样本检验,提供了两种方法:levene检验和均值T检验两种方法 Levene检验主要用来检验原假设条件是否成立,(即:假设方差相等和方差不相等两种情况)如果SIG>0.05,证明假设成立,不能够拒绝原假设,如果 SIG<0.05,证明假设不成立,拒绝原假设。 进行levene检验结果判断是第一步,从上图,可以看出 sig<0.05 方差相等的假设不成立,所以看第二行,方差不相等的情况 sig=0.082>0.05 即说明 P 值大于显著性水平,不应该拒绝原假设:即指:雌性老鼠和雄性老鼠在注射毒液后,存活下来的个数没有显著的差异

SPSS 3均值检验

平均数比较 Means过程用于统计分组变量的的基本统计量。这些基本统计量包括:均值(Mean)、标准差(Standard Deviation)、观察量数目(Number of Cases)、方差(Variance)。Means 过程还可以列出方差表和线性检验结果。 [例子] 调查了棉铃虫百株卵量在暴雨前后的数量变化,统计暴雨前和暴雨后的统计量,其数据如下: 暴雨前 110 115 133 133 128 108 110 110 140 104 160 120 120 暴雨后 90 116 101 131 110 88 92 104 126 86 114 88 112 该数据保存在“DATA4-1.SAV”文件中。 1)准备分析数据 在数据编辑窗口输入分析的数据,如图4-2所示。或者打开需要分析的数据文件“DATA4-1.SAV”。 图4-2 数据窗口

2)启动分析过程 在SPSS主菜单中依次选择“Analyze→Compare Means→Means”。出现对话框如图4-3。 图4-3 Means设置窗口 3)设置分析变量 从左边的变量列表中选中“百株卵量”变量后,点击变量选择右拉按钮,该变量就进入到因子变量列表“Dependent List:”框里,用户可以从左边变量列表里选择一个或多个变量进行统计。 从左边的变量列表中选中“调查时候”变量,点击“Independent List”框左边的右拉按钮,该变量就进入分组变量“Independent List”框里,用户可以从左边变量列表里选择一个或多个分组变量。 多个分组变量既可放在一层,又可放在不同层。利用图中的“Previous”和“Next”按钮可以在不同层之间切换。 4)选择输出统计量

均数差别比较的t检验

样本均数间的差别原因
均数差别比较的 t检验
z 总体均数不同 z 总体均数相同,差别仅仅由抽样误
差引起
z 一般做法是计算某个统计量(如t
值),然后根据相应的概率作出推 断
t检验(student’s t test)
t检验常用于样本含量较小,并且总 体标准差σ未知时
三种t检验 z 样本均数 X 与已知某总体均数μ0 的比较; z 两组样本均数 X 1 与 X 2 的比较; z 配对设计资料均数的比较。
t检验的应用条件
z 1.当样本含量较小时(n<60),理论上
要求样本为来自正态分布总体的随机 样本; z 2.当做两样本均数比较时,还要求两 总体方差相等(方差齐性,即 σ12=σ22)。 在实际工作中,若上述条件略有偏 离,仍可进行t检验分析。
一、样本均数和总体均数比较的t检验 (one sample t test)
z 目的是推断样本所代表的未知总体
假设检验的独特逻辑
例 : 某病患者20人,其血沉 (mm/h)均数为 9.15,标准差为2.13,问是否该病患者血 沉与以往文献报道的均数10.50有差别?
均数μ与已知总体均数μ0有无差 别。 z 已知的总体均数μ0一般为理论值、 标准值或经过大量观察所得的稳定 值等。 z 条件:当n较小时,要求样本来自于 正态分布总体
x ± t0.05 / 2,19 s / n = 9.15 ± 2.093 × 2.13 / 20 = (8.15,10.15)
1

1.两个假设,决策者在其中作出抉择 该病患者血沉总体均数与10.50无差别, 该病患者血沉总体均数与10.50有差别。 简写 H0:μ=10.50 H1:μ≠10.50 单凭一份样本不可能证明哪一个正确, 一般利用小概率反证法思想,从问题的对 立面出发(H0)间接判断要解决的问题(H1) 是否成立。
H0:μ=10.50
H1:μ≠10.50
μ = 10.50
X
10.50
μ
X
2. H0成立时会怎样? 所得t值因样本而 异,但其绝对值多数情况下落在0附近。 t的分布规律可由t界值表查出
t = | X ? 10 . 50 | | X ? 10 . 50 | = ,ν = n ? 1 s sx n
P值系指在H0成立的假设前提下,出现 当前检验统计量以及更极端情况的概 率。 查表,对于自由度为19的t分布曲线,当 前t值以外的双侧尾部面积 P ( t ≥ 2 . 8345 ) 介于0.01和0.02之间 4.决策 决策者需要事先规定一个可以忽略 的小概率值α。如取0.05,那么上述P值 可认为很小。即H0成立时,几乎不可能 出现当前的状况。
3.当前状况如何,发生的可能性(P值)有 多大?
n=20, X =9.15,S=2.13, μ0 =10.50 得t=2.8345, ν=19
于是,面临两种抉择,一是认为H0是成 立的,而当前情况又恰好偶然发生了; 二是怀疑H0的正确性。通常选择后者。 本例,可认为该病患者血沉总体均数与 10.50有差别。 当然,此时决策者也可能 错误地拒绝H0,通常称之为第Ⅰ类错 误,概率为P。
例 某医生测量了36名从事铅作业男性工人的 血红蛋白含量,算得其均数为130.83g/L,标 准差为25.74g/L。问从事铅作业工人的血红 蛋白是否不同于正常成年男性平均值 140g/L? 1.建立假设。 H0:μ=μ0 ,从事铅作业工人的血红蛋白与 正常成年男性平均值相等。 H1:μ≠μ0,从事铅作业工人的血红蛋白与 正常成年男性平均值不相等。 α=0.05
2

相关主题
文本预览
相关文档 最新文档