当前位置:文档之家› 2-均值差异检验

2-均值差异检验

2-均值差异检验
2-均值差异检验

一般总体均值的假设检验.

§7.4 一般总体均值的假设检验 一、一般总体均值的大样本假设检验 1. 一个总体均值的大样本假设检验 设样本12(,,,)n X X X 取自非正态总体X ,记总体均值μ=)(X E 。样本均值及样本方差分别为11n i i X X n ==∑,2211()1n i i S X X n ==--∑。 如果我们要做双侧检验:0100::μμμμ≠?=H H ,在大样本情况(样本容量30≥n )下可选 n S X Z /0 μ-=为检验统计量,由中心极限定理知,它在0H 成立时近 似服从)1,0(N 。检验的P 值近似为|))(|1(2)| |(20O O z z Z P Φ-==≥μμ,其中检验统计量Z 的观测值为 n s x z O /0 μ-=。 例7.4.1 一种机床加工的零件尺寸绝对平均误差为1.35mm 。生产厂家现采用一种新的 机床进行加工以期降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。50个零件尺寸的绝对误差数据(mm )如下所示: 1.26 1.19 1.31 0.97 1.81 1.13 0.96 1.06 1.00 0.94 0.98 1.10 1.12 1.03 1.16 1.12 1.12 0.95 1.02 1.13 1.23 0.74 1.50 0.50 0.59 0.99 1.45 1.24 1.01 2.03 1.98 1.97 0.91 1.22 1.06 1.11 1.54 1.08 1.10 1.64 1.70 2.37 1.38 1.60 1.26 1.17 1.12 1.23 0.82 0.86 利用这些数据,检验新机床加工的零件尺寸的平均误差是否显著降低?(0.01α=) 解:这里研究者所关心的是新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低,也就是新机床加工的零件尺寸的误差的数学期望μ=)(X E 是否小于1.35,因此属于单左侧检验。提出的假设如下: 0: 1.35H μ≥?1: 1.35H μ< 现在50=n ,检验统计量可选为 )1,0(~/35.135.1N n S X Z =-=μ; 由数据得:215.1=x ,366.0=s ,故检验统计量Z 的观测值为608.250 /366.035 .1215.1-≈-≈O z ,所以检验的P 值近似为 0046.0)608.2()35.1608.2(=-Φ≈=-≤μZ P 。 因为01.0

spss教程第二章均值比较检验与方差分析要点

第二章均值比较检验与方差分析 在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。 ◆本章主要内容: 1、单个总体均值的 t 检验(One-Sample T Test); 2、两个独立总体样本均值的 t 检验(Independent-Sample T Test); 3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test); 4、单因素方差分析(One-Way ANOVA); 5、双因素方差分析(General Linear Model Univariate)。 ◆假设条件:研究的数据服从正态分布或近似地服从正态分布。 在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。如图2.1所示。 图2.1 均值的比较菜单选择项 §2.1 单个总体的t 检验(One-Sample T Test)分析 单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。

例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。 首先建立假设:H0:国有企业工资为10000元; H1:国有企业职工工资不等于10000元 打开数据库SY-2,检验过程的操作按照下列步骤: 1、单击Analyze →Compare Means →One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示。 图2.2 一个样本的t检验的主对话框 2、从左边框中选中需要检验的变量(国有单位)进入检验框中。 3、在Test Value框中键入原假设的均值数10000。 4、单击Options按钮,得到Options对话框(如图2.3),选项分别是置信度(默认项是95%)和缺失值的处理方式。选择后默认值后返回主对话框。 图2.3 一个样本t检验的Options对话框 5、单击OK,得输出结果。如表2.1所示。 表2.1(a).数据的基本统计描述 One-Sample Statistics

上机实验2、样本均值的比较与假设检验

上机实验2、样本均值的比较与假设检验 班级: 12食品转本学号: 12110504 姓名:陈琳琳日期: 一、实验目的: 熟悉应用SPSS统计软件的“比较均值”功能,掌握样本均值比较、单一样本(均值)T检验、独立样本(成组资料均值)T检验、配对样本(配对资料均值)T检验的分析方法。 二、实验内容: (一)样本均值比较分析(house.sav) House.sav 中收集了某城市不同地段的房价和售价数据,利用比较均值的均值分析功能,对房价和售价数据进行分析。 (二)单样本T检验(pulse.sav) 已知某一地区成年男子的脉搏平均数为72次/min,pulse.sav是邻近山区随机抽取的20名健康成年男子的脉搏值而建立的数据文件。根据该数据文件推断该山区成年男子的脉搏平均数是否与该地区成年男子有所不同。 P76,例4-1、4-2。 (三)独立样本T检验(test.sav) test.sav 文件是对某班14名学生(7名男生、7名女生)某次物理考试成绩的汇总数据文件,对其进行独立样本T检验,对结果进行分析。男生和女生的成绩是否存在显著差异? P82,例4-7。 (四)配对样本T检验(tea.sav) tea.sav文件:一种新上市的减肥茶需要做市场调查,对35个消费者进行测试,分别统计35个受

试者服用减肥茶前后的体重数据,形成35个配对数据。按照95%的置信区间,说明减肥茶是否有效果(a=0.01)? P84,例4-8。 三、实验结果 (一)样本均值比较分析(house.sav) (二)单样本T检验(pulse.sav) (三)独立样本T检验(test.sav) (四)配对样本T检验(tea.sav)

均值比较与实验法常用的统计检验

均值比较与实验法常用的统计检验 总结与范例 理论基础: 一、描述性统计与推断性统计 二、抽样分布:样本统计量的分布 三、假设检验的(1)原理(小概率事件反证法),(2)步骤(原假设与备择假设、计算统计量、显著性水平、拒绝或接受原假设、I类错误和II类错误),(3)实用条件(总体正态分布、独立随机抽样、方差齐性)。 四、样本均值的抽样分布—t分布 1.单样本t检验(样本均值与总体均值的差异显著性检验) 例1:医学界测得正常人的每分钟脉搏次数为72,下面是本年度体检时随机抽查的20位电子科大教职工的每分钟脉搏次数,分别为:72,76,68,78,62,59,64,85,70,75,61,74,87,83,54,76,56,66,68,62。请问电子科大教职工的脉搏次数与正常人是否有显著差异? 2.独立样本t检验(实验组\控制组,完全随机分组,被试间设计) 例2:在一项关于反馈对知觉判断(直线长度判断)的影响的研究中,将被试随机分成两组,其中一组20人,每一次知觉判断后将结果告诉被试。另一组20人,每次知觉判断后不将结果告诉被试。测量被试判断线段长度的准确度,并按一定的评分标准打分,分值越高表明长度判断的准确度越高。两组被试的实验得分如下: 反馈组:78 82 83 77 78 81 85 84 86 75 78 86 84 88 75 90 88 70 69 80 不反馈组:74 80 70 65 72 80 66 73 82 83 69 85 66 75 74 78 69 70 71 79 请问给不给反馈会不会显著影响被试的长度判断的准确度? 3.配对样本t检验(重复测量\前后测、匹配\配对组设计、被试内设计) 例3:从某小学三年级随机抽取20名儿童,分别在学期初和学期末进行瑞文推理测验,结果如下: 学生编号 1 2 3 4 5 6 7 8 9 10 学期初12 13 12 11 10 13 14 15 15 11 学期末14 14 11 15 11 14 14 17 15 14 学生编号11 12 13 14 15 16 17 18 19 20 学期初13 12 11 10 13 14 15 15 11 12 学期末14 14 11 15 14 14 16 18 15 14 请问经过一学期的学习,学生的瑞文推理测验成绩是否有显著提高? 五、样本方差的抽样分布—F分布 方差分析(Analysis of Variance, ANOV A) 1.单因素方差分析(事后比较,post hoc)、 例4:喝酒会不会使一个人的认知判断更容易受外界影响呢?Gustafson(1987)设计了一个实验探讨这个问题。在实验中,被试的任务是进行线段长度判断,三十九名被试随机分成三组:其中,第一组被试喝果汁,第二组被试也喝果汁,但告诉他们果汁中加入了一定量的酒,第三组被试依其体重喝一定量的酒。饮用15分钟之后开始进行线段长度判断任务,每个被试进行75次重

总体均值的假设检验

总体均值的假设检验 一、正态总体均值的检验 设n X X X ,, , 21为总体),(2 N 的一个容量为n 的样本. 1.方差2 已知, 的检验——u 检验法. 当2 02 已知时, 假设检验问题:0100 :;:H H . 选择检验统计量n X U /00 ,当0H 成立时,)1,0(~N U . 给定显著性水平 ,由标准正态分布分位点的定义, 有 }|{|2/u U P , 故拒绝域}{}{}|{|2/2/2/ u U u U u U W , 这种利用服从正态分布的检验统计量的检验方法称为u 检验法. 有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值 是小于等于原来的均值0 ,还是大于0 , 即检验假设 0100 :;:H H . 可以证明,在显著性水平 下,上述假设检验问题和 检验假设0100 :;:H H 有相同的拒绝域, 因此,遇到形如00 :H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100 :;:H H 的检验问题, 可归结为检验假设 0100 :;:H H . 这都是单边检验问题.给定显著性水平 ,求得的临界值点是上 分位点或上 1分位点.

例1 某厂生产的某种钢索的断裂强度X 服从),(2 N ,其中 40 (kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值 x 较以往正常生产的 大20(kg/cm 2 ),设总体方差不变,问在1.00 下,能否 认为这批钢索质量有显著提高? 解 依题意,检验假设0100 :;:H H , 由于40 已知,选择检验统计量n X U /0 因为0H 中的 全部都比1H 中的 要小,从直观上看,当0H 成立时,X 的取值 x 不应比 大很多,若偏差0 x 过大,则拒绝0H 而接受1H . 因为 0100 :;:H H 的拒绝域为}{ u U W , 故在显著性水平1.00 下原假设的拒绝域为 }{}{0n u X u U W . 本题中,9 n ,40 ,200 x ,33.201.0 u , 计算U 的值33.25.1/0 n x u 因此在显著性水平1.00 下不能拒绝0H ,即认为这批钢索质量没有显著提高. 2.方差2 未知, 的检验——t 检验法. 检验假设0100 :;:H H . 因为2 未知,而样本方差2S 是总体方差2 的无偏估计量,用S 代替 . 选择检验统计量 n S X T /0 , 当0H 成立时,)1(~ n t T .给定显著性水平 ,由t 分布分位点的定义, 有 )}1(|{|2/n t T P ,

正态总体均值及方差的假设检验表

正态总体均值及方差的假设检验表: 单正态总体均值及方差的假设检验表(显著性水平α) 1 a n ~N (0,1)2 01 a S n ~t 2 2 02 1 0n i n i a ~ 2或 2 21 2 n 2 2n 2 21 n 20 ~ 22 21 1 2 n 2 21n 21 1 n

2 212 12 n n ~N (0,1) 2 1 2 11W S n n ~ 2 , 22 1122 122 n S n S n n 22 22 21112 2 1 2 1i i n i i a a n ~12,F n n 2 或 2 2 221 n S n ~21,1n 1 2或 2

Z =ξ-η~N (a 1-a 2,21σ+2 2σ),Z i =ξi -ηi . 2 21 2 Z n ) 2 1 S n ~ 2

单正态总体均值及方差的区间估计(置信度1-α) 已知 1 a n ~N (0,1)0 1 1 , n n u u n n 1 a S n ~t , 1 1 t t n n 2 02 1 n i n i a ~ 001 122, 12 2 i i i i n n a a 20 ~ 21 ,12 2 n

2个正态总体均值差及方差比的区间估计(置信度1-α) 12 212 12 a n n ~N (0,1) 2212 12 u n n 112 11W a S n n 22 n t 1 22 12 11W n n t S n n )2 a ξ-12 ,1 ,2 2 n n A F A 2 112 222 2 11n S n S ~ 2 2 21112W n S n S n n 212 1212 2 2 1 n i i n i i n a A n a ,2 122 2 21111n n S B n n S . (注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)

spss第五章,两总体均值比较

第5章两总体均值比较 Means:两个总体均值的比较 One samples T Test:单样本T检验 Independent –Samples T Test:独立样本T检验 Paried-Samples T Test:配对样本T检验 One –Way ANOV A:单因素方差分析 5.1单样本T检验 单样本检验是检验样本均值与已知总体均值是否存在差异。统计的前提是样本总体服从正态分布。 spss将自动计算t值(自己理解意思) 例5.1 分析某班级学生高考数学成绩与全国的平均成绩70分之间

是否存在显著性差异。数据如下:85 74 86 95 86 82 75 78 88 86 98 56 64 63 80 ----Analyze----Computer Means----One Sample T Test 红色部分填(输入已知的总体均数------此题在Tset Value中写70) -------点击options后出现如下: exclude case analysis by analysis:带有缺失值的观测值(当它与分析有关时才被剔除,它为默认状态) exclude cases listwise:表示剔除带有缺失值的所有观测值 -------设置置信度,默认95%。------continue -------回到前一个对话框------单击“OK” 结果如表5.1 5.2 独立样本T检验(使用表5.2)

----Analyze----Computer Means----Indenpendent Sample T Test ------如下图选择数据 ------单击“define groups”---并在“Groups 1“中输入“1”在“Groups 2“中输入“2”

均值比较与t检验

第3章均值比较与t检验(t代表平均值间的差距p代表的是可信度) 3.1样本平均数与总体平均数差异显著性检验 在实际工作中,我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体,已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值,比较的目的是推断样本所代表的未知总体均数与已知总体均数有无差别。 例题:已知玉米单交种群单105的平均穗重为300g,喷药后随机抽取9个果穗称重,穗重分别为:308、305、311、298、315、300、321、294、320g,问喷药前后果穗穗重差异是否显著。 具体操作可参看多媒体教程-3.1单一样本t检验,例题中的数据编号为data-01。 操作步骤:Analyze→Compare Means→点击One-Sample T Test,进人对话框→将要分析的变量选入Test Variables→Test Value项填入已知总体均数→点击Options按钮,进入Options子对话框,Confidence Interval选项中填入95或99,确定显著水平后返回上一对话框→点击OK键运行,显示结果界面。 结果界面包括描述性统计量表(One-Sample Statistics) 和t检验表(One-Sample Test)两个表格。描述性统计量表中输出样本含量、均数、标准差和标准误;t检验表中显示t 值(t)自由度(df)、双尾P值(Sig.2-tailed)、样本均数与已知总体均数的差值(Mean Difference)、差

值的95%或99%置信区间的上限与下限(95%Confidence Interval of the Difference,Lower,Upper)。 3.2独立样本t检验 在实际工作中,还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。因试验设计不同,一般可分为:非配对或成组设计两样本平均数的差异显著性检验和配对设计两样本平均数的差异显著性检验。 非配对设计或成组设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的两个样本相互独立,其含量不一定相等。 例题:某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重结果如下,问两种饲料对粤黄鸡的增重效果有无显著差异?

§8.2总体均值的假设检验

§8.2总体均值的假设检验 一、正态总体均值的检验 设n X X X ,,, 21为总体),(2σμN 的一个容量为n 的样本. 1.方差2σ已知,μ的检验——u 检验法. 当2 02σσ=已知时, 假设检验问题:0100μμμμ≠=:;:H H . 选择检验统计量n X U /00 σμ-= ,当0H 成立时,)1,0(~N U . 给定显著性水平α,由标准正态分布分位点的定义, 有αα=>}|{|2/u U P , 故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= , 这种利用服从正态分布的检验统计量的检验方法称为u 检验法. 有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ,还是大于0μ, 即检验假设 0100μμμμ>≤:;:H H . 可以证明,在显著性水平α下,上述假设检验问题和 检验假设0100μμμμ>=:;:H H 有相同的拒绝域, 因此,遇到形如00μμ≤:H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100μμμμ<≥:;:H H 的检验问题, 可归结为检验假设 0100μμμμ<=:;:H H . 这都是单边检验问题.给定显著性水平α,求得的临界值点是上α分位点或上α-1分位点. 例1 某厂生产的某种钢索的断裂强度X 服从),(2σμN ,其中40=σ(kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2),设总体方差不变,问在1.00=α下,能否认为这批钢索质量有显著提高?

均值比较和T检验

Spss16.0与统计数据分析均值比较和T检验 2013年6月13日

均值比较和T 检验 统计分析常常采取抽取样本的方法,即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。但是,由于抽取的样本不一定具有完全代表性,样本统计量与总体参数间存在差异,所以不能完全的说明总体的特性。同时,我们也可以知道,均值不等的两个样本不一定来自均值不同的整体。对于如何避免这些问题,我们自然可以想均值比较和T 检验 1、Means 过程 1.1 Means 过程概述 (1)功能:对数据进行进行分组计算,比较制定变量的描述性统计量包括均值、标准差 、总和、观测量数、方差等一系列单列变量描述性统计量,还可以给出方差分析表和线性检验结果。 (2)计算公式为: n x x n i i ∑==1 11 1.2问题举例: 比较不同性别同学的体重平均值和方差。数据如下表所示: 体重表 1.3用SPSS 操作过程截图:

1.4 结果和讨论 p{color:black;font-family:sans-serif;font-size:10pt;font-weight:normal} Your trial period for SPSS for Windows will expire in 14 days.p{color:0;font -family:Monospaced;font-size:13pt;font-style:normal;font-weight:normal;text-decoration:none} MEANS TABLES=体重 BY 性别 /CELLS MEAN COUNT STDDEV VAR. Means

均数差别比较的t检验

样本均数间的差别原因
均数差别比较的 t检验
z 总体均数不同 z 总体均数相同,差别仅仅由抽样误
差引起
z 一般做法是计算某个统计量(如t
值),然后根据相应的概率作出推 断
t检验(student’s t test)
t检验常用于样本含量较小,并且总 体标准差σ未知时
三种t检验 z 样本均数 X 与已知某总体均数μ0 的比较; z 两组样本均数 X 1 与 X 2 的比较; z 配对设计资料均数的比较。
t检验的应用条件
z 1.当样本含量较小时(n<60),理论上
要求样本为来自正态分布总体的随机 样本; z 2.当做两样本均数比较时,还要求两 总体方差相等(方差齐性,即 σ12=σ22)。 在实际工作中,若上述条件略有偏 离,仍可进行t检验分析。
一、样本均数和总体均数比较的t检验 (one sample t test)
z 目的是推断样本所代表的未知总体
假设检验的独特逻辑
例 : 某病患者20人,其血沉 (mm/h)均数为 9.15,标准差为2.13,问是否该病患者血 沉与以往文献报道的均数10.50有差别?
均数μ与已知总体均数μ0有无差 别。 z 已知的总体均数μ0一般为理论值、 标准值或经过大量观察所得的稳定 值等。 z 条件:当n较小时,要求样本来自于 正态分布总体
x ± t0.05 / 2,19 s / n = 9.15 ± 2.093 × 2.13 / 20 = (8.15,10.15)
1

1.两个假设,决策者在其中作出抉择 该病患者血沉总体均数与10.50无差别, 该病患者血沉总体均数与10.50有差别。 简写 H0:μ=10.50 H1:μ≠10.50 单凭一份样本不可能证明哪一个正确, 一般利用小概率反证法思想,从问题的对 立面出发(H0)间接判断要解决的问题(H1) 是否成立。
H0:μ=10.50
H1:μ≠10.50
μ = 10.50
X
10.50
μ
X
2. H0成立时会怎样? 所得t值因样本而 异,但其绝对值多数情况下落在0附近。 t的分布规律可由t界值表查出
t = | X ? 10 . 50 | | X ? 10 . 50 | = ,ν = n ? 1 s sx n
P值系指在H0成立的假设前提下,出现 当前检验统计量以及更极端情况的概 率。 查表,对于自由度为19的t分布曲线,当 前t值以外的双侧尾部面积 P ( t ≥ 2 . 8345 ) 介于0.01和0.02之间 4.决策 决策者需要事先规定一个可以忽略 的小概率值α。如取0.05,那么上述P值 可认为很小。即H0成立时,几乎不可能 出现当前的状况。
3.当前状况如何,发生的可能性(P值)有 多大?
n=20, X =9.15,S=2.13, μ0 =10.50 得t=2.8345, ν=19
于是,面临两种抉择,一是认为H0是成 立的,而当前情况又恰好偶然发生了; 二是怀疑H0的正确性。通常选择后者。 本例,可认为该病患者血沉总体均数与 10.50有差别。 当然,此时决策者也可能 错误地拒绝H0,通常称之为第Ⅰ类错 误,概率为P。
例 某医生测量了36名从事铅作业男性工人的 血红蛋白含量,算得其均数为130.83g/L,标 准差为25.74g/L。问从事铅作业工人的血红 蛋白是否不同于正常成年男性平均值 140g/L? 1.建立假设。 H0:μ=μ0 ,从事铅作业工人的血红蛋白与 正常成年男性平均值相等。 H1:μ≠μ0,从事铅作业工人的血红蛋白与 正常成年男性平均值不相等。 α=0.05
2

相关主题
文本预览
相关文档 最新文档