01第一节 显著性检验的基本原理
- 格式:doc
- 大小:350.00 KB
- 文档页数:11
1. 显著性检验的的原理是什么?显著性检验的基本步骤是什么?答:显著性检验的原理就是“小概率事件实际不可能性原理”来接受或否定假设。
其基本步骤如下:第一:提出统计假设H 0和H A 。
第二:构造统计量t ,并根据样本资料计算t 值。
第三:根据t 分布的自由度,确定理论临界值t 0.05和t 0.01。
第四:作出判断。
2. 什么是配对法?什么是成组法?两种方法有何区别?答:将起始条件一致的两个试验个体配成对,并设有多个配对,每对个体分别随机地给予不同处理。
则所得的结果即为配对资料。
非配对资料又称成组资料,是指一组数据与另一组数据没有任何关系,也就是说两样本资料是相互独立的,是对两组平均数进行差异显著性检验。
配对法与成组法之间的差别一是在于试验材料的不同,二是检验的方法上的不同。
3答:根据已知条件得:)./(50.4,05.0678.2008.2,911019357.008443.0|50.4421.4|||08443.0102670.0)/(2670.01101021.4409.1961)()/(421.41021.441009.19621.44)/(50.405.001.005.0022220L mg P t t t t t n df S x t nS S L mg n nx xS L mg nx x n x x L mg x x 总体含氧量为即可以认为该鱼塘水中接受无效假设值表得查><===-=-==-=-=====--=--========∑∑∑∑∑μμ4答:01.0638.2989.1822483624766.36702.023.2356.256702.048136147354047.2912875.466114047.2914749.22875.4663565.34735:01.001.005.021212121212222221211212102121<>===-+=-+==-=-==⎪⎭⎫⎝⎛+++=⎪⎪⎭⎫ ⎝⎛+++==⨯===⨯=====--P t t t t n n df S X X t n n df df SS SS S df S SS df S SS df df X X H X X X X拒绝H 0,即8月龄公羊与母羊的体重存在着极显著的差异。
第一节显著性检验的基本原理一、显著性检验的意义为了便于理解,我们结合一个具体例子来说明显著性检验的意义。
随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下:长白:11,11,9,12,10,13,13,8,10,13大白:8,11,12,10,9,8,8,9,10,7经计算,得长白猪10头经产母猪产仔平均数=11头,标准差S1=1。
76头;大白猪10头经产母猪产仔平均数=9。
2头,标准差S2=1.549头。
能否仅凭这两个平均数的差值-=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的.这是因为如果我们再分别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。
由于抽样误差的随机性,两样本平均数就不一定是11头和9。
2头,其差值也不一定是1。
8头。
造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。
对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的.如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。
两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。
这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。
因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体.例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试验研究的目的,就是要给、是否相同做出推断。
由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(—)作为检验对象。
为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:1、离均差的平方和∑(—)2最小.说明样本平均数与样本各个观测值最接近,平均数是资料的代表数.2、样本平均数是总体平均数的无偏估计值,即E()=μ。
显著性判断的基本原理
显著性判断是一种统计推断方法,用于确定两个或多个样本之间的差异是否真实存在。
其基本原理是通过比较观察到的样本差异与预期的随机差异来评估差异的显著性。
在进行显著性判断时,通常会先建立一个原假设(null hypothesis)和一个备择假设(alternative hypothesis)。
原假设通常表明两个样本之间没有差异或差异仅仅是由于随机因素引起的,而备择假设则表明两个样本之间存在真实的差异。
然后,通过收集样本数据并进行统计分析,计算出一个统计量(test statistic),该统计量能够衡量观察到的差异与预期的随机差异之间的差距。
接下来,将该统计量与一个临界值(critical value)进行比较,如果统计量超过了临界值,则可以拒绝原假设,认为观察到的差异是显著的;反之,如果统计量未超过临界值,则不能拒绝原假设,认为观察到的差异不是显著的。
在进行显著性判断时,还需要确定一个显著性水平(significance level),该水平用于确定临界值。
常见的显著性水平为0.05或0.01,表示在5%或1%的显著性水平下,拒绝原假设。
总之,显著性判断的基本原理是通过比较观察到的差异与预期的随机差异,来评估差异的显著性。
显著性检验1、什么是显著性检验显著性检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。
或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。
显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。
抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。
2、显著性检验的含义显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
常把一个要检验的假设记作H0,称为原假设(或零假设)(null hypothesis) ,与H0对立的假设记作H1,称为备择假设(alternative hypothesis) 。
⑴在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作α;⑵在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作β。
通常只限定犯第一类错误的最大概率α,不考虑犯第二类错误的概率β。
这样的假设检验又称为显著性检验,概率α称为显著性水平。
最常用的α值为0.01、0.05、0.10等。
一般情况下,根据研究的问题,如果放弃真错误损失大,为减少这类错误,α取值小些,反之,α取值大些。
3、显著性检验的原理一、无效假设显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。
所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。
经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。
统计4:显著性检验在统计学中,显著性检验是“假设检验”中最常⽤的⼀种,显著性检验是⽤于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。
⼀,假设检验显著性检验是假设检验的⼀种,那什么是假设检验?假设检验就是事先对总体(随机变量)的参数或总体分布形式做出⼀个假设,然后利⽤样本信息来判断这个假设是否合理。
在验证假设的过程中,总是提出两个相互对⽴的假设,把要检验的假设称作原假设,记作H0,把与H0对⽴的假设称作备择假设,记作H1。
假设检验需要解决的问题是:指定⼀个合理的检验法则,利⽤已知样本的数据作出决策,是接受假设H0,还是拒绝假设H0。
1,假设检验的基本思想假设检验的基本思想是⼩概率反证法思想。
⼩概率思想是指⼩概率事件(P<0.01或P<0.05)在⼀次试验中基本上不会发⽣。
反证法思想是先提出原假设(记作假设H0),再⽤适当的统计⽅法确定原假设成⽴的可能性⼤⼩:若可能性⼩,则认为原假设不成⽴;若可能性⼤,则认为原假设是成⽴的。
2,假设检验的思路假设检验思路是:先假设,后检验,通俗地来说就是要先对数据做⼀个假设,然后⽤检验来检查假设对不对。
⼀般⽽⾔,把要检验的假设称之为原假设,记为H0;把与H0相对对⽴(相反)的假设称之为备择假设,记为H1。
如果原假设为真,⽽检验的结论却劝你拒绝原假设,把这种错误称之为第⼀类错误(弃真),通常把第⼀类错误出现的概率记为α;就是说,拒绝真假设的概率是α。
如果原假设不真,⽽检验的结论却劝你接受原假设,把这种错误称之为第⼆类错误(取伪),通常把第⼆类错误出现的概率记为β;就是说,接受假假设的概率是β。
因此,在确定检验法则时,应尽可能使犯这两类错误的概率都较⼩。
⼀般来说,当样本容量固定时,如果减少犯⼀类错误的概率,则犯另⼀类错误的概率往往增⼤。
如果要使犯两类错误的概率都减少,除⾮增加样本容量。
⼆,显著性检验什么是显著性检验?在给定样本容量的情况下,我们总是控制犯第⼀类错误的概率α,这种只对犯第⼀类错误的概率加以控制,⽽不考虑犯第⼆类错误的概率β的检验,称作显著性检验。
关于显著性检验,你想要的都在这⼉了!!(基础篇)⽆论你从事何种领域的科学研究还是统计调查,显著性检验作为判断两个乃⾄多个数据集之间是否存在差异的⽅法被⼴泛应⽤于各个科研领域。
笔者作为科研界⼀名新⼈也曾经在显著性检验⽅⾯吃过许多苦头。
后来醉⼼于统计理论半载有余才摸到显著性检验的⽪⽑,也为显著性检验理论之精妙,品种之繁多,逻辑之严谨所折服。
在此,特写下这篇博⽂,以供那些仍然挣扎在显著性检验泥潭的⾮统计专业的科研界同僚们参考。
由于笔者本⼈也并⾮统计专业毕业,所持观点粗陋浅鄙,贻笑⼤⽅之处还望诸位业界前辈,领域翘楚不吝赐教。
⼩可在此谢过诸位看官了。
本篇博⽂致⼒于解决⼀下⼏点问题,在此罗列出来:1.什么是显著性检验? 2.为什么要做显著性检验? 3.怎么做显著性检验?下⾯就请跟随笔者的步伐⼀步步⾛⼊显著性检验的“前世与今⽣”。
⼀:显著性检验前传:什么是显著性检验?它与统计假设检验有什么关系?为什么要做显著性检验?“显著性检验”实际上是英⽂significance test的汉语译名。
在统计学中,显著性检验是“统计假设检验”(Statistical hypothesis testing)的⼀种,显著性检验是⽤于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。
实际上,了解显著性检验的“宗门背景”(统计假设检验)更有助于⼀个科研新⼿理解显著性检验。
“统计假设检验”这⼀正名实际上指出了“显著性检验”的前提条件是“统计假设”,换⾔之“⽆假设,不检验”。
任何⼈在使⽤显著性检验之前必须在⼼⾥明⽩⾃⼰的科研假设是什么,否则显著性检验就是“⽔中⽉,镜中花”,可望⽽不可即。
⽤更通俗的话来说就是要先对科研数据做⼀个假设,然后⽤检验来检查假设对不对。
⼀般⽽⾔,把要检验的假设称之为原假设,记为H0;把与H0相对应(相反)的假设称之为备择假设,记为H1。
如果原假设为真,⽽检验的结论却劝你放弃原假设。
此时,我们把这种错误称之为第⼀类错误。
54. 统计学中的显著性检验如何运作?54、统计学中的显著性检验如何运作?在我们的日常生活和各种研究领域中,统计学扮演着至关重要的角色。
而其中的显著性检验更是帮助我们做出决策、判断结论是否可靠的有力工具。
那么,显著性检验到底是如何运作的呢?让我们一起来揭开它神秘的面纱。
首先,我们要明白什么是显著性检验。
简单来说,它是一种用于判断样本数据所反映的情况是否能够代表总体的方法。
比如说,我们想知道一种新药物是否真的比旧药物更有效,或者想知道某个地区的平均收入是否发生了显著变化,这时候就需要用到显著性检验。
为了更好地理解显著性检验,我们先来了解几个重要的概念。
第一个是假设。
在进行显著性检验时,我们会提出两个相互对立的假设:原假设(H₀)和备择假设(H₁)。
原假设通常是我们想要推翻的假设,比如“新药物和旧药物的疗效没有差异”;备择假设则是我们希望证明的假设,比如“新药物的疗效优于旧药物”。
第二个是检验统计量。
这是根据样本数据计算出来的一个数值,它的作用是衡量样本与原假设之间的差异程度。
不同的情况会有不同的检验统计量,常见的有 t 统计量、z 统计量等。
第三个是显著性水平(α)。
这是我们事先设定的一个阈值,用于判断检验结果是否显著。
通常,显著性水平取 005 或 001 等。
如果计算出来的 p 值小于显著性水平,我们就拒绝原假设;否则,我们就不能拒绝原假设。
那么,显著性检验具体是怎么操作的呢?假设我们要比较两个班级学生的数学成绩是否有显著差异。
首先,我们提出原假设 H₀:两个班级的数学平均成绩相同;备择假设 H₁:两个班级的数学平均成绩不同。
然后,我们从两个班级中分别抽取一定数量的学生作为样本,计算出样本的均值、标准差等统计量。
接着,根据这些数据计算出检验统计量(比如 t 统计量)。
再然后,根据检验统计量和相应的分布(比如 t 分布),计算出 p 值。
p 值表示在原假设成立的情况下,得到当前样本结果或者更极端结果的概率。
报告中的统计推断与显著性检验统计推断与显著性检验的应用范围相当广泛,不仅在学术研究中扮演重要角色,也在商业决策、医学研究、社会调查等多个领域发挥着关键作用。
本文将从六个方面进行论述,分别是:统计推断的基本原理、显著性检验的概念与应用、误差水平与显著性水平的关系、统计推断的类型、常见的显著性检验方法和统计推断的应用案例。
1. 统计推断的基本原理:统计推断是通过从部分数据得出全体总体的结论。
其基本原理是利用样本数据推断总体特性,并对推断结果的准确性进行估计。
统计推断常用的方法有点估计和区间估计。
2. 显著性检验的概念与应用:显著性检验是一种通过对样本数据进行统计检验来判断样本是否代表总体的方法。
显著性检验主要用于判断样本均值是否与总体均值有显著差异,以及两个样本均值是否有显著差异。
3. 误差水平与显著性水平的关系:误差水平是指在一个显著性检验中,我们能够接受一种错误结果的程度。
而显著性水平则是指拒绝原假设的程度。
两者直接相关,误差水平越小,显著性水平越高。
4. 统计推断的类型:统计推断可以分为两种类型,即参数估计和假设检验。
参数估计是通过样本数据来估计总体参数的值,常见的方法有点估计和区间估计。
假设检验则是通过对样本数据进行统计检验来判断总体参数是否符合某种假设。
5. 常见的显著性检验方法:常见的显著性检验方法包括单样本t检验、配对样本t检验、独立样本t检验、方差分析、卡方检验等。
每种方法都有其适用的场景和假设条件,研究者需要根据具体情况选择合适的方法。
6. 统计推断的应用案例:统计推断在各个领域都有重要的应用。
例如,在医学研究中,可以通过统计推断来评估新药的疗效;在社会调查中,可以利用统计推断来推断整体人口的特征。
通过具体的实例,展示统计推断在不同领域中的应用和意义。
综上所述,统计推断与显著性检验是现代数据分析中不可或缺的工具,它们为我们从样本数据中引出与总体相关的结论提供了有力支持。
熟练掌握统计推断和显著性检验的原理与方法,将有助于我们更准确地理解实际问题,并做出科学合理的决策。
第一节显著性检验的基本原理一、显著性检验的意义为了便于理解,我们结合一个具体例子来说明显著性检验的意义。
随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下:长白:11,11,9,12,10,13,13,8,10,13大白:8,11,12,10,9,8,8,9,10,7经计算,得长白猪10头经产母猪产仔平均数=11头,标准差S1=1.76头;大白猪10头经产母猪产仔平均数=9.2头,标准差S2=1.549头。
能否仅凭这两个平均数的差值-=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。
这是因为如果我们再分别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。
由于抽样误差的随机性,两样本平均数就不一定是11头和9.2头,其差值也不一定是1.8头。
造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。
对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。
如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。
两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。
这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。
因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体。
例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试验研究的目的,就是要给、是否相同做出推断。
由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。
为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:1、离均差的平方和∑(-)2最小。
说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。
2、样本平均数是总体平均数的无偏估计值,即E()=μ。
3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。
所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。
由上所述,一方面我们有依据由样本平均数和的差异来推断总体平均数、相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。
若对样本观测值的数据结构作一简单剖析,就可更清楚地看到这一点。
通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。
所以观测值由两部分组成,即= +。
总体平均数反映了总体特征,表示误差。
若样本含量为,则可得到个观测值:,,,。
于是样本平均数===+。
说明样本平均数并非总体平均数,它还包含试验误差的成分。
对于接受不同处理的两个样本来说,则有:=+,=+。
这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫做试验的处理效应(treatmenteffect);另一部分是试验误差(-)。
也就是说样本平均数的差(-)包含有试验误差,它只是试验的表面效应。
因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。
只有通过显著性检验才能从(-)中提取结论。
对(-)进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。
虽然处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。
所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。
为了通过样本对其所在的总体作出符合实际的推断,要求合理进行试验设计,准确地进行试验与观察记载,尽量降低试验误差,避免系统误差,使样本尽可能代表总体。
只有从正确、完整而又足够的资料中才能获得可靠的结论。
若资料中包含有较大的试验误差与系统误差,有许多遗漏、缺失甚至错误,再好的统计方法也无济于事。
因此,收集到正确、完整而又足够的资料是通过显著性检验获得可靠结论的基本前提。
二、显著性检验的基本步骤仍以前面所举实例说明显著性检验的基本步骤。
(一)首先对试验样本所在的总体作假设这里假设=或-=0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:-=1.8头是试验误差,处理无效,这种假设称为无效假设(nullhypothesis),记作:=或-=0。
无效假设是被检验的假设,通过检验可能被接受,也可能被否定。
提出:=或-=0的同时,相应地提出一对应假设,称为备择假设(alternativehypothesis),记作。
备择假设是在无效假设被否定时准备接受的假设。
本例的备择假设是:≠或-≠0,即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数与不相等或与之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。
(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率对于上述例子,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。
经统计学研究,得到一个统计量t:其中=叫做均数差异标准误;、为两样本的含量。
所得的统计量t服从自由度df=(-1)+(-1)的分布。
根据两个样本的数据,计算得:-=11-9.2=1.8;===0.742==2.426我们需进一步估计出|t|≥2.426的两尾概率,即估计P(|t|≥2.426)是多少?查附表3,在df=(-1)+(-1)=(10-1)+(10-1)=18时,两尾概率为0.05的临界值:=2.101,两尾概率为0.01的临界t值:=2.878,即:P(|t|>2.101)=P(t>2.101)+P(t<-2.101)=0.05P(|t|>2.878)=P(t>2.878)+P(t<-2.878)=0.01由于根据两样本数据计算所得的t值为2.426,介于两个临界t值之间,即:t0.05<2.426<t0.01所以,|t|≥2.426的概率P介于0.01和0.05之间,即:0.01<P<0.05。
如图5-1所示,说明无效假设成立的可能性,即试验的表面效应为试验误差的可能性在0.01─0.05之间。
(三)根据“小概率事件实际不可能性原理”否定或接受无效假设上章曾论及:若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。
根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设:=,接受备择假设:≠,即认为:试验的处理效应是存在的。
当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设:=成立的可能性大,不能被否定,因而也就不能接受备择假设:≠。
本例中,按所建立的:=,试验的表面效应是试验误差的概率在0.01─0.05之间,小于0.05,故有理由否定:=,从而接受:≠。
可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数和不相同。
综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。
对于各种显著性检验的方法,除明确其应用条件,掌握有关统计运算方法外,正确的统计推断是不可忽视的。
三、显著水平与两种类型的错误在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。
用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作。
在生物学研究中常取=0.05或=0.01。
对于上述例子所用的检验方法(t检验)来说,若|t|<,则说明试验的表面效应属于试验误差的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数与差异不显著”,在计算所得的t值的右上方标记“”或不标记符号;若≤|t|<,则说明试验的表面效应属于试验误差的概率P在0.01—0.05之间,即0.01<P0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异显著”,在计算所得的t值的右上方标记“*”;若|t|≥,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异极显著”,在计算所得的t值的右上方标记“**”。
这里可以看到,是否否定无效假设:=,是用实际计算出的检验统计量t 的绝对值与显著水平对应的临界t值比较。
若|t|≥,则在水平上否定:=;若|t|<,则不能在水平上否定:=。
区间和称为水平上的否定域,而区间(-,)则称为水平上的接受域。
假设检验时选用的显著水平,除=0.05和0.01为常用外,也可选=0.10或=0.001等等。
到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。
如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即值取大些。
反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即值应该小些。
显著水平对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。
因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。
也就是说,在检验无效假设时可能犯两类错误。
第一类错误是真实情况为成立,却否定了它,犯了“弃真”错误,也叫Ⅰ型错误(typeⅠerror)。
Ⅰ型错误,就是把非真实差异错判为真实差异,即:=为真,却接受了:≠。
第二类错误是不成立,却接受了它,犯了“纳伪”错误,也叫Ⅱ型错误(typeⅡerror)。
Ⅱ型错误,就是把真实差异错判为非真实差异,即:≠为真,却未能否定:=。
我们是基于“小概率事件实际不可能性原理”来否定,但在一次试验中小概率事件并不是绝对不会发生的。
如果我们抽得一个样本,它虽然来自与对应的抽样总体,但计算所得的统计量t却落入了否定域中,因而否定了,于是犯了Ⅰ型错误。
但犯这类错误的概率不会超过。
Ⅱ型错误发生的原因可以用图5-2来说明。