假设检验——非参数检验
- 格式:doc
- 大小:402.00 KB
- 文档页数:15
参数检验和非参数检验参数检验和非参数检验是统计学中两种常用的假设检验方法。
参数检验假设总体服从其中一种特定的概率分布,而非参数检验则不对总体的概率分布进行特定的假设。
本文将分析和比较这两种假设检验方法,并讨论它们的优缺点和适用范围。
参数检验的基本思想是假设总体的概率分布属于一些已知的参数化分布族,例如正态分布或泊松分布。
然后根据样本数据计算出统计量的观察值,并基于它们进行假设检验。
常见的参数检验方法有t检验、F检验和卡方检验等。
以t检验为例,它适用于研究两个样本均值之间是否存在显著差异的情况。
假设我们有两组样本数据,分别服从正态分布。
可以使用t检验来计算两组样本均值的差异是否显著。
t检验基于样本均值和标准差来估计总体均值的差异,并通过计算t值和查表或计算p值来判断差异是否显著。
参数检验的优点是它们对总体概率分布的假设比较明确,计算方法相对简单,适用于数据符合特定分布的情况。
此外,参数检验通常具有较好的效率和统计性质。
然而,参数检验也有一些限制和缺点。
首先,参数检验通常对数据的分布假设要求较高,如果数据不符合指定的分布假设,则结果可能不可靠。
另外,参数检验对样本大小的要求较高,需要较大的样本才能获得可靠的检验结果。
此外,参数检验对异常值和离群值比较敏感,这可能会导致统计结论的错误。
与参数检验相比,非参数检验更加灵活,不需要对总体的概率分布做出特定的假设。
它适用于更广泛的数据类型和样本分布。
常见的非参数检验方法有Wilcoxon符号秩检验、Mann-Whitney U检验和Kruskal-Wallis检验等。
以Wilcoxon符号秩检验为例,它适用于比较两个相关样本的差异。
这个检验不要求样本数据满足正态分布的假设,它基于样本差值的秩次来判断差异是否显著。
非参数检验的优点在于其适用范围广泛,不需要对总体分布做出特定假设,对数据平均性和对称性的要求较低,对异常值和离群值的鲁棒性较好。
此外,非参数检验对样本大小的要求较低,可以在较小的样本情况下获得可靠的结果。
非参数检验的检验方法非参数检验是一种假设检验的方法,它不依赖于总体分布的具体形式,而是基于样本数据进行推断。
相比于参数检验,非参数检验更加灵活和普适,可以适用于更广泛的情况。
非参数检验的主要思想是通过对样本数据的排序或者秩次变换,来推断总体的性质。
下面将介绍几种常见的非参数检验方法:1. Mann-Whitney U检验(又称Wilcoxon秩和检验):Mann-Whitney U检验用于比较两个独立样本的总体中位数是否相等。
它的基本思想是将两组样本的数据合并,按照从小到大的顺序进行排列,并为每个值分配一个秩次。
然后计算两组数据秩次和之差的绝对值,该值即为检验统计量U,根据U的大小可以进行推断。
2. Kruskal-Wallis H检验:Kruskal-Wallis H检验用于比较多个独立样本的总体中位数是否相等。
它的基本思想是将所有样本的数据合并,按照从小到大的顺序进行排列,并为每个值分配一个秩次。
然后计算每个样本的秩次和,以及总体的秩次和。
根据这些秩次和的差异来进行推断。
3. 秩和检验:秩和检验是一类常见的非参数检验方法,包括Wilcoxon符号秩检验和符号秩和检验。
这两种方法都是用来比较两个相关样本的总体中位数是否相等。
基本思想是将两个样本的差的符号进行标记,并用秩次表示绝对值大小的顺序。
然后根据秩次和的大小来进行推断。
4. Friedman检验:Friedman检验用于比较多个相关样本的总体中位数是否相等。
它的基本思想是将所有样本的数据进行秩次变换,并计算每个样本的秩次和。
然后根据秩次和的差异来进行推断。
在进行非参数检验时,需要注意以下几点:1. 样本独立性:非参数检验通常要求样本之间是独立的,即样本之间的观测值不受其他样本观测值的影响。
如果样本之间存在相关性,应考虑使用相关性检验或者非参数检验的相关版本。
2. 样本大小:非参数检验对样本的大小没有严格要求,但样本大小较小时可能会影响检验的统计功效。
非参数假设检验方法
非参数假设检验方法,那可真是个超棒的统计利器!咱先说说它的步骤吧。
嘿,你想想看,就像搭积木一样,第一步得先明确问题,确定咱要检验啥。
然后收集数据,这数据就像是建筑材料,得好好收集。
接着计算检验统计量,这就如同给积木搭出形状。
最后根据统计量判断是否拒绝原假设。
这步骤简单易懂吧?
注意事项也不少呢!数据得有代表性,不然就像盖房子用了劣质材料,那可不行。
样本量也不能太小,不然就像小娃娃搭的积木城堡,风一吹就倒啦。
说到安全性和稳定性,那可是杠杠的!它不像有些方法那么娇气,对数据的分布要求不高。
就好比一辆越野车,能在各种路况下行驶,不用担心路况不好就抛锚。
应用场景那可多了去啦!当数据不满足参数检验的条件时,非参数假设检验方法就大显身手啦。
比如研究不同年龄段的人对某种产品的喜好,数据可能乱七八糟的,这时候非参数检验就像救星一样。
它的优势也很明显啊,操作简单,容易理解,不需要太多高深的数学知识。
就像玩游戏,不需要看厚厚的说明书就能上手。
给你举个实际案例吧。
有个公司想知道新推出的广告有没有效果,就用了非参数假设检验方法。
结果发现广告确实提高了产品的知名度。
这效果,哇塞,杠杠的!
非参数假设检验方法就是这么牛!它简单易用,安全稳定,应用场景广泛,优势明显。
赶紧用起来吧!。
假设检验(二)——非参数检验假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。
上一节我们所介绍的Z 检验、t 检验,都是参数检验。
它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。
参数检验就是要通过样本统计量去推断或估计总体参数。
然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。
这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。
非参数检验是通过检验总体分布情况来实现对总体参数的推断。
非参数检验法与参数检验法相比,特点可以归纳如下:(1)非参数检验一般不需要严格的前提假设;(2)非参数检验特别适用于顺序资料;(3)非参数检验很适用于小样本,并且计算简单;(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息;(5 )非参数检验法目前还不能用于处理因素间的交互作用。
非参数检验的方法很多,分别适用于各种特点的资料。
本节将介绍几种常用的非参数检验方法。
一.2检验2检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。
22检验的方法主要包括适合性检验和独立性检验。
(一)2检验概述2是实得数据与理论数据偏离程度的指标。
其基本公式为:2 ( f0 f e)(公式11—9)fe式中,f0 为实际观察次数,f e 为理论次数。
分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。
观察公式可发现,如果实际观察次数与理论次数的差异越小, 2值也就越小。
当 f 0 与 f e 完全相同时,2值为零。
际次数与理论次数之差的大小而变化利用2值去检验实际观察次数与理论次数的差异是否显著的方法称为2检验有两个主要的作第一,可以用来检验各种实际次数与理论次数是否吻合的这类问题统称为适合性检验; 第二, 判断计数的两组或多组资料是否相互关联还是相互独立的问 题,这类问题统称为独立性检验。
非参数检验非参数检验是一种统计方法,用于比较两组或多组数据的差异或关联性,它并不依赖于数据的分布假设。
相比于参数检验,非参数检验通常更为灵活,可应用于各种数据类型和样本量,尤其在数据不满足正态分布的情况下表现优势。
本文旨在介绍非参数检验的基本原理、应用领域以及常见方法。
首先,非参数检验的基本原理是依赖于样本中的秩次,即将原始数据转化为秩次数据进行统计分析。
秩次是数据在全体中的相对位置,将数据转化为秩次可以消除异常值对统计结果的影响,并使数据的分布不再成为限制因素。
非参数检验的应用领域广泛,包括但不限于以下几个方面。
一、假设检验非参数检验可用于假设检验,比如检验两组样本的中位数是否存在差异。
常见的方法有Wilcoxon符号秩检验、Mann-Whitney U检验等。
在实际应用中,如果数据的分布无法满足正态分布假设,非参数检验则是一种理想的选择。
二、相关性分析非参数检验可用于判断两个变量之间的关联性。
常见的方法有Spearman秩相关系数检验、Kendall秩相关系数检验等。
这些方法的核心思想是将原始数据转化为秩次数据,通过秩次数据之间的比较来判断两个变量之间是否存在显著相关。
三、分组比较非参数检验可用于比较多个样本之间的差异。
常见的方法有Kruskal-Wallis检验、Friedman检验等。
这些方法可用于比较三个以上的样本组之间的差异,而不依赖于数据的分布假设。
在实际应用中,非参数检验需要注意以下几个问题。
一、样本容量非参数检验对样本容量的要求相对较低,适用于小样本和大样本。
然而,在样本容量较小的情况下,非参数检验可能会产生较大的误差,因此应根据实际情况选择合适的方法。
二、数据类型非参数检验可应用于各种数据类型,包括连续型数据和离散型数据。
但对于有序分类数据、定序数据和名义数据,非参数检验相较于参数检验有更好的适用性。
三、分布假设非参数检验不需要对数据的分布做出假设,这使得它更加灵活。
但是,如果数据满足正态分布假设,参数检验也是一种较为有效的选择。
16种常用的数据分析方法汇总2015—11-10 分类:数据分析评论(0)经常会有朋友问到一个朋友,数据分析常用的分析方法有哪些,我需要学习哪个等等之类的问题,今天数据分析精选给大家整理了十六种常用的数据分析方法,供大家参考学习。
一、描述统计描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。
1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。
2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。
常用方法:非参数检验的K—量检验、P—P图、Q-Q图、W检验、动差法。
二、假设检验1、参数检验参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。
1)U验使用条件:当样本含量n较大时,样本值符合正态分布2)T检验使用条件:当样本含量n较小时,样本值符合正态分布A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别;B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用.2、非参数检验非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。
适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。
A 虽然是连续数据,但总体分布形态未知或者非正态;B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K—量检验等。
三、信度分析检査测量的可信度,例如调查问卷的真实性.分类:1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。
非参数统计方法在假设检验中的应用研究论文素材一、引言假设检验是统计学中一种重要的分析方法,用于根据样本数据推断总体参数的性质。
传统的假设检验通常基于参数统计方法,即假设总体参数服从某种特定的概率分布。
然而,在实际应用中,往往无法确定总体分布的具体形式,这时就需要使用非参数统计方法。
本文旨在探讨非参数统计方法在假设检验中的应用,并提供相应的研究素材。
二、非参数统计方法概述非参数统计方法是指不对总体参数做任何假设的统计方法。
它的优势在于不依赖具体的分布假设,因此更加灵活,适用范围更广。
非参数统计方法主要包括秩和检验、分布自由度检验和重抽样检验等。
1. 秩和检验秩和检验是非参数统计方法中常用的一种方法,适用于两组或多组独立样本的比较。
该方法将观测值按照大小排列,通过比较秩和的大小来进行假设检验。
常见的秩和检验包括Wilcoxon秩和检验和Mann-Whitney U检验。
2. 分布自由度检验分布自由度检验是一种非参数的拟合优度检验方法,用于检验观测数据与某个理论分布是否一致。
该方法基于观测数据的经验分布函数,通过计算观测数据的累积概率与理论分布的累积概率之间的差异来进行假设检验。
3. 重抽样检验重抽样检验是一种基于数据重抽样的非参数统计方法。
常见的重抽样检验包括Bootstrap方法和Permutation方法。
Bootstrap方法通过随机抽样产生重复样本,从而估计总体参数的分布。
Permutation方法则通过对样本数据的重新排列来进行假设检验。
三、非参数统计方法的应用研究素材1. 秩和检验的应用研究文献1:Smith, J. et al. (2015). "A Comparative Study of Nonparametric Rank Tests for Gene Differential Expression Analysis." Journal of Biometrics, 30(4), 123-135.该研究通过比较不同的秩和检验方法在基因差异表达分析中的应用效果,探讨了不同方法的优缺点并给出了相应的建议。
非参数检验的名词解释
非参数检验是一种统计方法,用于在数据不满足正态分布或其他假设条件的情况下进行统计推断。
与参数检验相比,非参数检验不需要对总体参数做出假设,而是直接利用样本数据进行推断。
以下是相关名词解释:
1. 非参数:指在进行统计推断时,不对总体的分布形式或参数做出特定的假设。
非参数方法依赖于具体的样本数据,不依赖于总体的分布特征。
2. 假设检验:统计推断的一种方法,用于通过对样本数据进行分析来得出关于总体参数或总体分布的结论。
假设检验通常涉及对某个假设的拒绝或接受。
3. 正态分布:也称为高斯分布,是一种连续概率分布,常用于描述许多自然现象和随机变量的分布。
参数检验通常基于对总体数据服从正态分布的假设。
4. 参数检验:通过对总体参数的估计和假设进行统计推断的
方法。
参数检验通常要求数据满足特定的假设条件,如正态分布、独立性和方差齐性等。
5. 统计显著性:在假设检验中,用于评估观察到的差异或效应是否显著。
统计显著性通常以p值表示,若p值小于预设的显著性水平(如0.05),则可以拒绝零假设。
非参数检验在实际应用中具有灵活性和广泛适用性,特别适合处理样本数据不满足假设条件的情况。
它们不依赖于总体分布的形式,因此更加鲁棒,并可以应用于各种类型的数据集。
§ 7.4 非参数假设检验在§7.2中讨论了母体分布类型为已知时的参数假设检验问题.一般在进行参数假设检验之前,需要对母体的分布进行推断.本节将讨论母体分布的假设检验问题.因为所用的方法适用于任何分布或者仅有微弱假定分布,实质上是不依赖于分布的.在数理统计学中不依赖于分布的统计方法统称为非参数统计方法.这里所讨论的问题就是非参数假设检验问题.这里所研究的检验是如何用子样去似全母体分布,所以又称为分布拟合扰度检验,一般有两种:一是拟合母体的分布函数;另一是拟合母体分布的概率函数.这里我们只介绍三种检验方法:概率图纸法. 2χ-拟合优度检验和柯尔莫哥洛夫斯米尔诺夫检验.一, 概率图纸法这是一种比较直观和简便的检验方法.它适合于在现场使用.目前常见的概率图纸有正态,对数正态,二项分布,指数分布和威布尔分布概率图纸等.这里我们只介绍正态概率图纸,关于其它分布的概率图纸的构造原理和使用方法都是类似的1. 正态概率图纸的构造原理设母体ξ有分布函数F(x),{N(μ,2σ)}表示正态分布族.需要检验假设)},({)(:20σμN x F H ∈这里μ和2σ均为未知常数.在原假设0H 为真时,通过中心化变换)(2121)(22)(222σμπσπσμμσμ-Φ===⎰⎰-∞--∞---x du edt ex F x xt即σμξξμ-=)(服从正态N(0,1).函数u(x)是x 的线性函数. σμξξμ-=)( (7.13) 在(x,u(x))直角坐标平面上是一条直线.这条直线过(μ,0),且斜率为σ1. 2. 检验步骤.事实上,我们知道的不是母体ξ取出的一组子样观察值n x x ,,1 由格里汶科定理知道子样的经验分布函数)(x F n 依概率收剑于母体分布函数F(x).所以在检验母分体布函数F(x)是否属于正态分布族时,我们以大子样的经验分布函数)(x F n 作为母体分布的近似.若0H :F(x) ∈{N(μ,2σ)}为真,那末点,,,1)),(,(n i x F x i i =在正态概率图纸上应该在一条直线上.所以根据上述经验分布函数)(x F n 是母体分布函数F(x)很好的近似,点,,,1)),(,(n i x F x i i =在正态概率图纸上也应该近似地在一条直线附近.倘若点列)),(,(i i x F x 不是近似地在一条直线附近,那末只能说明F(x)不属于正态分布族.根据上述想法,用正态概率图纸去检验假设0H 的具体步骤如下.(1) 整理数据 (2) 描点(3) 目测这些点的位置, 3. 未知参数μ与2σ的估计.若通过概率图纸检验已经知道母体服从正态分布,我们就凭目测在概率图纸上画出最靠近各点,,,1)),(,()()(n i x F x i n i =的一条直线l,因为σμξξμ-=)(服从正态N(0,1),所以当0)(=-=σμξμx ,即x=μ时对应的概率F=0.5.因此,只要在概率图纸上面一条F=0.5的水平直线.这条直线与直线l 的交点的横坐标5.0x 就可以作为参数为μ的估计.又由μ(x)=1时所对应的概率F=0.8413的水平直线,这条直线与直线l 的交点的横坐标为8413.0x .这个8413.0x 显然满足18413.08413.0=-=σμμx 即μσ-=8413.0x 因此可以用差5.08413.0x x -估计σ.例 7.8 (略)见P 338 二, 2χ的似体检验法前面介绍了直观而简便的概率图纸法,它不需要很多计算就能对母体分布族作出一个统计推断,并且还能对分布所含的参数作出估计.但是这种方法因人而异,且精度不高,又不能控制犯错误的概率.这里介绍2χ-拟合检验法,它能够像各种显著性检验一样控制犯第一类错误的概率.设母体ξ的分布函数为具有明确表达式的F(x),.我们把随机变量ξ的值域R 分成k 个互不相容的区间[][][]k k k a a A a a A a a A ,,,,,,1212101-=== 这些区间不一定有相同的长度.设n x x ,,1 是容量为n 的子样的一组观测值.i n 为子样观测值n x x ,,1 中落入i A 的频数.n n ni i =∑=1在这n 次事件i A 出现的频率为nn i. 我们现在检验原假设)()(:00x F x F H =.设在原假设0H 成立下,母体ξ落入区间i A 的概率为i P ,即k i a F a F A P P i i i i ,1),()()(100=-==- (7.14)此时n 个观察值中,恰有1n 个值落入1A 内,2n 的观察值落入2A 内,k n 个观察值落入k A 内的概率为k n n n n k P P P n n n n 212121!!!!这是一个多项分布.按大数定理,在0H 为真时,频率nn i与概率i P 的差异不应太大.根据这个思想构造一个统计量2χ=∑=-ki i i i nP nP n 12)( (7.15)称做2χ-统计量.往后可以看到,用2χ表示这一统计量不是没有原因的.因为它的极限分布就是自由度为k-1的2χ-分布.为了能够把2χ-统计量用来作检验的统计量,我们必须知道它的抽样分布.我们先k=2的简单情形.在0H 成立下,221)(,)(P A P P A P i ==其中121=+P P这时,频数n n n =+21我们考察222212112)()(nP nP n nP nP n -+-=χ (7.16) 令222111,nP n Y nP n Y -=-= (7.17)显然0)(212121=+-+=+P P n n n Y Y (7.18)由此可见1Y 与2Y 不是线性独立,且21Y Y -=.于是21212221212P nP Y nP Y nP Y =+=χ 21111)1(⎥⎥⎦⎤⎢⎢⎣⎡--P nP nP n (7.19) 根据德莫弗-拉普拉斯极限定理,当n 充分大时,随机变量)1(1111P nP nP n --的分布是接近于正态的,从而推得k=2情形的分布,当n 充分大时,是接近于自由度为1的2χ-分布.对于一般情形有如下的定理.定理 7.1 当0H 为真时,即k P P ,,1 为母体的真实概率时,由(7.15)式所定义的统计量2χ的渐近分布是自由度为k-1的2χ-分布,即密度函数为⎪⎪⎩⎪⎪⎨⎧⎪⎭⎫ ⎝⎛-Γ=---,0,2121)(22321xk k e x k x f (7.20) 证 因为在n 个观测值中恰有1n 个观测值落入1A 内, 2n 的观察值落入2A 内,k n 个观察值落入k A 内的概率为k n n n n k P P P n n n n 212121!!!!这里n n n n k =+++ 21.其特征函数nk j it jk je P t t ⎪⎪⎭⎫⎝⎛=∑=112),,( ϕ (7.21) 令k j nP nP n Y jjj j ,2,1, =-=(7.22)于是有∑∑===-=kj j kj jj j Y nP nP n 12122)(χ (7.23)和∑=kj j jP Y1=0 (7.24)由此式看出,诸随机变量j Y 不是线性独立的.(k Y Y ,,1 )的联合分布的特征函数具有形状2111exp exp ),,(⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛•⎪⎪⎭⎫ ⎝⎛-=∑∑==kj j j j kj j jk nPit P nP it t t ϕ (7.25) 两边取对数得⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛+-=∑∑==k j j jj kj j jn nP it P n P t n i t t 111exp ln ),,(ln ϕ (7.26) 利用指数数函和对数函在0=j t 处的泰勒展开:⎪⎭⎫ ⎝⎛+-=-⎥⎥⎦⎤⎢⎢⎣⎡n nP t nP it np it j jj j jj 121exp 2ο和)(2)1ln(22x x x x ο+-=+于是)1(21211211ln ),,(ln 11212111211οοϕ+⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--+-=⎪⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+-++-=∑∑∑∑∑∑∑=======k j k j k j j j j j j k j j j k j k j j j j kj j jk P t n i t n P t n i n P t n i n t n P t n i n P t n i t t当∞→n 时⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--→∑∑==k j kj j j j k P t t t t 1212121),,(ln ϕ 即⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--=∑∑==∞→k j k j j j j k n P t t t t 1212121exp ),,(lim ϕ (7.26) 作一正交变换:⎪⎪⎩⎪⎪⎨⎧=-==∑∑==kj j k j kj lj l Y P Z k l Y a Z 111,,1, (7.27) 其中lj a 应该满足1,,1,,0,11-=⎩⎨⎧≠==⋅∑=k r l r l r l a a kj rjlj 和1,,1,01-==∑=k l P akj j lj由⎪⎪⎩⎪⎪⎨⎧=-==∑∑==kj j j k kj y ij l t P u k l t a u 111,1, (7.28) 得到∑∑∑-====⎪⎪⎭⎫ ⎝⎛-1122112k j j kj i k j j j u P t t (7.29) 由(7.26)知,当∞→n 时,(k Z Z ,,1 )的特征函数⎭⎬⎫⎩⎨⎧-=∑-=∞→112121exp ),,(lim k j j k n u u u ϕ.这意味着11,,-k Z Z 的分布弱收剑于相互独立的正态N(0,1)分布,而k Z 依概率收剑于0.因此∑∑====kj j k j j Z Y 12122χ的渐近分布是自由度为k-1的2χ-分布.如果原假设0H 只确定母体分布类型,而分布中还含有未知参数m θθ,,1 则我们还不能用定理7.1来作为检验的理论依据.费歇证明了如下定理.从而解决了含未知参数情形的分布检验问题.定理 7.2 设F(x; m θθ,,1 )为母体的真实分布,其中m θθ,,1 为m 个未知参数.在F(x;m θθ,,1 )中用m θθ,,1 的极大似然估计mθθ∧∧,代替m θθ,,1 并且以F(x; mθθ∧∧,)取代(7.4)中的F(x)得到),,1;(),,1;(1m a F m a F i i iP θθθθ∧∧-∧∧∧-= (7.30)则将(7.30)代入(7.15)所得的统计量∑=∧∧-=kj i ini nn p p 122()χ (7.31)当∞→n 时有自由度为k-m-1的2χ-分布.例 7.9 (略)见P 345由例子来总结一下利用2χ-检验分布假设的步骤:(1)把母体ξ的值域划分为k 个互不相交的区间[,,,1),,1k i a a i i =+其中k a a ,1可以分别取∞∞-,;(2) 在0H 成立下,用极大似然估计法估计分布所含的未知参数; (3)在0H 成立下,计算理论概率)()(010i i i a F a F p -=+并且算出理论频数i nP ; (4)按照子样观察值n x x x ,,,21 落在区间),[1+i i a a 中的个数,即实际频数,,,1,k i n i =和(3)中算出的理论频数i nP ,计算ii i nP nP n )(2-=χ的值;(5)按照所给出的显著性水平α,查自由度k-m-1的2χ-分布表得)1(21---m k αχ,其中m 是未知参数的个数; (6)若2χ21αχ-≥,则拒绝原假设0H ,若212αχχ-<,则认为原假设0H 成立.三 柯尔莫哥洛夫似合检验------n D 检验2χ-似合检验是比较子样频率与母体的概率的.尽管它对于离散型和连续型母体分布都适用.但它是依赖于区间的划分的.因为即使原假设)()(:00x F x F H =不成立,在某种划分下还是可能有k i P a F a F a F a F i i i i i ,,1,)()()()(1001 ==-=---从而不影响(7.5)中2χ的值,也就是有可能把不真的原假设0H 接受过来.由此看到,用2χ-检验实际上只是检验了,,,1,)()(100k i P a F a F i i i ==--是否为真,而并未真正地检验母体分布F(x)是否为)(0x F .柯尔莫哥洛夫对连续母体的分布提出了一种方法.一般称做柯尔莫哥洛夫检验或n D -检验.这个检验比较子样经验分布函数)(x F n 和母体分布函数F(x)的.它不是在划分的区间上考虑)(x F n 与原假设的分布函数之间的偏差.而是在每一点上考虑它们之间的偏差.这就克服了2χ-检验的依赖于区间划分的缺点.但母体分布必须假定为连续.根据格里汶科定理,我们可以把子样经验分布函数看作实际母体分布函的缩影.如果原假设成立,它与F(x)的差距一般不应太大.由此柯尔莫哥洛夫提出一个统计量|)()(|sup x F x F D n xn -= (7.32)并且得到这统计量n D 的精确分布和极限分布K(λ).它们都不依赖于母体的分布.这里我们不加证明地引入柯尔莫哥洛夫定理.定理 7.3 设母体ξ有连续分布函数F(x),从中抽取容量为n 的字样,并设经验分布函数为)(x F n ,则|)()(|sup x F x F D n xn -=的分布函数⎪⎭⎫ ⎝⎛+<n D P n 21λ=n n n n dy y y f n n n nn n n n n 2120212,1,),,(0,021********22121-<≤⎪⎪⎪⎩⎪⎪⎪⎨⎧-≥<⎰⎰⎰+-+-+---λλλλλλλλλ 当(7.33)其中⎩⎨⎧<<<=其它当,010!),(11n n y y n y y f在∞→时有极限分布函⎪⎩⎪⎨⎧≤>--=→<∑-∞=0,00),2exp()1()()(22λλλλλ当当n j j n j K D n P (7.34) 在应用柯尔莫哥洛夫检验时,应该注意的是,原假设的分布的参数值原则上应是已知的.但在参数为未知时,近年来有人对某些母体分布如正态分布和指数分布用下列两种方法估计.()可用另一个大容量子样来估计未知参数,(2)如果原来子样容量很大,也可用来估计未知参数.不过此n D -检验是近似的.在检验时以取.较大的显著性水平为宜,一般取α=0.10-0.12.n D -检验检验母体有连续分布函数F(x)这个假设的步骤如下:(1) 从母体抽取容量为n 的子样,并把子样观察值按由小到大的次序排列;(2) 算出经验分布函⎪⎪⎩⎪⎪⎨⎧≤=<≤<=+x n j x x x nx n x x x F k j j jn 当当当,1,,1,,)(,0)()1()()1((3) 在原假设0H 下,计算观测值处的理论分布函数F(x)的值; (4) 对每一个i x 算出经验分布函数与理论分布函数的差的绝对值||)()(||)()()()1()()(i i n i i n x F x F x F x F --+与(5) 由(4)算出统计量的值(6) 给出显著性水平α,由柯尔莫哥洛夫检验的临界值表查出αα=≥)(,n n D D P的临界值α,n D ;当n>100时,可通过n D n /1,ααλ-≈查n D 的极限分布函数数值表得αλ-1从而求出α,n D 的近似值.(7) 若由(5)算出的α,n n D D ≥则拒绝原假设0H ;若α,n n D D <则接受假设,并认为原假设的理论分布函数与子样数据是似合得好的. 例 7.10 略) 见P 351定理 7.4 当样本容量21n n 和分别趋身于∞时,统计量|)()(|212121,sup x F x F D n n xn n -=有极限分布函数)(212121λλK D n n n n P n n →⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<+ ⎪⎩⎪⎨⎧≤>--=∑∞-∞=0,00),2exp()1(22λλλ当当j j j (7.35) 例 7.11 (略)见P 353。
假设检验-参数检验⾮参数检验-置信区间1. 假设检验⼩概率事件和反证法的应⽤。
H0:原假设H1:备选假设解释:假设在H0前提下,我们得到⽬前⼿头上的样本,定义为⼀个概率事件,概率为α(0.05, 0.01, 0.001),是⼩概率事件。
通过公式计算P值,P<α, 则确认我们得到⽬前⼿头上的样本是⼀个⼩概率事件,⽽⼩概率事件在⼀次试验中是不可能发⽣的,但事实发⽣了,则原假设错误,接受备选假设。
正经解释:H0:只存在抽样误差,不存在系统误差H1:存在抽样误差和系统误差在只存在抽样误差的前提下,我们得到⽬前样本的概率为P,如果P<α,则证明不只是存在抽样误差,还存在系统误差。
在参数检验中,像t分数,F统计量,卡⽅统计量等,它的分布是什么形式的,统计学家已经算出来。
之所以有分布,是因为变异的存在,分布就是描述变异的规律。
Z分布是均值,率分布规律T分布是均值差的分布规律F分布是⽅差⽐的分布规律x2是⽅差、实际频数和理论频数的分布规律接着来:1. 参数检验思想以 t 分布为例,t 分布是说从均值为u, ⽅差为 sigma⽅的正态分布总体中,随机抽取样本量为n的样本,⽤均值差 / 标准误,抽⼀次得到⼀个 t 分数,抽⼀万次得到⼀万个 t 分数(这只是描述,实际密度函数是⼈家推导出来的),从⽽得到 t 分布规律。
这就是说,在只有抽样误差的时候(因为这就是进⾏的反复抽样,像正态分布是对样本不停抽样,计算均值⼀样),95% 的 t 分数是( x1, x2)之间。
提前设定⼀个拒绝⽔平(也就是概率值),也就是犯错概率,就是阿尔法,当 t 分数落到拒绝域对应的区间,我们认为只有抽样误差的时候,我们认为 t 是不可能落在这个范围。
alpha这么⼩,如果我们还犯错,我们认了。
95%解释:1. 在只有抽样误差的时候,抽样⼀百次,95个 t 分数是( x1, x2)之间。
如果样本 t 分数不属于这95个之⼀,我们拒绝原假设。
假设检验(二)——非参数检验假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。
上一节我们所介绍的Z 检验、t 检验,都是参数检验。
它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。
参数检验就是要通过样本统计量去推断或估计总体参数。
然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。
这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。
非参数检验是通过检验总体分布情况来实现对总体参数的推断。
非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料;(3)非参数检验很适用于小样本,并且计算简单;(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。
非参数检验的方法很多,分别适用于各种特点的资料。
本节将介绍几种常用的非参数检验方法。
一.2χ检验2χ检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。
2χ检验的方法主要包括适合性检验和独立性检验。
(一)2χ检验概述2χ是实得数据与理论数据偏离程度的指标。
其基本公式为:∑-=ee f f f 202)(χ (公式11—9) 式中,0f 为实际观察次数,e f 为理论次数。
分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2χ。
观察公式可发现,如果实际观察次数与理论次数的差异越小,2χ值也就越小。
当0f 与e f 完全相同时,2χ值为零。
2χ值的特点为:① 2χ值具有可加性。
② 2χ值永远不会小于零。
③ 2χ值的大小随着实际次数与理论次数之差的大小而变化。
利用2χ值去检验实际观察次数与理论次数的差异是否显著的方法称为2χ检验。
2χ检验有两个主要的作用:第一,可以用来检验各种实际次数与理论次数是否吻合的问题,这类问题统称为适合性检验;第二,判断计数的两组或多组资料是否相互关联还是相互独立的问题,这类问题统称为独立性检验。
2χ检验的具体步骤与t 检验基本相同。
第一,建立虚无假设。
例如假定实测次数与理论次数无显著差异,差异仅由机会造成。
第二,计算理论次数,并求出2χ值。
第三,统计推断。
根据df 数目和选定的显著性水平,查2χ值表得出超过实得2χ值的概率。
把概率的大小,作为接受或拒绝假设的依据。
表11—9 2χ检验统计决断规则(二)适合性检验适合性检验是应用2χ检验方法的一种。
它主要适用于检验实际观测次数与理论次数之检查以是否显著,它所面对的研究对象主要是一个因素多项分类的计数资料,所以又称为单因素分类2χ检验或单项表的2χ检验。
适合性检验的种类主要有无差假设的适合性检验和实际次数分布是否属于正态分布的适合性检验,下面逐一进行简要介绍。
1. 无差假设的适合性检验所谓无差假设是指各项分类的次数没有差异,理论次数完全按概率相等的条件计算,即理论次数= 总数/分类项数例1,随机抽取70名学生,调查他们对高中分文理科的意见,回答赞成的有42人,反对的有28人。
问对分科的意见有无显著差异?解:此例只有两种分类。
因此应有理论次数e f =70×0.5=35(人) 检验步骤:(1)建立假设: 0H :300==e f f , 1H :e f f ≠0 (2)计算2χ值:∑-=ee f f f 202)(χ=8.235)3528(35)3542(22=-+- (3)统计推断。
首先确定自由度df ,2χ检验的自由度一般等于分类项数减1,本例df =2 — 1 = 1。
查df = 1的2χ表,)05.0,1(2χ=3.84,故有 2χ<)05.0,1(2χ,因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。
其结论为:学生对高中文理分科的态度的差异不显著。
例2,某大学某系的46位老年教师中,健康状况属于良好的有15人,中等的有20人,比较差的有11人,问该系老教师中三种健康状况的人数是否一样?解:此例有三种分类。
因此应有理论次数e f = 346= 18(人) 检验步骤:(1)建立假设: 0H :健康状况好、中、差三种人数相同 1H :健康状况好、中、差三种人数不相同 (2)计算2χ值:∑-=ee f f f 202)(χ=44.318)1811(18)1820(18)1815(222=-+-+- (3)统计推断。
首先确定自由度df ,本例df = 3— 1 = 2。
查df = 2的2χ表,)05.0,2(2χ=5.99,故有 2χ<)05.0,2(2χ,因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。
其结论为:该系老教师中,健康状况好、中、差三种人数无显著差异。
2.实际次数分布是否属于正态分布的适合性检验2χ检验还可以通过将正态分布的概率转换为理论次数的数值,来检验某些实际次数分布是否属于正态分布。
例3,今对某校100名学生进行操行评定,分优、良、中、差四等,评定结果为:优19人、良39人、中35人、差7人。
试检验其分布的形式是否属于正态分布?解: 检验步骤:(1)建立假设: 0H :评定结果服从正态分布 1H :评定结果不服从正态分布 (2)计算2χ值:首先需求出理论次数。
正态分布的各部分理论次数,是通过正态分布图中面积比率乘以总次数得出的。
在正态分布情况下,正态曲线底边上±3σ之内几乎包含了全部量数,因此我们可将正态分布底线长度从-3σ至+3σ分为四个等分,每等分为1.5σ,其面积比率为:第一等分(优)的面积:上限3σ,下限为1.5σ。
1.5σ~3σ之间的面积比率为: 0.4987-0.4332=0.0655,即7%。
第二等分(良)的面积:位于0~1.5σ之间,其面积比率为0.4332,即43%。
第三等分(中)的面积:位于0~-1.5σ之间,其面积比率为0.4332,即43%。
第四等分(差)的面积:位于-1.5σ~-3σ之间的面积比率为:0.4987-0.4332=0.0655,即7%。
根据各等分的面积比率,乘以总人数,即可得出理论次数。
如:优的人数为7%×100=7,良的人数为43%×100=43。
同理可求出中的人数为43,差的人数为7。
即优的 e f =7,良的e f =43,中的e f =43,差的e f =7。
代入(公式11—9)有:=2χ43.227)77(43)4335(43)4339(7)719(2222=-+-+-+- (3)统计推断。
首先确定自由度df ,本例df = 4— 1 = 3。
查df = 2的2χ表,)05.0,3(2χ=7.81,)01.0,3(2χ= 11.345,故有 2χ>)01.0,3(2χ,因此应在0.01显著性水平上拒绝虚无假设,接受备择假设。
其结论为:此评定结果不服从正态分布。
(三)独立性检验独立性检验也是2χ检验的一个重要应用。
如果想研究两个或两个以上因素之间是否具有独立性,就可利用2χ独立性检验。
独立性检验一般都采用表格的形式来显示观察结果,所以独立性检验也称为列联表分析。
当检验对象只有两个因素而且每个因素只有两项分类的列联表就称为2×2列联表或四格表;而一个因素有R 类,另一个因素有C 类,这种表称之为R ×C 表。
本节只讨论二维列联表的情况。
关于二维列联表的独立性检验,需注意几个问题:第一,独立性检验的虚无假设是二因素(或多元素)之间是独立的或无关联,被择假设是二因素(或多因素)自荐有关联或者说差异显著。
一般多用文字叙述而很少用符号代替。
第二,独立性检验的理论次数是直接由列联表所提供的数据推算出来的。
如果用Ri f 表示第i 行的和,Cj f 表示第j 列的和,N 为所有数据值和,则第i 行第j 列的方格内的理论次数为:Nf f f ji ij C R e ⨯=(公式11—10)第三,二维列联表自由度与二因素各自的分类项数有关。
设R 为行分类项数(行数),C 为列分类项数(列数),则自由度为: )1)(1(--=C R df 。
1.2×2列联表的独立性检验2×2列联表就是把样本按两种性质分组,并排成两行两列的表,它是最简单的列联表,简称为四格表。
2×2列联表用以进行两个组彼此独立互无关联的检验。
独立性检验下面我们从样本的不同情况出发,分别介绍相应的检验方法。
独立样本的2×2列联表的独立性检验独立样本4格表的独立性检验,既可以用计算2χ的基本公式(公式11—9)计算,也可用下面的简捷公式计算:2χ=))()()(()(2d b c a d c b a bc ad N ++++- (公式11—11)式中:d c b a ,,,分别是四格表内的实计数。
表11—10 2×2列联表的 2χ值计算示意表d例4,设有甲乙两区,欲测验两区中学教学水平,各区随机抽取500名初三学生,进行统一试题的数学测验,其结果是:甲区及格学生为475人,不及格为25人;乙区及格学生460人,不及格为40人,问甲区中学与乙区中学的数学测验成绩的差异是否显著?解: 检验步骤:(1)建立假设:0H :甲区中学与乙区中学数学测验成绩无显著差异 1H :甲区中学与乙区中学数学测验成绩差异显著 (2)计算2χ值:表11—11 甲区中学与乙区中学的数学测验成绩表根据简捷公式:2χ==⨯⨯⨯⨯-⨯⨯50093565500)2546040475(100023.68 (3)统计推断。
首先确定自由度df ,本例df =(2-1)(2-1)=1,查df =1的2χ表,)05.0,1(2χ=3.84,故有 2χ<)05.0,1(2χ,因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。
其结论为:甲区中学与乙区中学数学测验成绩无显著差异。
例5,随机抽取某校男生250名,女生240,进行体育达标考核,结果如下表 问体育达标水平是否与性别有关?表11—12 体育达标考核情况表解:检验步骤:(1)建立假设:0H :体育达标水平与性别无关 1H :体育达标水平与性别有关(2)计算2χ值:利用基本公式 ∑-=ee f f f 202)(χ,其理论次数为:11e f =85.14662835=⨯ 15.2066383512=⨯=e f 15.1366283121=⨯=e f 85.1766383122=⨯=e f2χ =006.085.17)85.1718(15.13)15.1313(15.20)15.2020(85.14)85.1415(2222=-+-+-+- (3)统计决断: 首先确定自由度df ,本例df =1,查df =1的2χ表,)05.0,1(2χ=3.84,故有 2χ<)05.0,1(2χ,因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。