第六章 假设检验(Hypothesis test)
- 格式:ppt
- 大小:2.93 MB
- 文档页数:8
第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。
假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。
本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。
第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。
例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。
上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。
假设检验(Hypothesis Test)假设检验是数理统计中按照⼀定的假设条件由样本推断总体的⼀种⽅法,因此假设检验也成为“显著性检验(Test of statistical significant)”,是研究样本与样本之间、样本与总体之间的误差是由抽样误差引起的还是本质误差的统计推断⽅法。
它的基本思想是在假设成⽴的条件下,根据某个统计⽅法(如Z检验、卡⽅检验等)的⽅法估计输⼊数据的统计特性,根据统计特性和输⼊数据的分布估计假设成⽴的概率⼤⼩,如果⼩于某⼀个预先设定的“显著性⽔平(significant level)”则说明假设不成⽴,反之则说明假设成⽴。
假设检验所定义的假设成为零假设,数学上⼀般写成H0(念:H-nought)。
与H0对⽴的假设,即对⽴假设,也称为备择假设。
由于我们对于假设的判断是基于概率统计所作出的判断,那么我们就很有可能(⼀定的概率)做出错误的判断。
错误分两种,第⼀类错误为H0假设成⽴,但是我们却认为它不成⽴,第⼆类错误是说H0不成⽴,但是我们却认为它成⽴。
⼀般⽽⾔,第⼀类错误更难为⼈所忍受,所以在判断时,允许犯这种错误的可能性必须要极低——即犯第⼀类错的事件应该是⼀个⼩概率事件。
假设检验就是基于这种⼩概率原理,即事先确定的作为判断的标准,即允许犯错的⼩概率标准,这种⼩概率标准就是统计学上定义的“显著性⽔平-α”,如果根据假设计算出来的概率⼩于这个显著性⽔平,则拒绝原假设,反之,如果⼤于这个标准,则承认原假设。
因此,⼀般把1-α称为“置信区间”或者“接收区间”,⼩于α的区间称为“拒绝区间”。
举个例⼦来说明,⼀个⼈被控诉犯罪,陪审团根据现有的条件做出对这个⼈有罪还是⽆罪的判断。
事实上,陪审团就是进⾏⼀个假设检验。
假设H0:被告⽆罪假设H1:被告有罪当然,陪审团现在还不知道哪个假设是成⽴的,他们必须根据控辩双⽅的证词做出判断,判断的结果只有两种,⼀种是被告⽆罪释放,⼀种是被告罪名成⽴。
假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
中文名假设检验外文名 hypothesis test提出者 K.Pearson 提出时间 20世纪初1、简介假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
[1]2、基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。
[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。
设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。
使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。
如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。
如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。
对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。
假设检验(HypothesisTesting)假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:μ=μ0,然后用统计的方法来计算验证你的假设是否正确。
假设检验的基本思想1.小概率原理如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
2.假设的形式H0——原假设,H1——备择假设双尾检验:H0:μ = μ0,单尾检验:,H1:μ < μ0,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。
假设检验(hypothesis testing)方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOV A)➢概述假设检验是分析数据的一种方法。
回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。
这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?”最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。
这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。
最有名的分布就是正态分布,它是:检验的基础。
t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。
➢适用场合·想知道一组或更多组数据的平均值、比例、方差或其他特征时;·当结论是基于更大总体中所取得的样本时。
例如:·想确定一个过程的均值或方差有否改变;·想确定很多数据集的均值或方差是否不同:·想确定两组不同的数据集的比例是否不同;·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。
➢实施步骤假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。
虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。
如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。
这些定义解释了假设检验的慨念,然后再回来看这个步骤。
本书不可能详细地涉及假设检验。
这个步骤是个综述和快速参考。
要得到更多的信息,查阅统计学参考书或请教统计学家。
1确定要从数据中获得的结论。
选择适当的检验方法。
用哪种检验取决于检验的目的和数据的种类。
假设检验(HypothesisTesting)假设检验的定义假设检验:先对总体参数提出某种假设,然后利⽤样本数据判断假设是否成⽴。
在逻辑上,假设检验采⽤了反证法,即先提出假设,再通过适当的统计学⽅法证明这个假设基本不可能是真的。
(说“基本”是因为统计得出的结果来⾃于随机样本,结论不可能是绝对的,所以我们只能根据概率上的⼀些依据进⾏相关的判断。
)假设检验依据的是⼩概率思想,即⼩概率事件在⼀次试验中基本上不会发⽣。
如果样本数据拒绝该假设,那么我们说该假设检验结果具有统计显著性。
⼀项检验结果在统计上是“显著的”,意思是指样本和总体之间的差别不是由于抽样误差或偶然⽽造成的。
假设检验的术语零假设(null hypothesis):是试验者想收集证据予以反对的假设,也称为原假设,通常记为 H0。
例如:零假设是测试版本的指标均值⼩于等于原始版本的指标均值。
备择假设(alternative hypothesis):是试验者想收集证据予以⽀持的假设,通常记为H1或 Ha。
例如:备择假设是测试版本的指标均值⼤于原始版本的指标均值。
双尾检验(two-tailed test):如果备择假设没有特定的⽅向性,并含有符号“=”,这样的检验称为双尾检验。
例如:零假设是测试版本的指标均值等于原始版本的指标均值,备择假设是测试版本的指标均值不等于原始版本的指标均值。
单尾检验(one-tailed test):如果备择假设具有特定的⽅向性,并含有符号 “>” 或 “<” ,这样的检验称为单尾检验。
单尾检验分为左尾(lower tail)和右尾(upper tail)。
例如:零假设是测试版本的指标均值⼩于等于原始版本的指标均值,备择假设是测试版本的指标均值⼤于原始版本的指标均值。
检验统计量(test statistic):⽤于假设检验计算的统计量。
例如:Z值、t值、F值、卡⽅值。
显著性⽔平(level of significance):当零假设为真时,错误拒绝零假设的临界概率,即犯第⼀类错误的最⼤概率,⽤α表⽰。
假设检验名词解释假设检验(HypothesisTesting)是统计学的一个重要的研究方式,也是利用统计分析处理潜在关系的有效方法。
它可以对两个或以上未知概率分布里的统计差异进行验证,以确定它们之间是否有实质性差异。
下面是一些关于假设检验的常见术语。
检验假设(HypothesisTesting):检验假设是一种统计分析方法,可以通过收集数据并进行检验,以确定两个或多个未知概率分布之间是否存在实质性差异。
研究假设(ResearchHypothesis):研究假设是在开展假设检验之前需要设立的假设性断言,以指导研究过程。
一般情况下,在研究假设中,应参考变量和观察变量之间的关系,以确定受试者在某个环境下,是否表现出某种特定效应或变化。
零假设(NullHypothesis):零假设是研究假设的反义词,针对研究假设,它先假定比较变量之间没有实质性差异。
而研究假设表示,两个变量之间存在某种实质性差异。
显著性水平(Significance Level):显著性水平是研究中的概念,用于衡量统计检验的可靠程度。
它表示统计检验的结果,是一种对研究假设或零假设的支持程度,用于衡量受试者的行为差异的实质性和可靠性。
拒绝域(Rejection Region):拒绝域是统计检验中的概念,用于衡量检验假设与零假设之间差异的大小,以决定是否拒绝零假设。
拒绝域表明,在满足特定显著性水平的情况下,多少次试验结果就足以表明两个变量之间存在某种实质差异。
样本大小(SampleSize):样本大小是指在进行统计检验时,受试者的数量。
样本越大,获得更多有意义结论的可能性就越大,但是样本越大,所需时间就越长。
p值(pValue):p值是一个概念,用于衡量统计检验结果的可靠性,它表示有多少可能性发生统计检验中参与变量之间存在的差异是由于随机性,而不是真实差异。
p值用于确定零假设是否应被拒绝,只有当p值小于显著性水平,才能够拒绝零假设。
假设检验是一种有效的统计分析方法,在决策过程中有许多应用,比如市场营销决策、投资决策、政策决策等。