比率P的假设检验及其应用-2016.06.08一读
- 格式:docx
- 大小:769.99 KB
- 文档页数:11
概率与统计中的假设检验概率与统计是一门研究统计规律和随机现象的学科,而假设检验是其中重要的内容之一。
在统计学中,假设检验被广泛应用于验证科学假设、判断实证数据与理论模型是否相符,以及进行决策和推断等方面。
本文将会介绍概率与统计中的假设检验的基本原理、应用场景以及一些常见的检验方法。
一、假设检验的基本原理假设检验是基于统计推断的方法,旨在通过对样本数据进行分析,对总体参数假设的真伪给出定量的判断。
在假设检验中,一般会建立两个互相对立的假设,即原假设(H0)和备择假设(H1)。
原假设是我们要进行验证的假设,而备择假设则是对原假设的否定或补充。
二、应用场景假设检验广泛应用于科学研究、医学试验、市场调研等领域,其中的应用场景包括但不限于以下几个方面:1. 科学实验验证在科学实验中,通过对实验结果的统计分析,可以判断某个因素对实验结果的影响是否显著。
例如,在药物研发过程中,可以通过对患者的治疗效果进行统计分析,来验证新药的疗效是否明显优于现有药物。
2. 市场调研在市场调研中,假设检验可以用于判断不同市场策略的有效性。
例如,某公司在推出新产品前,可以进行市场调研,使用假设检验来比较不同宣传方式对消费者购买意愿的影响,从而选择最佳的市场推广策略。
3. 经济决策在经济决策中,假设检验可以用于评估政策措施的有效性。
例如,某地政府在推行一项新政策前,可以通过对实施之前和之后的数据进行假设检验,来判断该政策是否对经济产生了显著的影响。
三、常见的检验方法假设检验有多种方法,根据不同的问题和数据类型可以选用不同的方法。
下面介绍几种常见的检验方法:1. t检验t检验用于对两组样本均值之间是否存在显著差异进行判断。
当两组样本均值相差显著时,可以拒绝原假设,认为两组样本的均值存在显著差异。
2. 卡方检验卡方检验主要用于分析观测频数与理论频数之间的差异。
通过对实际观测值和理论期望值进行比较,判断差异是否显著。
3. 方差分析方差分析适用于比较三组或三组以上样本均值是否存在显著性差异。
概率与统计的假设检验与显著性检验方法应用概率与统计是现代科学研究中不可或缺的重要方法之一。
在众多的统计方法中,假设检验与显著性检验方法是常用的分析手段之一。
本文将详细介绍概率与统计的假设检验与显著性检验方法的应用。
一、概率与统计的基本概念在讨论假设检验与显著性检验方法之前,我们首先需要了解一些基本概念。
1. 总体与样本:在统计学中,研究对象的全体称为总体,而从总体中抽取的一部分称为样本。
2. 参数与统计量:总体的特征值称为参数,样本的特征值称为统计量。
3. 假设与备择假设:假设是对总体参数的陈述,备择假设是对假设的反面陈述。
二、假设检验的基本原理假设检验是以样本信息推断总体参数的一种方法。
在假设检验中,我们会先提出一个原假设,通常表示为H0,然后根据样本数据对原假设进行检验。
假设检验的步骤如下:1. 提出原假设H0与备择假设H1;2. 选择一个适当的统计量,计算观察样本的统计量值;3. 根据假设检验的目的和具体情况,选择一个合适的显著性水平α;4. 根据显著性水平α,在显著性水平表中查找对应的临界值或计算p值;5. 根据计算结果与显著性水平的比较,对原假设进行接受或拒绝的决策;6. 根据决策结果给出相应的结论。
三、显著性检验方法的应用显著性检验是假设检验的一种具体形式,其目的是判断样本统计量与总体参数之间的显著差异。
常用的显著性检验方法有Z检验、T检验、卡方检验等。
1. Z检验:Z检验适用于总体参数为已知的情况,或样本容量较大的情况。
它的假设检验步骤如下:1)提出原假设H0与备择假设H1;2)计算样本均值与总体均值之间的差异;3)计算标准误差;4)计算统计量;5)根据统计量与临界值或p值的比较进行决策;6)给出结论。
2. T检验:T检验适用于总体参数未知的情况,且样本容量较小的情况。
它的假设检验步骤与Z检验类似,但需要计算自由度和标准误差时使用样本标准差。
3. 卡方检验:卡方检验适用于类别型数据的假设检验。
比率P的假设检验及其应用比率P的假设检验及其应用摘要:假设检验是统计推断的另一项重要容,它与参数估计类似,但角度不同。
参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。
本文将主要介绍总体比率的假设检验的原理和方法,以及其在各种生活实例中的应用,从而更深的了解假设检验在各种统计方法中的重要作用。
关键词:假设检验;总体比率;检验统计量;拒绝域Hypothesis Testing and Its Application of Ratio PAbstract:Hypothesis testing is another important content to statistical inference, and it is similar to parameter estimation, but the Angle is different. Parameter estimation is use sample information to infer an unknown population parameter, and the hypothesis testing is a hypothesis is proposed first in the overall parameters, and then using the sample information to determine whether the hypothesis is established. This article mainly introduces the overall rate of the principle and method of hypothesis testing, and its application in all kinds of living examples, thus deeper understanding of the hypothesis testing plays an important part in all kinds of statistical methods.Key words:hypothesis testing;the overall rate;test statistics;rejection region目录一、假设检验的基本问题(一)假设检验的概述(二)假设检验的基本步骤(三)检验的P值二、总体比率的假设检验及其应用(一)单个总体比率的假设检验1.单个总体比率的精确检验及其应用2.单个总体比率的大样本检验及其应用(二)两个总体比率的假设检验1.两个总体比率之差的精确检验及其应用2.两个总体比率之差的大样本检验及其应用一、假设检验的基本问题 (一)假设检验的概述假设检验是统计推断的一项重要组成部分,它在各种统计方法中都有极其重要的应用。
比率P的假设检验及其应用摘要:假设检验是统计推断的另一项重要内容,它与参数估计类似,但角度不同。
参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。
本文将主要介绍总体比率的假设检验的原理和方法,以及其在各种生活实例中的应用,从而更深的了解假设检验在各种统计方法中的重要作用。
关键词:假设检验;总体比率;检验统计量;拒绝域Hypothesis Testing and Its Application of Ratio P Abstract:Hypothesis testing is another important content to statistical inference, and it is similar to parameter estimation, but the Angle is different. Parameter estimation is use sample information to infer an unknown population parameter, and the hypothesis testing is a hypothesis is proposed first in the overall parameters, and then using the sample information to determine whether the hypothesis is established. This article mainly introduces the overall rate of the principle and method of hypothesis testing, and its application in all kinds of living examples, thus deeper understanding of the hypothesis testing plays an important part in all kinds of statistical methods.Key words:hypothesis testing;the overall rate;test statistics;rejection region目录一、假设检验的基本问题(一)假设检验的概述(二)假设检验的基本步骤(三)检验的P值二、总体比率的假设检验及其应用(一)单个总体比率的假设检验1.单个总体比率的精确检验及其应用2.单个总体比率的大样本检验及其应用(二)两个总体比率的假设检验1.两个总体比率之差的精确检验及其应用2.两个总体比率之差的大样本检验及其应用一、假设检验的基本问题(一)假设检验的概述假设检验是统计推断的一项重要组成部分,它在各种统计方法中都有极其重要的应用。
假设检验通过首先对总体参数提出的一个假设,然后利用样本信息推断这个假设是否成立这样一个过程,来判断承认还是拒绝该假设。
(二)假设检验的基本步骤1.建立假设在假设检验中,通常把被检验的假设叫做原假设,用H0表示,当原假设被拒绝时接受的假设叫做备择假设,用H1表示。
在任一假设检验中,原假设与备择假设都是相互对立的,且二者只能居其一。
2.选择检验统计量建立假设后,对于是否接受原假设则需要根据某一统计量出现的数值,从概率意义上判断来完成,这个统计量称为检验统计量。
3.显著性水平检验的结果不一定是真实的情况,所以说,检验是有可能犯错误的。
在假设检验中可能会犯的错误有两类:一是原假设为真却拒绝原假设,称这种错误为第一类错误,其发生的概率叫做犯第一类错误的概率,或称为拒真概率,在假设检验中把犯第一类错误的概率称为显著性水平,通常用α表示,即α=P(拒绝H0 | H0为真)=Pθ(X∈W)另一种错误是原假设为假却接受原假设,称这种错误为第二类错误,其发生的概率叫做犯第二类错误的概率,或称为受伪概率,通常用β表示,即β=P(接受H0 | H1为真) =Pθ(X∈W)这两类错误之间也存在着这样的关系:当α减小时,β会随之增大;当β减小时,α会随之增大。
这个现象不是偶然的,而具有一般性,也就是说,在样本容量不变的前提下,找到一个使α和β都减小的检验是不可能的,唯一能使α和β同时减小的方法是增大样本容量。
在假设检验中,发生哪一类错误的后果更为严重,就应首先减小哪类错误发生的概率,通常情况下允许犯第一类错误的概率,尽量减小犯第二类错误的概率,一般取α=0.05和0.01,表示发生的概率很小。
4.给出拒绝域拒绝域是指使原假设被拒绝的样本观测值所在的区域,用W表示。
若统计量的值落在拒绝域内,则拒绝原假设;反之,则接受原假设。
5.由样本值计算结果(三)检验的P值假设检验的判断还有另外一种形式,即计算检验的P值,检验的P值就是在一个假设检验中,可以利用样本观测值做出拒绝原假设的最小显著性水平。
将检验的P值与心目中的显著性水平α进行比较,就可以很容易的做出检验的结论。
判断如下:如果α≥p ,则在显著性水平α下拒绝原假设;如果α<p ,则在显著性水平α下接受原假设。
二、总体比率的假设检验及其应用(一)单个总体比率的假设检验1.单个总体比率的精确检验及其应用下文所提到的比例p 可将其看作某事件发生的概率,即为两点分布(按:即0-1分布)X ~B(1,p)中的参数。
做n 次独立试验,用x 标记事件发生的次数,则X ~B(n,p),(按:即二项分布)。
(1)设n 21x ,x ,x 为两点分布)p ,1(B ~X 的样本,考虑右侧假设检验:000p vsp p p :H >≤,给出拒绝域{}c x W ≥=,由于x 为整数,所以c 取非负整数值。
但是对于给定α的,不一定找到恰好的c ,使(1)设n 21x ,x ,x 为两点分布)p ,1(B ~X 的样本,考虑右侧假设检验:H 0:p≤p 0,H 1:p >p 0,给出拒绝域{}c x W ≥=,由于x 为整数,所以c 取非负整数值。
但是对于给定α的,不一定找到恰好的c ,使,)p 1(p i n )p 1(p i n i n 0i 0n 1c i i n 0i 0nc i 00-+=-=-⎪⎪⎭⎫ ⎝⎛>α>-⎪⎪⎭⎫ ⎝⎛∑∑对此情况比较常见的办法是,找一个c 0,使α=-⎪⎪⎭⎫ ⎝⎛=≥-=∑i n 0i 0nc i 0)p 1(p i n )p ;c x (P若取c=c 0,相当于提高检验的显著性水平,若取c=c 0+1,则相当于降低检验的显著性水平,由于取c=c 0+1可以保证α=-⎪⎪⎭⎫ ⎝⎛=≥-=∑i n 0i 0nc i 0)p 1(p i n )p ;c x (P 的左侧不大于α(按:对c 0+1,上面的小概率P 比c 0会更小≤α,设小c 自然检验更加明显,检验效率更高,但容易弃真),所以取c=c 0+1可得到水平为α的检验。
由此可以类似推出,对于假设检验问题H 0:p ≥p 0,H 1:p <p 0,检验的拒绝域可以为}{,c x W ≤=c 为满足α≤-⎪⎪⎭⎫ ⎝⎛-=∑i n 0i 0nc i )p 1(p i n 0的最大正整数。
对于假设检验问题H 0:p =p 0,H 1:p ≠p 0,检验的拒绝域为{},c x c x W 21≥≤=或其中1c 为满足2)p 1(p i n i n 0i 0c 0i 1α≤-⎪⎪⎭⎫ ⎝⎛-=∑的最大整数,2c 为满足2)p 1(p i n i n 0i 0n c i 2α≤-⎪⎪⎭⎫ ⎝⎛-=∑的最小整数。
(2)应用例1.1.1 在一次模拟考试后,某班级的班主任对这次的成绩做了一次统计,统计结果发现有%40的同学达到了80分以上,现从该班级随机抽取20名同学,其中有5位同学成绩在80分以上。
在显著性水平05.0=α下,能否认为这次的统计结果属实? 解:由题意可知:这是一个关于单个总体比率的双侧假设检验问题,由于3018n <=,故可用精确检验的方法进行检验。
设该班级学生成绩达到80分以上的比率为p ,x 表示20名学生中成绩达到80分以上的人数,则)p ,20(b ~x 。
现建立假设:4.0p :H ;4.0p :H 10≠=拒绝域为:}{21c x c x W ≥≤=或,下求1c 和2c由前面可知:1c 为满足2)p 1(p i n i n 0i 0c 0i 1α≤-⎪⎪⎭⎫ ⎝⎛-=∑的最大整数,2c 为满足2)p 1(p i n i n 0i 0n c i 2α≤-⎪⎪⎭⎫ ⎝⎛-=∑的最小整数,又因0510.0)4x (P 025.00160.0)3x (P =≤<<=≤故3c 1=,又有022.0)12x (P 025.00564.0)11x (P =≥>>=≥故12c 2=,所以拒绝域为}{12x 3x W ≥≤=或,由于观测值5不在拒绝域内,也就是说未落入拒绝域,即接受原假设,可以认为这次的统计结果属实。
例1.1.2 某工厂在一次对产品质量的调查中显示,该产生产的产品优质品率不低于%30,为了验证这一结论,该产随机从生产的产品中抽取了15件产品,其中发现有3件是优质品。
问:在显著性水平05.0=α下,能否认为这次的调查结果属实?并给出检验的P 值。
解:由题意可知:这是一个关于总体比例的左侧的假设检验。
设p 表示该工厂产品的优质品率,x 表示抽取的15件产品中的优质品数,则可有),15(~p b x 。
先建立假设:3.0p :H ;3.0p :H 10<≥检验的拒绝域为:}{c x W ≤=,下计算c 的值。
由于1269.0)2x (P 025.00352.0)1x (P =≤<<=≤,所以可取1c =,检验的拒绝域为}{1x W ≤=,因题中得到的优质品数为3,未落入拒绝域,故接受原假设,可以认为这次的调查结果属实。
本题也可通过计算检验的P 值得出结论,用X 表示服从二项分布)3.0,15(b 的随机变量,则检验的P 值为:2969.0)3.01(3.0x 15)3x (P p x 15x 30x =-⎪⎪⎭⎫ ⎝⎛=≤=-=∑ 由于检验的P 值05.02969.0=α>显著性水平,故接受原假设,所以可以认为这次的调查结果属实。
2.单个总体比率的大样本检验及其应用(1)设样本n 21x ,x ,x 取自两点分布总体),p ,1(B ~X 其中p ~表示样本比例,p 为对总体比率的某一假设值。
当n 很大,np 和)p 1(n -都大于5时,样本比例p ~近似服从均值为p ,方差为n /)p 1(p -的正态分布,而标准化检验统计量())p 1(p p p ~n u 000--=,则近似服从标准正态分布。