概率论与数理统计(8)假设检验
- 格式:doc
- 大小:207.50 KB
- 文档页数:71
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
教学内容一、引入新课:假设检验能解决什么问题呢?它能解决的问题分为两大类,第一类是参数假设检验,如果总体的分布已知,但是某个参数未知,对未知参数进行检验称为参数假设检验。
第二类是非参数假设检验,这时总体的分布未知,对未知分布的类型提出假设并检验,这时非参数假设检验。
二、讲授新课:1、假设检验的基本原理:假设检验的基本过程是,对于一个统计模型,先提出一个假设,然后根据抽取的样本对假设进行检验,然后做出接受或者拒绝假设的决策。
下面通过一个例子具体地看一下假设检验的基本原理。
在一次社交聚会中,一位女士宣称,她能区分熬好的咖啡中是先加的奶还是先加的糖,并当场试验,结果8杯中判断正确7杯,问这位女士真的具有这样的鉴别能力吗?解:假设该女士不具备鉴别能力,也就是她的判断是会乱猜的,因此,每杯咖啡猜正确的概率为21。
那么,8杯中猜对7杯的以上的概率可以利用古典概型的方法计算出来,其值为0.0352这个值较小,我们认为是小概率事件。
又因为一般认为在一次试验中,小概率事件是不可能发生的,但是这个事件发生了,从而产生了矛盾。
因此,认为是假设错误,拒绝假设,也就是该女士应该是具有鉴别咖啡的能力的。
这个问题的解决就是经历了,假设、检验、决策这三个环节。
其中假设就是女士不具备鉴别能力。
检验就是在假设的条件下,计算出发生事件的概率,发现这个概率是个小概率事件,在一次试验中不可能发生。
所以,最后的决策是拒绝假设。
(1)假设检验的推理依据:小概事件在一次试验中几乎不可能发生。
因此给出小概率事件的标准记为α,一般为发生概率小于为0.05或0.01,称为叫小概率事件。
(2)假设检验的基本思想是具有概率性质的反证法。
2、假设检验的例题:例 1 某单位新购进一台设备进行测试,已知该设备的误差服从正态分布,方差为0.01,正常情况下,系统误差为0,现在实际测试16次,误差值为x1,…,xn, 计算得出样本均值为0.072,问,能否认为该设备工作正常?首先,看看本题的已知条件:机器正常时,均值0=μ,方差为0.01,抽取的样本均值为0.072,样本容量为16,最后给出小概率的标准05.0=α,这也是小概率事件的标准,也就是事件的概率小于0.05是小概率事件,否则就不是小概率事件。
1.[一]某批矿砂的5个样品中的镍含量,经测定为(%)3.25 3.27 3.24 3.26 3.24。
设测定值总体服从正态分布,问在α = 0.01下能否接受假设:这批矿砂的含镍量的均值为3.25.解:设测定值总体X~N (μ,σ 2),μ,σ 2均未知步骤:(1)提出假设检验H 0:μ=3.25; H 1:μ≠3.25 (2)选取检验统计量为)1(~25.3--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α(4)n=5, α = 0.01,由计算知01304.0)(11,252.3512=--==å=i iX Xn S x查表t 0.005(4)=4.6041, )1(343.0501304.025.3252.3||2-<=-=n t t α(5)故在α = 0.01下,接受假设H 02.[二] 如果一个矩形的宽度ω与长度l 的比618.0)15(21»-=l ω,这样的矩形称为黄金矩形。
这种尺寸的矩形使人们看上去有良好的感觉。
现代建筑构件(如窗架)、工艺品(如图片镜框)、甚至司机的执照、商业的信用卡等常常都是采用黄金矩型。
下面列出某工艺品工厂随机取的20个矩形的宽度与长度的比值。
设这一工厂生产的矩形的宽度与长短的比值总体服从正态分布,其均值为μ,试检验假设(取α = 0.05)H 0:μ = 0.618H 1:μ≠0.6180.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.933. 解:步骤:(1)H 0:μ = 0.618; H 1:μ≠0.618 (2)选取检验统计量为)1(~618.0--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α (4)n=20 α = 0.05,计算知0925.0)(11,6605.01121=--===åå==ni ini ix xn S xnx ,)1(055.2200925.0618.06605.0||,0930.2)1(22-<=-==-n t t n t αα(5)故在α = 0.05下,接受H 0,认为这批矩形的宽度和长度的比值为0.6183.[三] 要求一种元件使用寿命不得低于1000小时,今从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时,已知这种元件寿命服从标准差为σ =100小时的正态分布。
62第8章 假设检验一、填空题1、 对正态总体的数学期望m 进行假设检验,如果在显著性水平0.05下,接受假设00:m m =H ,那么在显著性水平0.01下,必然接受0H 。
2、在对总体参数的假设检验中,若给定显著性水平为a ,则犯第一类错误的概率是a 。
3、设总体),(N ~X 2s m ,样本n 21X ,X ,X ,2s未知,则00:H m =m ,01:H m <m 的拒绝域为 )}1(/{0--<-n t nS X a m ,其中显著性水平为a 。
4、设n 21X ,X ,X 是来自正态总体),(N 2s m 的简单随机样本,其中2,sm 未知,记å==n1i i X n 1X ,则假设0:H 0=m 的t 检验使用统计量=T Qn n X )1(-.二、计算题1、某食品厂用自动装罐机装罐头食品,规定标准重量为250克,标准差不超过3克时机器工作 为正常,每天定时检验机器情况,现抽取16罐,测得平均重量252=X 克,样本标准差4=S 克,假定罐头重量服从正态分布,试问该机器工作是否正常?解:设重量),(~2s m N X05.016==a n 4252==S X(1)检验假设250:0=m H 250:1¹m H , 因为2s 未知,在0H 成立下,)15(~/250t nS X T -=拒绝域为)}15(|{|025.0tT >,查表得1315.2)5(025.0=¹t由样本值算得1315.22<=T ,故接受0H (2)检验假设9:20=s H9:201>s H因为m 未知,选统计量 222)1(s S n x -=在0H 成立条件下,2x 服从)15(2x 分布,拒绝域为)}15({205.02x x >,查表得996.24)15(205.0=x ,现算得966.24667.26916152>=´=x 拒绝0H ,综合(1)和(2)得,以为机器工作不正常2、一种电子元件,要求其使用寿命不得低于1000小时,现在从一批这种元件中随机抽取25 件,测得其寿命平均值为950小时,已知该种元件寿命服从标准差100=s 小时正态分布, 试在显著性水平0.05下确定这批产品是否合格. 解:设元件寿命),(~2s m N X ,2s 已知10002=s,05.0,950,25===a X n检验假设1000:0=m H1000:1<m H在2s 已知条件下,设统计量)1,0(~/1000N nX s m -=拒绝域为}{05.0mm<,查表得645.195.005.0-=-=m m而645.15.2205025/1001000950-<-=-=-=m拒绝假设0H 选择备择假设1H ,所以以为这批产品不合格.3. 对 显 著 水 平 a , 检 验假 设 H 0 ; m = m 0, H 1 ; m ¹ m 0, 问当 m 0, m , a 一定 时 , 增大样本量 n 必 能 使 犯 第 二 类 错 误 概 率 b减 少 对 吗 ?并 说 明 理 由 。
第八章 假设检验
1. 假设检验的基本思想:小概率事件在一次抽样中是几乎不可能发生的
例1 设总体X ~)1,(μN ,其中μ未知,n x x x ,,,21 为其样本
试在显著性水平α下检验假设
00:μμ=H ;01:μμ≠H
这里,α即为小概率事件的概率,当00:μμ=H 真时,n x n x u /1/00μσμ-=-=
~)1,0(N
则 αα=≥)(2/u u P
即事件)(2/αu u ≥即为小概率事件,当它发生时,即认为原假设0H 不真,从而接受对立假设01:μμ≠H
2. 两类错误
以例1为例,上述n x u /10
μ-=的取值完全由样本n x x ,,1 所决定,由于样本的随机性,
假设检验可能犯以下两类错误:
第一类错误:P =α(拒00H H 真),也即检验的显著性水平
第二类错误:P =β(接受00H H 不真)P =(接受10H H 真)
在样本容量n 固定时,βα,相互制约,当减小α时,β的值会增大,反之亦然。
3.正态总体),(2σμN 参数的假设检验
(1)首先要会判断所讨论问题是否为假设检验问题
例2 从一批灯泡中随机抽取50个,分别测得其寿命,算得其平均值1900=x (小时),样本标准差490=s (小时),问可否认为这批灯泡的平均寿命(μ)为2000小时。
分析:本题中虽然没说总体(寿命)服从什么分布,但由于样本容量50≥n ,可按正态总体处理,“可否认为平均寿命为2000小时”等价于作检验2000:0=μH
(2)检验问题主要是对提出的假设检验确定出检验的拒绝域,这可参考指定教材第八章正态总体检验一览表。
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
在总体的概率分布已知情形下,对分布中的未知参数作假设并进行检验,称为参数假设检验.若总体的分布未知,对总体的分布形式或参数作假设并进行检验,称为非参数假设检验.如上述问题1~4为参数假设检验问题,问题5为非参数假设检验问题.值得注意的是,当给定原假设后,其对立假设的形式可以有多个,如H0: 其对立形式有在假设检验问题中,常把一个被检验的假设称为原假设或零假设,而其对立面就称为对立假设.上述各问题中,H0为原假设,H1为对立假设.当H0不成立时,就拒绝接受H0而接受其对立假设H1.选择哪一种需根据实际问题确定,因而对立假设往往也称为备选假设,即在拒绝原假设后可供选择的假设.在假设检验问题中,必须同时给出原假设和对立假设.在参数假设中,不论是原假设还是对立假设,若其中只含有一个参数值,则称为简单假设,否则称为复合假设,如H0: ,H1: 为简单假设;而H0: ,H1: 为复合假设.二、假设检验的思想方法如何利用从总体中抽取的样本来检验一个关于总体的假设是否成立呢?由于样本与总体同分布,样本包含了总体分布的信息,因而也包含了假设H0是否成立的信息,如何来获取并利用样本信息是解决问题的关键.统计学中常用“概率反证法”和“小概率原理”来解决这个问题.小概率原理概率很小的事件在一次试验中不会发生.如果小概率事件在一次试验中竟然发生了,则事属反常,定有导致反常的特别原因,有理由怀疑试验的原定条件不成立.概率反证法欲判断假设H0的真假,先假定H0真,在此前提下构造一个能说明问题的小概率事件A.试验取样,由样本信息确定A是否发生,若A发生,这与小概率原理相违背,说明试验的前定条件H0不成立,拒绝H0,接受H1;若小概率事件A 没有发生,没有理由拒绝H0,只好接受H0.反证法的关键是通过推理,得到一个与常理(定理、公式、原理)相违背的结论.“概率反证法”依据的是“小概率原理”.那么多小的概率才算小概率呢?这要由实际问题的不同需要来决定.以后用符号记小概率,一般取等.在假设检验中,若小概率事件的概率不超过,则称为检验水平或显著性水平.已知某炼铁厂的铁水含碳量X~N(4.55,0.062),现改变了工艺条件,又测得10炉铁水的平均含碳量,假设方差无变化,问总体的均值是否有明显改变?(取 =0.05)下面举例说明以上检验的思想与方法。
例1则与4.55应很接近事件较大,待定)不太可能发生解由问题提出假设H0: ,H1:若H0成立由于未知用其无偏估计来代替用来衡量与4.55之间的差异如果较大则可认为所以在H0成立的前提下即P(A)很小令P(A)= ,确定9><>d是解决问题的关键由此确定了小概率事件由可知因此在H0成立的前提下,统计量显然因此即由标准正态分布上分位点的定义可知由 =0.05,得由于说明小概率事件A未发生,因此接受假设H0即认为总体均值等于4.55在随机试验中,小概率事件有许多,关键是要找一个能说明问题的小概率事件.,由P(A)= 同样可确定<>d本例中,若取最后的检验将出现这样一种倾向越与4.55接近,越要拒绝这样的判别方法显然不合理,错误在于:在H0成立的前提下,这样取小概率事件A不合理.在本例中,若设则A:( X1,X2, (X10)<>D是使小概率事件A发生的所有10维样本值(x1,…,x10)构成的集合则拒绝接受H0等价于一般地,若拒绝接受其中<>D是n维空间Rn中的区域,则称<>D为假设H0的拒绝域或否定域、临界域.检验中所用的统计量称为检验统计量样本观测值(x1,x2, (x10)样本观测值(x1,x2,…,xn)称<>D的补集为H0的接受域执行统计判决:求统计量的值,并查表求出有关数据,判断小概率事件是否发生,由此作出判决.提出假设:根据问题的要求,提出原假设H0与对立假设H1,给定显著水平及样本容量n.总结前面例1处理问题的思想与方法,可得处理参数假设检验问题的步骤如下:(1)(2)(3)确定拒绝域:用参数的一个好的估计量 (通常取为的无偏估计)来代替 ,分析拒绝域<>D的形式,构造检验统计量g( ),在H0成立的前提下确定g( )的概率分布,通过等式确定<>D.其中确定拒绝域是关键.拒绝域的形式一般由原假设与对立假设共同确定,对同一原假设H0,不同的对立假设所得到的H0的拒绝域可能不同.请看下例。
例2数据同前面例1,问总体的均值是否明显大于4.55?在统计学中,只有当与4.55的偏差大到一定程度时才可认为在本例中,拒绝H0时接受的是,因而H0的拒绝取为较合理此问题的合理假设为解的无偏估计是的一个很好的近似值用代替在例8.1中,拒绝H0时接受的是H1:两个数的偏差用其差的绝对值来衡量因而其拒绝域设为较合理与例1中的拒绝域不同在H0成立的条件下,事件发生的概率应很小设P(A)= ,统计量由得所以拒绝域为所以判决结果为:接受H0三、参数假设检验与区间估计的关系参数的区间估计则是找一个随机区间I,使I包含待估参数是个大概率事件.参数假设检验的关键是要找一个确定性的区域(拒绝域),使得当H0成立时,事件是一个小概率事件一旦抽样结果使小概率事件发生,就否定原假设H0对此两类问题,都是利用样本对参数作判断:一个是由小概率事件否定参数属于某范围,另一个则是依大概率事件确信某区域包含参数的真值.两者本质上殊途同归,一类问题的解决,导致解决另一类问题类比方案的形成.为的置信区间如设总体已知,给定容量n的样本则参数的置信度为样本均值为的置信区间为假设检验问题的拒绝域为接受域为时,接受也就是说,当即在区间内,此区间正是的置信度习题8-11.何谓统计假设?2.试述普通反证法与概率反证法的异同点.3.试述检验统计假设的步骤.4.设总体,为未知参数,为其一个样本,对下述假设检验问题取拒绝域为:试求常数c,使得该检验的显著水平为0.05.m第二节正态总体均值的假设检验本节讨论有关正态总体的均值的假设检验问题.构造合适的检验统计量并确定其概率分布是解决检验问题的关键.若检验统计量服从标准正态分布(分布,F分布)则所得到的相应检验法称为U 检验法( 检验法,F 检验法)一、 U 检验法(方差已知)在方差已知的条件下,对一个正态总体的均值或两个正态总体均值差的假设检验常用U 检验法.若X1,X2,…,Xn为取自总体X的样本设总体已知,给定显著水平检验以下不同形式的假设问题:下面我们来求H03的拒绝域前两个为简单假设检验问题,我们已在例1及例2中求出其拒绝域分别为和其中(1)H03的拒绝域形式为等价形式为(k待定)若H03成立,则要控制只需令由此得此处所以H03的拒绝域为(2)比较两种假设检验问题:对于后面将要讨论的有关正态总体的参数假设检验问题也有类似结果.可以看出尽管两者原假设形式不同,实际意义也不一样,但对于相同的显著水平,它们的拒绝域是相同的。
因此,遇到H03与H13的检验问题,可归结为H02与H12来讨论.下面求两个正态总体均值差检验的拒绝域。
设总体X与Y相互独立已知从两总体中分别取容量为n1、n2的样本用,分别表示样本均值、给定显著水平检验假设的无偏估计分别为显然,H0的拒绝形式应为(k待定)由于若H0真,则统计量由得拒绝域为(3)例 1 一种燃料的辛烷等级服从正态分布,其平均等级,标准差.现抽取25桶新油,测试其等级,算得平均等级为97.7.假定标准差与原来一样,问新油的辛烷平均等级是否比原燃料的辛烷平均等级偏低?()解按题意需检验假设检验统计量拒绝域(参阅表8-1)查正态分布表得计算统计值执行统计判决故拒绝H0,即认为新油的辛烷平均等级比原燃料辛烷的平均等级确实偏低.二、 t 检验法(方差未知)设总体未知对显著水平检验假设拒绝域形式(k待定)注意到S2是的无偏估计,用S代替由于未知,现在不能用来作为检验统计量采用作为检验统计量当H0真时,由得所以拒绝域为(4)类似可给出假设的拒绝域为(5)对正态总体关于的各种形式的假设检验的拒绝域列于表8-1.例 2 一手机生产厂家在其宣传广告中声称他们生产的某种品牌的手机的待机时间的平均值至少为71.5小时,一质检部门检查了该厂生产的这种品牌的手机6部,得到的待机时间为69,68,72,70,66,75设手机的待机时间,由这些数据能否说明其广告有欺骗消费者之嫌疑?()解问题可归结为检验假设由于方差未知,用t 检验。