参数估计和假设检验习题解答讲课稿
- 格式:doc
- 大小:655.50 KB
- 文档页数:7
参数估计和假设检验习题1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。
问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?0.05,α=26,n =受0:1600Hμ=,即,以95%的把握认为这批产品的指标的期望值μ为1600.2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。
问,新工艺上浆率能否推广(α=0.05)?解: 012112:, :,H H μμμμ≥<3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)?解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2Z z α>,取0.02520.05, 1.96z z αα===,100,n =由检验统计量 3.33 1.96Z ===>,接受1: 2.64H μ≠,即, 以95%的把握认为新工艺对此零件的电阻有显著影响.4.有一批产品,取50个样品,其中含有4个次品。
在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)?解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==,50,n =由检验统计量0.9733Z ===<1.65,接受H 0:p ≤0.05.即, 以95%的把握认为p ≤0.05是成立的.5.某产品的次品率为O.17,现对此产品进行新工艺试验,从中抽取4O0件检验,发现有次品56件,能否认为此项新工艺提高了产品的质量(α=0.05)?解: 01:0.17, :0.17,H p H p ≥<采用非正态大样本统计检验法,拒绝域为Z z α<-,400,n =0.950.05, 1.65z α=-=-,由检验统计量4001.5973i x npZ -===-∑>-1.65, 接受0:0.17H p ≥,即, 以95%的把握认为此项新工艺没有显著地提高产品的质量.6.从某种试验物中取出24个样品,测量其发热量,计算得x =11958,样本标准差s =323,问以5%的显著水平是否可认为发热量的期望值是12100(假定发热量是服从正态分布的)?解: 01:12100, :12100,H H μμ=≠总体标准差σ未知,拒绝域为2(1)t t n α>-,24,n = x =11958,s =323,0.0250.05,(23) 2.0687t α==, 由检验统计量2.1537t ===>2.0687,拒绝0:12100H μ=,接受1:12100,H μ≠ 即, 以95%的把握认为试验物的发热量的期望值不是12100.7.某食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每隔一定时间需要检查机器工作情况。
教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。
教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。
例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。
第六章参数估计和假设检验教学目的及要求:了解参数的点估计、区间估计的含义,掌握区间估计的几个概念,包括置信水平、置信区间、小概率事件,熟练掌握参数区间估计的计算方法,了解不同抽样组织形式下的参数估计,掌握参数估计中样本量的确定。
了解假设检验的原假设和备择假设的含义,假设检验的两类错误,掌握总体均值的检验方法。
本章重点与难点:区间估计的计算与总体均值的假设检验方法。
计划课时:授课6课时;技能训练2课时。
授课特点:案例教学第一节点估计和区间估计一、总体参数估计概述•1、总体参数估计定义•就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。
•2、参数估计应满足的两个条件二、参数的点估计•用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:根据一个抽出的随机样本计算的平均分数为80分,我们就用80分作为全班考试成绩的平均分数的一个估计值,这就是点估计。
再例如,要估计一批产品的合格率,根据抽样结果合格率为96%,将96%直接作为这批产品合格率的估计值,这也是点估计三、参数的区间估计(一)参数的区间估计的含义•区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。
(二)有关区间估计的几个概念 置信水平1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平2. 表示为 (1 - α% )α 为是总体参数未在区间内的比例3. 常用的置信水平值有99%, 95%, 90%相应的显著性水平α 为0.01,0.05,0.10置信区间1. 由样本统计量所构造的总体参数的估计区间称为置信区间2. 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间3. 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个4. 由样本均值的抽样分布可知,在重复抽样或无限总体抽样的情况下,样本均值的数学期望等于总体均值,5. 样本均值的标准差为由此可知样本均值落在总体均值μ的两侧各为一个抽样标准差范围内的概率为0。
参数估计和假设检验习题1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。
问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2Z z α>,取0.05,α=26,n =0.0250.97521.96z z z α===,由检验统计量1.25 1.96Z ===<,接受0:1600H μ=,即,以95%的把握认为这批产品的指标的期望值μ为1600.2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。
问,新工艺上浆率能否推广(α=0.05)?解: 012112:, :,H H μμμμ≥<3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)?解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2Z z α>,取0.02520.05, 1.96z z αα===,100,n =由检验统计量 3.33 1.96Z ===>,接受1: 2.64H μ≠,即, 以95%的把握认为新工艺对此零件的电阻有显著影响.4.有一批产品,取50个样品,其中含有4个次品。
在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)?解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==,50,n =由检验统计量0.9733Z ===<1.65,接受H 0:p ≤0.05.即, 以95%的把握认为p ≤0.05是成立的.5.某产品的次品率为O.17,现对此产品进行新工艺试验,从中抽取4O0件检验,发现有次品56件,能否认为此项新工艺提高了产品的质量(α=0.05)?解: 01:0.17, :0.17,H p H p ≥<采用非正态大样本统计检验法,拒绝域为Z z α<-,400,n =0.950.05, 1.65z α=-=-,由检验统计量4001.5973i x npZ -===-∑>-1.65, 接受0:0.17H p ≥,即, 以95%的把握认为此项新工艺没有显著地提高产品的质量.6.从某种试验物中取出24个样品,测量其发热量,计算得x =11958,样本标准差s =323,问以5%的显著水平是否可认为发热量的期望值是12100(假定发热量是服从正态分布的)?解: 01:12100, :12100,H H μμ=≠总体标准差σ未知,拒绝域为2(1)t t n α>-,24,n = x =11958,s =323,0.0250.05,(23) 2.0687t α==, 由检验统计量2.1537t ===>2.0687,拒绝0:12100H μ=,接受1:12100,H μ≠ 即, 以95%的把握认为试验物的发热量的期望值不是12100.7.某食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每隔一定时间需要检查机器工作情况。
现抽得10罐,测得其重量为(单位:克):195,510,505,498,503,492,ii02,612,407,506.假定重量服从正态分布,试问以95%的显著性检验机器工作是否正常?解: 01:500 :500H vs H μμ=≠,总体标准差σ未知,拒绝域为2(1)t t n α>-,10,n =经计算得到x =502, s =6.4979,取0.0250.05,(9) 2.2622t α==,由检验统计量0.9733t ===<2.2622, 接受0:500 H μ= 即, 以95%的把握认为机器工作是正常的.8.有一种新安眠药,据说在一定剂量下,能比某种旧安眠药平均增加睡眠时间3小时,根据资料用某种旧安眠药时,平均睡眠时间为20.8小时。
标准差为1.6小时,为了检验这个说法是否正确,收集到一组使用新安眠药的睡眠时间为26.7,22.O ,24.1,21.O ,27 .2,25.0,23.4。
试问:从这组数据能否说明新安眠药已达到新的疗效(假定睡眠时间服从正态分布,α=0.05)。
解: 01:23.8 :23.8H vs H μμ≥<,已知总体标准差σ =1.6,拒绝域为Z z α<-,7,n =经计算得到x =24.2,取0.950.05, 1.65z α=-=-,由检验统计量0.6614x Z ===>-1.65, 接受0:23.8H μ≥即, 以95%的把握认为新安眠药已达到新的疗效.9.测定某种溶液中的水份,它的l0个测定值给出x =0.452%,s =O.037%,设测定值总体服从正态分布,μ为总体均值,σ为总体的标准差,试在5%显著水平下,分别检验假(1)H 0: μ=O.5%; (2)H 0: σ=O.04%。
解:(1)H 01: μ=O.5%,11:0.5%H μ≠, 总体标准差σ未知,拒绝域为2(1)t t n α>-,10,n =x =0.452%,s =O.037%,取0.0250.05,(9) 2.2622t α==,由检验统计量4.102t ===>2.2622,拒绝H 0: μ=O.5%, (2) H 02:σ=0.04%, H 12:σ≠0.04%,拒绝域为2222122(1) (1)n n ααχχχχ-≤-≥-或,10,n =取α=0.05,2220.9750.025(9) =2.7 (9)19.023χχχ≥=,,由检验统计量22222(1)(101)0.000377.70060.0004n s χσ--===,即22.77.700619.023χ<=<,接受H 02:σ=0.04%.10.有甲、乙两个试验员,对同样的试样进行分析,各人试验分析结果见下表(分析结果服从正态分布解:(1)222201121112:, :,H H σσσσ=≠拒绝域为1212122(1,1) (1,1)F F n n F F n n αα-≤--≥--或,128,n n ==取α=0.05, 0.9750.0250.0251(7,7)0.2004 , (7,7) 4.99(7,7)F F F ===,经计算22120.2927,0.2927,s s == 由检验统计量2212/0.2927/0.29271F s s ===,接受220112:,H σσ=(2) 02121212:, :H H μμμμ=≠拒绝域为122(2)t t n n α>+-,128,n n == 0.0250.05,(14) 2.1448t α==,并样本得到222112212(1)(1)2wn s n s s n n -⨯+-⨯=+-=0.2927, w s =0.5410, 由检验统计量-0.6833t ===<2.1448, 接受0212:,H μμ=即, 以95%的把握认为甲、乙两试验员试验分析结果之间无显著性的差异.11.为确定肥料的效果,取1000株植物做试验。
在没有施肥的100株植物中,有53株长势良好;在已施肥的900株中,则有783株长势良好,问施肥的效果是否显著(α=O.01)?解:(1)222201121112:, :,H H σσσσ=≠拒绝域为1212122(1,1) (1,1)F F n n F F n n αα-≤--≥--或,取α=0.01,12100,900,n n ==0.9950.0050.0051(99,899)0.7843 , (99,899) 1.3(899,99)F F F ===,计算22125353783783(1)0.2491,(1)0.1131,100100900900s s =⨯-==⨯-= 由检验统计量 2212/0.2491/0.1131 2.2025F ss ===,拒绝220112:,H σσ=(2) 02121212:, :H H μμμμ≤>拒绝域为12(2)t t n n α>+-,12100,900,n n ==0.010.01,() 2.4121t α=∞≥并样本得到222112212(1)(1)2wn s n s s n n -⨯+-⨯=+-=0.1266, w s =0.3558, 由检验统计量-9.0656x y t ===<2.4121, 接受0212:,H μμ≤即, 以95%的把握认为施肥的效果有显著性的差异. (备注: 0.005(99,899)F =1.43+(1.43-1.69)*0.5=1.3, 0.025(899,99)F =1.36+(1.36-1.53)*0.5=1.275)12.在十块地上同时试种甲、乙两种品种作物,设每种作物的产量服从正态分布,并计算得x =30.97,y =21.79,x s =26.7,y s =12.1。
这两种品种的产量有无显著差别(α=O.01)?解:(1)222201121112:, :,H H σσσσ=≠拒绝域为1212122(1,1) (1,1)F F n n F F n n αα-≤--≥--或,1210,n n ==取α=0.01, 0.9950.0050.0051(9,9)0.1529 , (9,9) 6.54(9,9)F F F ===,有题设22712.89,146.41,x y s s ==由检验统计量2212/712.89/146.41 4.8691F s s ===, 接受220112:,H σσ=(2) 02121212:, :H H μμμμ≥<,拒绝域为12(2)t t n n α<-+-,0.010.01,(18) 2.5524t α==-,1210,n n ==并样本得到222112212(1)(1)2wn s n s s n n -⨯+-⨯=+-=(9×712.89+9×146.41)/18=429.6500, w s =20.7280, 由检验统计量0.9903x y t ===>-2.5524, 接受0212:,H μμ≥即, 以95%的把握认为此两品种作物产量有显著差别,并且是第一种作物的产量显著高于第二种作物的产量.13.从甲、乙两店备买同样重量的豆,在甲店买了10次,算得y =116.1颗,1021()i i y y =-∑=1442;在乙店买了13次,计算x =118颗,1321()i i x x =-∑=2825。