参数估计和假设检验案例(精)
- 格式:doc
- 大小:119.50 KB
- 文档页数:5
参数估计和假设检验案例假设我们是一家制造公司的数据分析师,公司最近收到用户对产品的投诉,称产品的平均使用寿命低于承诺的使用寿命。
为了验证这一断言,我们希望利用采样数据对产品的平均使用寿命进行估计,并进行假设检验来验证用户的主张。
1.参数估计:为了对产品的平均使用寿命进行估计,我们需要收集一定数量的样本数据。
假设我们从该公司生产的100个产品中随机选择了20个,然后记录了它们的使用寿命(以年为单位)。
收集到的数据如下:15,12,18,20,14,16,19,17,13,11,14,16,21,15,17,14,13,12,19,18首先,我们需要计算这些数据的样本均值来进行参数估计。
样本均值的计算公式为:样本均值=(15+12+18+20+14+16+19+17+13+11+14+16+21+15+17+14+13+12+19+18)/2 0=16.5因此,用收集到的样本数据估计该公司生产的产品的平均使用寿命为16.5年。
2.假设检验:接下来,我们需要进行假设检验来验证用户的主张。
在本案例中,我们的原假设(H0)为产品的平均使用寿命等于承诺的使用寿命,备择假设(H1)为产品的平均使用寿命小于承诺的使用寿命。
我们设定显著性水平为0.05,即我们希望在5%的置信水平下进行判断。
在通过参数估计得到产品的平均使用寿命估计值后,我们可以利用假设检验来验证该估计值是否与承诺的使用寿命相符。
假设检验的步骤如下:1)设定原假设(H0)和备择假设(H1);2)选择一个合适的统计检验方法;3)计算检验统计量(test statistic);4)计算p值;5)根据p值判断是否拒绝原假设。
在本案例中,由于样本数量较小(n<30),符合正态分布的假设也未被验证,我们可以选择使用t检验来进行假设检验。
根据我们的备择假设,我们希望验证产品的平均使用寿命小于承诺的使用寿命。
因此,我们将进行单样本t检验,计算检验统计量和p值。
参数估计和假设检验案例案例一:工艺流程的检测某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。
在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的800个观测值组成。
这些数据的样本标准差为0.21;因为有如此多的样本数据,因此,总体标准差被假设为0.21。
然后,该公司建议:持续不断地定期抽取容量为30的随机样本以对工艺流程进行检测。
通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。
当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。
设计规格要求工艺流程的均值为12,该公司建议采用如下形式的假设检验。
μ=μ≠H0 :12 H1 :12只要H0被拒绝,就应采取纠正措施。
下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。
问题:1、对每个样本在0.01的显著性水平下进行假设检验,并且确定,如果需要Z0.005=2.582、4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平,哪种错误或误差将增加?显著性水平增加,置信区间减小,误差减小。
案例二:计算机辅助教学会使完成课程的时间差异缩小吗?某课程引导性教程采用一种个性化教学系统,每位学生观看教学录像,然后给以程式化的教材。
每位学生独立学习直至完成训练并通过考试。
人们关心的问题是学生完成训练计划的进度不同。
有些学生能够相当快地完成程式化教材,而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。
学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。
建议的替代系统是使用计算机辅助教学。
在这种方法中,所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。
在整个教程的自我训练过程中,由计算机指导学生独立操作。
为了比较建议的和当前的教学方法,刚入学的122名学生被随机地安排到这两种教学系统中。
概率论与数理统计实验实验3 参数估计假设检验实验目的实验内容直观了解统计描述的基本内容。
2、假设检验1、参数估计3、实例4、作业一、参数估计参数估计问题的一般提法X1, X2,…, Xn要依据该样本对参数作出估计,或估计的某个已知函数.现从该总体抽样,得样本设有一个统计总体,总体的分布函数向量). 为F(x, ),其中为未知参数( 可以是参数估计点估计区间估计点估计——估计未知参数的值区间估计——根据样本构造出适当的区间,使他以一定的概率包含未知参数或未知参数的已知函数的真?(一)、点估计的求法1、矩估计法基本思想是用样本矩估计总体矩.令设总体分布含有个m未知参数??1 ,…,??m解此方程组得其根为分别估计参数??i ,i=1,...,m,并称其为??i 的矩估计。
2、最大似然估计法(二)、区间估计的求法反复抽取容量为n的样本,都可得到一个区间,这个区间可能包含未知参数的真值,也可能不包含未知参数的真值,包含真值的区间占置信区间的意义1、数学期望的置信区间设样本来自正态母体X(1) 方差?? 2已知, ?? 的置信区间(2) 方差?? 2 未知, ?? 的置信区间2、方差的区间估计未知时, 方差?? 2 的置信区间为(三)参数估计的命令1、正态总体的参数估计设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)此命令以alpha 为显著性水平,在数据X下,对参数进行估计。
(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计.例1、给出两列参数?? =10, ??=2正态分布随机数,并以此为样本值,给出?? 和?? 的点估计和区间估计命令:r=normrnd(10,2,100,2);[mu,sigm,muci,sigmci]=normfit(r);[mu1,sigm1,muci1,si gmci1]=normfit(r,0.01);mu=9.8437 9.9803sigm=1.91381.9955muci=9.4639 9.584310.2234 10.3762sigmci=1.68031.75202.2232 2.3181mu1=9.8437 9.9803sigm1=1.91381.9955muci1=9.3410 9.456210.3463 10.5043sigmci1=1.6152 1.68412.3349 2.4346例2、产生正态分布随机数作为样本值,计算区间估计的覆盖率。
参数估计和假设检验习题1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。
问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?0.05,α=26,n =受0:1600Hμ=,即,以95%的把握认为这批产品的指标的期望值μ为1600.2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。
问,新工艺上浆率能否推广(α=0.05)?解: 012112:, :,H H μμμμ≥<3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)?解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2Z z α>,取0.02520.05, 1.96z z αα===,100,n =由检验统计量 3.33 1.96Z ===>,接受1: 2.64H μ≠,即, 以95%的把握认为新工艺对此零件的电阻有显著影响.4.有一批产品,取50个样品,其中含有4个次品。
在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)?解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==,50,n =由检验统计量0.9733Z ===<1.65,接受H 0:p ≤0.05.即, 以95%的把握认为p ≤0.05是成立的.5.某产品的次品率为O.17,现对此产品进行新工艺试验,从中抽取4O0件检验,发现有次品56件,能否认为此项新工艺提高了产品的质量(α=0.05)?解: 01:0.17, :0.17,H p H p ≥<采用非正态大样本统计检验法,拒绝域为Z z α<-,400,n =0.950.05, 1.65z α=-=-,由检验统计量4001.5973i x npZ -===-∑>-1.65, 接受0:0.17H p ≥,即, 以95%的把握认为此项新工艺没有显著地提高产品的质量.6.从某种试验物中取出24个样品,测量其发热量,计算得x =11958,样本标准差s =323,问以5%的显著水平是否可认为发热量的期望值是12100(假定发热量是服从正态分布的)?解: 01:12100, :12100,H H μμ=≠总体标准差σ未知,拒绝域为2(1)t t n α>-,24,n = x =11958,s =323,0.0250.05,(23) 2.0687t α==, 由检验统计量2.1537t ===>2.0687,拒绝0:12100H μ=,接受1:12100,H μ≠ 即, 以95%的把握认为试验物的发热量的期望值不是12100.7.某食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每隔一定时间需要检查机器工作情况。
教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。
教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。
例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。
参数估计和假设检验案例下面将通过一个实际案例来说明参数估计和假设检验的应用。
假设我们想要研究一些国家的大学生平均每天在手机上花费的时间。
我们希望通过对一部分学生进行调查来估计总体的平均时间,并且判断是否存在大学生在手机上花费的平均时间超过全国平均水平的情况。
首先,我们需要制定一个合适的假设。
在这个案例中,我们可以设立如下假设:-零假设H0:国家大学生在手机上花费的平均时间不超过全国平均水平-备择假设H1:国家大学生在手机上花费的平均时间超过全国平均水平接下来,我们需要收集一定数量的样本数据。
根据我们的研究目标,我们可以随机抽取一部分大学生作为样本,并且记录他们每天在手机上花费的时间。
在这个案例中,我们假设抽取了100名大学生作为样本,然后每天记录他们在手机上花费的时间。
接着,我们计算出样本的平均时间,记为X̄。
接下来,我们需要进行参数估计。
参数估计是通过样本数据来推断总体参数的取值。
在这个案例中,我们希望估计的参数是国家大学生在手机上花费的平均时间。
假设样本平均时间为X̄,我们可以使用样本均值X̄来估计总体均值μ。
对于大样本情况,可以使用正态分布进行参数估计。
假设我们计算得到的样本均值为4小时,标准差为1小时。
然后,我们需要进行假设检验来判断总体参数是否符合一些特定的假设。
在这个案例中,我们希望判断国家大学生在手机上花费的平均时间是否超过全国平均水平。
我们可以使用t检验进行假设检验。
假设我们选择了显著性水平为0.05、如果计算出的t值落在拒绝域内,则拒绝原假设,否则接受原假设。
假设样本平均时间为X̄,总体均值为μ0(全国平均水平),样本标准差为S,样本容量为n。
我们可以计算出t值,然后查找查表得到相应的临界值。
假设计算所得t值为2.5,自由度为99、根据查表可以得到在显著性水平为0.05时,临界值为1.984、由于计算所得t值大于临界值,所以我们可以拒绝原假设。
通过参数估计和假设检验,我们得出结论:国家大学生在手机上花费的平均时间超过全国平均水平。
参数估计与假设检验案例在统计学中,参数估计是一种通过对样本数据做出合理的推测来估计总体参数的方法。
假设检验则是一种基于样本数据进行统计推断的方法,用于判断对于一个总体的一些假设是否可接受。
为了更好地理解参数估计和假设检验的应用,我们可以考虑以下案例:假设我们是一家电商公司的数据分析师,想要评估一项新推出的增值服务是否对用户购买力有正面影响。
具体而言,我们想知道购买了增值服务的用户相对于没有购买的用户,在订单总金额上是否存在显著差异。
首先,我们需要建立两个假设:1.零假设(H0):购买增值服务与订单总金额之间不存在显著差异;2.备择假设(H1):购买增值服务与订单总金额之间存在显著差异。
接下来,我们需要进行参数估计。
假设我们从公司的数据库中随机抽取了两组用户数据:一组是购买了增值服务的用户,另一组是没有购买增值服务的用户。
我们从这两组用户中分别计算出了订单总金额的均值和标准差。
然后,我们可以使用参数估计的方法来估计总体订单总金额的均值差异。
具体而言,我们可以使用两个样本的均值差(例如,购买了增值服务的用户订单总金额的均值减去没有购买增值服务的用户订单总金额的均值)作为总体均值差的估计。
此外,我们还可以使用标准差来估计总体均值差的标准误差。
然后,我们可以进行假设检验。
我们使用一个统计量来评估观察到的样本均值差是否足够大,以至于我们可以拒绝零假设并接受备择假设。
在这种情况下,我们可以使用一个双侧t检验来进行假设检验。
假设我们设置了一个显著性水平(α)为0.05,即我们愿意承担5%的错误接受备择假设的风险。
然后,我们计算出双侧t检验的p值(即观察到的样本均值差在零假设下出现的概率)。
如果p值小于0.05,我们可以拒绝零假设,并得出结论:购买了增值服务的用户与没有购买的用户在订单总金额上存在显著差异。
最后,我们可以汇报我们的研究结果和结论。
我们可以得出结论:购买了增值服务的用户相对于没有购买的用户,在订单总金额上存在显著差异。
参数估计与假设检验案例一、案例的背景和现实意义上海五洲信息咨询公司市场部刘经理新世纪第一天上班,刚走进办公室还来不及与同事们互祝新年问候,办公桌上的传真机就响了,这是一份来自美国Lion投资公司的委托书,委托书上的文字十分简单:“2001年10月,美国Lion公司的品牌香槟酒将进入中国市场,现需了解上海市场的有关情况,委托业务费用10万美元。
”随后是Lion酒的产品介绍。
刘经理一看兴奋得差一点跳了起来:这是等待已久的项目,其收人也十分可观。
在与同事们庆祝之后,刘经理陷入了思考,委托书上的要求看似简单,但这是一个十分棘手的项目,如果稍有疏忽不仅将影响到公司的声誉和发展前景,搞得不好还有可能丢了自己的饭碗。
想到这,刘经理马上召集部门的业务骨干,共商对策。
一个多小时的紧张讨论,一个颇为周全的企划方案跃人桌面:这是一个十分典型的市场调查和抽样推断的案例,了解市场有关情况,意味着需掌握洋酒的市场价格、需求量、消费群体、产品市场定位、促销手段、同类产品的市场占有率、销售情况、广告宣传以及消费者的心态、未来洋酒需求能力的推断、潜在用户挖掘的可能性等等。
做好这个项目,关键是切入口的确定。
应该说,刘经理做市场调查是熟门熟路,然而洋酒的市场调查,其调查对象与其他调查的不一样。
对于上海销售的除从法国进口的某些葡萄酒及香槟以外,诸如轩尼诗、人头马、拿破仑、路易十六等品牌,由于其昂贵的价格,市场消费群体并不大,销量也十分有限。
为此,刘经理与同事们反复论证,最后决定,首先拟订一个周密的市场调查方案,然后分头作市场调查及数据处理,最后完成这一项目。
目前中国正处于经济体制的转轨时期,信息资料的搜集也由过去单一的统计报表制度转向了“以周期性普查为基础,经常性的抽样调查为主体,其他调查形式为补充”的调查体制,向市场直接索取资料,将会成为了解市场、获得信息的主要手段,如何完成这一过程,怎样着手做市场调查,最终根据市场信息对未来市场走势作出判断和推测,就显得十分重要和具有现实意义。
参数估计和假设检验案例
案例一:工艺流程的检测
某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。
在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的 800个观测值组成。
这些数据的样本标准差为 0.21;因为有如此多的样本数据,因此,总体标准差被假设为 0.21。
然后,该公司建议:持续不断地定期抽取容量为 30的随机样本以对工艺流程进行检测。
通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。
当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。
设计规格要求工艺流程的均值为 12,该公司建议采用如下形式的假设检验。
H 0 :12 H 1 :12
只要 H 0被拒绝,就应采取纠正措施。
下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。
μ=μ≠
问题:
1、对每个样本在 0.01的显著性水平下进行假设检验,并且确定,如果需要
Z0.005=2.58
2、
4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加?
显著性水平增加,置信区间减小,误差减小。
案例二:计算机辅助教学会使完成课程的时间差异缩小吗?
某课程引导性教程采用一种个性化教学系统, 每位学生观看教学录像, 然后给以程式化的教材。
每位学生独立学习直至完成训练并通过考试。
人们关心的问题是学生完成训练计划的进度不同。
有些学生能够相当快地完成程式化教材, 而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。
学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。
建议的替代系统是使用计算机辅助教学。
在这种方法中, 所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。
μ=
在整个教程的自我训练过程中,由计算机指导学生独立操作。
为了比较建议的和当前的教学方法, 刚入学的 122名学生被随机地安排到这两种教学系统中。
61名学生使用当前程式化教材, 而另外 61名学生使用建议的计算机辅助方法。
记录每位学生的学习时间(小时 ,如表所示。
78 75 80 79 72 69 79 72 70 70 81
76 78 72 82 72 73 71 70 77 78 73
79 82 65 77 79 73 76 81 69 75 75
77 79 76 78 76 76 73 77 84 74 74
69 79 66 70 74 72
建议的计算机辅助方法完成教程的时间(小时
74 75 77 78 74 80 73 73 78 76 76
74 77 69 76 75 72 75 72 76 72 77
73 77 69 77 75 76 74 77 75 78 72
77 78 78 76 75 76 76 75 76 80 77
1、利用适当的描述统计学方法汇总每种方法的训练时间数据。
根据样本资料,
你能观察到
2、利用所学知识评价两种方法总体均值之间的差异,讨论你的结论。
3、计算每一种训练方法的标准差与方差, 进行两种训练方法总体方差相等的假设检验, 讨论你的结论。
检验数 >1.84,所以拒绝原假设,即两个总体方差不相等
4、关于两种方法之间的差异,你能得到什么结论?有何建议?请做出解释。
计算机辅助方法的方差比当前教学方法的方差小, 学生的学习时间差异比较小, 建议使用计算机辅助方法。
5、对于将来要使用哪种训练计划,在做出最终决定之前,你是否还需要其他数据或检验。
不需要。