8.1.2假设检验的两类错误和假设的提法
- 格式:pptx
- 大小:74.95 KB
- 文档页数:36
第四版统计学课后习题答案《统计学》第四版统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
假设检验中的两类错误及其控制方法假设检验是统计学中常用的一种推断方法,用于判断关于总体参数的假设是否成立。
在进行假设检验时,我们一般会面临两类错误,即第一类错误和第二类错误。
本文将介绍这两类错误的含义、造成原因以及控制方法。
一、第一类错误的含义及控制方法第一类错误,也被称为α错误,指的是当原假设为真时,却错误地拒绝了原假设的情况。
换句话说,第一类错误意味着我们得出了一个错误的结论,即在事实上不存在的关系。
控制第一类错误的方法主要是通过控制显著性水平α来实现。
1. 显著性水平的控制显著性水平α定义了我们在进行假设检验时拒绝原假设的临界值。
通常情况下,α的取值为0.05或0.01,代表了我们容忍犯第一类错误的概率。
较小的α值会降低犯第一类错误的风险,但同时也增加了犯第二类错误的概率。
2. 样本容量的控制样本容量对于控制第一类错误也至关重要。
较大的样本容量可以提供更多的信息,从而降低犯第一类错误的概率。
因此,在进行假设检验时,我们应尽可能选择足够大的样本容量来增加推断的准确性。
二、第二类错误的含义及控制方法第二类错误,也被称为β错误,指的是当原假设为假时,却错误地接受了原假设的情况。
换句话说,第二类错误意味着我们未能发现事实上存在的关系。
控制第二类错误的方法主要是通过改进实验设计或增大样本容量来实现。
1. 实验设计的改进良好的实验设计可以降低发生第二类错误的概率。
例如,在两组样本进行比较时,我们可以增加处理组与对照组的差异,从而提高检测到显著差异的能力。
此外,合理的随机分组和对照设计也能够有效地控制第二类错误。
2. 样本容量的增大与控制第一类错误类似,增大样本容量也是控制第二类错误的一种方法。
较大的样本容量可以提高检测到真实差异的概率,从而减少第二类错误的发生。
在做出假设检验计划时,我们应考虑到研究资金、时间和实验设计等方面的限制,尽可能选择足够大的样本容量。
总结:在假设检验中,我们需要控制两类错误,即第一类错误和第二类错误。
假设检验中的第一类错误和第二类错误分别是什么如何控制错误率在统计学中,假设检验是一种常用的统计方法,用于对一个或多个统计假设进行验证。
然而,在进行假设检验时,我们经常会遇到两种错误,即第一类错误和第二类错误。
本文将详细介绍这两种错误的含义,并讨论如何控制错误率。
一、第一类错误第一类错误是指在进行假设检验时,当原假设为真时却拒绝了原假设的情况。
换句话说,第一类错误是将正态分布的假设标为非正常分布。
一般将第一类错误的概率表示为α(alpha),称为显著性水平。
α的大小决定了拒绝原假设的标准。
常见的α值有0.05和0.01,分别对应着5%和1%的显著性水平。
控制第一类错误的方法之一是选择适当的显著性水平。
一般来说,当研究的结果对于决策具有较大的影响时,选择较小的α值可以帮助我们更加谨慎地作出决策。
另一种方法是增加样本量,通过增加样本量可以减小概率发生第一类错误的可能性。
二、第二类错误第二类错误是指在进行假设检验时,当原假设为假时却未能拒绝原假设的情况。
换句话说,第二类错误是将非正态分布的假设标为正态分布。
一般将第二类错误的概率表示为β(beta)。
控制第二类错误的方法之一是增加显著性水平α。
增加α会减小β,从而减小发生第二类错误的可能性。
然而,增加α的同时会增加发生第一类错误的概率,所以在进行假设检验时需要权衡这两个错误。
另一种方法是增加样本量。
增加样本量有助于减小概率发生第二类错误的可能性,提高假设检验的准确性。
总结假设检验中的第一类错误和第二类错误都是我们在进行统计推断时需要注意的问题。
第一类错误涉及将正态分布的假设标为非正常分布,第二类错误则涉及将非正态分布的假设标为正态分布。
在进行假设检验时,我们可以通过选择适当的显著性水平和增加样本量来控制这两种错误。
然而,在实际应用中,控制错误率是一个复杂的问题。
我们需要对研究的背景、目的和具体情况进行综合考虑,选择合适的错误率控制方法。
同时,我们也需要警惕其他可能导致错误的因素,例如统计模型设定不当或数据收集不准确等。
我来尝试给你讲清统计学中的假设检验和两类错误学习过统计的同学一定对“两类错误”不会陌生,但是否已经完全理清了其中的逻辑,想必要打一个问号了。
希望我今天能“不辱使命”,用你听得懂的语言给你讲清楚这整套内容。
1. 从玩色子看假设检验到底在干嘛首先,两类错误是出现在假设检验过程中的,所以我们得先弄明白假设检验到底在做什么。
简单举一个赌桌上的例子。
看完周润发的《赌神》之后,朋友小金也来到赌场赌色子,一个色子,买单双号:1、3、5为单,2、4、6为双。
小金玩了100把,但是就只有4次买中,气的小金直跺脚,直呼运气太背……难道小金的运气就这么差吗?咱们回头看看,是否哪里有猫腻。
你肯定已经想到,每一把小金就算瞎猜,也会有50%的可能性猜对,这样重复玩100把,平均而言有50把的机会能买中,现在他只买中4把,这怎么可能呢?那原因在哪?很简单,问题出在色子上,我们说平均会有50把买中是建立在一个假设上的:色子是均匀的,没有人动手脚。
但现在的情况是,他确实只买中了4把,而如果色子是均匀的,那么这种情况发生的概率及其微小,接近0,概率接近0的事情一般在一次试验(这100把游戏)下是不可能发生的,但现在却真真切切的发生了,于是,我们就有理由怀疑假设的真实性。
在这个例子中,我们就会怀疑色子可能不是均匀的,或者被人为操控了。
所以,假设检验的基本逻辑就是:我们为了解决一个疑问,就先做一个假设,然后在这个假设的基础上推测已经发生了的事情的概率(在这个例子里面就是“小金猜中4次或少于4次的概率”),如果这个概率低于我们设定的参考值(如0.05),则我们就拒绝假设;而如果这个概率大于0.05,则我们就没有理由来拒绝原假设。
2. 第一类错误的概率为什么是α明白了假设检验的逻辑之后,我们就可以开始分析第一类错误。
统计学上把原假设H0为真而拒绝原假设称为犯了第一类错误。
回到小金的例子,因为他只买中4把,根据推测,他是有理由拒绝色子是均匀的这个原假设,但事后通过专业人员检验发现:色子没有问题,纯粹是小金的运气太背了,那么这时,小金就犯错了,这便是第一类错误的由来,接着我们会问,犯这个错误的概率是多少呢?为了便于理解,我们可以看另外一个计算简单的例子。
2.假设检验的两类错误当假设0H 正确时,小概率事件也有可能发生,我们会拒绝假设,0H 因而犯了“弃真”的错误,称此为第一类错误.犯第一类错误的概率恰好就是“小概率事件”发生的概率,α即{P 拒绝00|H H 为真}.α=反之,若假设0H 不正确,但一次抽样检验结果未发生不合理结果,这时我们会接受,0H 因而犯了“取伪”此时,的错误,称此为第二类错误,的概率,即记β为犯第二类错误{P 接受00|H H 为不真}.β=假设检验的犯两类错误的概率的关系:理论上,自然希望犯这两类错误的概率都很小,当样本容量n 固定时,βα,不能同时都小,小时,β就变大;而β变小时,α就变大. 兼顾,在实际应用中,一般原则是:控制犯第一类错误的概率,即给定,α然后通过增大样本容量但即α变二者不可n 来减小.β关于显著性水平的选取:若注重经济效益,α可小些,如;01.0=α若注重社会效益,α可大些,如;1.0=α若要兼顾经济效益和社会效益,一般可取.05.0=αα3.假设检验问题的提法在假设检验问题中,把要检验的假设0H 称为原假设(零假设或基本假设),把原假设0H 的对立面称为备择假设或对立假设,记为.1H 例1某化学日用品有限责任公司用包装机包装洗衣粉,洗衣粉包装机在正常工作时,)22(单位:g),每天开工后,需先检验包装机工作是否正常.某天开工后,在装好的洗衣粉中任取9袋,其重量为:NX ~装包量,500(本例的假设检验问题可简记为:)350.(:,:00100=≠=μμμμμH H (1)形如(1)式的备择假设,1H 表示μ可能大于,0u 能小于,0u 称为双侧(边)备择假设.也可形如(1)式的假设检验称为双侧(边)假设检验.假设总体标准差σ不变,即,2=σ试问这天包装机工作是否正常?505499502506498498497510503在实际问题中,有时还需要检验下列形式的假设:.:,:0100μμμμ>≤H H .:,:0100μμμμ<≥H H (2)(3)形如(2)式的假设检验称为右侧(边)检验.形如(3)式的假设检验称为左侧(边)检验.右侧(边)检验和左侧(边)检验统称为单侧(边)检验.为检验提出的假设,通常需构造检验统计量,并取总体的一个样本值,根据该样本提供的信息来判断假设是否成立.值时,我们拒绝原假设,0H 拒绝域的边界点称为临界点.完当检验统计量取某个区域W 中的则称区域W 为拒绝域,。
假设检验中的两类错误及其控制方法在统计学中,假设检验是一种常用的分析方法,用于判断某个假设是否成立。
然而,进行假设检验时会存在两类错误,即第一类错误和第二类错误。
了解并掌握如何控制这两类错误是进行可靠假设检验的关键。
本文将介绍两类错误的概念以及控制方法。
一、第一类错误第一类错误,也称为α错误,是指当原假设为真时,拒绝原假设的错误。
这种错误将导致我们错误地得出结论,即拒绝了一个事实上是真实的假设。
为了控制第一类错误,我们可以通过设置显著性水平来进行调控。
显著性水平(α)是指在假设检验中所容忍的第一类错误的最大概率。
常见的显著性水平有0.05和0.01,分别表示一类错误的容忍程度为5%和1%。
设定更严格的显著性水平会减少第一类错误的发生概率,但同时也增加了第二类错误的风险。
二、第二类错误第二类错误,也称为β错误,是指当原假设不真实时,不能拒绝原假设的错误。
这种错误将导致我们未能发现一个实际上是错误的假设。
相比于第一类错误,控制第二类错误要更具挑战性。
通常,我们无法直接控制第二类错误的概率,但可以通过增加样本容量或改变检验方法来降低第二类错误的风险。
增加样本容量是一种常见的控制第二类错误的方法。
样本容量的增加意味着我们会有更多的观察值用于分析,从而提高检验的灵敏度。
通过增加样本容量,我们可以更容易地检测到真实效应,减少第二类错误的概率。
另一种控制第二类错误的方法是改变检验方法。
例如,可以选择更合适的统计检验方法,或者调整假设检验的参数,以提高检验的效力和准确性。
然而,改变检验方法需要在实践中进行谨慎考虑,并且需要充分了解不同方法的优缺点。
综上所述,假设检验中存在两类错误,即第一类错误和第二类错误。
为了控制第一类错误,可以通过设置显著性水平来调控。
而控制第二类错误则需要采取增加样本容量和改变检验方法等措施。
在进行假设检验时,我们应该充分考虑两类错误的控制方法,确保得出准确可靠的结论。
(文章长度:520字)。
第一类错误(Type I error):原假设H为真,但由于样本的随机性,使样的结论,这类错误称为第一类错本观测值落入拒绝域,从而作出拒绝H误,它发生的概率称为犯第一类错误的概率,也称为“拒真概率”.第二类错误(Type II error):原假设H为假,但由于样本的随机性,使样的结论,这类错误称为第二类错本观测值落入接受域,从而作出保留H误,它发生的概率称为犯第二类错误的概率,也称为“取伪概率”.真实情况所作判断接受H 0拒绝H 0H 0为真H 0为假正确正确第一类错误(弃真)第二类错误(取伪)易知:第一类错误的概率=“拒真概率”=P (W |H 0)第二类错误的概率=“取伪概率”=P (A |H 1)1(|)P W H例1.某餐厅每天的营业额服从正态分布,按照以往的老菜单营业,营业额的均值μ0为8000,标准差σ为640.目前,该餐厅试用一新菜单,经过九天的运营,发现平均每天的营业额为8300,经理想知道这个差别是否是由于新菜单而引起的.(假定按照新菜单营业,营业额的标准差依然为640)H 0:μ=μ0=8000H 1:μ≠μ0=8000拒绝域为计算此检验犯两类错误的概率.:|800041.|813W x -≥解:先求犯第一类错误的概率易知当H 0成立H 0:μ=μ0=8000H 1:μ≠μ0=8000N (0,1):|800041.|813Wx -≥2220.0252418.13 1.96640964096409z z α=⨯==0(|)P W H (|8000|418.13|8000)P X μ=-≥=22(|8000|6409|8000)P X z αμ=-≥=22|8000|(|8000)6409X P z αμ-=≥=0.05α==2~(8000,6409)X N第二类错误的概率:H 1成立X N 2~(,6409)μH 0:μ=μ0=8000H1:μ≠μ0=8000:|800041.|813W x -≥1(|)P W H 22(|8000|6409|8000)P X z αμ=-<≠2222(8000640980006409|8000)P z X z ααμ=-<<+≠2222228000640980006409()()64096409z z ααμμ+---=Φ-Φ222280008000()()64096409z z αα--=Φ+-Φ-在一般情形,当样本容量固定时,减小一类错误概率会导致另一类错误概率的增加.我们总希望所用的检验方法尽量少犯错误,但不能完全排除犯错误的可能性.理想的检验方法应使犯两类错误的概率都很小.第一类错误的概率P W H 0(|)α=第二类错误的概率P (W |H 0)=α减小,导致z α/2增大,增大.12222(|)))64096409P W H z z αα=Φ+-Φ-1(|)P W H要同时降低两类错误的概率,或者要在第一类错误的概率不变的条件下降低第二类的错误概率,需要增加样本容量.一般来说,我们总是控制犯第一类错误的概率,使它不大于 .再在这一限制下使第二类的错误发生的概率尽可能地小.——控制第一类错误的原则H0与H1地位应平等,但在控制犯第一类错误的概率的原则下,使得采取拒绝H0的决策变得较慎重,即H得到特别的保护.因而,通常把有把握的、有经验的、不能轻易否定的结论作为原假设,或者尽可能使后果严重的错误成为第一类错误.关于零假设与备择假设的选取例2.设总体X ~N (μ,1),其中μ为未知参数,X 1,X 2,…,X 9为来自总体X 的一个样本,考虑假设检验问题H 0:μ=2,H 1:μ=3,若检验的拒绝域由所确定.求该检验犯第一类错误的概率α和第二类错误的概率β.解:当原假设H 0:μ=2成立时,19{(,,): 2.6}W X X X =≥1~(2,)9X N 0(|)( 2.6|2)P W H P X αμ==≥=1/91/9X P =≥1(0.69)1(1.8)10.96410.0459=-Φ=-Φ=-=10.69)1/9X P =-<例2.H 0:μ=2,H 1:μ=3,检验的拒绝域由所确定.求第二类错误的概率β.解:当原假设H 1:μ=3成立时,犯第二类错误的概率为1~(3,)9X N 19{(,,): 2.6}W X X X =≥1(|)( 2.6|3)P W H P X βμ==<=32.63()1/91/9X P --=<(0.49)1/9X P =<-1(1.2)10.88490.1151=-Φ=-=( 1.2)=Φ-例3.设总体X ~π(λ),其中λ>0为未知参数,X 1,X 2,X 3为来自总体X 的一个样本,考虑假设检验问题H 0:λ=3,H 1:λ=1/3,若检验的拒绝域由W ={X 1+X 2+X 3≤1.5}所确定.求该检验犯第一类错误的概率α和第二类错误的概率β.解:当H 0:λ=3成立时,X 1+X 2+X 3~π(9)0919990!1!e e --=+α=P (W ≤1.5|λ=3)=P (X 1+X 2+X 3≤1.5|λ=3)= P (X 1+X 2+X 3 =0)+P (X 1+X 2+X 3 =1)=10e −9犯第一类错误的概率为例2.假设检验问题H 0:λ=3,H 1:λ=1/3,检验的拒绝域为W ={X 1+X 2+X 3≤1.5}.求第二类错误的概率β.解:当H 1:λ=1/3成立时,X 1+X 2+X 3~π(1)123(|13)( 1.5|13)P W P X X X βλλ===++>=1231231(=0)(=1)P X X X P X X X =-++-++01111110!1!e e --=--=1−2e −1。