第八章假设检验§1基本概念一、假设检验的基本原理在总体的分布
- 格式:doc
- 大小:1021.00 KB
- 文档页数:14
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
第八章 假设检验§1 基本概念一、假设检验的基本原理在总体的分布函数完全未知或只知其形式、但不知其参数的情况下, 为了推断总体的某些性质, 提出某些关于总体的假设 例如, 提出总体服从泊松分布的假设;假设检验就是根据样本对所提出的假设作出判断: 是接受, 还是拒绝例1 、某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.当机器正常时, 其均值为0.5千克, 标准差为0.015千克.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512) 问机器是否正常?分析:μσ用和分别表示这一天袋X 装糖重总体的均值和标准差,2 ~(,0.015),X N μ则问题: 根据样本值判断机器正常(0.5μ=)或不正常(0.5 . μ≠) 提出两个对立假设 00:0.5H μμ== 10: H μμ≠再利用已知样本作出判断是接受假设0H (拒绝假设1H ) ,还是拒绝假设0H (接受假设1H ).由于要检验的假设设计总体均值, 故可借助于样本均值来判断。
,X μ因为是的无偏估计量00 , || ,H x μ-所以若为真则不应太大0|||, x x μ-衡量的大小可归结为衡量的大小于是可以选定一个适当的正数k ,当观察值0 ,x k H ≥时拒绝假设,反之当当观察值 x 满足0,.k H <时接受假设。
0~(0,1),X H Z N =因为当为真时由标准正态分布分位点的定义得/2k z α=,/20,,z H α≥时拒绝/2z α<时接受0H 。
过程如下: 0.05,α=在实例中若取定/20.025 1.96,k z z α===则又已知9, n =0.01σ= 0.51x =由样本算得 2.21.96,=>即有于是拒绝0H ,认为包装机工作不正常。
二、假设检验的相关概念1、 原假设(零假设)0H 与备择假设(对立假设)1H2、 显著性水平α 0, ,z k x μ=≥如果则称与的差异是显著的则0, H 拒绝0, , z k x μ=<反之如果则称与的差异是,不显著的0 H 接受α数称为显著性水平,0x μ上述关于与有无显著差异的判断是在显著性水平. α之下作出的3、拒绝域与临界点 当检验统计量取某个区域C 中的值时, 我们拒绝原假设0H , 则称区域C 为0H 的拒绝域, 拒绝域的边界点称为临界点4、 两类错误及记号 假设检验的依据是: 小概率事件在一次试验中很难发生, 但很难发生不等于不发生, 因而假设检验所作出的结论有可能是错误的. 这种错误有两类:(1) 当原假设0H 为真, 观察值却落入拒绝域, 而作出了拒绝0H 的判断, 称做第一类错误, 又叫弃真错误, 这类错误是“以真为假”. 犯第一类错误的概率是显著性水平α00()P H H =拒绝为真(2)当原假设0H 不真,而观察值却落入接受域, 而作出了接受0H 的判断, 称做第二类错误, 又叫取伪错误, 这类错误是“以假为真”. 犯第二类错误的概率记为00()P H H β=接受为假当样本容量n 一定时, 若减少犯第一类错误的概率, 则犯第二类错误的概率往往增大,若要使犯两类错误的概率都减小, 除非增加样本容量.1、显著性检验 只对犯第一类错误的概率加以控制, 而不考虑犯第二类错误的概率的检验, 称为显著性检验二、 假设检验的一般步骤01., H 根据实际问题的要求提出原假设及备择1 H 假设2. n α给定显著性水平以及样本容量3 确定检验统计量以及拒绝域形式004.{}P H H α=按为真拒绝求出拒绝域§2 单个正态总体均值和方差的假设检验 一、单个正态总体均值μ的检验(水平α) 问题1 设总体2(,)XN μσ,样本1,,n X X ,给定检验水平α,待检验问题0010::H H μμμμ=≠(双边检验)解:(1)若2σ为已知,由0H 为真时 N(0,1)X Z =,根据上分位点的概念得2()P Z Z αα>=,所以0H 的拒绝域为2C Z Z α⎧⎫=>⎨⎬⎩⎭,根据样本点可以判断接受还是拒绝0H(2)若2σ为未知,由0H 为真时, T(1)X t n =-,同样根据上分位点得2((1))P T t n αα>-=,所以0H 的拒绝域为2{(1)}C T t n α=>-,根据样本点可以判断接受还是拒绝0H问题2 设总体2(,)XN μσ,样本1,,n X X ,给定检验水平α,待检验问题00010:():H H μμμμμμ≥=<(单边检验)解:(1)若2σ为已知,由0H 为真时 N(0,1)X Z =,根据上分位点的概念得()P Z Z αα<-=,所以0H 的拒绝域为{}C Z Z α=<-,根据样本点可以判断接受还是拒绝0H(2)若2σ为未知,由0H 为真时, T(1)X t n =-,同样根据上分位点得((1))P T t n αα<--=,所以0H 的拒绝域为{(1)}C T t n α=<--,根据样本点可以判断接受还是拒绝0H 问题3 设总体2(,)XN μσ,样本1,,n X X ,给定检验水平α,待检验问题00010:():H H μμμμμμ≤=>(单边检验)解:(1)若2σ为已知,由0H为真时 N(0,1)X Z =,根据上分位点的概念得()P Z Z αα>=,所以0H 的拒绝域为{}C Z Z α=>,根据样本点可以判断接受还是拒绝0H(2)若2σ为未知,由0H 为真时, T(1)X t n =-,同样根据上分位点得((1))P T t n αα>-=,所以0H 的拒绝域为{(1)}C T t n α=>-,根据样本点可以判断接受还是拒绝0H单个正态总体均值μ的检验(水平α)N(0,1) (1)t n -例1、设某次考试的成绩X 服从正态分布2(,)N μσ,从中随机抽取25位考生的成绩,算得平均成绩为66.5分,样本标准差为15分,问在显著性水平0.05下,是否可以认为全体考生的平均成绩为70分。
(0.025(24) 2.064t =)解:设成绩2(,)XN μσ 01:70,:70,H H μμ=≠由于2σ未知,故选(1)t t n =-故0H 的拒绝域为0.0252{(1)}{(24)}{ 2.064}t t n t t t α>-=>=>题中66.5,15,25,0.05X S n α====,计算得 1.17t =,故接受0H ,可以认为全体考生的平均成绩为70分。
例2、一批电子元件, 要求其使用寿命不得低于1000小时, 现从中抽取25件, 测得寿命平均值为990小时, 样本标准差为100小时, 假定寿命总体服从正态分布, 试问在显著性水平05.0=α下这批产品是否合格? 参考数据:()()()708.125 ,711.124 ,06.22405.005.0025.0===t t t解:设寿命2(,)XN μσ ,01:1000,:1000,H H μμ≥<由于2σ未知,故选(1)t t n =-,0H 的拒绝域为0.05{(1)}{(24)}{ 1.711}t t n t t t α<--=<=<-, 题中 990,100,25,0.05X S n α====,计算得0.5t =-,故接受0H ,即产品合格例3、某种电子元件的寿命X (以小时计)服从正态分布, 2,μσ 均为未知. 现测得16只元件的寿命如下:159280101212224379179264222362168250149260485170,问是否有理由认为元件的平均寿命大于225(小时)?(0.05)α=解:001:225,:225H H μμμ≤=>2σ未知,用T 检验,T (1)t n =-,0H 的拒绝域为{(1)}C T t n α=>-{}0.05=T>(15) 1.7531t =,计算样本0.6685 x T ==,0 , H 故接受认为元件的 225平均寿命不大于小时。
二、单个正态总体方差2σ的检验(水平α) 问题1 设总体2(,)XN μσ,样本1,,n X X ,给定检验水平α,待检验问题22220010::H H σσσσ=≠解:(1)若μ为已知,由0H 为真时2222101() ()nii Xn χμχσ==-∑,根据上分位点的概念得2222122(())(())P n P n ααχχχχα->+<=,所以0H 的拒绝域为2222122{()}{()}C n n ααχχχχ-=><, 根据样本点可以判断接受还是拒绝0H(2)若μ为未知,由0H 为真时,2222221(1)1()=(1)ni i n S XX n χχσσ=-=--∑,同样根据上分位点得2222122((1))((1))P n P n ααχχχχα->-+<-=,所以0H 的拒绝域为2222122{(1)}{(1)}C n n ααχχχχ-=>-<-,根据样本点可以判断接受还是拒绝0H 问题2 设总体2(,)XN μσ,样本1,,n X X ,给定检验水平α,待检验问题22222200010:():H H σσσσσσ≥=<解:(1)若μ为已知,由0H 为真时2222101() ()nii Xn χμχσ==-∑,根据上分位点的概念得221(())P n αχχα-<=,所以0H 的拒绝域为221{()}C n αχχ-=<, 根据样本点可以判断接受还是拒绝0H (2)若μ为未知,由0H 为真时,222222100(1)1()=(1)nii n S XX n χχσσ=-=--∑,同样根据上分位点得221((1))P n αχχα-<-=,所以0H 的拒绝域为221{(1)}C n αχχ-=<-,根据样本点可以判断接受还是拒绝0H问题3 设总体2(,)XN μσ,样本1,,n X X ,给定检验水平α,待检验问题22222200010:():H H σσσσσσ≤=>解:(1)若μ为已知,由0H 为真时2222101() ()nii Xn χμχσ==-∑,根据上分位点的概念得22(())P n αχχα>=,所以0H 的拒绝域为22{()}C n αχχ=>, 根据样本点可以判断接受还是拒绝0H(2)若μ为未知,由0H 为真时,2222221(1)1()=(1)ni i n S XX n χχσσ=-=--∑,同样根据上分位点得22((1))P n αχχα>-=,所以0H 的拒绝域为22{(1)}C n αχχ=>-,根据样本点可以判断接受还是拒绝0H单个正态总体方差2σ的检验(水平α)()n χ (1)n χ-例4、某厂生产的某种型号的电池, 其寿命长期以来服从方差2σ=5000的正态分布, 现有一批这种电池, 从它生产情况来看, 寿命的波动性有所变化.现随机的取26只电池, 测出其寿命的样本方差2S =9200. 问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化? (0.02)α= 解: 2201:5000,:5000H H σσ=≠μ为未知0H 为真时,2222(1)(1)n S n χχσ-=-,26,n =0.02,α=205000,σ=0H 的拒绝域2222122{(1)}{(1)}C n n ααχχχχ-=>-<-22220.010.99{(25)44.314(25)11.524χχχχ=>=<=或}计算得220(1)25920046 5000n s σ-⨯==0 ,H 所以拒绝认为这批电池的寿命的波动性较以往的有显著的变化.例5、 某自动车床生产的产品尺寸服从正态分布,按规定产品尺寸的方差 不得超过0.1, 为检验该自动车床的工作精度, 随机的取25件产品, 测得样本方差2S =0.1975,问该车床生产的产品是否达到所要求的精度?(0.05)α= 解:2201:0.1,:0.1H H σσ≤>μ为未知0H 为真时,2222(1)(1)n S n χχσ-=-,0H 的拒绝域22{(1)}C n αχχ=>- 220.05{(24)36.415}χχ=>=计算样本得220(1)240.197547.4 0.1n s σ-⨯==36.415>所以0 H 拒绝,认为该车床生产的产品没有达到所要求的精度。