高计I第九章假设检验部分
- 格式:pdf
- 大小:1.93 MB
- 文档页数:11
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
假设检验亦称“显著性检验(Test of statistical significance)”,是假设检验用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:µ=µ0,然后用统计的方法来计算验证你的假设是否正确。
用的假设检验有Z检验、T检验、配对检验、比例检验、秩和检验、卡方检验等。
编辑本段意义假设检验是抽样推断中的一项重要内容。
它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。
第九章 假设检验(练习及习题标准答案) 一、单项选择题1.当总体服从正态分布,但总体方差未知小样本的情况下,0100:;:μμμμ〈≥H H ,则0H 的拒绝域为( ) A.)1(-≤n t t α B. )1(--≤n t t α C. )1(--〉n t t α D. )1(/2--≤n t t α 2.在假设检验中,原假设0H ,备选假设1H ,则称( )为犯第二类错误。
A.0H 为真,不拒绝1H B. 0H 为真,拒绝1H C. 0H 不真,不拒绝0H D. 0H 不真,拒绝0H 3.假设检验是对未知总体某个特征提出某种假设,而验证假设是否成立的资料是( )。
A.样本资料B.总体全部资料C.重点资料D.典型资料4.下列对总体特征值θ的假设,哪一种写法是正确的?( )。
A. 0100:;:θθθθ〈≥H HB. 0100:;:θθθθ≤≥H HC.0100:;:θθθθ〈≤H HD.0100:;:θθθθ≥=H H 5. 一家食品生产企业声称,它们生产的某种食品的合格率在95%以上。
为检验这一说法是否属实,某食品安全检测部门打算抽取部分食品进行检验,该检验的原假设和备择假设为( )A. %95:%;95:10〉≤ππH HB. %95:%;95:10≠=ππH HC. %95:%;95:10〈≥ππH HD. %95:%;95:10≥〉ππH H6.对于非正态总体,使用统计量/x z s n =估计总体均值的条件是( )A .小样本B .总体方差已知C .总体方差未知D .大样本7.在假设检验中,原假设和备选假设( )A .都有可能成立B .都有可能不成立C .只有一个成立而且必有一个成立D .原假设一定成立,备选假设不一定成立8.一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A .0:5H μ=,1:5H μ≠ B .0:5H μ≠,1:5H μ>C .0:5H μ≤,1:5H μ>D .0:5H μ≥,1:5H μ< 9.若检验的假设为00:H μμ≥,10:H μμ<,则拒绝域为( ) A .z z α> B .z z α<- C ./2z z α<-或/2z z α<- D .z z α>或z z α<-10.一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程不超过24000公里。
假设检验
(1)
第一类错误拒真错误概率为α,第二类错误纳伪错误概率为β
势函数(功效函数)π(θ)=1-β,只考察在备择假设H1下的θ即可,在原假设H0下π(θ)=α,不用再考虑了,作答时也不用写出。
Size为犯第一类错误的上确界,一般可以理解为假设检验的显著水平。
例题:
(2)正态分布下的假设检验:
例题:
(3)NP引理和似然比检验(GLRT)
UMPT:Uniformly Most Powerful Test 一般用拒绝域C表示UMPT
NP引理:对于原假设和备择假设都是简单的情形,似然比可以确定UMPT。
对于原假设简单,备择假设复杂的情况就不一定存在UMPT。
例如正态分布,方差已知①H0:μ=0 vs H1:μ>0 存在UMPT;②H0:μ=0 vs H1:μ≠0 不存在UMPT;
GLRT也不保证存在UMPT。
GLRT例题:
NP引理例题:
Wald和拉格朗日检验不做要求
参数估计和极限理论
(1)指数分布族(exponential family),充分统计量,slutsky定理,delta method
参见HW4,HW5
(2)极大似然估计MLE,一致性Consistency,无偏性Unbiased,UMVUE(uniform minimum
variance unbiased estimator),CR下界
GMM不做要求。
判断UMVUE的几个条件:
①无偏估计量的方差达到CR下界,注意这个是充分条件,有的UMVUE的方差可能大于CR 下界,例如正态分布方差的UMVUE;另外有偏估计的MSE可能小于CR下界。
②如果W是τ(θ)的无偏估计且T是θ的充分完备统计量,则E(W|T)是τ(θ)的UMVUE,主要是指数分布族的充分完备统计量。
③线性的,教材376页,例212
例题。