当前位置:文档之家› 概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验

第八章假设检验

第一节假设检验问题

第二节正态总体均值的假设检验

第三节正态总体方差的检验

第四节大样本检验法

第五节 p值检验法

第六节假设检验的两类错误

第七节非参数假设检验

第一节假设检验问题

前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).

下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.

一、统计假设

某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了

8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?

请看以下几个问题:

问题1

引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.

若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.

一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?

问题2

记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.

某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?

问题3

则问题等价于检验H0成立,还是H1成立.

某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?

问题4

则问题等价于检验H0成立,还是H1成立.

自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?

问题5

记服从指数分布,不服从指数分布.

则问题也等价于检验H0成立,还是H1成立.

在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.

如上述各问题中的H0和H1都是假设.

利用样本对假设的真假进行判断称为假设检验。

在总体的概率分布已知情形下,对分布中的未知参数作假设并进行检验,称为参数假设检验.

若总体的分布未知,对总体的分布形式或参数作假设并进行检验,称为非参数假设检验.

如上述问题1~4为参数假设检验问题,问题5为非参数假设检验问

题.

值得注意的是,当给定原假设后,其对立假设的形式可以有多个,如H0: 其对立形式有

在假设检验问题中,常把一个被检验的假设称为原假设或零假设,而其对

立面就称为对立假设.

上述各问题中,H0为原假设,H1为对立假设.

当H0不成立时,就拒绝接受H0而接受其对立假设H1.

选择哪一种需根据实际问题确定,因而对立假设往往也称为备

选假设,即在拒绝原假设后可供选择的假设.在假设检验问题中,必须同时给出

原假设和对立假设.在参数假设中,不论是原假设还是对立假设,若其中只含有

一个参数值,则称为简单假设,否则称为复合假设,如H0: ,

H1: 为简单假设;而H0: ,

H1: 为复合假设.

二、假设检验的思想方法

如何利用从总体中抽取的样本来检验一个关于总体的假设是否

成立呢?由于样本与总体同分布,样本包含了总体分布的信息,因而也包含了假

设H0是否成立的信息,如何来获取并利用样本信息是解决问题的关键.统计学中

常用“概率反证法”和“小概率原理”来解决这个问题.

小概率原理

概率很小的事件在一次试验中不会发生.如果小概率事件在一次试验中竟然

发生了,则事属反常,定有导致反常的特别原因,有理由怀疑试验的原定条件不

成立.

概率反证法

欲判断假设H0的真假,先假定H0真,在此前提下构造一个能说明问题的小概率事件A.试验取样,由样本信息确定A是否发生,若A发生,这与小概率原理相违背,说明试验的前定条件H0不成立,拒绝H0,接受H1;若小概率事件A 没有发生,没有理由拒绝H0,只好接受H0.

反证法的关键是通过推理,得到一个与常理(定理、公式、原理)相违背的结论.“概率反证法”依据的是“小概率原理”.那么多小的概率才算小概率呢?这要由实际问题的不同需要来决定.以后用符号记小概率,一般取

等.

在假设检验中,若小概率事件的概率不超过,则称为检验水平或显著性水平.

已知某炼铁厂的铁水含碳量X~N(4.55,0.062),现改变了工艺条件,又测得10炉铁水的平均含碳量,假设方差无变化,问总体的均值是否有明显改变?(取 =0.05)

下面举例说明以上检验的思想与方法。

例1

则与4.55应很接近

事件较大,待定)不太可能发生

由问题提出假设H0: ,H1:

若H0成立

由于未知

用其无偏估计来代替

用来衡量与4.55之间的差异

如果较大

则可认为

所以在H0成立的前提下

即P(A)很小

令P(A)= ,确定9><>d是解决问题的关键

由此确定了小概率事件

由可知

因此在H0成立的前提下,统计量

显然

因此

由标准正态分布上分位点的定义可知

由 =0.05,得

由于

说明小概率事件A未发生,因此接受假设H0

即认为总体均值等于4.55

在随机试验中,小概率事件有许多,关键是要找一个能说明问题的小概率事件.

,由P(A)= 同样可确定<>d

本例中,若取

最后的检验将出现这样一种倾向

越与4.55接近,越要拒绝

这样的判别方法显然不合理,错误在于:在H0成立的前提下,这样取小概率事件A不合理.

在本例中,若设

则A:( X1,X2,…,X10)

<>D是使小概率事件A发生的所有10维样本值(x1,…,x10)构成的集合则拒绝接受H0等价于

一般地,若拒绝接受

其中<>D是n维空间Rn中的区域,则称<>D为假设H0的拒绝域或否定域、临界域.

检验中所用的统计量称为检验统计量

样本观测值(x1,x2, (x10)

样本观测值(x1,x2,…,xn)

称<>D的补集为H0的接受域

执行统计判决:求统计量的值,并查表求出有关数据,判断小概率事件是否发生,由此作出判决.

提出假设:根据问题的要求,提出原假设H0与对立假设H1,给定显著水平及样本容量n.

总结前面例1处理问题的思想与方法,可得处理参数假设检验问题的步骤如

下:

(1)

(2)

(3)

确定拒绝域:用参数的一个好的估计量 (通常取为的无偏估计)来代替 ,分析拒绝域<>D的形式,构造检验统计量g( ),在H0成立的前提下确定g( )的概率分布,通过等式确定<>D.

其中确定拒绝域是关键.拒绝域的形式一般由原假设与对立假设共同确定,对同一原假设H0,不同的对立假设所得到的H0的拒绝域可能不同.请看下例。

例2

数据同前面例1,问总体的均值是否明显大于4.55?

在统计学中,只有当与4.55的偏差大到一定程度时才可认为

在本例中,拒绝H0时接受的是,因而H0的拒绝取为较合理

此问题的合理假设为

的无偏估计是的一个很好的近似值

代替

在例8.1中,拒绝H0时接受的是H1:

两个数的偏差用其差的绝对值来衡量

因而其拒绝域设为

较合理

与例1中的拒绝域不同

在H0成立的条件下,事件

发生的概率应很小

设P(A)= ,统计量

所以拒绝域为

所以判决结果为:接受H0

三、参数假设检验与区间估计的关系

参数的区间估计则是找一个随机区间I,使I包含待估参数是个大概率事件.

参数假设检验的关键是要找一个确定性的区域(拒绝域)

,使得当H0成立时,事件

是一个小概率事件

一旦抽样结果使小概率事件发生,就否定原假设H0

对此两类问题,都是利用样本对参数作判断:一个是由小概率事件否定参数属于某范围,另一个则是依大概率事件确信某区域包含参数的真值.两者本质上殊途同归,一类问题的解决,导致解决另一类问题类比方案的形成.为的置信区间

如设总体

已知,给定容量n的样本

则参数的置信度为

样本均值为

的置信区间为

假设检验问题

的拒绝域为

接受域为

时,接受

也就是说,当

即在区间

内,此区间正是的置信度

习题8-1

1.何谓统计假设?

2.试述普通反证法与概率反证法的异同点.

3.试述检验统计假设的步骤.

4.设总体,为未知参数,

为其一个样本,对下述假设检验问题取拒绝域为:

试求常数c,使得该检验的显著水平为0.05.

m

第二节正态总体均值的假设检验

本节讨论有关正态总体的均值的假设检验问题.

构造合适的检验统计量并确定其概率分布是解决检验问题的关键.

若检验统计量服从标准正态分布(分布,F分布)

则所得到的相应检验法称为

U 检验法( 检验法,F 检验法)

一、 U 检验法(方差已知)

在方差已知的条件下,对一个正态总体的均值或两个正态总体均值差的假设检验常用U 检验法.

若X1,X2,…,Xn为取自总体X的样本

设总体

已知,

给定显著水平检验以下不同形式的假设问题:

下面我们来求H03的拒绝域

前两个为简单假设检验问题,我们已在例1及例2中求出其拒绝域分别为和

其中

(1)

H03的拒绝域形式为

等价形式为

(k待定)

若H03成立,则

要控制

只需令

由此得

此处

所以H03的拒绝域为

(2)

比较两种假设检验问题:

对于后面将要讨论的有关正态总体的参数假设检验问题也有类似结果.

可以看出尽管两者原假设形式不同,实际意义也不一样,但对于相同的显著水平,它们的拒绝域是相同的。因此,遇到H03与H13的检验问题,可归结为H02与H12来讨论.

下面求两个正态总体均值差检验的拒绝域。

设总体

X与Y相互独立

已知

从两总体中分别取容量为n1、n2的样本

用,分别表示样本均值、

给定显著水平

检验假设

的无偏估计分别为

显然,H0的拒绝形式应为(k待定)

由于

若H0真,则统计量

拒绝域为

(3)

例 1 一种燃料的辛烷等级服从正态分布,其平均等级,标准差.现抽取25桶新油,测试其等级,算得平均等级为97.7.假定标准差与原来一样,问新油的辛烷平均等级是否比原燃料的辛烷平均等级偏低?()

解按题意需检验假设

检验统计量

拒绝域(参阅表8-1)

查正态分布表得

计算统计值

执行统计判决

故拒绝H0,即认为新油的辛烷平均等级比原燃料辛烷的平均等级确实偏低.

二、 t 检验法(方差未知)

设总体

未知

对显著水平检验假设

拒绝域形式

(k待定)

注意到S2是的无偏估计,用S代替

由于未知,现在不能用来作为检验统计量

采用

作为检验统计量

当H0真时,

所以拒绝域为

(4)

类似可给出假设

的拒绝域为

(5)

对正态总体

关于的各种形式的假设检验的拒绝域列于表8-1.

例 2 一手机生产厂家在其宣传广告中声称他们生产的某种品牌的手机的待机时间的平均值至少为71.5小时,一质检部门检查了该厂生产的这种品牌的手机6部,得到的待机时间为

69,68,72,70,66,75

设手机的待机时间,由这些数据能否说明其广告有欺骗消费者之嫌疑?()

解问题可归结为检验假设

由于方差未知,用t 检验。

检验统计量

拒绝域

计算统计值

查t分布表,得

统计判决

故接受H0,即不能认为该厂广告有欺骗消费者之嫌疑

下面求两个正态总体均值相等性检验的拒绝域。

设总体

独立,

未知

X1,…,Xn1取自总体X

样本方差为

其样本均值为

Y1,…,Yn2取自总体Y

其样本均值为,样本方差为

给定显著水平,检验假设

拒绝域形式为

(k待定)

由第六章第四节例2的结果知:

当H0成立时,统计量

例 3 对用两种不同热处理方法加工的金属材料做抗拉强度试验,得到的

试验数据如下:

方法Ⅰ:31,34,29,26,32,35,38,34,30,29,32,31

方法Ⅱ:26,24,28,29,30,29,32,26,31,29,32,28

设两种热处理加工的金属材料的抗拉强度都服从正态分布,且方差相等.比较两种方法所得金属材料的平均抗拉强度有无显著差异.()

解记两总体的正态分布为

本题是要检验假设

检验统计量为

拒绝域为

计算统计值

查t分布表,得

统计判决:由于

故拒绝H0

即认为两种热处理方法加工的金属材料的平均抗拉强度有显著差异.

习题8-2

1.已知某炼铁厂的铁水含量在正常情况下服从正态分布N(4.55,10.82),现在测了5炉铁水,其含碳量为

4.28, 4.40, 4,42, 4.35, 4.37

若方差没有变,问总体均值是否有显著变化?()2.有一种新安眠剂,据说在一定剂量下能比某种旧安眠剂平均增加睡眠时间3小时.为了检验新安眠剂的这种说法是否正确,收集到一组使用新安眠剂的

睡眠时间(单位:h):

26.7, 22.0, 24.1, 21.0, 27.2, 25.0, 23.4

根据资料,用某种旧安眠剂时平均睡眠时间为20.8h,假设用安眠剂后睡眠时间服从正态分布,试问这组数据能否说明新安眠剂已达到的疗效?()

3.某单位上年度排出的污水中,某种有害物质的平均含量为0.009%,污水经处理后,本年度抽测16次,得这种有害物质的含量(百分比)为

设有害物质含量服从正态分布,问是否可认为污水经处理后,这种有害物质的含量有显著降低?()

0.008,

0.007,

0.006,

0.008,

0.009,

0.007,

0.004,

0.007,

0.003,

0.009,

0.010,

0.005,

0.007,

0.009,

0.011,

0.008,

4.某弹壳直径,规定标准为

(mm),(mm)。某车间新生产一批这种弹壳,已知这批弹壳直径的方差为标准值,但其均值未知,为了检验这批弹壳是否符合要求,抽测9枚弹壳,得直径数据为(单位:mm):

试在水平之下,检验这批弹壳是否合格.

7.94

7.91

7.93

7.92

7.92

7.93

7.90

7.94

7.92

5.如果一个矩形的宽与长之比等于0.618,称这样的矩形为黄金比矩形,

这种矩形给人良好的感觉,现代的建筑物构件(如窗架)、工艺品(如图片镜框),甚至司机的驾驶执照、商品的信用卡等都常常采用黄金比矩形.下面列出某工艺品工厂随机抽取的20个矩形的宽与长之比:

设这一工厂生产的矩形的宽与长的比值总体服从正态分布,试检验

H0:μ=0.618,

0.933,

0.576,

0.844,

0.570,

0.553,

0.609,

0.601,

0.668,

0.606,

0.611,

0.628,

0.690,

0.606,

0.615,

0.672,

0.662,

0.670,

0.654,

0.749,

0.693,

6.对某种物品在处理前与处理后取样分析其含脂率如下:

假定处理前后含脂率都服从正态分布,且它们的方差相等,问处理后平均含脂率有无显著降低?()

0.12

0.20

0.08

0.04

0.19

0.24

0.24

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

第八讲

第八讲概率与数理统计 一、内容提要: 本讲主要是讲解随机事件与概率,古典概率,一维随机变量的分布和数字特征,数理统计的基本概念,参数估计,假设检验,方差分析,回归分析。 二、本讲的重点是: 随机事件的关系,二项概率公式,条件概率,分布函数的性质,连续型随机变量的密度函数、分布函数,正态分布,常用随机变量的分布和数字特征。 本讲的难点是:数理统计方面的参数估计,假设检验,方差分析,回归分析。 三、内容讲解: 1、随机事件与概率: (1)随机事件的关系与运算: 包含:若事件A发生,一定导致事件B发生,那么称事件B包含事件A,记作A B; 相等:若两事件A与B相互相互包含,即A B且B A,那么称事件A与B相等,记作A=B 和事件:称“事件A与事件B中至少有一个发生”的事件为A与B的和事件,记为A∪B 积事件:称“事件A与事件B同时发生”的事件为A与B的积事件,记为A∩B简记为AB 互不相容:若事件A与事件B不能同时发生,则称A与B互不相容,记作AB= 差事件:称“事件A发生且事件B不发生”的事件为A与B的差,记作A-B 对立事件:若事件A与B满足A∪B= ( 为必然事件),同时AB=,称A与B是对立的,记B= 交换律:对任意两事件A和B有A∪B=B∪A,AB=BA, 结合律:对任意事件A、B、C有A∪(B∪C)= (A∪B)∪C,

A∩(B∩C)=(A∩B)∩C 分配律:对任意事件A、B、C有A∪(B∩C)=(A∪B)∩(A∪C), A∩(B∪C)=(A∩B)∪(A∩C) (2)概率的公理化定义: 设试验的样本空间为,随机事件A为的子集,P(A)为实值函数,若满足下列三条公理: 公理1、对于任一随机事件A,有0≤P(A)≤1, 公理2、P()=1,P()=0 公理3、对于一系列互不相容的事件A1,A2,…A n…有P(A1+ A2+…)=P(A1)+P(A2)+…则称函数P(A)为随机事件的概率。概率的性质: (i) P()=1-P(A) (ii)(ii)当A B时,有P(B-A)=P(B)-P(A) (iii)当A1,A2,…A n互不相容时,有P(A1+ A2+…)=P(A1)+P(A2)+…P(A n)(iv)P(A∪B)=P(A)+P(B)-P(AB) (2)条件概率与相互独立性: 条件概率:如果A、B是随机试验的两个事件,且P(B)>0,则称事件B发生的条件下事件A的概率为事件B发生条件下事件A发生的条件概率,记作P(A|B)条件概率可以通 过下列公式计算:( P(B)>0) 乘法定理:两事件的积事件的概率等于其中一事件的概率与另一事件在前一事件出现下的条件概率的乘积: P(AB)=P(A)P(B|A)( P(A)>0) P(AB)=P(B)P(A|B)( P(B)>0)

(完整版)样本量计算(DOC)

1.估计样本量的决定因素 1.1资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。 1.2研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 1.4 1.5 度为 1.6 1.7 1.8双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需 样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算 由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。 护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。 2.1描述性研究 例. =0.1, 2.2 2.2.1探索有关变量的影响因素研究 有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计算,计量

应用数理统计吴翊李永乐第三章假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显著影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显著性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测 得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分布, 试在显著水平下确定这批元件是否合格。 解:

{}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从一 批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比, X 较μ大20(2/cm kg )。设总体方差不变,问在01.0=α下能否认为这批钢索质量显著提 高 解: (1)提出假设0100::μμμμ>=H H , (2)构造统计量5.13 /4020 /u 00 == -= n X σμ (3)否定域{}α->=1u u V (4)给定显著性水平01.0=α时,临界值33.21=-αu (5) α-<1u u ,在否定域之外,故接受原假设,认为这批钢索质量没有显著提高。 某批矿砂的五个样品中镍含量经测定为(%): 设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为

(完整版)假设检验习题及答案

第三章 假设检验 3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。已知这种元件寿命服从标准差 100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。 {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为 010110 2: 3.25 H :t 3.252, S=0.0117, n=5 0.3419 H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.99512 0 V=t>t (1)0.01,(4) 4.6041, 3.25n t t t H ααα- ??-?? ?? ==<∴Q 本题中,接受认为这批矿砂的镍含量为。

3.5确定某种溶液中的水分,它的10个测定值0.452%,0.035%,X S == 2N(,),μσ设总体为正态分布试在水平5%检验假设: 0101() H :0.5% H :0.5%() H :0.04% H :0.0.4% i ii μμσσ≥<≥< {}0.95()0.452% S=0.035%-4.1143 (1)0.05 n=10 t (9) 1.833i t X n ασα==-==1-构造统计量:本文中未知,可用检验。取检验统计量为X 本题中,代入上式得: 0.452%-0.5% 拒绝域为: V=t >t 本题中,0 1 4.1143H <=∴t 拒绝 {}2 2 2 002 2 2212210.95 2()nS S 0.035% n=10 0.04%100.035%7.65630.04% V=(1)(1)(9)16.919 ii n n αα μχσσχχχχ χ χ--= ==*==>--==Q 2 构造统计量:未知,可选择统计量本题中,代入上式得: () () 否定域为: 本题中, 210 (1)n H αχ-<-∴接受 3.9设总体116(,4),,,X N X X μ:K 为样本,考虑如下检验问题:

统计学假设检验习题答案

1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。667.116/60800820=-= t 。因为t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,

假设检验习题

第6章 假设检验练习题 选择题 1. 对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为( ) A.参数估计 B.双侧检验 C.单侧检验 D.假设检验 2.研究者想收集证据予以支持的假设通常称为( ) A.原假设 B.备择假设 C.合理假设 D.正常假设 3. 在假设检验中,原假设和备择假设( ) A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 4. 在假设检验中,第Ⅰ类错误是指( ) A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时未拒绝备择假设 D.当备择假设不正确时拒绝备择假设 5. 当备择假设为: ,此时的假设检验称为( ) A.双侧检验 B.右侧检验 C.左侧检验 D.显著性检验 6. 某厂生产的化纤纤度服从正态分布,纤维纤度的标准均值为1.40。某天测得25根纤维的纤度的均值为x =1.39,检验与原来设计的标准均值相比是否有所下降,要求的显著性水平为α=0.05,则下列正确的假设形式是( ) H0: μ=1.40, H1: μ≠1.40 H0: μ≤1.40, H1: μ>1.40 H0: μ<1.40, H1: μ≥1.40 H0: μ≥1.40, H1: μ<1.40 7一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,用来检验这一结论的原假设和备择假设应为 A. H0:μ≤20%, H1: μ>20% B. H0:π=20% H1: π≠20% C. H0:π≤20% H1: π>20% D. H0:π≥20% H1: π<20% 8. 在假设检验中,不拒绝原假设意味着( )。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 9. 若检验的假设为H0: μ≥μ0, H1: μ<μ0 ,则拒绝域为( ) A. z>zα B. z<- zα C. z>zα/2 或z<- zα/2 D. z>zα或 z<-zα 10.若检验的假设为H0: μ≤μ0, H1: μ>μ0 ,则拒绝域为( ) A. z> zα B. z<- zα C. z> zα/2 或z<- zα/2 D. z> zα或 z<- zα 11. 如果原假设H0为真,所得到的样本结果会像实际观测取值那么极端或更极端的概率称为 ( ) A.临界值 B.统计量 C. P 值 D. 事先给定的显著性水平 12. 对于给定的显著性水平α,根据P 值拒绝原假设的准则是( ) A. P= α B. P< α C. P> α D. P= α=0 13. 下列几个数值中,检验的p 值为哪个值时拒绝原假设的理由最充分( ) A.95% B.50% C.5% D.2% 14. 若一项假设规定显著性水平为α=0.05,下面的表述哪一个是正确的( ) A. 接受H0 时的可靠性为95% B. 接受H1 时的可靠性为95% C. H0为假时被接受的概率为5% D. H1为真时被拒绝的概率为5% 15. 进行假设检验时,在样本量一定的条件下,犯第一类错误的概率减小,犯第二类错误的概率就会( ) 01:μμ

医药数理统计第六章习题集(检验假设和t检验)

第四章抽样误差与假设检验 练习题 一、单项选择题 1. 样本均数的标准误越小说明 A. 观察个体的变异越小 B. 观察个体的变异越大 C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是 A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当 3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布 4. 假设检验的目的是 A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同 E. 检验样本的P值是否为小概率 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~ 9.1×109/L,其含义是 A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95% E. 该区间包含总体均数的可能性为95%

答案:E D C D E 二、计算与分析 1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。 [参考答案] 样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。 101.4 X=, 1.5 S=,450 n=,0.07 X S=== 95%可信区间为 下限: /2.101.4 1.960.07101.26 X X u S α=-?= -(g/L) 上限: /2.101.4 1.960.07101.54 X X u S α +=+?=(g/L) 即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。 2.研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题: ①如何衡量这100名儿童总胆固醇样本平均数的抽样误差? ②估计100名儿童的胆固醇平均水平的95%可信区间; ③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 [参考答案] ①均数的标准误可以用来衡量样本均数的抽样误差大小,即 30 S=mg/dl,100 n= 3.0 X S=== ②样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。 207.5 X=,30 S=,100 n=,3 X S=,则95%可信区间为 下限: /2.207.5 1.963201.62 X X u S α=-?= -(mg/dl)

统计学(五):几种常见的假设检验

定义 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。 假设的形式 H0——原假设,H1——备择假设 双侧检验:H0:μ = μ0, 单侧检验:,H1:μ < μ0 或,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 假设检验的种类 下面介绍几种常见的假设检验 1.T检验 亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 目的:比较样本均数所代表的未知总体均数μ和已知总体均数μ0。 计算公式:统计量: 自由度:v=n - 1 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2,即先假定两个总体平均数之间没有显著差异; 2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法;

假设检验

简要回答题: 1. 某生产厂家声称,它们的产品合格率在99%以上。某销售商准备购进一批该厂生产的产品,但需要一份质检证明报告证明其合格率在99%以上。(1)如果是生产厂家自己出示一份质检报告,会提出怎样的备择假设?试说明理由。(2)如果是销售商亲自抽检,会提出怎样的备择假设? 答案: (1)生产厂家提出的备择假设应该是:。因为生产厂家自己想证明的自然是产品合格率在99%以上。 (2)销售商提出的假设应该是:。因为销售商不会轻易相信生产厂家的说法,会采取相对保守的策略。 知识点:假设检验 难易度:2 2. 什么是P值?要证明原假设不正确,如何确定合理的P值? 答案: (1)P值是指原假设正确时,所得到的样本结果会象实际观测结果那么极端或更极端的概率,也称为观察到的显著性水平。它反映的是在某个总体的许多样本中某一类数据出现的经常程度。 (2)如果原假设所代表的假设是人们多年来一直相信的看法,要证明原假设不正确,就需要很强的证据,应该选择应该小的P值。如果拒绝原假设可能会付出很高的成本,那么就需要选择一个更小的P值。 知识点:假设检验 难易度:3 3. 为什么说用P决策要优于用统计量决策? 答案: (1)与统计量决策相比,P值决策提供了更多的信息。因为用统计量决策时,依据的是事先确定的

显著性水平a,因此,只要统计量的值落在拒绝域,无论它在哪个位置,拒绝原假设的结论都是一样的。但统计量落在拒绝域不同的地方,实际的显著性是不同的。 (2)P值给出了拒绝原假设时,犯第Ⅰ类错误的实际概率的大小,而用统计量决策仅仅是知道犯错误的可能性是a那么大,但究竟是多少却不知道。 知识点:假设检验 难易度:2 4. 为什么说用假设检验不能证明原假设正确? 答案: (1)假设检验的目的是收集证据拒绝原假设,而支持你所倾向的备择假设。当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的,因为假设检验的程序没有提供它正确的证据。 (2)当不能拒绝原假设时,仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设,但我们也无法证明原假设是什么。 知识点:假设检验 难易度:2 5. 在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? 答案: (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。 知识点:假设检验

统计学假设检验作业答案

假设检验作业答案 一、单项选择题 1.在假设检验中,第一类错误是指(A ) A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时拒绝备择假设 D.当备择假设不正确时拒绝备择假设 2.对于给定的显著性水平α,根据P 值拒绝原假设的准则是(B ) A.P=α B.P<α C.P>α D.P=α=0 3.在大样本情况下,当总体方差已知时,检验总体均值所使用的统计量是(B )A.0/x z n μσ?=B. x z =C. x t =D. x z = 4.检验一个正态总体的方差时所使用的分布是(D ) A.正态分布 B.t 分布 C.F 分布 D.2 χ分布二、简答题 简述:假设检验依据的基本原理是什么?

三、计算题 1.已知某炼铁厂的产品含碳量服从正态分布N(4.55,0.108),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(α=0.05)。 解:正态分布总体,方差已知,因此用Z 检验。α=0.05时,临界值为±1.96 01: 4.55, : 4.55 H H μμ=≠0.602 x z ===?1.96 1.96 z ?<<所以不拒绝原假设。 结论:样本提供的信息不足以推翻“铁水平均含碳量为4.55”的说法。 2.某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤。现用一种化肥进行试验,从35个小区抽样结果,平均产量为270公斤。问这种化肥是否使小麦明显增产?(α=0.05) 解:大样本,方差已知,用Z 检验。0.05 1.645 z =01:250, :250 H H μμ≤> 0.053.94x z z ===>所以拒绝原假设。 结论:这种化肥使小麦明显增产 3.某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂。问该批食品能否出厂?(α=0.05) 解:大样本的总体比例检验,用Z 检验。0.05 1.645 z =01:5%, :5% H H ππ≤>

(完整版)T检验F检验和卡方检验

什么是Z检验? Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数>平均数的差异是否显著。 当已知标准差时,验证一组数的均值是否与某一期望值相等时,用Z检验。 Z检验的步骤 第一步:建立虚无假设,即先假定两个平均数之间没有显著差异。 第二步:计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。 1、如果检验一个样本平均数()与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为: 其中: 是检验样本的平均数; μ0是已知总体的平均数; S是样本的方差; n是样本容量。 2、如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为: 其中: 是样本1,样本2的平均数; S1,S2是样本1,样本2的标准差; n1,n2是样本1,样本2的容量。 第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如下表所示: 第四步:根据是以上分析,结合具体情况,作出结论。 Z检验举例 某项教育技术实验,对实验组和控制组的前测和后测的数据分别如下表所示,比较两组前测和后测是否存在差异。 实验组和控制组的前测和后测数据表 前测实验组n1 = 50 S1a = 14

控制组n2 = 48 S2a = 16 后测实验组n1 = 50 S1b = 8 控制组n2 = 48 S2b = 14 由于n>30,属于大样本,所以采用Z检验。由于这是检验来自两个不同总体的两 个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的Z检验方法。 计算前要测Z的值: ∵|Z|=0.658<1.96 ∴ 前测两组差异不显著。 再计算后测Z的值: ∵|Z|= 2.16>1.96 ∴ 后测两组差异显著。 T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 t检验是对各回归系数的显著性所进行的检验,是指在多元回归分析中,检验回归系数是否为0的时候,先用F检验,考虑整体回归系数,再对每个系数是否为零进行t检验。t检验还可以用来检验样本为来自一元正态分布的总体的期望,即均值;和检验样本为来自二元正态分布的总体的期望是否相等) 目的:比较样本均数所代表的未知总体均数μ和已知总体均数μ0。 自由度:v=n –1 T检验注意事项 要有严密的抽样设计随机、均衡、可比 选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布) 单侧检验和双侧检验 单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能 性大。 假设检验的结论不能绝对化 不能拒绝H0,有可能是样本数量不够拒绝H0 ,有可能犯第Ⅰ类错误 正确理解P值与差别有无统计学意义P越小,不是说明实际差别越大,而 是说越有理由拒绝H0 ,越有理由说明两者有差异,差别有无统计学意义和有无 专业上的实际意义并不完全相同 假设检验和可信区间的关系结论具有一致性差异:提供的信息不同区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H 0成立与否的概率。 适用条件

数理统计——假设检验

解:由题意可知,样本数据来自于服从指数分布的总体假设检验:H0:θ≥1100,H1:θ<1100;α=0.05 其拒绝域的形式为:χ2≤χ2α2n=χ20.0520=31.41 统计量为χ2=2nx θ=20?942.8 1100 =17.14<31.41 所以拒绝H0,所以不能够认为这批货物平均寿命不低于1100h 程序代码: function [ d ] = kaf( A,T,a ) %UNTITLED2 Summary of this function goes here % Detailed explanation goes here n=length(A); c=sum(A)/n; x=chi2inv(1-a,n); X=2*n*c/T; if x

解:假设检验:H0:μ≥μ0=1000,H1:μ<μ0;α=0.05 因为本题是左侧检验问题,故其拒绝域为:Z=0 σ/n ≤?z0.025=?1.96 而统计量Z=0 σ/n = 100/24 =-3.9754<-1.96 所以拒绝H0 程序代码:function [ d ] = kaf( A,u,a,s ) %UNTITLED2 Summary of this function goes here % Detailed explanation goes here n=length(A); c=sum(A)/n; z=norminv(a/2); Z=(c-u)*sqrt(n)/s; if z

统计学假设检验习题答案

1 ?假设某产品的重量服从正态分布, 现在从一批产品中随机抽取 16件, 测得平均重量为 820克,标准差为60克,试以显著性水平 =0.01与 =0.05, 分别检验这批产品的平均重量是否是 800克。 解:假设检验为 H 。: % =800,比:% =800 (产品重量应该使用双侧 820—800 平下的临界值(df= n-1=15)为2.131和2.947。 t 1.667 。因为 60/716 t <2.131<2.947,所以在两个水平下都接受原假设。 2 ?某牌号彩电规定无故障时间为 10 000小时,厂家采取改进措施,现在从 新批量彩电中抽取 100台,测得平均无故障时间为 10 150小时,标准差为 500小时,能否据此判断该彩电无故障时间有显著增加 (=0.01) ? =10000, H 1 >l 0 10000 (使用寿命有无显 Z = % 一」0。查出〉= 0.01 -/ . n 2.34之间(因为表中给出的是双侧检验的接受域临界值, 因此本题的单侧检 验显著性水平应先乘以2 ,再查到对应的临界值)。计算统计量值 10150 -10000 Z 3。因为z=3>2.34(>2.32),所以拒绝原假设,无故障 500/J100 时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差 b 已知为150,今抽了一 个容量为26的样本,计算得平均值为1637。问在5 %的显著水平下,能否认 为这批 产品的指标的期望值 □为1600? 解:H 。:卩=1600,比:卜鬥600,标准差 b 已知,拒绝域为 2 检验)。采用t 分布的检验统计量 。查出〉=0.05和0.01两个水 解:假设检验为H 。:% 著增加,应该使用右侧检验) 。n=100可近似采用正态分布的检验统计量 水平下的反查正态概率表得到临界值 2.32到

(完整版)数理统计复习总结

1统计量与抽样分布 1.1基本概念:统计量、样本矩、经验分布函数 总体X 的样本X 1,X 2,…,X n ,则T(X 1,X 2,…,X n )即为统计量 样本均值X =μ 样本方差2 1 2 )(1∑=-=n i i n X X n S 修正样本方差2 1 2*)(11∑=--=n i i n X X n S 样本k 阶原点矩,...)2,1(,11 ==∑=k X n A n i k i k 样本k 阶中心矩,...)2,1(,)(11 =-=∑=k X X n B n i k i k 经验分布函数)(,) ()(+∞<<-∞= x n x v x F n n 其中V n (x)表示随机事件}{x X ≤出现的次数,显然))(,(~)(x F n B x V n ,则有)()]([x F x F E n = )](1)[(1 )]([x F x F n x F D n -= 补充: ? DX n n ES n 12-= DX ES n =2 * 22)(EX DX EX += ? 22 21 1n n i i S X X n ==-∑ ● 二项分布B(n,p): ),...,1,0(,)1(}{n k p p C k X P k n k k n =-==- EX=np DX=np(1-p) ● 泊松分布)(λP : ,...)1,0(,! }{== =-k e k k X P k λλ λ=EX λ=DX ● 均匀分布U(a,b): )(,1 )(b x a a b x f <<-= 2b a EX += 2)(12 1 a b DX -= ● 指数分布: (),(0)()1,(0)x x f x e x F x e x λλλ--=>?=-> λ 1 = EX 2 1 λ= DX

统计学假设检验习题答案

统计学假设检验习题答案 1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0、01与α=0、05,分别检验这批产品的平均重量就是否就是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0、05与0、01两个水平下的临界值(df=n-1=15)为2、131与2、947。667.116/60800820=-= t 。因为t <2、131<2、947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0、01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0、01水平下的反查正态概率表得到临界值2、32到2、34之间(因为表中给出的就是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2、34(>2、32),所以拒绝原假设,无故障时间有显著增加。 3、设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?

完整版假设检验习题及答案

第二章假设检验 3.2 —种元件,要求其使用寿命不低于1000 (小时),现在从一批这种元件中随机 抽取25件,测得其寿命平均值为950 (小时)。已知这种元件寿命服从标准差 100(小时)的正态分布,试在显著水平 0.05下确定这批元件是否合格。 提出假设:H 0: 1000, H 1: 1000 构造统计量:此问题情形属于u 检验,故用统计量: V= u U 1 本题中: 0.05 u 0.95 1.64 即, u u 0.95拒绝原假设H 0 认为在置信水平0.05下这批元件不合格。 3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在 0.01下能否接受假设,这批矿砂的镍含量为 提出假设: H ° : 1 3.25 H 1 : 1 0 构造统计量:本题属于 2 未知的情形,可用t 检验,即取检验统计量为: t=— S .n 1 本题中,x 3.252, S=0.0117, n=5 代入上式得: t = 3.252-3.25 0.0117 .5 1 否定域为: V= t>^_(n 1) 2 本题中, 0.01,t 0.995(4) 4.6041 Qt t 1 2 接受H 0,认为这批矿砂的镍含量为 3.25。 X u=—— 0 0 此题中:x 950 代入上式得: 950-1000 u= 2.5 100 25 拒绝域: 0 100 n=25 0 1000 0.3419

3.5确定某种溶液中的水分,它的10个测定值X 0.452%, S 0.035%, 0.452%-0.5% t= -4.1143 0.035% 拒绝域为: V 二 t >t i. (n 1) 本题中, 0.05 n=10 t °.95(9) 1.8331 t 4.1143 拒绝H 0 (ii)构造统计量: 未知,可选择统计量 2 nS 2 2" 本题中,S 0.035% n=10 0.04% 代入上式得: 否定域为: 接受H 。 3.9设总体X : N( ,4),X 1,K ,X 16为样本,考虑如下检验问题: 设总体为正态分布N(, 2 ),试在水平5%检验假设: (i) H 。: 0.5% H 1 : 0.5% (ii) H 0: 0.04% H 1 : 0.0.4% (i)构造统计量: 本文中 未知,可用t 检验。取检验统计量为 t= X 0 S n 1 本题中,X 0.452% S=0.035% 代入上式得: 10 (°.°35 %)2 7.6563 (0.04%)2 V= 1 2 (n 1) 本题中, 2 1 (n 1) 12 (n 1) 2 0.95 (9) 16.919

统计学(无敌权威完整版重点)

反映客观的数据(包括自然现象与社会经济现象)样本数据 总体数据 统计学 第一章数据与统计学 1.1统计数据与统计学 (1)统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探究数据在的数据量规律性,为决策提供参考(含义) (2)应用统计研究过程: 实际问题→收集数据(取得数据)→整理数据(处理数据)→显示数据→分析数据 →解释数据→实际问题 (3)例子:新生婴儿的性别、掷硬币和骰子、农作物试验、商品广告、汽车合格的统计、化妆品试用的抽样。 1.2 统计学的产生和发展 (1)三个源头:◎英国经济学家威廉·配第◎英国约翰·格朗特 ◎布莱斯·帕斯卡、皮埃尔·德·费马。 1.3 统计学的分类 (1)描述统计:是用图形、表格和概括性的数字对数据进行描述的统计方法。 (2)推断统计:是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计 方法。 (3)统计学分为描述统计和推断统计,一方面反映了统计发展的前后两个阶段。另一方面夜反映了统计方法研究和探索客观事物在数量规律性的先后过程。 (4) 图统计学探究客观现象数量规律性过程的款图 (5)统计研究过程的起点是数据,终点是探索到客观事件总体在的数据规律性。描述统计是整个统计学的基础和统计研究工作的第一步,推断统计是现代统计学的核心和统计研究工作的关键环节。 (6)理论统计和应用统计

1.4 统计数据的来源 (1)统计数据的来源:按直接获取和间接获取分类。 (2)直接获取的数据:普查:应用面窄、费时费力、反映总体数据的手段、实效性差。 抽样调查:节省人力物力、实效性强、有误差。 1.5 统计数据的质量 (1)统计调查阶段是统计研究的第一步,是直接收集统计数据的阶段。可分为非抽样误差和抽样误差。 1.6 统计学的基本概念 (1)总体:是人们研究的所有基本单位的总和。 (2)变量:在研究总体时,重点关注的是总体单位具有哪些特征和属性,指这些特征。(3)参数:概括性的数学度量。(主体) (4)统计量:概括样本的数学度量。(样本) (5)样本:是总体的一部分单位。 1.7 数据的有关知识 一、数据的计量尺度 1.列名尺度(定类尺度):层次最低、平行分类、列名时要穷尽所有的。“=≠” 2.顺序尺度(定序尺度):在分类的基础上给出类别的顺序。“﹥﹤” 3.间隔尺度(定距尺度):更加准备的测量,没有绝对的零点。“+-” 4.比例尺度(定比尺度):有绝对的零点。“+-×÷” 二、数据类型 1.数据的类型分为定性(品质)和定量(数量)。 2.变量:品质变量和数量变量。 三、数据的表现形式 1.分绝对数(总量的时期数和相对数)和相对数(两个绝对值的比值) 2.单位:实物单位、价值单位、复合单位。

假设检验习题及答案

第8章 假设检验 一、填空题 1、 对正态总体的数学期望μ进行假设检验,如果在显著性水平0.05下,接受假设 00:μμ=H ,那么在显著性水平0.01下,必然接受0H 。 2、在对总体参数的假设检验中,若给定显著性水平为α,则犯第一类错误的概率是α。 3、设总体),(N ~ X 2σμ,样本n 21X ,X ,X Λ,2σ未知,则00:H μ=μ,01:H μ<μ的拒绝域为 )}1(/{0 --<-n t n S X αμ,其中显著性水平为α。 4、设n 21X ,X ,X Λ是来自正态总体),(N 2σμ的简单随机样本,其中2,σμ未知,记 ∑==n 1 i i X n 1X ,则假设0:H 0=μ的t 检验使用统计量=T Q n n X )1(- . 二、计算题 1、某食品厂用自动装罐机装罐头食品,规定标准重量为250克,标准差不超过3克时机器工作 为正常,每天定时检验机器情况,现抽取16罐,测得平均重量252=X 克,样本标准差4=S 克,假定罐头重量服从正态分布,试问该机器工作是否正常? 解:设重量),(~2σμN X 05.016==αn 4252==S X (1)检验假设250:0=μH 250:1≠μH , 因为2σ未知,在0H 成立下,)15(~/250t n S X T -= 拒绝域为)}15(|{|025.0t T >,查表得1315.2)5(025.0=≠t 由样本值算得1315.22<=T ,故接受0H (2)检验假设9:20=σH 9:201>σH 因为μ未知,选统计量 2 02 2)1(σS n x -= 在0H 成立条件下,2x 服从)15(2x 分布,

相关主题
文本预览
相关文档 最新文档