数理统计与随机过程8--假设检验

  • 格式:ppt
  • 大小:1.54 MB
  • 文档页数:50

下载文档原格式

  / 50
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
建立假设:上面的任务是要通过样本检验 “ =0.5”的假设是否成立。
在数理统计中,把“ =0.5” 这样一个待 检验的假设记为“原假设”或“零假设”, 记成 “ H0: =0.5”。由Fisher提出。 原假设的对立面是“ ≠0.5”,称为 “对立假 设”或“备择假设”,记成 “ H1: ≠ 0.5”。 Neyman-Pearson 理论:把原假设和对立假设 合写在一起,就可以对不同的检验进行比较: H0: =0.5; H1: ≠0.5.
从而,拒绝原假设H0,即认为新的原材料 确实提高了绳子所能承受的最大拉力。
判断以下说法是否正确:

A、假设检验接受原假设H0说明H0是正确的概率很大 B、假设检验拒绝原假设H0说明H0是错误的概率很大

8.2.2 两个正态总体 N(1, 12) 和 N(2, 22) 均值的比较 在应用上,经常会遇到两个正态总体均 值的比较问题。 例如:比较甲、乙两厂生产的某种产品的 质量。将两厂生产的产品的质量指标分别看成 正态总体 N(1, 12) 和 N(2, 22)。 比较它们的产品质量指标的问题,就变为比 较这两个正态总体的均值 1和 2的的问题。
这里的问题是:如何确定常数 c ? 分析: 根据定理 6.4.1,有
2
X X ~ N ( , 0.015 / 9) ,或 ~ N (0, 1) . 0.015 / 9
于是,当原假设 H0:μ=0.5 成立时,有
X 0.5 ~ N (0, 1) . 0.015 / 9
为确定常数 c,我们考虑一个很小的正数, 如 =0.05。当原假设 H0:μ=0.5成立时,有
在统计学中, 通常选择控制犯第一类错误的概概率。 一般事先选定一个数 (0<<1),要求犯第一类 错误的概率不超过 。 称 为假设检验的显著性水平(Significance Level),简称水平。
例1(续):分析该例的显著性水平。
因为当 | X 0.5 | c 时,我们拒绝了原假设 H0:μ=0.5, 其中c (0.015 / 9 ) z / 2 .
总体分布未知情形 下的假设检验问题
例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖 重是一个随机变量, 它服从正态分布。当机器正常时, 其均值为0.5kg, 标准差为0.015 kg。某日开工后为检 验包装机是否正常, 随机地抽取它所包装的糖9袋, 称 得净重量 (kg)为: 0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512。问: 从样本看机器是否正常?
9 ) z / 2

发生, 就认为 H0不正确。
IV. 两类错误与显著性水平
当我们检验一个假设 H0 时,有可能犯以 下两类错误之一: Type I Error: H0 正确,但我们认为其 不正确,这就犯了“弃真”的错误。 Type II Error: H0 不正确,但却被误认 为正确,这就犯了“取伪”的错误。 因为检验统计量是随机的,所以,我们 总是以一定的概率犯以上两类错误。
| X 0.5 | P z / 2 , 0.015 / 9
小概率事件
即 P | X 0.5 | (0.015 / 9 ) z / 2 .


故, 取 c (0.015 / 9 ) z / 2 .
于是,我们就得到如下检验准则:
当 | X 0.5 | c 时, 接受原假设 H 0 ; 当 | X 0.5 | c 时, 拒绝原假设 H 0 .


P拒绝接受 H 0 | H 0 为真 .
可见:用该方法进行检验时,犯第一类 错误的概率等于 ,即等于显著性水平。
§8.2 正态总体均值的假设检验
8.2.1 单正态总体 N(, 2) 均值 的检验 1. 双边检验 H0: μ = μ0;H1: μ≠μ0
X 0 ~ N (0, 1) . / n
Hale Waihona Puke Baidu
假设 2已知,当原假设 H0:μ = μ0 成立时,有
X 0 所以, P z / 2 , / n
即 P X 0 z / 2 . n
所以, H 0拒绝域为
X 0

n
z / 2 .
以上检验法称作 Z 检验法。
0 n1
S 故H 0的拒绝域为 X 0 t n 1 ( / 2) . n
此检验法称作 t 检验法。
例: 某种电子元件的寿命X(以小时计)服从正态分 布N(, 2) , 和 2都未知, 现测得16只元件寿命 如下: 159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170. 在α =0.05下,问:从数据看,是否有理由认为 元件平均寿命 =225小时? 解: α =0.05,n=16。欲检验 H0:μ=μ0 ; H1: μ≠μ0 , 其中μ0=225。
例 2:某厂生产一种工业用绳,其质量指标是绳子所 承受的最大拉力,假定该指标服从正态分布,且该厂 原来生产的绳子指标均值μ0 =15公斤,采用一种新原 材料后,厂方称这种原材料提高了绳子的质量,也就 是说绳子所承受的最大拉力 μ比15公斤增大了。 为检验该厂的结论是否真实,从其新产品中随 机抽取50件,测得它们所承受的最大拉力的平均值为 15.8公斤,样本标准差 S=0.5公斤。
以μ和σ分别表示这一天袋装葡萄糖重量总 体的均值和标准差。
检验“机器是否正常”等价于检验“X是 否服从正态分布N(0.5, 0.0152)”。
I. 如何建立检验模型

确定总体:记 X 为该车间包装机包装的袋装 葡萄糖的重量,则 X ~ N(, 0.0152);


明确任务:通过样本推断“是否等于0.5”;
主讲: 路永钢 E-mail: ylu@lzu.edu.cn
兰州大学信息科学与工程学院
•1
第八节
假设检验
下面,我们讨论不同于参数估计问题的 另一类统计推断问题—— 根据样本提供的信息,检验总体的某个 假设是否成立的问题。
这类问题称为假设检验。
假设检验
非参数检验
参数检验
总体分布已知情 形下,检验未知 参数的某个假设
在实际应用上, 2未知的情况是常见的。 此时常用样本方差 S 2代替未知的 2 ,这时要用 t 检验法
当 2未知时,根据基本定理 6.4.1 ,当 X H0: μ = μ0 成立时,有 ~t . S/ n X 0 所以, P tn1 ( / 2) , S/ n S 即 P X 0 tn1 ( / 2) . n
通过计算,得 X 241.5, S 98.725,
| X 0 || 241.5 225 | 16.5,
S 98.7259 t n 1 ( / 2) 2.1315 52.6086, n 16 S | X 0 | t n 1 ( / 2). n
所以,接受原假设为真,即认为元件 平均寿命 为225小时。
设X1, X2, „, Xm与Y1, Y2, „, Yn 分别为抽 自正态总体 N(1, 12)和 N(2, 22)的样本,记
X 和 S 分别为 X 1 , X 2 ,, X m 的均值和方差;
II. 解决问题的思路
因样本均值是 μ 的一个很好的估计。所以, 当原假设 H0 成立,即 =0.5时, | X 0.5 | 应比较小;如果该值过大, H0 就可能不成立。 于是,我们就用| X 0.5 | 的大小来判定 H0 是否成立。 合理的做法应该是:找出一个界限 c,
当 | X 0.5 | c 时, 接受原假设 H 0 ; 当 | X 0.5 | c 时, 拒绝原假设 H 0 .
2. 单边检验 H0: μ =μ0; H1: μ >μ0
上一段中, H0:μ=μ0 的对立假设为 H1: μ ≠μ0 , 该假设称为双边对立假设。
而现在要处理的对立假设为H1:μ >μ0, 称 为右边对立假设。 类似地, H0: μ =μ0; H1: μ <μ0 中的对立假设 H1: μ <μ0 称为左边对立假设。 右边对立假设和左边对立假设统称为单边 对立假设,其检验为单边检验。
例如:工厂生产的某产品的数量指标服 从正态分布,均值为 μ0; 采用新技术或新配 方后,产品质量指标还服从正态分布,但均 值为 。
我们想了解 “是否显著地大于μ0”, 即 采用新技术或新配方后产品的质量指标是否 显著地增加了。
单边检验 H0: μ =μ0; H1: μ >μ0 H0中的μ比H1小,即原假设成立,则 X 0 就不应太大;反之,如果 X 0 过大,就认 为原假设不成立。 在2已知情况下,根据定理6.4.1,知: 当原假设 成立时, X 0 ~ N (0, 1) . / n 由此可推出 P X 0 z .
现在我们来分析一下 : 取上述 c 后,犯第 一类错误的概率是多少?即,如果 H0 是正确 的,其被拒绝的概率是多少?
分析: 因为当 H0:μ=0.5 成立时,有
X 0.5 ~ N (0, 1) . 0.015 / 9
从而,P | X 0.5 | (0.015 / 9 ) z / 2 .
取显著性水平 =0.01。问从这些样本看:能否 接受厂方的结论?
解:问题归结为检验如下假设 H0: μ=15; H1: μ>15 (2未知)
已知:n 50, 0 15, X 15.8, S 0.5, 0.01 .
X 0 15.8 15 0.8, S 0.5 0.5 t n -1 ( ) t 49 (0.01) 2.4049 0.17, n 50 50 S 所以, X 0 tn -1 ( ) . n
n
所以, H 0的拒绝域为 X 0

n
z .
在2未知情况下,当原假设 成立时, X 0 ~ tn1 . S/ n 由此,可推出
S P X 0 tn1 ( ) . n
S 所以,H 0 的拒绝域为 X 0 tn-1 ( ) . n
其中c (0.015 / 9 ) z / 2 .
X 0.5 称 | X 0.5 | 或 U 为检验统计量; 0.015 / 9
称 | X 0.5 | (0.015 / 9 ) z / 2 , 或
| X 0.5 | | U | z / 2 0.015 / 9
为 H0 的拒绝域。
用以上检验准则来处理我们的问题:
经计算, X 0.511 , c (0.015 / 9 ) z / 2 (0.015 / 9 ) 1.96 0.0098.
| X 0.5 | 0.011 c.
所以,拒绝 H0:μ=0.5,认为机器异常。
III. 方法原理
因为,当 H0:μ =0.5 成立时,
P | X 0.5 | (0.015 / 9 ) z / 2 .


所以,当 很小时,若 H0 为真(正确), 则检 验统计量落入拒绝域是一小概率事件 (概率很 小, 为 ) 。 “通常认为小概率事件在一次试验中基本上不 会发生”。那么,一旦小概率事件发生,即:
| X 0.5 | (0.015 /
通常分别用 α 和 β 记犯第一、第二类错误 的概率,即
P{ 拒绝H 0 | H 0为真 }, P{ 接受H 0 | H 0为假 } .
在检验问题中,犯“弃真”和“取伪”两类错误 都总是不可避免的,并且减少犯第一类错误的概 率,就会增大犯第二类错误的概率;反之亦然。
问题: 犯两类错误的概率不能同时得到控制。