假设检验的基本思想与概念

格式：ppt
大小：471.50 KB
文档页数：4

下载文档原格式

假设检验的基本概念

第五节检验水准与两类错误
第二章
I型错误和II型错误
假设检验是利用小概率反证法思想，从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立，然后在假定H0成立的条件下计算检验统计量，最后根据P值判断结果，此推断结论具有概率性，因而无论拒绝还是不拒绝H0，都可能犯错误。详见表8-1。
01
P122 例8-3
02
两均数之差的标准误的估计值
03
01
P122 例8-3
02
两均数之差的标准误的估计值
由于u0.05/2=1.96，u0.01/2=2.58，|u|>u0.01/2, 得P<0.01，按α=0.05水准，拒绝H0，接受H1，两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等，两组的疗效不同。试验组的平均退热天数比对照组短。例7-7已计算了的95%的可信区间：天，给出了两总体均数差别的数量大小。
1- ：检验效能（power）:当两总体确有差别，按检验水准所能发现这种差别的能力。
a 与 b 间的关系
a
b
减少（增加）I型错误，将会增加（减少）II型错误增大n 同时降低a 与 b
B
D
A
C
减少I型错误的主要方法：假设检验时设定值。
提高检验效能的最有效方法：增加样本量。
若，不拒绝H0，但不能下“无差别”或“相等”的结论，只能下“根据目前试验结果，尚不能认为有差别”的结论。
第三节大样本均数的假设检验
单样本数据，每组例数等于或大于60例；两样本数据，两组例数的合计等于或大于60例，而且基本均等。
两总体方差已知。
样本数据不要求一定服从正态分布总体。
另一方面，可信区间不但能回答差别有无统计学意义，而且还能比假设检验提供更多的信息，即提示差别有无实际的专业意义。

4 假设检验和t检验

t
2.671
17905113912 /11101971 9462 / 9 ( 1 1)
11 9 2
11 9
=n1+n22=11+9-2=18
(3)确定P值，作出推断结论
以=18，查 t 界值表得 0.01<P<0.02。按=0.05 水
准，拒绝 H0，接受 H1,差异有统计学意义。可以认为两种饲料对小鼠的体重影响不同。
(2)计算检验统计量
本例n=12，d=53，d2=555，
d d 53 4.42 n 12
sd
d2 (
d)2 / n
555 (53)2 /12 5.40
n 1
12 1
t d 4.42 2.83 sd / n 5.40 / 12
12 1 11
(3)确定P值，作出推断结论
(1)建立检验假设，确定检验水准
H0：1=2 即两组小鼠的体重总体均数相同 H1：1 2 即两组小鼠的体重总体均数不相同 =0.05
(2)计算检验统计量
126.45 105.11
t
2.671
(111)17.762 (9 1)17.802 ( 1 1)
11 9 2
11 9
126.45 105.11
型）选择相应的检验统计量。如 t 检验、z检验、 F检验和 2 检验等。
本例采用t检验方法 t X X X 0 , n 1
SX S n S n
本例t值为1.54
3. 确定P值,做出推断结论
是指查根表据得所到计检算验的用检的验临统界计值量，确然定后H将0成算立得的可能性的大统小计，量即与确拒定绝在域检的验临假界设值条作件比下较由，抽确样定误P差引起差值别。的如概对率双。侧 t 检验 | t | ，则 tα/2(ν) P α ,按检

假设检验的基本思想

现在，我们来解决例1提出的问题：
(1)假设H0：= 0=4.55，H1：≠4.55；
(2)选择检验用统计量；
(3)对于给定小正数，如=0.05，查标准正态分表得到临界值z/2 =z0.025 =1.96；
因为| z|=3.9＞1.96，所以拒绝H0，接受H1，即认为新工艺改变了铁水的平均含碳量。
以上两例都是科技领域中常见的假设检验问题。我们把问题中涉及到的假设称为原假设或称待检假设，一般用H0表示。而把与原假设对立的断言称为备择假设，记为H1。
如例1，若原假设为H0：= 0=4.55，则备择假设为H1：≠4.55。若例2的原假设为H0：X服从正态分布，则备择假设为H1：X不服从正态分布。
例如，在100件产品中，有一件次品，随机地从中取出一个产品是次品的事件就是小概率事件。因为此事件发生的概率=0.01很小，因此，从中任意抽一件产品恰好是次品的事件可认为几乎不可能发生的，如果确实出现了次品，我们就有理由怀疑这“100件产品中只有一件次品”的真实性。那么取值多少才算是小概率呢？这就要视实际问题的需要而定，一般取0.1，0.05，0.01等。
一、假设检验问题的提出
统计推断的另一个重要问题是假设检验问题。在总体的分布函数未知或只知其形式，但不知其参数的情况下，为了推断总体的某些性质，提出某些关于总体的假设。例如，提出总体服从泊松分布的假设，又如，对于正态总体提出数学期望μ0的假设等。
这里，先结合例子来说明假设检验的基本思
二、假设检验的基本思想
假设检验的一般提法是：在给定备择假设H1下，利用样本对原假设H0作出判断，若拒绝原假设H0，那就意味着接受备择假设H1，否则，就接受原假设H0。换句话说，假设检验就是要在原假设H0和备择假设H1中作出拒绝哪一个和接受哪一个的判断。究竟如何作出判断呢？对一个统计假设进行检验的依据是所谓小概率原理，即概率很小的事件在一次试验中是几乎不可能发生

茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解-第7~8章【圣才出品】

，xn；
)
0
2．分类数据的χ2 拟合优度检验
定理：在实际观测数与期望观测数相差不大的假定下，在 H0 成立时，对统计量
2
r i 1
(ni
npi0 )2 npi0
有 2
L 2 (r 1) 。
根据定理，采取显著性水平为α 的显著性检验：检验统计量为：
2
r i 1
(ni
npi0 )2 npi0
，拒绝域为W
{ 2
2 1
(r
1)} 。
五、正态性检验 1．W 检验 W 统计量
3 / 117
圣才电子书十万种考研考证电子书、题库视频学习平台

W
n
(ai
i 1
a
)( x ( i )
x
)
2
n
n
(ai a )2 (x(i) x )2
i 1
i 1
拒绝域{W≤Wa}。
2．比率 p 的检验（见表 7-1-2）
表 7-1-2 比率 p 的检验
2 / 117
圣才电子书十万种考研考证电子书、题库视频学习平台

四、似然比检验与分布拟合检验
1．似然比检验的思想
假设的似然比
sup p(x1，K ，xn； )
( x1，K
，xn
)
sup
p( x1，K
＋（n）}。
7.2 课后习题详解
习题 7.1
1．设 x1，…，xn 是来自 N（μ，1）的样本，考虑如下假设检验问题
4 / 117
圣才电子书十万种考研考证电子书、题库视频学习平台

H0：μ＝2 vs H1：μ＝3
若检验由拒绝域为 W {x 2.6}确定。

假设检验的基本原理

项目
假设检验的基本原理
一、假设检验的基本原理
参数估计是当总体的参数不明确时，根据数据找出参数的估计，以确定相应的总体。而当对参数的信息有所了解，但存在某种怀疑或猜测而需要证实时，则应用假设检验的方法来处理。
一、假设检验的基本原理
一、假设检验的概念
统计假设（简称假设）的实质是施加于一个或多个总体的概率分布或其参数的假设。所做的假设可以是正确的，也可以是不正确的。
一、假设检验的基本原理
反证法是假设检验所采用的逻辑推理方式，为了检验某个假设是否成立，先假设它是正确的，然后根据抽样理论和样本信息计算样本特征值。如果样本特征值在小概率范围内，就拒绝假设；如果样本特征值在大概率范围内，就接受假设。
一、假设检验的基本原理
四、假设检验的两类错误与功效
1. 假设检验的两类错误
一、假设检验的基本原理
假设检验过程中可能发生以下两类错误：（1）第Ⅰ类错误（type Ⅰ error）。当原假设为真时拒绝原假设所犯的错误称为第Ⅰ类错误，又称弃真错误。犯第Ⅰ类错误的概率记为α。（2）第Ⅱ类错误（type Ⅱ error）。当原假设为假时没有拒绝原假设所犯的错误称为第Ⅱ类错误，又称取伪错误。犯第Ⅱ类错误的概率记为β。
一、假设检验的基本原理
二、原假设和备择假设
在假设检验中，首先需要提出两种假设，即原假设和备择假设。在统计学中，把统计假设称为原假设或零假设(null hypothesis),记为H0。原假设通常是研究者想收集证据予以反对的假设。与原假设对立的是备择假设(alternative hypothesis) ，记为H1。备择假设通常是研究者想收集证据予以支持的假设，也称研究假设。备择假设通常用于支持研究者的看法，比如，研究者正在做一项研究，并想使用假设检验来支持自己的看法，就应该把自己认为正确的看法作为备择假设。

假设检验的基本概念

假设检验的基本概念
一、假设检验的基本原理二、假设检验的基本概念三、假设检验的一般步骤
回
停下
一、假设检验的基本原理
在实际工作中常会遇到这样的问题：（1）某药物在改进工艺后的疗效是否有提高？（2）假定总体服从某种分布是否成立？如何通过抽检的样本对上述问题做出判断？此时常常作出适当的假设,然后进行试验或
观测ห้องสมุดไป่ตู้得到统计样本,构造统计方法进行判断,以
决定是否接受这个假设.
假设检验就是这样一种统计推断方法，
根据样本提供的信息对所提出的假设作出判断: 是接受, 还是拒绝.
1. 基本原理小概率推断原理： 0 α 0.05 小概率事件 (概率接近0的事件),在一次试验中,实际上可认为不会发生(这是人们长期积累起的普遍经验!).
分析设该厂生产的猪肉罐头平均重量 μ = 500 g
则问题变为检验假设H0: μ = 500是否成立？
由以往经验可知, 标准差 σ = 2 ，
则X ~ N ( μ,22 ), 其中μ未知.
问题: 根据样本值判断 μ = 500 解 1° 提出两个对立假设还是 μ ≠ 500？
H 0 : μ μ0 500 , H1 : μ μ0 ;
/ n
u / 2 , 则称x与0差异是显著的 , 则
我们拒绝 H0;
反之，如果 | u | | x 0 |
/ n
u / 2 , 则称 x与0差异是不
显著的，则我们接受 H0 ;
上述 x与0有无显著差异的判断是在显著性水平
之下做出的 .
2. 检验统计量用于检验假设的统计量，称为检验统计量. 如：对于例2, X μ0 ______ 统计量U 检验统计量 σ/ n 3. 原假设与备择假设假设检验问题通常叙述为: “在显著性水平下,

概率论与数理统计第八章假设检验

对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
，
拒
绝H
0
u
拒绝

1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由经验知 0.015公斤，为了检验某天机器工作是否正常，抽取其所
包装的9袋称得重量分别为0：.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519；问这天机器正常否？
现在另一天任然抽取9袋得样本均值x 0.511公斤，推断这天机器是否工作正常?
小概率事件是: 样本均值X与所假设的期望0相差 X 0
不能太大, 若相差太大则拒绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的

2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念，合理的界限在何处？应由什么原则来确定？
问题是：如何给出这个量的界限？这里用到人们在实践中普遍采用的一个原则：
小概率事件在一次试验中基本上不会发生(若发生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用表示.

假设检验。《统计学》

ຫໍສະໝຸດ 4、假设检验中的拒绝域和接受域
在规定了检验的显著性水平α后，根据容量为n 的样本，按照统计量的理论概率分布规律，可以确定据以判断拒绝和接受原假设的检验统计量的临界值。
临界值将统计量的所有可能取值区间分为两个互不相交的部分，即原假设的拒绝域和接受域。
对于正态总体，总体均值的假设检验可有如下图示：
第二，假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的，而是基于实践中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件，并没有统一的界定标准，而是必须根据具体问题而定。如果一旦判断失误，错误地拒绝原假设会造成巨大损失，那么拒绝原假设的概率就应定的小一些；如果一旦判断失误，错误地接受原假设会造成巨大损失，那么拒绝原假设的概率就应定的大一些。
假设检验
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
参数估计和假设检验
参数估计和假设检验是统计推断的两个组成部分，都是利用样本对总体进行某种推断，但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。
＞X0），那么对于前者当X＜X0时，对于后者当X＞X0 时，可以否定原假设。这种假设检验称为单侧检验。可以分为左侧检验和右侧检验。
双侧检验与单侧检验 (假设的形式)
假设
H0 H1
研究的问题（总体均值检验）双侧检验左侧检验右侧检验 X= X0 X X 0 X X 0 X ≠ X 0 X < X 0 X > X 0
a和的关系就像翘翘板，a小就大， a大就小

假设检验的基本思想

《概率统计》返回下页结束
㈡检验的逻辑过程例3. 设某考试成绩X~N(m , 202), 从中任抽36人的成绩, 算得平均分为75, 问在显著性水平a = 0.05下, 是否可以认为全体考生的平均成绩为70分？要点: 某考试 (所有) 成绩是总体, 任意抽取的36人的成绩为样本. 欲通过样本信息推断总体分布中的 m 是否为70分？检验依据: 小概率事件在一次试验中一般不发生，若发生了，则认为
② 选择统计量
③ 确定拒绝域
选统计量 U
X m
/
~ N ( 0 ,1) .
n
由 P { | U | u a } a 0 .0 5, 查表得拒绝域为
2
U< -1.96 或 U>1.96 . ④ 计算统计量的值统计量的值为
U x m
完整解答…
/
75 70 20 / 6 1 .5 . n
《概率统计》返回下页结束
例3. 设某考试成绩X~N(m , 202), 从中任抽36人的成绩, 算得平均分为75, 问在显著性水平a = 0.05下, 是否可以认为全体考生的平均成绩为70分？检验过程(形而下): ① H0: m =m0=70, 即总体X~N(70 , 202), 从而知
一、假设检验的基本思想例1. 设某厂生产一种灯管, 其寿命 X~N (m , 200 2), 原来灯管
的平均寿命为m = 1500小时. 现在采用新工艺后, 在所生产的灯管中抽取25只, 测得平均寿命为1675小时. 问采用新工艺后, 灯管寿
命是否有显著提高 ?
问题表现为：判断 m >1500 ？例2. 某种农作物的农药残留量 X 是否服从正态分布 ?

假设检验的基本思想和有关概念的教学设计

㊀㊀㊀㊀㊀假设检验的基本思想和有关概念的教学设计假设检验的基本思想和有关概念的教学设计Һ魏满满１㊀李石虎２∗㊀周㊀勤２㊀（１．江苏师范大学科文学院，江苏㊀徐州㊀２２１１１６；２．江苏师范大学数学与统计学院，江苏㊀徐州㊀２２１１１６）㊀㊀ʌ摘要ɔ本文主要探究了假设检验的基本思想和有关概念的教学设计．首先，通过女士品茶的故事引入，提炼出假设检验的基本思想；其次，通过分析项链含金量这一实际案例总结出假设检验的基本步骤，并介绍了假设检验的两类错误和ｐ值的概念；最后，融入思政的元素，丰富了课堂教学内容．ʌ关键词ɔ假设检验；教学设计ʌ基金项目ɔ江苏师范大学课程思政专项研究（ＫＣＳＺＹ１７）；江苏师范大学数学与统计学院思政示范课程（ＸＹＫＣＳＺ０１）一㊁引㊀言概率论与数理统计课程是各个高校理工科的基础必修课，它在理工科及经管类各专业被广泛应用．假设检验是概率论与数理统计中的重要知识点，是统计推断的主要方法之一，在概率统计的理论研究与实际应用中都占有极其重要的地位．２０１９年３月１８日，在学校思想政治理论课教师座谈会上，习近平总书记明确提出［１］：要坚持灌输性和启发性相统一，注重启发性教育，引导学生发现问题㊁分析问题㊁思考问题，在不断启发中让学生水到渠成得出结论．近年来，各大高校都十分重视思政建设，通过教师培训㊁专家讲座㊁示范课程等多种方式来加深教师对课程思政的理解．教师是高校的第一主角，作为专业课教师，也有责任和义务认真挖掘所授课程的思政元素．例如，２０２１年，李晨和陈丽萍［２］在研究概率统计的思政元素时，以概率学者的文化素养和科学治学精神为切入点，通过多个实际案例剖析全概率公式的应用，潜移默化地引入诸多思政元素来激发学生的学习兴趣．受此启发，本文着重从概率论与数理统计课程中假设检验这一角度思考，通过教学设计来探索课程思政理念进概率统计课堂的实践方法，目的就是同大家交流如何上好假设检验这一知识点的教学课．首先，我们通过女士品茶这一广为流传且富有趣味性的故事引入，启发学生思考，从中提炼出假设检验的基本思想．其次，我们通过分析项链含金量这一实际案例总结出假设检验的基本步骤．接着，我们介绍假设检验的两类错误和ｐ值的概念，并介绍假设检验的一些应用．最后，我们融入思政的元素，以我国著名数学家严加安院士的‘悟道诗“为结尾，阐述了概率统计的基本思想，同时激励学生向老一辈科学家学习，树立正确的价值观，从而丰富了课堂教学内容．二㊁教学过程（一）问题引入首先，我们从一个经典故事出发，来体会假设检验的基本思想．例１［３］㊀（女士品茶试验）故事发生在英国剑桥大学，那是２０世纪２０年代，一群大学精英们正在品茶．该茶是由牛奶和茶水混合而成的．在品茶过程中，一位女士宣称：先加入牛奶还是先加入茶，不同的顺序会使茶的口感不同．周围人都认为这位女士简直是在胡言乱语，这是不可能的啊！然而在场的统计学家Ｆｉｓｈｅｒ却对这个话题很感兴趣，他请人端来１０杯调制好的茶让该女士品尝，其中有的是先加的牛奶，有的是先加的茶．结果，这位女士正确地鉴别出每一杯茶的制作顺序．该如何判断该女士是否有鉴别能力呢？Ｆｉｓｈｅｒ的想法：假设该女士没有鉴别能力，这个时候她只能靠猜，从而她猜对的概率为１２．因此，她能同时判断出１０杯茶的概率为２－１０＜０．００１，这个概率非常非常小，仅仅做一次试验是几乎不会发生的，可是，它却发生了！这表明原假设不恰当，应予以拒绝，认为该女士有鉴别能力！假设检验的基本思想：小概率反证法思想．先提出假设，然后设计试验，在原假设成立的条件下计算概率，依据小概率原理来判断是否拒绝原假设．那么多大的概率属于小概率呢？对于不同的问题，会有不同的标准，在统计学中，这个小概率称为显著性水平，常取０．０５或０．０１．接下来，我们就通过生活中的一个实际案例来探索一下假设检验的奥秘．（二）实例分析在生活中，经常会遇到一组数据，我们来看下面的例子．例２［４］㊀质检部门接到投诉后，对某金店进行调查，从标有１８Ｋ的一批项链中抽取２０条，测得其含金量如下：表１㊀某金店项链含金量数据单位：Ｋ１７．６１８．１１７．９１８．３１８．０１７．４１７．５１８．６１７．３１７．８１７．３１７．８１８．１１７．４１７．６１８．０１７．２１８．３１８．３１７．５∗通信作者：李石虎，男，讲师，博士，就职于江苏师范大学，研究方向为概率论与数理统计．联系方式：江苏省徐州市江苏师范大学泉山校区数学与统计学院；电话邮编：２２１１１６；Ｅ－ｍａｉｌ：ｓｈｉｈｕｌｉ＠ｊｓｎｕ．ｅｄｕ．ｃｎ．㊀㊀㊀㊀㊀㊀问：如何判断这批项链有没有达到标准呢？（显著性水平α＝０．０５）分析：观察表１中的数据，我们可以发现：有的含金量大于１８Ｋ，有的含金量小于１８Ｋ，还有的恰好等于１８Ｋ．那么我们能否直接说和标准值１８Ｋ有显著差别呢？根据所学的统计学思想方法，我们已经了解到答案是否定的，因为这里看到的只是样本数据，我们无法直接做出判断．那么应该如何判断呢？我们的思路如下：首先，计算出这２０条项链含金量的平均值为１７．８，它与标准值１８存在０．２的差值．这０．２的差值是由抽样引起的误差，还是有本质的差别？我们利用上述思想来检验一下．令ξ表示这批项链的含金量，由中心极限定理可知ξ ㊃Ｎ（μ，σ２），我们要检验均值是否为μ＝１８，具体步骤如下：１．建立假设．原假设Ｈ０：μ＝１８，表示这批项链符合标准；与之对立的备择假设Ｈ１：μʂ１８，表示这批项链不符合标准．２．在Ｈ０成立时，由Ｆｉｓｈｅｒ定理可知统计量Ｔ＝ｘ－μＳｎｎｔ（ｎ－１）＝ｔ（１９）．３．由Ｔ分布图像（如图１）可以看出：Ｔ的取值集中在零点附近．这表明：｜Ｔ｜越大，对应的概率就越小．从而存在临界值Ｃ，使得｜Ｔ｜大于或等于Ｃ是一个小概率事件，则Ｃ要满足Ｐ（｜Ｔ｜ȡＣ｜Ｈ０成立）＝α，再由Ｔ分布图像的对称性可知Ｃ＝ｔ０．９７５（１９）ʈ２．０９３．图１㊀Ｔ分布图像从而，当｜Ｔ｜ȡ２．０９３时，非常小的概率事件在此就发生了，只能拒绝原假设Ｈ０．我们将Ｗ＝｛（ξ１，ξ２，，ξｎ）｜｜Ｔ｜ȡ２．０９３｝这一集合称为拒绝域，如果样本的观测值落到Ｗ中，则原假设应被拒绝．４．代入样本均值和样本标准差进行计算，得到所观测的样本统计量ｔ的值：｜ｔ｜＝｜１７．８－１８｜０．４０３９３２０ʈ２．２１４＞２．０９３，其落到拒绝域Ｗ中，因此原假设被拒绝，故这批项链没有达到标准．为了更直观地理解拒绝域的含义，同学们可以参考Ｔ分布图像．小结㊀本案例利用假设检验思想得出了该金店项链的含金量不符合标准的结论，启发我们对待任何事情都不要抱有侥幸心理，不要弄虚作假，要诚信做人做事，方能赢得大家的信任．项链含金量不达标可能只是使消费者金钱方面的利益受损．试想一下：如果是某大型婴儿奶粉企业检测出质量不达标的产品呢？再或者是婴儿霜经检测含有毒物质呢？抑或是我们服用的某种药物检测出有危害健康的成分呢？这些案例都不是捕风捉影，均上过各大网站热搜，引起了消费者的恐慌．利用假设检验这个工具，有助于我们全面地认识这类事件，既可以让我们避免无谓的损失，又可以帮助我们找到有利的取舍依据．（三）假设检验的基本步骤通过对上述案例的分析，我们可以归纳出求解假设检验的基本步骤：第一步：从要研究的实际问题引入，先提出一个假设，一般称之为原假设，记为Ｈ０，与其对立的假设称为备择假设，记为Ｈ１．例如，在上述案例中，原假设为这批项链符合标准，备择假设为这批项链不符合标准．第二步：依据所研究总体服从的分布，我们来构造合适的检验统计量，并通过所学知识来确定统计量服从的分布．第三步：接下来，我们需要确定检验的拒绝域Ｗ使得Ｐ（（ξ１，ξ２，，ξｎ）ɪＷ｜Ｈ０成立）ɤα．第四步：根据样本数值计算统计量所对应的观测值．如果计算所得观测值落进了Ｗ中，则说明原假设不当，应予以拒绝，否则原假设不可以被拒绝．（四）假设检验的两类错误在女士品茶的例子中，如果该女士本来就没有鉴别能力，但是她运气好，每次都猜对了，这时候我们的推断就出错了．事实上，在假设检验问题中，我们由样本提供的信息来推断总体信息，由于样本只包含总体的一部分信息，这就不可能保证从来不会犯错误．假设检验可能犯的错误有如下两类：（Ⅰ）是否在拒绝假设Ｈ０时用了小概率原理．注意小概率事件并非不可能事件，如果原假设本为真，但由于样本值落进了拒绝区域内而得出拒绝的结论，这里犯的错误为弃真错误，通常称为第一类错误，记为α，即Ｐ（拒绝Ｈ０｜Ｈ０为真）＝α．（Ⅱ）反之，如果原假设Ｈ０本来是不成立的，却由于样本值未落进拒绝区域而得出不能拒绝的结论．这里的错误是纳伪错误，一般称为第二类错误，记作β，即Ｐ（接受Ｈ０｜Ｈ０不真）＝β．根据检验法则知：当Ｈ０成立时，拒绝Ｈ０的概率小于或等于显著性水平α，但是显著性水平α取得越小越好，因为㊀㊀㊀㊀㊀此时拒绝域也会相应地减小，从而导致犯第二类错误的概率增大．这是一个矛盾的双方，类似于区间估计时的做法，我们需要先固定显著性水平α，再选择合理的检验统计量来适当地减小β的值．下面我们再结合一个实际例子来理解两类错误：在新冠肺炎疫情发生初期，新闻报道中时常会出现假阳的检测结果．我们可以从假设检验的两类错误的角度来理解：事实上，任何检验方法都会存在犯错误的可能性，理想的试剂应是假阴和假阳出现的概率都越小越好，但当样本量有限㊁检测技术没有明显优化提升时，一类错误概率的减少必会导致另一类错误概率的增加，因此处理原则是：人为限定犯第一类错误的概率α，为降低犯第二类错误的概率，我们可以增大样本容量．所以，从统计学的观点看，新闻报道中的假阴假阳患者出现并不奇怪．启发：小概率事件虽然在一次试验中不易发生，但绝非不可能事件，重复次数多了，发生的可能性也就增大了．这说明做任何事情都不要存在投机取巧的心理，俗话说常在河边走，哪有不湿鞋勿以恶小而为之，勿以善小而不为．反之，再困难的事情，只要我们持之以恒，总是可以成功的，正所谓锲而不舍，金石为开！（五）假设检验的ｐ值可以看出，显著性水平α变小，对应的拒绝域也会变小；当显著性水平α取得足够小时，使得样本值不落在相应的拒绝域中，从而在此显著性水平α下不能拒绝假设Ｈ０．当显著性水平α由上述足够小的值不断增大时，对应的拒绝域也会变大，当显著性水平α大到一定程度时，便可以使样本值落入相应的拒绝域中，从而在此显著性水平α下可以拒绝假设Ｈ０．对于一个确定的样本值，存在一个实数ｐ（０＜ｐ＜１），当显著性水平α＝ｐ时可以拒绝Ｈ０，而当α＜ｐ时原假设Ｈ０不可以被拒绝．可见，ｐ是使依据给定样本数值做出拒绝Ｈ０的最小的那个显著性水平，我们称之为检验的ｐ值．在例２中，我们也可以通过统计软件计算ｔ统计量的值和ｐ值：表２㊀某金店项链含金量检验结果检验值＝１８ｔｄｆｐ值均值差值项链含金量－２．２１４１９０．０３９－０．２００００给定显著性水平α为０．０５，由表２可知ｐ值０．０３９＜０．０５，原假设应被拒绝，认为项链含金量与１８Ｋ之间有显著的统计差异，从而得出项链不符合标准的结论．（六）课堂小结与思政本节课我们主要通过女士品茶的案例引入假设检验的基本思想，通过分析项链含金量这一实际案例总结出假设检验的基本步骤，也给出了假设检验的两类错误和ｐ值的含义，这为接下来进一步学习不同类型的㊁具体的假设检验打下了必要的基础．假设检验不仅是一种重要的统计方法，更是一种思维方式，告诉我们用数据来说话，理性地看待问题．正因为如此，假设检验在我们的现实生活中有着十分重要的应用．比如，专家利用假设检验，结合临床数据分析不同采样点㊁人群㊁年龄的新冠病毒核酸检测的结果，给有关部门的决策提供参考．假设检验的理论方法不仅被广泛应用于医学检验㊁生物制药等诸多领域，在我们的生产生活，特别是工业产品的质量判断中也有着十分广泛的应用［５］，因为在工厂的实际生产过程中，产品的尺寸总是左右浮动的，存在一定的误差，那么如何判断这些误差是否在允许的范围内？这就要用到假设检验的思想方法．不仅如此，假设检验的理论还可应用于文学研究．例如，东南大学韦博成教授在２００９年［６］利用假设检验的理论方法分析了‘红楼梦“前８０回与后４０回的某些文风差异，得到的结论是这两部分内容在写作风格方面存在明显的差异，给关于‘红楼梦“作者的论断提供了一个强有力的证据．在现实生活中，数据是无处不在的，学习假设检验的思想方法有助于我们正确地挖掘数据背后的规律，做出更客观的判断．如今，我们身处一个大数据时代，通过学习假设检验，更重要的是培养透过现象看本质这一统计思维．这里，调查得来的数据是现象，规律是从数据中探索出来的本质属性．我们需要借助数学模型，并结合统计方法来寻找这其中的规律和随机性，在潜移默化中培养统计思维．正如我国著名的数学家严加安院士在‘悟道诗“中所题：随机非随意，概率破玄机；无序隐有序，统计解迷离．注：课后同学们若想进一步了解统计学的发展历程，可以读一读‘２０世纪统计怎样变革了科学：女士品茶“［７］这一科普著作．ʌ参考文献ɔ［１］习近平主持召开学校思想政治理论课教师座谈会［Ｎ］．新华社，２０１９－０３－１８，２０：５７．［２］李晨，陈丽萍．概率论与数理统计课程教学中思政元素的挖掘与实践［Ｊ］．大学教育，２０２１（９）：１０４－１０６．［３］茆诗松，程依明，濮晓龙．概率论与数理统计教程：第３版［Ｍ］．北京：高等教育出版社，２０１９．［４］朱元泽，李贤彬．概率论与数理统计［Ｍ］．上海：上海交通大学出版社，２０１５．［５］乔静．假设检验在工业产品质量判断中的应用［Ｊ］．机电信息，２０２０（２７）：１４２－１４３．［６］韦博成．‘红楼梦“前８０回与后４０回某些文风差异的统计分析（两个独立二项总体等价性检验的一个应用）［Ｊ］．应用概率统计，２００９（４）：４４１－４４８．［７］萨尔斯伯格．２０世纪统计怎样变革了科学：女士品茶［Ｍ］．北京：中国统计出版社，２００４．。

假设检验

假设检验这里将涉及到统计学分析最为主要的理论前提：假设检验。

假设检验思想是构建统计理论，分析统计数据的决策支持的基石。

这里将首先介绍假设检验的相关思想、理论基础、分析步骤等，然后分别叙述几个比较重要的分布类型检验——正态分布检验、二项分布检验以及游程检验，并借此使同学们更加熟悉假设检验基本思想的具体应用。

一、假设检验的概念与原理1、假设检验的思维逻辑为了直观地介绍假设检验及其原理，这里不妨以实际生活为背景虚构一个例子：某商家宣称他的一大批鸡蛋“坏（变质）蛋率为1%”。

为了对这批鸡蛋的质量（即“坏蛋率为1%”还是“坏蛋率高于1%”）做出判断，顾客与商家约定，从中随机抽取5个作检查。

结果为4个“好蛋”，1个“坏蛋”。

根据这一检查结果，几乎任何一位顾客都会对“这批鸡蛋坏蛋率为1%”的广告词发生怀疑。

在“坏蛋率为1%”的前提下，5个鸡蛋样品中出现一个“坏蛋”的机会是很小的（应用二项分布的原理可以计算出，在这种前提下5个鸡蛋中出现1个或更多变质蛋的概率为0.049）。

发生机会理应很小的事件竟然在一次抽样中出现了?! 人们不禁怀疑前提条件（如“坏蛋率为1%”）的真实性。

这一思维逻辑上升到统计理论便是“小概率事件在一次随机试验中不（大）可能发生”的推断原理。

当然这样推断也可能出错, 因为在“坏蛋率为1%”的前提下, 毕竟还有4.9%的可能真的出现5个鸡蛋有1个“坏蛋”, 甚至更多坏蛋的情形。

本章将要介绍的假设检验理论和方法，正是基于这一思维判断形式而发展出来的依据随机样本对于未知事物进行判断和决策的规则。

需要通过假设检验来处理的问题一般具有两个特点：一是需要从全局的范围，即从总体上对问题作出判断；二是不可能或者不允许对研究总体的每一个个体均做观察。

例如，某工厂生产了一批炮弹，需要检测它们的质量是否合格；某药厂生产了一批用安瓿瓶封装的注射药物，需要检测它们的质量是否合格；某种治疗高血压的新药的疗效是否优于常规药物等等。

假设检验的基本思想

例8.2 某预制品厂生产的混凝土制件，由于原料和生产过程的种种
随机因素，各制件的抗压强度一般是不完全相同的，为了研究混凝土制件抗压强度的分布，随机抽样试验了200件混凝土制件的抗压强度，以分组的形式给出如下数据：
问:能否认为这种混凝土制件的抗压强度服从正态分布? 与上例相似，先建立假设：假设混凝土制件的抗压强度服从正态分布，然后通过抽取样本的信息来推断这种假设的正确性。这种类型的假设检验一般称为非参数假设检验。
因为X ~ N ( μ , σ2)，当 H0 : μ = μ0 = 355为真时，X ~ N ( μ , σ2)，
于是
1 n
X = n i1 X i
N
(
0
,
2
n
)
Z X 0 X 0 N (0,1) , 2 n n
给定一个小概率 α ，存在一个分位数 z 2 ，
使得
P{| Z | z 2} .
例8.1 机器罐装的牛奶每瓶标明为355毫升，设 X 为实际容量，由过
去的经验知道，在正常生产情况下，X ~ N ( μ , σ2)。根据长期的经验知其标准差 σ =2毫升。为检验罐装生产线的生产是否正常，某日开工后抽查了12瓶，其容量为：
350，353，354，356，351，352， 354，355，357，353，354，355
若取 α =0. 05，则 P{| Z | 1.96} 0.05 ( 查附表2标准正态分布
表可得 z 0.025=1. 96 ) 将样本观测值代入 Z 得
Z X 0 353.67 355 =2.3>1.96 .
n
2 12

因为 α = 0.05 很小，根据实际推断原理，即“小概率事件在一次试验中几乎是不可能发生的”，当 H0 为真时，事件 P{|Z| >1.96} = 0.05 是小概率事件,实际上是不可能发生的。现在抽样的结果是: |Z| =2. 3 >1. 96，也就是说，小概率事件 P{|Z| >1.96} = 0.05居然在一次抽样中发生了，这是一个几乎矛盾的结果，因而不能不使人怀疑假设 H0 的正确性，所以在显著性水平 α = 0.05下，我们拒绝 H0 ，接受 H1 ，即认为这一天罐装生产线的生产是不正常的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(1) 是参数估计问题吗？
(2) 回答“是”还是“否” ，假设检验问题。
(3) 命题“合金平均强度不低于110Pa”正确与
否仅涉0 及{如:下 1两10个} 参数集1 合 {： : 110}
这两个非空参数集合都称作统计假设，简称假设。
(4) 我们的任务是利用样本去判断假设（命题） “ 0 ”是否成立。这里的“判断”在统
正如在数学上我们不能用一个例子去证明一个结论一样，用一个样本（例子）不能证明一个命题（假设）是成立的，但可以用一个例子（样本）推翻一个命题。因此，从逻辑上看，注重拒绝域是适当的。事实上，在“拒绝原假设”和“拒绝备择假设（从而接收原假设）” 之间还有一个模糊域，如今我们把它并入接收域，所以接收域是复杂的，将之称为保留域也许更恰当，但习惯上已把它称为接收域，没有必要再进行改变，只是应注意它的含义。
二、选择检验统计量，给出拒绝域形式
由样本对原假设进行判断总是通过一个统计量完成的，该统计量称为检验统计量。使原假设被拒绝的样本观测值所在区域称为拒绝域，一
般用W 表示，在例7.1.1中，样本均值 x愈大，
意味着总体均值也大，因此，合理的拒绝域
形如 W {(x1,L , xn ) : x c} {x c}
计学中称为检验或检验法则。
7.1.2 假设检验的基本步骤
一、建立假设
在假设检验中，常把一个被检验的假设称为原假设，用 H0表示，通常将不应轻易加以否定的假设作为原假设。当 H0被拒绝时而接收的假设称为备择假设，用 H1表示，它们常常成对出现。
在例7.1.1中，我们可建立如下两个假设：
H0 : 110 vs H1 : 110
三、选择显著性水平
检验可能犯以下两类错误：
➢ 其一是 H0为真但样本观测值落在拒绝域中，从而拒绝原假设 H0，这种错误称为第一类错误，其发生的概率称为犯第一类错误的概率，或称拒真概率，通常记为 .
➢ 其二是 H0不真（即 H1为真）但样本观测值落在接受域中，从而接受原假设 H，0 这种错误称为第二类错误，其发生的概率称为犯第二类错误的概率,或称受伪概率，通常记为。
观测数据情况
总体情况
H 0为真
H1为真
(x1,L , xn ) W
犯第一类错误
正确
(x1,L , xn ) W c 正确
犯第二类错误
犯第一类错误的概率和犯第二类错误的概率可以用同一个函数表示，即所谓的势函数。势函数是假设检验中最重要的概念之一，定义如下：
定义7.1.1 设检验问题 H0 : 0 vs H1 : 1
§7.1 假设检验的基本思想与概念
7.1.1 假设检验问题
例7.1.1 某厂生产的合金强度服从 N( ,，16其) 中
的设计值为不低于110(Pa)。为保证质量，该
厂每天都要对生产情况做例行检查，以判断生产是否正常进行,即该合金的平均强度不低于
110(Pa)。某天从生产中随机抽取25块合金，
测得强度值为x1, x2 , …, x25，其均值为 x 108 (Pa)，问当日生产是否正常？
说明：在样本量一定的条件下不可能找到一
个使和都小的检验。
英国统计学家 Neyman 和 Pearson 提出水平
为的显著性检验的概念。
定义7.1.2 对检验问题 H0 : 0 对 H1 : 1
如果一个检验满足对任意的 0，都有 g( ) ,
则称该检验是显著性水平为的显著性检验，简称水平为的检验。
四、给出拒绝域
确定显著性水平后，可以定出检验的拒绝域W。
在例7.1.1中，若取=0.05,
由于g()关于单调减，只需要
g (110)
5(c
110) 4
0.05
成立即可。这给出c 的值为
c 110 0.8u0.05 110 0.81.645 =108.684 检验的拒绝域为 W {x 108.684}
g( )
P ( /5
c
4/5
这个势函数是的减函数
利用这个势函数容易写出犯两类错误的概率
分别为
(
)
c
4/5
,
0
和
(
)
1
c
4/5
,
1,
由此可得如下结论：
➢ 当减小时，c 也随之减小，必导致的增大； ➢ 当减小时，c 会增大，必导致的增大；
若令 u x 110 4/5
则拒绝域有另一种表示: W {u u0.05} {u 1.645}
五、作出判断
在有了明确的拒绝域后，根据样本观测值我们可以做出判断：
➢ 当 x 108.684 或 u 1.时64，5 则拒绝 H0
即接收 H1 ；
➢ 当 x 108.684 或 u 1.645时，则接收 H0
的拒绝域为W，则样本观测值落在拒绝域内的概率称为该检验的势函数，记为
x g( ) P ( W ), 0 1 (7.1.3)
势函数 g( )是定义在参数空间上的一个函数。犯两类错误的概率都是参数的函数，并可由势
函数算得，即：
( ), g( ) 1 ( ),
0 1
对例7.1.1，其拒绝域为W {x，c由} (7.1.3)可以算出该检验的势函数
在例7.1.1中，由于 x 108 108.684
因此拒绝原假设，即认为该日生产不正常。

假设检验的基本思想与概念

合集下载

假设检验的基本概念

4 假设检验和t检验

假设检验的基本思想

茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解-第7~8章【圣才出品】

假设检验的基本原理

假设检验的基本概念

概率论与数理统计第八章假设检验

假设检验。《统计学》

假设检验的基本思想

假设检验的基本思想和有关概念的教学设计

假设检验

假设检验的基本思想

文档推荐

最新文档