第45-46讲方差的假设检验知识分享
- 格式:docx
- 大小:263.32 KB
- 文档页数:10
方差分析原假设简介造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
原理定义方差分析(anova)又称“变异数分析”或“f检验”,就是由罗纳德·费雪爵士发明者的,用作两个及两个以上样本均数差别的显著性检验。
原理方差分析的基本原理就是指出相同处置组的均数间的差别基本来源存有两个:(1) 实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和的总和表示,记作ssb,组间自由度dfb。
(2) 随机误差,例如测量误差导致的差异或个体间的差异,称作组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和则表示,记作ssw,组内自由度dfw。
总偏差平方和 sst = ssb + ssw。
组内ssw、组间ssb除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),获得其均方msw和msb,一种情况就是处置没促进作用,即为各组样本均源自同一总体,msb/msw≈1。
另一种情况就是处置的确存有促进作用,组间均方就是由于误差与相同处置共同引致的结果,即为各样本源自相同总体。
那么,msb\ue\uemsw(远远大于)。
msb/msw比值构成f分布。
用f值与其临界值比较,推断各样本是否来自相同的总体。
基本思想方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
举例分析:下面我们用一个简单的例子来说明方差分析的基本思想:如某克山病区测出11基准克山病患者和13名健康人的血磷值(mmol/l)如下:患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87问该地克山病患者与健康人的血磷值是否不同?从以上资料可以窥见,24个患者与健康人的血磷值各不相同,如果用离求逆平方和(ss)叙述其紧紧围绕总均值的变异情况,则总变异存有以下两个来源:组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;组间变异,即为由于克山病的影响使患者与健康人组的血磷值均值大小不等。
假设检验-1Hypothesis Testing假设检验方法【例】一种机床加工的零件尺寸绝对平均误差允许值为1.35mm 。
生产厂家现采用一种新的机床进行加工以期进一步降低误差。
为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。
利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(α=0.1),数据见:”Parts .mtw ”左侧检验1.061.220.911.971.982.031.011.241.450.990.590.501.500.741.23 1.131.020.951.121.12 1.161.031.121.100.98 1.122.371.540.961.1950个零件尺寸的误差数据(mm)0.821.601.101.000.970.861.231.171.261.381.70 1.641.081.110.941.061.13 1.811.311.261-Sample Z Test —例题应用Minitab 检验假设检验-31-Sample Z Test—习题1. 请打开“1-Sample Z Test .mtw”C1为某钢丝绳索制造商声称其生产的钢丝绳的平均抗断强度为大于5磅,已经知道总体标准差为1,请判断其声明是否正确?注意:Ⅰ.当小样本时(n<25~30),且总体标准差未知时使用1-Sample T Test.使用1-Sample T Test前,一定要检验正态性.如果非正态时,可以考虑:a.增加样本量,达到n≥25.b.使用非参量设计(绿带教程一般不涉及)Ⅱ. 当大样本时(n≥25~30),使用1-Sample Z Test.不一定要求正态性.如果不知道总体标准差时,可以使用样本标准差代替.Ⅲ.当小样本时(n<25~30),但总体标准差已知时,也是使用1-Sample Z Test.注意:小样本时;一定要保证正态性.第一步设定H0和H a1. H0: 钢丝绳的平均抗断强度≤5H a:钢丝绳的平均抗断强度>5磅2. 取α=0.05假设检验-5第二步比较均值结论One-Sample Z: ValuesTest of mu= 5 vs mu> 5The assumed sigma = 1Variable N Mean StDev SE MeanValues 30 5.435 0.984 0.183Variable 95.0% Lower Bound Z PValues 5.134 2.38 0.009因为P小于0.05,所以对立假设成立。
高考数学知识点速记假设检验的原理与步骤高考数学知识点速记:假设检验的原理与步骤在高考数学中,假设检验是一个重要的知识点。
它不仅在统计学中有着广泛的应用,也是培养我们逻辑思维和数据分析能力的重要工具。
接下来,让我们一起深入了解假设检验的原理与步骤。
一、假设检验的基本概念假设检验是根据样本所提供的信息,对关于总体的某个假设进行检验,判断这个假设是否成立。
我们通常会提出两个相互对立的假设:原假设(H₀)和备择假设(H₁)。
原假设是我们想要检验其是否为真的假设,而备择假设则是在原假设不成立时的另一种可能。
例如,我们想检验某种药物是否有效。
原假设可能是“该药物无效”,备择假设则是“该药物有效”。
二、假设检验的原理假设检验的基本原理是基于小概率事件原理。
小概率事件在一次试验中几乎不可能发生。
如果在一次试验中,小概率事件竟然发生了,我们就有理由怀疑原假设的正确性,从而拒绝原假设,接受备择假设。
在进行假设检验时,我们首先假定原假设成立,然后根据样本数据计算出一个统计量的值。
这个统计量的值会反映样本与原假设之间的差异程度。
接着,我们根据预先设定的显著性水平(α)来确定一个临界值。
如果计算得到的统计量的值超过了临界值,就说明样本与原假设之间的差异过大,是小概率事件发生了,我们就拒绝原假设;否则,我们就不能拒绝原假设。
三、假设检验的步骤1、提出原假设和备择假设原假设和备择假设要相互对立且完整。
例如,对于一个关于均值的假设检验,原假设可以是“总体均值等于某个值μ₀”,备择假设则可以是“总体均值大于μ₀”、“总体均值小于μ₀”或“总体均值不等于μ₀”。
2、选择合适的检验统计量检验统计量的选择取决于所研究的问题、总体的分布以及样本的大小等因素。
常见的检验统计量有 z 统计量、t 统计量等。
3、确定显著性水平显著性水平α表示在原假设为真的情况下,拒绝原假设的概率。
通常,我们会选择α = 005 或α = 001 等。
4、计算检验统计量的值根据样本数据,按照所选检验统计量的公式计算出其值。
第45-46讲方差的假
设检验
第45-46讲
正态总体方差的假设检验
χ第1节课:单正态总体下方差的假设检验——2
设总体X ~N (μ,σ2),μ未知,检验假设
H 0:σ2=σ02;H 1:σ2≠σ02.
其中σ02为已知常数.
由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值2
2
S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时
2
χ=22
(1)n S σ-~2χ(n -1). 所以对于给定的显著性水平α有
P {21/2αχ-(n -1)≤2χ≤2
/2αχ(n -1)}=1-α.
对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2
/2αχ(n -1). 则H 0的接受域是
21/2αχ- (n -1)≤2χ≤2
/2αχ (n -1);
H 0的拒绝域为
2χ<21/2αχ-(n -1)或2χ>2
/2αχ(n -1).
这种用服从2χ分布的统计量对个单正态总体方差进行 假设检验的方法,称为2
χ检验法.
例 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?
解 本题要求在α=0.02下检验假设
H 0:σ2=5000;H 1:σ2≠5000.
现在n =26,
2/2αχ(n -1)=20.01(25)χ=44.314,
21/2αχ- (n -1)= 20.99(25)χ=11.524,
σ02=5000.
拒绝域为
于是有
P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α. 可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:
2
χ=22
(1)n S σ->2αχ(n -1)(右检验). 类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ02
的拒绝域为
2χ<21αχ-(n -1)(左检验).
例 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)
解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02.
(2) 选取统计量
2
χ=22
(1)n S σ-. *2
χ=
2
2
(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ
(3) 对于显著性水平α=0.05,查2χ分布表得
21αχ-(n -1)=20.95(24)χ=13.848,
当H 0为真时,
P {2χ<2
1αχ- (n -1)}≤P 2212
(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭
=α. 故拒绝域为
2χ<21αχ- (n -1)=13.848.
(4) 根据样本观察值计算2χ的观察值
2
χ=
2
2
0(1)240.00066
0.0012
n s σ-⨯=
=13.2.
(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2
χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后
生产的零件直径的方差小于革新前生产的零件直径的方差.
钟单个正态总体的假设检验可列表如下
与Y 相互独立,2212,σσ未知,试对21σ与2
2σ有无显著差异作假设检验.
①在总体上作假设22012:H σσ=↔22112:H σσ≠
②检验统计量
00*22*2112*22*22 / ~(1,1)H H X X
Y Y
S S F F n n S S σσ==--
③给定显著水平α,存在1212
(1,1)F n n α---和
122
(1,1)F n n α--,使
1212122
{(1,1)}{(1,1)}2P F F n n P F F n n ααα
-<--=>--= 故取拒绝域
1212121212122
(1,1)
{(,,,;,,,)}
(1,1)n n F F n n W x x x y y y F F n n αα-<--=>--L L ④决策:当抽样结果是
121212(,,,;,,,)n n x x x y y y W ∈L L 时,拒绝0H ,认为21σ与22σ有显著差异;否则接受0H ,认为21σ与22σ无显著差异.
例 有两种冶金方法,所得产品中的杂质含量(%)分别为211~(,)X N μσ,222~(,)Y N μσ,且X 与Y 相互独立,各抽取一个子样,杂质含量(%)如下:
问:两种方法生产的产品中所含杂质的波动性有无显著差异(取0.05α=)?
解:①作假设22012:H σσ=↔22112:H σσ≠
②检验统计量 0
*212*2 ~(1,1)H X
Y
S F F n n S =-- ③拒绝域 121212
1212122
(1,1){(,,,;,,,)}(1,1)
n n F F n n W x x x y y y F F n n αα-<--=>--L L ④给定显著水平0.05α=,1213,9n n ==,则查表
可得
120.0252
(1,1)(12,8) 4.20F n n F α--==,
1120.9752
0.025(1,1)(12,8)
110.28(8,12) 3.51
F n n F F α---====。