单个正态总体均值假设检验
- 格式:pptx
- 大小:323.63 KB
- 文档页数:3
概率论与数理统计08假设检验均值的假设检验U 检验(单尾和双尾)t 检验(单尾和双尾)单个总体单个正态总体均值μ的假设检验均值的双尾U 检验(σ2已知)1.假定条件:总体服从正态分布,方差已知2. 原假设:H 0: μ=μ0备择假设:H 1:μ≠μ03. 使用U -统计量U ~(0,1)N n X μσ−=均值的双尾U 检验(σ2已知)U-统计量的分布临界值临界值α/2α/2拒绝域拒绝域接受域1 -α临界值临界值α/2α/2拒绝域拒绝域接受域1 -αU -统计量的分布均值的双尾U 检验(σ2已知)临界值临界值α/2α/2拒绝域拒绝域接受域1 -αU -统计量的分布均值的双尾U 检验(σ2已知)临界值临界值α/2α/2拒绝域拒绝域接受域1 -αU -统计量的分布均值的双尾U 检验(σ2已知)均值的双尾U 检验(σ2已知)例某机床厂加工一种零件,设零件的椭圆度(单位:mm)近似服从正态分布,μ=0.081,σ=0.025.今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度均值为0.076.试问新机床加工零件的椭圆度的均值与以前有无显著差异?(α=0.05)均值的双尾U 检验(σ2已知)•H0: μ= 0.081•H1: μ≠0.081α= 0.05•n= 200•临界值:uα2= 1.96检验统计量:U0 1.96-1.96.025拒绝H0拒绝H.025决策:结论:在显著性水平5%下拒绝H证据表明新机床加工零件的椭圆度与以前存在显著差异.U=x−μ0Τσn=0.076−0.081Τ0.025200=−2.83。
第二节 单个正态总体的假设检验1.单个正态总体数学期望的假设检验(1) σ2已知关于μ的假设检验(Z 检验法(Z -test)) 设总体X ~N (μ,σ2),方差σ2已知,检验假设H 0:μ=μ0;H 1:μ≠μ0 (μ0为已知常数) 由X ~N (μ,n σ),/X nσ~N (0,1), 我们选取Z =/X nσ (8.2)作为此假设检验的统计量,显然当假设H 0为真(即μ=μ0正确)时,Z ~N (0,1),所以对于给定的显著性水平α,可求z α/2使P {|Z |>z α/2}=α,见图8-1,即P {Z <-z α/2}+P {Z >z α/2}=α.从而有P {Z >z α/2}=α/2, P {Z ≤z α/2}=1-α/2.图8-1利用概率1-α/2,反查标准正态分布函数表,得双侧α分位点(即临界值)z α/2. 另一方面,利用样本观察值x 1,x 2,…,x n 计算统计量Z 的观察值z 0=/x S n-. (8.3)如果:(a )|z 0|>z α/2,则在显著性水平α下,拒绝原假设H 0(接受备择假设H 1),所以|z 0|>z α/2便是H0的拒绝域.(b ) |z 0|≤z α/2,则在显著性水平α下,接受原假设H 0,认为H 0正确.这里我们是利用H0为真时服从N (0,1)分布的统计量Z 来确定拒绝域的,这种检验法称为Z 检验法(或称U 检验法).例8.1中所用的方法就是Z 检验法.为了熟悉这类假设检验的具体作法,现在我们再举一例.例8.2 根据长期经验和资料的分析,某砖厂生产的砖的“抗断强度”X 服从正态分布,方差σ2=1.21.从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg ·cm -2):32.56 29.66 31.64 30.00 31.87 31.03检验这批砖的平均抗断强度为32.50kg ·cm -2是否成立(取α=0.05,并假设砖的抗断强度的方差不会有什么变化)?解 ① 提出假设H 0:μ=μ0=32.50;H 1:μ≠μ0. ② 选取统计量Z =/X nσ,若H 0为真,则Z ~N (0,1).③ 对给定的显著性水平α=0.05,求z α/2使P {|Z |>z α/2}=α,这里z σ/2=z 0.025=1.96.④ 计算统计量Z 的观察值:|z 0|=/x nμσ- =31.1332.501.16-≈3.05.⑤ 判断:由于|z 0|=3.05>z 0.025=1.96,所以在显著性水平α=0.05下否定H 0,即不能认为这批产品的平均抗断强度是32.50 kg ·cm -2.把上面的检验过程加以概括,得到了关于方差已知的正态总体期望值μ的检验步骤: (a ) 提出待检验的假设H 0:μ=μ0;H 1:μ≠μ0. (b ) 构造统计量Z ,并计算其观察值z 0:Z =/X nσ,z 0=/x nσ-.(c ) 对给定的显著性水平α,根据P {|Z |>z α/2}=α,P {Z >z α/2}=α/2,P {Z ≤z α/2}=1-α/2查标准正态分布表,得双侧α分位点z α/2. (d ) 作出判断:根据H 0的拒绝域 若|z 0|>z α/2,则拒绝H 0,接受H 1; 若|z 0|≤z α/2,则接受H 0.(2) 方差σ2未知,检验μ(t 检验法(t -test)) 设总体X ~N (μ,σ2),方差σ2未知,检验H 0:μ=μ0;H 1:μ≠μ0.由于σ2未知,/X nσ便不是统计量,这时我们自然想到用σ2的无偏估计量——样本方差S 2代替σ2,由于/X nσ~t (n -1),故选取样本的函数t =0/X S n(8.4)图8-2作为统计量,当H 0为真(μ=μ0)时t ~t (n -1),对给定的检验显著性水平α,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2,见图8-2,直接查t 分布表,得t 分布分位点t α/2(n -1).利用样本观察值,计算统计量t 的观察值t 00/x s n, 因而原假设H0的拒绝域为|t 0|0/x s nμ-t α/2(n -1). (8.5)所以,若|t 0|>t α/2(n -1),则拒绝H 0,接受H 1;若|t 0|≤t α/2(n -1),则接受原假设H 0.上述利用t 统计量得出的检验法称为t 检验法.在实际中,正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的问题.例8.3 用某仪器间接测量温度,重复5次,所得的数据是1250°,1265°,1245°,1260°,1275°,而用别的精确办法测得温度为1277°(可看作温度的真值),试问此仪器间接测量有无系统偏差?这里假设测量值X 服从N (μ,σ2)分布. 解 问题是要检验H 0:μ=μ0=1277;H 1:μ≠μ0.由于σ2未知(即仪器的精度不知道),我们选取统计量t =0/X S n.当H 0为真时,t ~t (n -1),t 的观察值为|t 0|012591277185.399/(570)/(45)x s n μ---==⨯>3.对于给定的检验水平α=0.05,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2, P {t >t 0.025(4)}=0.025,查t 分布表得双侧α分位点t α/2(n -1)=t 0.025(4)=2.776.因为|t 0|>3>t 0.025(4)=2.776,故应拒绝H 0,认为该仪器间接测量有系统偏差.(3) 双边检验与单边检验上面讨论的假设检验中,H 0为μ=μ0,而备择假设H 1:μ≠μ0意思是μ可能大于μ0,也可能小于μ0,称为双边备择假设,而称形如H 0:μ=μ0,H 1:μ≠μ0的假设检验为双边检验.有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体的均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺.此时,我们需要检验假设H 0:μ=μ0;H 1:μ>μ0. (8.6)(我们在这里作了不言而喻的假定,即新工艺不可能比旧的更差),形如(8.6)的假设检验,称为右边检验,类似地,有时我们需要检验假设H 0:μ=μ0;H 1:μ<μ0. (8.7)形如(8.7)的假设检验,称为左边检验,右边检验与左边检验统称为单边检验.下面来讨论单边检验的拒绝域. 设总体X ~N (μ,σ2),σ2为已知,x 1,x 2,…,x n 是来自X 的样本观察值.给定显著性水平α,我们先求检验问题H 0:μ=μ0;H 1:μ>μ0.的拒绝域.取检验统计量Z 0/X nσ,当H 0为真时,Z 不应太大,而在H 1为真时,由于X 是μ的无偏估计,当μ偏大时,X 也偏大,从而Z 往往偏大,因此拒绝域的形式为Z 0/X nσ≥k ,k 待定.因为当H 00/X nσ~N (0,1),由P {拒绝H 0|H 0为真}=P 0/X k n σ⎫≥⎨⎬⎩⎭=α得k =z α,故拒绝域为Z 0/X nσ≥z α. (8.8)类似地,左边检验问题H 0:μ=μ0;H 1:μ<μ0.的拒绝域为Z 0/X nσ≤-z α. 8.9)例8.4 从甲地发送一个信号到乙地,设发送的信号值为μ,由于信号传送时有噪声迭加到信号上,这个噪声是随机的,它服从正态分布N (0,22),从而乙地接到的信号值是一个服从正态分布N (μ,22)的随机变量.设甲地发送某信号5次,乙地收到的信号值为: 8.4 10.5 9.1 9.6 9.9由以往经验,信号值为8,于是乙方猜测甲地发送的信号值为8,能否接受这种猜测?取α=0.05.解 按题意需检验假设H 0:μ=8;H 1:μ>8.这是右边检验问题,其拒绝域如(8.8)式所示, 即 Z = 0/X nσ≥z 0.05=1.645.而现在z 02/5=1.68>1.645,所以拒绝H 0,认为发出的信号值μ>8.2.单个正态总体方差的假设检验(2χ检验法(2χ-test)) (1) 双边检验设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2=σ02;H 1:σ2≠σ02.其中σ02为已知常数.由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值22S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时2χ=22(1)n S σ-~2χ(n -1). (8.10)所以对于给定的显著性水平α有(图8-3)图8-3P {21/2αχ-(n -1)≤2χ≤2/2αχ(n -1)}=1-α. (8.11)对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2/2αχ(n -1).由(8.11)知,H 0的接受域是21/2αχ- (n -1)≤2χ≤2/2αχ (n -1); (8.12) H 0的拒绝域为2χ<21/2αχ-(n -1)或2χ>2/2αχ(n -1). (8.13)这种用服从2χ分布的统计量对个单正态总体方差进行假设检验的方法,称为2χ检验法. 例8.5 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?解 本题要求在α=0.02下检验假设H 0:σ2=5000;H 1:σ2≠5000.现在n =26,2/2αχ(n -1)=20.01(25)χ=44.314,21/2αχ- (n -1)= 20.99(25)χ=11.524,σ02=5000.由(8.13)拒绝域为22(1)n s σ->44.314或22(1)n s σ-<11.524由观察值s 2=9200得220(1)n s σ-=46>44.314,所以拒绝H 0,认为这批电池寿命的波动性较以往有显著的变化.(2) 单边检验(右检验或左检验) 设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2≤σ02;H 1:σ2>σ02.(右检验)由于X ~N (μ,σ2),故随机变量*2χ=22(1)n S σ-~2χ(n -1).当H 0为真时,统计量2χ=220(1)n S σ-≤*2χ.对于显著性水平α,有P {*2χ>2αχ(n -1)}=α图8-4(图8-4).于是有P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α.可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:2χ=220(1)n S σ->2αχ(n -1)(右检验). (8.14)类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ02的拒绝域为2χ<21αχ-(n -1)(左检验). (8.15)例8.6 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02. (2) 选取统计量2χ=22(1)n S σ-.*2χ=22(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ(3) 对于显著性水平α=0.05,查2χ分布表得21αχ-(n -1)=20.95(24)χ=13.848,当H 0为真时,P {2χ<21αχ- (n -1)}≤P 2212(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭=α. 故拒绝域为2χ<21αχ- (n -1)=13.848.(4) 根据样本观察值计算2χ的观察值2χ=220(1)240.000660.0012n s σ-⨯==13.2.(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后生产的零件直径的方差小于革新前生产的零件直径的方差.最后我们指出,以上讨论的是在均值未知的情况下,对方差的假设检验,这种情况在实际问题中较多.至于均值已知的情况下,对方差的假设检验,其方法类似,只是所选的统计量为2χ=212()ni i X μσ=-∑.当σ2=σ02为真时,2χ~2χ(n ).关于单个正态总体的假设检验可列表8-2.表8-2检验参数条件H0H1H0的拒绝域检验用的统计量自由度分位点数学期望σ2已知μ=μ0μ≤μ0μ≥μ0μ≠μ0μ>μ0μ<μ0|Z|>zα/2Z>zαZ<-zαZ=0/Xnμσ-±zα/2zα-zασ2未知μ=μ0μ≤μ0μ≥μ0μ≠μ0μ>μ0μ<μ0|t|>tα/2t>tαt<-tαt=0/XS nμ-n-1 ±tα/2tα-tα方差μ未知σ2=σ02σ2≤σ02σ2≥σ02σ2≠σ02σ2>σ02σ2<σ022χ>2/2αχ2χ<21/2αχ-2χ>2αχ2χ<21αχ-2χ=22(1)n Sσ-n-1 /21/2ααχχ-⎧⎪⎨⎪⎩222αχ21αχ-μ已知σ2=σ02σ2≤σ02σ2≥σ02σ2≠σ02σ2>σ02σ2<σ022χ>2/2αχ2χ<21αχ-2χ>2αχ2χ<21αχ-2χ=212()niiXμσ=-∑n/21/2ααχχ-⎧⎪⎨⎪⎩222αχ21αχ-注:上表中H0中的不等号改成等号,所得的拒绝域不变.。
单个正态总体参数的假设检验1.提出假设:首先,我们需要提出关于总体参数的假设。
在单个正态总体参数的情况下,我们通常对总体的均值(μ)或标准差(σ)进行假设。
2.确定显著性水平:显著性水平(α)是一个事先设定的临界值。
根据显著性水平,我们可以决定接受还是拒绝原假设。
3.构建统计量:接下来,我们需要构建一个适当的统计量来判断总体参数的假设。
在单个正态总体参数的情况下,通常使用t统计量或z统计量。
4.计算统计量的值:根据样本数据,计算所选统计量的值。
如果使用t统计量,则需要计算样本均值和标准差;如果使用z统计量,则只需计算样本均值。
5.确定拒绝域:拒绝域是根据显著性水平和统计量的分布确定的。
根据统计量的值和拒绝域的临界值,我们可以决定是否拒绝原假设。
6.做出决策:根据统计量的值和拒绝域,我们可以做出决策:接受原假设或拒绝原假设。
下面以一个具体的例子来说明单个正态总体参数的假设检验。
假设我们要检验一些公司员工的平均工资是否等于5000元。
我们从公司中随机抽取了50个员工的工资数据,假设工资数据服从正态分布。
现在我们要进行假设检验。
1.假设提出:原假设(H0):员工的平均工资等于5000元;备择假设(H1):员工的平均工资不等于5000元。
2.显著性水平:我们设定显著性水平为0.053.构建统计量:由于样本量较大(n=50),我们可以使用z统计量。
z统计量的计算方法为(样本均值-总体均值)/(总体标准差/根号n)。
4.计算统计量的值:假设我们计算出样本均值为4950元,总体标准差为100元。
5.确定拒绝域:由于显著性水平为0.05,我们需要找出z值对应的临界值。
在标准正态分布表中查找z=1.96对应的值,并根据原假设的双侧检验找出拒绝域的范围。
6.做出决策:根据统计量的值和拒绝域的范围,我们可以判断是否拒绝原假设。
如果统计量的值落在拒绝域之外,我们将拒绝原假设,即认为员工的平均工资不等于5000元。
单个正态总体参数的假设检验一、假设检验的基本概念假设检验是统计推断的一种方法,其基本思想是通过抽样来对总体参数进行推断,并判断总体参数是否满足其中一种假设。
在进行假设检验时,我们首先提出一个原假设(H0),这是一个既定的假设,表示总体参数满足其中一种特定的值或不满足其中一种特定的关系。
同时,我们还提出一个备择假设(H1),表示总体参数不满足原假设。
通过对样本数据的统计推断,我们可以对原假设进行拒绝或不拒绝的判断。
二、假设检验的步骤假设检验一般包括以下步骤:1.提出假设:根据问题的需求和背景条件,提出原假设和备择假设。
2.确定显著性水平:显著性水平(α)是指当原假设成立时,我们愿意犯第一类错误的概率。
一般情况下,我们常使用0.05作为显著性水平。
3.选择检验统计量:根据所需检验的问题,选择适当的检验统计量。
在单个正态总体参数的假设检验中,常用的检验统计量有Z检验和t检验。
4.计算检验统计量的观察值:根据样本数据计算出检验统计量的观察值。
5.根据显著性水平查找拒绝域:根据显著性水平和检验统计量的分布,查找拒绝域的临界值。
6.判断并作出结论:如果检验统计量的观察值落在拒绝域内,则拒绝原假设,否则不拒绝原假设。
三、应用领域1.药物临床试验:在新药物的临床试验中,可以通过对患者进行抽样,检验患者服用药物前后的药效差异是否显著,以判断药物的疗效。
2.市场调研:在市场调研中,可以通过对一定数量的顾客进行问卷调查,检验顾客对其中一种产品的满意度是否显著不同,以了解产品在市场中的竞争力。
3.品质控制:在生产过程中,可以通过抽样检验产品的质量是否符合设定的标准。
例如,食品加工厂可以通过抽样检验产品的营养成分是否达到设定的要求。
4.经济学研究:在经济学研究中,可以通过对一定数量的经济指标进行抽样,检验指标的差异是否显著,以判断宏观经济政策的有效性。
总结:单个正态总体参数的假设检验是统计学中一种重要的方法,通过对样本数据的统计推断,判断总体参数是否满足其中一种假设。
正态下单个总体的假设检验例题假设有一个总体,其数据符合正态分布。
现在我们想要检验这个总体的均值是否等于某个特定值。
假设总体的均值为μ,我们要检验的假设为:H0: μ = μ0 (均值等于μ0)Ha: μ≠μ0 (均值不等于μ0)我们可以使用 t 检验来检验这个假设。
t 检验的步骤如下:1. 收集样本数据,并计算样本均值 X 和样本标准差 S。
2. 计算 t 统计量:t = (X - μ0) / (S / √n)其中,n 是样本容量。
3. 根据自由度(df = n-1)和显著性水平,查找 t 分布表得到临界值 t*。
4. 判断 t 统计量是否在临界值范围内。
如果 t 统计量小于 t*(或大于-t*),则接受 H0 假设,表示数据支持总体均值等于μ0。
如果 t 统计量大于 t*(或小于-t*),则拒绝 H0 假设,表示数据不支持总体均值等于μ0。
例如,我们想要检验一个总体样本的均值是否等于60。
我们从这个总体中随机抽取了10个样本,得到样本均值为65,样本标准差为5。
我们假设显著性水平为0.05。
步骤如下:1. 收集样本数据,并计算样本均值 X 和样本标准差 S。
X = 65, S = 52. 计算 t 统计量:t = (X - μ0) / (S / √n)t = (65 - 60) / (5 / √10) = 4.473. 查找 t 分布表得到临界值 t*。
df = n-1 = 10-1 = 9,根据显著性水平0.05和自由度9,在t 分布表中查找得到:t* = ±2.2624. 判断 t 统计量是否在临界值范围内。
t = 4.47 > 2.262,因此拒绝 H0 假设,表示数据不支持总体均值等于60。
因此,我们可以得出结论,总体均值不等于60。
用Excel实现单个正态总体均值的假设检验刘忠广【摘要】单个正态总体均值的检验是假设检验中最基础的内容.通过证明两个总体均值之差假设检验的特殊情形和单个正态总体均值检验的一致性,提供了用Excel 进行单个正态总体均值的检验的一种便捷方法.【期刊名称】《河南工程学院学报(自然科学版)》【年(卷),期】2013(025)003【总页数】4页(P77-80)【关键词】正态总体;假设检验;t统计量【作者】刘忠广【作者单位】河南工程学院工商管理学院,河南郑州451191【正文语种】中文【中图分类】O212.1单个正态总体均值的假设检验可以用SPSS等专业统计软件来实现,但这些专业统计软件的普及性不够.Excel软件具有极强的普及性并且易于操作,其所带的数据分析工具能满足大多数数据处理的要求,但在进行假设检验时,Excel的数据分析工具只提供了两个总体参数检验的方法,而没有专门的对单个总体均值进行检验的现成工具,所以很有必要探讨用Excel进行单个正态总体均值检验的便捷方法.1 单个正态总体均值检验的传统方法对于总体均值的检验按照以下步骤来进行:(1)提出假设;(2)构造检验统计量并计算统计量的值;(3)根据给定的显著水平确定临界值和拒绝域;(4)将统计量的值与临界值进行比较,做出决策.下面以实例来说明.例某医生调查了20个难产婴儿的出生体重,数据如下(单位为kg):3.88,3.31,3.34,3.82,3.30,3.16,3.84,3.10,3.90,3.18,3.05,3.22,3.28,3.34,3.62,3.28,3.30,3.22,3.54,3.30.已知一般婴儿的平均出生体重为3.25 kg,能否认为难产婴儿的出生体重显著大于一般婴儿(给定显著水平α=0.05).解 (1)提出假设:H0∶μ=3.25,H1∶μ>3.25.(2)构造检验统计量并计算统计量的值.由于总体的方差未知,用样本的方差来代替,且是小样本(n=20),故用t检验,检验统计量为根据例中数据可得(3)根据α=0.05,查自由度为19的t分布表得临界值为1.729.(4)将统计量的值与临界值进行比较,统计量t=2.476>1.729,故拒绝原假设,认为难产婴儿的出生体重显著大于一般婴儿.检验结果见图1.图1 检验结果Fig.1 Result of the test2 利用Excel的函数工具进行检验(1)构造工作表[1]. 在单元格A1输入“难产婴儿出生体重”,在A2~A21输入上例中的数据,在B2和C2分别输入“总体均值的假设值”和“3.25”;在B3和C3分别输入“置信水平”和“0.95”;在B6,B7和B8分别输入“检验统计量t”,“t临界值(右侧检验)”和“p值”,如图1所示. C6,C7和C8的数值由下面的函数工具计算.(2)计算检验统计量.在C6单元格输入公式:“=(average(A2∶A21)-C2)/stdev(A2∶A21)/sqrt(count(A2∶A21))”.(3)计算临界值tα,在C7单元格输入公式“=tinv((1-C4),count(A2∶A21)-1)”.(4)计算p值,在C8单元格输入公式“=tdist(C6,count(A2∶A21)-1,1)”.(5)根据以上的计算结果,p值(0.011 426)< 0.05(或统计量t=2.476>1.729 1),故拒绝原假设,认为难产婴儿的出生体重显著大于一般婴儿.3 证明两个总体均值之差检验的特殊情形和单个正态总体均值检验的一致性3.1 两个总体均值之差检验的检验统计量和自由度的确定在两个总体的方差未知且不相等以及样本容量较小的情况下,两个样本均值之差经标准化后服从自由度为v的t分布[2],即其中,的确定方法是Welch[3]在1938年提出的.所以,两个总体均值之差检验的t检验统计量计算公式为自由度为v.在对两个总体均值之差检验时,原假设和备择假设分别有如下几种情况:(1)H0∶μ1-μ2=0,H1∶μ1-μ2≠0;(2)H0∶μ1-μ2≥0,H1∶μ1-μ2<0;(3)H0∶μ1-μ2≤0,H1∶μ1-μ2>0.使用的检验统计量为(1)自由度为(2)3.2 两个总体均值之差检验特殊情形下的检验统计量和自由度的确定现在考虑一种特殊的情形,假设总体2的各个值均为μ0,那么从总体2中抽取的若干个体组成的样本2的各个值也均为μ0,则样本2的均值和方差分别为(3)(4)将式(3)和式(4)代入式(1)和式(2),则检验统计量为(5)自由度为(6)3.3 单个总体均值检验时的检验统计量和自由度的确定在仅对总体1的均值进行检验时,原假设和备择假设分别为(1)H0∶μ1=μ0,H1∶μ1≠μ0;(2)H0∶μ1≥μ0,H1∶μ1<μ0;(3)H0∶μ1≤μ0,H1∶μ1>μ0.使用的检验统计量为和(5)式相同.自由度为n1-1,和(6)式相同.图2 Excel数据Fig.2 Excel data故上述内容证明了单个正态总体均值的检验和对两个总体均值之差检验的特殊情形(其中一个总体的各个体的值均相等)是一致的,所以对单个总体均值的检验可以利用Excel中的数据分析来实现.4 实例操作打开Excel,在单元格A1输入“难产婴儿出生体重”,将上例中的20个数据输入到工作表的A2~A21;在单元格B1输入“一般婴儿出生体重”,B2单元格输入3.25,再将3.25复制粘贴几次即可(最少要有2个数据,因为只有一个数据时无法计算方差,本例为2个数据),如图2所示,然后按如下步骤操作:(1)选择【工具】下拉菜单;(2)选择【数据分析】选项;(3)在分析工具中选择【t 检验,双样本异方差检验】;(4)当出现对话模型时,在【变量1的区域】方框内输入数据区域A1∶A15,在【变量2的区域】方框内输入数据区域B1∶B3,在【假设的平均差】方框内输入0,在【标志】前的方框内打上“√”,在【ɑ】方框内输入0.05,在【输出选项】中选择输出区域(本例中选择“新工作表”),如图3所示.然后选择【确定】,输出结果如图4所示.根据图4中的结果可知,p值单尾(0.011 426)<0.05(或检验统计量t=2.476>单尾临界值1.729 1),故拒绝原假设,认为难产婴儿的出生体重显著大于一般婴儿. 图3 Excel工作表Fig.3 Excel work chart图4 Excel输出Fig.4 Excel output【相关文献】[1] 袁加军,朱建平.统计基础实验[M].厦门:厦门大学出版社,2010:103.[2] 贾俊平,何晓群,金勇进.统计学[M].5版.北京:中国人民大学出版社,2012:171.[3] 庄楚强,何春雄.应用数理统计基础[M].3版.广州:华南理工大学出版社,2006:107.。