两个正态总体的假设检验
- 格式:ppt
- 大小:464.00 KB
- 文档页数:13
两个正态总体方差的假设检验1. 引言嘿,大家好!今天我们来聊聊一个在统计学中非常重要,但听起来可能有点儿复杂的话题——两个正态总体方差的假设检验。
别担心,我们会用通俗易懂的方式,把这个问题掰开了揉碎了讲清楚。
你可能会问,“这跟我有什么关系呢?”其实,这些统计方法不仅仅是数学家的专属,很多实际问题都可以通过这些方法得到解决。
好比你买衣服时,会比较不同品牌的裤子,看哪个更适合你,其实也是在做“检验”。
所以,搞懂这个概念,绝对会让你在数据分析的世界里如鱼得水。
我们从最基本的概念开始聊起,循序渐进,一步一步深入。
2. 正态总体和方差2.1 正态总体是什么?首先,让我们搞清楚什么是“正态总体”。
简单来说,正态总体就是数据分布呈现钟形曲线的情况。
在生活中,很多自然现象都符合这种分布,比如人的身高、体重、考试分数等等。
正态分布的特点就是数据集中在中间,向两边渐渐减少,就像一个标准的山峰。
想象一下你在玩飞盘,飞盘从空中下落时的轨迹,就是一个典型的钟形曲线。
2.2 方差的作用接下来,我们来谈谈方差。
方差是用来衡量数据的离散程度的,换句话说,就是数据离中间值的远近程度。
方差大的话,数据就会分布得比较散,方差小的话,数据就比较集中。
好比你家里那只爱乱跑的猫,方差大,它就到处跑;而如果它安安静静地待在一个角落,那就是方差小了。
3. 假设检验的基本概念3.1 什么是假设检验?好,接下来进入正题:假设检验。
假设检验就像是在做一个“真心话大冒险”,我们要通过数据来验证某个“假设”是否成立。
比如你和朋友讨论哪家餐馆的菜最好,你们就会提出一个假设,然后用实际的体验来检验这个假设。
统计学中的假设检验也是类似的,只不过我们用的是数字和公式来做这个验证。
3.2 两个正态总体方差的假设检验现在,我们要做的是两个正态总体方差的假设检验。
这就像是比较两个篮球队的实力,看看哪个队更强。
假设我们有两个正态分布的数据集,我们的任务就是判断这两个数据集的方差是否相同。
第58讲:两个正态总体参数的假设检验(比较两个正态总体均值的检验)例1:通常认为男女的脉搏率是没有显著差异的. 现在随机地抽取年龄都是25岁的16位男子和13位女子, 测得他们的脉搏率如下:男: 61, 73, 58, 64, 70, 64, 72, 60, 65, 80, 55,72, 56, 56, 74, 65,女: 83, 58, 70, 56, 76, 64, 80, 68, 78, 108,76, 70, 97.问题:假设男女脉搏率都是服从正态分布, 这些数据能否认为男女脉搏率的均值相同?()()12221212122221,,,,,,,,,,,n n X X X N Y Y Y N X Y S S μσμσ∙∙∙ 12假设:是来自的样本是来自的样本,两样本相互独立.并记,分别为两样本的均值和方差.()012112.:,:,H H μμμαμ=≠检验假设显著水平22121.σσ当和已知时2212012,.~(0X Y X Y C H X Y N n n σσ∙--≥∙-+ 检验统计量拒绝域形式 当成立时,,).221212σσ-=+X YZ n n 记: 2α≥--Z z z 则检验拒绝域为:检验{}00002212122(1(),.σσ-=≥=-Φ-=+H P P Z z z x yz n n 其中:222122.σσσ当==但未知时2σ首先利用合样本给出参数的无偏估计量()()22112221211 .2wn S n SS n n -+-=+-1211-=+w X Y T S n n 可取检验统计量为:()21212211wX Y T t n n S n n α-=≥+-+检验拒绝域为:{}{}00120012||||2(2)||11--=≥=+-≥-=+H w P P T t P t n n t x yt P s n n 其中为::值——两样本精确t检验22123.σσ≠当且未知时221212.-=+X Y T S S n n 取检验统计量为:22221212.S S σσ以样本方差分,别代替,{}{}000||||2||,--=≥=≥H P P T t P Z P t 值为:(1)当两个样本量都很大时,利用中心极限定理{}/2||α≥T z 检验的拒绝域为:0221212~(01).-=+x y Z N t s sn n 其中: ,,12min(1,1),=--k n n (2)当两个样本为小样本时都很大时,统计量近似服从t 分布,自由度为22211222222112212(//)(/)(/)11+=+--S n S n k S n S n n n 或更精确的近似自由度{}/2||()α≥T t k 检验的拒绝域为: {}{}000||||2()||.--=≥=≥H P P T t P t k t P 值为: t ——两样本近似检验22112212221201,~(,),~(,),16,13,65.31,75.69,56.36,211.40,.X Y X N Y N n n x y s s H H μσμσμμμμ=======≠1212检验假设在例1中设分别表示男女的脉搏率,由已知数据计得:,::算221256.36,211.40,s s t ==注意到相差很大,采用不等方差的检验法,结论:拒绝原假设,认为男女脉搏率的均值不相同。
第八章假设检验第二节正态总体均值的假设检验2. 两个正态总体在寿命问题中提出了两个正态总体均值是否相等的假设012:H μμ=112:H μμ≠这种情形经常发生在当研究对象的外界条件发生了改变时,判断研究对象是否受到了这种影响.检验统计量如何构造呢?例3对用两种不同热处理方法加工的金属材料做抗拉强度试验,得到的试验数据如下:方法Ⅰ:31,34,29,26,32,35,38,34,30,29,32,31方法Ⅱ:26,24,28,29,30,29,32,26,31,29,32,28设两种热处理加工的金属材料的抗拉强度都服从正态分布,且方差相等.比较两种方法所得金属材料的平均抗拉强度有无显著差异().05.0=α).,(),,(2221σμσμN N 解:记两总体的正态分布为.:,:211210μμμμ≠=H H 本题是要检验假设关键问题在于找到拒绝域12k μμ->X Y k->121212()()~(2),11w X Y t n n S n n μμ---+-+222112212(1)(1)2w n S n S S n n -+-=+-其中12221212()()~(0,1)X Y N n n μμσσ---+).,(),,(2221σμσμN N 解:记两总体的正态分布为.:,:211210μμμμ≠=H H 本题是要检验假设1212~(2)11w X Y T t n n S n n -=+-+检验统计量为21212||(2)11w x y t t n n S n n α-=≥+-+拒绝域为,1221==n n ,75.31=x .67.28=y ,25.112)1(211=-s n ,64.66)1(222=-s n .85.2=w s .647.26185.2|67.2875.31|11||||21=-=+-=n n s y x t w 计算统计值074.2)22()2(025.0212==-+t n n t α查t 分布表,得/212||(2)t t n n α>+-统计判决:由于故拒绝H 0.即认为两种热处理方法加工的金属材料的平均抗拉强度有显著差异.解:休息一下吧。
两个正态总体参数的假设检验推导一、引言假设检验是统计学中常用的方法,用于检验两个正态总体参数是否具有显著差异。
本文将介绍两个正态总体参数的假设检验的推导过程,主要包括以下步骤:假设提出、样本收集、样本检验、推断结论、结果解释和误差分析。
二、假设提出假设检验的基本思想是通过样本数据对总体参数进行推断。
在这个过程中,首先需要提出假设,即对两个正态总体参数的关系做出假设。
通常,假设检验中包含两个假设:零假设(H0)和备择假设(H1)。
零假设通常表示两个总体参数无显著差异,备择假设则是与零假设相对的假设。
例如,我们可以在零假设中设定两个总体均数相等,备择假设则是均数不等。
三、样本收集在提出假设后,需要收集样本数据以进行检验。
样本收集应遵循随机抽样的原则,以确保样本的代表性。
在收集样本时,还需要注意样本量的大小,以保证推断结论的准确性。
四、样本检验样本检验是假设检验的核心步骤,包括计算样本统计量、确定临界值和做出推断结论等步骤。
样本统计量是根据样本数据计算出的量,用于推断总体参数。
临界值是用于判断样本统计量是否达到显著差异的标准。
在做出推断结论时,需要根据样本统计量和临界值进行比较,以确定零假设是否被拒绝。
五、推断结论根据样本检验的结果,可以做出推断结论。
如果样本统计量超过了临界值,则可以拒绝零假设,接受备择假设;否则,不能拒绝零假设。
推断结论是假设检验的关键步骤之一,要求谨慎和客观地做出判断。
六、结果解释推断结论做出后,需要对结果进行解释。
解释结果时需要关注以下几点:一是理解推断结论的含义,二是明确结果对于实践的意义,三是注意结果的局限性,即样本量和误差范围等因素对结果的影响。
结果解释要求清晰明了地传达结果的含义和应用范围。
七、误差分析误差分析是假设检验中不可或缺的一环。
误差分为两类:一类是随机误差,由随机抽样造成;另一类是系统误差,由样本设计和处理等环节造成。
误差分析的目的是评估结果的可靠性和精确性,从而确定结果在实际应用中的可信度。
§7.3 双正态总体参数的假设检验设样本1,,1n X X 取自正态总体211(,)N μσ,样本2,,1n Y Y 取自总体222(,)N μσ,两样本相互独立,它们的样本均值分别为∑==1111n i iX n X ,∑==2121n j jYn Y ,样本方差分别为∑=--=112121)(11n i i X X n S ,∑=--=212222)(11n j j Y Y n S 。
一、 关于两个正态总体方差比的假设检验以双侧检验:2221122210::σσσσ≠↔=H H 为例 选用检验统计量2221S S F =,它在原假设0H 成立的条件下服从F 分布)1,1(21--n n F ;记2221s s f O =表示检验统计量F 的样本观测值,则检验的P 值为⎪⎩⎪⎨⎧<=≥≥=≥=1),/1/1(21),(222212221O O O O f f F P f f F P P 如果如果σσσσ这种检验方法通常称为“F 检验”。
例7.3.1 甲乙两台车床分别加工某种轴,轴的直径分别服从正态分布),(211σμN ,),(2σμN ,从各自加工的轴中分别抽取若干根,测得其直径如下表所示:试问在显著性水平05.0=α下,两台车床加工的精度是否有显著差异?解:(1)依题意,考虑假设检验问题2221122210::σσσσ≠↔=H H (2)用F 检验,检验统计量为)6,7(~02221F S S F H =或)7,6(~/102122F S S F H =;(3)由样本观测值可得2164.021=s ,2729.022=s ,检验统计量的值为793.0/2221==s s f O 。
故检验的P 值为76.038.02)793.0/1/1(22221=⨯==≥=σσF P P 。
(4) 因为05.0>P ,所以不拒绝原假设0H ,即没有充分理由认为两种机床所加工轴的精度有显著差异。
2012年9月第25期科技视界SCIENCE &TECHNOLOGY VISION 科技视界※基金项目:浙江省教育厅科研计划一般项目(Y201119868)。
0引言设ξ,η是两个相互独立的随机变量,ξ~N (μ1,σ12),η~N(μ2,σ22),ξ1,ξ2,…,ξn 和η1,η2,…,ηn 分别是来自总体ξ和η的样本,它们的样本均值和方差分别记为ξ軃,S 12和η軍,S 22。
ξ軃=1n 1n i =1Σξi ,S 12=1n 1-1n i =1Σ(ξi -ξ軃)2,η軍=1n 2n i =1Σξi ,S 22=1n 2-1n i =1Σ(ηi-η軍)2。
考虑总体方差σ12与σ22未知但相等的情况,当原假设H 0:μ1=μ2成立时,采用的统计量[1]是T =ξ軃-η軍S w1n 1+1n 2姨(1),其中S w 2=(n 1-1)S 12+(n 2-1)S 22n 1+n 2-2,该统计量服从自由度为n -2的t 分布,其中n =n 1+n 2。
本文通过引进虚拟变量(dummy variable)[2],建立回归模型,给出两个正态总体的期望的假设检验的另种方法。
该回归的方法不仅能检验两个总体的期望是否相同,而且能估计期望之差及期望之差的置信区间。
1回归模型的建立定义虚拟变量d i =0,样本点来自总体η1,样本点来自总体,ξ,i =1,2,…,n 1+n 2。
n 1+n 2维列向量y =(ξ1,ξ2,…,ξn ,η1,η2,…,ηn )′,对应的n 1+n 2维列向量d =(0,0,…,0,1,1,…,1)′。
建立回归模型y =β0+β1d +ε,假设该模型满足经典的假定条件[2],其中E (ε|d )=0,E(ε′ε|d )=σ2I n 。
则有E (y |d =1)=β0+β1,E (y |d =0)=β0,β1=E (y |d =1)-E (y |d =0)表示两个总体ξ和η的期望的差。