两个正态总体均值差和方差的假设检验2
- 格式:ppt
- 大小:558.51 KB
- 文档页数:31
两个正态总体方差的假设检验1. 引言嘿,大家好!今天我们来聊聊一个在统计学中非常重要,但听起来可能有点儿复杂的话题——两个正态总体方差的假设检验。
别担心,我们会用通俗易懂的方式,把这个问题掰开了揉碎了讲清楚。
你可能会问,“这跟我有什么关系呢?”其实,这些统计方法不仅仅是数学家的专属,很多实际问题都可以通过这些方法得到解决。
好比你买衣服时,会比较不同品牌的裤子,看哪个更适合你,其实也是在做“检验”。
所以,搞懂这个概念,绝对会让你在数据分析的世界里如鱼得水。
我们从最基本的概念开始聊起,循序渐进,一步一步深入。
2. 正态总体和方差2.1 正态总体是什么?首先,让我们搞清楚什么是“正态总体”。
简单来说,正态总体就是数据分布呈现钟形曲线的情况。
在生活中,很多自然现象都符合这种分布,比如人的身高、体重、考试分数等等。
正态分布的特点就是数据集中在中间,向两边渐渐减少,就像一个标准的山峰。
想象一下你在玩飞盘,飞盘从空中下落时的轨迹,就是一个典型的钟形曲线。
2.2 方差的作用接下来,我们来谈谈方差。
方差是用来衡量数据的离散程度的,换句话说,就是数据离中间值的远近程度。
方差大的话,数据就会分布得比较散,方差小的话,数据就比较集中。
好比你家里那只爱乱跑的猫,方差大,它就到处跑;而如果它安安静静地待在一个角落,那就是方差小了。
3. 假设检验的基本概念3.1 什么是假设检验?好,接下来进入正题:假设检验。
假设检验就像是在做一个“真心话大冒险”,我们要通过数据来验证某个“假设”是否成立。
比如你和朋友讨论哪家餐馆的菜最好,你们就会提出一个假设,然后用实际的体验来检验这个假设。
统计学中的假设检验也是类似的,只不过我们用的是数字和公式来做这个验证。
3.2 两个正态总体方差的假设检验现在,我们要做的是两个正态总体方差的假设检验。
这就像是比较两个篮球队的实力,看看哪个队更强。
假设我们有两个正态分布的数据集,我们的任务就是判断这两个数据集的方差是否相同。
数理统计习题答案习题5.1解答1. 设总体服从()λP 分布,试写出样本n X X X ,,,21 的联合分布律. 解:()的分布律为:即X P X ,~λ ()!k e k X P k λλ-==, ,,,2,1,0n k =n X X X ,,,21 的联合分布律为:()n n x X x X x X P ===,,,2211 = ()()()n n x X P x X P x X P === 2211=nx x x x e x e x e nλλλλλλ---⋅2121=λλn n xx x e x x x n-+++!!!2121, n i n x i ,,2,1,,,2,1,0 ==2. 设总体X 服从()1,0N 分布,试写出样本n X X X ,,,21 的联合分布密度. 解:()1,0~N X ,即X 分布密度为:()2221x e x p -=π,+∞<<-∞xn X X X ,,,21 的联合分布密度为: ()∏==ni i n x p x x x p 121*)(,...,=22222221212121n x x x eee--⋅-πππ=()}21exp{2122∑=--n i ix n π n i x i ,,2,1, =+∞<<-∞.3. 设总体X 服从()2,σμN 分布,试写出样本n X X X ,,,21 的联合分布密度. 解:()2,~σμN X ,即X 分布密度为:()x p =()}2exp{2122σμσπ--x ,∞<<-∞xn X X X ,,,21 的联合分布密度为:()()∏==ni inx p x x x p 121*,...,=)})(21exp{21122∑--⋅⋅=-ni i n n x μσσπ, n i x i ,,2,1, =+∞<<-∞.4. 根据样本观测值的频率分布直方图可以对总体作什么估计与推断? 解:频率分布直方图反映了样本观测值落在各个区间长度相同的区间的频率大小,可以估计X 取值的位置与集中程度,由于每个小区间的面积就是频率,所以可以估计或推断X 的分布密度. 5. 略. 6. 略.习题5.2解答1. 观测5头基础母羊的体重(单位:kg)分别为53.2,51.3,54.5,47.8,50.9,试计算这个样本观测值的数字特征:(1)样本总和,(2)样本均值,(3)离均差平方和,(4)样本方差,(5)样本标准差,(6)样本修正方差,(7)样本修正标准差,(8)样本变异系数,(9)众数,(10)中位数,(11)极差,(12)75%分位数.解:设9.50,8.47,5.54,3.51,2.5354321=====x x x x x()7.257151=∑=i ix,()54.51251==∑=i ixx(3) ss =()2512512x n xx xi ii i-=-∑∑===13307.84-5×51.542=25.982(4)2s =()∑=-51251i i x x =51ss =5.1964, (5)s =2.28; (6)s s * =ss n 11-=6.4955 (7)*s =2.5486; (8)cv =100⨯*xs =4.945;(9)每个数都是一个,故没有众数. (10)中位数为3x =51.3; (11)极差为54.5-47.8=6.7;(12)0.75分位数为53.2.2. 观测100支金冠苹果枝条的生长量(单位:cm)得到频数表如下:组下限 19.5 24.5 29.5 34.5 39.5 44.5 49.5 54.5 59.5 组上限 24.5 29.5 34.5 39.5 44.5 49.5 54.5 59.5 64.5 组中值 22 27 32 37 42 47 52 57 62频数 8 11 13 18 18 15 10 4 3试计算这个样本观测值的数字特征:(1)样本总和,(2)样本均值,(3)离均差平方和,(4)样本方差,(5)样本标准差,(6)样本修正方差,(7)样本修正标准差,(8)样本变异系数,(9)众数,(10)中位数,(11)极差,(12)75%分位数.解:设组中值依次为921,,,x x x ,频数依次为921,,,n n n ,=+++=921n n n n 100,()=∑=911i ii x n 3950;()=+=∑=919112i ii xn n n x 39.5;()()=-=-=∑∑==29129123x n xn x x n ss i ii i i i 25.39100166300⨯-=10275;()==ss s 100142102.75; ()=s 510.137;()=-=*ss n s 1162103.788 ()=*s 710.188;()=⨯=*1008xs cv 25.79;()42379或众数是(),50210=n ;中位数为5.3924237=+;()11极差为:62-22=40;()4775.0,83,6812621521分位数为∴=+++=+++n n n n n n .3.略.4. 设n x x x ,,,21 是一组实数,a 和b 是任意非零实数,bax y i i -=(n i ,,1 =),x 、y 分别为i x 、i y 的均值,2xs =∑-iix xn2)(1,2ys =1n()y y i i-∑2,试证明:① b a x y -=;② 222b s s x y =. 解①:∑∑==-==ni i ni i b a x ny ny 1111= ()∑=-ni i a x bn11= ⎪⎪⎭⎫ ⎝⎛-∑=n i i na x nb 11= b a x -; ②2ys =1n∑-ii y y 2)(=∑=⎪⎪⎭⎫ ⎝⎛---ni i b a x b a x n121=∑=⎪⎪⎭⎫⎝⎛-ni i b x x n 121=221x s b .习题5.3解答1.求分位数(1)()8205.0x ,(2)()12295.0x 。
§7.3 双正态总体参数的假设检验设样本1,,1n X X 取自正态总体211(,)N μσ,样本2,,1n Y Y 取自总体222(,)N μσ,两样本相互独立,它们的样本均值分别为∑==1111n i iX n X ,∑==2121n j jYn Y ,样本方差分别为∑=--=112121)(11n i i X X n S ,∑=--=212222)(11n j j Y Y n S 。
一、 关于两个正态总体方差比的假设检验以双侧检验:2221122210::σσσσ≠↔=H H 为例 选用检验统计量2221S S F =,它在原假设0H 成立的条件下服从F 分布)1,1(21--n n F ;记2221s s f O =表示检验统计量F 的样本观测值,则检验的P 值为⎪⎩⎪⎨⎧<=≥≥=≥=1),/1/1(21),(222212221O O O O f f F P f f F P P 如果如果σσσσ这种检验方法通常称为“F 检验”。
例7.3.1 甲乙两台车床分别加工某种轴,轴的直径分别服从正态分布),(211σμN ,),(2σμN ,从各自加工的轴中分别抽取若干根,测得其直径如下表所示:试问在显著性水平05.0=α下,两台车床加工的精度是否有显著差异?解:(1)依题意,考虑假设检验问题2221122210::σσσσ≠↔=H H (2)用F 检验,检验统计量为)6,7(~02221F S S F H =或)7,6(~/102122F S S F H =;(3)由样本观测值可得2164.021=s ,2729.022=s ,检验统计量的值为793.0/2221==s s f O 。
故检验的P 值为76.038.02)793.0/1/1(22221=⨯==≥=σσF P P 。
(4) 因为05.0>P ,所以不拒绝原假设0H ,即没有充分理由认为两种机床所加工轴的精度有显著差异。
两正态总体均值差的假设检验基于Wolfram Mathematica ,给出了两正态分布Ν[μ1,σ1]、Ν[μ2,σ2]总体均值差μ1-μ2在两总体方差已知、未知但相等、未知但样本量相等、未知但已知方差比、未知近似、未知精确的假设检验方法。
"一.两总体方差σ12=σ102、σ22=σ202已知,Z 检验"定理1:U =X 1--X 2--(μ1-μ2)σ12N[0,1],σ12=需要Needs ["HypothesisTesting`"]σ1=1;σ2=2;X1=伪随机变数RandomVariate [正态分布NormalDistribution [3,σ1],1000];X2=伪随机变数RandomVariate [正态分布NormalDistribution [2,σ2],1500];μ0=1.02;α=0.01;n1=长度Length [X1];n2=长度Length [X2];m =平均值Mean [X1]-平均值Mean [X2];σ=u =m -μ0σ;"1.双侧Z 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0"p =2 1-⋯CDF [正态分布NormalDistribution [0,1],绝对值Abs [u ]]ZTest {X1,X2}, σ12,σ22 ,μ0,"TestDataTable",备择假设AlternativeHypothesis →"不等Unequal" "2.右侧Z 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0"p =1-⋯CDF [正态分布NormalDistribution [0,1],u ]Z 检验ZTest {X1,X2}, σ12,σ22 ,μ0,"TestDataTable",备择假设AlternativeHypothesis →"大于Greater" "3.左侧Z 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0"p =⋯CDF [正态分布NormalDistribution [0,1],u ]Z 检验ZTest {X1,X2}, σ12,σ22 ,μ0,"TestDataTable",备择假设AlternativeHypothesis →"小于Less"1.双侧Z 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0.6402322.右侧Z 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0.3201163.左侧Z 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ00.679884"二.两总体方差σ12=σ22未知,T 检验"定理2:T =X 1--X 2--(μ1-μ2)S Wt n 1+n 2-2 ,S W =2 正态分布\\正态分布统计分析\\两正态分布均值差检验.nb需要Needs ["HypothesisTesting`"]σ1=σ2=2;X1=伪随机变数RandomVariate [正态分布NormalDistribution [3,σ1],1000];X2=伪随机变数RandomVariate [正态分布NormalDistribution [2,σ2],1500];μ0=1.05;α=0.01;n1=长度Length [X1];n2=长度Length [X2];m =平均值Mean [X1]-平均值Mean [X2];V1=方差Variance [X1];V2=方差Variance [X2];Sw =t =m -μ0Sw;"1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0"p =2 1-⋯CDF [学生t 分布StudentTDistribution [n1+n2-2],绝对值Abs [t ]]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"不等Unequal"]"2.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0"p =1-⋯CDF [学生t 分布StudentTDistribution [n1+n2-2],t ]T 检验TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"大于Greater"]"3.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0"p =⋯CDF [学生t 分布StudentTDistribution [n1+n2-2],t ]T 检验TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"小于Less"]1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ00.1818342.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ00.9090833.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ00.0909169正态分布\\正态分布统计分析\\两正态分布均值差检验.nb3"三.两总体方差σ12、σ22未知,但样本容量n1=n2=n,T检验"定理3:T=X-(μ1-μ2)S X n t n-1 ,X=X1-X2.4正态分布\\正态分布统计分析\\两正态分布均值差检验.nb需要Needs ["HypothesisTesting`"]n =1000;X1=伪随机变数RandomVariate [正态分布NormalDistribution [3,2],n ];X2=伪随机变数RandomVariate [正态分布NormalDistribution [2,1],n ];μ0=1.0;α=0.01;X =X1-X2;m =平均值Mean [X ];S =标准偏差StandardDeviation [X ];t =m -μ0Sn;"1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0"p =2 1-⋯CDF [学生t 分布StudentTDistribution [n -1],绝对值Abs [t ]]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"不等Unequal"]"2.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0"p =1-⋯CDF [学生t 分布StudentTDistribution [n -1],t ]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"大于Greater"]"3.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0"p =⋯CDF [学生t 分布StudentTDistribution [n -1],t ]T 检验TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"小于Less"]1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ00.3169872.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ00.8415063.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ00.158494"四.两总体方差σ12、σ22未知,但已知方差比σ12σ22=r,T 检验"正态分布\\正态分布统计分析\\两正态分布均值差检验.nb5定理4:X 1--X 2--(μ1-μ2)S X 1t n 1-1 ,X 1--X 2--(μ1-μ2)S X2t n 2-1 ,X 1--X 2--(μ1-μ2)t n 1+n 2-2 .需要Needs ["HypothesisTesting`"]X1=伪随机变数RandomVariate [正态分布NormalDistribution [3,2],1200];X2=伪随机变数RandomVariate [正态分布NormalDistribution [2,1],2500];μ0=1.1;α=0.01;r =4;n1=长度Length [X1];n2=长度Length [X2];m =平均值Mean [X1]-平均值Mean [X2];S1=标准偏差StandardDeviation [X1];S2=标准偏差StandardDeviation [X2];"(一) X 1--X 2--(μ1-μ2)S X1t (n 1-1)"Sw =S1t =m -μ0Sw;"1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0"p =2 1-⋯CDF [学生t 分布StudentTDistribution [n1-1],绝对值Abs [t ]]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"不等Unequal"]"2.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0"p =1-⋯CDF [学生t 分布StudentTDistribution [n1-1],t ]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"大于Greater"]"3.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0"p =⋯CDF [学生t 分布StudentTDistribution [n1-1],t ]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"小于Less"]"(二) X 1--X 2--(μ1-μ2)SX 2t (n 2-1)"Sw =S2t =m -μ0Sw;6 正态分布\\正态分布统计分析\\两正态分布均值差检验.nb"1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0"p =2 1-⋯CDF [学生t 分布StudentTDistribution [n2-1],绝对值Abs [t ]]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"不等Unequal"]"2.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0"p =1-⋯CDF [学生t 分布StudentTDistribution [n2-1],t ]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"大于Greater"]"3.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0"p =⋯CDF [学生t 分布StudentTDistribution [n2-1],t ]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"小于Less"]"(三X 1--X 2--(μ1-μ2)t (n 1+n 2-2)"Sw = 1n1+(n2-1)S12++(n2-1)S22;t =m -μ0Sw;"1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0"p =2 1-⋯CDF [学生t 分布StudentTDistribution [n2-1],绝对值Abs [t ]]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"不等Unequal"]"2.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0"p =1-⋯CDF [学生t 分布StudentTDistribution [n2-1],t ]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"大于Greater"]"3.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0"p =⋯CDF [学生t 分布StudentTDistribution [n2-1],t]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"小于Less"](一)X 1--X 2--(μ1-μ2)S X 1t (n 1-1)1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ00.05165612.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ00.974172正态分布\\正态分布统计分析\\两正态分布均值差检验.nb73.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ00.0258281(二)X 1--X 2--(μ1-μ2)S X 2t (n 2-1)1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ00.04846952.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ00.9757653.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0.0242347(三X 1--X 2--(μ1-μ2)t (n 1+n 2-2)1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ00.09177842.右侧T 检验H 0:μ1-μ2≤μ0,H1:μ1-μ2>μ00.9541113.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ00.0458892"五.两总体方差σ12、σ22未知,近似T检验"定理5:X --Y --(μ1-μ2)~t (n ),n =舍入Round++.8 正态分布\\正态分布统计分析\\两正态分布均值差检验.nb需要Needs ["HypothesisTesting`"]X1=伪随机变数RandomVariate [正态分布NormalDistribution [3,2],1800];X2=伪随机变数RandomVariate [正态分布NormalDistribution [2,1],1000];μ0=1.0;α=0.01;m =平均值Mean [X1]-平均值Mean [X2];V1=方差Variance [X1];V2=方差Variance [X2];n =舍入Round+2+;t =m -μ0"1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0"p =2 1-⋯CDF [学生t 分布StudentTDistribution [n ],绝对值Abs [t ]]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"不等Unequal"]"2.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0"p =1-⋯CDF [学生t 分布StudentTDistribution [n ],t ]T 检验TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"大于Greater"]"3.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0"p =⋯CDF [学生t 分布StudentTDistribution [n ],t ]T 检验TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"小于Less"]1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ00.6178232.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ00.6910893.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ00.308911"六.两总体方差σ12、σ22未知,T 检验(n 1<n 2)"正态分布\\正态分布统计分析\\两正态分布均值差检验.nb9定理6:T =X 1--X 2--(μ1-μ2)S X nt n 1-1 ,X 3i =X 2i i =1,2,⋯,n 1 ,X i =X 1iX 3i+X 3-X 2,X =1n 1i =1n 1X i ,S X =需要Needs ["HypothesisTesting`"]X1=伪随机变数RandomVariate [正态分布NormalDistribution [3,2],1200];X2=伪随机变数RandomVariate [正态分布NormalDistribution [2,1],1500];μ0=1.0;α=0.01;n1=长度Length [X1];n2=长度Length [X2];m1=平均值Mean [X1];m2=平均值Mean [X2];X3=X2[[1;;n1]];m3=平均值Mean [X3];X =X1-平方根Sqrt n1 n2 X3+平方根Sqrt n1 n2 m3-m2;m =平均值Mean [X ];S =标准偏差StandardDeviation [X ];t =m -μ0Sn1;"1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ0"p =2 1-⋯CDF [学生t 分布StudentTDistribution [n1-1],绝对值Abs [t ]]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"不等Unequal"]"2.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ0"p =1-⋯CDF [学生t 分布StudentTDistribution [n1-1],t ]TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"大于Greater"]"3.左侧T 检验H 0:μ1-μ2≥μ0,H 1:μ1-μ2<μ0"p =⋯CDF [学生t 分布StudentTDistribution [n1-1],t ]T 检验TTest [{X1,X2},μ0,"TestDataTable",备择假设AlternativeHypothesis →"小于Less"]1.双侧T 检验H 0:μ1-μ2=μ0,H 1:μ-μ2≠μ00.6180772.右侧T 检验H 0:μ1-μ2≤μ0,H 1:μ1-μ2>μ00.30903810 正态分布\\正态分布统计分析\\两正态分布均值差检验.nb正态分布\\正态分布统计分析\\两正态分布均值差检验.nb113.左侧T检验H0:μ1-μ2≥μ0,H1:μ1-μ2<μ00.690962。