第十九讲正态总体均值及方差的区间估计
- 格式:doc
- 大小:649.00 KB
- 文档页数:12
正态分布总体总体均值已知方差的置信区间【文章开头】一、引言在统计学中,正态分布总体是相当常见的一种总体类型。
当我们需要对一个正态分布总体的总体均值进行推断时,有时候我们会面临到总体均值已知,但方差未知的情况。
对于这样的情况,我们可以使用置信区间来进行推断。
二、什么是置信区间?置信区间是指在统计推断中,对总体参数的估计范围。
通常,我们会给出一个置信水平,比如95%的置信水平,表示对总体参数的估计有95%的把握是正确的。
置信区间由一个下限和一个上限组成,表示总体参数可能落在这个范围内的概率。
三、正态分布总体的总体均值已知的情况下,方差的置信区间如何计算?当正态分布总体的总体均值已知时,我们可以使用样本标准差来作为总体方差的估计。
我们可以利用样本大小、置信水平和样本标准差来计算方差的置信区间。
四、计算步骤1. 收集样本数据:从正态分布总体中随机抽取样本,并记录样本数据。
2. 计算样本标准差:利用样本数据计算样本标准差。
样本标准差是总体方差的一个无偏估计。
3. 确定置信水平:根据需要的置信水平,确定置信水平对应的临界值。
临界值可以从统计表中查找。
4. 计算置信区间:利用样本大小、样本标准差和置信水平的临界值,计算方差的置信区间。
五、示例假设我们想研究某种药物对血压的影响。
我们从正态分布的总体中随机抽取了100个样本,并记录了每个样本的血压数据。
我们已知总体均值为120,方差未知。
现在,我们想要计算方差的95%置信区间。
1. 收集样本数据:从正态分布总体中随机抽取100个样本,并记录血压数据。
2. 计算样本标准差:利用样本数据计算样本标准差。
假设计算得到样本标准差为10。
3. 确定置信水平:我们希望得到95%的置信区间,因此置信水平为0.95。
4. 计算置信区间:根据样本大小100,样本标准差10,和置信水平0.95的临界值,我们可以计算得到方差的置信区间。
【文章主体】六、方差的置信区间是如何帮助我们进行推断的?方差的置信区间为我们提供了一个总体参数可能的取值范围。
第十九讲 正态总体均值及方差的区间估计1. 单个正态总体方差的区间估计设总体),(~2σμN X , ),,(21n X X X 为来自X 的一个样本,已给定置信度(水平)为α-1,求2σ的置信区间。
①当μ已知时,由于),(~2σμN X i ,因此,)1,0(~N X i σμ-(,2,1=i n , )。
由2χ分布的定义知:∑=-ni i n X 1222)(~)(χσμ,据)(2n χ分布上α分位点的定义,有:αχσμχαα-=<-<∑=-1)}()()({21222122n X n P ni i从而αχμσχμαα-=⎪⎪⎭⎪⎪⎬⎫-<<⎪⎪⎩⎪⎪⎨⎧--=-∑∑1)()()()(2112221222n X n X P ni i ni i 故2σ的置信度为α-1的置信区间为:⎪⎪⎪⎪⎭⎫ ⎝⎛---==∑∑)()(,)()(211221222n X n X ni i n i i ααχμχμ ②当μ未知时,据抽样分布有:)1(~)1(222--n S n χσ类似以上过程,得到第七章 参数估计第5节 正态总体均值及方差的区间估计单个正态总体均值的区间估计 ①当2σ已知时,μ的置信水平为α-1的置信区间为:⎪⎪⎭⎫ ⎝⎛±2ασz n X (5.1) ②当2σ未知时,μ的置信水平为α-1的置信区间为⎪⎪⎭⎫ ⎝⎛-±)1(2n t n S X α.(5.4)注意:当分布不对称时,如2χ分布和F 分布,习惯上仍然取其对称的分位点,来确定置信区间,但所得区间不是最短的。
αχσχαα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---1)1()1()1()1(21222222n S n n S n P 2σ的置信度为α-1的置信区间为:⎪⎪⎭⎫⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 例2 有一大批袋装糖果, 现从中随机地取出16袋, 称得重量(以克计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 设袋装糖果的重量近似地服从正态分布, 求总体标准差σ的置信水平为0.95的置信区间.解:总体均值μ未知,σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 此时,,975.021,025.02,05.0=-==ααα16=n ,查表得,488.27)15(025.0=χ,262.6)15(975.0=χ由给出的数据算得.4667.382=s 因此,σ的一个置信度为0.95的置信区间为(4.58,9.60).2. 两个正态总体均值差的区间估计设总体),(~),,(~222211σμσμN Y N X ,且X 与Y 相互独立,),,(21m X X X 来自X 的一个样本,),,,(21n Y Y Y 为来自Y 的一个样本,且设2221,,,S S Y X 分别为总体X 与Y 的样本均值与样本方差,对给定置信水平α-1,求21μμ-的一个置信区间。
教学内容一、新课概述:单正态总体的区间估计首先分均值的区间估计和方差的区间估计,然后在均值的区间估计中又分为方差已知和方差未知两种情况。
二、讲授新课:1、均值μ的置信区间:(1)2σ已知:①),(~2n N X σμ)1,0(~:N n X U σμ-=得ααα-=<<-1)(2/2/1u U u P 2/2/1ααu u -=-其中ασμαα-=<-<-1)(2/2/u nX u P 则 ασμσαα-=+<<-1)(2/2/u n X u n X P 则的置信区间。
的置信度为为αμσσαα-+-1),(2/2/u n X u n X例1滚珠直径x 服从正态分布,其均值μ未知,方差已知为0.0006,从某天生产的滚珠中随机抽取6个测得其直径如下,求μ的置信度为95%的置信区间。
解:要求均值μ的置信区间,且方差已知为0.0006,因此,这里选取它作为统计量,其分布为标准正态分布)1,0(~N n X U σμ-=然后利用题目所给的样本值求出样本均值,样本个数等一些量。
495.1=X 6=n 95.01=-α05.0=α025.02=α接着就要求两个分位点了,利用标准正态分布的表查到两个分位点分别是-1.96和1.96。
ασμ-=<-<-1)96.196.1(nX P 最后把已知的值都代入,解这样一个含有未知参数μ的不等式,就得到了要求的置信区间。
αμ-=⨯+<<⨯-1)96.160006.0495.196.160006.0495.1(P 直径均值μ的置信度为95%的置信区间为(1.4754,1.5146)②置信区间的特点:接下来观察一下这个置信区间有什么特点,区间的大小又跟什么相关。
αμσμμσαα-=+<<-1)(2/2/n X n X Pi :置信区间是一个以X 为中心的对称的区间。
(为什么是对称的区间呢?前面介绍了当区间的可信度确定的情况下,我们就要提高区间的精度,也就是区间长度越短越好,而对称区间是在相同的置信度下,长度最短的区间。
如何确定正态分布总体均值已知的方差的置信区间在统计学中,置信区间是一种用来估计参数真实值范围的方法。
当我们知道总体均值,但方差未知时,我们需要确定正态分布总体总体均值已知的方差的置信区间。
在本文中,我将以从简到繁的方式来探讨这个主题,让您能更深入地理解。
1. 正态分布总体的概念让我们简要回顾一下正态分布总体的概念。
正态分布是最为常见的概率分布之一,其特点是呈钟形曲线,均值和标准差决定了曲线的中心位置和宽度。
在统计学中,我们常常使用正态分布来描述连续型随机变量的分布情况。
2. 总体均值已知的情况当我们已经知道正态分布总体的均值时,我们可以通过样本来估计总体的方差。
我们可以利用样本方差来估计总体方差,然后构建置信区间来确定总体方差的范围。
3. 方差的置信区间估计为了确定正态分布总体均值已知的方差的置信区间,我们可以利用卡方分布来进行估计。
卡方分布是一种特殊的概率分布,用于描述正态分布总体方差的抽样分布。
通过卡方分布的性质,我们可以构建出方差的置信区间,从而对总体方差做出估计。
4. 个人观点和理解在我的个人观点中,确定正态分布总体总体均值已知的方差的置信区间是统计学中非常重要的一部分。
这不仅可以帮助我们对总体方差进行估计,还可以为我们后续的推断统计提供重要的依据。
通过合理地构建置信区间,我们可以更准确地对总体参数进行推断,并且可以对我们的结论进行更加可靠的评估。
总结通过本文的阐述,我们可以深刻理解确定正态分布总体总体均值已知的方差的置信区间的方法。
我们需要对正态分布总体及其性质有一个清晰的认识。
我们可以利用样本数据来对总体方差进行估计,并且通过卡方分布来构建置信区间。
我也共享了我个人的观点和理解,希望可以为您对这个主题提供更多的思考。
在知识的文章格式中,可以使用序号标注来清晰地展示每个步骤的逻辑关系。
我希望本文的内容能够帮助您更好地理解正态分布总体总体均值已知的方差的置信区间的确定方法。
在统计学中,确定正态分布总体均值已知的方差的置信区间是一项重要的任务。
第十九讲 正态总体均值及方差的区间估计1. 单个正态总体方差的区间估计设总体),(~2σμN X , ),,(21n X X X 为来自X 的一个样本,已给定置信度(水平)为α-1,求2σ的置信区间。
①当μ已知时,由于),(~2σμN X i ,因此,)1,0(~N X i σμ-(,2,1=i n , )。
由2χ分布的定义知:∑=-ni i n X 1222)(~)(χσμ,据)(2n χ分布上α分位点的定义,有:αχσμχαα-=<-<∑=-1)}()()({21222122n X n P ni i从而αχμσχμαα-=⎪⎪⎭⎪⎪⎬⎫-<<⎪⎪⎩⎪⎪⎨⎧--=-∑∑1)()()()(2112221222n X n X P ni i ni i 故2σ的置信度为α-1的置信区间为:⎪⎪⎪⎪⎭⎫ ⎝⎛---==∑∑)()(,)()(211221222n X n X ni i n i i ααχμχμ ②当μ未知时,据抽样分布有:)1(~)1(222--n S n χσ类似以上过程,得到第七章 参数估计第5节 正态总体均值及方差的区间估计单个正态总体均值的区间估计 ①当2σ已知时,μ的置信水平为α-1的置信区间为:⎪⎪⎭⎫ ⎝⎛±2ασz n X (5.1) ②当2σ未知时,μ的置信水平为α-1的置信区间为⎪⎪⎭⎫ ⎝⎛-±)1(2n t n S X α.(5.4)注意:当分布不对称时,如2χ分布和F 分布,习惯上仍然取其对称的分位点,来确定置信区间,但所得区间不是最短的。
αχσχαα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---1)1()1()1()1(21222222n S n n S n P 2σ的置信度为α-1的置信区间为:⎪⎪⎭⎫⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 例2 有一大批袋装糖果, 现从中随机地取出16袋, 称得重量(以克计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 设袋装糖果的重量近似地服从正态分布, 求总体标准差σ的置信水平为0.95的置信区间.解:总体均值μ未知,σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 此时,,975.021,025.02,05.0=-==ααα16=n ,查表得,488.27)15(025.0=χ,262.6)15(975.0=χ由给出的数据算得.4667.382=s 因此,σ的一个置信度为0.95的置信区间为(4.58,9.60).2. 两个正态总体均值差的区间估计设总体),(~),,(~222211σμσμN Y N X ,且X 与Y 相互独立,),,(21m X X X 来自X 的一个样本,),,,(21n Y Y Y 为来自Y 的一个样本,且设2221,,,S S Y X 分别为总体X 与Y 的样本均值与样本方差,对给定置信水平α-1,求21μμ-的一个置信区间。
(1)当2221,σσ已知时,由第六章定理1知,),(~211mN X σμ,),(~222nN Y σμ,又X 与Y 相互独立,所以),(~222121nmN Y X σσμμ+--,即)1,0(~)()(222121N nmY X σσμμ+---;所以可以得到21μμ-的一个置信水平为α-1的置信区间为:⎥⎥⎦⎤⎢⎢⎣⎡+⋅±-n m z Y X 22212)(σσα(2)当22221σσσ==,但2σ未知时,由第六章定理4知:)2(~)()(1121-++---n m t S Y X nmwμμ其中2w w S S =,2)1()1(22212-+-+-=n m Sn S m S w,从而可得:21μμ-的一个置信水平为α-1的置信区间为:在实际中常遇到下面的问题:已知产品的某一质量指标服从正态分布,但由于原料、设备条件、操作人员不同,或工艺过程的改变等因素,引起总体均值、总体方差有所改变,我们需要知道这些变化有多大,这就需要考虑两个正态总体均值差或方差比的估计问题。
()n m wSn m t Y X 11)2(2+⋅-+±-α例2: 为比较Ⅰ,Ⅱ两种型号步枪子弹的枪口速度,随机地取Ⅰ型子弹10发,得到枪口平均速度为)/(5001s m x =,标准差)/(10.11s m s =,取Ⅱ型子弹20发,得到枪口平均速度为)/(4962s m x =,标准差)/(20.12s m s =,假设两总体都可认为近似地服从正态分布,且由生产过程可认为它们的方差相等,求两总体均值差21μμ-的置信度为0.95的置信区间。
解:结合实际,可认为来自两个总体的样本相互独立。
因两个总体的方差相等,却未知,所以21μμ-的一个置信水平为α-1的置信区间为:()n m wSn m t Y X 11)2(2+⋅-+±-α其中2w w S S =,2)1()1(22212-+-+-=n m S n S m S w此处,,025.02/,95.01==-αα20,10==n m ,282=-+n m ,查表得 0484.2)28(025.0=t ,又2820.11910.19222⨯+⨯=ws ,1688.12==w w s s ,故所求置信区间为:()()93.04)28(201101025.021±=+⋅±-t s xx w即 ()93.4,07.33. 两个正态总体方差比的区间估计在该题中所得置信区间的下限大于0,在实际中我们就认为1μ比2μ大(可信度为95%);相反,若下限小于0,则认为1μ与2μ没有显著的差别。
设总体),(~),,(~222211σμσμN Y N X ,且X 与Y 相互独立,),,(21m X X X 来自X 的一个样本,),,,(21n Y Y Y 为来自Y 的一个样本,且设2221,,,S S Y X 分别为总体X 与Y 的样本均值与样本方差,对给定置信水平α-1,求2221σσ的一个置信区间。
据抽样分布知:)1,1(~//22212221--n m F S S σσ由F 分布的上α分位点的定义知,ασσαα-=--<<---1)}1,1(//)1,1({22222122211n m F S S n m F P 即ασσαα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---1)1,1(//)1,1(/221222122212221n m F S S n m F S S P 于是得2221σ的一个置信水平为α-1的置信区间为:⎪⎪⎭⎫ ⎝⎛-----)1,1(/,)1,1(/22122212221n m F S S n m F S S αα 例3: 研究由机器A 和机器B 生产的钢管的内径, 随机地抽取机器A 生产的管子18只, 测得样本方差;34.0221mm s =抽取机器B 生产的管子13只, 测得样本方差.29.0222mm s =设两样本相互独立,且设两机器生产的管子的内径分别服从正态分布),(211σμN 和),(222σμN , 这里222121,,,σσμμ均未知,求方差比2221/σσ的置信度为0.90的置信区间.解:记机器A 生产的钢管为总体X, 机器B 生产的钢管为总体Y ,由题意知,),,(~211σμN X ),(~222σμN Y ,且来自X 与Y 的两个样本相互独立,因此,2221σσ的一个置信水平为α-1的置信区间为⎪⎪⎭⎫ ⎝⎛-----)1,1(/,)1,1(/22122212221n m F s s n m F s s αα 此处,95.021,05.02,90.01=-==-ααα,,13,18==n m 查表求?)12,17(05.0=F能够得到数据62.2)12,15(05.0=F ,54.2)12,20(05.0=F ,采用线性插值方法有62.2)12,17(151762.254.2152005.0--=--F得59.2)12,17(05.0≈F 。
又由F 函数的性质),(1),(1m n F n m F αα-=得38.21)17,12(1)12,17(05.095.0==F F .于是所求置信区间为⎪⎭⎫⎝⎛⨯38.229.034.0,59.229.0/34.0 即 ()79.2,45.0由于2221σ的置信区间包含1,在实际中我们认为2221,σσ两者没有显著差别。
(课间休息)4. (0—1)分布参数的区间估计 问题:设有一容量50>n 的大样本,它来自(0—1)分布的总体X ,X 的分布律为1,0,)1();(1=-=-x p p p x f x x ,其中p 为未知参数。
现在来求p 的置信水平为α-1的置信区间。
易知(0—1)分布的均值和方差分别为).1(,2p p p -==σμ设大样本n X X X ,,,21 来自(0—1)分布的总体X ,由中心极限定理知)1,0(~)1()1(1N p np np X n p np npXni i近似--=--∑=于是有ααα-≈⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<--<-1)1(2/2/z p np np X n z P从而得到p 的一个置信水平为α-1的置信区间为⎪⎪⎭⎫⎝⎛-±-a ac b b 242, 其中22/αz n a +=,()22/2αz X n b +-=,2X n c =。
例4: 从一大批产品中任取100件产品进行检验,发现其中有 60 件是一级品。
试求这批产品的一级品率 p 的置信度为 95%的置信区间.解:产品的一级品率p 是(0—1)分布的参数,且样本的容量较大,因此,一级品率 p 的一个置信水平为0.95的置信区间为(独立同分布的中心极限定理) (林德伯格—勒维定理) 设 ,,,,21n X X X 相互独立,服从同一分布, 且具有数学期望和方差:,)(μ=i X E ,)(2σ=i X D,,,2,1n i =, 则)(lim )(lim 1x x n n X P x F n i i n n n Φ=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=∑=∞→∞→σμ 中心极限定理的另类描述: 均值为μ, 方差为02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布.由于不等式2/2/)1(ααz p np npX n z <--<-等价于()222/)1(αz p np np X n -<-,将不等式化简,222222222/2/2p nz p nz p n p X n X n αα-<+-222222/2/2p z p z np p X n X n αα-<+- ()()0222222/2/<++-+Xn p z X n p z n αα以p 为自变量的函数()()22222/2/2X n p z X n p z n y ++-+=αα对应于一个开口朝上的抛物线。