正态分布变差系数的置信区间
- 格式:pdf
- 大小:190.68 KB
- 文档页数:4
第四节 正态总体的置信区间与其他总体相比, 正态总体参数的置信区间是最完善的,应用也最广泛。
在构造正态总体参数的置信区间的过程中,t 分布、2χ分布、F 分布以及标准正态分布)1,0(N 扮演了重要角色.本节介绍正态总体的置信区间,讨论下列情形: 1. 单正态总体均值(方差已知)的置信区间; 2. 单正态总体均值(方差未知)的置信区间; 3. 单正态总体方差的置信区间;4. 双正态总体均值差(方差已知)的置信区间;5. 双正态总体均值差(方差未知但相等)的置信区间;6. 双正态总体方差比的置信区间.注: 由于正态分布具有对称性, 利用双侧分位数来计算未知参数的置信度为α-1的置信区间, 其区间长度在所有这类区间中是最短的.分布图示★ 引言★ 单正态总体均值(方差已知)的置信区间★ 例1 ★ 例2★ 单正态总体均值(方差未知)的置信区间 ★ 例3 ★ 例4★ 单正态总体方差的置信区间 ★ 例5 ★ 双正态总体均值差(方差已知)的置信区间 ★ 例6 ★ 双正态总体均值差(方差未知)的置信区间★ 例7 ★ 例8★ 双正态总体方差比的置信区间 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题6-4内容要点一、单正态总体均值的置信区间(1)设总体),,(~2σμN X 其中2σ已知, 而μ为未知参数, n X X X ,,,21 是取自总体X 的一个样本. 对给定的置信水平α-1, 由上节例1已经得到μ的置信区间,,2/2/⎪⎪⎭⎫⎝⎛⋅+⋅-n u X n u X σσαα二、单正态总体均值的置信区间(2)设总体),,(~2σμN X 其中μ,2σ未知, n X X X ,,,21 是取自总体X 的一个样本. 此时可用2σ的无偏估计2S 代替2σ, 构造统计量n S X T /μ-=,从第五章第三节的定理知).1(~/--=n t nS X T μ对给定的置信水平α-1, 由αμαα-=⎭⎬⎫⎩⎨⎧-<-<--1)1(/)1(2/2/n t n S X n t P ,即 ,1)1()1(2/2/αμαα-=⎭⎬⎫⎩⎨⎧⋅-+<<⋅--n S n t X n S n t X P因此, 均值μ的α-1置信区间为.)1(,)1(2/2/⎪⎪⎭⎫ ⎝⎛⋅-+⋅--n S n t X n S n t X αα三、单正态总体方差的置信区间上面给出了总体均值μ的区间估计,在实际问题中要考虑精度或稳定性时,需要对正态总体的方差2σ进行区间估计.设总体),,(~2σμN X 其中μ,2σ未知,n X X X ,,,21 是取自总体X 的一个样本. 求方差2σ的置信度为α-1的置信区间. 2σ的无偏估计为2S , 从第五章第三节的定理知,)1(~1222--n S n χσ, 对给定的置信水平α-1, 由,1)1()1()1()1(,1)1(1)1(22/12222/222/2222/1αχσχαχσχαααα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---=⎭⎬⎫⎩⎨⎧-<-<---n S n n Sn P n S n n P 于是方差2σ的α-1置信区间为⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(22/1222/2n S n n S n ααχχ而方差σ的α-1置信区间.)1()1(,)1()1(22/1222/2⎪⎪⎭⎫ ⎝⎛-----n S n n S n ααχχ四、双正态总体均值差的置信区间(1)在实际问题中,往往要知道两个正态总体均值之间或方差之间是否有差异,从而要研究两个正态总体的均值差或者方差比的置信区间。
正态分布总体总体均值已知方差的置信区间【文章开头】一、引言在统计学中,正态分布总体是相当常见的一种总体类型。
当我们需要对一个正态分布总体的总体均值进行推断时,有时候我们会面临到总体均值已知,但方差未知的情况。
对于这样的情况,我们可以使用置信区间来进行推断。
二、什么是置信区间?置信区间是指在统计推断中,对总体参数的估计范围。
通常,我们会给出一个置信水平,比如95%的置信水平,表示对总体参数的估计有95%的把握是正确的。
置信区间由一个下限和一个上限组成,表示总体参数可能落在这个范围内的概率。
三、正态分布总体的总体均值已知的情况下,方差的置信区间如何计算?当正态分布总体的总体均值已知时,我们可以使用样本标准差来作为总体方差的估计。
我们可以利用样本大小、置信水平和样本标准差来计算方差的置信区间。
四、计算步骤1. 收集样本数据:从正态分布总体中随机抽取样本,并记录样本数据。
2. 计算样本标准差:利用样本数据计算样本标准差。
样本标准差是总体方差的一个无偏估计。
3. 确定置信水平:根据需要的置信水平,确定置信水平对应的临界值。
临界值可以从统计表中查找。
4. 计算置信区间:利用样本大小、样本标准差和置信水平的临界值,计算方差的置信区间。
五、示例假设我们想研究某种药物对血压的影响。
我们从正态分布的总体中随机抽取了100个样本,并记录了每个样本的血压数据。
我们已知总体均值为120,方差未知。
现在,我们想要计算方差的95%置信区间。
1. 收集样本数据:从正态分布总体中随机抽取100个样本,并记录血压数据。
2. 计算样本标准差:利用样本数据计算样本标准差。
假设计算得到样本标准差为10。
3. 确定置信水平:我们希望得到95%的置信区间,因此置信水平为0.95。
4. 计算置信区间:根据样本大小100,样本标准差10,和置信水平0.95的临界值,我们可以计算得到方差的置信区间。
【文章主体】六、方差的置信区间是如何帮助我们进行推断的?方差的置信区间为我们提供了一个总体参数可能的取值范围。
正态分布的置信区间
置信区间的常用计算方法如下:
pr(c1\uc=μ\uc=c2)=1-α
其中:α就是显著性水平(基准:0.05或0.10);
pr表示概率,是单词probability的缩写;
%*(1-α)或(1-α)或指置信水平(比如:95%或0.95);
表达方式:interval(c1,c2) - 置信区间。
资料开拓:
置信区间是指由样本统计量所构造的总体参数的估计区间。
在统计学中,一个概率样
本的置信区间(confidence interval)是对这个样本的某个总体参数的区间估计。
置信
区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测
量参数的测量值的可信程度,即前面所要求的“一个概率”。
置信区间就是一种常用的区间估算方法,所谓置信区间就是分别以统计数据量的置信
下限和置信上限为上下界形成的区间。
对于一组取值的样本数据,其平均值为μ,标准
偏差为σ,则其整体数据的平均值的(1-α)%置信区间为(μ-ζα/2σ , μ+ζα/2σ) ,其中α为非置信水平在正态分布内的覆盖面积,ζα/2即为对应的标准分数。
正态分布分位数与变异系数的置信限正态分布分位数与变异系数的置信限正态分布是统计学中最为常见的概率分布之一,通常用于描述自然界和社会现象中的随机变量。
正态分布的特点是对称、钟形曲线,其分布取决于两个参数,即均值(μ)和标准差(σ)。
在实际应用中,我们经常需要通过样本数据来推断总体分布的特性。
其中两个重要的统计量是分位数和变异系数。
分位数用于描述一个随机变量的位置,而变异系数则表示数据的离散程度相对于均值的比例。
在本文中,我们将重点讨论正态分布分位数与变异系数的置信限,以及它们对统计推断的重要性。
一、正态分布分位数的定义及计算正态分布的分位数是指将概率分布曲线上分成若干等分的点。
常见的分位数包括中位数、四分位数和百分位数等。
1.中位数(Median)中位数是指将一个样本或总体的观察值按照从小到大的顺序排列,处于中间位置的数值。
对于正态分布而言,中位数与均值相等。
2.四分位数(Quartiles)四分位数将数据分为四个部分,分别是下四分位数Q1、中位数、上四分位数Q3和全距IQR(Interquartile Range)。
下四分位数Q1是将数据按照从小到大排列后,处于前25%位置的数值。
上四分位数Q3是将数据按照从小到大排列后,处于前75%位置的数值。
全距IQR则是Q3和Q1之间的差值。
3.百分位数(Percentiles)百分位数指的是将数据分为一百份,每一份包含1%的数据。
计算正态分布的分位数可以通过求解累积分布函数(Cumulative Distribution Function,CDF)的逆函数来实现。
在常见的统计软件中,可以直接使用相应的函数来计算分位数。
二、正态分布的置信限置信限是指在给定的显著水平下,通过样本数据来估计总体参数的区间范围。
常见的置信限包括均值的置信限、比例的置信限和方差的置信限等。
对于正态分布的均值和标准差的置信限,我们通常使用样本均值和样本标准差来进行估计。
这里,我们将重点讨论正态分布的分位数和变异系数的置信限。
两正态总体均值差的区间估计基于Wolfram Mathematica ,给出了两正态分布Ν[μ1,σ1]、Ν[μ2,σ2]总体均值差μ1-μ2在两总体方差已知、未知但相等、未知但样本量相等、未知但已知方差比、未知近似、未知精确的置信区间估计方法。
最后对理论结果进行程序模拟。
设X i ~Ν(μ1,σ1),i =1,2,...,n ,为正态总体X ~Ν(μ1,σ1)的一i.i.d.,样本均值X -=1n i =1n X i ,样本方差S X 2=1n -1 i =1n X i -X - 2。
设Y i ~Ν(μ2,σ2),i =1,2,...,m ,为正态总体Y ~Ν(μ2,σ2)的一i.i.d.,样本均值Y -=1m i =1m Y i ,样本方差S Y 2=1m -1 i =1m Y i -Y - 2。
一、两总体方差σ12=σ102、σ22=σ202已知定理1:X -Ν μ1,σ1n ,Y -Ν μ2,σ2m .CharacteristicFunction NormalDistribution [μ,σ],t n n;特征函数CharacteristicFunction 正态分布NormalDistribution μ,σn ,t ;%⩵%%//完全简化FullSimplify [#,n >0&&属于Element [n,整数域Integers ]]&True定理2:X --Y -Νμ1-μ2,⇔X --Y --(μ1-μ2)Ν[0,1].转换分布TransformedDistribution X -Y,X 正态分布NormalDistribution μ1,σ1n ,Y 正态分布NormalDistribution μ2,σ2m转换分布TransformedDistribution(X -Y )-(μ1-μ2), X 正态分布NormalDistribution μ1,σ1n ,Y 正态分布NormalDistribution μ2,σ2m //完全简化FullSimplifyNormalDistribution μ1-μ2,NormalDistribution [0,1]下面简要给出求μ1-μ2置信区间的方法:由α2≤Φ≤1-α2,得μ1-μ2的置信水平为1-α的置信区间为X --Y --Z1≤μ1-μ2≤X --Y --Zα2即X --Y --Z1-α2≤μ1-μ2≤X --Y -+Z1其长度:L =2Z 1-α2以下是程序模拟:需要Needs ["HypothesisTesting`"]μ10=10;μ20=1;σ10=3;σ20=4;X =伪随机变数RandomVariate [正态分布NormalDistribution [μ10,σ10],2000];Y =伪随机变数RandomVariate [正态分布NormalDistribution [μ20,σ20],1000];α=0.05;"(一)两方差已知""1.计算法"n =长度Length [X ];m =长度Length [Y ];M =平均值Mean [X ]-平均值Mean [Y ];σ=Q =分位数Quantile 正态分布NormalDistribution [0,1],1-α2;{M -Q σ,M +Q σ}"2.MeanDifferenceCI"MeanDifferenceCI X,Y,KnownVariance → σ102,σ202 ,置信级别ConfidenceLevel →1-α"3.NormalCI"NormalCI [M,σ,置信级别ConfidenceLevel →1-α]"区间长度:"L =2Q σ"相对区间长度:"r =L M "(二)两方差未知"清除Clear [μ,σ]{μ1,σ1}={μ,σ}/.求分布参数FindDistributionParameters [X,正态分布NormalDistribution [μ,σ]];2 正态分布\\正态分布统计分析\\两正态总体均值差的置信区间.nb求分布参数正态分布{μ2,σ2}={μ,σ}/.求分布参数FindDistributionParameters [Y,正态分布NormalDistribution [μ,σ]];"1.计算法"n =长度Length [X ];m =长度Length [Y ];M =平均值Mean [X ]-平均值Mean [Y ];σ=Q =分位数Quantile 正态分布NormalDistribution [0,1],1-α2;{M -Q σ,M +Q σ}"2.MeanDifferenceCI"MeanDifferenceCI X,Y,KnownVariance → σ12,σ22 ,置信级别ConfidenceLevel →1-α"3.NormalCI"NormalCI [M,σ,置信级别ConfidenceLevel →1-α]"区间长度:"L =2Q σ"相对区间长度:"r =L M(一)两方差已知1.计算法{8.75322,9.31447}2.MeanDifferenceCI {8.75322,9.31447}3.NormalCI{8.75322,9.31447}区间长度:0.561248相对区间长度:0.0621273(二)两方差未知1.计算法{8.75899,9.30871}2.MeanDifferenceCI {8.75899,9.30871}3.NormalCI{8.75899,9.30871}区间长度:正态分布\\正态分布统计分析\\两正态总体均值差的置信区间.nb30.549724相对区间长度:0.0608516二、两总体方差σ12=σ22未知σ12=σ22未知,由定理2,知X--Y- Ν μ1-μ2,σ,X--Y- -(μ1-μ2)σΝ[0,1]。
正态分布置信区间EXCEL计算公式1.确定样本数量、样本均值和样本标准差。
在Excel中,假设样本数量为n,样本均值为x̄,样本标准差为s。
你可以使用诸如COUNT、AVERAGE和STDEV.S等函数来计算这些值。
2.确定置信水平。
置信水平是一个概率,表示我们对总体参数的估计有多大的信心。
常用的置信水平有90%、95%和99%。
你需要将这个置信水平转换为与其对应的α值。
例如,对于95%的置信水平,α值为0.053.确定临界值。
根据样本数量和置信水平,你需要确定正态分布的临界值。
在Excel 中,可以使用函数NORM.S.INV来计算这个临界值。
公式如下:```临界值=NORM.S.INV(1-α/2,0,1)```其中,α/2表示α值的一半。
4.计算置信区间的下限值和上限值。
接下来,你可以使用以下公式来计算置信区间的下限值和上限值:```下限值=x̄-(临界值*s/√n)上限值=x̄+(临界值*s/√n)```下限值表示总体参数可能的最小值,上限值表示总体参数可能的最大值。
例如,假设样本数量为100,样本均值为50,样本标准差为10,置信水平为95%。
可以使用以下公式来计算置信区间:```临界值=NORM.S.INV(1-0.05/2,0,1)=1.96下限值=50-(1.96*10/√100)=47.04上限值=50+(1.96*10/√100)=52.96```因此,95%的置信区间为(47.04,52.96)。
以上就是在Excel中计算正态分布置信区间的公式和步骤。
使用这些公式,你可以根据样本数据和置信水平来估计总体参数的取值范围。
标准正态分布的置信区间标准正态分布是统计学中非常重要的一个分布,它是指均值为0,标准差为1的正态分布。
在实际的统计分析中,我们经常需要对样本数据进行推断,而置信区间就是用来估计总体参数的范围。
在本文中,我们将介绍如何利用标准正态分布来计算置信区间。
首先,我们需要明确什么是置信区间。
置信区间是用来估计总体参数的范围,它可以告诉我们总体参数落在一个区间内的概率有多大。
在统计学中,常用的置信水平有95%和99%。
以95%置信水平为例,如果我们得到一个95%置信区间为(a,b),那么意味着有95%的概率总体参数落在a和b之间。
接下来,我们将介绍如何利用标准正态分布来计算置信区间。
首先,我们需要明白标准正态分布的性质。
标准正态分布的概率密度函数是一个钟形曲线,均值为0,标准差为1。
利用标准正态分布的性质,我们可以计算出给定置信水平下的临界值。
在95%置信水平下,临界值为±1.96;在99%置信水平下,临界值为±2.58。
然后,我们可以利用样本数据来计算置信区间。
假设我们有一个样本数据,我们可以计算出样本均值和标准差。
接着,我们可以利用样本均值和标准差来计算标准误差,标准误差是总体标准差的估计量。
最后,我们可以利用标准误差和临界值来计算置信区间。
举个例子来说明,假设我们有一个样本数据,样本均值为10,样本标准差为2,样本容量为100。
我们希望计算出95%置信水平下的置信区间。
首先,我们可以计算出标准误差,标准误差等于标准差除以样本容量的平方根,即2/√100=0.2。
然后,我们可以利用标准误差和临界值来计算置信区间,即10-1.960.2到10+1.960.2,最终得到的置信区间为(9.6,10.4)。
在实际的统计分析中,我们经常需要计算置信区间来估计总体参数的范围。
利用标准正态分布来计算置信区间是一种常用且有效的方法。
通过本文的介绍,相信读者对于标准正态分布的置信区间有了更深入的理解。
数值计算置信区间置信区间的计算涉及到样本均值、标准差和样本量等,根据总体分布的特点和样本的抽样方法,可以采用不同的计算方法。
下面将介绍几种常见的数值计算置信区间的方法。
1.正态分布的置信区间当样本的大小足够大,并且总体呈现近似正态分布时,可以采用正态分布的置信区间计算方法。
下面是正态分布置信区间的计算公式:置信区间=样本均值±Z*(标准差/√n)其中,Z是标准正态分布的分位数,可以根据所需的置信水平来确定。
例如,对于95%的置信水平,Z为1.96;对于99%的置信水平,Z为2.582.t分布的置信区间当样本的大小较小,总体的分布未知或总体不是正态分布时,可以采用t分布的置信区间计算方法。
下面是t分布置信区间的计算公式:置信区间=样本均值±t*(标准差/√n)其中,t是t分布的分位数,可以根据所需的置信水平和自由度来确定。
3.二项分布的置信区间当需要估计总体比例时,且样本符合二项分布时,可以采用二项分布的置信区间计算方法。
下面是二项分布置信区间的计算公式:置信区间=样本比例±Z*√((样本比例*(1-样本比例))/n)其中,Z是标准正态分布的分位数,可以根据所需的置信水平来确定。
除了上述方法外,还有其他一些适用于特定情况的置信区间计算方法,例如泊松分布的置信区间、贝叶斯置信区间等。
需要注意的是,置信区间是对总体参数的估计范围,不是总体参数的准确值。
置信区间的计算依赖于样本数据,不同的样本可能得到不同的置信区间。
因此,在进行置信区间的解释和应用时,需要考虑到置信区间的范围和置信水平的选择。
在实际应用中,数值计算置信区间可以帮助我们了解样本数据的可靠性和总体参数的不确定性,从而做出更准确的推断和决策。
文章标题:正态分布分位数与变异系数的置信限一、引言正态分布分位数和变异系数作为统计学中重要的概念,在实际应用中经常用于描述和分析数据的分布特征和变异程度。
在本文中,我将对正态分布分位数和变异系数的置信限进行深入探讨,并结合个人观点和理解,为读者解析这一重要概念。
二、正态分布分位数的置信限1. 正态分布分位数的概念正态分布分位数是指在正态分布曲线上的某一点对应的横坐标值,用来描述该点所处的位置。
在统计学中,常用的正态分布分位数包括均值、标准差、中位数等。
正态分布分位数的置信限是指对于给定的置信水平,求出分布中对应的两个值,这两个值范围内包含了给定置信水平下的分位数。
2. 正态分布分位数的置信限的应用正态分布分位数的置信限在实际应用中具有广泛的意义,它可以帮助我们对分布中的某一点进行确定概率区间的估计,从而帮助我们进行可靠的数据分析和决策。
三、变异系数的置信限1. 变异系数的概念变异系数是用于衡量数据变异程度的统计量,它是标准差与均值的比值。
变异系数的置信限是指在给定的置信水平下,对数据变异程度的区间估计。
2. 变异系数的置信限的应用变异系数的置信限能够帮助我们对数据的变异程度进行可靠的估计,这对于比较不同组别或样本的变异程度具有重要的意义。
通过变异系数的置信限,我们可以更加准确地评估数据的稳定性和一致性。
四、总结与展望正态分布分位数和变异系数的置信限在实际数据分析中扮演着重要的角色。
通过对它们的深入理解和应用,我们可以更准确地描述和分析数据的分布特征和变异程度,为决策提供科学依据。
未来,在实际应用中,我们还可以进一步探索正态分布分位数和变异系数的置信限在不同领域的应用,从而不断扩展它们的研究和应用价值。
五、个人观点和理解正态分布分位数与变异系数的置信限是统计学中重要的概念,它们能够帮助我们更准确地理解和分析数据的特征。
在实际应用中,我们需要不断深化对它们的理解,并结合具体问题,灵活运用它们来解决实际的数据分析和决策问题。
如何确定正态分布总体均值已知的方差的置信区间在统计学中,置信区间是一种用来估计参数真实值范围的方法。
当我们知道总体均值,但方差未知时,我们需要确定正态分布总体总体均值已知的方差的置信区间。
在本文中,我将以从简到繁的方式来探讨这个主题,让您能更深入地理解。
1. 正态分布总体的概念让我们简要回顾一下正态分布总体的概念。
正态分布是最为常见的概率分布之一,其特点是呈钟形曲线,均值和标准差决定了曲线的中心位置和宽度。
在统计学中,我们常常使用正态分布来描述连续型随机变量的分布情况。
2. 总体均值已知的情况当我们已经知道正态分布总体的均值时,我们可以通过样本来估计总体的方差。
我们可以利用样本方差来估计总体方差,然后构建置信区间来确定总体方差的范围。
3. 方差的置信区间估计为了确定正态分布总体均值已知的方差的置信区间,我们可以利用卡方分布来进行估计。
卡方分布是一种特殊的概率分布,用于描述正态分布总体方差的抽样分布。
通过卡方分布的性质,我们可以构建出方差的置信区间,从而对总体方差做出估计。
4. 个人观点和理解在我的个人观点中,确定正态分布总体总体均值已知的方差的置信区间是统计学中非常重要的一部分。
这不仅可以帮助我们对总体方差进行估计,还可以为我们后续的推断统计提供重要的依据。
通过合理地构建置信区间,我们可以更准确地对总体参数进行推断,并且可以对我们的结论进行更加可靠的评估。
总结通过本文的阐述,我们可以深刻理解确定正态分布总体总体均值已知的方差的置信区间的方法。
我们需要对正态分布总体及其性质有一个清晰的认识。
我们可以利用样本数据来对总体方差进行估计,并且通过卡方分布来构建置信区间。
我也共享了我个人的观点和理解,希望可以为您对这个主题提供更多的思考。
在知识的文章格式中,可以使用序号标注来清晰地展示每个步骤的逻辑关系。
我希望本文的内容能够帮助您更好地理解正态分布总体总体均值已知的方差的置信区间的确定方法。
在统计学中,确定正态分布总体均值已知的方差的置信区间是一项重要的任务。
高斯分布和正态分布置信区间
高斯分布和正态分布在统计学和概率论中起着重要作用,它们被广泛应用于各种领域,包括自然科学、社会科学和工程学等。
在这篇文章中,我们将探讨高斯分布和正态分布的置信区间,以及它们在实际问题中的应用。
首先,让我们简要介绍一下高斯分布和正态分布。
高斯分布,又称为正态分布,是一种连续概率分布,其曲线呈钟形,以均值μ为对称轴,标准差σ决定了曲线的宽窄。
正态分布具有许多重要的性质,例如68-95-99.7法则,即在一个标准差内的数据占比约为68%,两个标准差内的数据占比约为95%,三个标准差内的数据占比约为99.7%。
在统计学中,置信区间是对参数估计的一种区间估计方法。
它表示了对参数估计的不确定性,即参数真值所在的范围。
对于正态分布的均值μ的置信区间,通常使用样本均值x̄和标准差s来计算。
置信区间的计算依赖于样本量和置信水平,常见的置信水平包括90%、95%和99%。
一般情况下,置信水平越高,置信区间的宽度就越大。
在实际问题中,置信区间可以帮助我们对参数估计进行推断,
例如在医学研究中对药物的疗效进行评估、在市场调研中对产品销
售额的预测等。
通过计算置信区间,我们可以对参数的估计进行更
加客观和全面的评估,从而做出更加准确的决策。
总之,高斯分布和正态分布的置信区间是统计学中重要的概念,它们在参数估计和推断中起着关键作用。
通过合理地计算置信区间,我们可以对参数估计进行更加准确和可靠的推断,为实际问题的解
决提供有力支持。
希望本文能够帮助读者更好地理解高斯分布和正
态分布的置信区间,以及它们在实际问题中的应用。
正态分布变异系数的置信区间估计基于Wolfram Mathematica ,给出了正态分布N (μ,σ)样本变异系数c =SX的分布,据此得到总体变异系数c =σμ的置信区间估计。
◼抽样分布定理引理:X Ν μ,1 ,Y χ2(n )⇒Xt (n,μ)。
=转换分布TransformedDistributionX{X 正态分布NormalDistribution [μ,1],Y 卡方分布ChiSquareDistribution [n ]} ;块Block {μ=5,n =15},显示Show 直方图Histogram 伪随机变数RandomVariate ,107 ,1000,"概率密度函数PDF" ,Plot [⋯PDF [非中心学生t 分布NoncentralStudentTDistribution [n,μ],x ],{x,0,18},绘图样式PlotStyle →粗Thick ]定理1:X i Ν(μ,σ)⇒X -Νμ,σn⇔X --μσnΝ 0,1 .CharacteristicFunction NormalDistribution [μ,σ],t nn;特征函数CharacteristicFunction 正态分布NormalDistribution μ,σn,t ;%⩵%%//完全简化FullSimplify [#,n >0&&属于Element [n,整数域Integers ]]&True定理2:X i Ν(μ,σ)⇒(n -1)S2σ2 χ2 n -1 ⇔σχn -1 .令Y i =X i -μσ,则(n -1)S 2σ2=i =1n2=i =1n-= i =1nY i -Y2= i =1nYi 2-2Y Y i +Y 2=i =1nY i 2-2Y i =1nY i +n Y 2= i =1nY i 2-n Y 2χ2 n -1 ⇒σχ n -1 .n =n0=35;=转换分布TransformedDistribution i =1nY [i ]2-1ni =1nY [i ]2,数组Array [Y,n ] 联合分布ProductDistribution [{正态分布NormalDistribution [],n }] ;Block {n =n0},显示Show 直方图Histogram 伪随机变数RandomVariate ,2×106 ,500,"概率密度函数PDF" ,绘图Plot [⋯PDF [卡方分布ChiSquareDistribution [n -1],x ],{x,5,65},绘图样式PlotStyle →粗Thick ]定理3:n ct n -1,n c .根据定理1,得X -Νμ,σn⇒X -σ nN n c,1 ,根据定理2,得(n -1)S 2σ2χ2 n -1 ,根据引理,得n c =n X S=X -σnt n -1,n c .**变异系数c 的估计**In[135]:=μ0=2;σ0=2;X =伪随机变数RandomVariate [正态分布NormalDistribution [μ0,σ0],5000];n =长度Length [X ];m =平均值Mean [X ];S =标准偏差StandardDeviation [X ];α=0.01;"变异系数c 的点估计"c0=S m "1.等尾区间估计"cL =c /.求根FindRoot⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n c ,n c0 ⩵α2,{c,c0} ;cU =c /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n c ,n c0 ⩵1-α2,{c,c0} ;2 正态分布\\正态分布统计分析\\正态分布变异系数的置信区间.nb"等尾区间:"{cL,cU }"等尾区间长度:"L =cU -cL"相对区间长度:"r =2L cU +cL"2.最短区间估计"β=α;i =α 10;标签Label [begin1];cL =c /.求根FindRoot⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n c ,n c0 ⩵β,{c,c0} ;cU =c /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n c ,n c0 ⩵1-α+β,{c,c0} ;β-=i;标签Label [begin ];L1=cU -cL ;cL =c /.求根FindRoot⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n c ,n c0 ⩵β,{c,c0} ;cU =c /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n c ,n c0 ⩵1-α+β,{c,c0} ;L2=cU -cL ;如果If [L2<L1,{β-=i,如果If [β>0,转到Goto [begin ]]}];如果If L2>L1, β+=2i,i =i 10,转到Goto [begin1] ;"最短区间:"{cL,cU }"最短区间长度为:"Lmin =L2"相对区间长度:"rmin =2LmincU +cL"区间长度比:"Lmin L"相对区间长度比:"rmin r正态分布\\正态分布统计分析\\正态分布变异系数的置信区间.nb34正态分布\\正态分布统计分析\\正态分布变异系数的置信区间.nbOut[138]=变异系数c的点估计Out[139]= 1.00685Out[140]=1.等尾区间估计Out[143]=等尾区间:Out[144]={0.963679,1.05412}Out[145]=等尾区间长度:Out[146]=0.090439Out[147]=相对区间长度:Out[148]=0.0896413Out[149]=2.最短区间估计Out[151]=最短区间:Out[152]={0.963106,1.05349}Out[153]=最短区间长度为:Out[154]=0.0903861Out[155]=相对区间长度:Out[156]=0.0896422Out[157]=区间长度比:Out[158]=0.999416Out[159]=相对区间长度比:Out[160]= 1.00001。
正态分布变差系数的置信区间研究★徐晓岭1,顾蓓青1,王蓉华2(1.上海对外经贸大学统计与信息学院,上海201620;2.上海师范大学数理学院,上海200234)摘要:首先,研究了正态分布均值μ与方差σ2的联合置信域,该联合置信域具有较好的优良性,在大样本场合其面积和已有的置信域的面积非常接近;然后,给出了变差系数的置信区间、单侧置信下限和单侧置信上限;最后,通过实例说明了该方法的具体应用,同时也说明了原文献中存在的错误。
关键词:正态分布;变差系数;置信区间;联合置信域中图分类号:TB 114.3文献标志码:A文章编号:1672-5468(2021)02-0035-07doi:10.3969/j.issn.1672-5468.2021.02.008Study on Confidence Interval of Variation Coefficientfor Normal DistributionXU Xiaoling 1,GU Beiqing 1,WANG Ronghua 2(1.School of Statistics and Information ,Shanghai University of International Business and Economics ,Shanghai 201620,China ;2.Mathematics and Science College ,Shanghai Normal University ,Shanghai 200234,China )Abstract :Firstly ,the joint confidence region of mean μand variance σ2for normal distributionis studied.This joint confidence region has better superiority ,and the area of it is very close to that of the existing confidence region in the case of large sample.Then ,the confidence interval ,the one side lower confidence limit and the one-side upper confidence limit of variation coefficient are given.Finally ,the examples are given to illustrate the specific application of the proposed method ,and the error of the original literature is explained .Keywords :normal distribution ;variation coefficient ;confidence interval ;joint confidence re ⁃gion★基金项目:国家自然科学基金项目(11671264)资助。