两个正态分布的混合分布参数的估计_吴为人
- 格式:pdf
- 大小:456.62 KB
- 文档页数:8
正态分布的参数估计及假设检验一、实验目的掌握参数估计和假设检验的 MATLAB 的有关命令。
二、实验内容及要求1、掌握参数估计和假设检验的 MATLAB 的有关命令;2、熟练掌握单个正态总体期望和方差的区间估计;3、熟练掌握两个正态总体期望差和方差比的区间估计的命令;4、熟练掌握对单个正态总体均值、方差的假设检验;5、掌握对两个正态总体均值、方差有关的假设检验;6、对统计结果能进行正确的分析。
三、实验的重点和难点实验的重点和难点是要求学生掌握基本的MATLAB 软件的编程语言,掌握基本的调用命令。
四、实验准备掌握假设检验的相关步骤;(1) 根据问题提出合理的原假设0H 和备择假设;(2) 给定显著性水平α, 一般取较小的正数, 如0.05,0.01等; (3) 选取合适的检验统计量及确定拒绝域的形式; (4) 令P{当0H 为真拒绝0H }α≤, 求拒绝域;(5) 由样本观察值计算检验统计量的值, 并做出决策: 拒绝0H 或接受0H . 五、实验步骤下面是MATLAB 软件提供的一些常用的参数估计函数命令. 一、矩估计命令:mu_ju=mean(X) % 返回样本X 的均值sigma2_ju =moment(X,2) % 返回样本X 的2阶中心矩 例1. 来自某总体X 的样本值如下:232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48, 232.05, 232.45, 232.60, 232.47, 232.30,求X 的均值与方差的矩估计。
解:x=[232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48,232.05, 232.45, 232.60, 232.47, 232.30];mu_ju=mean(X)sigma2_ju= moment(X,2)输出:mu_ju =232.4025sigma2_ju =0.0255二、单个总体极大似然估计与区间估计(参数均未知)命令1: [a,b]=namefit (X, ALPHA) % 返回总体参数的极大似然估计a与置信度为100(1- ALPHA)%.的置信区间,若参数为多个,ab也是多个,若省略ALPHA,置信度为0.95常用分布的参数估计函数表3-1 参数估计函数表函数名调用形式函数说明binofit PHAT= binofit(X, N)[PHA T, PCI] = binofit(X,N)[PHA T, PCI]= binofit (X, N, ALPHA)二项分布的概率的最大似然估计置信度为95%的参数估计和置信区间返回水平α的参数估计和置信区间poissfit Lambdahat=poissfit(X)[Lambdahat, Lambdaci] = poissfit(X)[Lambdahat,Lambdaci]=poissfit(X, ALPHA)泊松分布的参数的最大似然估计置信度为95%的参数估计和置信区间返回水平α的λ参数和置信区间normfit [muhat,sigmahat,muci,sigmaci] = normfit(X)[muhat,sigmahat,muci,sigmaci]=normfit(X,ALPHA)正态分布的最大似然估计,置信度为95%返回水平α的期望、方差值和置信区间betafit PHAT =betafit (X)[PHA T, PCI]= betafit (X, ALPHA)返回β分布参数a和b的最大似然估计返回最大似然估计值和水平α的置信区间unifit [ahat,bhat] = unifit(X)[ahat,bhat,ACI,BCI] = unifit(X)[ahat,bhat,ACI,BCI]=unifit(X, ALPHA)均匀分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平α的参数估计和置信区间expfit muhat =expfit(X)[muhat,muci] = expfit(X)[muhat,muci] = expfit(X,alpha)指数分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平α的参数估计和置信区间gamfit phat =gamfit(X)[phat,pci] = gamfit(X)[phat,pci] = gamfit(X,alpha)γ分布参数的最大似然估计置信度为95%的参数估计和置信区间返回最大似然估计值和水平α的置信区间weibfit phat = weibfit(X)[phat,pci] = weibfit(X)[phat,pci] = weibfit(X,alpha)韦伯分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平α的参数估计及其区间估计Mlephat = mle('dist',data)[phat,pci] = mle('dist',data)[phat,pci] = mle('dist',data,alpha)[phat,pci] = mle('dist',data,alpha,p1)分布函数名为dist的最大似然估计置信度为95%的参数估计和置信区间返回水平α的最大似然估计值和置信区间仅用于二项分布,pl为试验总次数说明:各函数返回已给数据向量X的参数最大似然估计值和置信度为(1-α)×100%的置信区间。
混合分布的最大似然概率引言在统计学中,最大似然估计是一种常用的参数估计方法,它通过寻找使得观测数据出现的概率最大的参数值来估计未知参数。
最大似然估计在各个领域中有着广泛的应用,其中一个重要的应用领域就是混合分布模型。
什么是混合分布?混合分布是由多个分布组合而成的分布模型。
每个组成部分都是一个分布,而混合分布则是这些分布的线性组合。
混合分布在实际应用中非常常见,特别是当我们的数据集包含多个不同的子群体时。
假设我们的数据集包含两个子群体,一个子群体的数据符合正态分布,另一个子群体的数据符合指数分布。
我们可以通过混合分布来描述这个数据集,其中正态分布和指数分布分别是组成混合分布的两个组成部分。
混合分布的参数估计方法混合分布的参数估计是指通过观测数据来估计混合分布的组成部分以及每个组成部分出现的概率。
最大似然估计是一种常用的混合分布参数估计方法。
E步骤:计算每个观测数据属于每个组成部分的概率在最大似然估计中,首先需要计算每个观测数据属于每个组成部分的概率。
这可以通过使用贝叶斯定理来计算得到。
对于每个观测数据,我们计算其属于每个组成部分的概率,并保存起来以便在后续步骤使用。
M步骤:更新组成部分的参数在M步骤中,我们固定每个观测数据属于每个组成部分的概率,然后更新每个组成部分的参数。
具体而言,我们通过对每个组成部分的概率进行加权平均来更新每个组成部分的参数。
这个加权平均的权重就是每个观测数据属于该组成部分的概率。
重复进行E步骤和M步骤直到收敛在最大似然估计中,需要多次迭代进行E步骤和M步骤,直到参数的估计值收敛。
收敛的标准可以是参数的变化不大或者似然函数的变化不大。
一般情况下,我们可以选择一个合适的迭代次数来进行参数估计。
实例演示下面通过一个实例来演示混合分布的最大似然估计方法。
假设我们有一个数据集,该数据集包含两个子群体,其中一个子群体的数据符合正态分布,另一个子群体的数据符合指数分布。
我们的目标是通过最大似然估计来估计这两个子群体的参数。
第53讲两个正态总体参数的区间估计()()()()12112211222212,,,,,,,,;,1.. n n X X Y Y N N X Y S S μσμσα- 设样本和分别来自总体和并且它们相互独立.样本均值分别为样本方差分别为置信水平为()1,2212σσ已知时121. μμ-的置信区间12X Y μμ--:由的估计的分布,得枢轴量()2212212X Y z n n ασσ⎛⎫-±+ ⎪ ⎪⎝⎭得置信区间:()()()12221212~0,1X Y N n n μμσσ---+()22122 σσ=未知()()12212112w X Y t n n S n n α⎛⎫-±+-+ ⎪⎝⎭置信区间为: ()()2221122121122:wn S n S Sn n σ-+-=+-以代替得枢轴量()()()121212~211wX Y t n n S n n μμ---+-+()22123 σσ≠且未知()()12221212(0,1)X Y N S S n n μμ---+近似~123n n >当样本量和都充分大时(一般要0),22122212,S S σσ以估计以估计()2212212S S X Y z n n α⎛⎫-±+ ⎪⎪⎝⎭得近似置信区间为:12min(1,1)k n n ≈-- 其中 ()()12221212~(),, X Y t k S Sn n μμ---+近似当样本量小时()2212212()S S X Y t k n n α⎛⎫-±+ ⎪ ⎪⎝⎭则近似置信区间为:2112222., σμμσ的置信区间(未知)()222211121222222212~1,1S S S F n n Sσσσσ--由的估计想到枢轴量 ()()2212121222122121,11,1S SF n n F n n αασσ---<<--由2α2α1α-122(1,1)F n n α--1212(1,1)F n n α---()()2221112221212222122111,11,1S S F n n F n n S S αασσ-<<----得()()22112212122212211,1,11,1S S F n n F n n S S αα-⎛⎫ ⎪---- ⎪⎝⎭置信区间为:()()221122,,,,,.X Y X N Y N μσμσ~~设两机床生产的滚珠直径分别为且 15.014.815.215.414.915.115.214.815.215.014.815.114.614.815.114.515.01.8 9: : 两台机床生产同一型号滚珠.从甲机床生产的 滚珠中取个,从乙机床生产的滚珠的中取个. 测得这些滚珠的直径(单位:毫米)如下:甲机床乙例机床()()()()1212121212122112220.910.18,0.24234, σσμμσσμμσσμμσμμσ==-=-≠-求置信水平为的双侧置信区间.,求的置信区间;若且未知,求的置信区间;若且未知,求的置信区间;若未知,求的置信区间.本例的Excel计算见实验17.2112228,15.05,0.04579,14.9,0.0575,0.1n x S n y S α====== =解:; 2212212X Y z n n ασσ⎛⎫-±+⎪ ⎪⎝⎭()121210.18,0.24, σσμμ==-当时的置信区间为:()0.05 1.645,0.018,0.318z =-从而所求区间为()12122 σσμμ=-当且未知时,的置信区间为:()0.05121115 1.7531,0.228,0.486w t S n n ==+=()0.044,0.344-从而所求区间为()21212112w X Y t n n S n n α⎛⎫-±+-+ ⎪⎝⎭()12123 σσμμ≠-当且未知时,的置信区间为:()2212/212()S S X Y t k n n α⎛⎫-±+ ⎪ ⎪⎝⎭12min(1,1)7k n n --=其中自由度取()()0.057 1.895,0.058,0.358t =-从而所求区间为0 由(1)、(2)和(3)求得的三个区间 都了,说明两机床生产的滚珠的 平均直包含没有径注:显著差异.——见第59讲.()()22112221212122211,1,11,1S S F n n F n n S S αα-⎛⎫ ⎪----⎝⎭()211222,4 σμμσ当未知时,的置信区间为:()21220.900.227,2.965σσ得的置信度为的置信区间为()()()0.050.950.05117,8 3.50,7,8 3.738,7F F F ===由1 (4)中所求置信区间,说明两注:机床生产的滚珠直径包含没有的方差显著差异.——见第59讲.。
双参数指数分布尺度参数变化幅度的区间估计
吴正云
【期刊名称】《应用数学》
【年(卷),期】1995(8)3
【摘要】本文将Schechtman(1983)文中的方法加以修改后应用到双参数指数分布尺度参数变化幅度ρ的估计上,得到了一个保守的置信下限,并通过随机模拟证明了这个置信下限不是平凡的。
【总页数】4页(P345-348)
【关键词】双参数指数分布;区间估计;尺度参数;指数分布
【作者】吴正云
【作者单位】华中理工大学数量经济系
【正文语种】中文
【中图分类】O212.7
【相关文献】
1.双参数指数分布参数的最短区间估计 [J], 周世国;张新育;苏庆
2.双参数指数分布尺度参数的区间估计 [J], 王涛;华志强;张红梅
3.不完全数据场合下双参数指数分布参数的区间估计 [J], 程绩;李云飞
4.双参数指数分布尺度参数基于样本分位数的置信区间 [J], 李云飞;程绩
5.双参数指数分布中参数的区间估计 [J], 袁璐
因版权原因,仅展示原文概要,查看原文内容请购买。