7.5(二)两个正态总体时的置信区间
- 格式:ppt
- 大小:433.50 KB
- 文档页数:18
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
令狐采学解:总体方差知道的情况下,均值的抽样分布服从的正态分布,由正态分布,标准化得到标准正态分布:z=~,因此,样本均值不超过总体均值的概率P为:====21,查标准正态分布表得=0.8159因此,=0.63186.2在练习题6.1中,我们希望样本均值与总体均值的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:===6.3 ,,……,表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,……,Zn是来自总体N(0,1)的样本,则统计量服从自由度为n的χ分布,记为χ~??χ(n)因此,令,则,那么由概率,可知:b??,查概率表得:b??????6.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得解:更加样本方差的抽样分布知识可知,样本统计量:此处,n=10,,所以统计量根据卡方分布的可知:又因为:因此:则:查概率表:=3.325,=19.919,则=0.369,=1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。
(1)样本均值的抽样标准差等于多少(2)在95%的置信水平下,估计误差是多少?7.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
两正态总体均值差的区间估计基于Wolfram Mathematica ,给出了两正态分布Ν[μ1,σ1]、Ν[μ2,σ2]总体均值差μ1-μ2在两总体方差已知、未知但相等、未知但样本量相等、未知但已知方差比、未知近似、未知精确的置信区间估计方法。
最后对理论结果进行程序模拟。
设X i ~Ν(μ1,σ1),i =1,2,...,n ,为正态总体X ~Ν(μ1,σ1)的一i.i.d.,样本均值X -=1n i =1n X i ,样本方差S X 2=1n -1 i =1n X i -X - 2。
设Y i ~Ν(μ2,σ2),i =1,2,...,m ,为正态总体Y ~Ν(μ2,σ2)的一i.i.d.,样本均值Y -=1m i =1m Y i ,样本方差S Y 2=1m -1 i =1m Y i -Y - 2。
一、两总体方差σ12=σ102、σ22=σ202已知定理1:X -Ν μ1,σ1n ,Y -Ν μ2,σ2m .CharacteristicFunction NormalDistribution [μ,σ],t n n;特征函数CharacteristicFunction 正态分布NormalDistribution μ,σn ,t ;%⩵%%//完全简化FullSimplify [#,n >0&&属于Element [n,整数域Integers ]]&True定理2:X --Y -Νμ1-μ2,⇔X --Y --(μ1-μ2)Ν[0,1].转换分布TransformedDistribution X -Y,X 正态分布NormalDistribution μ1,σ1n ,Y 正态分布NormalDistribution μ2,σ2m转换分布TransformedDistribution(X -Y )-(μ1-μ2), X 正态分布NormalDistribution μ1,σ1n ,Y 正态分布NormalDistribution μ2,σ2m //完全简化FullSimplifyNormalDistribution μ1-μ2,NormalDistribution [0,1]下面简要给出求μ1-μ2置信区间的方法:由α2≤Φ≤1-α2,得μ1-μ2的置信水平为1-α的置信区间为X --Y --Z1≤μ1-μ2≤X --Y --Zα2即X --Y --Z1-α2≤μ1-μ2≤X --Y -+Z1其长度:L =2Z 1-α2以下是程序模拟:需要Needs ["HypothesisTesting`"]μ10=10;μ20=1;σ10=3;σ20=4;X =伪随机变数RandomVariate [正态分布NormalDistribution [μ10,σ10],2000];Y =伪随机变数RandomVariate [正态分布NormalDistribution [μ20,σ20],1000];α=0.05;"(一)两方差已知""1.计算法"n =长度Length [X ];m =长度Length [Y ];M =平均值Mean [X ]-平均值Mean [Y ];σ=Q =分位数Quantile 正态分布NormalDistribution [0,1],1-α2;{M -Q σ,M +Q σ}"2.MeanDifferenceCI"MeanDifferenceCI X,Y,KnownVariance → σ102,σ202 ,置信级别ConfidenceLevel →1-α"3.NormalCI"NormalCI [M,σ,置信级别ConfidenceLevel →1-α]"区间长度:"L =2Q σ"相对区间长度:"r =L M "(二)两方差未知"清除Clear [μ,σ]{μ1,σ1}={μ,σ}/.求分布参数FindDistributionParameters [X,正态分布NormalDistribution [μ,σ]];2 正态分布\\正态分布统计分析\\两正态总体均值差的置信区间.nb求分布参数正态分布{μ2,σ2}={μ,σ}/.求分布参数FindDistributionParameters [Y,正态分布NormalDistribution [μ,σ]];"1.计算法"n =长度Length [X ];m =长度Length [Y ];M =平均值Mean [X ]-平均值Mean [Y ];σ=Q =分位数Quantile 正态分布NormalDistribution [0,1],1-α2;{M -Q σ,M +Q σ}"2.MeanDifferenceCI"MeanDifferenceCI X,Y,KnownVariance → σ12,σ22 ,置信级别ConfidenceLevel →1-α"3.NormalCI"NormalCI [M,σ,置信级别ConfidenceLevel →1-α]"区间长度:"L =2Q σ"相对区间长度:"r =L M(一)两方差已知1.计算法{8.75322,9.31447}2.MeanDifferenceCI {8.75322,9.31447}3.NormalCI{8.75322,9.31447}区间长度:0.561248相对区间长度:0.0621273(二)两方差未知1.计算法{8.75899,9.30871}2.MeanDifferenceCI {8.75899,9.30871}3.NormalCI{8.75899,9.30871}区间长度:正态分布\\正态分布统计分析\\两正态总体均值差的置信区间.nb30.549724相对区间长度:0.0608516二、两总体方差σ12=σ22未知σ12=σ22未知,由定理2,知X--Y- Ν μ1-μ2,σ,X--Y- -(μ1-μ2)σΝ[0,1]。
双正态总体参数的区间估计双正态总体参数的区间估计是统计学中的一种方法,用于估计由两个正态分布组成的总体的参数。
这种方法适用于当我们需要估计两个总体的平均值或比例时,且这两个总体可以被假定为来自两个不同的正态分布。
下面我们将详细介绍双正态总体参数的区间估计的原理和步骤。
双正态总体参数的区间估计可以分为两种情况:一种是当我们需要估计两个总体的平均值,另一种是当我们需要估计两个总体的比例。
首先,假设我们需要估计两个总体的平均值。
我们可以用样本平均值来估计总体平均值,并通过计算标准误差来构建置信区间。
如果我们假设两个总体的方差相等,则可以使用统计学中的配对t检验方法来进行推断。
具体步骤如下:1.收集样本数据。
从每个总体中随机抽取一定数量的样本,并记录下每个样本的观测值。
2.计算样本平均值。
对于每个总体,计算对应样本的平均值。
3.计算差值。
对于每个配对样本,计算它们的差值。
如果我们关注的是总体平均值的差异,则用两个总体对应样本的平均值之差来作为差值。
4.计算标准差。
计算差值样本的标准差,用来估计差值的标准误差。
5.确定置信水平。
选择一个置信水平,通常为95%。
这意味着我们希望有95%的置信度认为估计的区间包含真实的总体差异。
6.计算临界值。
确定配对t检验的自由度,并使用自由度和置信水平来查找相应的t临界值。
7.构建置信区间。
使用差值平均值±t临界值*标准误差来构建置信区间,这个区间将包含真实的总体差异。
另一种情况是当我们需要估计两个总体的比例。
在这种情况下,我们可以使用两个样本中的比例差异来估计总体的比例差异。
具体步骤如下:1.收集样本数据。
从每个总体中随机抽取一定数量的样本,并记录下每个样本中的成功次数和总次数。
2.计算样本比例。
对于每个总体,计算对应样本的比例,即成功次数除以总次数。
3.计算差异。
对于每个配对样本,计算它们的比例之差。
4.计算标准误差。
计算比例差异样本的标准误差,用来估计比例差异的标准误差。
置信区间法一、概述置信区间法(Confidence interval)是统计学中常用的一种方法,用于估计总体参数的范围。
在实际应用中,我们通常无法获得全体数据,只能通过从总体中抽取样本来进行推断。
而置信区间法可以帮助我们利用样本数据来估计总体参数,并给出一个可信的范围。
二、置信水平置信水平(Confidence level)是指在重复抽样的情况下,置信区间包含真实参数值的比例。
通常情况下,我们使用95%或99%作为置信水平。
三、构建置信区间构建置信区间需要以下三个步骤:1. 确定总体分布类型和总体参数;2. 根据样本数据估计总体参数;3. 利用统计方法确定置信区间。
四、正态分布情况下的置信区间当总体分布为正态分布时,可以使用t分布或标准正态分布来构建置信区间。
1. 样本量大于30且已知总体标准差时,使用标准正态分布构建置信区间;2. 样本量小于30或未知总体标准差时,使用t分布构建置信区间。
五、t分布情况下的置信区间当样本量小于30或未知总体标准差时,使用t分布构建置信区间。
1. 确定置信水平和自由度;2. 根据样本数据计算样本均值和样本标准差;3. 计算t值;4. 根据t分布表查找临界值;5. 构建置信区间。
六、实例假设我们想要估计一批产品的平均重量。
我们从该批产品中随机抽取了20个样本,得到平均重量为100g,标准差为10g。
现在我们希望以95%的置信水平来估计总体平均重量的范围。
1. 确定总体分布类型和总体参数:假设总体分布为正态分布,未知总体参数;2. 根据样本数据估计总体参数:样本均值为100g,样本标准差为10g;3. 利用统计方法确定置信区间:(1)因为样本量大于30且已知总体标准差,所以使用标准正态分布构建置信区间;(2)查找标准正态分布表可得到95%置信水平下的临界值为1.96;(3)根据公式:(x̄-zα/2 * σ/√n, x̄+zα/2 * σ/√n),计算置信区间为(96.08g, 103.92g)。
统计学中的假设检验与置信区间统计学中的假设检验与置信区间是两个重要的概念,用于分析样本数据并对总体参数进行推断。
假设检验是一种统计推断方法,用于判断某个断言是否成立或者拒绝。
而置信区间则是用于估计总体参数的范围。
一、假设检验假设检验是一种基于样本数据对总体假设进行推断的方法。
其基本思想是:首先提出一个关于总体参数的假设,然后通过样本数据的分析来判断该假设是否成立。
在进行假设检验时,首先需要提出原假设(H0)和备择假设(H1)。
原假设是我们希望得到支持的假设,而备择假设则是我们希望进行反驳的假设。
然后,选择一个合适的检验统计量,根据该统计量的取值,计算出相应的P值。
若P值小于预先设定的显著性水平(通常为0.05),则拒绝原假设,否则接受原假设。
举个例子来说,假设我们要检验某个新药物的疗效是否优于传统药物。
原假设可以是该药物的疗效不优于传统药物,备择假设可以是该药物的疗效优于传统药物。
然后,收集一部分病人的数据,计算出适当的统计量,并根据该统计量的取值计算出P值,用以判断是否拒绝原假设。
二、置信区间置信区间是用于对总体参数的范围进行估计的方法。
它给出了一个范围,该范围内包含了可能的参数值,并以一定的置信水平(通常为95%)表示。
计算置信区间的方法有很多种,最常用的是基于正态分布的方法。
该方法假设样本数据近似服从正态分布,通过样本均值和样本标准差的计算,结合正态分布的性质,可以计算出一个置信区间,用于估计总体参数。
举个例子来说,我们想要估计某个城市的平均工资水平。
收集到了一部分居民的工资数据,计算出样本均值和样本标准差,然后使用正态分布的方法计算出一个置信区间,例如95%的置信区间为(1000, 2000),表示我们对于总体平均工资的估计范围在1000到2000之间,且有95%的置信水平。
三、假设检验与置信区间的联系假设检验与置信区间在某种程度上可以互相转化和补充。
在假设检验中,我们可以根据置信区间来判断原假设的合理性。
置信度置信区间计算方法-置信区间公式表置信度置信区间计算方法置信区间公式表在统计学中,置信度和置信区间是非常重要的概念。
它们帮助我们在对总体参数进行估计时,给出一个可能包含真实参数值的范围,以及我们对这个范围的确定程度,也就是置信度。
首先,让我们来理解一下什么是置信度。
置信度通常用百分数表示,比如 95%或 99%。
它反映了我们在多次重复抽样和估计的过程中,得到的置信区间能够包含真实总体参数值的比例。
比如说,95%的置信度意味着如果我们进行 100 次抽样和估计,大约有 95 次得到的置信区间能够包含真实的总体参数值。
而置信区间则是一个可能包含总体参数真实值的范围。
这个范围的宽窄取决于我们所选择的置信度、样本数据的特征以及样本量的大小。
接下来,我们重点介绍几种常见的置信区间计算方法和相应的公式。
对于正态总体均值的置信区间计算,当总体方差已知时,我们使用的公式是:\\bar{X} \pm Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\其中,\(\bar{X}\)是样本均值,\(Z_{\alpha/2}\)是标准正态分布的双侧分位数(对应于置信度\(1 \alpha\)),\(\sigma\)是总体标准差,\(n\)是样本量。
例如,如果我们有一个样本均值为 50,总体标准差为 10,样本量为 100,并且想要计算 95%置信度下的置信区间,那么首先找到\(Z_{\alpha/2}\),对于 95%的置信度,\(\alpha = 005\),\(\alpha/2 = 0025\),对应的\(Z_{\alpha/2} \approx 196\)。
然后代入公式计算:\50 \pm 196 \times \frac{10}{\sqrt{100}}= 50 \pm 196\得到的置信区间就是 4804, 5196。
当总体方差未知时,我们用样本方差\(s\)来代替总体方差\(\sigma\),此时使用的是\(t\)分布,公式变为:\\bar{X} \pm t_{\alpha/2}(n 1) \frac{s}{\sqrt{n}}\其中,\(t_{\alpha/2}(n 1)\)是自由度为\(n 1\)的\(t\)分布的双侧分位数。
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从()2,N n σμ的正态分布,由正态分布,标准化得到标准正态分布:x ~()0,1N ,因此,样本均值不超过总体均值的概率P为:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,()0.3P x μ-≤=0.63186.2在练习题6.1中,我们希望样本均值与总体均值μ的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=210.95Φ-≥0.975⇒Φ≥1.96⇒≥42.6828843n n ⇒≥⇒≥6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使得 6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑ 解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量222212χ=+++n Z Z Z服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令6221ii Z χ==∑,则()622216ii Zχχ==∑,那么由概率6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑,可知:b=()210.956χ-,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差22211(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得 212()0.90p b S b ≤≤=解:更加样本方差的抽样分布知识可知,样本统计量:222(1)~(1)n s n χσ--此处,n=10,21σ=,所以统计量22222(1)(101)9~(1)1n s s s n χσ--==-根据卡方分布的可知:()()2212129990.90P b S b P b S b ≤≤=≤≤=又因为:()()()2221221911P n S n ααχχα--≤≤-=-因此:()()()()22221212299919110.90P b S b P n S n ααχχα-≤≤=-≤≤-=-= ()()()()222212122999191P b S b P n S n ααχχ-⇒≤≤=-≤≤- ()()()2220.950.059990.90P S χχ=≤≤=则: ()()2210.9520.0599,99b b χχ⇒==()()220.950.051299,99b b χχ⇒==查概率表:()20.959χ=3.325,()20.059χ=19.919,则()20.95199b χ==0.369,()20.05299b χ==1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。