6.4 正态总体的置信区间()
- 格式:ppt
- 大小:1.91 MB
- 文档页数:31
数理统计试题库-----填空题(每题3分)第一章1. 设()211~,X N μσ,()222~,Y N μσ相互独立,样本容量分别为12,n n ,则()Var X Y -= 。
2. 设1234,,,X X X X 是来自正态总体2(0,2)N 的简单随机样本,221234(2)(34)X a X X b X X =-+-,则a = ,b = 时,统计量2~(2)X χ。
3.设1234,,,X X X X 是来自正态总体2(0,3)N 的简单随机样本,221234(2)()X a X X b X X =-+-,则a = ,b = 时,统计量2~(2)X χ。
4. 设总体()2Xk χ,12,,,n X X X 是取自该总体的一个样本,则1ni i X =∑服从2χ分布,且自由度为 。
5.设12345,,,,X X X X X 是来自正态总体(0,1)N 的简单随机样本,2212()X a X X =+,则a = 时,统计量X 服从2χ分布,其自由度为 。
6.设12345,,,,X X X X X 是来自正态总体(0,1)N 的简单随机样本,X =,则a = 时,统计量X 服从t 分布,其自由度为 。
7.X 服从正态分布,1-=EX ,25EX =,12,,,n X X X 是来自总体X 的一个样本,则11ni i X X n ==∑服从的分布为 。
8. 设随机变量 X 服从正态分布2(0,3)N , 而 129,,,X X X 是来自X 的样本,则统计量()22212919U X X X =+++服从 。
9. 设随机变量 X 和 Y 相互独立且都服从正态分布2(0,3)N , 而129,,,X X X 和 129,,,Y Y Y 分别是来自X 和Y 的样本,则统计量292221921YY Y X X X U ++++++=服从 。
10. 设12,,,n X X X 是来自总体X 的简单随机样本,已知(1,2,3,4)k k EX k α== 则当n 充分大时,随机变量211n n i i Z X n ==∑近似服从正态分布,其分布参数为____________11. 设12,,,n X X X 是来自总体X 的一个样本,X 服从参数为λ的指数分布,则∑=ni i X 12λ服从____________分布.12. 设在总体2(,)N μσ中抽取一个容量为16的样本,这里2,μσ均为未知, 则2.DS =____________ 13. 设11,,,,,n n n m X X X X ++是分布2(0,)N σ的容量为n m +的样本,统计量1n iX Y =__________。
生物统计学知到章节测试答案智慧树2023年最新烟台大学绪论单元测试1.概率论是研究随机现象数量规律的数学分支。
参考答案:对2.在18世纪概率论引进之后,统计才逐渐发展成为一门成熟的学科。
参考答案:对3.同质基础上的变异是随机现象的基本属性。
参考答案:对4.同质性是总体的基本特征。
参考答案:对5.抽样研究的目的是用有限的样本信息推断总体特征。
参考答案:对6.变异是导致抽样误差的根本原因。
参考答案:对7.参数是描述样本特征的指标。
参考答案:错8.数理统计以概率论为基础,通过对随机现象观察数据的收集整理和分析推断来研究其统计规律。
参考答案:对9.统计方法体系的主体内容是参考答案:推断10.统计学的主要研究内容包括参考答案:数据分析;数据整理;数据解释;数据收集第一章测试1.各样本观察值均加同一常数c后参考答案:样本均值改变,样本标准差不变2.关于样本标准差,以下叙述错误的是参考答案:不会小于样本均值3.表示定性数据整理结果的统计图有条形图、圆形图。
参考答案:对4.直方图、频数折线图、茎叶图、箱图是专用于表示定量数据的特征和规律的统计图。
参考答案:对5.描述数据离散程度的常用统计量主要有极差、方差、标准差、变异系数等,其中最重要的是方差、标准差。
参考答案:对6.统计数据可以分为定类数据、定序数据和数值数据等三类,其中定类数据、定序数据属于定性数据。
参考答案:对7.描述数据集中趋势的常用统计量主要有均值、众数和中位数等,其中最重要的是均值。
参考答案:对8.己知某城市居民家庭月人均支出(元)<200,200-500,500-800,800-1000和>1000五个档次的家户庭数占总户数比例(%)分别为1.5,18.2,46.8,25.3,8.2。
则根据上述统计数据计算该市平均每户月人均支出的均值为687.3。
参考答案:对9.己知某城市居民家庭月人均支出(元)<200,200-500,500-800,800-1000和>1000五个档次的家户庭数占总户数比例(%)分别为1.5,18.2,46.8,25.3,8.2。
总体率的置信区间是通过考虑抽样误差,按照一定的可信度(即1-α)估计总体率的可能范围。
常见的估计方法有两种:查表法和正态近似法。
1. 查表法:适用于样本含量(n)较小的情况,特别是当样本率(p)接近0或1时。
可以通过查表法获得单个率的总体95%和99%可信区间。
2. 正态近似法:当样本含量n足够大,且样本率P和(1-p)均不太小(一般要求np与n(1-p)都>5)时,样本率的抽样分布近似服从正态分布。
可以用正态分布理论估计单个率的总体可信区间。
使用SPSS软件可以方便地计算出总体率的置信区间,也可以手动计算。
计算公式为:总体率(π)的95%可信区间:p±1.96sp,其中p是样本率,sp是标准误。
例如,如果样本率为25%,标准误为0.0153,则总体率的95%可信区间为(22.0%,28.0%)。
以上信息仅供参考,如果仍有疑问,建议咨询统计学专家或查阅统计学相关书籍。
(2022更新)国家开放大学电大专科《统计学原理》单项选择题题库及答案(试卷号2022)A.同类实体B.异类实体C.总体D.同类集合2.不能自然地直接使用数字表示的属性称为()属性。
A.数量属性B.质量属性C.水平属性D.特征属性3.属于总体边界清晰,个体不清晰的变量是()。
A.一列车的煤炭B.滇金丝猴种群C.大兴安岭的树D.工业流水线的一批产品4.()是选择个体及采集个体属性值的途径。
A.调查方法B.调查工具C.调查准则D.调查程序5.从某生产线上每隔25分钟抽取5分钟的产品进行检验,这种抽样方式属于()A.简单随机抽样B.等距抽样C.整群抽样D.分层抽样6.抽样调查和重点调查都是非全面调查,二者的根本区别是()A.灵活程度不同B.组织方式不同C.作用不同D.抽取样本的方式不同7.按随机原则进行抽样的抽样称为()A.问卷设计B.调查C.抽样设计D.随机抽样8.统计学将由许多个小实体构成的同类实体看作集合,称之为()A.总体B.个体C.总量D.变量9.根据总体的形态,总体可以分为()A.时间总体和空间总体B.实在总体和想象总体C.时点总体和时期总体D.平面总体和线性总体10.统计工作过程由()两个步骤构成。
A.统计设计和统计实施B.统计实施和调查设计C.现场调查和调查设计D.统计设计和调查设计11.对一个变量而言,其()指的是全面调查获得的所有变量值(或组)与其对应频率的一揽子表示。
A.分布B.总体分布C.样本分布D.频数12.()指的是抽样调查获得的所有变量值(或组)与其对应频率的一揽子表示。
A.分布B.总体分布C.样本分布D.联合总体分布13.以文字叙述方式表达简单变量的分布,一般用于变量值极少的场合(如性别)的分布的表达方法是()。
A.语示法B.表示法C.图示法D.函数法14.以表格陈列的方式表达较复杂变量的分布,用于变量值较少的场合(如年龄段)的分布的表达方法是()。
A.语示法B.表示法C.图示法D.函数法15.以图形方式表达复杂变量的分布的表达方法是()。
第四节 正态总体的置信区间与其他总体相比, 正态总体参数的置信区间是最完善的,应用也最广泛。
在构造正态总体参数的置信区间的过程中,t 分布、2χ分布、F 分布以及标准正态分布)1,0(N 扮演了重要角色.本节介绍正态总体的置信区间,讨论下列情形: 1. 单正态总体均值(方差已知)的置信区间; 2. 单正态总体均值(方差未知)的置信区间; 3. 单正态总体方差的置信区间;4. 双正态总体均值差(方差已知)的置信区间;5. 双正态总体均值差(方差未知但相等)的置信区间;6. 双正态总体方差比的置信区间.注: 由于正态分布具有对称性, 利用双侧分位数来计算未知参数的置信度为α-1的置信区间, 其区间长度在所有这类区间中是最短的.分布图示★ 引言★ 单正态总体均值(方差已知)的置信区间★ 例1 ★ 例2★ 单正态总体均值(方差未知)的置信区间 ★ 例3 ★ 例4★ 单正态总体方差的置信区间 ★ 例5 ★ 双正态总体均值差(方差已知)的置信区间 ★ 例6 ★ 双正态总体均值差(方差未知)的置信区间★ 例7 ★ 例8★ 双正态总体方差比的置信区间 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题6-4内容要点一、单正态总体均值的置信区间(1)设总体),,(~2σμN X 其中2σ已知, 而μ为未知参数, n X X X ,,,21 是取自总体X 的一个样本. 对给定的置信水平α-1, 由上节例1已经得到μ的置信区间,,2/2/⎪⎪⎭⎫⎝⎛⋅+⋅-n u X n u X σσαα二、单正态总体均值的置信区间(2)设总体),,(~2σμN X 其中μ,2σ未知, n X X X ,,,21 是取自总体X 的一个样本. 此时可用2σ的无偏估计2S 代替2σ, 构造统计量n S X T /μ-=,从第五章第三节的定理知).1(~/--=n t nS X T μ对给定的置信水平α-1, 由αμαα-=⎭⎬⎫⎩⎨⎧-<-<--1)1(/)1(2/2/n t n S X n t P ,即 ,1)1()1(2/2/αμαα-=⎭⎬⎫⎩⎨⎧⋅-+<<⋅--n S n t X n S n t X P因此, 均值μ的α-1置信区间为.)1(,)1(2/2/⎪⎪⎭⎫ ⎝⎛⋅-+⋅--n S n t X n S n t X αα三、单正态总体方差的置信区间上面给出了总体均值μ的区间估计,在实际问题中要考虑精度或稳定性时,需要对正态总体的方差2σ进行区间估计.设总体),,(~2σμN X 其中μ,2σ未知,n X X X ,,,21 是取自总体X 的一个样本. 求方差2σ的置信度为α-1的置信区间. 2σ的无偏估计为2S , 从第五章第三节的定理知,)1(~1222--n S n χσ, 对给定的置信水平α-1, 由,1)1()1()1()1(,1)1(1)1(22/12222/222/2222/1αχσχαχσχαααα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---=⎭⎬⎫⎩⎨⎧-<-<---n S n n Sn P n S n n P 于是方差2σ的α-1置信区间为⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(22/1222/2n S n n S n ααχχ而方差σ的α-1置信区间.)1()1(,)1()1(22/1222/2⎪⎪⎭⎫ ⎝⎛-----n S n n S n ααχχ四、双正态总体均值差的置信区间(1)在实际问题中,往往要知道两个正态总体均值之间或方差之间是否有差异,从而要研究两个正态总体的均值差或者方差比的置信区间。
西安交大统计学考试试卷一、单项选择题(每小题2分,共20分)1.在企业统计中,下列统计标志中属于数量标志的是(C)A、文化程度B、职业C、月工资D、行业2.下列属于相对数的综合指标有(B )A、国民收入B、人均国民收入C、国内生产净值D、设备台数3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量?A、0个B、两个C、1个D、3个4.下列变量中属于连续型变量的是(A )A、身高B、产品件数C、企业人数D、产品品种5.下列各项中,属于时点指标的有(A )A、库存额B、总收入C、平均收入D、人均收入6.典型调查是(B )确定调查单位的A、随机B、主观C、随意D盲目7.总体标准差未知时总体均值的假设检验要用到(A ):A、Z统计量B、t统计量C、统计量D、X统计量8. 把样本总体中全部单位数的集合称为(A )A、样本B、小总体C、样本容量D、总体容量9.概率的取值范围是p(D )A、大于1B、大于-1C、小于1D、在0与1之间10. 算术平均数的离差之和等于(A )A、零B、1C、-1D、2二、多项选择题(每小题2分,共10分。
每题全部答对才给分,否则不计分)1.数据的计量尺度包括(ABCD ):A、定类尺度B、定序尺度C、定距尺度D、定比尺度E、测量尺度2.下列属于连续型变量的有(BE ):A、工人人数B、商品销售额C、商品库存额D、商品库存量E、总产值3.测量变量离中趋势的指标有(ABE )A、极差B、平均差C、几何平均数D、众数E、标准差4.在工业企业的设备调查中(BDE )A、工业企业是调查对象B、工业企业的所有设备是调查对象C、每台设备是填报单位D、每台设备是调查单位E、每个工业企业是填报单位5.下列平均数中,容易受数列中极端值影响的平均数有(ABC )A、算术平均数B、调和平均数C、几何平均数D、中位数E、众数三、判断题(在正确答案后写“对”,在错误答案后写“错”。
第19讲 正态总体参数的区间估计教学目的:理解区间估计的概念,掌握各种条件下对一个正态总体的均值和方差进行区间估计的方法。
教学重点:置信区间的确定。
教学难点:对置信区间的理解。
教学时数: 2学时。
教学过程:第六章 参数估计§6.3正态总体参数的区间估计1. 区间估计的概念我们已经讨论了参数的点估计,但是对于一个估计量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度。
因此,对于未知参数θ,除了求出它的点估计ˆθ外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度。
设ˆθ为未知参数θ的估计量,其误差小于某个正数ε的概率为1(01)αα-<<,即ˆ{||}1P θθεα-<=-或αεθθεθ-=+<<-1)ˆˆ(P这表明,随机区间)ˆ,ˆ(εθεθ+-包含参数θ真值的概率(可信程度)为1α-,则这个区间)ˆ,ˆ(εθεθ+-就称为置信区间,1α-称为置信水平。
定义 设总体X 的分布中含有一个未知参数θ。
若对于给定的概率1(01)αα-<<,存在两个统计量1112(,,,)n X X X θθ= 与2212(,,,)n X X X θθ= ,使得12{}1P θθθα<<=-则随机区间12(,)θθ称为参数θ的置信水平为1α-的置信区间,1θ称为置信下限,2θ称为置信上限,1α-称为置信水平。
注(1)置信区间的含义:若反复抽样多次(各次的样本容量相等,均为n ),每一组样本值确定一个区间12(,)θθ,每个这样的区间要么包含θ的真值,要么不包含θ的真值。
按伯努利大数定理,在这么多的区间中,包含θ真值的约占100(1)%α-,不包含θ真值的约仅占100%α。
例如:若0.01α=,反复抽样1000次,则得到的1000个区间中,不包含θ真值的约为10个。
(2)置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。
正态分布可靠度R 的区间估计基于Wolfram Mathematica ,给出了正态分布N (μ,σ)系数n K = X -X Sn的分布,据此得到正态总体可靠度R 的置信区间估计。
◼抽样分布定理引理:X Ν μ,1 ,Y χ2(n )⇒Xt (n,μ)。
=转换分布TransformedDistribution X{X 正态分布NormalDistribution [μ,1],Y 卡方分布ChiSquareDistribution [n ]} ;块Block {μ=5,n =15},显示Show 直方图Histogram 伪随机变数RandomVariate ,107 ,1000,"概率密度函数PDF" ,Plot [⋯PDF [非中心学生t 分布NoncentralStudentTDistribution [n,μ],x ],{x,0,18},绘图样式PlotStyle →粗Thick ]定理1:X i Ν(μ,σ)⇒X -Νμ,σn⇔X --μσnΝ 0,1 .CharacteristicFunction NormalDistribution [μ,σ],t nn;特征函数CharacteristicFunction 正态分布NormalDistribution μ,σn,t ;%⩵%%//完全简化FullSimplify [#,n >0&&属于Element [n,整数域Integers ]]&True定理2:X i Ν(μ,σ)⇒(n -1)S 2σ2χ2 n -1 ⇔σχ n -1 .令Y i =X i -μσ,则(n -1)S 2σ2=i =1n2=i =1n-= i =1nY i -Y2= i =1nY i 2-2Y Y i +Y 2=i =1nY i 2-2Y i =1nY i +n Y 2= i =1nY i 2-n Y 2χ2n -1 ⇒σχ n -1 .n =n0=35;=转换分布TransformedDistribution i =1nY [i ]2-1ni =1nY [i ]2,数组Array [Y,n ] 联合分布ProductDistribution [{正态分布NormalDistribution [],n }] ;Block {n =n0},显示Show 直方图Histogram 伪随机变数RandomVariate ,2×106 ,500,"概率密度函数PDF" ,绘图Plot [⋯PDF [卡方分布ChiSquareDistribution [n -1],x ],{x,5,65},绘图样式PlotStyle →粗Thick ]定理3:n K t n -1,n z R ).根据定理1,得X -Nμ,⇒U -X -σnNU -μσn,1,根据定理2,得(n -1)S 2σ2χ2n -1 ,根据引理,得nU -X -S=U -X -σnt n -1,U -μσn.令K =U -X -S,z R =U -μσn,则n K t n -1,n Z R ).R =P (X <U )=Φ(z R ).根据定理1,得X -Nμ,⇒X --L σnNμ-L σn,1,根据定理2,得(n -1)S 2σ2χ2n -1 ,根据引理,得nX --L S=X --L σnt n -1,μ-L σn.令K =X --L S,z R =μ-L σn,n K t n -1,n z R ).R =P (X >L )=Φ(z R ).◼可靠度R 的估计2 正态分布\\正态分布统计分析\\正态分布可靠度的置信区间.nb一.R =P (X <U )In[86]:=μ0=5;σ0=2;X =伪随机变数RandomVariate [正态分布NormalDistribution [μ0,σ0],1000];n =长度Length [X ];m =平均值Mean [X ];S =标准偏差StandardDeviation [X ];α=0.01;U =9;K =U -m S;"R 的点估计"R =⋯CDF [正态分布NormalDistribution [],K ]"1.等尾区间估计"清除Clear [Z ]ZL =Z /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵1-α2,{Z,K } ;ZU =Z /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵α2,{Z,K } ;RL =⋯CDF [正态分布NormalDistribution [],ZL ];RU =⋯CDF [正态分布NormalDistribution [],ZU ];"等尾区间:"{RL,RU }"等尾区间长度:"L =RU -RL"相对区间长度:"r =2L RU +RL"2.最短区间估计"β=α;i =α 10;标签Label [begin1];ZL =Z /.求根FindRootCDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵1-α+β,{Z,K } ;ZU =Z /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵β,{Z,K } ;RL =⋯CDF [正态分布NormalDistribution [],ZL ];RU =⋯CDF [正态分布NormalDistribution [],ZU ];β-=i;标签Label [begin ];L1=RU -RL ;正态分布\\正态分布统计分析\\正态分布可靠度的置信区间.nb3ZL =Z /.求根FindRoot⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵1-α+β,{Z,K } ;ZU =Z /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵β,{Z,K } ;RL =⋯CDF [正态分布NormalDistribution [],ZL ];RU =⋯CDF [正态分布NormalDistribution [],ZU ];L2=RU -RL ;如果If [L2<L1,{β-=i,如果If [β>0,转到Goto [begin ]]}];如果If L2>L1, β+=2i,i =i 10,转到Goto [begin1] ;"最短区间:"{RL,RU }"最短区间长度为:"Lmin =L2"相对区间长度:"rmin =2LminRU +RL"区间长度比:"Lmin L"相对区间长度比:"rmin rOut[90]=R 的点估计Out[91]=0.972809Out[92]=1.等尾区间估计Out[97]=等尾区间:Out[98]={0.962978,0.98037}Out[99]=等尾区间长度:Out[100]=0.0173918Out[101]=相对区间长度:Out[102]=0.0178988Out[103]=2.最短区间估计Out[105]=最短区间:Out[106]={0.963347,0.980655}Out[107]=最短区间长度为:Out[108]=0.01730834 正态分布\\正态分布统计分析\\正态分布可靠度的置信区间.nbOut[109]=相对区间长度:Out[110]=0.0178068Out[111]=区间长度比:Out[112]=0.995199Out[113]=相对区间长度比:Out[114]=0.994864二.R =P (X >L )In[115]:=μ0=5;σ0=2;X =伪随机变数RandomVariate [正态分布NormalDistribution [μ0,σ0],1000];n =长度Length [X ];m =平均值Mean [X ];S =标准偏差StandardDeviation [X ];α=0.01;L =2;K =m -L S;"R 的点估计"R =⋯CDF [正态分布NormalDistribution [],K ]"1.等尾区间估计"清除Clear [Z ]ZL =Z /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵1-α2,{Z,K } ;ZU =Z /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵α2,{Z,K } ;RL =⋯CDF [正态分布NormalDistribution [],ZL ];RU =⋯CDF [正态分布NormalDistribution [],ZU ];"等尾区间:"{RL,RU }"等尾区间长度:"L =RU -RL"相对区间长度:"r =2L RU +RL"2.最短区间估计"β=α;i =α 10;标签Label [begin1];ZL =Z /.求根FindRootCDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵1-α+β,{Z,K } ;ZU =Z /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵β,正态分布\\正态分布统计分析\\正态分布可靠度的置信区间.nb5求根非中心学生t 分布{Z,K } ;RL =⋯CDF [正态分布NormalDistribution [],ZL ];RU =⋯CDF [正态分布NormalDistribution [],ZU ];β-=i;标签Label [begin ];L1=RU -RL ;ZL =Z /.求根FindRoot⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵1-α+β,{Z,K } ;ZU =Z /.求根FindRoot ⋯CDF 非中心学生t 分布NoncentralStudentTDistribution n -1,n Z ,n K ⩵β,{Z,K } ;RL =⋯CDF [正态分布NormalDistribution [],ZL ];RU =⋯CDF [正态分布NormalDistribution [],ZU ];L2=RU -RL ;如果If [L2<L1,{β-=i,如果If [β>0,转到Goto [begin ]]}];如果If L2>L1, β+=2i,i =i 10,转到Goto [begin1] ;"最短区间:"{RL,RU }"最短区间长度为:"Lmin =L2"相对区间长度:"rmin =2LminRU +RL"区间长度比:"Lmin L"相对区间长度比:"rmin rOut[119]=R 的点估计Out[120]=0.920374Out[121]=1.等尾区间估计Out[126]=等尾区间:Out[127]={0.901929,0.93606}Out[128]=等尾区间长度:Out[129]=0.0341304Out[130]=相对区间长度:6 正态分布\\正态分布统计分析\\正态分布可靠度的置信区间.nb正态分布\\正态分布统计分析\\正态分布可靠度的置信区间.nb7Out[131]=0.0371388Out[132]=2.最短区间估计Out[134]=最短区间:Out[135]={0.902356,0.936425}Out[136]=最短区间长度为:Out[137]=0.034069Out[138]=相对区间长度:Out[139]=0.0370561Out[140]=区间长度比:Out[141]=0.998202Out[142]=相对区间长度比:Out[143]=0.997773。