统计学第七章 参数估计
- 格式:ppt
- 大小:3.36 MB
- 文档页数:85
第7章参数估计7.1 考点归纳【知识框架】【考点提示】(1)置信区间的含义理解(选择题、简答题考点);(2)估计量的三个评价标准(判断题、填空题、简答题考点);(3)区间估计的步骤(简答题考点)、总体参数的区间估计选择恰当的统计量(计算题考点);(4)必要样本容量的影响因素、计算(简答题、计算题考点)。
【核心考点】考点一:参数估计的基本原理1.置信区间(1)置信水平为95%的置信区间的含义:用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
(2)置信度愈高(即估计的可靠性愈高),则置信区间相应也愈宽(即估计准确性愈低)。
(3)置信区间的特点:置信区间受样本影响,具有随机性,总体参数的真值是固定的。
一个特定的置信区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。
2.评价估计量的标准(1)无偏性:估计量抽样分布的期望值等于被估计的总体参数,即E(θ∧)=θ。
(2)有效性:估计量的方差尽可能小。
(3)一致性:随着样本量的增大,估计量的值越来越接近被估计总体的参数。
【提示】本考点常见考查方式:①直接考查置信水平为95%的置信区间的含义;②置信度、估计可靠性、置信区间的关系及应用;③置信区间的特点;④给出估计量的具体含义,判断体现了什么标准;⑤直接回答估计量的三个评价标准及具体含义(简答题)。
考点二:一个总体参数的区间估计表7-1 一个总体参数的区间估计【总结】一个总体参数的估计及所使用的分布见图7-1:图7-1 一个总体参数的估计及所使用的分布【真题精选】设总体X~N(μ,σ2),σ2已知,样本容量和置信水平固定,对不同的样本观测值,μ的置信区间的长度()。
[对外经济贸易大学2018研]A.变长B .变短C .保持不变D .不能确定 【答案】C【解析】在正态总体方差已知的条件下,μ的置信区间为/2x z ±ασ所以置信区间长度为/22Z α,当样本容量和置信水平固定时,置信区间长度保持不变。
统计学参数估计参数估计是统计学中的一个重要概念,它是指在推断统计问题中,通过样本数据对总体参数进行估计的过程。
这一过程是通过样本数据来推断总体参数的未知值,从而进行总体的描述和推断。
在统计学中,参数是指总体的其中一种特征的度量,比如总体均值、总体方差等。
而样本则是从总体中获取的一部分观测值。
参数估计的目标就是基于样本数据来估计总体参数,并给出估计的精确程度,即估计的可信区间或置信区间。
常见的参数估计方法包括点估计和区间估计。
点估计是一种通过单个数值来估计总体参数的方法。
点估计的核心是选择合适的统计量作为估计量,并使用样本数据计算出该统计量的具体值。
常见的点估计方法包括最大似然估计和矩估计。
最大似然估计是一种寻找参数值,使得样本数据出现的概率最大的方法。
矩估计则是通过样本矩的函数来估计总体矩的方法。
然而,点估计只能提供一个参数的具体值,无法提供该估计值的精确程度。
为了解决这个问题,区间估计被引入。
区间估计是指通过一个区间来估计总体参数的方法。
该区间被称为置信区间或可信区间。
置信区间是在一定置信水平下,总体参数的真值落在该区间内的概率。
置信区间的计算通常涉及到抽样分布、标准误差和分位数等概念。
在实际应用中,参数估计经常用于统计推断、统计检验和决策等环节。
例如,在医学研究中,研究人员可以通过对患者进行抽样调查来估计其中一种药物的有效性和不良反应的发生率。
在市场调研中,市场研究人员可以通过抽取部分样本来估计一些产品的市场份额或宣传效果。
参数估计的准确性和可靠性是统计分析的关键问题。
估计量的方差和偏倚是影响估计准确性的主要因素,通常被称为估计量的精确度和偏倚性。
经典的参数估计要求估计量是无偏且有效的,即估计量的期望值等于真值,并且方差最小。
总之,参数估计是统计学中的一个重要概念,它通过样本数据对总体参数进行估计,并给出估计值的精确程度。
参数估计在统计推断、统计检验和决策等领域具有广泛的应用。
估计量的准确性和可靠性是参数估计的关键问题,通常通过方差和偏倚的分析来评价估计量的性质。
第七章 参数估计7.1 (1)x σ==(2)2x z α∆= 1.96=1.54957.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x σ==(2)在95%的置信水平下,求估计误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:2x z x z αα⎛-+ ⎝=()120 4.2,120 4.2-+=(115.8,124.2)7.322x z x z αα⎛-+ ⎝=104560±(87818.856,121301.144) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭ 或2,s x N n μ⎛⎫⎪⎝⎭置信区间为:22x z x z αα⎛-+ ⎝=1.2 (1)构建μ的90%的置信区间。
2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。
2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。
2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(77.91,84.09)7.5 (1)2x z α±=25 1.96±=(24.114,25.886)(2)2x z α±119.6 2.326±=(113.184,126.016)(3)2x z α± 3.419 1.645±(3.136,3.702)7.6 (1)2x z α±=8900 1.96±=(8646.965,9153.035)(2)2x z α±8900 1.96±=(8734.35,9065.65)(3)2x z α±8900 1.645±=(8761.395,9038.605)(4)2x z α±8900 2.58±=(8681.95,9118.05)7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调解:(1)样本均值x =3.32,样本标准差s=1.611α-=0.9,t=2z α=0.05z =1.645,x z α± 3.32 1.645±=(2.88,3.76)1α-=0.95,t=z α=0.025z =1.96,x z α± 3.32 1.96±(2.79,3.85)1α-=0.99,t=z α=0.005z =2.576,2x z α± 3.32 2.76±(2.63,4.01)7.82x t α±=10 2.365±7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 86 9 12 117 5 1015 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
实验七:参数估计【目的要求】1.掌握均数抽样误差的概念及产生原因2.掌握总体均数的可信区间及估计方法3.熟悉标准差与标准误的区别和联系【案例分析】案例1:某研究者于某年在某市随机调查了200例正常成年人血铅含量(μg/100g),将资料整理成表5-3的频数表形式,试估计该市正常成年人血铅含量的参考值范围及正常成年人平均血铅含量的置信区间。
由于血铅值高于某上限值才被看作异常,故作者将该数据代入公式X+1.64S计算得到该市正常成年人血铅含量95%参考值范围的上界;并用公式X+1.64 s计算得到正常成年人平均血铅含量的95%置信区间的上界。
试问这样做是否合适? 为什X么?应当怎么做?200名正常成年人血铅频数表组段(μg/100g)频数f累计频数累计频率(%)4~252512.58~325728.512~369346.516~3012361.520~2514874.024~2217085.028~1118190.532~818994.536~419396.540~419798.544~119899.048~119999.552~561200100.0合计∑f=200【SPSS操作】Analyze→Descriptive Statistics→Explore→选择变量到Dependent List列表中→选择Display选择框内的Statistics→OK【练习题】一、填空题1.抽样误差是指。
2.标准误是指。
3.总体均数置信区间的计算方法有和。
4.t分布的自由度是。
5.参数估计分为和。
6.总体概率置信区间的计算方法有和。
二、选择题1.表示均数抽样误差大小的统计指标是( )A.标准差B.方差C.均数标准误D.变异系数E.样本标准误S表示( )2.xA.总体均数B.样本均数的标准差C.总体均数离散程度D.变量值X的离散程度3.标准误越大,表示此次抽样得到的样本频率( )A.系统误差越大B.可靠程度越大C.抽样误差越大D.可比性越差4.要减小抽样误差,通常的做法是( )A.适当增加样本例数B.将个体变异控制在一个范围内C.严格挑选观察对象D.增加抽样次数5.关于t分布的图形,下列哪项是错误的( )A.当v趋于无穷时,标准正态分布是t分布的特例B.当v逐渐增大,t分布逐渐逼近标准正态分布C.v越小,则t分布的尾部越高D.t分布是一条以v为中心左右对称的曲线6.已知某地25岁正常成年男性平均收缩压为113.0mmHg,从该地随机抽取20名25岁正常成年男性,测得平均收缩压为119.0 mmHg. 113.0mmHg与119.0mmHg不同,原因是( )A.样本例数太少B.抽样误差C.总体均数不同D.系统误差E.个体差异太大7.从上题的同一个地区再随机抽取20名8岁正常男孩,测得平均收缩压为90 mmHg,标准差为9.8 mmHg.90 mmHg与113.0 mmHg不同,原因是( )A.样本例数太少B.抽样误差C.总体均数不同D.系统误差E.样本均数不可比8.在同一总体随机抽样,样本含量n固定时,a越大,用总体均数的可信区间估计总体均数,估计的情况是()A.错的概率越大B.错的概率越小C.错的概率不变D.其精度越差9.统计推断包括两个重要方面()A.参数估计和假设检验B.计算均数和标准差C.统计描述和假设检验D.计算均数和标准误10.总体均数的可信区间()A.随总体均数而变化B.不随总体均数而变化C.固定区间D.随样本不同而变化11.总体概率的区间估计中,a值越大()A.置信度越大B.置信度越低C.估计的精度下降D.抽样误差越大E.抽样误差越小12.样本频率的标准误越大,()A.置信度越大B.置信度越低C.估计的精度下降D.抽样误差越大E.抽样误差越小13.置信区间和医学参考值范围相比,()A.置信区间也能判断个体值是否正常B.估计的精度好C.估计的精度下降D.置信区间的宽度小于医学参考值范围的宽度E.两者的计算都利于标准误三、判断题1.一般情况下,同一批资料的标准误小于标准差()2.从同一总体中随机抽取样本含量相同的两个样本,他们的样本均数与总体均数相同()3.增加样本含量可以减小抽样误差,所以样本含量越大越好()4.样本含量足够大时,来自正偏峰分布的样本可用正态近似法作参数估计()5.t分布法计算置信区间只适合小样本而不适用于大样本()6.当v一定,a=0.05时,单侧t值小于双侧t值()7.t值相等时,单侧概率小于双侧概率()8.通过样本频率估计总体概率,99%置信区间的精度高于95%置信区间()S都是变异指标,因此它们都可以表示抽样误差的大小()9.S和x四、思考题1.参考值范围和置信区间有什么区别和联系?2.t分布有什么特点?3.什么是均数标准误?意义是什么?如何计算及控制?【作业】1.为了研究某地黄连中小檗碱含量,随机抽查该地20份黄连中小檗碱含量(mg/100g)得平均数为4.35,标准差为0.20,试计算:(1)总体均数的95%和99%的可信区间。
统计学参数估计统计学参数估计是统计学中一种重要的方法,它通过观察样本数据来估计总体参数的值。
参数是描述总体特征的数值,例如总体均值、总体比例等。
参数估计的目的是根据样本信息对总体参数进行推断,从而得到总体特征的近似值。
参数估计的过程通常分为点估计和区间估计两种方法。
点估计是指根据样本数据求出总体参数的一个数值估计量,例如样本均值、样本比例等。
点估计的基本思想是用样本统计量作为总体参数的估计值,它是参数的无偏估计量时,表示点估计是一个良好的估计。
区间估计是指根据样本数据求出一个区间,这个区间包含总体参数的真值的概率较高,通常用置信区间表示。
区间估计的基本思想是总体参数位于一个区间中的可能性,而不是一个确定的值。
置信区间的构造依赖于样本统计量的分布以及总体参数的估计量的抽样分布。
点估计和区间估计的方法有很多,其中最常用的是最大似然估计和矩估计。
最大似然估计是指根据已知样本观测值,选择使样本观测值出现的概率最大的总体参数作为估计值。
最大似然估计的基本思想是找到一个参数值,使得已观测到的样本结果出现的概率尽可能大。
矩估计是指根据样本矩的观测值,选择使样本矩的偏差与总体矩的偏差最小的总体参数作为估计值。
矩估计的基本思想是利用样本矩估计总体矩,从而近似估计总体参数。
参数估计在实际应用中具有广泛的应用价值。
例如,在医学研究中,需要对患者的疾病概率进行估计,以帮助医生做出正确的诊断和治疗决策。
在经济学研究中,需要对经济指标(如GDP、通胀率等)进行估计,以帮助政府制定宏观经济政策。
在市场调研中,需要对消费者行为进行估计,以帮助企业确定产品定价和市场策略。
然而,参数估计也存在一些局限性。
首先,参数估计的结果仅仅是对总体参数的估计,并不是总体参数的确切值。
其次,参数估计的结果受到样本容量的影响,样本容量越大,估计结果越可靠。
另外,参数估计还需要满足一些假设条件,如总体分布的形式、样本的独立性等,如果这些假设条件不满足,估计结果可能会失效。
第7章参数估计练习题一、填空题共10题,每题2分,共计20分1.参数估计就是用_______ __去估计_______ __;2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __;3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到;4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __;5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __;6. 评价估计量的标准包含无偏性、_______ __和_______ __;7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量;8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响;9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __;10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __;二、选择题共10题,每题1分,共计10分1.根据一个具体的样本求出的总体均值的95%的置信区间 ;A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C.一定包含总体均值D. 要么包含总体均值,要么不包含总体均值2.估计量的含义是指 ;A. 用来估计总体参数的统计量的名称B. 用来估计总体参数的统计量的具体数值C. 总体参数的名称D. 总体参数的具体数值3. 总体均值的置信区间等于样本均值加减边际误差,其中边际误差等于所要求置信水平的临界值乘以 ;A. 样本均值的标准差B. 样本标准差C. 样本方差D. 总体标准差4.一个95%的置信区间是指 ;A. 总体参数有95%的概率落在这一区间内B. 总体参数有5%的概率未落在这一区间内C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数5. 置信系数表达了置信区间的 ;A. 准确性B. 精确性C. 显着性D. 可靠性6. 在置信水平不变的条件下,要缩小置信区间,则 ;A. 需要增加样本量B. 需要减少样本量C. 需要保持样本量不变D. 需要改变统计量的抽样标准差7. 某地区职工样本的平均工资450元,样本平均数的标准差是5元,该地区全部职工平均工资落在440-460元之间的估计置信度为 ;A. 0.95B.0.9545C. 0.99D. 0.99738. 在其它条件不变的情况下,如果总体均值置信区间半径要缩小成原来的二分之一,则所需的样本容量 ;A. 扩大为原来的4倍B. 扩大为原来的2倍C. 缩小为原来的二分之一D. 缩小为原来的四分之一9. 以下哪个不是用公式n st x ±构造置信区间所需的条件 ;A. 总体均值已知B. 总体服从正态分布C. 总体标准差未知D. 样本容量小于3010. 假设正态总体方差已知,欲对其均值进行区间估计;从其中抽取较小样本后使用的统计量是 ;A. 正态统计量B. 2χ统计量C. t 统计量D. F 统计量三、判断题共10题,每题1分,共计10分1. 在其他条件相同时,95%的置信区间比90%的置信区间宽;2. 比较参数的两个估计量的有效性时,必须保证它们是无偏估计;3. 用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,因此我们可以说60-80分这个区间以95%的概率包含全班学生平均考试成绩的真值;4. 在总体均值和总体比例的区间估计中,边际误差由置信水平和统计量的标准差确定;5. 当正态总体的方差已知时,在小样本条件下,估计总体均值使用的分布是t 分布;6.有效性是指随着样本量的增大,估计量的值越来越接近被估总体的参数;7. 在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量;8. 在样本量一定的条件下,要提高估计的精度,就应降低置信水平;9. 在其他条件不变的情况下,总体数据的方差越大,估计时所需的样本量就越大;10.对于非正态总体,在大样本条件下,估计总体均值使用的分布是正态分布;四、计算题共6题,每题10分,共计60分1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8.2厘米;请确定该苗圃中树苗平均高度的置信区间,置信水平95%;2、从水平锻造机的一大批产品中随机抽取20件,测得其尺寸平均值x =32.58,样本方差2S =0.0966;假定该产品的尺寸2~(,)X N μσ,2,μσ均未知;试求2σ的置信度为95%的置信区间;3、某一金融分析师想要估计纽约证券交易所上市公司中拥有现金资产超过总资产百分之十的上市公司的比例;1他希望达到的估计误差不超过0.10,置信度为90%,请确定他所需的样本容量;2假设他根据1所确定的样本容量进行了抽样,并计算得出样本比例为0.13,试构建置信度为90%的总体比例的置信区间;4、某市交通管理部门拟估计该市机动车未按照规定购买保险的比例;1他们希望估计的允许误差不超过0.02,置信度为95%,请确定所需的样本容量;2假设他根据1所确定的样本容量进行了抽样,并计算得出样本比例为0.15,试构建置信度为95%的总体比例的置信区间;5、强生出租车公司拟进行一项调查,调查在六一儿童节那天出租车的平均行驶里程数;为此公司抽取了20辆出租车进行调查,测得样本均值545公里,标准差为140公里;请确定公司所有出租车平均行驶里程的置信区间,置信水平95%;6、某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的边际误差为25元,应抽取的样本量是多少。