第8章区间估计
- 格式:ppt
- 大小:1002.00 KB
- 文档页数:64
第五、六、七章:抽样推断1.总体分布、样本分布、抽样分布总体分布:总体中各个数据的分布样本分布:样本中各个数据的分布抽样分布:样本统计量的概率分布总体的分布通过直方图观察,但一般不可能得到所有的数据,也就不能直接观察到总体分布。
只要知道总体的分布类型和反映总体分布特征的参数就能够满足需要。
样本分布也称为经验分布,样本来源于总体,会包含总体的信息和特征,特别当样本容量较大时,样本的分布会很接近总体分布,但样本是随机抽取的,一般与总体分布有一定差异。
抽样分布是说明样本分布特征的统计量的分布,对它的理解是建立在反复抽样的基础上,样本是随机抽取的,不同的样本会有不同的统计量值,一个总体可以有很多个不同的样本,这样一个统计量就会有很多不同的取值,这些不同值的分布就是抽样分布。
由于在实践中对于同一总体我们不会反复抽取很多样本,因此,抽样分布一般不能直接观察到,仅是一种理论分布。
抽样分布揭示了样本统计量与总体参数的内在联系,为统计推断提供了理论基础。
2.总体单位与抽样单位、样本容量与样本可能数目3.统计量、总体参数及统计量的标准化统计量是样本数据的函数,在实际抽样之前,由于是样本随机的,统计量也是随机的,但在抽取样本之后,样本已经确定,统计量也就是确定的,不包含任何未知变量。
总体参数是说明统计总体的数据特征值,一般是确定但未知的,是待估计的。
统计量的标准化是统计推断的必要过程,是将具体的统计量转化为已知分布的统计量,转化以后就可以确定一定区间的概率。
4.统计误差、抽样误差、抽样标准误差与抽样边际误差统计误差是统计调查得到的值与客观实际值之间的差异。
包括抽样误差和非抽样误差。
非抽样误差又称工作误差或调查误差,是指调查登记过程中由于登记、过录、计算等原因引起的误差。
在全面调查和非全面调查中都有可能存在。
抽样误差也称为随机误差,是指在坚持了随机抽样的情况下,由于样本的随机性造成样本统计量与总体参数的差异。
样本是随机的,样本的统计量也是随机的,而总体参数是唯一的,因而抽样误差也是随机的。
第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。
因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。
根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。
当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。
后一种情况是小概率事件。
在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。
(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。
原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。
原假设和备择假设是相互对立的,检验结果二者必取其一。
接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。
② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。
在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。
③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。
假设检验就是应用了小概率事件实际不发生的原理。
这里的小概率就是指α。
但是要小到什么程度才算小概率? 对此并没有统一的标准。
通常取α=0.1,0.05,0.01。
给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。
关于区间估计的课程设计一、课程目标知识目标:1. 学生能够理解区间估计的基本概念,掌握其定义和性质。
2. 学生能够运用区间估计方法,对总体参数进行估计,并解释估计结果的含义。
3. 学生能够掌握区间估计的误差分析,了解影响区间估计精度的因素。
技能目标:1. 学生能够运用统计软件或计算器进行区间估计的计算。
2. 学生能够根据实际问题,选择合适的区间估计方法,并解决实际问题。
3. 学生能够通过实例分析,提高数据处理和分析能力。
情感态度价值观目标:1. 学生能够认识到统计学在实际生活中的广泛应用,增强学习统计学的兴趣。
2. 学生能够培养严谨的科学态度,注重数据分析的客观性和准确性。
3. 学生能够通过小组合作,培养团队协作能力和沟通表达能力。
课程性质分析:本课程为高中统计学课程,旨在帮助学生掌握区间估计的基本方法,提高数据处理和分析能力。
学生特点分析:高中学生具备一定的数学基础和逻辑思维能力,但对于统计学方法的应用还较为陌生,需要通过实例和实际操作来加深理解。
教学要求:1. 注重理论与实践相结合,让学生在实际问题中感受区间估计的应用价值。
2. 强调计算能力的培养,引导学生熟练使用统计软件或计算器进行计算。
3. 鼓励学生积极参与讨论和分享,提高课堂互动效果。
二、教学内容1. 区间估计基本概念:总体参数、样本统计量、估计量、置信区间。
2. 区间估计的原理与方法:中心极限定理、标准误差、正态分布的性质。
3. 置信区间的计算与应用:- 单个总体均值的区间估计。
- 单个总体比例的区间估计。
- 两个总体均值差的区间估计。
- 两个总体比例差的区间估计。
4. 影响区间估计精度的因素:样本容量、总体标准差、置信水平。
5. 实际问题中的应用:分析实际问题,选择合适的区间估计方法,解决实际问题。
教学大纲安排:第一课时:区间估计基本概念,总体参数与样本统计量。
第二课时:中心极限定理,标准误差,正态分布性质。
第三课时:单个总体均值和比例的区间估计。
第8章 非线性回归思考与练习参考答案8.1 在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。
如:(1) 乘性误差项,模型形式为e y AK L αβε=, (2) 加性误差项,模型形式为y AK L αβε=+对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。
一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。
8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。
表8.15生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%)5.26.56.88.110.2 10.3 13.0解:先画出散点图如下图:5000.004000.003000.002000.001000.00x12.0010.008.006.00y从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。
(1)二次曲线 SPSS 输出结果如下:Model Summ ary.981.962.942.651R R SquareAdjusted R SquareStd. E rror of the EstimateThe independent variable is x.ANOVA42.571221.28650.160.0011.6974.42444.2696Regression Residual TotalSum of Squares dfMean SquareF Sig.The independent variable is x.Coe fficients-.001.001-.449-.891.4234.47E -007.0001.4172.812.0485.843 1.3244.414.012x x ** 2(Constant)B Std. E rror Unstandardized Coefficients BetaStandardizedCoefficientstSig.从上表可以得到回归方程为:72ˆ 5.8430.087 4.4710yx x -=-+⨯ 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。
第7章 假设检验和区间估计7.1 内容框图7.2 基本要求(1) 理解假设检验的基本思想及两类错误的含义.(2) 掌握有关正态总体参数的假设检验的基本步骤和方法. (3) 理解单侧检验与双侧检验的异同.(4) 理解并掌握正态总体参数区间估计的的基本方法. (5) 了解总体分布的检验和独立性检验的基本方法.7.3 内容概要1)假设检验下面把各种情形列一个表:∈U 接受域0W ,接受0H∈U 拒绝域1W ,拒绝0H0H 为真,1H 不真 正确 犯第一类错误0H 不真,1H 为真犯第二类错误正确α值为显著水平。
然后,根据显著水平 α来确定临界值,用临界值来划分接受域 0W 假设检验 区间估计参数检验 分布的检验正态总体参数的检验独立性检验和拒绝域 1W 。
这样的检验,称为显著性检验。
假设检验的一般步骤是: (1)提出原假设 0H ;(2)选取合适的检验统计量 U ,从样本求出 U 的值;(3)对于给定的显著水平α,查 U 的分布表,求出临界值,用它划分接受域 0W 和拒绝域 1W ,使得当 0H 为真时,有 α=∈}{1W U P ;(4)若 U 的值落在拒绝域 1W 中,就拒绝 0H ,若 U 的值落在接受域 0W 中,就接受 0H 。
假设检验的理论依据是所谓的小概率事件原理,即一个概率很小的事件在一次试验中几乎是不可能发生的.要检验一个根据实际问题提出的原假设0H 是否成立,如果已知在0H 成立时,某个事件发生的可能性很小,而试验的结果却是这个事件发生了,那么根据小概率事件原理,我们就可以认为所提出的这个假设0H 是不成立的,即拒绝0H ;反之,则接受0H .这里的原假设0H 可以根据实际问题提出,事件是否发生可根据试验观测值判断,因此假设检验的关键问题就是要确定在0H 成立时,发生可能性很小的某个事件.我们知道,正态分布有个3σ原则,即ξ若服从正态分布,那么ξ的取值会大多集中在其均值附近,落入两侧的可能性很小.事实上,当ξ服从t 分布,2x 分布,F 分布时,其取值落入两侧的可能性也都相对很小.因此,我们要确定0H 成立时一个发生可能性很小的事件,只需根据样本构造出服从正态分布,t 分布,2x 分布或F 分布的随机变量(统计量)就可以了. 根据上述分析,正态总体参数的假设检验可概括为如下步骤。
第八章假设检验2009考试内容显著性检验假设检验的两类错误单个及两个正态总体的均值和方差的假设检验2009考试要求1.理解显著性检验基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误。
2.掌握单个及两个正态总体的均值和方差的假设检验。
一、假设检验与参数区间估计的关系1.1参数θ的置信度为1α-的区间估计,正好是显著性水平为α的假设检验的接受域。
1.2 区间估计中,假设总体中的参数是未知的,要用样本对它进行估计;而假设检验中,是先对参数做出假设,再用样本对假设作检验。
在某种意义上,假设检验是区间估计的逆问题。
1.3 具有完全相同的8大枢轴量(8大枢轴量详见第七章)。
二、假设检验的基本思想及两类错误与显著性检验比如,一个人说他射击是高手,我们将半信半疑。
怎样才能确定他的话真假,最好的办法就是先假设他是高手或低手,然后让他实际打几枪,根据他射击的结果来检验。
如果其射击结果命中率在90% 以上,我们就接受他的说法;如果命中率在50% 以下,我们就拒绝他的说法。
但我们的判断也可能犯错误,一是他的确是高手,但在这次射击中失误了,而我们却只根据他这一次的命中率没把他当高手,也就是说我们犯了以真当假的错误—称为第一类错误。
二是他本来是个低手,但这次命中率恰好超过了90% 以上,我们却把他当成了高手,实事上我们犯了以假当真的错误—称为第二类错误。
这两类错误,我们都尽可能使其概率最小,但实事上做不到,因为它们是此消彼长的关系,因此,我们首先要控制主要错误(又称显著性错误)的概率。
为了说明两类错误主次关系的直观含义,我们引用一个生活例子:某人因身体不适前往医院求医。
医生的职责就是通过各种生理检查,根据化验的数据作出该病员是否犯病的结论。
然而再好的医生都不可避免会犯下两类错误。
一种是病员确实有病,但由于生理指标未出现明显的异常现象,使医生判断为无病。
另一种是病员实际上没有疾病,但生理指标呈现某种异常,使医生判断为有病。
2.统计学复习笔记第七章参数估计解释估计量和估计值在参数佔汁中,用来估计总体参数的统计量称为估计量。
佔汁量也是随机变 量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本汁算出来的佔计量的数值称为齟值。
简述评价估计量好坏的标准(1) 无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2) 有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估 计ft ,有更小方差的佔计量更有效。
(3)-致性.是指随着样本量的增大,点佔计量的值越来越接近被估总体 的参数。
怎样理解置信区间在区间估计中,山样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是山区间和置信度两部分组成。
有些新闻媒体报道一些调查结果 只给出白分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数, 这是不负贵的表现。
因为降低置信度可以使置信区间变窄(显得〃精确”),有误 导读者之嫌。
在公布调査结果时给出被调査人数是负责任的表现。
这样则可以山 此推算出置信度(山后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置倍区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体 参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95% (的区间) 包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区 间以的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1.估计总体均值时样本fin 为 心呼!其中:EfJ样本量n 与置信水平1-a 、总体方差夕、佔计误差f 之间的关系为1. 2. 3. a 、与置信水平成正比,在其他条件不变的悄况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与佔汁误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
练习题从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40 1.的样本,样本均值为25。
区间估计的基本步骤
区间估计的基本步骤如下:
1、根据实际问题的具体要求,选定一个合适的统计量作为区间估计的基础,该统计量应该包含我们要估计的未知参数。
2、找到一个合适的置信水平,通常这个置信水平是根据问题的实际情况和对估计准确度的要求来确定的。
3、利用选定的统计量和样本数据,构造出未知参数的置信区间。
这个置信区间是一个范围,我们希望这个范围能够包含真实的未知参数值。
4、对置信区间进行解释和说明。
这包括说明置信区间的含义,比如我们有95%的信心认为真实的未知参数值落在这个范围内。
需要注意的是,置信区间的构造方法会根据不同的统计量和分布情况而有所不同。
因此,在具体实施区间估计时,需要根据实际情况选择合适的方法和技术。