第三讲 统计假设检验与参数估计
- 格式:ppt
- 大小:1.72 MB
- 文档页数:95
教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。
教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。
例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。
概率与统计的推断参数估计与假设检验概率与统计是应用广泛的数学分支,可用于数据分析、决策制定和科学研究等领域。
在概率与统计的推断中,参数估计和假设检验是两个重要的技术。
本文将对这两个主题进行介绍,并探讨其在实际应用中的意义和应用示例。
参数估计是利用样本数据来推断总体参数的值。
在统计学中,总体是指研究对象的整体集合,而样本则是总体的一个子集。
通过对样本数据进行分析,我们可以推断出总体参数的估计值,并计算信度水平的置信区间。
参数估计的目标是通过样本数据对总体参数进行估计,并给出与之相对应的估计误差。
常见的参数估计方法包括点估计和区间估计。
点估计是用一个具体的数值来估计总体参数的值。
例如,我们可以通过样本均值来估计总体均值,通过样本比例来估计总体比例。
点估计提供了一个单一的估计值,但它并未告诉我们该估计值的准确性。
为了解决这个问题,区间估计应运而生。
区间估计是对总体参数的估计提供一个置信区间,该区间表示参数估计值的范围。
置信区间是通过样本数据和置信水平来计算的。
置信水平是一个概率值,表示在多次抽样中,样本估计值包含总体参数的概率。
常见的置信水平为95%和99%。
置信区间提供了估计值的精度信息,使我们能够对总体参数进行更准确的推断。
举个例子来说明参数估计的应用。
假设我们想知道某城市成年人的平均身高。
为了进行估计,我们随机抽取了100个成年人进行测量,并计算出样本的平均身高为165厘米。
我们可以使用该平均值作为总体平均值的点估计。
接下来,我们可以计算出一个95%的置信区间,该区间为(162,168)厘米。
这意味着我们可以有95%的置信度说,总体平均身高在162厘米到168厘米之间。
假设检验是用于检验一个总体特征是否符合我们的假设。
在假设检验中,我们提出一个零假设和一个备择假设。
零假设通常是我们希望证伪的假设,而备择假设则是与之相对的假设。
通过对样本数据进行分析,我们计算出一个检验统计量,并将其与一个临界值进行比较,以确定是否拒绝零假设。
参数估计、假设检验及它们之间的关系(相同点、联系与区别)统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。
1.参数估计就是用样本统计量去估计总体的参数的真值,它的方法有点估计和区间估计两种。
点估计就是直接以样本统计量直接作为相应总体参数的估计值。
点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。
区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间是由样本统计量加减允许误差(极限误差)得到的。
在区间估计中,由样本统计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。
在其它条件相同的条件下,区间估计中置信度越高,置信区间越大。
置信水平为1-a, a(显著性水平)为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05, 0.1置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。
一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等(1)来自正态分布的样本均值,总体方差已知,不论抽取的是大样本还是小样本,均服从正态分布。
(2)总体不是正态分布,总体方差已知或未知,大样本的样本均值服从正态分布,小样本的不能进行参数估计。
(3)来自正态分布的样本均值,如果总体方差未知,原则上都按t 分布来处理(但在大样本的情况下,可近似按正态分布处理)。
2. 假设检验假是根据样本统计量来检验对总体参数的先验假设是否成立,是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。
假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。