北京化工大学数理统计---两类错误 势函数30页PPT
- 格式:ppt
- 大小:2.51 MB
- 文档页数:30
参考试题一、填空题1.设总体212~(,),,,...,n X N X X X μσ为样本,样本均值及样本方差分别为,221111,()n n i i i i X X S X X n n ====-∑∑,设112,,...n n X X X X +与独立同分布,则统计量~Y =t(n-1) 。
2.设2~(),~T t n T 则 F(1,n) 。
3.设总体X 的均值为μ,12,,...,n X X X 为样本,当a =:μ 时,E 21()ni i X a =-∑达到最小值。
4. 设总体212~(,),,,...,n X N X X X μσ为样本,1||,()ni i D X E D μ==-=∑则 :σπ2n5.设总体X 的均值和方差分别为a , b , 样本均值及样本方差分别为221111,()n n i i i i X X S X X n n ====-∑∑,则 E (S 2 )=:1n b n -。
6. 设总体X 服从参数为λ的泊松分布,1.9,2,2,2.1, 2.5为样本,则λ的矩估计值为ˆλ= 2.1 。
7. 设总体212~(,),,,...,n X N X X X μσ为样本,12211ˆ()n i i i c X X σ-+==-∑,若2ˆσ为2σ的无偏估计,则 c =)1(21-n 8. 设总体12~(,1),,,...,n X U X X X θθ+为样本,则θ的矩估计量为:___12X -,极大似然估计量为:max(1),min()i i x x -。
9. 设总体212~(,),,,...,n X N X X X μσ为样本,μ未知,σ2 已知,为使μ的置信度为1-α的置信区间长度不超过L ,则需抽取的样本的容量n 至少为:222124U L αδ-。
10. 设总体212~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的置信区间为,)1()1([22/2--n X S n α])1()1(22/12---n X S n α 。
第七章 假设检验统计推断的另一类重要问题是假设检验. 在总体分布未知或虽知其类型但含有未知参数的时候, 为推断总体的某些未知特性, 提出某些关于总体的假设. 我们要根据样本所提供的信息以及运用适当的统计量, 对提出的假设作出接受或拒绝的决策, 假设检验是作出这一决策的过程.⎩⎨⎧非参数假设检验参数假设检验假设检验 参数假设检验针对总体分布函数中的未知参数提出的假设进行检验, 后者针对总体分布函数形式或类型的假设进行检验, 本章主要讨论单参数假设检验问题.第一节 假设检验的基本概念内容分布图示★ 引言 ★ 引例 ★ 假设检验的基本思想★ 假设检验的两类错误 ★ 假设检验问题的提法★ 假设检验的一般步骤★ 例1 ★ 例2★ 多参数与非参数假设检验问题 ★ 内容小结 ★习题7-1 ★ 返回内容要点:一、引例设一箱中有红白两种颜色的球共100个, 甲说这里有98个白球, 乙从箱中任取一个, 发现是红球, 问甲的说法是否正确?二、假设检验的基本思想假设检验的基本思想实质上是带有某种概率性质的反证法. 为了检验一个假设0H 是否正确, 首先假定该假设0H 正确, 然后根据样本对假设0H 作出接受或拒绝的决策. 如果样本观察值导致了不合理的现象的发生, 就应拒绝假设0H , 否则应接受假设0H .假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则, 即小概率事件在一次试验中是几乎不发生的. 但概率小到什么程度才能算作“小概率事件”, 显然, “小概率事件”的概率越小,否定原假设0H 就越有说服力. 常记这个概率值为)10(<<αα,称为检验的显著性水平. 对不同的问题, 检验的显著性水平α不一定相同, 但一般应取为较小的值, 如0.1,0.05或0.01等.三、假设检验的两类错误当假设0H 正确时, 小概率事件也有可能发生, 此时我们会拒绝假设0H , 因而犯了“弃真”的错误, 称此为第一类错误. 犯第一类错误的概率恰好就是“小概率事件”发生的概率α, 即P {拒绝0H |0H 为真}=α. 反之, 若假设0H 不正确, 但一次抽样检验结果, 未发生不合理结果, 这时我们会接受0H , 因而犯了“取伪”的错误,称此为第二类错误. 记β为犯第二类错误的概率, 即P {接受0H |0H 不真}=β.理论上, 自然希望犯这两类错误的概率都很小。
深入理解假设检验的两类错误和功效假设包含原假设Null Hypothesis和备择假设Alternative Hypothesis,原假设也称为零假设,记为H0 H_0H0,备择假设也称为对立假设,记为Ha H_aHa或H1 H_1H1。
原假设和备择假设相互对立,没有交集。
进行假设检验时,由于数据的随机性,所作出的决策可能会有:第 I 类错误(拒真):H0 H_0H0为真时错误地拒绝了零假设。
犯第I II 类错误的最大概率记为α \alphaα。
第 II 类错误(受伪):H0 H_0H0为假时错误地没有拒绝零假设。
犯第 II IIII 类错误的最大概率记为β \betaβ。
H0H_0H0Do not reject H0 H_0H0 Reject H0 H_0H0TRUE Correct Decision1−α1-\alpha1−α: Confidencelevel 置信水平Type I II errorα \alphaα: significance level显著性水平FALSE Type II IIII errorβ \betaβCorrect Decision1−β 1- \beta1−β: Power 功效假设检验的功效(Power)定义如下:1−β=P(reject H0 when Ha is true) 1-\beta=P(reject\ H_0 \ when \ H_a \ is \ true)1−β=P(reject H0 when Ha is true) 下图表明了α \alphaα, β \betaβ和power之间的关系:H0:μ=μ0Ha:μ≠μ0 H_0: \mu=\mu_0\\H_a: \mu\ne\mu_0H0 :μ=μ0Ha:μ=μ0重叠在一起看:在实际运用中,假设检验作出的结论,不同的利益攸关方可能关注的风险点不一样。
比如,一家药企临床试验的药物,进行假设检验:H0:该药无疗效;H1:该药有疗效H_0: 该药无疗效; H_1:该药有疗效H0:该药无疗效;H1:该药有疗效监管机构关注的是H0 H_0H0为真时(药无疗效),被误判为有效的概率,即α \alphaα,导致无疗效的药物上市销售贻害百姓。
第六章数理统计的基本概念一、基本教学要求与主要内容(一)教学要求1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。
2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。
3.掌握正态总体的某些常用统计量的分布。
4.了解最大次序统计量和最小次序统计量的分布。
本章重点:统计量的概念及其分布。
(二)主要内容1.总体、个体我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。
在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。
设x为总体的某个数值指标,常称这个总体为总体X。
X的分布函数称为总体分布函数。
当X为离散型随机变量时,称X的概率函数为总体概率函数。
当X为连续型随机变量时,称X的密度函数为总体密度函数。
当X服从正态分布时,称总体X为正态总体。
正态总体有以下三种类型:(1)未知,但已知;(2)未知,但已知;(3)和均未知。
2.简单随机样本数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。
要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。
由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。
n称为样本容量。
()称为样本观测值。
如果样本()满足(1)相互独立;(2) 服从相同的分布,即总体分布;则称()为简单随机样本。
简称样本。
设总体X的概率函数(密度函数)为,则样本()的联合概率函数(联合密度函数为)3. 统计量完全由样本确定的量,是样本的函数。
即:设是来自总体X的一个样本,是一个n元函数,如果中不含任何总体的未知参数,则称为一个统计量,经过抽样后得到一组样本观测值,则称为统计量观测值或统计量值。
4. 常用统计量(1)样本均值:(2)样本方差:(3)样本标准差:它们的观察值分别为:这些观察值仍分别称为样本均值、样本方差和样本标准差。