茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解(假设检验)【圣才出品】
- 格式:pdf
- 大小:1.64 MB
- 文档页数:69
第6章 参数估计6.1 复习笔记一、点估计的概念与无偏性 1.点估计及无偏性(1)定义:设x 1,…,x n 是来自总体的一个样本,用于估计未知参数θ的统计量θ∧=θ∧(x 1,…,x n )称为θ的估计量,或称为θ的点估计,简称估计.(2)定义:设θ∧=θ∧(x 1,…,x n )是θ的一个估计,θ的参数空间为Θ,若对任意的θ∈Θ,有E θ(θ∧)=θ,则称θ∧是θ的无偏估计,否则称为有偏估计.注意:①当样本量趋于无穷时,有E (s n 2)→σ2,称s n 2为σ2的渐近无偏估计,这表明当样本量较大时,s n 2可近似看作σ2的无偏估计.②若对s n 2作如下修正:则s 2是总体方差的无偏估计.这个量常被采用.③无偏性不具有不变性.即若θ∧是θ的无偏估计,一般而言,其函数g (θ∧)不是g (θ)的无偏估计,除非g (θ)是θ的线性函数.④并不是所有的参数都存在无偏估计,当参数存在无偏估计时,我们称该参数是可估的,否则称它是不可估的.22211()11nn i i ns s x x n n ===---∑2.有效性定义:设θ∧1,θ∧2是θ的两个无偏估计,如果对任意的θ∈Θ有Var (θ∧1)≤Var (θ∧2),且至少有一个θ∈Θ使得上述不等号严格成立,则称θ∧1比θ∧2有效.二、矩估计及相合性 1.替换原理和矩法估计 替换原理指:(1)用样本矩去替换总体矩,这里的矩可以是原点矩也可以是中心矩. (2)用样本矩的函数去替换相应的总体矩的函数.2.概率函数已知时未知参数的矩估计设总体具有已知的概率函数p (x ;θ1,…,θk ),(θ1,…,θk )∈Θ是未知参数或参数向量,x 1,…,x n 是样本.假定总体的k 阶原点矩u k 存在,则对所有的j (0<j <k )u j 都存在,若假设θ1,…,θk 能够表示成u 1,…,u k 的函数θj =θj (u 1,…,u k ),则可给出θj 的矩估计:θ∧j =θj (a 1,…,a k ),j =1,…,k ,其中a 1,…,a k 是前k 阶样本原点矩进一步,如果我们要估计θ1,…,θk 的函数η=g (θ1,…,θ∧k ),则可直接得到η的矩估计η∧=g (θ∧1,…,θ∧k ).注:当k =1时,我们通常可以由样本均值出发对未知参数进行估计;如果k =2,我们可以由一阶、二阶原点矩(或二阶中心矩)出发估计未知参数.11n jj ii a x n ==∑3.相合性定义:设θ∈Θ为未知参数,θ∧n =θ∧n (x 1,…,x n )是θ的一个估计量,n 是样本容量,若对任何一个ε>0,有则称θ∧n 为参数θ的相合估计. 判断相合性的两个有用定理:(1)设θ∧n =θ∧n (x 1,…,x n )是θ的一个估计量,若则θ∧n 是θ的相合估计.(2)若θ∧n1,…,θ∧nk 分别是θ1,…,θk 的相合估计η=g (θ1,…,θk ),是θ1,…,θk 的连续函数,则η∧=g (θ∧n1,…,θ∧nk )是η的相合估计.三、最大似然估计与EM 算法 1.最大似然估计定义:设总体的概率函数为P (x ;θ),θ∈Θ,其中θ是一个未知参数或几个未知参数组成的参数向量,Θ是参数空间,x 1,…,x n 是来自该总体的样本,将样本的联合概率函数看成θ的函数,用L (θ;x 1,…,x n )表示,简记为L (θ),L (θ)=L (θ;x 1,…,x n )=p (x 1;θ)p (x 2;θ)…p (x n ;θ)ˆlim ()0n n P θθε→∞-≥=ˆlim ()nn E θθ→∞=ˆlim ()0nn Var θ→∞=L (θ)称为样本的似然函数.如果某统计量θ∧=θ∧(x 1,…,x n )满足则称θ∧是θ的最大似然估计,简记为MLE .注意:在做题时,习惯于由lnL (θ)出发寻找θ的最大似然估计,再求导,计算极值.但在有些场合用求导就没用,此时就需要从取值范围中的最大值和最小值来入手.2.EM 算法当分布中有多余参数或数据为截尾或缺失时,其MLE 的求取是比较困难的,这时候就可以采用EM 算法,其出发点是把求MLE 的算法分为两步:(1)求期望,以便把多余的部分去掉; (2)求极大值.3.渐近正态性最大似然估计有一个良好的性质:它通常具有渐近正态性.(1)定义:参数目的相合估计θ∧n 称为渐近正态,若存在趋于0的非负常数序列σn (θ),使得依分布收敛于标准正态分布.这时也称θ∧n 服从渐近正态分布N (θ,σn 2(θ)),记为θ∧n ~AN (θ,σn 2(θ)),σn 2(θ)称为θ∧n 的渐近方差.(2)定理:设总体x 有密度函数p (x ;θ),θ∈Θ,Θ为非退化区间,假定 ①对任意的x ,偏导数∂lnp/∂θ,对所有θ∈Θ都存在; ②∀θ∈Θ有|∂p/∂θ|<F 1(x ),|∂2p/∂θ2|<F 2(x ),|∂3lnp/∂θ3|<F 3(x )()()ˆmax L L θθθ∈Θ=()ˆn n θθσθ-其中函数F 1(x ),F 2(x ),F 3(x )满足③∀θ∈Θ,若x 1,x 2,…,x n 是来自该总体的样本,则存在未知参数θ的最大似然估计θ∧n =θ∧n (x 1,x 2,…,x n ),且θ∧n 具有相合性和渐近正态性,该定理表明最大似然估计通常是渐近正态的,且其渐近方差σn 2(θ)=(nI (θ))-1有一个统一的形式,其中,I (θ)称为费希尔信息量.四、最小方差无偏估计 1.均方误差(1)使用条件:小样本,有偏估计.(2)均方误差为:MSE (θ∧)=E (θ∧-θ)2,常用来评价点估计. 将均方误差进行如下分解:MSE (θ∧)=E[(θ∧-E θ∧)+(E θ∧-θ)]2=E (θ∧-E θ∧)2+(E θ∧-θ)2+2E[(θ∧-E θ∧)1()d F x x ∞-∞<∞⎰2()d F x x ∞-∞<∞⎰3sup ()(;)d F x p x x ∞-∞∈Θ<∞⎰θθ()()2ln 0;d p p x x ∞-∞∂⎛⎫<I =<∞ ⎪∂⎝⎭⎰θθθ1ˆ~(,)()nAN nI θθθ(E θ∧-θ)]=Var (θ∧)+(E θ∧-θ)2由分解式可以看出均方误差是由点估计的方差与偏差|E θ∧-θ|的平方两部分组成.如果θ∧是θ的无偏估计,则MSE (θ∧)=Var (θ∧).(3)一致最小均方误差设有样本x 1,…,x n ,对待估参数θ有一个估计类,如果对该估计类中另外任意一个θ的估计θ~,在参数空间Θ上都有MSE (θ∧)≤MSE (θ~),称θ∧(x 1,…,x n )是该估计类中θ的一致最小均方误差估计.2.一致最小方差无偏估计定义:设θ∧是θ的一个无偏估计,如果对另外任意一个θ的无偏估计θ~.在参数率间Θ上都有Var (θ∧)≤Var (θ~),则称θ∧是θ的一致最小方差无偏估计,简记为UMVUE .关于UMVUE ,有如下一个判断准则:设X =(x 1,…,x n )是来自某总体的一个样本,θ∧=θ∧(X )是θ的一个无偏估计,Var (θ∧)<∞,则θ∧是θ的UMVUE 的充要条件是:对任意一个满足E (φ(X ))=0和Var (φ(X ))<∞的φ(X )都有Cov θ(θ∧,φ)=0,∀θ∈Θ.这个定理表明UMVUE 的重要特征是:θ的最小方差无偏估计必与任一零的无偏估计不相关,反之亦然.3.充分性原则定理:总体概率函数是p (x ;θ),x 1,…,x n 是其样本,T =T (x 1,…,x n )是θ的充分统计量,则对θ的任一无偏估计θ∧=θ∧(x 1,…,x n );令ˆ()E T θθ=。
茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解第6章参数估计6.1复习笔记一、矩估计及相合性判断相合性的两个定理:(1)设ꞈθn =ꞈθn (x 1,…,x n )是θ的一个估计量,若ˆlim ()nn E θθ→∞=,ˆlim Var()0n n θ→∞=,则ꞈθn 是θ的相合估计。
(2)若ꞈθn1,…,ꞈθnk 分别是θ1,…,θk 的相合估计,η=g(θ1,…,θk ),是θ1,…,θk 的连续函数,则ꞈη=g(ꞈθn1,…,ꞈθnk )是η的相合估计。
二、最大似然估计(1)求样本似然函数;(2)求对数似然函数;(3)求导;(4)找到ꞈθ=ꞈθ(x 1,…,x n )满足()()ˆmax L L θθθ∈Θ=。
三、最小方差无偏估计1.均方误差(1)MSE(ꞈθ)=E(ꞈθ-θ)2,如果ꞈθ是θ的无偏估计,则MSE(ꞈθ)=Var(ꞈθ)。
(2)一致最小均方误差如果对该估计类中另外任意一个θ的估计~θ,在参数空间Θ上都有MSE (ꞈθ)≤MSE (~θ),称ꞈθ(x 1,…,x n )是该估计类中θ的一致最小均方误差估计。
2.一致最小方差无偏估计UMVUE 判断准则:设X=(x 1,…,x n )是来自某总体的一个样本,ꞈθ=ꞈθ(X)是θ的一个无偏估计,Var (ꞈθ)<∞,则ꞈθ是θ的UMVUE 的充要条件是:对任意一个满足E(φ(X))=0和Var(φ(X))<∞的φ(X)都有Cov θ(ꞈθ,φ)=0,∀θ∈Θ。
3.充分性原则定理:总体概率函数是p(x;θ),x 1,…,x n 是其样本,T=T(x 1,…,x n )是θ的充分统计量,则对θ的任一无偏估计ꞈθ=ꞈθ(x 1,…,x n );令~θ=E(ꞈθ|T),则ꞈθ也是θ的无偏估计,且Var(ꞈθ)≤Var(ꞈθ)。
4.Cramer-Rao 不等式(1)费希尔信息量I(θ)2()=ln (;)I E p x θθθ∂⎡⎤⎢⎥∂⎣⎦(2)定理(Cramer-Rao 不等式)设总体分布P(X;θ)满足费希尔信息里I(θ),x 1,x 2…,x n 是来自该总体的样本,T =T(x 1,x 2…,x n )是g(θ)的任一个无偏估计,g′(θ)∂g(θ)/∂θ存在,且对Θ中一切θ,对1i 11()...(,,)(;)d d nn ni g T x x p x x x θθ∞∞-∞-∞==∏⎰⎰ 的微商可在积分号下进行,即1111111()...(,...,)((;))d d ...(,,)ln(;)(;)d d nn i ni nnn i i ni i g T x x p x x x T x x p x p x x x θθθθθθ∞∞-∞-∞=∞∞-∞-∞==∂'=∂∂⎡⎤=⎢⎥∂⎣⎦∏⎰⎰∏∏⎰⎰ 对离散总体,则将上述积分改为求和符号后,等式仍然成立。
第一章 事件与概率1.写出下列随机试验的样本空间。
(1)记录一个班级一次概率统计考试的平均分数(设以百分制记分)。
(2)同时掷三颗骰子,记录三颗骰子点数之和。
(3)生产产品直到有10件正品为止,记录生产产品的总件数。
(4)对某工厂出厂的产品进行检查,合格的记上“正品”,不合格的记上“次品”,如连续查出2个次品就停止检查,或检查4个产品就停止检查,记录检查的结果。
(5)在单位正方形内任意取一点,记录它的坐标。
(6)实测某种型号灯泡的寿命。
解 (1)},100,,1,0{n i n i==Ω其中n 为班级人数。
(2)}18,,4,3{ =Ω。
(3)},11,10{ =Ω。
(4)=Ω{00,100,0100,0101,0110,1100,1010,1011,0111,1101,0111,1111},其中0表示次品,1表示正品。
(5)=Ω{(x,y)| 0<x<1,0<y<1}。
(6)=Ω{ t | t ≥ 0}。
2.设A ,B ,C 为三事件,用A ,B ,C 的运算关系表示下列各事件,。
(1)A 发生,B 与C 不发生。
(2)A 与B 都发生,而C 不发生。
(3)A ,B ,C 中至少有一个发生。
(4)A ,B ,C 都发生。
(5)A ,B ,C 都不发生。
(6)A ,B ,C 中不多于一个发生。
(7)A ,B ,C 至少有一个不发生。
(8)A ,B ,C 中至少有两个发生。
解 (1)C B A ,(2)C AB ,(3)C B A ++,(4)ABC ,(5)C B A ,(6)C B C A B A ++或C B A C B A C B A C B A +++,(7)C B A ++,(8)BC AC AB ++或ABC BC A C B A C AB ⋃⋃⋃ 3.指出下列命题中哪些成立,哪些不成立,并作图说明。
(1)B B A B A = (2)AB B A =(3)AB B A B =⊂则若, (4)若 A B B A ⊂⊂则,(5)C B A C B A = (6) 若Φ=AB 且A C ⊂, 则Φ=BC 解 : (1) 成立,因为B A B B B A B B A ==))((。
概率论与数理统计王松桂第三版课后答案【篇一:概率论与数理统计(第三版)课后答案习题1[1]】>1.写出下列随机试验的样本空间。
(1)记录一个班级一次概率统计考试的平均分数(设以百分制记分)。
(2)同时掷三颗骰子,记录三颗骰子点数之和。
(3)生产产品直到有10件正品为止,记录生产产品的总件数。
(4)对某工厂出厂的产品进行检查,合格的记上“正品”,不合格的记上“次品”,如连续查出2个次品就停止检查,或检查4个产品就停止检查,记录检查的结果。
(5)在单位正方形内任意取一点,记录它的坐标。
(6)实测某种型号灯泡的寿命,??{ini?0,1,?,100n},解(1)??{3,4,?,18} ??{10,11,?}。
其中n为班级人数(2)(3)(5)??{(x,y)? 0x1,0y1}。
(6)??{ t? t ? 0}。
2.设a,b,c为三事件,用a,b,c的运算关系表示下列各事件,。
(1)a发生,b与c不发生。
(2)a与b都发生,而c不发生。
(3)a,b,c中至少有一个发生。
(4)a,b,c都发生。
(5)a,b,c都不发生。
(6)a,b,c中不多于一个发生。
(7)a,b,c至少有一个不发生。
(8)a,b,c中至少有两个发生。
解(1)abc,(2)abc,(3)a?b?c,(4)abc,(5)abc,(6)ab?ac?bc或(7)a?b?c,(8)ab?ac?bc或abc?abc?abc?abc3.指出下列命题中哪些成立,哪些不成立,并作图说明。
(1)a?b?ab?b (2)ab?ab(3)若b?a,则b?ab (4)若 a?b,则b?a(5)a?bc?abc (6)若ab??且c?a,则bc??1解 : (1) 成立,因为ab?b?(a?b)(b?b)?a?b。
(2) 不成立,因为ab?a?b?ab。
(3) 成立,?b?a,?b?ab,又ab?b,?b?ab。
(4) 成立。
(5) 不成立,因左边包含事件c,右边不包含事件c,所以不成立。
第7章假设检验一、选择题1.在假设检验中,如果待检验的原假设为H0,那么犯第二类错误是指()。
A.H0成立,接受H0B.H0不成立,接受H0C.H0成立,拒绝H0D.H0不成立,拒绝H0【答案】B【解析】直接应用“犯第二类错误”=“取伪”=“H0不成立,接受H0的定义,B项正确。
2.关于总体X的统计假设H0属于简单假设的是()。
A.X服从正态分布,H0:EX=0B.X服从指数分布,H0:EX≥1C.X服从二项分布,H0:DX=5D.X服从泊松分布,H0:DX=3【答案】D【解析】A、B、C三项的假设都不能完全确定总体的分布,所以是复合假设,而D项的假设可以完全确定总体分布,因而是简单假设。
3.设X 1,X 2, …,X 16为正态总体X ~N (μ,4)的简单随机样本,设H 0:μ=0,H 1:μ≠0的拒绝域为{|X _|≥1/2},则犯第一类错误的概率为( )。
A .2Ф(1)-1B .2-2Ф(1)C .2-2Ф(1/2) D .2Ф(1/2)-1 【答案】B【解析】由题设可知,X —~N (μ,1/4)()0,1N ,当u =0时,2X —~N (0,1)。
犯第一类错误的概率为P{|X —|≥1/2|μ=0}=P{|2X —|≥1}=1-P{|2X —|<1}=1-P{-1<2X —<1}=1-Ф(1)+Ф(-1)=2-2Ф(1),故选B 。
二、填空题1.设X 1,X 2,…,X n 是来自正态总体N (μ,σ2)的简单随机样本,其中参数σ2未知,1ni i X X ==∑,2211()ni i Q X μ==-∑,2221()nii Q X X ==-∑,对假设H 0:σ2=σ02,在μ已知时用χ2检验统计量为______;在μ未知时使用χ2检验统计量为______。
【答案】22122200Q Q σσ;【解析】这是一个关于正态总体方差σ2的假设检验问题。
在μ已知时选用χ2检验统计量为()()222221122100ni ni i i X X Q n μμχχσσσ==-⎛⎫-===⎪⎝⎭∑∑~在μ未知时选用χ2检验统计量为()()22222122210001ni ni i i X X X X Q n χχσσσ==-⎛⎫-===- ⎪⎝⎭∑∑~2.假设X 1,X 2,…,X 36是取自正态总体 N (μ,0.04)的简单随机样本,其中μ为未知参数。
茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解
第7章
假设检验
7.1复习笔记
一、假设检验的基本思想与概念1.假设检验的基本步骤(1)建立假设;
(2)选择检验统计量,给出拒绝域形式;(3)选择显著性水平:
第一类错误:弃真,α=p θ{(X∈W)},θ∈Θ0;第二类错误:取伪,1{(p X W θβθ=∈∈Θ,。
(4)给出拒绝域;(5)做出判断。
2.检验的p 值
①如果α≥p,则在显著性水平α下拒绝H 0;②如果α<p,则在显著性水平α下接受H 0。
二、正态总体参数假设检验成对数据检验
(1)提出假设:H 0:μ=0vs H 1:μ≠0;
(2)双样本的检验问题转化为单样本t 检验问题,检验t 统计量
2()
d
t d s n =其中
1/2
21111()1n
n
i d i i i d d s d d n n ==⎛⎫=
=- ⎪-⎝⎭
∑∑,(3)拒绝域:W 1={|t 2|≥t 1-α/2(n-1)}。
三、其他分布参数的假设检验
1.指数分布参数的假设检验(见表7-1-1)
表7-1-1
指数分布参数的假设检验
2.比率p 的检验(见表7-1-2)
表7-1-2比率p 的检验
四、似然比检验与分布拟合检验1.似然比检验的思想假设的似然比
111sup ()
()sup ()
n n n p x x x x p x x θθθθ∈Θ
∈ΘΛ=
,,;,,,,;K K K 2.分类数据的χ2拟合优度检验
定理:在实际观测数与期望观测数相差不大的假定下,在H 0成立时,对统计量
2
2
01
0()r
i i i i n np np χ=-=∑
有2
2
(1)L
r χχ−−
→-。
根据定理,采取显著性水平为α的显著性检验:检验统计量为:
2
2
01
0()r
i i i i n np np χ=-=∑
,拒绝域为22
1{(1)}W r αχχ-=≥-。
五、正态性检验1.W 检验W 统计量
()()2
12
2
1
1
()(()i i i i n
i n
n i i a a x x W a a x x ===⎡⎤∑--⎢⎥⎣⎦=∑-∑-拒绝域{W≤W a }。
2.EP 检验
EP 检验统计量定义为
22122
211()2()1exp 2exp 243n i n j i i EP
i j i x x x x T n s s -===⎧⎫--⎧⎫--⎪⎪
=++∑∑-∑⎨⎬⎨⎬⎪⎪⎩⎭⎩⎭
其拒绝域为{T EP ≥T 1-α,EP(n)}。
六、秩和检验
R=(R 1,…,R n )(R i 是x i 的秩)符号秩和统计量1
(0)n
i i i W
R I x +
==∑>拒绝域为{W +≤W a/2+(n)}∪{W +≥W 1-a/2
+
(n)}。
7.2课后习题详解
习题7.1
1.设x 1,…,x n 是来自N(μ,1)的样本,考虑如下假设检验问题
H 0:μ=2vs H 1:μ=3
若检验由拒绝域为{ 2.6}W x =≥确定。
(1)当n=20时求检验犯两类错误的概率;
(2)如果要使得检验犯第二类错误的概率β≤0.01,n 最小应取多少?(3)证明:当n→∞时,α→0,β→0。
解:(1)由第一类错误定义,且在H 0:μ=2成立下,1220x N ⎛
⎫ ⎪⎝
⎭
,,故犯第一类错误的概率为
0( 2.6|)
2
2.621/20
1/201(2.68)0.0037
P x H x P =≥==-Φ=α由第二类错误定义,且在H 1成立下。
1320x N ⎛⎫ ⎪⎝
⎭
,,故犯第二类错误的概率为
1( 2.6|)1/20
1/20(1.79)1(1.79)0.0367
x P x H P β=<=<=Φ-=-Φ=(2)由第二类错误定义,若使犯第二类错误的概率β≤0.01,即满足
1( 2.6|)0.01
1/1/x P x H P n
n β⎛=<=<≤ ⎝即0.410.011/n -Φ≤,
或(0.40.99n Φ≥,查表得: 2.33n ≥,故n≥33.93,因而n 最小应取34,才能使检验犯第二类错误的概率β≤0.01。
(3)在样本量为n 时,根据定义,检验犯第一类错误的概率为
0( 2.6|)
2 2.621/1/1(0.6)
P x H x P n n n α===-Φ≥当n→∞时。
1n Φ→,即α→0。
检验犯第二类错误的概率为
1( 2.6|)
1/1/=(0.41(0.4P x H x P n n n n β=<⎫
=<⎪
⎭Φ-=-Φ当n→∞时,1n Φ→,即β→0。
注:从这个例子可以看出,一般情况下人们不应要求α与β同时很小。
这是因为要使得α与β同时很小,必须样本量n 很大。
这一结论在一般场合仍成立,由于样本量n 很大在实际中常常是不可行的。
2.设x 1,…,x 10是来自0-1总体b (1,p)的样本,考虑如下检验问题H 0:p=2vs H 1:p=0.4,取拒绝域为{}W x =≥0.5,求该检验犯两类错误的概率。
解:因为总体服从二点分布b(1,p),则()1010x b p ,,由第一类错误定义,且在H 0:p=2成立下,故犯第一类错误的概率为
001010
5(0.5|)(105|)
10140.0328
55k
k
k P x H P x H k α-===⎛⎫⎛⎫⎛⎫
== ⎪⎪ ⎪⎝⎭⎝⎭
⎝⎭∑≥≥由第二类错误定义,且在H 1:p=0成立下,故犯第二类错误的概率为。