数理统计总结
- 格式:doc
- 大小:1013.00 KB
- 文档页数:9
概率论与数论统计第一部分 概率论※随机事件的运算定律交换律:A ∪B=B ∪A A ∩B=B ∩A结合律:A ∪(B ∪C)=(A ∪B)∪C A ∩(B ∩C)=(A ∩B)∩C分配率:A ∩(B ∪C)=(A ∩B)∪(A ∪C) A ∪(B ∩C)=(A ∩B)∪(A ∩C)对偶律:A ∪B=A ∩B A ∩B=A ∩B鄙人之愚见:如果碰到那种很难从正面理解的事件,试着从对立面翻译。
※条件概率与概率公式1. 条件概率公式:P (A |B )=P(AB)P(B)2. 乘法公式:P (A B C D …)=P (A )P (B |A )P (C |AB )P (D |ABC )3. 全概率公式:P (A )=∑P (B i )P(A|B i )∞i=14. 贝叶斯公式:P (B i |A )=P (B i )P(A|B i )∑P(A |B j )P(B j )∞i=1鄙人之愚见:除了第一个以外,其他的都太抽象,强烈建议不要去记他们,而是去做题,不然小心思维混乱。
我现在压根不明白他们是什么意思,但是如果做题的话就会无意中用到。
※离散型随机变量的常见分布1. 两点分布与二项分布X~B(n,p)2. 泊松分布若X~B(n,p),当n →∞,X~P(λ),λ=npP(λ)=λk e −λk!※连续型随机变量及其常见分布1. 概率密度函数是分布函数的导数,分布函数是概率密度函数的可变上限定积分。
2. 零概率事件并不都是不可能事件,几乎必然发生的事件也并不都是必然事件。
3.分布函数的定义域一定是从-∞→∞,值域一定是从0→1,右连续[P(X)=P(X+0)],且单调不减,自己做题要注意。
4.分布函数不仅仅只有离散型和连续型两种。
5.均匀分布:概率密度函数满足f (x )={1b−a (a ≤x ≤b )0 (其他)X~U(a,b)6. 指数分布:概率密度函数满足f(x){λe −λ(x ≥0)0(x <0)X~E(λ) λ>0 7. 正态分布:X~ N(μ,ϭ2)正态分布函数的标准化:一般的正态分布N(μ,ϭ2)的分布函数F(x)与标准正态分布N(0,1)的分布函数ϕ(x)之间有如下关系:F(x)=ϕ(x−μϭ)3ϭ原则:0.6826 0.9574 0.99738.对于一般的连续型随机变量,有如下定理设X 为连续型随机变量,f x (x )为X 的概率密度,若y=g(x)为严格单调的连续函数,且反函数x=h(y)有连续导数,则Y=g(x)为连续型随机变量,且概率密度为 f x (y)=f x [(h(y) ) * |h`(y)|]若g(x)分段严格单调,对应反函数h i (y) 则有f x (y)=∑f x i [(h i (y) ) * |h i `(y)|]※二维随机变量的联合分布与边缘分布1.二维随机变量的分布函数和概率密度函数依然拥有一维随机变量的那些性质,只是更麻烦些。
2024年学习概率与数理统计总结一、引言2024年,我在大学学习了概率与数理统计这门课程。
这是一门基础的数学课程,旨在帮助学生理解和应用概率和统计的原理和方法。
在学习过程中,我深入学习了概率和统计的基本概念、模型和技巧,并通过实例分析和数学推导等方法,全面掌握了概率与数理统计的基本理论和方法。
本文旨在对我在2024年学习概率与数理统计的学习过程和收获进行总结。
二、概率与数理统计的基本概念在学习概率与数理统计的过程中,我首先了解了概率与数理统计的基本概念。
概率是研究随机现象规律的一门数学学科,它描述了事件发生的可能性大小。
数理统计是研究从具体数据去推断总体特征的方法和理论。
概率与数理统计是密切相关的,概率的理论和方法是数理统计的基础。
三、概率的基本概念和性质学习概率的基本概念和性质是概率与数理统计的重要基础。
我通过学习,掌握了概率的基本概念如样本空间、随机事件、事件的概率等,以及概率的基本性质如非负性、规范性和可列可加性等。
在学习过程中,我还学习了概率的计算方法,包括古典概型、切比雪夫不等式、贝叶斯公式等。
四、随机变量及其分布随机变量是概率与数理统计中的重要概念,它是定义在样本空间上的实值函数。
学习随机变量及其分布的过程中,我深入了解了离散型随机变量和连续型随机变量的定义、分布律和分布函数,并学习了常见的离散型分布如伯努利分布、二项分布和泊松分布,以及连续型分布如均匀分布、指数分布和正态分布。
五、多维随机变量及其分布多维随机变量是概率与数理统计中的重要概念,它扩展了一维随机变量的概念。
学习多维随机变量及其分布的过程中,我了解了二维随机变量的联合分布、边缘分布和条件分布,并学习了多维随机变量的独立性和相关性。
此外,我还学习了常见的二维随机变量的分布如二维正态分布和二项分布等。
六、大数定律与中心极限定理大数定律和中心极限定理是概率与数理统计的核心内容,它们描述了大样本情况下随机变量的行为。
学习大数定律和中心极限定理的过程中,我了解了大数定律的弱收敛和强收敛的概念和数学表达,并学习了切比雪夫大数定律和伯努利大数定律等。
2024年学习概率与数理统计总结概率与数理统计是一门应用广泛且重要的学科,对于各个领域的研究和应用起着至关重要的作用。
在2024年的学习中,我对概率与数理统计有了更深入的了解和理解,下面是我对于2024年学习概率与数理统计的总结。
一、基础知识的学习在学习概率与数理统计的过程中,我首先系统地学习了该学科的基础知识。
我通过课堂上的讲解和自主学习,掌握了概率论的基本概念、条件概率与独立性、随机变量与分布函数、多维随机变量及其分布等内容,为后续的学习打下了坚实的基础。
二、概率模型与统计推断在学习概率与数理统计的过程中,我深入学习了概率模型与统计推断的理论知识。
我了解了概率模型的构建和参数估计方法,掌握了点估计和区间估计的原理和方法。
在学习统计推断时,我进一步了解了假设检验的原理和应用,以及常见的检验方法,如t检验、卡方检验等。
通过学习这些内容,我能够利用概率模型和统计推断对实际问题进行建模和分析。
三、案例分析与实践应用在学习概率与数理统计的过程中,我也参与了一些案例分析和实践应用的实践活动。
通过实际操作和应用概率与数理统计的方法,我深入了解了理论知识在实际问题中的应用。
例如,我们进行了一次市场调研,并利用统计方法对收集到的数据进行了分析和解读。
这次实践活动不仅加深了我对概率与数理统计的理解,还提高了我解决实际问题的能力。
四、思维的培养和拓展在学习概率与数理统计的过程中,我也注重培养和拓展思维能力。
概率与数理统计是一门需要逻辑思维和创造性思维相结合的学科,因此培养这些思维能力对于学习和应用概率与数理统计至关重要。
我在学习过程中注重培养自己的逻辑思维能力,通过练习题和解题过程,提高了自己的问题分析和解决能力;同时,我也注重拓展自己的创造性思维能力,通过参与一些实践活动和自主学习,提高了自己的创新能力和解决实际问题的能力。
总之,在2024年的学习中,概率与数理统计是我非常重要的一门学科。
通过对基础知识的学习、概率模型与统计推断的掌握、案例分析与实践应用的实践活动以及思维能力的培养和拓展,我对概率与数理统计有了更深入的了解和理解。
《概率论与数理统计》第一章概率论的基本概念§2.样本空间、随机事件1.事件间的关系 A B 则称事件 B 包含事件 A ,指事件 A 发生必然导致事件 B 发生A B {x x A或x B} 称为事件 A 与事件 B 的和事件,指当且仅当 A ,B 中至少有一个发生时,事件 A B 发生A B {x x A且x B} 称为事件 A 与事件 B 的积事件,指当A,B 同时发生时,事件A B 发生A—B {x x A且x B} 称为事件A 与事件 B 的差事件,指当且仅当 A 发生、B 不发生时,事件 A — B 发生A B ,则称事件 A 与B 是互不相容的,或互斥的,指事件 A 与事件 B 不能同时发生,基本事件是两两互不相容的A B S A B ,则称事件 A 与事件 B 互为逆事件,又称事件 A 与事件 B 互为且对立事件2.运算规则交换律 A B B A A B B A结合律(A B) C A (B C) ( A B)C A(B C)分配律 A (B C)(A B) ( A C)A (B C)(A B)( A C)—徳摩根律 A B A B A B A B§3.频率与概率定义在相同的条件下,进行了n 次试验,在这n 次试验中,事件 A 发生的次数n称为事件AA 发生的频数,比值n nA 称为事件 A 发生的频率概率:设E是随机试验,S 是它的样本空间,对于E 的每一事件A赋予一个实数,记为P(A),称为事件的概率1.概率P( A)满足下列条件:(1)非负性:对于每一个事件 A 0 P( A) 1(2)规范性:对于必然事件S P (S) 11(3)可列可加性:设A1, A2 , ,A是两两互不相容的事件,有nn nP A k ) P( A) ( (n可kk 1 k 1以取)2.概率的一些重要性质:(i )P( ) 0(ii )若A1, A2 , ,A是两两互不相容的事件,则有n Pn n( (n可以取)A k ) P( A )kk 1 k 1(iii )设A,B 是两个事件若 A B ,则P(B A) P( B) P( A) ,P( B) P(A) (iv)对于任意事件A,P(A) 1(v)P( A) 1 P(A) (逆事件的概率)(vi)对于任意事件A,B 有P(A B) P( A) P( B) P( A B)§4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同若事件 A 包含k 个基本事件,即{e i } {e } {e }A ,里1 i i k] 2,k是,中某个不同的数,则有i1 i 2, ,i k 1,2 nP( A)j k1P { eij}knA包含的基本事件数S中基本事件的总数§5.条件概率(1)定义:设A,B 是两个事件,且P( A) 0 ,称P( A B)P(B | A) 为事件 A 发生的条P(A)件下事件 B 发生的条件概率(2)条件概率符合概率定义中的三个条件。
概率论与数理统计知识点总结概率论与数理统计是数学的一个重要分支,主要研究各种随机现象的规律性及其数值描述。
下面将对概率论与数理统计的一些重要知识点进行总结。
一、概率论知识点总结1. 随机事件与概率- 随机事件:指在一定条件下具有不确定性的事件。
- 概率:用来描述随机事件发生的可能性大小的数值。
2. 古典概型与几何概型- 古典概型:指随机试验中,所有基本事件的可能性相等的情况。
- 几何概型:指随机试验中,基本事件的可能性不完全相等,与图形的属性有关的情况。
3. 随机变量与概率分布- 随机变量:定义在样本空间上的函数,用来描述试验结果与数值之间的对应关系。
- 离散随机变量:取有限个或可列个数值的随机变量。
- 连续随机变量:取无限个数值的随机变量。
4. 期望与方差- 期望:反映随机变量平均取值的数值。
- 方差:反映随机变量取值偏离期望值的程度。
5. 大数定律与中心极限定理- 大数定律:指在独立重复试验中,随着试验次数增加,事件发生的频率趋近于其概率。
- 中心极限定理:指在独立随机变量之和的情况下,当随机变量数目趋于无穷时,这些随机变量之和的分布趋近于正态分布。
二、数理统计知识点总结1. 抽样与抽样分布- 抽样:指对总体进行有规则地选择一部分样本进行观察和研究的过程。
- 抽样分布:指用统计量对不同样本进行计算所得到的分布。
2. 参数估计与置信区间- 参数估计:根据样本推断总体的未知参数。
- 置信区间:对于总体参数估计的一个区间估计,用来表示这个参数的可能取值范围。
3. 假设检验与统计显著性- 假设检验:用来判断统计推断是否与已知事实相符。
- 统计显著性:基于样本数据,对总体或总体参数进行判断的一种方法。
4. 方差分析与回归分析- 方差分析:用来研究因素对于某一变量均值的影响程度。
- 回归分析:通过观察变量之间的关系,建立数学模型来描述两个或多个变量间的依赖关系。
5. 交叉表与卡方检验- 交叉表:将两个或多个变量的数据按照某种方式交叉排列而形成的表格。
概率论与数理统计总结3、分布函数与概率的关系 ∞<<∞-≤=x x X P x F ),()()()()()()(a F b F a X P b X P b X a P -=≤-≤=≤<4、离散型随机变量的分布函数 (1) 0 – 1 分布 1,0,)1()(1=-==-k p p k X P kk(2) 二项分布 ),(p n B nk p p C k X P k n k k n,,1,0,)1()( =-==- 泊松定理 0lim >=∞→λnn np有,2,1,0!)1(lim ==---∞→k k ep p Ckkn n knk nn λλ(3) 泊松分布 )(λP =,2,1,0,!)(===-k k ek X P kλλ(5)几何分布 p q k p q k X P k -====-1,2,1}{1dt t f x F x ⎰∞-=)()(则称X 为连续型随机变量,其中函数f(x)称为随机变量X 的概率密度函数, 2、分布函数的性质:(1)连续型随机变量的分布函数F(x )是连续函数。
(2)对于连续型随机变量X 来说,它取任一指定实数a 的概率均为零,即P{X=a }=0。
3、常见随机变量的分布函数 (1) 均匀分布 ),(b a U⎪⎩⎪⎨⎧<<-=其他,0,1)(b x a ab x f⎪⎪⎩⎪⎪⎨⎧--=1,,0)(a b a x x F(2) 指数分布 )(λE⎪⎩⎪⎨⎧>=-其他,00,)(x e x f x λλ ⎩⎨⎧≥-<=-0,10,0)(x ex x F xλ (3) 正态分布 N (μ , σ 2 )+∞<<∞-=--x ex f x 222)(21)(σμσπ⎰∞---=xt tex F d 21)(222)(σμσπN (0,1) — 标准正态分布+∞<<∞-=-x ex x 2221)(πϕ+∞<<∞-=Φ⎰∞--x t e x xt d 21)(22π2、连续型随机变量函数的分布: (1)分布函数法;(){}⎰⎰<==∈=yx g X l X yYdxx f dx x f l X P y F y)()()((2)设随机变量X 具有概率密度f X (x ),又设函数g(x )处处可导且恒有g '(x )>0 (或恒有g '(x )<0) ,则Y=g(X )的概率密度为()()[]()⎩⎨⎧<<'=其他βαy y h y h f y f XY 其中x =h(y )为y =g(x )的反函数,()()()()()()∞+∞-=∞+∞-=g g g g ,m ax ,,m in βα 3、 二维连续型随机变量(1)联合分布函数为dudvv u f y x F y x ⎰⎰∞-∞-=),(),(函数f (x ,y )称为二维向量(X ,Y )的(联合)概率密度.其中: 0),(≥y x f ,⎰⎰∞∞-∞∞-=1),(dxdy y x f(2)基本二维连续型随机向量分布均匀分布:⎪⎩⎪⎨⎧∈=其他),(1),(G y x Ay x f二维正态分布:+∞<<-∞+∞<<∞--=-+------y x ey x f y y x x ,121),(])())((2)([)1(212212222212121212σμσσμμρσμρρσπσ3、离散型边缘分布律:4、 连续型边缘概率密度 ,),()(dy y x f x f X⎰∞+∞-= dx y x f y f Y⎰∞+∞-=),()(F (x ,y )=F x (x )F Y (y ) 则称随机变量X 和Y 是相互独立的3、连续型随机变量独立的等价条件 设(X ,Y )是连续型随机变量,f (x ,y ),f x (x ),f Y (y )分别为(X ,Y )的概率密度和边缘概率密度,则X 和Y 相互独立的充要条件是等式 f (x ,y ) = f x (x )f Y (y ) 对f (x ,y ),f x (x ),f Y (y )的所有连续点成立. 五、条件分布1、离散型随机变量的条件分布律: (3)条件分布函数:2、连续型随机变量的条件分布 (1)条件分布函数⎰⎰∞-∞-==x Y Y X Y x YX du y f y u f y x F y f du y u f y x F )(),()|()(),()|(||或写成,(2)条件概率密度在Y=y 条件下X 的条件概率密度)(),()|(|y f y x f y x fY Y X =同理 X=x 条件下X 的条件概率密度)(),()|(|x f y x f x y f X X Y =六、多维随机函数的分布 1、离散型随机变量函数分布:二项分布:设X 和Y 独立,分别服从二项分布b (n 1,p ), 和b (n 2,p ),则 Z=X+Y 的分布律:Z ~b (n 1+n 2,p ).泊松分布:若X 和Y 相互独立,它们分别服从参数为21,λλ的泊松分布,则Z=X+Y 服从参数为21λλ+的泊松分布。
第一章随机事件与概率第一节随机事件及其运算1、随机现象:在一定条件下,并不总是出现相同结果的现象2、样本空间:随机现象的一切可能基本结果组成的集合,记为Ω={ω},其中ω表示基本结果,又称为样本点。
3、随机事件:随机现象的某些样本点组成的集合常用大写字母A、B、C等表示,Ω表示必然事件,∅表示不可能事件.4、随机变量:用来表示随机现象结果的变量,常用大写字母X、Y、Z等表示。
5、时间的表示有多种:(1)用集合表示,这是最基本形式(2)用准确的语言表示(3)用等号或不等号把随机变量于某些实属联结起来表示6、事件的关系(1)包含关系:如果属于A的样本点必属于事件B,即事件 A 发生必然导致事件B发生,则称A被包含于B,记为A⊂B;(2)相等关系:若A⊂B且B⊃A,则称事件A与事件B相等,记为A=B。
(3)互不相容:如果A∩B=∅,即A与B不能同时发生,则称A与B互不相容7、事件运算(1)事件A与B的并:事件A与事件B至少有一个发生,记为 A∪B。
(2)事件A与B的交:事件A与事件B同时发生,记为A∩ B或AB。
(3)事件A对B的差:事件A发生而事件B不发生,记为 A-B。
用交并补可以表示为。
(4)对立事件:事件A的对立事件(逆事件),即“A不发生”,记为.对立事件的性质:。
8、事件运算性质:设A,B,C为事件,则有(1)交换律:A∪B=B∪A,AB=BA(2)结合律:A∪(B∪C)=(A∪B)∪C=A∪B∪C A(BC)=(AB)C=ABC(3)分配律:A∪(B∩C)=(A∪B)∩(A∪C)、A(B∪C)=(A∩B)∪(A∩C)= AB∪AC(4)棣莫弗公式(对偶法则):9、事件域:含有必然事件Ω,并关于对立运算和可列并运算都封闭的事件类ξ称为事件域,又称为σ代数。
具体说,事件域ξ满足:(1)Ω∈ξ;(2)若A∈ξ,则对立事件∈ξ;(3)若A n∈ξ,n=1,2,···,则可列并ξ。
E (X )=∑∑x i p i jijxxn+∞ n n−λλkP (X = k ) = e , (k = 0,1,...)k !(a ≤ x ≤ b )1b − af (x ) =概率论与数理统计公式总结F (x ) = P (X ≤ x ) = ∑P (X = k )k ≤x分布函数 对离散型随机变量F ' (x ) = f (x )第一章P(A+B)=P(A)+P(B)- P(AB)特别地,当 A 、B 互斥时, P(A+B)=P(A)+P(B)对连续型随机变量F (x ) = P (X ≤ x ) =∫−∞f (t )dt条件概率公式分布函数与密度函数的重要关系:P (A | B ) =P (AB )P (B )F (x ) = P (X ≤ x ) =∫−∞f (t )dt概率的乘法公式P (AB ) = P (B )P (A | B )= P (A )P (B | A )二元随机变量及其边缘分布分布规律的描述方法全概率公式:从原因计算结果P (A ) = ∑ P (B k )P (A | B k )k =1联合密度函数联合分布函数f (x , y ) ≥ 0f (x , y ) F (x , y )+∞ +∞Bayes 公式:从结果找原因∫−∞ ∫−∞f (x , y )dx dy = 1 0 ≤ F (x , y ) ≤ 1P (B k| A ) = P (B i )P (A | B i ) ∑P (B )P (A | B )F (x , y ) = P {X ≤ x ,Y ≤ y }f (x ) = ∫ f (x , y )d y 联合密度与边缘密度第二章kkk =1Xf Y (y ) = −∞+∞−∞f (x , y )dx二项分布(Bernoulli 分布)——X~B(n,p)P (X =k )=C k p k (1−p)n −k,(k =0,1,...n , ) 泊松分布——X~P(λ)概率密度函数离散型随机变量的独立性P {X = i ,Y = j } = P {X = i }P {Y = j }连续型随机变量的独立性f (x , y ) = f X (x ) f Y (y ) 第三章数学期望离散型随机变量,数学期望定义怎样计算概率P (a ≤ X ≤ b )b连续型随机变量,数学期望定义� E(a)=a ,其中 a 为常数P (a ≤ X ≤ b ) = ∫af (x )d x均匀分布 X~U(a,b)指数分布 X~Exp (θ)• E(a+bX)=a+bE(X),其中 a 、b 为常数 � E(X+Y)=E(X)+E(Y),X 、Y 为任意随机变量随机变量 g(X)的数学期望常用公式+∞∫−∞ f (x )dx = 1+∞E (X ) = ∑x k ⋅P kk =−∞+∞E (X ) = ∫−∞x ⋅ f (x )dxE (g (X )) = ∑ g (x k ) p kk∫Y / nD (X +Y ) = D (X ) + D (Y ) + 2E {(X − E (X ))(Y − E (Y ))} X ~ N (µ,σ2 )i σ 12 σ E (X Y ) = ∑∑x i y j p i jij2σ22−(x −µ) e 12πσf (x ) =不相关不一定独立第四章 正态分布E (X ) = µ,D (X ) = σ2方 差 定义式常用计算式常用公式当 X 、Y 相互独立时:标准正态分布的概率计算 标准正态分布的概率计算公式P (Z ≤ a ) = P (Z < a ) = Φ(a )P (Z ≥ a ) = P (Z > a ) = 1− Φ(a )P (a ≤ Z ≤ b ) = Φ(b ) − Φ(a )P (−a ≤ Z ≤ a ) = Φ(a ) − Φ(−a ) = 2Φ(a ) −1一般正态分布的概率计算一般正态分布的概率计算公式 P (X ≤ a ) = P (X < a ) = Φ(a − µσ ) a − µ方差的性质P (X ≥ a ) = P (X > a ) = 1− Φ( σ)D(a)=0,其中 a 为常数P (a ≤ X ≤ b ) = Φ(b − µ− Φ(a − µD(a+bX)=b2D(X),其中 a 、b 为常数当 X 、Y 相互独立时,D(X+Y)=D(X)+D(Y) 协方差与相关系数E {[X − E (X )][Y − E (Y )]}= E (XY ) − E (X )E (Y )第 五 章卡方分布σ ) σ)n若X ~ N (0,1),则∑ X 2 ~ χ2(n )i =121n2 2协方差的性质若Y ~ N (µ,σ ),t 分布则 2 ∑(Y i− µ) i =1 ~ χ (n )若X ~ N (0,1), Y ~ χ2(n ),则X ~ t (n )独立与相关独立必定不相关 Cov (aX ,bY ) = abCov (X ,Y )若U ~ χ2 (n ), F 分布正态总体条件下 样本均值的分布:V ~ χ2(n ),则U / n 1 V / n 2~ F (n 1,n 2 )相关必定不独立2X ~ N (µ,)nX − µ~ N (0,1)σ/ n 2− E (X )) ⋅ f (x )dx x +∞−∞∫ D (X ) =( E (XY ) = ∫ ∫ xyf (x , y )dxdy σX ~ N (µ,σ2 ) ⇔ Z = X − µ~ N (0,1)D (X )D (Y )XY ρ =C ov (X ,Y )Cov (X +Y , Z ) = Cov (X , Z ) + Cov (Y , Z )C ov (X , X ) = E (X 2 ) − (E (X ))2 =D (X )Cov (X ,Y ) = E (XY ) − E (X )E (Y )D (X +Y ) = D (X ) + D (Y )D (X ) =E (X 2 ) − [E (X )]2当X 与Y 独立时,E (XY ) = E (X )E (Y )Φ(a ) = 1− Φ(−a ) E (X +Y ) = E (X ) + E (Y )E (X ) = ∫ ∫ xf (x , y )dxdyn ⎠ n ⎠ n ⎠σ2 1 + 2 n 1 n 2 σ2 σ / n(x 1 − x 2 )± z α/ 2 2 2 ⎜ χ χ ⎛ ⎜ ⎟12x ± z样本方差的分布:正态总体方差的区间估计 两个正态总体均值差的置信区间(n −1)S 2 ~ χ2 (n −1) X − µ~ t (n −1) 大样本或正态小样本且方差已知σ2两个正态总体的方差之比⎛⎜ ⎜ ⎝S 2 / S 2两个正态总体方差比的置信区间1 2~ F (n 1 −1,σ2 /σ2n 2 −1)2 / S 2 , 2 / S 2⎞ ⎝ F α/ 2 (n 1 −1,n 2 −1) F α/ 2 (n 1 −1,n 2 −1) ⎠第六章点估计:参数的估计值为一个常数矩估计 最大似然估计n似然函数第七章假设检验的步骤1 根据具体问题提出原假设 H0 和备择假设 H12 根据假设选择检验统计量,并计算检验统计值3 看检验统计值是否落在拒绝域,若落在拒绝域则L = Π i =1f (x i ;θ)L = Π i =1p (x i ;θ)拒绝原假设,否则就不拒绝原假设。
1统计量与抽样分布1.1基本概念:统计量、样本矩、经验分布函数总体X 的样本X 1,X 2,…,X n ,则T(X 1,X 2,…,X n )即为统计量 样本均值X =μ样本方差212)(1∑=-=ni i nX X n S修正样本方差212*)(11∑=--=n i i nX X n S样本k 阶原点矩,...)2,1(,11==∑=k X n A n i ki k样本k 阶中心矩,...)2,1(,)(11=-=∑=k X X n B n i ki k经验分布函数)(,)()(+∞<<-∞=x nx v x F n n 其中V n (x)表示随机事件}{x X ≤出现的次数,显然))(,(~)(x F n B x V n ,则有)()]([x F x F E n = )](1)[(1)]([x F x F nx F D n -=补充: ⏹DX nn ES n 12-=DX ES n=2* 22)(EX DX EX += ⏹22211n ni i S X X n ==-∑● 二项分布B(n,p): ),...,1,0(,)1(}{n k p p C k X P k n kk n =-==-EX=np DX=np(1-p) ● 泊松分布)(λP :,...)1,0(,!}{===-k e k k X P kλλλ=EX λ=DX● 均匀分布U(a,b):)(,1)(b x a ab x f <<-=2b a EX +=2)(121a b DX -=● 指数分布:(),(0)()1,(0)x x f x e x F x e x λλλ--=>↔=->λ1=EX 21λ=DX● 正态分布),(2σμN :}2)(exp{21)(22σμσπ--=x x f μ=EX 2σ=DX22221()1nnnS n E n ES n σσ-=-⇒= 224222(1)()2(1)n n nS n D n DS n σσ-=-⇒= 当0=μ时,0=EX 22σ=EX 443EX σ= σπ2=X E 2)21(σπ-=X D1.2统计量:充分统计量、因子分解定理、完备统计量、指数型分布族 T 是θ的充分统计量⇔),...,,(21t T x x x f n =与θ无关 T 是θ的完备统计量⇔要使E[g(T)]=0,必有g(T)=0));,...,,((),...,,();()(21211θθθn n i ni x x x T g x x x h x f L ==∏=且h 非负⇔T 是θ的充分统计量),...,,()},...,,()(exp{)();(21211nnni ix x x h x x x T b C x f θθθ=∏=⇔T 是θ的充分完备统计量),...,,()},...,,()(),...,,()(exp{)();(21212221111nnnni ix x x h x x x T b x x x T b C x f θθθθ+=∏=⇔),(21T T 是),(21θθθ=的充分完备统计量1.3抽样分布:2χ分布,t 分布,F 分布,分位数,正态总体样本均值和方差的分布,非正态总体样本均值的分布2χ分布:)(~ (2)222212n X X X nχχ+++= )0()2(21)(1222>Γ=--x xe n xf n x nn E =2χ n D 22=χT 分布:)(~/n t nY XT =当n>2时,ET=0 2-=n n DTF 分布:),(~2121n n F n Yn XF =),(112n n F F= 补充:⏹ Z=X+Y 的概率密度⎰⎰+∞∞-+∞∞--=-=dy y y z f dx x z x f z f z ),(),()( f(x,y)是X 和Y 的联合概率密度 ⏹ XYZ =的概率密度dx x xz x f z f z ⎰+∞∞-=),()(⏹)(x g y =的概率密度)]'([))(()(11y g y g f y f x y --=●Γ函数:⎰+∞--=Γ01)(dx e x x αα )()1(αααΓ=+Γ 1)1(,)!1()(=Γ-=Γn n● B 函数:⎰---=111)1(),(dx x x B βαβα )()()(),(βαβαβα+ΓΓΓ=B1.4次序统计量及其分布:次序统计量、样本中位数X 、样本极差R X (k)的分布密度:),...,2,1(),()](1[)]([)!()!1(!)(1)(n k x f x F x F k n k n x f k n k x k =---=--X (1)的分布密度:1)](1)[()()1(--=n x x F x nf x fX (n)的分布密度:1)]()[()()(-=n x x F x nf x f n2参数估计2.1点估计与优良性:概念、无偏估计、均方误差准则、相合估计(一致估计)、渐近正态估计θ的均方误差:22(,)()()MSE E D E θθθθθθθ=-=+-若θ是无偏估计,则(,)MSE D θθθ=对于θ的任意一个无偏估计量θ,有*D D θθ≤,则*θ是θ的最小方差无偏估计,记MVUE 相合估计(一致估计):lim n n E θθ→∞= lim 0n n D θ→∞=2.2点估计量的求法:矩估计法、最大似然估计法 矩估计法:① 求出总体的k 阶原点矩:12(;,,...,)kk k m a EX x dF x θθθ+∞-∞==⎰② 解方程组11n kk i i a X n ==∑ (k=1,2,...,m),得12(,,...,)k k n X X X θθ=即为所求最大似然估计法:① 写出似然函数1()(;)ni i L f x θθ==∏,求出lnL 及似然方程ln 0i Lθθθ=∂=∂ i=1,2,...,m② 解似然方程得到12(,,...,)i n x x x θ,即最大似然估计12(,,...,)i n X X X θ i=1,2,...,m 补充:⏹ 似然方程无解时,求出θ的定义域中使得似然函数最大的值,即为最大似然估计 2.3MVUE 和有效估计:最小方差无偏估计、有效估计T 是θ的充分完备统计量,θ是θ的一个无偏估计⇔*(|)E T θθ=为θ的惟一的MVUE最小方差无偏估计的求解步骤:① 求出参数θ的充分完备统计量T② 求出()ET g θ=,则1()g T θ-=是θ的一个无偏估计或求出一个无偏估计,然后改写成用T 表示的函数③ 综合,11[()]()E g T T g T --=是θ的MVUE或者:求出θ的矩估计或ML 估计,再求效率,为1则必为MVUET 是()g θ的一个无偏估计,则满足信息不等式'2[()][()]()g D T X nI θθ≥,其中2ln (;)()f X I E θθθ∂⎡⎤=⎢⎥∂⎣⎦或22ln (;)()0f X I E θθθ⎡⎤∂=->⎢⎥∂⎣⎦,(;)f X θ为样本的联合分布。
最小方差无偏估计⇐达到罗-克拉姆下界⇔有效估计量⇔效率为1 无偏估计θ的效率:1()()e D nI θθθ=θ是θ的最大似然估计,且θ是θ的充分统计量⇔θ是θ的有效估计2.4区间估计:概念、正态总体区间估计(期望、方差、均值差、方差比)及单侧估计、非正态总体参数和区间估计 一个总体的情况:2~(,)X N μσ2σ已知,求μ的置信区间:02~(0,1)X N X u nnαμσμσ-⇒-<2σ未知,求μ的置信区间:*00*2~(1)(1)nnX S t n X t n Snnαμμ--⇒-<-μ已知,求2σ的置信区间:22222111222122()()()~()()()nnniiii i i XXXn n n ααμμμχσσχχ===----⇒<<∑∑∑μ未知,求2σ的置信区间:22222111222122()()()~(1)(1)(1)nnniiii i i XX XX XX n n n ααχσσχχ===-----⇒<<--∑∑∑两个总体的情况:211~(,)X N μσ,222~(,)Y N μσ2212,σσ均已知时,求12μμ-的区间估计:22121212221221212()~(0,1)()X Y N X Y u n n n n αμμσσμμσσ---⇒---<++22212σσσ==未知时,求12μμ-的区间估计:1212121212*2*2121122()(2)~(2)(1)(1)n n X Y n n n n t n n n n n S n S μμ---+-+-+-+-12,μμ未知时,求2122σσ:222211222122*2**2211112121212*2**12221222~(1,1)(1,1)(1,1)n n n n n n S S S F n n F n n F n n S SS σσσσ∂∂---⇒--<<-- 非正态总体的区间估计:当n →∞时,2(0,1)Ln n S X N X u S n n αμμ-→⇒-<1lim 1n n n S S →∞-⎛⎫= ⎪⎝⎭,故用S n 代替S n-121~(0,1)111mX m m m nN u n n n n m m n n n α-⎛⎫⎛⎫⇒±- ⎪ ⎪ ⎪⎝⎭⎛⎫⎝⎭- ⎪⎝⎭3统计决策与贝叶斯估计3.1统计决策的基本概念:三要素、统计决策函数及风险函数三要素:样本空间和分布族、行动空间(判决空间)、损失函数(,)L d θ 统计决策函数d(X):本质上是一个统计量,可用来估计未知参数 风险函数:(,)[(,())]R d E L d X θθθ=是关于θ的函数3.2贝叶斯估计:先验分布与后验分布、贝叶斯风险、贝叶斯估计① 求样本X=(X 1,X 2,...,X n )的分布:1(|)(|)nii q x f x θθ==∏② 样本X 与θ的联合概率分布:(,)(|)()(|)()f x h x m x q x θθθπθ== ③ 求(,)f x θ关于x 的边缘密度()(,)m x f x d θθΘ=⎰④ θ的后验密度为:(,)(|)()f x h x m x θθ=取2(,)()L d d θθ=-时θ的贝叶斯估计为:(|)(|)E x h x d θθθθθΘ==⎰贝叶斯风险为:22(,)()()[(,)]()(|)B R d E d R d E R d E d h x d θθθθθθθθΘ⎧=-⎪⎨==-⎪⎩⎰取2(,)()()L d d θλθθ=-时,贝叶斯估计为:[()|][()|]E x E x λθθθλθ=补充: ⏹()C θ的贝叶斯估计:取损失函数2(,)(())L d C d θθ=-,则贝叶斯估计为()[()|]()(|)C E C x C h x d θθθθθΘ==⎰⏹(,)(,)(|)(|)()(,)f x d f x E x h x d d m x f x d θθθθθθθθθθθθΘΘΘΘ====⎰⎰⎰⎰3.3minimax 估计对决策空间中的决策函数d 1(X),d 2(X),...,分别求出在Θ上的最大风险值max (,)R d θθ∈Θ在所有的最大风险值中选取相对最小值,此值对应的决策函数就是最小最大决策函数。