概率论及数理统计要点复习
- 格式:doc
- 大小:798.50 KB
- 文档页数:18
概率论与数理统计总复习知识点归纳1.概率论的基础概念-随机事件、样本空间和事件的关系。
-频率和概率的关系,概率的基本性质。
-古典概型和几何概型的概念。
-条件概率和乘法定理。
-全概率公式和贝叶斯公式。
-随机变量和概率分布函数的概念。
-离散型随机变量和连续型随机变量的定义、概率质量函数和概率密度函数的性质。
2.随机变量的数字特征-随机变量的数学期望、方差、标准差和切比雪夫不等式。
-协方差、相关系数和线性变换的数学期望和方差公式。
-两个随机变量的和、差、积的数学期望和方差公式。
3.大数定律和中心极限定理-大数定律的概念和三级强大数定律。
-中心极限定理的概念和中心极限定理的两种形式。
4.数理统计的基本概念和方法-总体、样本和抽样方法的概念。
-样本统计量和抽样分布的概念。
-点估计和区间估计的概念。
-假设检验的基本思想和步骤。
-正态总体的参数的假设检验和区间估计。
5.参数估计和假设检验的方法和推广-极大似然估计的原理和方法。
-矩估计的原理和方法。
-最小二乘估计的原理和方法。
-一般参数的假设检验和区间估计。
6.相关分析和回归分析-相关系数和线性相关的概念和性质。
-回归分析的一般原理。
-简单线性回归的估计和检验。
7.非参数统计方法-秩和检验和符号检验的基本思想和应用。
-秩相关系数的计算和检验。
8.分布拟合检验和贝叶斯统计-卡方拟合检验的原理和方法。
-正态总体参数的拟合优度检验。
-贝叶斯估计的基本思想和方法。
9.时间序列分析和质量控制-时间序列的基本性质和分析方法。
-时间序列预测的方法和模型。
-质量控制的基本概念和控制图的应用。
以上是概率论与数理统计总复习知识点的归纳,希望对你的复习有所帮助。
概率论与数理统计考点归纳1. 引言概率论与数理统计是数学中的两个重要分支,它们研究随机现象的规律和利用数据推断总体特征。
在实际应用中,概率论与数理统计广泛应用于自然科学、社会科学、工程技术等领域。
本文将从以下几个方面对概率论与数理统计的考点进行归纳和总结。
2. 概率论考点2.1 随机变量与概率分布•随机变量的定义、分类和常见概率分布:离散随机变量、连续随机变量、二项分布、泊松分布、正态分布等。
•期望、方差和协方差的定义和性质,以及它们与随机变量的关系。
•大数定律和中心极限定理的概念和应用。
2.2 一维随机变量的分布特征•分布函数、概率密度函数和概率质量函数的定义和性质。
•分位数和分位点的概念和计算方法。
•随机变量的矩、协方差和相关系数的定义和计算。
•常见分布的特征:均匀分布、指数分布、正态分布等。
2.3 多维随机变量的分布特征•多维随机变量的联合分布、边缘分布和条件分布的定义和性质。
•多维随机变量的矩、协方差矩阵和相关系数矩阵的定义和计算。
•多维正态分布的定义和性质,以及多维正态分布的应用。
2.4 随机变量的函数的分布特征•随机变量函数的分布:线性变换、和、积、商的分布。
•随机变量函数的期望、方差和协方差的计算方法。
3. 数理统计考点3.1 抽样与抽样分布•抽样的概念和方法:随机抽样、简单随机抽样、系统抽样、分层抽样、整群抽样等。
•抽样分布的概念和性质:样本均值的抽样分布、样本比例的抽样分布、样本方差的抽样分布等。
•中心极限定理在抽样分布中的应用。
3.2 参数估计•点估计的概念和方法:矩估计、最大似然估计等。
•点估计的性质:无偏性、有效性、一致性等。
•置信区间的定义和计算方法。
3.3 假设检验•假设检验的基本步骤:建立原假设和备择假设、选择检验统计量、确定显著性水平、计算拒绝域、做出判断。
•假设检验的错误和功效:第一类错误、第二类错误和功效的概念和计算。
•常见假设检验方法:正态总体均值的假设检验、正态总体方差的假设检验、两样本均值的假设检验等。
第一章 随机事件及其概率一、随机事件及其运算 1. 样本空间、随机事件①样本点:随机试验的每一个可能结果,用ω表示; ②样本空间:样本点的全集,用Ω表示; 注:样本空间不唯一.③随机事件:样本点的某个集合或样本空间的某个子集,用A,B,C,…表示; ④必然事件就等于样本空间;不可能事件()∅是不包含任何样本点的空集; ⑤基本事件就是仅包含单个样本点的子集。
2. 事件的四种关系①包含关系:A B ⊂,事件A 发生必有事件B 发生; ②等价关系:A B =, 事件A 发生必有事件B 发生,且事件B 发生必有事件A 发生;③互不相容(互斥): AB =∅ ,事件A 与事件B 一定不会同时发生。
④互逆关系(对立):A ,事件A 发生事件A 必不发生,反之也成立;互逆满足A A AA ⎧⋃=Ω⎨=∅⎩注:互不相容和对立的关系(对立事件一定是互不相容事件,但互不相容事件不一定是对立事件。
) 3. 事件的三大运算①事件的并:A B ⋃,事件A 与事件B 至少有一个发生。
若AB =∅,则A B A B ⋃=+;②事件的交:A B AB ⋂或,事件A 与事件B 都发生; ③事件的差:-A B ,事件A 发生且事件B 不发生。
4. 事件的运算规律①交换律:,A B B A AB BA ⋃=⋃=②结合律:()(),()()A B C A B C A B C A B C ⋃⋃=⋃⋃⋂⋂=⋂⋂③分配律:()()(),()()()A B C A B A C A B C A B A C ⋃⋂=⋃⋂⋃⋂⋃=⋂⋃⋂ ④德摩根(De Morgan )定律:,A B AB AB A B⋃==⋃对于n 个事件,有1111,n ni i i i nni ii i A A A A ======二、随机事件的概率定义和性质1.公理化定义:设试验的样本空间为Ω,对于任一随机事件),(Ω⊂A A 都有确定的实值P(A),满足下列性质: (1) 非负性:;0)(≥A P (2) 规范性:;1)(=ΩP(3)有限可加性(概率加法公式):对于k 个互不相容事件k A A A ,,21 ,有∑∑===ki i ki i A P A P 11)()(.则称P(A)为随机事件A 的概率. 2.概率的性质 ①()1,()0P P Ω=∅= ②()1()P A P A =-③若A B ⊂,则()(),()()()P A P B P B A P B P A ≤-=-且 ④()()()()P A B P A P B P AB ⋃=+-()()()()()()()()P A B C P A P B P C P AB P BC P AC P ABC ⋃⋃=++---+注:性质的逆命题不一定成立的. 如 若),()(B P A P ≤则B A ⊂。
概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x pp ====-<<,则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =-(2)二项分布:若一个随机变量X 的概率分布由式{}(1),0,1,...,.k kn k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,.k kn k n P x k C p p k n -==-=二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k ek k λλλ-==>=,则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k ek k λλλ-==>=泊松分布的期望:()E X λ=;泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt-∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布:(1)均匀分布:若连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a a b x f ,则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度:⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a a b x f 均匀分布的期望:()2a bE X +=;均匀分布的方差:2()()12b a D X -= (2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩,则称X 服从参数为λ的指数分布,记为X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩指数分布的期望:1()E X λ=;指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X的概率密度为22()2()x f x x μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()2()x f x x μσ--=-∞<<+∞正态分布的期望:()E X μ=;正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==,2222()()x t xx x e dtϕφ---∞=⎰标准正态分布表的使用: (1)()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数: 设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
概率论与数理统计复习提纲概率论与数理统计总复习第⼀讲随机事件及其概率⼀随机事件,事件间的关系及运算 1.样本空间和随机事件 2.事件关系,运算和运算律⑴事件的关系和运算⑶运算律:交换律,结合律,分配律;对偶律: B A B A ?=?,B A B A ?=?;⼆概率的定义和性质 1.公理化定义(P7)2.概率的性质(P8.五个) ⑴)(1)(A P A P -=;⑵)()()()(AB P B P A P B A P -+=?;3.古典概型和⼏何概型4.条件概率 )()()|(A P AB P A B P =三常⽤的计算概率的公式1.乘法公式 )()()()()(B A P B P A B P A P AB P ==2.全概率公式和贝叶斯公式(P17-20.) 四事件的独⽴性1.定义:A 和B 相互独⽴ )()(B P A B P =或)()()(B P A P AB P ?=,2.贝努利试验在n 重贝努利试验中,事件=k A {A 恰好发⽣k 次})0(n k ≤≤的概率为:k n nk n k p p C A P --=)1()(第⼆讲随机变量及其概率分布⼀随机变量及其分布函数1.随机变量及其分布函数 )()(x X P x F ≤=)(+∞<<-∞x2.分布函数的性质(P35.四个)⑴0)(lim =-∞→x F x ;1)(lim =+∞→x F x ;(常⽤来确定分布函数中的未知参数)⑵)()()(a F b F b X a P -=≤<(常⽤来求概率) ⼆离散型随机变量及其分布律1.分布律2.常⽤的离散型分布三连续型随机变量 1.密度函数 ?∞-=xdt t f x F )()(2.密度函数的性质(P39.七个) ⑴1)(=?+∞∞-dx x f ;(常⽤来确定密度函数中的参数)⑵?=≤adx x f b X a P )()(;(计算概率的重要公式)⑶对R x ∈?,有0)(==c X P (换⾔之,概率为0的事件不⼀定是不可能事件). 3.常⽤连续型分布重点:正态分布:)0,(21)(22)(>=--σσµσπσµ都是常数,x ex f标准正态分布)1,0(N :2221)(x ex -=π四随机变量函数的分布1.离散情形设X 的分布律为则)(X g Y =的分布律为2.连续情形设X 的密度函数为)(x f X ,若求)(X g Y =的密度函数,先求Y 的分布函数,再通过对其求导,得到Y 的密度函数。
《概率论与数理统计》第一章 随机事件与概率1.事件的关系 φφ=Ω-⋃⊂AB A B A AB B A B A 2.运算规则 (1)BA AB A B B A =⋃=⋃(2))()( )()(BC A C AB C B A C B A =⋃⋃=⋃⋃(3)))(()( )()()(C B C A C AB BC AC C B A ⋃⋃=⋃⋃=⋃ (4)B A AB B A B A ⋃==⋃3.概率)(A P 满足的三条公理及性质: (1)1)(0≤≤A P (2)1)(=ΩP(3)对互不相容的事件n A A A ,,,21 ,有∑===nk kn k kA P A P 11)()((n 可以取∞)(4) 0)(=φP (5))(1)(A P A P -=(6))()()(AB P A P B A P -=-,若B A ⊂,则)()()(A P B P A B P -=-,)()(B P A P ≤ (7))()()()(AB P B P A P B A P -+=⋃(8))()()()()()()()(ABC P BC P AC P AB P C P B P A P C B A P +---++=⋃⋃ 4.古典概型:基本事件有限且等可能5.几何概率 6.条件概率(1) 定义:若0)(>B P ,则)()()|(B P AB P B A P =(2) 乘法公式:)|()()(B A P B P AB P = 若n B B B ,,21为完备事件组,0)(>i B P ,则有 (3) 全概率公式: ∑==ni iiB A P B P A P 1)|()()((4) Bayes 公式: ∑==ni iik k k B A P B P B A P B P A B P 1)|()()|()()|(7.事件的独立性: B A ,独立)()()(B P A P AB P =⇔ (注意独立性的应用)第二章 随机变量与概率分布1. 离散随机变量:取有限或可列个值,i i p x X P ==)(满足(1)0≥i p ,(2)∑iip=1(3)对任意R D ⊂,∑∈=∈Dx i ii pD X P :)(2. 连续随机变量:具有概率密度函数)(x f ,满足(1)1)(,0)(-=≥⎰+∞∞dx x f x f ;(2)⎰=≤≤badx x f b X a P )()(;(3)对任意R a ∈,0)(==a X P4. 分布函数 )()(x X P x F ≤=,具有以下性质(1)1)( ,0)(=+∞=-∞F F ;(2)单调非降;(3)右连续; (4))()()(a F b F b X a P -=≤<,特别)(1)(a F a X P -=>; (5)对离散随机变量,∑≤=xx i ii px F :)(;(6)对连续随机变量,⎰∞-=xdt t f x F )()(为连续函数,且在)(x f 连续点上,)()('x f x F =5. 正态分布的概率计算 以)(x Φ记标准正态分布)1,0(N 的分布函数,则有 (1)5.0)0(=Φ;(2))(1)(x x Φ-=-Φ;(3)若),(~2σμN X ,则)()(σμ-Φ=x x F ;(4)以αu 记标准正态分布)1,0(N 的上侧α分位数,则)(1)(αααu u X P Φ-==> 6. 随机变量的函数 )(X g Y =(1)离散时,求Y 的值,将相同的概率相加;(2)X 连续,)(x g 在X 的取值范围内严格单调,且有一阶连续导数,则|))((|))(()('11y g y g f y f X Y --=,若不单调,先求分布函数,再求导。
概率论与数理统计知识点总结一、概率的基本概念1.概率的定义:概率是描述事件发生可能性的数字,表示为一个介于0和1之间的数。
2.事件与样本空间:事件是可能发生的结果的集合,样本空间是所有可能结果的集合。
3.事件的运算:事件的运算包括并、交、差等,分别表示两个事件同时发生、至少一个事件发生、一个事件发生而另一个事件不发生等。
4.概率的性质:概率具有非负性、规范性、可列可加性等性质。
二、随机变量与概率分布1.随机变量的定义:随机变量是一个变量,它的值由随机事件决定。
2.离散随机变量:离散随机变量只能取有限或可数个值,其概率表示为离散概率分布函数。
3.连续随机变量:连续随机变量可以取任意实数值,其概率表示为概率密度函数。
4.分布函数:分布函数描述随机变量的概率分布情况,包括累积分布函数和概率质量函数。
三、常见概率分布1.离散分布:包括伯努利分布、二项分布、泊松分布等。
2.连续分布:包括均匀分布、正态分布、指数分布、伽玛分布等。
正态分布在自然界和社会现象中广泛存在。
3.其他分布:包括卡方分布、指数分布、F分布、t分布等。
四、抽样与统计推断1.抽样:抽样是从总体中选择一部分个体进行实验或调查的方法,常用的抽样方法包括随机抽样、分层抽样、整群抽样等。
2.统计推断:通过从样本中获得的数据,对总体做出有关参数的推断。
包括点估计和区间估计两种方法。
3.假设检验:通过对样本数据的统计量进行计算,判断总体参数是否满足其中一种假设。
包括单样本假设检验、两样本假设检验、方差分析等。
五、回归分析与相关分析1.回归分析:研究两个或多个变量之间关系的统计方法,包括一元线性回归分析、多元线性回归分析等。
2.相关分析:研究两个变量之间相关性的统计方法,常用的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。
六、贝叶斯统计学1.贝叶斯定理:根据先验概率和条件概率,计算后验概率的统计方法。
2.贝叶斯推断:根据贝叶斯定理以及样本数据,推断参数的后验分布。
《概率论与数理统计》复习概要第一章随机事件与概率1.事件的关系ABAB AB A B A AB2.运算规则(1)A B B A AB BA(2)(A B)CA(BC)(AB)CA(BC)(3)(A B)C(AC)(BC)(AB)C(AC)(BC)(4)A B AB AB A B3.概率P(A)知足的三条公义及性质:(1)0P(A)1(2)P()1(3)对互不相容的事件n n(n能够取)A1,A2,,A n,有P(A k)P(A k)k1k1(4)P()0(5)P(A)1P(A)(6)P(A B)P(A)P(AB),若A B,则P(B A)P(B)P(A),P(A)P(B)(7)P(A B)P(A)P(B)P(AB)8)P(ABC)P(A)P(B)P(C)P(AB)P(AC)P(BC)P(ABC)4.古典概型:基本领件有限且等可能5.几何概率6.条件概率(1)定义:若P(B)0,则P(A|B)P(AB)P(B)(2)乘法公式:P(AB)P(B)P(A|B)若B1,B2,B n为齐备事件组,P(B i)0,则有(3)全概率公式:P(A)nP(B i)P(A|B i) i1(4)Bayes公式:P(B k)P(A|B k)P(B k|A) nP(B i)P(A|B i)i17.事件的独立性: A,B独立P(AB)第二章随机变量与概率散布1.失散随机变量:取有限或可列个值,(3)对随意D R,P(XD)p ii:x i D P(A)P(B) (注意独立性的应用)P(Xx i)p i知足(1)p i0,(2)p i=1i2.连续随机变量:拥有概率密度函数f(x),知足(1)f(x)0,f(x)dx1;-(2)b;()对随意a R,P(XP(aX b)f(x)dx a)03a3.几个常用随机变量数学期名称与记号散布列或密度方差望两点散布B(1,p)P(X1)p,P(X0)q1p二项式散布C n k p k q nk,kP(X k)0,1,2,n,B(n,p)Poisson散布P()几何散布G(p)平均散布U(a,b)f(x)1,a x b,b a指数散布E()正态散布N(,2)4.散布函数F(x) P(X x),拥有以下性质(1)F()0,F()1;(2)单一非降;(3)右连续;(4)P(a X b)F(b)F(a),特别P(Xa)1F(a);(5)对失散随机变量,F(x)p i;i:x i x(6)对连续随机变量,F(x)xf(x)连续点上,f(t)dt为连续函数,且在F'(x)f(x)5.正态散布的概率计算以(x)记标准正态散布N(0,1)的散布函数,则有(1)(0);(2)(x)1(x);(3)若X~N(,2),则F(x)(x);(4)以u记标准正态散布N(0,1)的上侧分位数,则P(Xu)1(u) 6.随机变量的函数Y g(X)(1)失散时,求Y的值,将同样的概率相加;(2)X连续,g(x)在X的取值范围内严格单一,且有一阶连续导数,则f Y(y) f X(g1(y))|(g1(y))'|,若不但一,先求散布函数,再求导。
《概率论与数理统计》复习大纲第一章 随机事件与概率基本概念随机试验E----指试验可在相同条件下重复举行,试验的结果具有多种可能性(每次试验有且仅有一个结果闪现,且事先知道试验可能闪现的一切结果,但不能预知每次试验确实切结果。
样本点ω ---随机试验E的每一具可能闪现的结果样本空间Ω----随机试验E的样本点的全体随机事件-----由样本空间中的若干个样本点组成的集合,即随机事件是样本空间的一具子集。
必然事件---每次试验中必然发生的事件。
不可能事件∅--每次试验中一定不发生的事件。
事件之间的关系包含A⊂B相等A=B对立事件,也称A的逆事件互斥事件AB=∅也称不相容事件A,B相互独立P(AB)=P(A)P(B)例1事件A,B互为对立事件等价于( D )A、A,B互不相容B、A,B相互独立C、A∪B=ΩD、A,B构成对样本空间的一具剖分例2设P(A)=0,B为任一事件,则(C )A、A=∅B、A⊂BC、A与B相互独立D、A与B互不相容事件之间的运算事件的交AB或A ∩B 例1设事件A、B满足A B¯=∅,由此推导不出(D)A、A⊂BB、A¯⊃B¯C、A B=BD、A B=B例2若事件B与A满足B – A=B,则一定有(B)A、A=∅B、AB=∅C、AB¯=∅D、B=A¯事件的并A∪B事件的差A-B 注意:A-B= A B= A-AB = (A∪B)-BA1,A2,…,An构成Ω的一具完备事件组(或分斥)−−指A1,A2,…,An两两互不相容,且∪i=1nAi=Ω运算法则交换律A∪B=B∪A A∩B=B∩A结合律(A∪B)∪C=A∪(B∪C) (A∩B)∩C=A∩(B∩C)分配律(A∪B)∩C=(AC)∪(BC) (A∩B)∪C=(A∪C)∩(B∪C) 对偶律A∪B=A∩B A∩B=A∪B文氏图事件与集合论的对应关系表记号概率论集合论Ω样本空间,必然事件全集∅不可能事件空集ω基本事件元素A 事件全集中的一具子集A A的对立事件A的补集A⊂B 事件A发生导致事件B发生A是B的子集A=B 事件A与事件B相等A与B相等A∪B 事件A与事件B至少有一具发生A与B的并集AB 事件A与事件B并且发生A与B的交集知识归纳整理A-B事件A 发生但事件B 不发生A 与B 的差集 AB=∅ 事件A 与事件B 互不相容(互斥) A 与B 没有相同的元素古典概型 古典概型的前提是Ω={ω1,ω2, ω3,…, ωn ,}, n 为有限正整数,且每个样本点ωi 出现的可能性相等。
概率论与数理统计知识点总结1. 概率论基础- 随机事件:一个事件是随机的,如果它可能发生也可能不发生。
- 样本空间:所有可能事件发生的集合。
- 事件的概率:事件发生的可能性的度量,满足0≤P(A)≤1。
- 条件概率:在另一个事件发生的条件下,一个事件发生的概率。
- 贝叶斯定理:描述了随机事件A和B的条件概率和边缘概率之间的关系。
- 独立事件:两个事件A和B是独立的,如果P(A∩B) = P(A)P(B)。
- 互斥事件:两个事件A和B是互斥的,如果它们不能同时发生,即P(A∩B) = 0。
2. 随机变量及其分布- 随机变量:将随机事件映射到实数的函数。
- 离散随机变量:取值为有限或可数无限的随机变量。
- 连续随机变量:可以在某个区间内取任意值的随机变量。
- 概率分布函数:描述随机变量取值的概率。
- 概率密度函数:连续随机变量的概率分布函数的导数。
- 累积分布函数:随机变量取小于或等于某个值的概率。
- 期望值:随机变量的长期平均值。
- 方差:衡量随机变量取值的离散程度。
3. 多维随机变量及其分布- 联合分布:描述两个或多个随机变量同时取特定值的概率。
- 边缘分布:通过联合分布求得的单个随机变量的分布。
- 条件分布:给定一个随机变量的值时,另一个随机变量的分布。
- 协方差:衡量两个随机变量之间的线性关系。
- 相关系数:协方差标准化后的值,表示变量间的线性相关程度。
4. 大数定律和中心极限定理- 大数定律:随着试验次数的增加,样本均值以概率1收敛于总体均值。
- 中心极限定理:独立同分布的随机变量之和,在适当的标准化后,其分布趋近于正态分布。
5. 数理统计基础- 样本:从总体中抽取的一部分个体。
- 总体:研究对象的全体。
- 参数估计:用样本统计量来估计总体参数。
- 点估计:给出总体参数的一个具体估计值。
- 区间估计:给出一个包含总体参数可能值的区间。
- 假设检验:对总体分布的某些假设进行检验。
- 显著性水平:拒绝正确假设的最大概率。
概率论与数理统计复习第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果.随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件.二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率.(1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+…2.性质(1) P(Φ) = 0 , 注意: A P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理)(3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) .对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=n k j i k j i n j i j i n i i n A A A P A A P A P A A A P 11121 …+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i )>0时,有贝叶斯公式P (B i |A)=()()()()()()∑==n i i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件.(1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .(2)若A 与B ,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()k k i i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()k n k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << . (2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx e x f 00≤>x x 若若 (θ>0). (3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--x t dt e x 2221)(π , Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α.四.随机变量X 的函数Y= g (X)的分布1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法:(1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f k y X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y 其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i j ij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x y y ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f . (3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2 (4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) .(X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立.六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称 },{j i j i p y Y x X P ==P{X=x i |Y=y j }为在Y= y j 条件下随机变量X 的条件分布律.同样,对于固定的i,若P{X=x i }>0,则称P{Y=y j |X=x i } 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X离散型随机变量 连续型随机变量 分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛) 方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2 =E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p),}{},{•=====i j i i j i p p x X P y Y x X P2.X~ b (n,p) (0<p<1) n p n p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,…随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如: 样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==n i k i k X X n B 1)(1( k=1,2,…) 二.抽样分布 即统计量的分布 1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n .特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) . 2.χ2分布 (1)定义 若X ~N (0,1 ) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2).③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ χ2(n),且X,Y 相互独立,则t=n Y X ~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时,n S X μ-~ t (n-1) . ③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1 X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点.注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③) 22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iL θ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效.(3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量.二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定.(2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α.(3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间 μ σ2已知 n X σμ-~N (0,1) (2/ασz n X ±) μ σ2未知n S X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体(1)均值差μ 1-μ 2 其它参数 W 及其分布 置信区间已知2221,σσ 22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w +-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③. (2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为 ))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα 注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。
概率论与数理统计复习第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果.随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件.二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率.(1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+…2.性质(1) P(Φ) = 0 , 注意: A P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理)(3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) .对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=n k j i k j i n j i j i n i i n A A A P A A P A P A A A P 11121 …+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i )>0时,有贝叶斯公式P (B i |A)=()()()()()()∑==n i i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件.(1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .(2)若A 与B ,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()k k i i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()k n k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << . (2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx e x f 00≤>x x 若若 (θ>0). (3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--x t dt e x 2221)(π , Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α.四.随机变量X 的函数Y= g (X)的分布1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法:(1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f k y X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y 其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i j ij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x y y ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f . (3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2 (4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) .(X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立.六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称 },{j i j i p y Y x X P ==P{X=x i |Y=y j }为在Y= y j 条件下随机变量X 的条件分布律.同样,对于固定的i,若P{X=x i }>0,则称P{Y=y j |X=x i } 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X离散型随机变量 连续型随机变量 分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛) 方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2 =E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p),}{},{•=====i j i i j i p p x X P y Y x X P2.X~ b (n,p) (0<p<1) n p n p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,…随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如: 样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==n i k i k X X n B 1)(1( k=1,2,…) 二.抽样分布 即统计量的分布 1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n .特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) . 2.χ2分布 (1)定义 若X ~N (0,1 ) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2).③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ χ2(n),且X,Y 相互独立,则t=n Y X ~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时,n S X μ-~ t (n-1) . ③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1 X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点.注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③) 22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iL θ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效.(3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量.二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定.(2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α.(3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间 μ σ2已知 n X σμ-~N (0,1) (2/ασz n X ±) μ σ2未知n S X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体(1)均值差μ 1-μ 2 其它参数 W 及其分布 置信区间已知2221,σσ 22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w +-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③. (2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为 ))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα 注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。
概率论与数理统计的复习要点概率论与数理统计的复习要点众所周知,考研中数学占了很大一部分比例。
在考研数学中,与高等数学和线性代数不同的是,概率论与数理统计中对基本概念的深入理解所占的比例相当大。
那么,概率论有哪些复习重点呢?今天就来说说概率论的复习重点。
一、随机事件概率这部分是非常简单的,就是我们高中学的概率。
通常考的是选择题或填空题,分值不大。
古典概型和几何概型,加法公式、减法公式、乘法公式、全概公式和贝叶斯公式等这些公式要记住。
二、随机变量分布这部分的复习可是重点,每年必考。
经常是与二维变量结合起来考,随机变量及其分布函数的概念和性质、分布律和概率密度的`性质、八大常见的分布(0-1分布、二项分布、几何分布、超几何分布、泊松分布、均匀分布、正态分布、指数分布)都是常考的。
三、随机变量今年的考研试卷中数一和数三只考到了二维正态分布的一个性质,还是一个填空题题。
这部分常常与第一章的随机变量结合起来考,重点有主要考一些常见分布及其应用、随机变量函数的分布。
常见的题型是求一维随机变量的分布律、分布密度或分布函数、求一维随机变量在某一区间的概率。
四、随机变量的数字特征通常会出现在大题中的某一小题,根据历年真题分析,这部分也是每年必考的。
重点要复习随机变量的数字特征定义(数学期望、方差、标准差、矩、协方差、相关系数);常见分布的数字特征;利用数字特征的基本性质计算具体分布的数字特征;根据一维和二维随机变量的概率分布求其函数的数学期望。
五、数定律和中心极限定理这部分就不是考试重点了,但还是要注意。
主要有三个内容,分别是切比雪夫不等式、大数定律和中心极限定理。
根据每年的考试情况来看,这部分不是每年必出的题,所以也不需要重点复习。
总的来说概率论与数理统计统计部分的重点内容是随机变量和随机变量的数字特征,大家要重点复习。
题目千变万化,有各种延伸或变式,大家要想在考试中取得好成绩,一定要认真仔细地复习,必须要重视基本概念、基本理论和基本方法。
《概率论与数理统计》复习提要第一章随机事件与概率1.事件的关系φφ=Ω-⋃⊂AB A B A AB B A B A 2.运算规则(1)BAAB A B B A =⋃=⋃ (2))()( )()(BC A C AB C B A C B A =⋃⋃=⋃⋃(3)))(()( )()()(C B C A C AB BC AC C B A ⋃⋃=⋃⋃=⋃(4)BA AB B A B A ⋃==⋃ 3.概率)(A P 满足的三条公理及性质:(1)1)(0≤≤A P (2)1)(=ΩP (3)对互不相容的事件n A A A ,,,21 ,有∑===nk kn k kA P A P 11)()( (n 可以取∞)(4)0)(=φP (5))(1)(A P A P -=(6))()()(AB P A P B A P -=-,若B A ⊂,则)()()(A P B P A B P -=-,)()(B P A P ≤(7))()()()(AB P B P A P B A P -+=⋃(8))()()()()()()()(ABC P BC P AC P AB P C P B P A P C B A P +---++=⋃⋃4.古典概型:基本事件有限且等可能5.几何概率6.条件概率(1)定义:若0)(>B P ,则)()()|(B P AB P B A P =(2)乘法公式:)|()()(B A P B P AB P =若n B B B ,,21为完备事件组,0)(>i B P ,则有(3)全概率公式:∑==ni iiB A P B P A P 1)|()()((4)Bayes 公式:∑==ni iik k k B A P B P B A P B P A B P 1)|()()|()()|(7.事件的独立性:B A ,独立)()()(B P A P AB P =⇔(注意独立性的应用)第二章随机变量与概率分布1.离散随机变量:取有限或可列个值,i i p x X P ==)(满足(1)0≥i p ,(2)∑iip=1(3)对任意R D ⊂,∑∈=∈Dx i ii pD X P :)(2.连续随机变量:具有概率密度函数)(x f ,满足(1)1)(,0)(-=≥⎰+∞∞dx x f x f ;(2)⎰=≤≤badx x f b X a P )()(;(3)对任意R a ∈,0)(==a X P 3.几个常用随机变量名称与记号分布列或密度数学期望方差两点分布),1(p B p X P ==)1(,pq X P -===1)0(p pq 二项式分布),(p n B n k q p C k X P kn k k n ,2,1,0,)(===-,npnpqPoisson 分布)(λP,2,1,0,!)(===-k k e k X P kλλλλ几何分布)(p G,2,1 ,)(1===-k p qk X P k p 12p q 均匀分布),(b a U b x a a b x f ≤≤-= ,1)(,2b a +12)(2a b -指数分布)(λE 0,)(≥=-x e x f x λλλ121λ正态分布),(2σμN 222)(21)(σμσπ--=x ex f μ2σ4.分布函数)()(x X P x F ≤=,具有以下性质(1)1)( ,0)(=+∞=-∞F F ;(2)单调非降;(3)右连续;(4))()()(a F b F b X a P -=≤<,特别)(1)(a F a X P -=>;(5)对离散随机变量,∑≤=xx i ii px F :)(;(6)对连续随机变量,⎰∞-=xdt t f x F )()(为连续函数,且在)(x f 连续点上,)()('x f x F =5.正态分布的概率计算以)(x Φ记标准正态分布)1,0(N 的分布函数,则有(1)5.0)0(=Φ;(2))(1)(x x Φ-=-Φ;(3)若),(~2σμN X ,则()(σμ-Φ=x x F ;(4)以αu 记标准正态分布)1,0(N 的上侧α分位数,则)(1)(αααu u X P Φ-==>6.随机变量的函数)(X g Y =(1)离散时,求Y 的值,将相同的概率相加;(2)X 连续,)(x g 在X 的取值范围内严格单调,且有一阶连续导数,则|))((|))(()('11y g y g f y f X Y --=,若不单调,先求分布函数,再求导。
概率论与数理统计 复习资料第一章随机事件与概率1.事件的关系 φφ=Ω-⋃⊂AB A B A AB B A B A(1) 包含:若事件A 发生,一定导致事件B 发生,那么,称事件B 包含事件A ,记作A B ⊂(或B A ⊃). (2) 相等:若两事件A 与B 相互包含,即A B ⊃且B A ⊃,那么,称事件A 与B 相等,记作A B =. (3) 和事件:“事件A 与事件B 中至少有一个发生”这一事件称为A 与B 的和事件,记作A B ⋃;“n 个事件1,2,,nA A A 中至少有一事件发生”这一事件称为1,2,,nA A A 的和,记作12nA A A ⋃⋃⋃(简记为1nii A =). (4) 积事件:“事件A 与事件B 同时发生”这一事件称为A 与B 的积事件,记作A B ⋂(简记为AB );“n 个事件1,2,,nA A A 同时发生”这一事件称为1,2,,nA A A 的积事件,记作12n A A A ⋂⋂⋂(简记为12nA A A 或1nii A =). (5) 互不相容:若事件A 和B 不能同时发生,即AB φ=,那么称事件A 与B互不相容(或互斥),若n 个事件1,2,,nA A A 中任意两个事件不能同时发生,即i j A A φ=(1≤i<j ≤几),那么,称事件 1,2,,n A A A 互不相容. (6) 对立事件:若事件A 和B 互不相容、且它们中必有一事件发生,即AB φ=且A B ⋃=Ω,那么,称A 与B 是对立的.事件A 的对立事件(或逆事件)记作A . (7) 差事件:若事件A 发生且事件B 不发生,那么,称这个事件为事件A 与B 的差事件,记作A B -(或AB ) .2.运算规则 (1)交换律:BA AB A B B A =⋃=⋃(2)结合律:)()( )()(BC A C AB C B A C B A =⋃⋃=⋃⋃ (3)分配律))(()( )()()(C B C A C AB BC AC C B A ⋃⋃=⋃⋃=⋃ (4)德摩根(De Morgan )法则:B A AB B A B A ⋃==⋃3.概率)(A P 满足的三条公理及性质: (1)1)(0≤≤A P (2)1)(=ΩP(3)对互不相容的事件n A A A ,,,21 ,有∑===nk kn k kA P A P 11)()((n 可以取∞)(4) 0)(=φP (5))(1)(A P A P -=(6))()()(AB P A P B A P -=-,若B A ⊂,则)()()(A P B P A B P -=-,)()(B P A P ≤ (7))()()()(AB P B P A P B A P -+=⋃(8))()()()()()()()(ABC P BC P AC P AB P C P B P A P C B A P +---++=⋃⋃ 4.古典概型:基本事件有限且等可能5.几何概率: 如果随机试验的样本空间是一个区域(可以是直线上的区间、平面或空间中的区域),且样本空间中每个试验结果的出现具有等可能性,那么规定事件A的概率为()A P A =的长度(或面积、体积)样本空间的的长度(或面积、体积)·6.条件概率(1) 定义:若0)(>B P ,则)()()|(B P AB P B A P =(2) 乘法公式:)|()()(B A P B P AB P = 若n B B B ,,21为完备事件组,0)(>i B P ,则有 (3) 全概率公式: ∑==ni iiB A P B P A P 1)|()()((4) Bayes 公式: ∑==ni iik k k B A P B P B A P B P A B P 1)|()()|()()|((5)贝努里概型与二项概率设在每次试验中,随机事件A发生的概率()(01)P A p p =<<,则在n 次重复独立试验中.,事件A恰发生k 次的概率为()(1),0,1,,k n k n n P k p p k n k -⎛⎫=-= ⎪⎝⎭,7.事件的独立性: B A ,独立)()()(B P A P AB P =⇔ (注意独立性的应用)下列四个命题是等价的:(i) 事件A 与B 相互独立;(ii) 事件A 与B 相互独立;(iii) 事件A 与B 相互独立;(iv) 事件A 与B 相互独立.8、思考题1.一个人在口袋里放2盒火柴,每盒n 支,每次抽烟时从口袋中随机拿出一盒(即每次每盒有同等机会被拿到)并用掉一支,到某次他迟早会发现:取出的那一盒已空了.问:“这时另一盒中恰好有m 支火柴”的概率是多少?2.设一个居民区有n 个人,设有一个邮局,开c 个窗口,设每个窗口都办理所有业务.c 太小,经常排长队;c 太大又不经济.现设在每一指定时刻,这n 个人中每一个是否在邮局是独立的,每个人在邮局的概率是p .设计要求:“在每一时刻每窗口排队人数(包括正在被服务的那个人)不超过m ”这个事件的概率要不小于a (例如,0.8,0.9.95a o =或),问至少须设多少窗口? 3.设机器正常时,生产合格品的概率为95%,当机器有故障时,生产合格品的概率为50%,而机器无故障的概率为95%.某天上班时,工人生产的第一件产品是合格品,问能以多大的把握判断该机器是正常的?第二章 随机变量与概率分布1. 离散随机变量:取有限或可列个值,i i p x X P ==)(满足(1)0≥i p ,(2)∑iip=1(3)对任意R D ⊂,∑∈=∈Dx i ii pD X P :)(2. 连续随机变量:具有概率密度函数)(x f ,满足(1)1)(,0)(-=≥⎰+∞∞dx x f x f ;(2)⎰=≤≤badx x f b X a P )()(;(3)对任意R a ∈,0)(==a X P3. 几个常用随机变量名称与记号分布列或密度数学期望 方差0—1分布 两点分布 ),1(p B p X P ==)1(,p q X P -===1)0(p pq二项式分布),(p n Bn k q p C k X P k n k kn ,2,1,0,)(===-,np npq泊松分布)(λP,2,1,0,!)(===-k k ek X P kλλλλ几何分布)(p G,2,1 ,)(1===-k p qk X P kp1 2p q 均匀分布),(b a Ub x a a b x f ≤≤-= ,1)(,2ba + 12)(2a b - 指数分布)(λE 0 ,)(≥=-x e x f x λλλ1 21λ正态分布),(2σμN222)(21)(σμσπ--=x ex fμ2σ标准正态分布的分布函数记作()x Φ,即()x Φ221()2t xx e dtπ--∞Φ=⎰,当出0x ≥时,()x Φ可查表得到;当0x <时,()x Φ可由下面性质得到()1()x x Φ-=-Φ.设2~(,)X N μσ,则有()()x F x μσ-=Φ;()()()b a P a X b μμσσ--<≤=Φ-Φ.4. 分布函数 )()(x X P x F ≤=,具有以下性质(1)1)( ,0)(=+∞=-∞F F ;(2)单调非降;(3)右连续; (4))()()(a F b F b X a P -=≤<,特别)(1)(a F a X P -=>; 特别的 ()()(0)P X a F a F a ==-- (5)对离散随机变量,∑≤=xx i ii px F :)(;(6)对连续随机变量,⎰∞-=xdt t f x F )()(为连续函数,且在)(x f 连续点上,)()('x f x F =5. 正态分布的概率计算 以)(x Φ记标准正态分布)1,0(N 的分布函数,则有 (1)5.0)0(=Φ;(2))(1)(x x Φ-=-Φ;(3)若),(~2σμN X ,则)()(σμ-Φ=x x F ;(4)以αu 记标准正态分布)1,0(N 的上侧α分位数,则)(1)(αααu u X P Φ-==> 6. 随机变量的函数 )(X g Y =(1)离散时,求Y 的值,将相同的概率相加;(2)X 连续,)(x g 在X 的取值范围内严格单调,且有一阶连续导数,则|))((|))(()('11y g y g f y f X Y --=,若不单调,先求分布函数,再求导。
7、思考题 1.某地有2500人参加人寿保险,每人在年初向保险公司交付把费12元,若在这一年内死亡,则由其家属从保险公司领取2000元.设该地人口死亡率为1.5%,求保险公司获利不少于10000元的概率. 2.已知二维随机变量(,)X Y 的联合概率函数为 YX 0 1 20 19 118 161 α β 19 问,αβ取何值时,X 与Y 相互独立?第三章 随机向量1. 二维离散随机向量,联合分布列ij j i p y Y x X P ===),(,边缘分布列⋅==i i p x X P )(,j j p y Y P ⋅==)(有(1)0≥ij p ;(2)∑=ijijp1;(3)∑=⋅jij i p p ,∑=⋅iij j p p 2. 二维连续随机向量,联合密度),(y x f ,边缘密度)( ),(y f x f Y X ,有 (1)0),(≥y x f ;(2)⎰⎰+∞∞-+∞∞-=1),(y x f ;(3)⎰⎰=∈Gdxdy y x f G Y X P ),()),((;(4)⎰+∞∞-=dy y x f x f X ),()(,⎰+∞∞-=dx y x f y f Y ),()(3. 二维均匀分布⎪⎩⎪⎨⎧∈=其它 0, ),( ,)(1),(G y x G m y x f ,其中)(G m 为G 的面积4. 二维正态分布),,,,(~) ,(222121ρσσμμN Y X ,其密度函数(牢记五个参数的含义)⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+-------=2222212121212221)())((2)()1(21ex p 121),(σμσσμμρσμρρσπσy y x x y x f 且),(~ ),,(~222211σμσμN Y N X ;5. 二维随机向量的分布函数 ),(),(y Y x X P y x F ≤≤=有(1) (,)0,,f x y x y ≥-∞<<+∞; (2) (,)1f x y dxdy +∞+∞-∞-∞=⎰⎰;(3) 设(,)X Y 为二维连续型随机变量,则对任意一条平面曲线L ,有((,))0P X Y L ∈=;(4)关于y x ,单调非降;(2)关于y x ,右连续; (5)0),(),(),(=-∞-∞=-∞=-∞F y F x F ;(6)1),(=+∞+∞F ,)(),(x F x F X =+∞,)(),(y F y F Y =+∞;(7)),(),(),(),() ,(111221222121y x F y x F y x F y x F y Y y x X x P +--=≤<≤<;(8)对二维连续随机向量,yx y x F y x f ∂∂∂=),(),(2(9) 设(,)X Y 为二维连续型随机变量,则对平面上任一区域D 有((,))(,)DP X Y D f x y dxdy∈=⎰⎰.6.概率密度()f x 及连续型随机变量的性质 (1)()0;f x ≥ (2)()1f x dx +∞-∞=⎰;(3)连续型随机变量X 的分布函数为()F x 是连续函数,且在()F x 的连续点处有()()F x f x '=;(4)设X 为连续型随机变量,则对任意一个实数c ,()0P X c ==; (5) 设()f x 是连续型随机变量X 的概率密度,则有()()()()P a X b P a X b P a X b P a X b <<=≤<=≤≤=<≤=()ba f x dx⎰.7.二维连续型随机变量(,)X Y 的边缘概率密度设(,)f x y 为二维连续型随机变量的联合概率密度,则X 的边缘概率密度为()(,)X f x f x y dy+∞-∞=⎰;Y 的边缘概率密度为()(,)Y f y f x y dx +∞-∞=⎰.8.二维连续型随机变量(,)X Y 的条件概率密度设(,)f x y 为二维连续型随机变量的联合概率密度,则X 在给定Y y =的条件下的条件概率密度为|(,)(|),()X Y Y f x y f x y x f y =-∞<<+∞,其中()0Y f y >;Y 在给定X x =的条件下的条件概率密度为|(,)(|),()Y X X f x y f y x y f x =-∞<<+∞,其中()0X f x >.9.常用的二维连续型随机变量 (1) 均匀分布如果(,)X Y 在二维平面上某个区域G 上服从均匀分布,则它的联合概率密度为1,(,)x y f x y G ⎧∈⎪=⎨⎪⎩,()G;的面积0,其余. (2) 二维正态分布221212(,,,,)N μμσσρ 如果(,)X Y 的联合概率密度2211212222112112()()()()11(,)exp 22(1)21x x y x f x y μμμμρρσσσσπσσρ⎧⎫⎡⎤----⎪⎪=--+⎨⎬⎢⎥-⎪⎪-⎣⎦⎩⎭则称(,)X Y 服从二维正态分布,并记为221212(,)~(,,,,)X Y N μμσσρ.如果221212(,)~(,,,,)X Y N μμσσρ,则211~(,)X N μσ,222~(,)Y N μσ,即二维正态分布的边缘分布还是正态分布.7.随机变量的独立性 Y X ,独立)()(),(y F x F y x F Y X =⇔ (1) 离散时 Y X ,独立j i ij p p p ⋅⋅=⇔(2) 连续时 Y X ,独立)()(),(y f x f y x f Y X =⇔(3) 二维正态分布Y X ,独立0=⇔ρ,且),(~222121σσμμ+++N Y X 8.随机变量的函数分布(1)和的分布 Y X Z +=的密度⎰⎰+∞∞-+∞∞--=-=dx x z x f dy y y z f z f Z ),(),()(以上两个公式也称为卷积公式.(2)最大最小分布 max(,)Z X Y =的分布函数为()()()Z X Y F z F z F z =特别有下面的结论:设211~(,)X N μσ,222~(,)Y N μσ,且X 与Y 相互独立,则221212~(,)X Y N μμσσ+++.9、思考题1.设随机变量(,)X Y 的概率密度为(),0,0,(,)0,x y xye x y f x y -+⎧≥≥=⎨⎩其它. 求(3).P X Y ≥2.若X Y 与为相互独立的分别服从[0,1]上均匀分布的随机变量,试求Z X Y =+的分布密度函数.第四章 随机变量的数字特征1.期望(1) 离散时 ∑=iii px X E )(,∑=iiipx g X g E )())(( ;(2) 连续时⎰+∞∞-=dx x xf X E )()(,⎰+∞∞-=dx x f x g X g E )()())((;(3) 二维时∑=ji ij jip yx g Y X g E ,),()),((,dy dx y x f y x g Y X g E ⎰⎰+∞∞-+∞∞-=),(),()),((()(,)E x xf x y dxdy +∞+∞-∞-∞=⎰⎰,()(,)E Y yf x y dxdy+∞+∞-∞-∞=⎰⎰.2.数学期望的性质(1) ()E c c = (其中c 为常数);(2) ()()E kX b kE X b +=+ (,k b 为常数); (3) ()()()E X Y E X E Y +=+;(4) 如果X 与相互独立,则()()()E XY E X E Y =.3.方差(1)方差222)()())(()(EX X E X E X E X D -=-=,标准差)()(X D X =σ;(2))()( ,0)(X D C X D C D =+=; (3))()(2X D C CX D =;(4)Y X ,独立时,)()()(Y D X D Y X D +=+当X 为连续型随机变量,其概率密度为()f x ,如果广义积分2(())()x E X f x dx+∞-∞-⎰收敛,则X 的方差为2()(())()D X x E x f x dx+∞-∞=-⎰.3.协方差(1))()()())]())(([(),(Y E X E XY E Y E Y X E X E Y X Cov -=--=; (2)),(),( ),,(),(Y X abCov bY aX Cov X Y Cov Y X Cov ==; (3)),(),(),(2121Y X Cov Y X Cov Y X X Cov +=+;(4)0),(=Y X Cov 时,称Y X ,不相关,独立⇒不相关,反之不成立,但正态时等价; (5)),(2)()()(Y X Cov Y D X D Y X D ++=+ 4.相关系数 )()(),(Y X Y X Cov XY σσρ=;有1||≤XY ρ,1)( ,,1||=+=∃⇔=b aX Y P b a XY ρ相关系数XY ρ反映了随机变量X 与Y 之间线性关系的紧密程度,当||XY ρ越大,X 与Y 之间的线性相关程度越密切,当0XYρ=时,称X 与Y 不相关.相关系数具有下列性质:(1) ||1XY ρ≤;(2) ||1XY ρ=的充要条件是()1P Y aX b =+=,其中,a b 为常数;(3) 若随机变量X 与Y 相互独立,则X 与Y 不相关,即0XY ρ=,但由0XY ρ=不能推断X 与Y 独立.(4) 下列5个命题是等价的: .(i) 0XYρ=;(ii) cov(,)0X Y =;(iii) ()()()E XY E X E Y =;(iv) ()()()D X Y D X D Y +=+); (v) ()()()D X Y D X D Y -=+. 利用协方差或相关系数可以计算()()()2cov(,)()()2()()XY D X Y D X D Y X Y D X D Y D X D Y ρ±=+±=+±.5.随机变量X 的k 阶原点矩定义为()kE X ; 随机变量X 的k 阶中心矩定义为[(())]k E X E X -]; 随机变量(,)X Y 的(,)k l 阶混合原点矩定义为()k lE X Y ; 随机变量(,)X Y 的(,)k l 阶混合中心矩定义为[(())(())]k l E X E X Y E Y --. 一阶原点矩是数学期望()E X ;二阶中心矩是方差D(X);(1,1)阶混合中心矩为协方差cov(,)X Y . 9.常用分布的数字特征(1) 当X 服从二项分布(,)B n p 时,(),()(1)E X np D X np p ==-. (2) 当X 服从泊松分布()p λ时,(),()E X D X λλ==, (3) 当X 服从区间(,)a b 上均匀分布时,2()(),()212a b b a E X D X +-==(4) 当X 服从参数为λ的指数分布时,211(),()E X D X λλ== (5) 当X 服从正态分布2(,)N μσ时, 2(),()E X D X μσ==.(6) 当(,)X Y 服从二维正态分布221212(,,,,)N μμσσρ时, 211(),()E X D X μσ==;222(),()E Y D Y μσ==;12cov(,),XY X Y ρσσρρ==10.分位数设X 为任意一个随机变量,对于01p <<,如果实数c 满足()()1P X c p P X c p ≤≥≥≥-且,则称c 是X (或X 所服从的分布)的p 分位数,记作p v.当12p =时,称1/2v 为中位数.对连续型随机变量X ,记其密度函数为()f x ,如果X 的值域是某个区间,则().pv f x dx p -∞=⎰三、思考题1.设2~(,)X N μσ,求||kE X μ-.2.设X 的密度函数为22/22,0,()(0,0.x a x ex f x a a x -⎧>⎪=⎨⎪≤⎩为正常数)记1Y X =,求Y 的数学期望().E Y 3. 一学徒工用车床接连加工10个零件,设第i 个零件报废的概率为11i +(1,2,,10)i =,求报废零件个数的数学期望.第五章 大数定律与中心极限定理1.Chebyshev 不等式 (切比雪夫不等式)2)(}|)({|εεX D X E X P ≤≥- 或2)(1}|)({|εεX D X E X P -≥<-2.大数定律1).切比雪夫大数定律设随机变量12,,,,n X X X ,相互独立,数学期望(),(),1,2,i i E X D X i =…,都存在,且方差是一致有上界的,即存在常数c ,使得(),1,2,,,i D X c i n <=则对于任何正数ε,有1111lim (|()|)1n ni i n i i P X E X n n ε→∞==-<=∑∑2).辛钦大数定律(独立同分布大数定律)设随机变量12,,,,n X X X 相互独立且同分布,并具有有限的数学期望μ和方差2σ,则对任何正数ε,有11lim (||)1ni n i P X n με→∞=-<=∑3).伯努里大数定律设随机变量(,)n Y B n p ,则对任意正数ε,有lim (||)1n n YP p n ε→∞-<=3.中心极限定理(1)设随机变量n X X X ,,,21 独立同分布2)( ,)(σμ==i i X D X E ,则) ,(~21σμn n N X ni i ∑=近似, 或) ,(~121n N X n n i i σμ∑=近似 或)0,1(~ 1N n n X ni i近似σμ∑=-,(2)棣莫弗-拉普拉斯中心极限定理设随机变量(,)n Y B n p ,则对任意一个实数x ,有lim ()()(1n n Y npP x x np p→∞-≤=Φ-.这个定理的直观意义是,当n 足够大时,服从二项分布的随机变量n Y可认为近似服从正态分布(,(1))N np np p -.思考题1.用切比雪夫不等式确定当掷一均匀硬币时,需投多少次才能保证使得正面出现的频率在0.4至0.6之间的概率不小于90%,并用正态逼近计算同一问题.2.根据遗传学理论,红黄两种番茄杂交第二代结红果植株和黄果植株的比率为3:1,现种植杂交种432株,试问(1)黄株介于108和117之间的概率;是多少? (2)红株介于315和324之间的概率是多少? (提示:使用中心极限定理计算)第六章 样本及抽样分布1.总体、样本(1)当 X 服从正态分布时,称总体X 为正态总体。