概率论与数理统计复习提纲PDF.pdf
- 格式:pdf
- 大小:557.40 KB
- 文档页数:11
《概率论与数理统计》复习资料一、复习提纲注:以下是考试的参考内容,不作为实际考试范围,仅作为复习参考之用。
考试内容以教学大纲和实施计划为准;注明“了解”的内容一般不考。
1、能很好地掌握写样本空间与事件方法,会事件关系的运算,了解概率的古典定义2、能较熟练地求解古典概率;了解概率的公理化定义3、掌握概率的基本性质和应用这些性质进行概率计算;理解条件概率的概念;掌握加法公式与乘法公式4、能准确地选择和运用全概率公式与贝叶斯公式解题;掌握事件独立性的概念及性质。
5、理解随机变量的概念,了解(0—1)分布、二项分布、泊松分布的分布律。
6、理解分布函数的概念及性质,理解连续型随机变量的概率密度及性质。
7、掌握指数分布(参数 )、均匀分布、正态分布,特别是正态分布概率计算8、会求一维随机变量函数分布的一般方法,求一维随机变量的分布律或概率密度。
9、会求分布中的待定参数。
10、会求边缘分布函数、边缘分布律、条件分布律、边缘密度函数、条件密度函数,会判别随机变量的独立性。
11、掌握连续型随机变量的条件概率密度的概念及计算。
12、理解二维随机变量的概念,理解二维随机变量的联合分布函数及其性质,理解二维离散型随机变量的联合分布律及其性质,理解二维连续型随机变量的联合概率密度及其性质,并会用它们计算有关事件的概率。
13、了解求二维随机变量函数的分布的一般方法。
14、会熟练地求随机变量及其函数的数学期望和方差。
会熟练地默写出几种重要随机变量的数学期望及方差。
15、较熟练地求协方差与相关系数.16、了解矩与协方差矩阵概念。
会用独立正态随机变量线性组合性质解题。
17、了解大数定理结论,会用中心极限定理解题。
18、掌握总体、样本、简单随机样本、统计量及抽样分布概念,掌握样本均值与样本方差及样本矩概念,掌握2分布(及性质)、t分布、F分布及其分位点概念。
19、理解正态总体样本均值与样本方差的抽样分布定理;会用矩估计方法来估计未知参数。
提纲第一部分 基本概念和基本定理【内容提要】(红色字体部分为复习重点)【释疑解惑】问题1:AB 与AB 是否相等?答:不一定相等.由对偶律可知,AB A B A B ==;而AB A B =.问题2:事件的相容性与独立性在逻辑上是否存在因果关系? 答:如下表所示,事件的相容性与独立性在逻辑上不存在因果关系.问题3:设()()()P AB P A P B =,()()()P AC P A P C =,()()()P BC P B P C =同时成立,能否推出()()()()P ABC P A P B P C =成立?答:不能(例如第2章课件中的伯恩斯坦反例),由此可以看出“两两独立”和“相互独立”并不等价.问题4:下列式子中的等号何时成立?()()()()()()()(|)()()()()()()P A B P A P B P AB P A P B P A P B A P A P B P A P B P A P B =+-=+-=+-=+答:第一个等号总成立;当()0P A >时,第二个等号成立;当,A B 独立时,第三个等号成立;当,A B 不相容时,第四个等号成立.问题5:不可能事件与零概率事件是否相等?必然事件与概率为1的事件是否相等? 答:不可能事件是零概率事件,但反之不然; 必然事件是概率为1的事件,但反之亦不然.第二部分 随机变量及其分布【内容提要】(红色字体部分为复习重点)【释疑解惑】问题1:离散型随机变量与连续型随机变量的联系与区别? 答: 2,,1ii p∞=∑一定成立.连续型随机变量还具有一个特殊性质:0, ()0C P C ξ∀>==,即任一基本事件发生的概率为零.从而可以推出下列结论:①不可能事件是零概率的事件,但反之不然;必然事件是概率为1的事件,但反之亦不然.②()()()()()baP a b P a b P a b P a b f x dx ξξξξ≤≤=<≤=≤<=<<=⎰.问题2:连续型随机变量的密度函数是否一定是连续函数? 答:不一定,均匀分布的密度函数并不连续.问题3:分布曲线(曲面)是分布函数的图像吗? 答:不是,分布曲线(曲面)是密度函数的图像.问题4:密度函数是否由分布函数唯一确定?()()dF x f x dx=何时成立? 答:不是,因为修改密度函数在个别点处的函数值对其积分的值(概率)没有影响. 对()f x 的连续点,有()()dF x f x dx=.问题5:联合分布、边缘分布、条件分布之间的联系与区别? 答:从分布函数的定义来看,分布函数几何意义联合分布(,)(,)F x y P x y ξη=≤≤边缘分布()(,)(,)F x P x F x ξξη=≤<+∞=+∞条件分布对使得()0f y η>的点y (这个条件不能少),|(,)(|)(|)()P x y F x y P x y P y ξηξηξηη≤==≤===从分布律的定义来看,分布律几何意义联合分布(,)i j ijP x y pξη===•边缘分布律体现为同一行概率求和.•条件分布律体现为ijp在同一行概率中所占的比重.注意:条件分布中“.ip>”的条件不能少!边缘分布.1()i ij ijP x p p ξ∞====∑条件分布当.ip>时,. (|)ijj iip P y xp ηξ===从密度函数的定义来看,密度函数几何意义联合分布(,) f x y边缘分布()(,) f x f x y dy ξ+∞-∞=⎰条件分布对使得()0f yη>的点y,|(,)(|)()f xf xyyyfξηη=注意:条件分布中“()0f yη>”的条件不能少!三种概率分布之间的相互转化关系是ξη,何时可以由ξ和η的边缘分布完全确定联合分布?问题6:给定二维随机变量(,)答:当ξ和η相互独立时,可以由边缘分布完全确定联合分布.ξη的边缘分布是正态分布,能否由此确定联合分布是二维正问题7:已知二维随机变量(,)态分布?答:不能,反例请参考P.146例19.第三部分随机变量的数字特征【内容提要】复习重点:期望、方差、协方差、相关系数的性质.1.期望和方差的定义、性质1,2,Eξ(要求积分绝对收敛)Eg(2.协方差和相关系数的定义、性质【释疑解惑】问题1:是否所有随机变量都存在数学期望?答:不是,反例请参考P.74例22及P.98例7.因为方差本质上是随机变量的函数的期望,所以并非所有随机变量都存在方差.问题2:随机变量的不相关性与独立性是否等价?答:“不相关”是指两个随机变量之间不存在线性函数的关系,“独立”是指两个随机变量不存在任何关系。
第二章 随机变量及其分布上一章研究内容: 事件(集合A )→ 概率(数).本章将用函数研究概率,函数是数与数的关系,即需要用数反映事件——随机变量.事件(数)→ 概率(数).§2.1 随机变量及其分布2.1.1.随机变量的概念随机试验的样本点有些是定量的:如掷骰子掷出的点数,电子元件使用寿命的小时数.有些是定性的:如掷硬币正面或反面,检查产品合格或不合格.对于定性的结果也可以规定其数量性质:如掷硬币,正面记为1,反面记为0;检查产品,合格记为1,不合格记为0.随机试验中,可将每一个样本点ω 都对应于一个实数X (ω),称为随机变量(Random Variable ),常用大写英文字母X , Y , Z 等表示随机变量,而随机变量的具体取值通常记为小写英文字母x , y , z .对于随机变量首先应掌握它的全部可能取值:如掷硬币,⎩⎨⎧=反面正面,0,1X ,X 的全部可能取值为0, 1;掷两枚骰子,X 表示掷出的点数之和,X 的全部可能取值为2, 3, 4, … , 12 ;观察某商店一小时内的进店人数X ,X 的全部可能取值为0, 1, 2, … ;电子元件使用寿命,用X 表示使用的小时数,X 的全部可能取值为 ),0[∞+; 一场足球比赛(90分钟),用X 表示首次进球时间(分钟),若为0:0,记X = 100,X 的全部可能取值为 (0, 90 )∪{100};注意:1. 每个样本点都必须对应于一个实数,2.不同样本点可以对应于同一个实数,3.随机变量的每一取值或取值范围都表示一个事件.应掌握将随机变量的取值或取值范围描述为事件,又能将事件用随机变量表达的方法. 例 掷一枚骰子,用X 表示出现的点数,则 X = 1表示出现1点;X > 4表示点数大于4,即出现5点或6点;X ≤ 0为不可能事件.又出现奇数点,即X = 1, 3, 5;点数不超过3,即X ≤ 3. 例 X 表示商店一天中某商品的销售件数(顾客的需求件数), 则 X = 0表示没有销售;X ≤ 10表示销售不超过10件.又销售5件以上(不含5件)即X > 5;若该商店准备了a 件该商品,事件“能满足顾客需要”,即X ≤ a . 例 X 表示一只电子元件的使用寿命(小时), 则 X = 1000表示该元件恰好使用了1000小时,X ≥ 800表示该元件使用寿命在800小时以上. 例 90分钟足球比赛,X 表示首次进球时间(分钟),且0:0时,记X = 100, 则 X = 10表示上半场第10分钟首次进球.又上半场不进球即X > 45;开场1分钟内进球即X ≤ 1.如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.(注:可列个即可以排成一列,一个一个往下数,如非负整数0, 1, 2, 3, … )离散型随机变量的全部可能取值是实数轴上一些离散的点,而连续型随机变量的全部可能取值是实数轴上一个区间或多个区间的并,如电子元件使用寿命X (小时),全部可能取值是),0[∞+.下面按离散型和连续型分别进行讨论.2.1.2. 离散随机变量的概率分布列对于随机变量还应该掌握它的每一取值或取值范围表示事件的概率.定义 如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.设离散型随机变量X 的全部可能取值为x 1, x 2, …, x k , …,则X 取值x k 的概率p k = p (x k ) = P {X = x k }, k = 1, 2, …… 称为离散型随机变量的概率分布函数(Probability Distribution Function ,PDF ),简称概率分布或概率函数.直观上,又写为L LLL)()()(2121k kx p x p x p Px x x X 或 ⎟⎟⎠⎞⎜⎜⎝⎛L L L L)()()(~2121k k x p x p x p x x x X , 称为X 的概率分布列.如掷一枚骰子,X 表示出现的点数,X 的分布列为616161616161654321PX . 概率函数基本性质:(1)非负性 p (x k ) ≥ 0 , k = 1, 2, ……; (2)正则性1)(1=∑∞=k kxp .这是因为事件X = x 1 , X = x 2 , … , X = x k , … 是一个完备事件组, 故P {X = x 1} + P {X = x 2} + … + P {X = x k } + … = P (Ω) = 1,即p (x 1) + p (x 2) + … + p (x k ) + … = 1. 例 设盒中有2个红球3个白球,从中任取3球,以X 表示取得的红球数.求X 的分布列. 解:X 的全部可能取值0, 1, 2 ,样本点总数为1035=⎟⎟⎠⎞⎜⎜⎝⎛=n ,X = 0表示“取到3个白球”,所含样本点个数为1330=⎟⎟⎠⎞⎜⎜⎝⎛=k ,有1.0101)0(==p , X = 1表示“取到1个红球2个白球”,所含样本点个数为612231=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有6.0106)1(==p , X = 2表示“取到2个红球1个白球”,所含样本点个数为322132=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有3.0103)2(==p . 故X 的分布列为3.06.01.0210P X.求离散型随机变量X 的概率分布步骤: (1)找出X 的全部可能取值,(2)将X 的每一取值表示为事件, (3)求出X 的每一取值的概率.例 现有10件产品,其中有3件不合格.若不放回抽取,每次取一件,直到取得合格品为止.用X 表示抽取次数,求X 的概率分布. 解:X 的全部可能取值1, 2, 3, 4 ,X = 1表示“第1次就取得合格品”,有107)1(=p , X = 2表示“第2次取得合格品且第1次是不合格品”,有30797103)2(=⋅=p , X = 3表示“第3次取得合格品且前两次是不合格品”,有12078792103)3(=⋅⋅=p , X = 4表示“第4次取得合格品且前三次是不合格品”,有1201778192103)4(=⋅⋅⋅=p , 故X 的分布列为120112073071074321PX . 例 上例若改为有放回地抽取,又如何? 解:X 的全部可能取值1 , 2 , … , n , … ,7.0107)1(==p ,21.0107103)2(=⋅=p ,7.03.0)3(2×=p ,…,7.03.0)(1×=−k k p ,…, 故X 的概率函数为L ,2,1,7.03.0)(1=×=−k k p k ;X 的分布列为LL L L 7.03.07.03.021.07.032112××−k PkX .例 若离散型随机变量的概率函数为kCk p =)(,k = 1, 2, 3, 4,且C 为常数. 求:(1)C 的值,(2)P {X = 3},(3)P {X < 3}.解:(1)由正则性知:1432)4()3()2()1(=+++=+++CC C C p p p p ,即11225=C ,故2512=C .(2)254)3(}3{===p X P , (3)25182562512)2()1(}3{=+=+=<p p X P . 2.1.3.随机变量的分布函数连续型随机变量在单个点取值概率为零,如电子元件使用寿命恰好为1000小时这个事件的概率就等于零,因此连续型随机变量不能考虑概率函数.为了用单独一个变量表示一个区间,特别地取区间 (−∞, x ].定义 随机变量X 与任意实数x ,称F (x ) = P {X ≤ x },−∞ < x < +∞为X 的累积分布函数(Cumulative Distribution Function ,CDF ),简称分布函数.P {a < X ≤ b } = P {X ≤ b } − P {X ≤ a } = F (b ) − F (a ),P {X > a } = 1 − P {X ≤ a } = 1 − F (a ),由概率的连续性知)0()(lim }{lim }{−==≤=<−−→→a F x F x X P a X P ax ax ,且P {X = a } = P {X ≤ a } − P {X < a } = F (a ) − F (a – 0),可见X 在任一区间上或任一点取值的概率都可用分布函数表示. 例 已知随机变量X 的分布列为3.05.02.0210PX ,求X 的分布函数.解:X 的全部可能取值为0, 1, 2,当x < 0时,F (x ) = P {X ≤ x } = P (∅) = 0, 当0 ≤ x < 1时,F (x ) = P {X ≤ x } = p (0) = 0.2,当1 ≤ x < 2时,F (x ) = P {X ≤ x } = p (0) + p (1) = 0.7, 当x ≥ 2时,F (x ) = P {X ≤ x } = P (Ω ) = 1,故⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=.2,1,21,7.0,10,2.0,0,0)(x x x x x F若离散型随机变量的全部可能取值为x 1, x 2, ……,概率函数p (x k ) = p k ,k = 1, 2, ……,则分布函数∑≤=≤=xx kk xp x X P x F )(}{)(.且离散型随机变量的分布函数F (x )是单调不减的阶梯形函数,X 的每一可能取值x k 是F (x )的跳跃点,跳跃高度是相应概率p (x k ).例 已知某离散型随机变量X 的分布函数为⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤−−<=,5,1,52,6.0,20,4.0,01,3.01,0)(x x x x x x F 求X 的分布列. 解:X 的全部可能取值是F (x )的跳跃点,即 −1, 0, 2, 5,跳跃高度依次为:p (−1) = 0.3 − 0 = 0.3; p (0) = 0.4 − 0.3 = 0.1; p (2) = 0.6 − 0.4 = 0.2; p (5) = 1 − 0.6 = 0.4.故X 的分布列为4.02.01.03.05201PX −.分布函数的基本性质:(1)单调性,F (x ) 单调不减,即x 1 < x 2时,F (x 1) ≤ F (x 2); (2)正则性,F (−∞) = 0,F (+∞) = 1;(3)连续性,F (x ) 右连续,即)()(lim 00x F x F x x =+→. 证:(1)当x 1 < x 2时,{X ≤ x 1} ⊂ {X ≤ x 2},有F (x 1) ≤ F (x 2);(2)F (−∞) = P {X < −∞} = P (∅) = 0,F (+∞) = P {X < +∞} = P (Ω ) = 1;(3)任取单调下降且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n ≤=≤=≤∞=∞→I ,根据概率的连续性知}{}{}{lim 01x X P x X P x X P n n n n ≤=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→I ,即)()(lim 00x F x F x x =+→. 但F (x )不一定左连续,任取单调增加且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n <=≤=≤∞=∞→U ,得}{}{}{lim 01x X P x X P x X P n n n n <=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→U , 故}{)(}{)(lim 0000x X P x F x X P x F x x =−=<=−→.2.1.4. 连续随机变量的概率密度函数离散型随机变量的全部可能取值是有限或可列个点,连续型随机变量的全部可能取值是实数区间.但连续型随机变量在单独一个点取值的概率为0,其概率函数无实际意义,对于连续随机变量通常考虑其在某个区间上取值的概率,这就需要讨论分布函数.连续型随机变量的分布函数是连续函数. 注意:概率为0的事件不一定是不可能事件.定义 随机变量X 的分布函数F (x ),若存在函数p (x ),使 ∫∞−=xdu u p x F )()(,则称X 为连续型随机变量,p(x )为X 的概率密度函数(可以理解为:p (u )为概率密度,p (u )du 为X 在该小区间内取值的概率,∫∞−x 为从−∞ 到x 无限求和.几何意义:在平面上作出密度函数p (x )的图形,则阴影部分的面积即为F (x )的值.密度函数基本性质:(1)非负性 p (x ) ≥ 0;(2)正则性 1)(=∫∞+∞−dx x p .因)()(x F du u p x =∫∞−,有1)()(=+∞=∫∞+∞−F dx x p .连续型随机变量的性质:设连续型随机变量X 的概率密度函数为p (x ),分布函数为F (x ),则有 (1)∫=−=≤<21)()()(}{1221x x dx x p x F x F x X x P ;(2)当p (x ) 连续时,p (x ) = F ′(x ); 因∫∞−=x du u p x F )()(,当p (x ) 连续时,有)(])([)(x p du u p x F x=′=′∫∞−(3)X 在单独一个点取值的概率为0,其分布函数为连续函数;(4)P {x 1 < X ≤ x 2} = P {x 1 ≤ X ≤ x 2} = P {x 1 < X < x 2} = P {x 1 ≤ X < x 2},即连续型...随机变量在某区间内的概率与区间开闭无关,离散型则不成立;(5)只在有限个点上取值不相同的密度函数对应于同一个分布函数,一般,只在概率为0的数集上取值不相同的密度函数都对应于同一个分布函数.例 设F (x ) = A + B arctan x 为某连续型随机变量X 的分布函数. 求:(1)A , B ; (2)}31{≤≤−X P ; (3)密度函数p (x ). 解:(1)由正则性 F (−∞) = 0,F (+∞) = 1,得:02π)arctan (lim =−=+−∞→B A x B A x ,12π)arctan (lim =+=++∞→B A x B A x ,故21=A ,π1=B ;(2)x x F arctan π121)(+=,得1274ππ1213ππ121)1()3(}31{=⎥⎦⎤⎢⎣⎡⎟⎠⎞⎜⎝⎛−⋅+−⎟⎠⎞⎜⎝⎛⋅+=−−=≤≤−F F X P . (3)密度函数)1π(1)()(2x x F x p +=′=.例 已知⎩⎨⎧<<−=,,0,10),()(32其它x x x C x p是某连续型随机变量X 的密度函数,求:(1)C , (2)}211{<<−X P , (3)分布函数F (x ).解:(1)由正则性:1)(=∫∞+∞−dx x p ,得1120)4131()43()(10431032==−−=−=−∫C C x x C dx x x C ,故C = 12;(2)165)641241(12)43(12)(12)(}211{2104321032211=−=−=−==<<−∫∫−x x dx x x dx x p X P ;(3)X 的全部可能取值为 [0, 1],分段点0, 1,当x < 0时,0)()(==∫∞−xdu u p x F ,当0 ≤ x < 1时,4304303234)43(12)(12)()(x x u u du u u du u p x F xxx−=−=−==∫∫∞−,当x ≥ 1时, 1)(12)()(132=−==∫∫∞−du u u du u p x F x,故⎪⎩⎪⎨⎧≥<≤−<=.1,1,10,34,0,0)(43x x x x x x F例 已知⎩⎨⎧<<−=,,0,11|,|)(其它x x x p是某连续型随机变量X 的密度函数,求分布函数F (x ).解:分段点−1, 0, 1,当x < −1时,0)()(==∫∞−xdu u p x F ;当−1 ≤ x < 0时, 212122)()()(22121x x u du u du u p x F xxx−=+−=−=−==−−∞−∫∫; 当0 ≤ x < 1时,21221022)()()(220212001x x u u udu du u du u p x F xxx+=++=+−=+−==−−∞−∫∫∫;当x ≥ 1时, 1)()()(101=+−==∫∫∫−∞−udu du u du u p x F x.故⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤+<≤−−<=.1,1,10,21,01,21,0,0)(22x x x x xx x F§2.2 随机变量的数学期望对于随机变量,还应当掌握反映其平均值、分散程度等的指标,这就需要引入数学期望和方差等概念. 2.2.1.数学期望的概念例 甲、乙两个射击选手,在射击训练中甲射了10次,其中3次10环,1次9环,4次8环,2次7环;乙射了15次,其中2次10环,9次9环,2次8环,2次7环.问谁的表现更好? 分析:比较他们射中的平均环数甲共射中3 × 10 + 1 × 9 + 4 × 8 + 2 × 7 = 85环,平均每次射中5.81085=环; 乙共射中2 × 10 + 9 × 9 + 2 × 8 + 2 × 7 = 131环,平均每次射中73.815131=&环. 故乙的表现更好.一般地,若在n 次试验中,出现了m 1次x 1,m 2次x 2,…,m k 次x k ,(其中m 1 + m 2 + … + m k = n ),则平均值为∑==+++ki i i k k n mx n x m x m x m 12211L ,即平均值等于取值与频率乘积之和.因n 很大时,频率稳定在概率附近,即平均值将稳定在取值与概率乘积之和附近. 2.2.2.数学期望的定义定义 设离散型随机变量X 的分布列是⎟⎟⎠⎞⎜⎜⎝⎛L L L L )()()(~2121k kx p x p x p x x x X ,如果级数∑∞=1)(k k k x p x 绝对收敛,则称之为X 的数学期望(Expectation ),记为E (X ). 数学期望的实际意义是反映随机变量的平均取值,是其全部可能取值以相应概率为权数的加权平均.如X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−2.04.01.03.04102,则E (X) = (−2) × 0.3 + 0 × 0.1 + 1 × 0.4 + 4 × 0.2 = 0.6. 例 某人有4发子弹,现在他向某一目标射击,若命中目标就停止射击,否则直到子弹用完为止.设每发子弹命中率为0.4,以X 表示射击次数,求E (X ). 解:先求X 的分布列,X 的全部可能取值为1, 2, 3, 4,X = 1,第一枪就命中, p (1) = 0.4;X = 2,第一枪没有命中,第二枪命中,p (2) = 0.6 × 0.4 = 0.24; X = 3,前两枪没有命中,第三枪命中,p (3) = 0.6 2 × 0.4 = 0.144; X = 4,前三枪没有命中, p (4) = 0.6 3 = 0.216.则X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛216.0144.024.04.04321,故E (X ) = 1 × 0.4 + 2 × 0.24 + 3 × 0.144 + 4 × 0.216 = 2.176.例 若X 的概率函数为L ,2,1,21)2(==⎟⎟⎠⎞⎜⎜⎝⎛−k kp k k,求E (X ). 解:因∑∑∞=∞=−=⋅−11)1(21)2(k kk k k k k 收敛但不是绝对收敛,故E (X ) 不存在.离散型随机变量的数学期望是取值乘概率求和:∑∞=1)(k k k x p x ,类似可定义连续型随机变量的数学期望是取值乘密度积分:∫+∞∞−dx x xp )(.定义 设连续型随机变量X 的密度函数为p (x ).如果广义积分∫+∞∞−dx x xp )(绝对收敛,则称之为X 的数学期望,记为E (X ).例 已知连续型随机变量X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其它x x x p 求E (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xp X E . 例 已知X 的密度函数为⎩⎨⎧<<+=.,0,20,)(其它x bx a x p 且32)(=X E ,求a , b . 解:由正则性得122)2()()(2220=+=⋅+=+=∫∫∞+∞−b a x b ax dx bx a dx x p ,又32382)32()()()(20322=+=⋅+⋅=+==∫∫∞+∞−b a x b x a dx bx a x dx x xp X E ,故21,1−==b a . 例 已知X 的密度函数为+∞<<∞−+=x x x p ,)1π(1)(2,求E (X ).解:因+∞∞−+∞∞−+∞∞−+∞∞−+=⋅+=+=∫∫∫)1ln(π21)(21)1π(1)1π()(2222x x d x dx x x dx x xp 发散, 故E (X )不存在. 2.2.3.数学期望的性质设X 为随机变量,g (x ) 为函数,则称Y = g (X ) 为随机变量函数,Y 也是一个随机变量.下面不加证明地给出随机变量函数的数学期望计算公式.定理 设X 为随机变量,Y = g (X ) 为随机变量函数,则(1)若X 为离散型随机变量,概率函数为p(x k ), k = 1, 2, …,则∑∞===1)()()]([)(k k k x p x g X g E Y E ;(2)若X 为连续型随机变量,密度函数为p (x ),则∫+∞∞−==dx x p x g X g E Y E )()()]([)(.数学期望具有以下性质:(1)常数的期望等于其自身,即E (c ) = c ;(2)常数因子可移到期望符号外,即E (aX ) = a E (X );(3)随机变量和的期望等于期望的和,即E [g 1 (X ) + g 2 (X )] = E [g 1 (X )] + E [g 2 (X )]. 证明:(1)将常数c 看作是单点分布p (c ) = 1,故E (c ) = c p (c ) = c ;(2)以连续型为例加以证明,)()()()(X aE dx x xp a dx x axp aX E ===∫∫+∞∞−+∞∞−;(3)以连续型为例加以证明,∫∫∫+∞∞−+∞∞−+∞∞−+=+=+dx x p x g dx x p x g dx x p x g x g X g X g E )()()()()()]()([)]()([212121= E [g 1 (X )] + E [g 2 (X )].由性质(2)、(3)知随机变量线性组合的期望等于期望的线性组合,可见数学期望具有线性性质. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−3.04.01.02.02101, 求E (2X +1),E (X 2).解:E (2X +1) = −1 × 0.2 + 1 × 0.1 + 3 × 0.4 + 5 × 0.3 = 2.6;E (X 2) = 1 × 0.2 + 0 × 0.1 + 1 × 0.4 + 4 × 0.3 = 1.8. 例 已知圆的半径X 是一个随机变量,密度函数为⎪⎩⎪⎨⎧<<=.,0,31,21)(其他x x p 求圆面积Y 的数学期望. 解:圆面积Y = π X 2,故3π1332π21π)(π)(3133122=⋅=⋅==∫∫∞+∞−xdx x dx x p x Y E . 例 设国际市场对我国某种出口商品的需求量X (吨)的密度函数为⎪⎩⎪⎨⎧<<=.,0,40002000,20001)(其他x x p 设每售出一吨,可获利3万美元,但若销售不出,每积压一吨将亏损1万美元,问如何计划年出口量,能使国家获利的期望最大.解:设计划年出口量为a 吨,每年获利Y 万美元.当X ≥ a 时,销售a 吨,获利3a 万美元;当X < a 时,销售X 吨,积压a − X 吨,获利3X − (a − X ) = 4X − a 万美元;即⎩⎨⎧<≤−≤≤==.2000,4,4000,3)(a X a X X a a X g Y则4000200024000200020003)2(2000120001320001)4()()()(aa a a x a ax x dx a dx a x dx x p x g Y E +−=⋅+⋅−==∫∫∫+∞∞− 8250)3500(10001400071000122+−−=−+−=a a a , 故计划年出口量为3500吨时,使国家获利的期望最大.§2.3 随机变量的方差与标准差数学期望反映平均值,方差反映波动程度.如甲、乙两台包装机,要求包装重量为每袋500克,现各取5袋,重量为甲:498,499,500,501,502; 乙:490,495,500,505,510.二者平均值相同都是500克,但显然甲比乙好.此时比较的是它们的偏差(即取值与平均值之差).偏差:甲:−2,−1,0,1,2;乙:−10,−5,0,5,10. 2.3.1.方差的定义定义 随机变量X 与其数学期望E (X ) 之差X − E (X ) 称为偏差.偏差有大有小,可正可负,比较时需要去掉符号,但绝对值函数进行微积分处理不方便,因此考虑偏差平方的数学期望.定义 随机变量X ,若E [X − E (X )]2存在,则称之为X 的方差(Variance ),记为Var (X ) 或D (X ).即Var (X ) = E [X − E (X )]2.显然方差Var (X ) ≥ 0,称)Var(X 为X 的标准差(Standard Deviation ).在实际问题中,标准差与随机变量有相同的量纲.方差与标准差反映波动程度.方差越大,取值越分散;方差越小,取值越集中. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求E (X ), Var (X ).解:E (X ) = 1 × 0.2 + 2 × 0.4 + 3 × 0.4 = 2.2;Var (X ) = (−1.2)2 × 0.2 + (−0.2)2 × 0.4 + 0.82 × 0.4 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p求E (X ), Var (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xf X E ; 181949821949842)98382()()32()Var(1023410232=+−=⎟⎠⎞⎜⎝⎛+−=+−=−=∫∫∞+∞−x x x dx x x x dx x p x X .例 已知X 的全部可能取值为0, 1, 2,且E (X ) = 1.3,Var (X ) = 0.81.求X 的分布列.解:设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛c b a 210,由正则性得:a + b + c = 1,且E (X ) = 0 × a + 1 × b + 2 × c = b + 2c = 1.3,Var (X ) = (−1.3)2 × a + (−0.3)2 × b + 0.72 × c = 1.69a + 0.09b + 0.49c = 0.81, 解得a = 0.3,b = 0.1,c = 0.6,故X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛6.01.03.0210.2.3.2. 方差的性质方差具有以下性质:(1)方差计算公式:Var (X ) = E (X 2) − [E (X )]2; (2)常数的方差等于零,即Var (c ) = 0;(3)设a , b 为常数,则Var (a X + b ) = a 2 Var (X ). 证:(1)Var (X ) = E [X − E (X )]2 = E [X 2 − 2X ⋅ E (X ) + E (X )2] = E (X 2 ) − 2E (X ) ⋅ E (X ) + [E (X )]2.= E (X 2) − [E (X )]2;(2)Var (c ) = E [c − E (c )]2 = E (c − c )2 = E (0) = 0;(3)Var (a X + b ) = E [(a X + b ) − E (a X + b )]2 = E [a X + b − a E (X ) − b ]2 = a 2 E [X − E (X )]2 = a 2 Var (X ). 由性质(1),显然有以下推论:推论 对于随机变量X ,如果E (X 2) 存在,则E (X 2) ≥ [E (X )]2.以后常利用方差计算公式Var (X ) = E (X 2) − [E (X )]2计算随机变量的方差.通常用公式计算比直接用定义计算方差要方便. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求Var (X ).解:前面已求得E (X ) = 2.2,因E (X 2) = 1 2 × 0.2 + 2 2 × 0.4 + 3 2 × 0.4 = 5.4, 故Var (X ) = E (X 2) − [E (X )]2 = 5.4 − 2.22 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p 求Var (X ).解:前面已求得32)(=X E , 因21422)(141022=⋅=⋅=∫x xdx x X E , 故1813221)]([)()Var(222=⎟⎠⎞⎜⎝⎛−=−=X E X E X . 对于随机变量X ,若方差Var (X ) 存在,且Var (X ) > 0.令)Var()(*X X E X X −=,有0)]()([)Var(1)]([)Var(1)Var()(*)(=−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=X E X E X X E X E X X X E X E X E ; 1)Var()Var(1)](Var[)Var(1)Var()(Var *)Var(==−=⎟⎟⎠⎞⎜⎜⎝⎛−=X X X E X X X X E X X .称X *为X 的标准化随机变量.2.3.3. 切比雪夫不等式方差反映随机变量的分散程度,切比雪夫不等式给出其定量标准.切比雪夫不等式表明大偏差概率的上限与方差成正比.定理 设X 为随机变量,且方差Var (X ) 存在,则对于任何正数ε ,都有2)Var(}|)({|εεX X E X P ≤≥−.证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫≥−=≥−εε|)(|)(}|)({|X E x dx x p X E X P ,且∫∞+∞−−=−=dx x p X E x X E X E X )()]([)]([1)Var(22222εεε,故222|)(|22)Var()()]([)()]([}|)({|εεεεεX dx x p X E x dx x p X E x X E X P X E x =−≤−≤≥−∫∫∞+∞−≥−,得证.注:切比雪夫不等式的等价形式2)Var(1}|)({|εεX X E X P −≥<−.如随机变量X 的数学期望为E (X ) = 10,方差Var (X ) = 1,则由切比雪夫不等式可得43211}2|10{|}128{2=−≥<−=<<X P X P . 例 设随机变量X 的全部可能取值为),0[∞+,且数学期望E (X ) 存在,试证:对任何正数a ,都有)(1}{X E aa X P ≤≥. 证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫+∞=≥a dx x p a X P )(}{,且∫∫+∞+∞∞−==0)()(1)(1dx x p a x dx x xp a X E a ,故)(1)()(}{0X E adx x p a x dx x p a x a X P a =≤≤≥∫∫+∞+∞,得证.定理 设随机变量X 的方差存在,则Var (X ) = 0的充分必要条件是存在常数b ,使得X 几乎处处收敛于b ,即P {X = b } = 1.证:充分性,设存在常数b ,使得P {X = b } = 1,有P {X ≠ b } = 0,即E (X ) = b P {X = b } = b ,故Var (X ) = E [X − E (X )]2 = E (X − b )2 = 0 × P {X = b } = 0; 必要性,设X 的方差Var (X ) = 0,因事件U +∞=+∞→⎭⎫⎩⎨⎧≥−=⎭⎬⎫⎩⎨⎧≥−=>−11|)(|lim 1|)(|}0|)({|n n n X E X n X E X X E X ,则01)Var(lim 1|)(|lim 1|)(|}0|)({|21=⎟⎠⎞⎜⎝⎛≤⎭⎬⎫⎩⎨⎧≥−=⎟⎟⎠⎞⎜⎜⎝⎛⎭⎬⎫⎩⎨⎧≥−=>−+∞→+∞→+∞=n X n X E X P n X E X P X E X P n n n U , 可得P {| X − E (X )| > 0} = 0,即P {| X − E (X )| = 0} = 1,取b = E (X ),有b 为常数, 故P {X = b } = 1.注:如果P {X = b } = 1,记为X = b , a.e.(或a.s.),称为X = b 几乎处处成立(或几乎必然成立).这里,a.e.就是almost everywhere 的缩写,a.s.就是almost surely 的缩写.意味着不成立的情况是一个测度(或概率)等于零的集合(或事件).§2.4 常用离散分布对于一个给定的函数,只要满足概率函数的两条基本性质:非负性、正则性,都可以成为某个离散随机变量的概率函数.但绝大多数在实际工作中并不常见,下面是几种常用的概率函数. 2.4.1.两点分布与二项分布一.两点分布两点分布只可能在两个点取值,通常就是0或1.定义 随机变量的可能取值只有两个:0或1,且概率函数为p (0) = 1 − p ,p (1) = p , 其中0 < p < 1,称X 服从两点分布(Two-point Distribution )或0-1分布,记为X ~ (0-1).分布列为⎟⎟⎠⎞⎜⎜⎝⎛−p p110. 两点分布实际背景是一次伯努利试验.通常描述为:X 表示一次伯努利试验中事件A 发生的次数.非负性:p (0) = 1 − p > 0,p (1) = p > 0; 正则性:(1 − p ) + p = 1. 两点分布的数学期望为E (X ) = 0 × (1 − p ) + 1 × p = p .又因E (X 2 ) = 02 × (1 − p ) + 12 × p = p ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = p − p 2 = p (1 − p ).二.二项分布在n 重伯努利试验中,以X 表示事件A 的发生次数,则X 的全部可能取值为0, 1, 2, …, n ,且kn k p p k n k X P −−⎟⎟⎠⎞⎜⎜⎝⎛==)1(}{. 定义 若离散型随机变量X 的概率函数为kn k p p k n k p −−⎟⎟⎠⎞⎜⎜⎝⎛=)1()(, k = 0, 1, 2, …, n ;0 < p < 1, 则称X 服从二项分布(Binomial Distribution ),记为X ~ b (n , p ).二项分布的实际背景是n 重伯努利试验. 当n = 1时,二项分布就是两点分布.非负性:0)1()(>−⎟⎟⎠⎞⎜⎜⎝⎛=−kn k p p k n k p ; 正则性:1)]1([)1()(11=−+=−⎟⎟⎠⎞⎜⎜⎝⎛=∑∑=−=nnk k n k nk p p p p k n k p . 例 掷三枚硬币,X 表示正面朝上的次数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3 ,将掷每一枚硬币看作一次试验.每次试验两种结果:正面A ,反面A ;每次试验相互独立;每次试验概率5.0)(=A P . 即n 重伯努利试验,n = 3,5.0=p ,有X ~ b (3, 0.5),p (0) = 0.5 3 = 0.125,375.05.05.013)1(21=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 375.05.05.023)2(12=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (3) = 0.5 3 = 0.125.例 现有5台机床,每台机床一小时内平均开动18分钟,且是否开动相互独立,以X 表示同一时刻开动的机床数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3, 4, 5 ,将每台机床是否开动看作一次试验.每次试验两种结果:开动A ,不开动A ;每次试验相互独立;每次试验概率P (A ) = 0.3. 即n 重伯努利试验,n = 5,p = 0.3,有X ~ b (5, 0.3).p (0) = 0.7 5 = 0.16807,36015.07.03.015)1(41=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 3087.07.03.025)2(32=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 1323.07.03.035)3(23=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 02835.07.03.045)4(14=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (5) = 0.3 5 = 0.00243 .一般地,如果随机变量X 服从二项分布,概率函数值p (k ) 将随着k 的增加,先逐渐增加,达到最大值后,又逐渐减少.通常,一个随机变量X 的概率函数或密度函数的最大值点称为X 的最可能值.二项分布b (n , p )的最可能值为⎩⎨⎧+−++++=.)1(,1)1()1(,)1(],)1[(0是正整数时当或不是正整数时当p n p n p n p n p n k 这里[x ]表示不超过x 的最大整数.如[2.3] = 2,[3.14] = 3,[−1.2] = −2.证:若X ~ b (n , p ),有n k p p k n k n p p k n k p k n k kn k ≤≤−−=−⎟⎟⎠⎞⎜⎜⎝⎛=−−0,)1()!(!!)1()(, 则11)1()!1()!1(!)1()!(!!)1()(+−−−−+−−−−−=−−k n k k n k p p k n k n p p k n k n k p k p ⎟⎠⎞⎜⎝⎛+−−−⋅−−−=−−11)1()!()!1(!1k n p k pp p k n k n k n k)1()1()1()!()!1(!1+−−+⋅−−−=−−k n k k p n p p k n k n k n k , 当k < (n + 1) p 时,有p (k ) > p (k − 1);当k > (n + 1) p 时,有p (k ) < p (k − 1).如果(n + 1) p 不是正整数,取k 0 = [(n + 1) p ],有k 0 < (n + 1) p ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > (n + 1) p ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果(n + 1) p 是正整数,取k 0 = (n + 1) p ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值.如X ~ B (3, 0.5),有(n + 1) p = 4 × 0.5 = 2是正整数,最可能值k 0 = 2或1;X ~ B (5, 0.3),有(n + 1) p = 6 × 0.3 = 1.8不是正整数,最可能值k 0 = [1.8] = 1.三.二项分布的数学期望和方差组合数公式⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=−⋅−−⋅=−⋅=⎟⎟⎠⎞⎜⎜⎝⎛11)!()!1()!1()!(!!k n k n k n k n k n k n k n k n , (n ≥ k > 0). 二项分布b (n , p )的数学期望为∑∑∑=−−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅⋅=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k kn k nk k n k p p k n np p p k n k n k p p k n k X E 1110)1(11)1(11)1()( = np [ p + (1 − p )]n − 1 = np .又因∑∑∑=−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k k n k nk k n k p p k n k p p k n k k p p k n k X E 002022)1()1(11)()1()( )()1(22)1()1()(22X E p p k n k k n n k k nk k n k+−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=∑=− np p p k n pn n nk kn k +−⎟⎟⎠⎞⎜⎜⎝⎛−−−=∑=−−222)1(22)1( = n (n − 1) p 2 [ p + (1 − p )]n − 2 + np = (n 2 − n ) p 2 + np ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = (n 2 − n ) p 2 + np − (np )2 = − np 2 + np = np (1 − p ).2.4.2.泊松分布一.泊松分布泊松分布是一种理论推导的极限分布(成立的条件和推导过程见附录). 定义 若随机变量X 的概率函数为λλ−=e !)(k k p k, k = 0, 1, 2, …… ;λ > 0,则称X 服从参数为 λ 的泊松分布(Poisson’s Distribution ),记为X ~ P (λ).泊松分布的实际背景是已知平均发生次数为常数λ ,实际发生次数的概率分布.如足球比赛进球数,商店进店人数,电话接听次数等.非负性:λ > 0时,0e !>−λλk k;正则性:1e e e !=⋅=⋅−∞=−∑λλλλk kk .例 已知一场足球比赛的进球数X 服从参数λ = 2.3的泊松分布,求比分为0:0, 1:0以及总进球数超过5个的概率.解:因X ~ P(2.5),则3.2e !3.2)(−=k k p k , k = 0, 1, 2, …….比分0:0,即X = 0,100.0e e !03.2)0(3.23.20===−−p (查表);比分1:0,即X = 1,231.0100.0331.0e 3.2e !13.2)1(3.23.21=−===−−p (查表);总进球数超过5个,即X > 5,030.0970.01e !3.21e!3.2}5{53.263.2=−=−==>∑∑=−∞=−k k k k k k X P (查表). 例 已知某公用电话每小时内打电话的人数X 服从参数为λ = 8的泊松分布.求某一小时内无人打电话的概率,恰有10人打电话的概率,至少有10人打电话的概率.解:因X ~ P(8),有8e !8}{−==k k X P k . 无人打电话的概率0003.0e e !08}0{880====−−X P ,恰有10人打电话的概率099.0717.0816.0e !108}10{810=−===−X P (查表),至少有10人打电话的概率283.0717.01}9{1e !8}10{108=−=≤−==≥∑∞=−X P k X P k k (查表). 例 已知某商店一天中某种贵重商品的销售件数X 服从泊松分布P (7),问该商店每天应该准备多少件该商品才能以99.9%以上的概率满足顾客需要?解:设准备了a 件该商品,X ~ P(7),则7e !7)(−=k k p k .事件“满足顾客需要”,即X ≤ a ,有P {X ≤ a } ≥ 0.999,故查表可得a = 16. 泊松分布P (λ )的最可能值为⎩⎨⎧−=.,1,],[0是正整数时当或不是正整数时当λλλλλk 证:若X ~ P(λ),有L ,2,1,0,e !)(==−k k k p kλλ,故k k k k k k k k p k p k k k k−⋅−=⎟⎠⎞⎜⎝⎛−⋅−=−−=−−−−−−−−−λλλλλλλλλλe )!1(1e )!1(e)!1(e !)1()(111,当k < λ 时,有p (k ) > p (k − 1);当k > λ 时,有p (k ) < p (k − 1).如果λ 不是正整数,取k 0 = [λ ] ,有k 0 < λ ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > λ ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果λ 是正整数,取k 0 = λ ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值. 二.泊松分布的数学期望和方差泊松分布P (λ )的数学期望为λλλλλλλλλλλ=⋅=−⋅=−=⋅=−∞=−−∞=−∞=−∑∑∑e e )!1(e e)!1(e!)(111k k k kk kk k k k X E ,即泊松分布的参数 λ 反映平均发生次数.又因)()!2(e e!e!)(e!)(222222X E k k k k k k k k X E k k k kk kk k+−⋅=⋅+⋅−=⋅=∑∑∑∑∞=−−∞=−∞=−∞=−λλλλλλλλλ= λ 2 e −λ ⋅ e λ + λ = λ 2 + λ ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = λ 2 + λ − (λ )2 = λ .三.二项分布的泊松近似二项分布与泊松分布的实际背景都是反映发生次数问题.下面的定理说明了二者之间的联系,泊松分布是二项分布的一种极限分布. 定理 (泊松定理)在n 重伯努利试验中,记事件A 在每次试验中发生的概率为与试验次数n 有关的数p n ,如果当n → +∞ 时,有n p n → λ ,则λλ−−+∞→=−⎟⎟⎠⎞⎜⎜⎝⎛e !)1(lim k p p k n k k n n k n n . 证:记λ n = n p n ,有λλ=+∞→n n lim ,因nk n n n kn n k n n n n n n p )(11)1(−−⋅−−−⎟⎠⎞⎜⎝⎛−+=⎟⎠⎞⎜⎝⎛−=−λλλλ,且e 1lim =⎟⎠⎞⎜⎝⎛−+−+∞→nnn n n λλ,λλ−=−−+∞→n k n n n )(lim , 则λλλλ−−−⋅−+∞→−+∞→=⎟⎠⎞⎜⎝⎛−+=−e 1lim )1(lim )(n k n n n n k n n n n n n p ,又因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛n k n k n k k n n n k n k 1111!!)1()1(L L ,且11111lim =⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−+∞→n k n n L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→−+∞→n k n p p k n p p k n k n nk n k n k n n k n n 1111)1(!lim )1(lim L λλ−+∞→−+∞→+∞→=⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅=e !1111lim )1(lim !)(lim k n k n p k np k n k n n n k n n L . 此定理表明对于二项分布b (n , p ),当n 很大,p 很小时,可用泊松分布P (λ ) 近似,其中λ = n p .例 某地区每年人口意外死亡率为0.0001,现有60000人投保人身意外保险,求一年内因投保人意外死亡恰好赔付8人的概率以及赔付不超过5人的概率.解:设X 表示“一年内因投保人意外死亡而赔付的人数”,X ~ B (60000, 0.0001).则5999289999.00001.0860000}8{××⎟⎟⎠⎞⎜⎜⎝⎛==X P ,∑=−××⎟⎟⎠⎞⎜⎜⎝⎛=≤50600009999.00001.060000}5{k kk k X P , 但显然计算很繁琐,为便于计算,用泊松分布近似.因n = 60000很大,p = 0.0001很小,λ = np = 6,有)6(~P X &,故103.0744.0847.0e !86}8{68=−=≈=−X P ,446.0e !6}5{506=≈≤∑=−k k k X P .2.4.3. 超几何分布一.超几何分布在N 件产品中,有M 件次品,从中不放回地取n 件,以X 表示取得的次品数.设X 取值为k ,一方面,显然有k ≤ n 且k ≤ M ,即k ≤ min{n , M },另一方面,有k ≥ 0且n − k ≤ N − M ,可得k ≥ M + n − N ,即k ≥ max{0, M + n − N }.这样X 的全部可能取值为l , l + 1, …, L ,其中l = max{0, M + n − N },L = min{n , M },且⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛==n N k n M N k M k X P }{.定义 若随机变量X 的概率函数为⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=n N k n M N k M k p )(,k = l , l + 1, …, L ,l = max(0, n + M − N ),L = min(M , n ),M < N ,n < N , 则称X 服从超几何分布(Hypergeometric Distribution ),记为X ~ h (n , N , M ).超几何分布的实际背景是古典概型中的不放回抽样检验问题. 注:有放回检验抽样问题对应的是二项分布.非负性:0>⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛n N k n M N k M ;正则性:10=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑∑==n N n N n N k n M N k M n N k n M N k M Ll k L k .注:比较(1 + x )M(1 + x )N − M与(1 + x )N中x n的系数可以证明⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑=n N k n M N k M Ll k .例 一袋中有3个红球,2个白球,不放回地取出3个球,X 表示取得的红球数.求X 的概率分布.解:不放回抽样,N = 3,M = 2,n = 3,则X ~ h (3, 5, 3).故X 的全部可能取值为1, 2, 3, (l = max (0, n + M − N ) = 1,L = min(n , M ) = 3),3.0352213}1{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,6.0351223}2{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,1.0350233}3{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P . 超几何分布h (n , N , M )的最可能值为⎪⎩⎪⎨⎧+++−++++++++++++=.21)1(,121)1(21)1(,21)1(],21)1[(0是正整数时当或不是正整数时当N M n N M n N M n N M n N M n k证:若X ~ h (n , N , M),有)!()!()!()!(!!1)(k n M N k n M N k M k M n N n N k n M N k M k p +−−−−⋅−⋅⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=, 故p (k ) − p (k − 1))!1()!1()!1()!1()!(!)!()!()!(!)!(!−+−−+−+−−⎟⎟⎠⎞⎜⎜⎝⎛−−+−−−−⎟⎟⎠⎞⎜⎜⎝⎛−=k n M N k n k M k n N M N M k n M N k n k M k n N M N M)]()1)(1[()!()!1()!1(!)!(!k n M N k k n k M k n M N k n k M k n N M N M +−−−+−+−+−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=)]2()1)(1[()!()!1()!1(!)!(!+−+++−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=N k n M k n M N k n k M k n N M N M .当21)1(+++<N M n k 时,有p (k ) > p (k − 1);当21)1(+++>N M n k 时,有p (k ) < p (k − 1). 如果21)1(+++N M n 不是正整数,取21)1[(0+++=N M n k ,有21)1(0+++<N M n k ,即p (k 0) > p (k 0 − 1);且21)1(10+++>+N M n k ,即p (k 0 + 1) < p (k 0).故p (k 0) 为最大值.如果21)1(+++N M n 是正整数,取21)1(0+++=N M n k ,即p (k 0) = p (k 0 − 1),故p (k 0) 和p (k 0 − 1) 都是最大值. 二.超几何分布的数学期望和方差超几何分布h (n , N , M )的数学期望为N nM n N k n M N k M N nM n N n N k n M N k M k M k n N k n M N k M k X E Ll k L lk L l k =⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=∑∑∑===11111111)(, 又因∑∑∑===⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=L lk L l k Ll k n N k n M N k M k n N k n M N k M k k n N k n M N k M k X E )()(222 ∑=+⎟⎟⎠⎞⎜⎜⎝⎛−−−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=Llk X E n N n n N N k n M N k M k k M M k k )(22)1()1(22)1()1()(2N nM N N M M n n N nM n N k n M N k M N N M M n n Ll k +−−−=+⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−−−=∑=)1()1()1(2222)1()1()1(, 故方差为)1())(()1()1)(1()]([)()Var(222222−−−=−+−−−=−=N N n N M N nM N M n N nM N N M n nM X E X E X . 为了便于记忆,可将超几何分布与二项分布的数学期望和方差进行比较.二项分布b (n , p ):数学期望E (X ) = np ,方差Var (X ) = np (1 − p );超几何分布h (n , N , M ):数学期望N M nX E =)(,方差11)Var(−−⎟⎠⎞⎜⎝⎛−=N n N N M N M n X ; 可见分布h (n , N , M )中的N M 相当于二项分布b (n , p )中的p ,方差修正因子为1−−N nN . 三.超几何分布的二项近似直观上,当抽样个数n 远小于M 及N − M 时,不放回抽样问题可近似看作有放回抽样问题,也就是此时超几何分布可用二项分布近似.定理 如果当N → +∞ 时,p NM→, (0 < p < 1),则k n k N p p k n n N k n M N k M −+∞→−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛)1(lim . 证:因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛N n N n N n n N N N n N n 1111!!)1()1(L L , 且⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛M k M k M k M k 1111!L ,⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−=⎟⎟⎠⎞⎜⎜⎝⎛−−−M N k n M N k n M N k n M N kn 1111)!()(L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→+∞→N n N n N M N k n M N k n M N M k M k M n N k n M N k M n k n k N N 1111!1111)!()(1111!lim lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅−=−+∞→N n N M N k n M N M k M N M N M k n k n nk n k N 111111111111)()!(!!lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛=+∞→−+∞→N n N M N k n M N M k M N M N M k n N kn k N 111111111111lim 1lim L L L。
概率论与数理统计要点复习.docx概率论与数理统计复习资料第⼀章随机事件与概率1.事件的关系AuB AuB AB A-B A Q AB =(/>(1)包含:若事件A发⽣,⼀定导致事件B发⽣,那么,称事件B包含事件A ,记作AuB(或Bz)A)?(2)相等:若两事件A与〃相互包含,即AnB且Bn A,那么,称事件A与B相等,记作A = B .(3)和事件:“事件A与事件B中⾄少有⼀个发⽣”这⼀事件称为A与B的和事件,记作AuB;“n个事件观出?…,⼈中⾄少有⼀事件发⽜”这⼀事HI J A件称为鱼…,⼈的和,记作Au⼊5??uA”(简记为* ').(4)积事件:“事件A与事件B同时发⽣”这⼀事件称为A与B的积事件,记作AcB(简记为AB);a n个事件观出,…,⼼同时发⽜”这⼀事件称为nA,⾎.…,⼈的积事件,记作(简记为A4??4或以').(5)互不相容:若事件A和B不能同时发⽣,即⼼?,那么称事件A与B互不相容(或互斥),若n个事件观出?…,⼈中任意两个事件不能同时发⽣,即A"⼴0(iwi(6)对⽴事件:若事件A和B互不相容、且它们中必有⼀事件发⽣,即AB = Q 且AuB⼆Q,那么,称A与B是对⽴的.事件A的对⽴事件(或逆事件)记作⼊(7)差事件:若事件A发⽣且事件B不发⽣,那么,称这个事件为事件A 与B的差事件,记作A-B(或⼈⽤)?2?运算规则(1)交换律:AuB = BuA AB = BA(2)结合律:(AuB)uC = Au(BuC) (AB)C = A(BC)(3)分配律(A u B)C = (AC) u (BC) (AB) uC = (Au C)(B u C)(4)德[摩根(DeMorgan)法则:AuB = AB AB = AuB3.概率P( A)满⾜的三条公理及性质:(1)0 < P(A) < 1 (2) P(Q) = 1(3)对互不相容的事件£,凡,…,有P(|J 4) = JP(A k) (n可以取co) k=[Bl(4)P(0) = O (5) P(A) = 1 - P(A)(6)P(A-B) = P(A)-P(AB),若AuB,则P(B-A) = P(B)-P(A), P(A)< P(B)(7)P(A u B) = P(A) + P(B) - P(AB)(8)P(AufiuC) = P(A) + P(B) + P(C) ⼀P( AB) - P(AC)⼀P(BC) + P(ABC)4.古典概型:基本事件有限且等可能5.⼏何概率:如果随机试验的样本空间是⼀个区域(可以是直线上的区间、平⾯或空间⼬的区域),且样本空间⼬每个试验结果的出现具有等可能性,那么规定事件A的概率为= A的长度(或⾯积、体积)(,⼀样本空间的的长度(或⾯积、体积)?6.条件概率(1)定义:若P(B)> 0,则P(A|B)⼆巴也P(B)(2)乘法公式:P(AB) = P(B)P(A | B)若⽿,场,3”为完备事件组,P(BJ>0,贝ij有(3)全概率公式:P(A) =》P(BJP(A | BJ/=!(4)Bayes 公式:P(B* | A) = £(拔)⼙(川伐)£P(BJP(A\BJ/=!(5)贝努⾥概型与⼆项概率设在每次试验中,随机事件A发⽣的概率P(A) = p(0复独⽴试验中?,事件A恰发⽣£次的概率为巳伙)⼆7 //(I —"1,20,1,…⼩k7.事件的独⽴性:A, 3独⽴o P(AB) = P(A)P(B)(注意独⽴性的应⽤)下列四个命题是等价的:(i)事件A与B相互独⽴;(ii)事件A与⽤相互独⽴;(iii)事件広与B相互独⽴;(iv)事件A与B相互独⽴.8、思考题1 . ⼀个⼈在⼝袋⾥放2盒⽕柴,每盒⽄⽀,每次抽烟时从⼝袋⼬随机拿出⼀盒(即每次每盒有同等机会被拿到)并⽤掉⼀⽀,到某次他迟早会发现:取出的那⼀盒已空了?问:“这时另⼀盒中恰好有加⽀⽕柴”的概率是多少?2?设⼀个居民区有〃个⼈,设有⼀个邮局,开c个窗⼝,设每个窗⼝都办理所有业务.c太⼩,经常排长队;c?太⼤⼜不经济.现设在每⼀指定时刻,这〃个⼈中每⼀个是否在邮局是独⽴的,每个⼈在邮局的概率是P?设计要求:“在每⼀时刻每窗⼝排队⼈数(包括正在被服务的那个⼈)不超过加”这个事件的概率要不⼩于Q (例如,Q = 0?&0?9或o.95),问⾄少须设多少窗⼝?3.设机器正常时,⽣产合格品的概率为9 5%,当机器有故障时,⽣产合格品的概率为5 0 %,⽽机器⽆故障的概率为9 5%.某天上班时,⼯⼈⽣产的第⼀件产品是合格品,问能以多⼤的把握判断该机器是正常的?第⼆章随机变量与概率分布1.离散随机变量:取有限或可列个值,P(X =xj = Pi满⾜(1) p,. > 0 , (2)⼯戸=1I(3)对任意DuR, P(X E D)= ^Pii: DJ+oof(x)dx = 1:-oo(2)P(aJu3.⼉个常⽤随机变量标准正态分布的分布函数记作①(X),即CX ] ----①⑴=I ——e 2 dt①(兀) '⼗问t ,当出“no时,①(%)可查表得到;当xvo时,①⑴可由下⾯性质得到①(I兀)=1 ⼀①(X)设X~N(“,k),则有F⑴=①(⼆)P(aer c ?4.分布函数F(x) = P(X(1)F(-oo) = 0, F(+oo) = l; (2)单调⾮降;(3)右连续;(4)P(a a) = l-F(a);特别的P(X = a) = F(a) - F(a -0)(5)对离散随机变量,F(Q =⼯⼙汀/:Xf(6)对连续随机变量,F(x) = f 为连续函数,且在.f(x)连续点上,F (x) = f(x)J—85.正态分布的概率计算以①(x)记标准正态分布2(0,1)的分布函数,则有(1)①(0) = 0.5; (2)①(⼀兀)=1 ⼀①⑴;(3)若X ?N(“Q2),则F(Q⼆①(^^);(7(4)以%记标准正态分布2(0,1)的上侧a分位数,则P(X >%) = a = l—①(⾎) 6.随机变量的函数Y = g(X)(1)离散时,求Y的值,将相同的概率相加;(2)X连续,g(x)在X的取值范围内严格单调,且有⼀阶连续导数,则/y(y) = /x (gT (y ))l (gT ()‘))'l ,若不单调,先求分布函数,再求导。
《概率论与数理统计》复习资料一、复习提纲注:以下是考试的参考内容,不作为实际考试范围,仅作为复习参考之用。
考试内容以教学大纲和实施计划为准;注明“了解”的内容一般不考。
1、 会事件关系的运算,了解概率的古典定义2、 能较熟练地求解古典概率;了解概率的公理化定义3、 掌握概率的基本性质和应用这些性质进行概率计算;理解条件概率的概念;掌握加法公式与乘法公式4、 能准确地选择和运用全概率公式与贝叶斯公式解题;掌握事件独立性的概念及性质。
5、 理解随机变量的概念,掌握离散性随机变量分布率的性质及求法,掌握(0—1)分布、二项分布、泊松分布的分布律。
6、 理解分布函数的概念及性质,理解并掌握连续型随机变量的概率密度及性质。
7、 掌握指数分布(参数λ)、均匀分布、正态分布8、 会求特殊的一维随机变量函数分布的分布律或概率密度。
9、 会求分布中的待定参数。
会求区间的概率.10、 会求边缘分布律、边缘密度函数,会判别随机变量的独立性。
11、 掌握二维连续型随机变量未知参数的计算,落在区域概率的计算。
12、 理解二维随机变量的概念,理解二维随机变量的联合分布函数及其性质,掌握二维离散型随机变量的联合分布律及其性质,掌握二维连续型随机变量的联合概率密度及其性质,并会用它们计算有关事件的概率。
13、 会求二维离散型随机变量函数的分布率.14、 掌握数学期望和方差的定义及性质,会熟练地求随机变量及其函数的数学期望和方差。
会熟练地默写出几种重要随机变量的数学期望及方差。
15、 较熟练地求协方差与相关系数.16、 会用独立正态随机变量线性组合性质解题。
17、 理解总体、样本、简单随机样本、统计量及抽样分布概念,样本均值与样本方差及样本矩概念,掌握χ2分布(及性质)、t 分布、F 分布及其分位点概念。
18、 理解正态总体样本均值与样本方差的抽样分布定理;会用矩估计方法来估计未知参数。
19、 掌握极大似然估计法,无偏性与有效性的判断方法。
概率论与数理统计复习提要第一章 随机事件与概率1.事件的关系 φφ=Ω-⋃⊂AB A B A AB B A B A 2.运算规则 1BA AB A B B A =⋃=⋃2)()( )()(BC A C AB C B A C B A =⋃⋃=⋃⋃3))(()( )()()(C B C A C AB BC AC C B A ⋃⋃=⋃⋃=⋃ 4B A AB B A B A ⋃==⋃3.概率)(A P 满足的三条公理及性质: 11)(0≤≤A P 21)(=ΩP3对互不相容的事件n A A A ,,,21 ,有∑===nk kn k kA P A P 11)()( n 可以取∞4 0)(=φP 5)(1)(A P A P -=6)()()(AB P A P B A P -=-,若B A ⊂,则)()()(A P B P A B P -=-,)()(B P A P ≤ 7)()()()(AB P B P A P B A P -+=⋃8)()()()()()()()(ABC P BC P AC P AB P C P B P A P C B A P +---++=⋃⋃ 4.古典概型:基本事件有限且等可能5.几何概率 6.条件概率(1) 定义:若0)(>B P ,则)()()|(B P AB P B A P =(2) 乘法公式:)|()()(B A P B P AB P = 若n B B B ,,21为完备事件组,0)(>i B P ,则有 (3) 全概率公式: ∑==ni iiB A P B P A P 1)|()()((4) Bayes 公式: ∑==ni iik k k B A P B P B A P B P A B P 1)|()()|()()|(7.事件的独立性: B A ,独立)()()(B P A P AB P =⇔ 注意独立性的应用第二章 随机变量与概率分布1. 离散随机变量:取有限或可列个值,i i p x X P ==)(满足10≥i p ,2∑iip=13对任意R D ⊂,∑∈=∈Dx i ii pD X P :)(2. 连续随机变量:具有概率密度函数)(x f ,满足11)(,0)(-=≥⎰+∞∞dx x f x f ;2⎰=≤≤badx x f b X a P )()(;3对任意R a ∈,0)(==a X P4. 分布函数 )()(x X P x F ≤=,具有以下性质 11)( ,0)(=+∞=-∞F F ;2单调非降;3右连续; 4)()()(a F b F b X a P -=≤<,特别)(1)(a F a X P -=>; 5对离散随机变量,∑≤=xx i ii px F :)(;6对连续随机变量,⎰∞-=x dt t f x F )()(为连续函数,且在)(x f 连续点上,)()('x f x F =5. 正态分布的概率计算 以)(x Φ记标准正态分布)1,0(N 的分布函数,则有 15.0)0(=Φ;2)(1)(x x Φ-=-Φ;3若),(~2σμN X ,则)()(σμ-Φ=x x F ;4以αu 记标准正态分布)1,0(N 的上侧α分位数,则)(1)(αααu u X P Φ-==>6. 随机变量的函数 )(X g Y = 1离散时,求Y 的值,将相同的概率相加;2X 连续,)(x g 在X 的取值范围内严格单调,且有一阶连续导数,则|))((|))(()('11y g y g f y f X Y --=,若不单调,先求分布函数,再求导;第四章 随机变量的数字特征 1.期望1 离散时 ∑=iii px X E )(,∑=iiipx g X g E )())(( ;2 连续时⎰+∞∞-=dx x xf X E )()(,⎰+∞∞-=dx x f x g X g E )()())((;3 二维时∑=ji ij jip yx g Y X g E ,),()),((,dy dx y x f y x g Y X g E ⎰⎰+∞∞-+∞∞-=),(),()),((4C C E =)(;5)()(X CE CX E =; 6)()()(Y E X E Y X E +=+; 7Y X ,独立时,)()()(Y E X E XY E = 2.方差1方差222)()())(()(EX X E X E X E X D -=-=,标准差)()(X D X =σ;2)()( ,0)(X D C X D C D =+=; 3)()(2X D C CX D =;4Y X ,独立时,)()()(Y D X D Y X D +=+ 3.协方差1)()()())]())(([(),(Y E X E XY E Y E Y X E X E Y X Cov -=--=; 2),(),( ),,(),(Y X abCov bY aX Cov X Y Cov Y X Cov ==; 3),(),(),(2121Y X Cov Y X Cov Y X X Cov +=+;40),(=Y X Cov 时,称Y X ,不相关,独立⇒不相关,反之不成立,但正态时等价; 5),(2)()()(Y X Cov Y D X D Y X D ++=+ 4.相关系数 )()(),(Y X Y X Cov XY σσρ=;有1||≤XY ρ,1)( ,,1||=+=∃⇔=b aX Y P b a XY ρ5.k 阶原点矩)(k k X E =ν,k 阶中心矩kk X E X E ))((-=μ第五章 大数定律与中心极限定理1.Chebyshev 不等式 2)(}|)({|εεX D X E X P ≤≥- 或2)(1}|)({|εεX D X E X P -≥<-2.大数定律3.中心极限定理 1设随机变量n X X X ,,,21 独立同分布2)( ,)(σμ==i i X D X E ,则) ,(~21σμn n N X ni i ∑=近似, 或) ,(~121n N X n n i i σμ∑=近似 或)0,1(~ 1N n n X ni i近似σμ∑=-,2设m 是n 次独立重复试验中A 发生的次数,p A P =)(,则对任意x ,有)(}{lim x x npqnp m P n Φ=≤-∞→或理解为若),(~p n B X ,则),(~npq np N X 近似第六章 样本及抽样分布 1.总体、样本(1) 简单随机样本:即独立同分布于总体的分布注意样本分布的求法; (2) 样本数字特征:样本均值∑==n i i X n X 11μ=)(X E ,n X D 2)(σ=;样本方差∑=--=ni i X X n S 122)(1122)(σ=S E 样本标准差∑=--=ni i X X n S 12)(11 样本k 阶原点矩∑==n i k i k X n 11ν,样本k 阶中心矩∑=-=n i ki k X X n 1)(1μ2.统计量:样本的函数且不包含任何未知数3.三个常用分布注意它们的密度函数形状及分位点定义12χ分布 )(~2222212n X X X n χχ+++= ,其中n X X X ,,,21 独立同分布于标准正态分布)1,0(N ,若)(~ ),(~2212n Y n X χχ且独立,则)(~212n n Y X ++χ; 2t 分布 )(~/n t nY X t =,其中)(~ ),1,0(~2n Y N X χ且独立;3F 分布 ),(~//2121n n F n Y n X F =,其中)(~),(~2212n Y n X χχ且独立,有下面的性质),(1),( ),,(~11221112n n F n n F n n F F αα=- 4.正态总体的抽样分布 1)/,(~2n N X σμ; 2)(~)(11222n Xni i∑=-χμσ;3)1(~)1(222--n S n χσ且与X 独立; 4)1(~/--=n t nS X t μ;5)2(~)()(21212121-++---=n n t n n n n S Y X t ωμμ,2)1()1(212222112-+-+-=n n S n S n S ω 6)1,1(~//2122222121--=n n F S S F σσ 第七章 参数估计 1.矩估计:1根据参数个数求总体的矩;2令总体的矩等于样本的矩;3解方程求出矩估计 2.极大似然估计:1写出极大似然函数;2求对数极大似然函数3求导数或偏导数;4令导数或偏导数为0,解出极大似然估计如无解回到1直接求最大值,一般为min }{i x 或max }{i x 3.估计量的评选原则1无偏性:若θθ=)ˆ(E ,则为无偏; 2 有效性:两个无偏估计中方差小的有效;复习资料一、填空题15分题型一:概率分布的考察 相关公式P379相关例题 1、设(,)X U a b ,()2E X =,1()3D Z =,则求a,b 的值; 2、已知(,),()0.5,()0.45Xb n p E X D X ==,则求n,p 的值;题型二:正态总体均值与方差的区间估计 相关公式P163 相关例题1、样本容量已知2、样本容量未知 题型三:方差的性质 相关公式P103 相关例题 1、题型四:2t χ分布、分布的定义 相关公式P140、P138相关例题 1、2(0,1),(4),,,/X XYX Y Y nχ若且相互独立?2、()302123301,,,,0,1,?ii X X X X N X=∑若变量……服从则题型五:互不相容问题相关公式P4 相关例题1、()0.6,,,().P A A B P AB =若互不相容求 二、选择题15分 题型一:方差的性质 相关公式见上,略 相关例题见上,略题型二:考察统计量定义不能含有未知量 题型三:考察概率密度函数的性质见下,略题型四:和、乘、除以及条件概率密度见下,略 题型五:对区间估计的理解P161 题型六:正态分布和的分布 相关公式P105 相关例题题型七:概率密度函数的应用 相关例题设()X f x ==已知{}{},P X a P X a a >=<则求。
概率论与数理统计复习提纲概率论与数理统计总复习第⼀讲随机事件及其概率⼀随机事件,事件间的关系及运算 1.样本空间和随机事件 2.事件关系,运算和运算律⑴事件的关系和运算⑶运算律:交换律,结合律,分配律;对偶律: B A B A ?=?,B A B A ?=?;⼆概率的定义和性质 1.公理化定义(P7)2.概率的性质(P8.五个) ⑴)(1)(A P A P -=;⑵)()()()(AB P B P A P B A P -+=?;3.古典概型和⼏何概型4.条件概率 )()()|(A P AB P A B P =三常⽤的计算概率的公式1.乘法公式 )()()()()(B A P B P A B P A P AB P ==2.全概率公式和贝叶斯公式(P17-20.) 四事件的独⽴性1.定义:A 和B 相互独⽴ )()(B P A B P =或)()()(B P A P AB P ?=,2.贝努利试验在n 重贝努利试验中,事件=k A {A 恰好发⽣k 次})0(n k ≤≤的概率为:k n nk n k p p C A P --=)1()(第⼆讲随机变量及其概率分布⼀随机变量及其分布函数1.随机变量及其分布函数 )()(x X P x F ≤=)(+∞<<-∞x2.分布函数的性质(P35.四个)⑴0)(lim =-∞→x F x ;1)(lim =+∞→x F x ;(常⽤来确定分布函数中的未知参数)⑵)()()(a F b F b X a P -=≤<(常⽤来求概率) ⼆离散型随机变量及其分布律1.分布律2.常⽤的离散型分布三连续型随机变量 1.密度函数 ?∞-=xdt t f x F )()(2.密度函数的性质(P39.七个) ⑴1)(=?+∞∞-dx x f ;(常⽤来确定密度函数中的参数)⑵?=≤adx x f b X a P )()(;(计算概率的重要公式)⑶对R x ∈?,有0)(==c X P (换⾔之,概率为0的事件不⼀定是不可能事件). 3.常⽤连续型分布重点:正态分布:)0,(21)(22)(>=--σσµσπσµ都是常数,x ex f标准正态分布)1,0(N :2221)(x ex -=π四随机变量函数的分布1.离散情形设X 的分布律为则)(X g Y =的分布律为2.连续情形设X 的密度函数为)(x f X ,若求)(X g Y =的密度函数,先求Y 的分布函数,再通过对其求导,得到Y 的密度函数。
第一章 随机事件及其概率一、随机事件及其运算1. 样本空间、随机事件①样本点:随机试验的每一个可能结果,用ω表示; ②样本空间:样本点的全集,用Ω表示; 注:样本空间不唯一.③随机事件:样本点的某个集合或样本空间的某个子集,用A,B,C,…表示; ④必然事件就等于样本空间;不可能事件()∅是不包含任何样本点的空集; ⑤基本事件就是仅包含单个样本点的子集。
2. 事件的四种关系①包含关系:A B ⊂,事件A 发生必有事件B 发生;②等价关系:A B =, 事件A 发生必有事件B 发生,且事件B 发生必有事件A 发生; ③互不相容(互斥): AB =∅ ,事件A 与事件B 一定不会同时发生。
④对立关系(互逆):A ,事件A 发生事件A 必不发生,反之也成立; 互逆满足A A AA ⎧⋃=Ω⎨=∅⎩注:互不相容和对立的关系(对立事件一定是互不相容事件,但互不相容事件不一定是对立事件。
)3. 事件的三大运算①事件的并:A B ⋃,事件A 与事件B 至少有一个发生。
若AB =∅,则A B A B ⋃=+; ②事件的交:A B AB ⋂或,事件A 与事件B 都发生; ③事件的差:-A B ,事件A 发生且事件B 不发生。
4. 事件的运算规律①交换律:,A B B A AB BA ⋃=⋃=②结合律:()(),()()A B C A B C A B C A B C ⋃⋃=⋃⋃⋂⋂=⋂⋂③分配律:()()(),()()()A B C A B A C A B C A B A C ⋃⋂=⋃⋂⋃⋂⋃=⋂⋃⋂④德摩根(De Morgan )定律:,A B AB AB A B⋃==⋃ 对于n 个事件,有1111,nni i i i nni ii i A A A A ======二、随机事件的概率定义和性质1.公理化定义:设试验的样本空间为Ω,对于任一随机事件),(Ω⊂A A 都有确定的实值P(A),满足下列性质:(1) 非负性:;0)(≥A P (2) 规范性:;1)(=ΩP(3)有限可加性(概率加法公式):对于k 个互不相容事件k A A A ,,21 ,有∑∑===ki ik i iA P A P 11)()(.则称P(A)为随机事件A 的概率. 2.概率的性质①()1,()0P P Ω=∅= ②()1()P A P A =-③若A B ⊂,则()(),()()()P A P B P B A P B P A ≤-=-且 ④()()()()P A B P A P B P AB ⋃=+-()()()()()()()()P A B C P A P B P C P AB P BC P AC P ABC ⋃⋃=++---+注:性质的逆命题不一定成立的. 如若),()(B P A P ≤则B A ⊂。
《概率论与数理统计》总复习提纲第一块随机事件及其概率内容提要基本内容:随机事件与样本空间,事件的关系与运算,概率的概念和基本性质,古典概率,几何概率,条件概率,与条件概率有关的三个公式,事件的独立性,贝努里试验.1、随机试验、样本空间与随机事件(1)随机试验:具有以下三个特点的试验称为随机试验,记为:,.1)试验可在相同的条件下重复进行;2)每次试验的结果具有多种可能性,但试验之前可确知试验的所有可能结果;3)每次试验前不能确定哪一个结果会出现.(2)样本空间:随机试验F的所有可能结果组成的集合称为F的样本空间;记为Q;试验的每一个可能结果,即Q中的元素,称为样本点,记为「(3)随机事件:在一定条件下,可能出现也可能不出现的事件称为随机事件,简称事件;也可表述为事件就是样本空间的子集,必然事件(记为「)和不可能事件(记为-).2、事件的关系与运算(1)包含关系与相等:“事件一发生必导致匸'发生”,记为二一「或丄-J ; A=B^AcB 且鸟匚乂.(2)互不相容性-互为对立事件1 :、「-门且一 :.(3)独立性:(i)设丄:'为事件,若有匸二-匸二y 口‘,则称事件-与F相互独立.等价于:若* 1 2 3 4(2)多个事件的独立:设一……;是n个事件,如果对任意的乂山二口匚,任意的1■\ ',具有等式,称;个事件…人相互独立.3、事件的运算(1)和事件(并):“事件一与匸'至少有一个发生”,记为」一丄.(2)积事件(交):“ 事件」与匸'同时发生”,记为』丄「或丄.(3)差事件、对立事件(余事件):“事件发生一而匸'不发生”,记为」「称为一与匚'的差事件;…二二称为T的对立事件;易知:二】匸.4、事件的运算法则1 交换律:亠二一二一 _」,二土;2结合律:』u0uO = (£u仍uC,(曲)0 =玫蜀;3分配律:(心―2此,的uC = (g(S;4 对偶()律:丸匸二丄,,一二二一1,十十u A=n n©u血可推广* ■'5、概率的概念(1)概率的公理化定义:i厂存v「J的f事件域.恥F隹义在F上的一个集值函数P(備足;1)菲负性:旳1)20;2)规范性:卩⑼訂3)可列可加性;设力岀,…是可列个互不相容事件,则则称P")为事件胡概率.(2)频率的定义:事件」在「次重复试验中出现11次,则比值」称为事件」在[次重复试验中出现的频率,记为 ,即— 」.即随旳的増大越来越韋近基个常数戸切丹斗审冲 n 称W 为事件一的(统计)概率在实际问题中,当「很大时,取f 一,“(4)古典概率:若试验的基本结果数为有限个, 且每个事件发生的可能性相等,则(试验对应古典概型)事件 」发生的概率为:—A 中所含样本点数」/(占) c 中样本点总数n(5)几何概率:若试验基本结果数无限,随机点落在某区域 g 的概率与区域g的测度(长度、面积、体积等)成正比,而与其位置及形状无关,则(试验对应几何概型),“在区域「中随机地取一点落在区域-中”这一事件二发生的概率为:1丿Q 的测度. (6)主观概率:人们根据经验对该事件发生的可能性所给出的个人信念6、概率的基本性质(3)统计概率: 频率具有稳定性, 9 QD(1)不可能事件概率零:= 0.(2)有限可加性:设\ \ -是n个两两互不相容的事件,即」•.=;,(;) 丄,12…j 则有= + 酗)+…+P⑷.(3)单调不减性:若事件口—上「」「—」,且冊卜附也).(4)互逆性:丿二】且H上-(5)加法公式:对任意两事件二:,有二二-匚—二二I-P匚.—厂扑;此性质可推广到任意个事件的情形.(6)可分性:对任意两事件二:,有门上二:,且AAu3)<PU) + ?(3)7、条件概率与乘法公式(1)条件概率:设丄E是两个事件,即」.,则P(AB)称为事件一发生的条件下事件匸'发生的条件概率.(2)乘法公式:设丄H 且「一•〕「"」则W = P(^P(B| X) = P^)P(A13)称为事件二-的概率乘法公式.8全概率公式与贝叶斯()公式(1)全概率公式:设-…二是异的一个划分,且S,•厂亠,…,则对任何事件”」,有p(s)=^mwi4)2-1称为全概率公式(2)贝叶斯()公式:设是打的一个划分,且■ 1 ' 1 _'\ ,则对任何事件丄「一,有P(AAP(B\JL)mi月)=丨宀心=1,…⑻i-L称为贝叶斯公式或逆概率公式9、贝努里()概型(1)只有两个可能结果的试验称为贝努里试验,常记为丄.丄也叫做“成功—失败”试验,“成功”的概率常用/ " L:/表示,其中」成功”.(2)把匚重复独立地进行•.次,所得的试验称为!重贝努里试验,记为匸.(3)把::'重复独立地进行可列多次,所得的试验称为可列重贝努里试验,记为孑.以上三种贝努里试验统称为贝努里概型.(4)匸中成功卜次的概率是二」mi其中—1 1:--/--1.疑难分析1、必然事件与不可能事件必然事件是在一定条件下必然发生的事件,不可能事件指的是在一定条件下必然不发生的事件•它们都不具有随机性,是确定性的现象,但为研究的方便,把它们看作特殊的随机事件.2、互逆事件与互斥(不相容)事件如果两个事件」与厂必有一个事件发生,且至多有一个事件发生,则J、'为互逆事件;如果两个事件」与1不能同时发生,则J、'为互斥事件.因而,互逆必定互斥,互斥未必互逆.区别两者的关键是:当样本空间只有两个事件时,两事件才可能互逆,而互斥适用与多个事件的情形•作为互斥事件在一次试验中两者可以都不发生,而互逆事件必发生一个且只发生一个3、两事件独立与两事件互斥两事件」、T独立,则」与T中任一个事件的发生与另一个事件的发生无关,这时「'' ■:' 1;而两事件互斥,则其中任一个事件的发生必然导致另一个事件不发生,这两事件的发生是有影响的,这时二一二二二.可以用图形作一直观解释.在图1.1左边的正方形中,图1.1咖)二.P⑷丄F(B) 一、^ 亠、4 2 ,表示样本空间中两事件的独立关系,而在右边的正方形中,丄匸•,表示样本空间中两事件的互斥关系.4、条件概率''与积事件概率「卜是在样本空间「内,事件二的概率,而’'''是在试验丄增加了新条件发生后的缩减的样本空间中计算事件』的概率.虽然都发生,但两者是不同的,一般说来,当」、-同时发生时,常用「加,而在有包含关系或明确的主从关系时,用"八二.如袋中有9个白球1个红球,作不放回抽样,每次任取一球,取2次,求:(1)第二次才取到白球的概率;(2)第一次取到的是白球的条件下,第二次取到白球的概率•问题(1)求的就是一个积事件概率的问题,而问题(2)求的就是一个条件概率的问题.5、全概率公式与贝叶斯()公式当所求的事件概率为许多因素引发的某种结果,而该结果又不能简单地看作这诸多事件之和时,可考虑用全概率公式,在对样本空间进行划分时,一定要注意它必须满足的两个条件•贝叶斯公式用于试验结果已知,追查是何种原因(情况、条件)下引发的概率.第二块随机变量及其分布内容提要基本内容:随机变量,随机变量的分布的概念及其性质,离散型随机变量的概率分布,连续型随机变量的概率分布,常见随机变量的分布,随机变量函数的分布.1、随机变量设「是随机试验的样本空间,如果对于试验的每一个可能结果二一X,都有唯一的实数'与之对应,则称为定义在「上的随机变量,简记为.随机变量通常用大写字母二-■-等表示.设g,F*)是一t概率空间,若枷W R有珂紋是-个随腋氢离散型随机喪量(可能取值至多可列)随机变量连续型随机变量(可育諏值充满某个区间〉奇异型随机变量■-2、离散型随机变量及其分布列如果随机变量二只能取有限个或可列个可能值,贝淋二为离散型随机变量.如果」的一切可能值为〔1 ,并且負取:;的概率为X,则称儿":一:一】“:为离散型随机变量的概率函数(概率分布或分布律).也称分布列,常记为其中常见的离散型随机变量的分布有:(1)两点分布(0-1分布):记为匸:日,分布列为丄工卜;■'■-■'!5 P或(2)二项分布:记为'-,,概率函数尸区胡乂”(1-卩严北二0「也0<^<1(3)泊松分布,记为'-',概率函数iJtP&"}二斗,"Oh, 4 0<1泊松定理设“::是一常数,J是任意正整数,设’人',则对于任一固定的非负整数i,有八,■-.当〔很大且|很小时,二项分布可以用泊松分布近似代替,即切(1宀年,其中5(4) 超几何分布:记为概率函数(5) 几何分布:记为上•「心口,概率函数> ;< :匚 ‘ .;■..3、分布函数及其性质分布函数的定义:设"为随机变量,:为任意实数,函数阳=P{X <X)(-0O<X< +oo)称为随机变量負的分布函数.分布函数完整地描述了随机变量取值的统计规律性,具有以下 性质: (1) 有界性(-00 < X <松);⑵ 单调性 如果:'< ,则旳g(xj ;(3) 右连续, 即戸;7C(4) 极限性 血 F(i) = 0> 陀)二127 W-Hfi ;(5)完美性 Pg fXSxj =P{X “卜P{X 二F(xj-F(xj .4、连续型随机变量及其分布分布如果对于随机变量二的分布函数门「,存在非负函数「九,使对于任一实数:, 有宀'",则称;为连续型随机变量.函数—称为;的概率密度函数.P{X "}= pJtr k- 0丄…,min (丹,M) ,其中匚暑为正整数,且:二「- \n 当:「很大,且'1较小时,有马軒泌"(1十严概率密度函数具有以下 性质:(1)工沁〕;⑵二(3) - ' _、「 7 '■ ' ; ( 4)丄;二 11 ;(5) 如果在:处连续,则.常用连续型随机变量的分布:(1) 均匀分布:记为- ; ,概率密度为a①其它分布函数为Q,x <a-f a<x<bl, x(2) 指数分布:记为工- ,概率密度为分布函数为0, A<0(3) 正态分布:记为--,概率密度为p(x) = -=^ 2f2 ? -DO <z < +CO* ?相应的分布函数为di当"-"■■■-1时,即「时,称負服从标准正态分布.这时分别用」:和 _1表示二的密度函数和分布函数,即具有性质:①」:i .jPW = 加-X >Q0,其它②一般正态分布]」严丁的分布函数门与标准正态分布的分布函数■' 有关系:陀)二①¥5、随机变量函数的分布(1)离散型随机变量函数的分布设;为离散型随机变量,其分布列为(表2-2):则亠— if任为离散型随机变量,其分布列为(表2-3):表2-3h有相同值时,要合并为一项,对应的概率相加.(2)连续型随机变量函数的分布设;为离散型随机变量,概率密度为'-'1,贝L 「二的概率密度有两种方法可求.1)定理法:若f在丄的取值区间内有连续导数「,且:单调时,X⑷ 是连续型随机变量,其概率密度为11 / 27• ①其它其中二一匸「7二「代汕匚一二1二;I—]:门是]:的反函数.2)分布函数法:先求的分布函数F,(y) = P(Y<y^P(g(X)<y)=X[人何必 &止心)然后求疑难分析1、随机变量与普通函数随机变量是定义在随机试验的样本空间沐上,对试验的每一个可能结果:,都有唯一的实数•「与之对应.从定义可知:普通函数的取值是按一定法则给定的,而随机变量的取值是由统计规律性给出的,具有随机性;又普通函数的定义域是一个区间,而随机变量的定义域是样本空间2、分布函数的连续性定义左连续或右连续只是一种习惯.有的书籍定义分布函数门「左连续,但大多数书籍定义分布函数「二为右连续.左连续与右连续的区别在于计算「二时,二二点的概率是否计算在内.对于连续型随机变量,由于,故定义左连续或右连续没有什么区别;对于离散型随机变量,由于 '負-^ ,则定义左连续或右连续时门值就不相同,这时,就要注意对定义左连续还是右连续.第三块多维随机变量及其分布内容提要基本内容:多维随机变量及其分布函数二维离散型随机变量的联合分布列,二维连续型随机变量的联合分布函数和联合密度函数,边际分布,随机变量的独立性和不相关性,常用多维随机变量,随机向量函数的分布1、二维随机变量及其联合分布函数如果随机变量血(讥血(町…,血@)定义在同一概率空间(Q FQ上则称恥)心⑷兀(叭-北3)为n维(n元)随机变量或随机向量.当沪2时诽为二维随戕氢常记为工儿联合分布函数的定义设—-匸丄二一「赴随机变量,心"为随机向量1■的联合分布函数特别卄血称为二淼合分布函数即恥』)訂(淞汀幻)二维联合分布函数具有以下基本性质:(1)单调性是变量:或;的非减函数;(2)有界性一―]I:* ;(3)极限性” 7」,:',一,厂「.一(?」丨一■.- -」.-工-1「-工,亠二(3)连续性l I;.关于:右连续,关于^也右连续;(4)非负性对任意点 =.「_.「,若「;二,贝V式表示随机点二门落在区域内的概率为:二…2、二维离散型随机变量及其联合分布列如果二维随机变量所有可能取值是有限对或可列对,则称■'为二维离散型随机变量.设「「为二维离散型随机变量,它的所有可能取值为匸- 将f 一—°厂一」或表3.1称为「「的联合分布列.表3.1(1)「「';( 2)肴' 联合分布列具有下列性质:3、二维连续型随机变量及其概率密度函数如果存在一个非负函数和乩门,使得二维随机变量的分布函数‘八「对任意实数「有 'f,则称 — 是二维连续型随机变量,称u为的联合密度函数(或概率密度函数)联合密度函数具有下列性质:设…丄|为二维随机变量,则称F x (x ) = P (X<^<Y <+oo ) 的0)二 P 卜00 <X <4007<7) 分别为关于二和关于「的边缘(边际)分布函数当为离散型随机变量,则称(1) 非负性对一切实数",有■" 1;(3) *-ho在任意平面域-上,「厂 取值的概率F {(工二[“(砂)如y Q ;3细(兀刃=Xj 为如果小」在;’处连续,则 「八一八 规范性(4)4、二维随机变量的边缘分布P 广乞珂(八12…):-1分别为关于;和关于『的边缘分布列当为连续型随机变量,则称內A )二ph 』)必分别为关于二和关于「的边缘密度函数5、二维随机变量的条件分布(了解)(1)离散型随机变量的条件分布设为二维离散型随机变量,其联合分布律和边缘分布列分别为P(X = ip/ = - p^,P(X= f P(Y -y^} = (ij = 12…),则当 j 固定P{f = ”} = Pj>Ci 时,称---------------------------------- 二——为'「条件下随机变量匚的条件分布律.同理,有吃讪|XrJ 二丝八12…Pi(2)连续型随机变量的条件分布设■= 为二维连续型随机变量,其联合密度函数和边缘密度函数分别为:心.则当’•时,在和门,的连续点处,-在条件’下,】的条件概率密度函数为曲力)=畔 Px Wp^\y)=p (兀力p^y) 同理,6、随机变量的独立性设;」’及匚:'1分别是的联合分布函数及边缘分布函数.如果对任何实数「有『上=则称随机变量;与「相互独立.设:;'|为二维离散型随机变量,..与『相互独立的充要条件是廿妝血=12…).设为二维连续型随机变量,二与[相互独立的充要条件是对几乎一切实数,有7、两个随机变量函数的分布设二维随机变量的联合概率密度函数为」;」,「—“ —「是;'的函数,则匚的分布函数为马⑵二\\p(x t yyixdy.(1);'二的分布若.1;|为离散型随机变量,联合分布列为',则】的概率函数为:易仇)=£临耳-吗)&仇)=5>%巩-为);或>若丄八为连续型随机变量,概率密度函数为W,则匚的概率函数为:严r-Ko旳⑵二p^z-x)dx=\ p(z-y r y)dy的分布若I为连续型随机变量,概率密度函数为小乩门,则]的概率函数为:8.最大值与最小值的分布曲”冊勺)畝阿〔兀…兀)勺厂P©)畅)胡旳)*血吃…北)勺)4*(卜恥))9.数理统计中常用的分布(1)正态分布:设随机变劉諾厂也相互紐,肮广N仏口;),心谊…也则2也皿左的加巾其中用心…尼为常黏(2)宀 *:设随机变就“血…也相互從,且丫厂M(叮〉心12…”则(3)「• 卄:亡*……-厂\ L書让二I(4)「—--:亡「疑难分析1、事件=-丄二「表示事件梟•丄「与的积事件,为什么二计不一定等于'■■■'■ :■■■.■ ?如同仅当事件二f相互独立时,才有「二-1三匚二一样,这里依乘法原理只有事件一与1「■'/.相互独立时,才有P{X<x t Y<y) = P(X<^ P(Y<y\,因为P{Y<y\X<x} = P{Y <y).2、二维随机变量「厂的联合分布、边缘分布及条件分布之间存在什么样的关系?由边缘分布与条件分布的定义与公式知,联合分布唯一确定边缘分布,因而也唯一确定条件分布.反之,边缘分布与条件分布都不能唯一确定联合分布.但由「丄丫二心」宀「7 r知,一个条件分布和它对应的边缘分布,能唯一确定联合分布.但是,如果二『相互独立,贝V「仁―t —:,即卩宀二;丄J •:'.说明当二『独立时,边缘分布也唯一确定联合分布,从而条件分布也唯一确定联合分布.3、两个随机变量相互独立的概念与两个事件相互独立是否相同?为什么?两个随机变量二〕相互独立,是指组成二维随机变量•厂的两个分量二〕中一个分量的取值不受另一个分量取值的影响,满足儿」—匸-:匚-.而两个事件的独立性,是指一个事件的发生不受另一个事件发生的影响,故有「二—L匚.两者可以说不是一个问题.但是,组成二维随机变量I的两个分量二「是同一试验丄的样本空间上的两个一维随机变量,而丄f也是一个试验的样本空间的两个事件.因此,若把“匸土”、”看作两个事件,那么两者的意义近乎一致,从而独立性的定义几乎是相同的第四块随机变量的数字特征内容提要基本内容:随机变量的数学期望和方差、标准差及其性质,随机变量函数的数学期望,原点矩和中心矩,协方差和相关系数及其性质1、随机变量的数学期望设离散型随机变量負的分布列为「工二:!亠,如果级数台"'绝对收敛,则称级数的和为随机变量J丄的数学期望.设连续型随机变量x的密度函数为p⑴,如果广义积分L腴R处绝对收敛,则f-HD称此积分值」为随机变量匚的数学期望•数学期望有如下性质:(1)设「是常数,则"'■;(2)设]'是常数,则和(3)若-1:'是随机变量,则-[丄:_:丄-';对任意〔个随机变量■ ' - ■ ',有(4)若-亠相互独立,贝U -七--'-.1 ;对任意「个相互独立的随机变量 u :•,有2、随机变量函数的数学期望设离散型随机变量 負的分布律为■"丄|丄,则」的函数一1 一的设连续型随机变量 負的密度函数为;;|,则負的函数'■_ ■的数学期望为i +®购恥讥讷,式中积分绝对收敛 3、随机变量的方差设匚是一个随机变量,贝V 丄一匸「L - - 称为匚的方差-一“称为;的标准差或均方差.计算方差也常用公式 方差具有如下性质:(1)设一1是常数,则\ '-; (2)设「是常数,则--------;(3)若分1、*2相互独立,则0区+托)=D(X])+°(為);对任意〔个相互独立的随机变量■' -■' ,有- ;(4) 的充要条件是:存在常数 「,使- - - -二八 4、几种常见分布的数学期望与方差 (1)匸;.「匸;二:.:;(2) 「——数学期望为亟(②卜另欽亦)久朮=12…jt-i 式中级数绝对收敛(3)(4)匸」已匸二2 1 ;(5)「一 -'■- :丫;(6)—「二 < 匚一,「I」门一:■汀匸⑺—:'二一;:.;;(8)八“血刊凤& = “23)=代5、矩设;是随机变量,贝y L 「2;* 4称为;的一阶原点矩.如果f存在,则■ ■ _ ' ' ■ '■■ - - - | "'-称为負的;阶中心矩.设「「是二维随机变量,贝y心亠;止【;;「工称为的I 阶混合原点矩;址=E ([X-E(Q*•[『-占(別),灯=1,2,…称为(x,y)的七+]阶混合中心矩.6、协方差与相关系数随机变量(XQ的协方差为^f Y^E{[X-E^Y-£(『)]).它是i+i阶混合中心矩,有计算公式:沏(工『)二E(沼)・E(x)E(y).随机变量■= 的相关系数为_ cov(xn呛二亦页相关系数具有如下性质:(1)卜冷」;(2)卜」存在常数•:',使";-汇+「=1,即二与1以概率1线性相关;(3)若;独立,则L •,即不相关.反之,不一定成立.(4)() 设()是二维随机变量,若X与Y的方差都存在,则[Cau(X r^<DX DY疑难分析1、随机变量的数字特征在概率论中有什么意义?知道一个随机变量的分布函数,就掌握了这个随机变量的统计规律性•但求得一个随机变量的分布函数是不容易的,而且往往也没有这个必要.随机变量的数字特征则比较简单易求,也能满足我们研究分析具体问题的需要,所以在概率论中很多的应用,同时也刻画了随机变量的某些特征,有重要的实际意义例如,数学期望反映了随机变量取值的平均值,表现为具体问题中的平均长度、平均时间、平均成绩、期望利润、期望成本等;方差反映了随机变量取值的波动程度;偏态系数、峰态系数则反映了随机变量取值的对称性和集中性.因此,在不同的问题上考察不同的数字特征,可以简单而切实地解决我们面临的实际问题.2、在数学期望定义中为什么要求级数和广义积分绝对收敛?首先,数学期望是一个有限值;其次,数学期望反映随机变量取值的平均值.因此,对级数和广义积分来说,绝对收敛保证了值的存在,且对级数来说,又与项的次序无关,从而更便于运算求值.而由于连续型随机变量可以离散化,从而广义积分与无穷级数有同样的意义.要求级数和广义积分绝对收敛是为了保证数学期望的存在与求出.3、相关系数1■二反映了随机变量二和「之间的什么关系?相关系数;I是用随机变量就和[的协方差和标准差来定义的,它反映了随机变量二和『之间的相关程度.当时,称二'与丁依概率1线性相关;当匚二I 时,称免与『不相关;当时,又分为强相关与弱相关.4、两个随机变量二与]相互独立和不相关是一种什么样的关系?(1)若、相互独立,则、不相关.因为、独立,则川;「厂小.,故心二-一,从而七j,所以J、r不相关.(2)若不相关,则门、「不一定独立.如:f —]"兀x2+y2 <}rPW= 1 o, 其它一因为TO = £(y)= 0,TO=1/4-1'1二•,知」、」不相关.但U ;1「’L,加y)二2尸加,瞼J)HP占)P0 ,知乂、『不独立.(3)若相关,则匚、[一定不独立.可由反证法说明.(4)若匚、)不相关,则二、不一定不相关.因为二、不独立,二—〕,但若汇-厂m时,可以有―,从而可以有」、不相关.但是,也有特殊情况,如服从二维正态分布时,不相关与;、J 独立是等价的第五块大数定律和中心极限定理内容提要基本内容:切比雪夫()不等式,切比雪夫大数定律,伯努里()大数定律,辛钦()大数定律,棣莫弗-拉普拉斯()定理,列维-林维德伯格()定理.1、切贝雪夫不等式设随机变量二的数学期望m—工,方差匸,则对任意正数「,有不等刊■心沪召或刊,小"-召成立2、大数定律(1)切贝雪夫大数定律:设…是相互独立的随机变量序列,数学期望J. 1和方差’二都存在,且「二」〔|,则对任意给定的I「,有1丄如列-乞凶-欧扎)]|<沪1“讯i-i .(2)贝努利大数定律:设L是「次重复独立试验中事件d发生的次数,:是事limP(|^-^|<F)=l件丿在一次试验中发生的概率,则对于任意给定的:'.■丨,有…贝努利大数定理给出了当[很大时,」发生的频率一=依概率收敛于d的概率,证明了频率的稳定性.(3)辛钦大数定律:设相互独立,服从同一分布的随机变量序列且匸也〕卫(:=匚),则对任意给定的:,I,有3、中心极限定律(1) 林德贝格-勒维中心极限定理:设〔芒〕,…丄 是独立同分布的随机变量 序列,有有限的数学期望和方差,「二-「,「..「一、:.则对任意实数刀(血-“)刀疋厂冲“Y _ ____:,随机变量■■,'■--■的分布函数二-满足 Em 氏⑵二曲尸也<i} = fJ2/T(2) 李雅普诺夫定理:设是不同分布且相互独立的随机变量,它护—y 2 们分别有数学期望和方差:小1 一畀,■'■■'■■<;「厂-八-■-;亠文欧因-丛角TO正数$,,使得当心谕时,有盯口,则随机变量»X屋据F7 _ i-1 H _ J-1 X的分布函数对于任意的x ,满足当〔很大时,爲』㈣总拓』(也昭.(3)德莫佛一拉普拉斯定理:设随机变量'■. 1 " 1 1服从参数为匚时卩J 匸;的二项分布,则对于任意的:,恒有疑难分析D 乞逊!-1lim 坨(打=lira <>=r 加 J 十矩rlimP\%-® J 誓(D<x1、依概率收敛的意义是什么?依概率收敛即依概率1收敛.随机变量序列J依概率收敛于,,说明对于任给的£>0,当"很大时,事件“”的概率接近于1•但正因为是概率,所以不排除小概率事件“ 1八_2卜6”发生.依概率收敛是不确定现象中关于收敛的一种说法.2、大数定律在概率论中有何意义?大数定律给出了在试验次数很大时频率和平均值的稳定性.从理论上肯定了用算术平均值代替均值,用频率代替概率的合理性,它既验证了概率论中一些假设的合理性,又为数理统计中用样本推断总体提供了理论依据.所以说,大数定律是概率论中最重要的基本定律.3、中心极限定理有何实际意义?许多随机变量本身并不属于正态分布,但它们的极限分布是正态分布.中心极限定理阐明了在什么条件下,原来不属于正态分布的一些随机变量其总和分布渐进地服从正态分布.为我们利用正态分布来解决这类随机变量的问题提供了理论依据.4、大数定律与中心极限定理有何异同?相同点:都是通过极限理论来研究概率问题,研究对象都是随机变量序列,解决的都是概率论中的基本问题,因而在概率论中有重要意义.不同点:大数定律研究当时,概率或平均值的极限,而中心极限定理则研究随机变量总和的分布的极限.。