概率论与数理统计常用的统计分布
- 格式:ppt
- 大小:2.56 MB
- 文档页数:62
概率论与数理统计公式整理在现代数学中,概率论与数理统计是两个重要的分支。
其中概率论是研究随机事件发生的可能性或概率的科学。
而数理统计则是利用概率论的方法,对已经发生的随机事件进行统计分析和推断。
本文将整理概率论与数理统计中常用的公式。
一、基本概率公式1.概率:$P(A)=\frac{n(A)}{n(S)}$其中,$P(A)$表示事件$A$发生的概率,$n(A)$表示事件$A$所包含的基本事件的个数,$n(S)$表示所有基本事件的个数。
2.加法原理:$P(A\cup B)=P(A)+P(B)-P(A\cap B)$其中,$A$和$B$是两个事件,$A\cup B$表示事件$A$和事件$B$中至少有一个发生的概率,$A\cap B$表示两个事件同时发生的概率。
3.条件概率:$P(B|A)=\frac{P(A\cap B)}{P(A)}$其中,$P(B|A)$表示在事件$A$发生的条件下,事件$B$发生的概率。
4.乘法定理:$P(A\cap B)=P(A)P(B|A)$其中,$P(A\cap B)$表示两个事件同时发生的概率,$P(B|A)$表示在事件$A$发生的条件下,事件$B$发生的概率。
二、概率分布1.离散随机变量的概率分布律:$\sum\limits_{i=1}^{+\infty}{p(x_i)}=1$其中,$p(x_i)$表示离散随机变量取值为$x_i$的概率。
2.连续随机变量的概率密度函数:$\int_{-\infty}^{+\infty}{f(x)}\mathrm{d}x=1$其中,$f(x)$表示连续随机变量在$x$处的概率密度。
3.数学期望:$E(x)=\sum\limits_{i=1}^{+\infty}{x_ip(x_i)}$或$E(x)=\int_{-\infty}^{+\infty}{xf(x)}\mathrm{d}x$其中,$E(x)$表示随机变量$x$的数学期望,$p(x_i)$表示$x_i$这一离散随机变量取到的带权概率。
数学分布类型
1. 均匀分布
在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。
均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。
2. 正态分布
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。
若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
3. t分布
在概率论和统计学中,t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
t分布曲线形态与n(确切地说与自由度df)大小有关。
与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。
概率论与数理统计各种分布总结概率论与数理统计中有许多不同的概率分布,每个分布都具有不同的特征和应用。
下面是一些常见的概率分布的总结:1. 均匀分布(Uniform Distribution):在一个区间内的所有取值都具有相等的概率。
它可以是离散的(离散均匀分布)或连续的(连续均匀分布)。
2. 二项分布(Binomial Distribution):描述了在一系列独立的伯努利试验中成功次数的概率分布。
每个试验只有两个可能结果(成功和失败),并且成功的概率保持不变。
3. 泊松分布(Poisson Distribution):用于描述在给定时间或空间单位内发生某事件的次数的概率分布。
它通常用于模拟稀有事件的发生情况。
4. 正态分布(Normal Distribution):也称为高斯分布,是最常见的连续概率分布之一。
它具有钟形曲线的形状,对称且具有明确的均值和标准差。
许多自然现象和测量数据都可以近似地用正态分布来描述。
5. 指数分布(Exponential Distribution):描述了连续随机事件之间的时间间隔的概率分布。
它通常用于模拟无记忆性事件的发生情况,如设备故障、到达时间等。
6. 卡方分布(Chi-Square Distribution):由正态分布的平方和构成的概率分布。
它在统计推断中广泛应用,特别是在假设检验和信赖区间的计算中。
7. t分布(Student's t-Distribution):用于小样本量情况下参数估计和假设检验。
与正态分布相比,t分布具有更宽的尾部,因此更适用于小样本数据。
8. F分布(F-Distribution):用于比较两个或多个样本方差是否显著不同的概率分布。
它经常用于方差分析和回归分析中。
这只是一些常见的概率分布的总结,还有其他许多分布,每个都在不同的领域和应用中起着重要的作用。
第三章 多维随机变量及其分布第一节二维随机变量的概念1.二维随机变量定义:设(X,Y)是二维随机变量,记为:(,){()()}=≤⋂≤F x y P X x Y y (,)=≤≤P X x Y y (,)-∞<<∞-∞<<∞x y称(,)F x y 为X 与Y 的分布函数,或称X 与Y 的联合分布函数}}(){{(,lim (,)→+∞=≤=≤≤+∞=X y F x P X x P X x Y F x y}}(){{,lim (,)→+∞=≤=≤+∞≤=Y x F y P Y y P X Y y F x y分布函数(,)F x y 性质:1)(,)F x y 是变量x 和变量y 的不减函数,(分别关于x 和y 有单调不减性) 2)0(,)1≤≤F x y ,任意一边趋于-∞=0.F(∞,∞)=1(用来确定未知参数).3)(,)(0,)(0,0)=+=++F x y F x y F x y ,即(,)F x y 分别关于x 右连续,关于y 也右连续,4)对于任意11221212(,),(,),,,<<x y x y x x y y 下述不等式成立(可用于判定二元函数(,)F x y 是不是某二维随机变量的分布函数):22211112(,)(,)(,)(,)0-+-≥F x y F x y F x y F x y 2.二维离散型随机变量:定义:如果二维随机变量(X,Y)只取有限对或可列无穷多对,则称(X,Y)是二维离散型随机变量其概率{,},,1,2,====i i ij P X x Y y p i j …为二维离散型随机变量(X,Y)的分布律,或随机变量X 和Y 是联合分布律 性质:1.0,(i,j 1.2.....)≥=ij P2.1≤≤=∑∑i i ijx x y yp满足以上两条,即为二维离散型随机变量的分布律. 注;步骤:定取值,求概率,验证1.离散型随机变量X 和Y 的联合分布函数为(,)≤≤=∑∑i i ijx x y yF x y p,其中和式是对一切满足,≤≤i i x x y y 的i,j 来求和的边缘分布定义:对于离散型随机变量(X,Y),分量X 和Y 的分布律(), 1.2...(), 1.2..的边缘分布律:的边缘分布律:••========∑∑i i ij jJ i ij iX p P X x p i Y p P Y y p i ,0,0(, 1.2....)1•••≥≥===∑∑i j jiip p i j pi p联合确定边缘,但一般情况,边缘不能确定的联合,除非相互独立. 比如;有放回的摸球,就是X ,Y 相互独立. 不放回地摸球,是条件分布.3.二维连续型随机变量的概率密度和边缘概率密度. 对比一维的: 概率密度:()()1∞-∞==⎰f x f x dx ,分布律:{}(),≤≤=⎰b aP a x b f x dx 分布函数:()()-∞=⎰xF x f t dt二维:定义:设二维随机变量(X,Y)的分布函数为(,)F x y ,若存在非负可积函数(,)f x y ,使得对于任意实数x,y 有(,)(,)-∞-∞=⎰⎰xyF x y f u v dudv ,则称(X,Y)为二维连续型随机变量,(,)f x y 称为(X,Y)的概率密度,或联合概率密度.概率密度的性质: 1.(,)F x y ≥0 2.(,)1∞∞-∞-∞=⎰⎰f x y dxdy只要具有以下两条性质,必可作为某二维随机变量的概率密度.3.已知(X,Y)的概率密度(,)f x y ,则(X,Y)在平面区域D 内取值的概率为:{(,)}(,)∈=⎰⎰DP X Y D f x y dxdy (作二重积分)(随机点(X,Y)落在平面区域D 上的概率等于以平面区域D 为底,以曲面(,)=z f x y 顶的典顶的体积) 4.若(,)F x y 在点(x,y)连续,则有2(,)(,)∂=∂∂F x y f x y x y(连续就能根据分布律求概率密度)1) 当求()=P X Y 时,它只是一条线,所以:()0==P X Y2) 一个方程有无实根:20++=ax bx c ,即求:22240,40,40,一个实根无实根两个实根+=+<+>b ac b ac b ac均匀分布:定义:设D 为平面上的有界区域,其面积为S ,且0>S ,如果二维随机变量(X,Y)的概率密度为1,(x,y)(,)0,其它⎧∈⎪=⎨⎪⎩Df x y S,则称(X,Y)服从区域D 上的均匀分布(或叫(X,Y)在D 上服从均匀分布,记作(X,Y )D U . 两种特殊情形:1) D 为矩形,,c )≤≤≤≤a x b y d 时,1,()()(,),c )0,其它⎧⎪--=≤≤≤≤⎨⎪⎩b a dc f x y a x b y d2) D 为圆形,如(X,Y)在以原点为圆心,R 为半径的圆域上服从均匀分布,则(X,Y)的概率密度为:22221,(,))0,其它π⎧⎪=+≤⎨⎪⎩f x y x y R R定义:对连续型随机变量(X,Y),分量X,Y 的概率密度称为(X,Y)关于X 或Y 的边缘概率密度,记作(),X f x ().Y f y X 的分布函数:()(,)(,)∞-∞-∞⎡⎤=∞=⎢⎥⎣⎦⎰⎰xX F x F x f u v dv du (让Y趋于正无穷) Y 的分布函数:()(,)(,)∞-∞-∞⎡⎤=∞=⎢⎥⎣⎦⎰⎰yY F y F y f u v du dv (让X趋于正无穷) X 的概率密度:()(,),()∞-∞=-∞<<∞⎰X f x f x y dy xY 的概率密度:()(,),()∞-∞=-∞<<∞⎰Y f y f x y dx y(二维的边缘概率密度是直接以联合概率密度在负无穷到正无穷对对应元素积分,其间需要对划分区间的作分别积分)(X,Y)的概率密度:(,)(,)[(,)]-∞-∞-∞-∞==⎰⎰⎰⎰x yx yf x y f u v dudv f u v dv du二维正态分布: 二维正态221212(,)(,,,,)σσρX Y N u u 分布函数的性质:1.211()(,)σX N u ,222()(,)σY N u 边缘服从一维正态分布2.0,ρ=⇔xy X Y 独立(相关系数为O,则两个随机变量独立)3.212()()σ++k X k Y N u (线性组合按一维正态处理)4. 1212(),±±k X k Y c X c Y 服从二维正态(如:(,)+-X Y X Y ) 条件分布:设(X,Y)是二维离散型随机变量,对于固定的j ,若{}0=>j P Y y ,则称{=i P X x |{,}},1,2,{}⋅=======i j ij j j jP X x Y y p Y y i P Y y p …为在=j Y y 条件下随机变量X 的条件分布律同样地,若{}0,=>i P X x 则称{=j P Y y |{,}},1,2,{}⋅=======i j ij i i i P X x Y y p X x j P X x p …为=i X x 条件下随机变量Y 的条件分布律 变形,即得求联合分布律的方法.设二维随机变量(X,Y)的概率密度为f(x,y),(X,Y)关于Y 的边缘概率密度为()Y f y .若对于固定的y,()0,>Y f y 则称(,)()Y f x y f y 为在Y=y 的条件下X 的条件概率密度称|(,)(|)()-∞-∞=⎰⎰xxX Y Y f x y f x y dx dx f y 为在Y=y 的条件下,X 的条件分布函数,记为P{X ≤x|Y=y}或|(|)X Y F x y ,即|(,)(|){|}()-∞=≤==⎰x X Y Y f x y F x y P X x Y y dx f y 设F(x,y)及(),()X Y F x F y 分别是二维随机变量(X,Y)的分布函数及边缘分布函数,若对于所有x,y 有P{X ≤x,Y ≤y}=P{X ≤x}P{Y ≤y},即(,)()()=X Y F x y F x F y ,则称随机变量X 和Y 是相互独立的设(X,Y)是连续型随机变量,(,),(),()X Y f x y f x f y 分别为(X,Y)的概率密度和边缘概率密度,则X 和Y 相互独立的条件等价于(,)()()=X Y f x y f x f y 在平面上几乎处处成立(除去面积为0的集合以外,处处成立)第二节随机变量的独立性1. 两个随机变量的独立性 定义:设(,),().()X Y F x y F x F y 分别是二维随机变量(X,Y)的分布函数和两个边缘分布函数,若对任意实数,x y 有(,)().()=X Y F x y F x F y ,则称X 与Y 相互独立.可用于判断独立性(随机变量独立,对任意实数x,y,事件X ,Y ≤≤x y 相互独立) 以上公式等价于:(X ,Y )(X ).()≤≤=≤≤X Y P x y P x P Y y 可类推至多个函数的情况.1)如果X,Y 随机变量独立,().()连续f x g y ,(通过函数作用)则().()f x g y 也独立.(可类推至多个随机变量的情况)例:X,Y 独立,则22,x y 独立.2)如果1212,...,...,YYYm m X X X 相互独立,12m 121()()...()()()....()和,f x f x f x g y g y g y 也相互独立。
概率论与数理统计中的三种重要分布摘要:在概率论与数理统计课程中,我们研究了随机变量的分布,具体地研究了离散型随机变量的分布和连续型随机变量的分布,并简单的介绍了常见的离散型分布和连续型分布,其中二项分布、Poisson 分布、正态分布是概率论中三大重要的分布。
因此,在这篇文章中重点介绍二项分布、Poisson 分布和正态分布以及它们的性质、数学期望与方差,以此来进行一次比较完整的概率论分布的学习。
关键词:二项分布;Poisson 分布;正态分布;定义;性质一、二项分布二项分布是重要的离散型分布之一,它在理论上和应用上都占有很重要的地位,产生这种分布的重要现实源泉是所谓的伯努利试验。
(一)泊努利分布[Bernoulli distribution ] (两点分布、0-1分布)1.泊努利试验在许多实际问题中,我们感兴趣的是某事件A 是否发生。
例如在产品抽样检验中,关心的是抽到正品还是废品;掷硬币时,关心的是出现正面还是反面,等。
在这一类随机试验中,只有两个基本事件A 与A ,这种只有两种可能结果的随机试验称为伯努利试验。
为方便起见,在一次试验中,把出现A 称为“成功”,出现A 称为“失败” 通常记(),p A P = ()q p A P =-=1。
2.泊努利分布定义:在一次试验中,设p A P =)(,p q A P -==1)(,若以ξ记事件A 发生的次数,则⎪⎪⎭⎫⎝⎛ξp q 10~,称ξ服从参数为)10(<<p p 的Bernoulli 分布或两点分布,记为:),1(~p B ξ。
(二)二项分布[Binomial distribution]把一重Bernoulli 试验E 独立地重复地进行n 次得到n 重Bernoulli 试验。
定义:在n 重Bernoulli 试验中,设(),()1P A p P A q p ===-若以ξ记事件A 发生的次数,则ξ为一随机变量,且其可能取值为n ,,2,1,0 ,其对应的概率由二项分布给出:{}k n kk n p p C k P --==)1(ξ,n k ,,3,2,1,0 =,则称ξ服从参数为)10(,<<p p n 的二项分布,记为),(~p n B ξ。
概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x pp ====-<<,则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =-(2)二项分布:若一个随机变量X 的概率分布由式{}(1),0,1,...,.k kn k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,.k kn k n P x k C p p k n -==-=二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k ek k λλλ-==>=,则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k ek k λλλ-==>=泊松分布的期望:()E X λ=;泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt-∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布:(1)均匀分布:若连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a a b x f ,则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度:⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a a b x f 均匀分布的期望:()2a bE X +=;均匀分布的方差:2()()12b a D X -= (2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩,则称X 服从参数为λ的指数分布,记为X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩指数分布的期望:1()E X λ=;指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X的概率密度为22()2()x f x x μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()2()x f x x μσ--=-∞<<+∞正态分布的期望:()E X μ=;正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==,2222()()x t xx x e dtϕφ---∞=⎰标准正态分布表的使用: (1)()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数: 设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
第 ×× 次课 2学时本次课教学重点:常用的统计量 本次课教学难点:总体,简单随机样本,统计量的概念。
本次课教学内容:第五章 数理统计的基础知识 第一节 数理统计的基本概念 教学组织: 一、引言在前五章中我们学习了概率论的基本内容,因为随机变量及其所伴随的概率分布全面描述了随机现象的统计规律性,所以在概率论的许多问题中,概率分布通常都是已知的,或者假设是已知的,而一切计算与推理都是在此基础上得出来的。
然而,实际情况往往并非如此。
一个随机现象所服从的分布概型可能完全不知道,或者只知道其概型而不知其分布函数中所含的参数。
例如,某工厂生产的灯泡的寿命服从什么分布是不知道的。
再如,某厂生产的一件产品是合格品还是不合格品,我们知道它服从两点分布,但其参数p 却不知道。
那么怎样才能知道一个随机现象的分布或其参数呢?这就是数理统计所要解决的一个首要问题。
为了获得灯泡的寿命分布,我们从所有的灯泡中抽出一部分进行观察与测试以取得相关信息,从而做出推断。
由于观察和测试是随机现象,依据有限个观察与测试对整体所做出的推断不可能绝对准确,这个不确定性我们用概率来表达。
数理统计学的基本问题就是依据观测或试验所取得的有限信息对整体做出推断,每个推断必须伴有一定的概率来表明其可靠程度。
这种伴有一定概率的推断称为统计推断。
二、总体与随机样本 1、总体在数理统计中,我们往往研究有关对象的某一数量指标(如灯泡的寿命这一数量指标)。
为此,考虑与这一数量指标相联系的随机试验,对这一数量指标进行试验或观察。
我们把研究对象的全体所构成的一个集合称为总体,总体中的每个对象称为个体。
总体中所包含的个体的个数称为总体的容量。
容量有限的总体称为有限总体,容量无限的总体称为无限总体。
例如,考察某批灯泡的质量,如这一批灯泡共有5000只,每个灯泡的寿命是一个可能的观察值,是一个个体。
所有5000只灯泡的寿命是一个有限总体。