几种常见的概率分布复习过程
- 格式:doc
- 大小:162.01 KB
- 文档页数:4
考研数学概率与统计备考掌握常见概率分布和统计方法概率与统计是考研数学中的一个重要内容,备考期间,掌握常见的概率分布和统计方法是非常关键的。
本文将介绍几种常见的概率分布和统计方法,以助于考生备考时的复习。
一、离散型随机变量及其概率分布离散型随机变量是指在一次试验中,可能取一些特定值的变量。
在概率论中,常见的离散型随机变量有二项分布、泊松分布和几何分布。
1. 二项分布二项分布是指在n次试验中,成功次数为X的概率分布。
它的概率质量函数为:P(X=k) = C(n, k) * p^k * (1-p)^(n-k)其中,n为试验次数,k为成功次数,p为一次试验成功的概率,C(n, k)为组合数。
2. 泊松分布泊松分布是一种在独立时间段内总体事件发生次数的离散概率分布。
它的概率质量函数为:P(X=k) = (λ^k * e^(-λ)) / k!其中,X为事件发生的次数,λ为单位时间或空间内事件的平均发生率。
3. 几何分布几何分布是指在一系列独立重复的伯努利试验中,首次成功所需的试验次数的概率分布。
它的概率质量函数为:P(X=k) = p * (1-p)^(k-1)其中,X为首次成功所需的试验次数,p为一次试验成功的概率。
二、连续型随机变量及其概率分布连续型随机变量是指在某一区间内可能取任意值的变量。
在概率论中,常见的连续型随机变量有均匀分布、正态分布和指数分布。
1. 均匀分布均匀分布是指在一个区间内,随机变量取任意值的概率相等的分布。
它的概率密度函数为:f(x) = 1 / (b-a) (a <= x <= b)其中,a为区间下界,b为区间上界。
2. 正态分布正态分布也称为高斯分布,是自然界和社会现象中最常见的分布。
它的概率密度函数为:f(x) = 1 / (σ* √(2π)) * e^(-(x-μ)^2 / (2σ^2))其中,μ为均值,σ为标准差。
3. 指数分布指数分布是一种用于描述事件发生时间间隔的分布。
第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。
第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。
难点:二项分布的概率函数特征,正态分布的特征。
一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。
对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。
在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。
在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。
先取n =4,k =2来讨论。
在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。
由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。
第四章 几种常见的概率分布第一节 二项分布 一、二项总体 1. 定义由非此即彼事件构成的总体,叫做二项总体(binomial population) 孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等 2. 表示方法通常给“此”事件以变量“1”,具概率φ ,给“彼”事件以变量“0”,具概率1- φ 。
二项总体又称0、1总体。
● 在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k(0≤k ≤n)次的概率Pn(k)。
● 先取n=4,k=2来讨论。
在4次试验中,事件A 发生2次的方式有 24C● 其中Ak(k=1,2,3,4)表示事件A 在第k 次试验发生;kA (k=1,2,3,4)表示事件A 在第k 次试验不发生。
由于试验是独立的,按概率的乘法法则,于是有● 由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为● 一般,在n 重贝努利试验中,事件A 恰好发生k(0≤k ≤n)次的概率为k n k kn n q p C (k)P -=nk ,,2,1,0 =二、二项分布如果我们每次独立抽取二项总体的n 个个体,则所得变量X 将可能有0,1,…n ,共n+1种变量有它各自的概率而组成一个分布。
这个分布就叫做二项概率分布,或简称二项分布(binomial distribution) 由此得到计算二项分布任何一项概率的通式为:p(x) =Cnx φ x(1- φ)n-x二项分布是一种离散型随机变量的概率分布性质1)1(0=-∑=-nx x n x x n C ϕϕ∑=--=≤mx xn x x n C m x P 0)1()(ϕϕ∑=--=≥nmx xn x x nCm x P )1()(ϕϕ∑=-=≤≤=≤≤21)()(2121m m x xn x x nn q p Cm k m p m x m P● 例1:若研究施用某种农药后蚜虫的死亡数,设死虫子为0,其概率为0.3;其活的为1,概率为0.7。
概率论中几种常用的重要的分布摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。
其在实际中的应用。
关键词1 一维随机变量分布随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常用分布,即( 0 -1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布. 下面我们将对这六种分布逐一地进行讨论.随机事件是按试验结果而定出现与否的事件。
它是一种“定性”类型的概念。
为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。
称这种变数为随机变数。
本章内将讨论取实值的这种变数—— 一维随机变数。
定义1.1 设X 为一个随机变数,令 ()([(,)])([]),()F x P X x P Xx x=∈-∞=-∞+∞.这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。
它是一个普通的函数。
成这个函数为随机函数X 的分布函数。
有的随机函数X 可能取的值只有有限多个或可数多个。
更确切地说:存在着有限多个值或可数多个值12,,...,a a 使得 12([{,,...}])1P X a a ∈=称这样的随机变数为离散型随机变数。
称它的分布为离散型分布。
【例1】下列诸随机变数都是离散型随机变数。
(1)X 可能取的值只有一个,确切地说,存在着一个常数a ,使([])1P X a ==。
称这种随机变数的分布为退化分布。
一个退化分布可以用一个常数a 来确定。
(2)X 可能取的值只有两个。
确切地说,存在着两个常数a ,b ,使([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。
如果([])P X b p ==,那么,([])1P X a p ===-。
因此,一个两点分布可以用两个不同的常数,a b 及一个在区间(0,1)内的值p 来确定。
特殊地,当,a b 依次为0,1时,称这两点分布为零-壹分布。
机器学习笔记之常见的11种概率分布0x01 均匀分布1) 离散随机变量的均匀分布:假设 X 有 k 个取值:x1, x2, ..., xk 则均匀分布的概率密度函数为:2) 连续随机变量的均匀分布:假设 X 在 [a, b] 上均匀分布,则其概率密度函数为:0x02伯努利分布伯努利分布:参数为θ∈[0,1],设随机变量 X ∈ {0,1},则概率分布函数为期望:⽅差:0x03 ⼆项分布假设试验只有两种结果:成功的概率为θ,失败的概率为 1-θ. 则⼆项分布描述了:独⽴重复地进⾏ n 次试验中,成功 x 次的概率。
概率密度函数:期望:⽅差:0x04 ⾼斯分布正态分布是很多应⽤中的合理选择。
如果某个随机变量取值范围是实数,且对它的概率分布⼀⽆所知,通常会假设它服从正态分布。
有两个原因⽀持这⼀选择:'''建模的任务的真实分布通常都确实接近正态分布。
中⼼极限定理表明,多个独⽴随机变量的和近似正态分布。
在具有相同⽅差的所有可能的概率分布中,正态分布的熵最⼤(即不确定性最⼤)。
'''典型的⼀维正态分布的概率密度函数为 :0x05 拉普拉斯分布概率密度函数:期望:⽅差:0x06 泊松分布假设已知事件在单位时间(或者单位⾯积)内发⽣的平均次数为λ,则泊松分布描述了:事件在单位时间(或者单位⾯积)内发⽣的具体次数为 k 的概率。
概率密度函数:期望:⽅差:0x07 指数分布若事件服从泊松分布,则该事件前后两次发⽣的时间间隔服从指数分布。
由于时间间隔是个浮点数,因此指数分布是连续分布。
概率密度函数:( t 为时间间隔)期望:⽅差:0x08 伽马分布若事件服从泊松分布,则事件第 i 次发⽣和第 i+k 次发⽣的时间间隔为伽玛分布。
由于时间间隔是个浮点数,因此伽马分布是连续分布。
概率密度函数:其中, t 为时间间隔,k 称为形状参数,λ称为尺度参数期望和⽅差分别为:0x09 贝塔分布贝塔分布是定义在 (0,1) 之间的连续概率分布。
概率问题常见解题方法作为<<概率统计>>这门应用数学的重要分支之一,概率问题在中学数学中越来越得到重视,也是近年高考的热点。
在高中数学新教材中,必修三和理科的选修课本中重点介绍了等可能事件的概率(即古典概型)、几何概型、条件概率、互斥事件有一个发生的概率、相互独立的事件同时发生的概率(包括n 次独立重复试验)。
高考中对概率的考查主要以大题形式出现,重点在分布列问题与其他章节内容相结合,但始终离不开各种概率的求法。
因此要让学生正确理解概率发生的条件,并掌握一些基本的概率“模型”及其解题方法。
一、公式法 概率部分有四个主要的公式(1)等可能事件发生的概率P (A )=nm (2)互斥事件有一个发生的概率 P (A+B )= P (A )+ P (B ) (3)相互独立事件同时发生的概率P (A ·B )= P (A )·P (B ) (4)独立重复试验概率公式k k n k n P C P =)((1―P)k n -,应用这些公式的关键在于正确理解公式成立的条件。
例1:猎人在距100米处射击一野兔,其命中率为21,如果第一次射击未中,则猎人进行第二次射击,但距离为150米,如果第二次未击中,则猎人进行第三次射击,并且在发射瞬间距离为200米,已知猎人命中概率与距离平方成反比,求猎人命中野兔的概率。
解:记三次射击为事件A 、B 、C 其中P (A )=21 由21= P (A )=50001002=⇒K K ∴ P (B )=9215050002= P (C )=8120050002= ∴命中野兔的概率为:P (A )+P (A ·B )+ P (A ·B ·C )=14495 二、组合分析法对于等可能的事件,我们可以利用组合分析法来计算其概率,其关键是寻求等可能事件的总数和事件的发生数。
例2:设有n 个人,每个人都等可能地被分配到N 个房间中的任意一间去住(n ≤N ),求下列事件的概率(1)指定的n 个房间各有一个人住(2)恰好有n 个房间,其中各住一人解:∵每个人有N 个房间可供选择,所以n 个人住的方式共有 N n 种,它们是等可能的,∴(1)指定n 个房间各有一个人住记作事件A :可能的总数为n !则 P (A )=nN n ! (2)恰好有n 个房间其中各住一人记作事件B ,则这n 个房间从N 个房间中任选共有n N C 个, 由(1)可知:P (B )=n n N Nn C ! 三、间接法某些概率问题,正面求解,不是很容易,特别当问题中出现至多(至少)等条件时,可采用间接方法转化为“对立事件”来求解例3:已知某种高炮在它控制的区域内击中敌机制概率为0.2(1)假定有5门这种高炮控制某区域,求敌机进入该区域后被击中的概率。
概率统计——讲透最经典的三种概率分布这一讲当中我们来探讨三种经典的概率分布,分别是伯努利分布、二项分布以及多项分布。
在我们正式开始之前,我们先来明确一个概念,我们这里说的分布究竟是什么?无论是在理论还是实际的实验当中,一个事件都有可能有若干个结果。
每一个结果可能出现也可能不出现,对于每个事件而言出现的可能性就是概率。
而分布,就是衡量一个概率有多大。
伯努利分布明确了分布的概念之后,我们先从最简单的伯努利分布开始。
伯努利分布非常简单,就是假设一个事件只有发生或者不发生两种可能,并且这两种可能是固定不变的。
那么,显然,如果假设它发生的概率是p,那么它不发生的概率就是1-p。
这就是伯努利分布。
生活中所有只可能出现两种结果并且概率保持不变的事件都可以认为服从伯努利分布,比如抛硬币,比如生孩子是男孩还是女孩。
伯努利实验就是做一次服从伯努利概率分布的事件,它发生的可能性是p,不发生的可能性是1-p。
二项分布我们明确了伯努利分布之后再来看二项分布就简单了。
说白了二项分布其实就是多次伯努利分布实验的概率分布。
以抛硬币举例,在抛硬币事件当中,每一次抛硬币的结果是独立的,并且每次抛硬币正面朝上的概率是恒定的,所以单次抛硬币符合伯努利分布。
我们假设硬币正面朝上的概率是p,忽略中间朝上的情况,那么反面朝上的概率是q=(1-p)。
我们重复抛n次硬币,其中有k项正面朝上的事件,就是二项分布。
我们来试着推导一下二项分布的公式:假设我们抛了4次硬币,每一次都有两种可能,既可能正面朝上,也可能反面朝上。
所以一共存在种情况,假设我们想知道4次当中有两次正面朝上的概率。
我们写成P(X=2),它应该是多少呢?我们先来看一种情况,假设某一次抛掷当中,我们的结果是正正反反,记作:OOXX。
那么,它的概率应该是但是这只是一种正面朝上两次的情况,与它相同的情况还有:以上的这5种都是两次正面朝上的情况,都满足要求,所以我们在计算概率的时候,需要乘上可能会导致两个正面朝上的种数。
几种常见的概率分布
一、 离散型概率分布
1. 二项分布
n 次独立的贝努利实验,其实验结果的分布(一种结果出现x 次的概率是多少的分布)即为二项分布
应用二项分布的重要条件是:每一种实验结果在每次实验中都有恒定的概率,各实验之间是重复独立的
平均数: (Y)np X E μ==
方差与标准差:2(1)X np P σ=-
;X σ=特例:(0-1)分布
若随机变量X 的分布律为
1(x k)p (1p)k k p -==- k=0,1;0<p<1,
则称X 服从参数p 的(0-1)分布
2. 泊松分布
泊松分布是一种用来描述一定的空间和时间里稀有事件发生次数的概率分布
泊松分布变量x 只取零和正整数:0、1、2…..其概率函数为:
(x)!x p e x μμ-=
泊松分布的平均数:(x)E μμ==
泊松分布的方差和标准差:2σμ=
、σ=
3. 超几何分布 P(X=k)=k n k M N M n N C C C -- 记X~(N ,M ,n ) P=M N
期望:E(X)=np
方差:D(X)=np(1-p)1
N n N -- 适用范围:多次完全相同并且相互独立的重复试验,如果在有限总体中不重
复抽样,抽样成功的次数X 的概率分布服从超几何分布,如福利彩票
二、 连续型概率分布
1. 均匀分布
若随机变量X 具有概率密度函数
(x)f =
则称X 在区间(a ,b )上服从均匀分布,记为X ~ U(a ,b)
在区间(a ,b )上服从均匀分布的随机变量X 的分布函数为
0F(x),1
x a x a a x b b a b x ⎧<⎪-⎪=≤<⎨-⎪≤⎪⎩
2指数分布
若随机变量X 具有概率密度函数,0(x)0,0
x e x f x λλ-⎧≥=⎨<⎩ 其中0λ> 是常数,
则称X 服从以λ 为参数的指数分布,记作~()X E λ ,X 的分布函数为
1,0(x)0,0
x e x F x λ-⎧-≥=⎨<⎩
3.正态分布
正态随机变量X 的概率密度函数的形式如下:
22(x )2(x),f x μδ--=-∞<<∞
式中,μ 为随机变量X 的均值;2δ 为随机变量X 的方差。
通常对具有均值μ,方差为2δ的正态概率分布,记为N (μ,2δ)。
于是有正态随机变量X~N (μ,2δ)。
1,;0,a x b b a ⎧<<⎪-⎨⎪⎩其他
4.2χ 分布
如果从标准正态分布N (0,1)的总体中得到n 个随机变量分别为12n ,....,X X X ,
时,则由2i X ∑ 得到的分布叫做自由度为n 的2χ 分布,记为2~n X χ()
2~n X χ() 。
2χ分布的数学期望和方差分别为:
E (X )= n ,D (X )=2n
关于2χ分布的加法定理。
设12,....k X X X ,
,是相互独立的随机变量,且2~(n ),i 1,2,....,i i X k χ=则
2121~(n n ...n )k i
k i X χ=++∑
2χ分布与N (0,1)分布有如下关系:
设12n ,....X X X ,是相互独立的随机变量,并且i X ~(0,1),i=1,2,…n ,则 221~(n)n
i
i X χ=∑ 5.t 分布
设X~N (0,1),2~(n)Y χ ,X 与Y 相互独立,则随机变量
t =
遵从n 个自由度的t
分布,记为~(n)t t =。
t 分布的数学期望和方差如下:
当n>2时,E(t)=0,D(t)=2
n n - t 分布的图形是对称的。
当n<30时,t 分布的分散程度比标准正态分布大,密度函数曲线比较平缓,随着n 的增大,t 分布逐渐逼近标准正态分布。
当n →∞ 时,t 分布渐近标准正态分布。
6.F 分布
设随机变量21~(n )X χ ,22Y ~(n )χ,且X 与Y 相互独立,则称随机变量
12
//X n F Y n 遵从自由度为12(n ,n ) 的F 分布,记作F~F 12(n ,n )
F 分布的形状为正偏态分布状,但随着12n ,n 的增大,其概率密度曲线的偏斜度虽有所缓减却仍保持偏态分布,并不以正态分布为其极限分布形式。
如果~(n)t t ,则2~(1,n)t F 如果12211~F(n ,n ),~F F
F 则(n ,n ) 。