[农学]第三章 常用概率分布
- 格式:pdf
- 大小:12.45 MB
- 文档页数:67
常用概率分布常用概率分布是数学中一个非常重要的概念,它描述了每种特定事件发生的可能性,并帮助我们更好地理解随机事件的性质。
在统计学、工程学、物理学、生物学和金融学等领域,常用概率分布被广泛应用于数据分析和模拟等方面。
接下来,我将介绍一些最常见的概率分布。
1. 二项分布二项分布是一种离散的概率分布,它描述了两种可能结果中每一种结果的概率。
比如说,抛硬币的结果只有正面和反面两种可能性。
当每次实验仅有两种可能结果,并且这两种结果的概率相等时,可以使用二项分布来计算任意试验中某个结果被观察到的概率。
一般地,二项分布可以用来计算n次独立实验中恰好有k次成功的概率。
2. 正态分布正态分布是一种连续概率分布,也称为高斯分布。
它是自然界中最常见的概率分布之一,用于描述一些连续型变量(例如长度、质量和时间等)的分布情况。
具有正态分布的数据通常呈现出钟形曲线的形状,且均值、中位数和众数相等。
正态分布是许多模型和算法的基础,例如线性回归和神经网络等。
3. 泊松分布泊松分布是一种离散概率分布,它描述了在一定时间内某个事件发生的次数。
该分布适用于低概率事件的发生频率较高的情况,例如在一定时间内接收到的电子邮件数量以及某种疾病的发病率等。
此外,泊松分布还可以用于描述自然生态系统中的物种数量变化、军事战斗中的伤亡人数等。
4. 指数分布指数分布是一种连续概率分布,用于描述一些事件所需的时间间隔。
比如说,等车的时间、电话呼叫之间的间隔时间等都可以用指数分布来描述。
该分布的特点是概率随着时间间隔的增加而逐渐减小,且具有单峰趋势。
5. Gamma分布Gamma分布是一种连续概率分布,广泛应用于工程和自然科学领域。
它可以用来描述诸如距离、强度、能量和粒子次数等连续型随机变量之和的概率分布。
由于Gamma 分布具有特定的形状和参数,因此它可以与其他分布结合使用,用于模拟各种实际场景的数据。
6. 卡方分布卡方分布是一种连续概率分布,用于描述统计独立性检验的结果。
常见概率分布特征总结
1、正态分布:正态分布是最常用的概率分布之一,它出现在许多形
式的研究中,主要是属于连续性概率分布。
正态分布的形状是一个钟形曲线,由一个均值(μ)和标准差(σ)决定。
它两侧各有一个“长”尖,就像
一个钟形。
正态分布的总体平均值μ=样本的均值,正态分布的总体方差
σ2=样本的方差。
正态分布有着特殊的性质:(1)中位数等于均值。
(2)标准差越大,尖峰越低,右腹越宽,左腹越窄。
(3)曲线两侧对称,均值、中位数、众数均相同。
2、贝叶斯分布:贝叶斯分布是一种连续性概率分布,其函数形式为
x^(α-1)*exp(-x^2/2b^2)。
贝叶斯分布具有有限的可变性,因此可以用
来描述连续现象的概率分布,如测量误差、估计参数等现象。
贝叶斯分布
亦称为Α-分布,其中α是分布的形状参数,β则表示尺度参数,可以
衡量其方差的大小。
当α=1和β=1时,贝叶斯分布可以用高斯分布来描述,此时又称为双变量高斯分布。
3、对数正态分布:对数正态分布是一种同密度连续概率分布,它是
一种特殊的正态分布,分布的概率密度函数与正态分布不同之处在于,其
取值范围限制在非负值,而且在正值上变化更为迅速,由均值μ和方差
σ2决定。
常用的概率分布类型与其特征3.1 二点分布和均匀分布1、两点分布许多随机事件只有两个结果.如抽检产品的结果合格或不合格;产品或者可靠的工作,或者失效.描述这类随机事件变量只有两个取值,一般取0和1.它服从的分布称两点分布.其概率分布为:其中 Pk=P〔X=Xk〕,表示X取Xk值的概率:0≤P≤1.X的期望 E〔X〕=PX的方差 D〔X〕=P〔1—P〕2、均匀分布如果连续随机变量X的概率密度函数f〔x〕在有限的区间[a,b]上等于一个常数,则X服从的分布为均匀分布.其概率分布为:X的期望 E〔X〕=〔a+b〕/2X的方差 D〔X〕=〔b-a〕2/123.2 抽样检验中应用的分布3.2.1 超几何分布假设有一批产品,总数为N,其中不合格数为d,从这批产品中随机地抽出n 件作为被检样品,样品中的不合格数X服从的分布称超几何分布.X的分布概率为:X=0,1,……X的期望 E〔X〕=nd/NX的方差 D〔X〕=〔〔nd/N〕〔〔N-d〕/N〕〔〔N-n〕/N〕〕〔1/2〕3.2.2 二项分布超几何分布的概率公式可以写成阶乘的形式,共有9个阶乘,因而计算起来十分繁琐.二项分布就可以看成是超几何分布的一个简化.假设有一批产品,不合格品率为P,从这批产品中随机地抽出n件作为被检样品,其中不合格品数X服从的分布为二项分布.X的概率分布为:0<p<1x=0,1,……,nX的期望 E〔X〕=npX的方差 D〔X〕=np〔1-p〕3.2.3 泊松分布泊松分布比二项分布更重要.我们从产品受冲击〔指瞬时高电压、高环境应力、高负载应力等〕而失效的事实引入泊松分布.假设产品只有经过一定的冲击次数后,产品才失效,又设这些冲击满足三个条件:〔1〕、两个不相重叠的时间间隔内产品所受冲击次数相互独立;〔2〕、在充分小的时间间隔内发生两次或更多次冲击的机会可忽略不计;〔3〕、在单位时间内发生冲击的平均次数λ〔λ>0〕不随时间变化,即在时间间隔Δt内平均发生λΔt次冲击,它和Δt 的起点无关.则在[0,t]时间内发生冲击的次数X服从泊松分布,其分布概率为:X的期望 E〔X〕=λtX的方差 D〔X〕=λt假设仪表受到n次冲击即发生故障,则仪表在[0,t]时间内的可靠度为:其中:x =0,1,2,……,λ>0,t>0.3.2.4 x2分布本分布是可靠性工程中最常用的分布之一,虽然其概率密度形式较复杂,但可由标准正态分布推出.设有v个相互独立的随机变量X1,X2,…… Xv,它们服从于标准正态分布N 〔0,1〕.记x2 =X12 + X22 +…Xv2 ,x2读作"卡方"则x2服从的分布称为x2分布.它的概率密度函数为:该式称为随机变量x2服从自由度为V的x分布.式中:V—为自由度,是个自然数x2分布最重要的性质是:当m为整数时:3.3 产品的寿命分布3.3.1 指数分布指数分布是电子产品在可靠性工程学中最重要的分布.通常情况下,电子产品在剔除了早期故障后,到发生元器件或材料的老化变质之前的随机失效阶段其寿命服从指数分布规律.指数分布是唯一的失效率不随时间变化而变化的连续随机变量的概率分布.容易推出:指数分布有如下三个特点:1.平均寿命和失效率互为倒数;MTBF=1/λ2.特征寿命就是平均寿命;3.指数分布具有无记忆性.〔即产品以前的工作时间对以后的可能工作时间没有影响〕3.3.2 威布尔分布从上面的描述可知,指数分布只适用于浴盆曲线的底部,但任何产品都有早期故障,也总有耗损失效期.在可靠性工程学中用威布尔分布来描述产品在整个寿命期的分布情况.将指数分布中的〔-λt〕替换为〔-〔t/η〕m〕,就得到威布尔分布.容易得到:3.3.3 正态分布与对数正态分布正态分布又称为常态分布或高斯分布.它的概率密度函数为:式中:-∞<x<∞分布函数记为:对数正态分布是指:若寿命T的对数lnT服从正态分布N〔u,σ〕,则T服从对数正态分布.它的概率密度函数为:式中:t,σ为正数,μ和σ分别称为对数正态分布的"对数均值"和"对数标准差".3.4 为进行统计推断所构造的分布3.4.1 t分布〔学生氏分布〕t—分布常用于区间估计、正态总体的假设检验以与机械概率设计之中.服从t—分布的随机变量记住t.它是服从标准正态分布N〔0,1〕的随机变量U和服从自由度为v的x2分布的随机变量x2〔v〕的函数.它的概率密度函数f〔t〕为:3.4.2 F—分布F分布主要用于两个总体的假设检验与方差分析.服从F分布的随机变量F是两个相互独立的x2分布随机变量x2〔v1〕和x2〔v2〕的函数:式中:F只能取正值.F分布的概率密度函数为:另外还有β—分布等.中位秩是β—分布的中位数,一般用下式求出:中位秩值≈〔i-0.3〕/<n+0.4> 式中:n为样本总数.。
常见的概率分布离散分布0-1分布(伯努利分布)它的分布律为:\[P\{X=k\}=p^k(1-p)^{1-k}, k=0,1, (0<p<1)\]0-1分布记作:\(X \sim b(1,p)\)期望:\(E(X)=p\)⽅差:\(D(X)=p(1-p)\)常⽤的场景:新⽣婴⼉性别的登记,招⽣考试的录取,产品的是否合格,硬币的正反⾯。
⼆项分布⼆项分布为\(n\)重伯努利实验的概率分布。
分布律为:\[P\{X=k\}=\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k},k=0,1,2,...,n,(0<p<1)\]\[\sum\limits_{k=0}^{n}P\{X=k\}=\sum\limits_{k=0}^{n}\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}=(p+1-p)^n=1\]⼆项分布记作:\( X \sim b(n,p)\)期望:\(E(X)=np\)⽅差:\(D(X)=np(1-p)\)常⽤的场景:⽐如⼀个⼈射击\(n\)次,其中\(k\)次命中的概率,抽查50台设备,其中10台出故障的概率等等。
从下⾯的图中,我们可以看到命中次数先增加,到了3达到最⼤,之后⼜逐渐减少,⼀般来说,对于固定的\(n,p\),都具有这⼀性质。
(1)当\((n+1)p\)不为整数时,⼆项概率\(P\{X=k\}\)在\(k=[(n+1)p]\)时达到最⼤值;(2)当\((n+1)p\)为整数时,⼆项概率\(P\{X=k\}\)在\(k=(n+1)p,k=(n+1)p-1\)时达到最⼤值。
%每轮射击10次,命中概率0.3,射击10000轮,x中返回的是每轮中命中的次数x=binornd(10,0.3,10000,1);%bin的数⽬为10hist(x,10);N=100;p=0.4;k=0:N;%事件发⽣k次的概率pdf=binopdf(k,N,p);%事件发⽣不⼤于k次的概率cdf=binocdf(k,N,p);plotyy(k,pdf,k,cdf);grid on;多项分布多项式分布是⼆项式分布的扩展,在多项式分布所代表的实验中,⼀次实验会有多个互斥结果,⽽⼆项式分布所代表的实验中,⼀次实验只有两个互斥结果。