(完整版)三大分布及其分位数
- 格式:ppt
- 大小:277.02 KB
- 文档页数:11
1、正态分布正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。
当μ=0,σ=1时,正态分布就成为标准正态分布N(0,1)。
概率密度函数为:正态分布的密度函数的特点是:关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,图像是一条位于x轴上方的钟形曲线。
2、伯努利分布如果随机变量X只取0和1两个值,并且相应的概率为:则称随机变量X服从参数为p的伯努利分布,若令q=1一p,则X的概率函数可写为:伯努利分布(二点分布)的期望E(X)=p,D(X)=p(1-p)。
(其中,离散数据的方差计算公式为D(X)=E{[X-E(X)]^2})n重伯努利分布(二项分布)的期望E(X)=np,D(X)=np(1-p)。
3、泊松分布在统计学上,只要某类事件满足三个条件,它就服从"泊松分布"。
三个条件分别是:①事件X的发生是小概率事件②事件X的发生是随机而且互相独立的③事件X发生的概率相对稳定。
泊松分布的公式为:各个参数的含义:单位时间(或单位面积)内随机事件的平均发生率,即P(X=k)事件X发生k次的概率,λ表示事件X稳定发生的概率。
当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似。
设X~B(n,p),当n很大,p很小,且λ=np适中时,有P(x=k)≈λ^k/k! ·e^(-λ),推导过程如下所示:为第二重要极限公式,上面的推到会涉及到。
1.分布若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution),其中参数n称为自由度,正如正态分布中均值或方差不同就是另一个正态分布一样,自由度不同就是另一个分布。
记为或者卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时,分布近似为正态分布。
对于任意正整数k, 自由度为k的卡方分布是一个随机变量X的机率分布。
[1]2.特点概率密度函数其中,是伽玛函数。
期望和方差分布的均值为自由度n,记为E() = n。
分布的方差为2倍的自由度(2n),记为D() = 2n。
3. 性质1)分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数n 的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1.2) 分布的均值与方差可以看出,随着自由度n的增大,χ2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。
3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4) 若互相独立,则:服从分布,自由度为;服从分布,自由度为3概率表分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在χ2分布中得对每个分布定制相应的概率值,这通过χ2分布表中列出不同的自由度来表示,在χ2分布表中还需要如标准正态分布表中给出不同P 值一样,列出概率值,只不过这里的概率值是χ2值以上χ2分布曲线以下的概率。
由于χ2分布概率表中要列出很多χ2分布的概率值,所以χ2分布中所给出的P 值就不象标准正态分布中那样给出了400个不同的P 值,而只给出了有代表性的13个值,因此χ2分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。
查χ2分布概率表时,按自由度及相应的概率去找到对应的χ2值。