常用离散型分布
- 格式:pps
- 大小:966.00 KB
- 文档页数:4
第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x pp ====-<<则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =两点分布的方差:()(1)D X p p =-(2)二项分布: 若一个随机变量X 的概率分布由式{}(1),0,1,...,.k k n k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,.k kn k n P x k C p p k n -==-=二项分布的期望:()E X np =二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k e k k λλλ-==>=则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k e k k λλλ-==>=泊松分布的期望:()E X λ=泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt -∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布: (1)均匀分布:若连续型随机变量X 的概率密度为则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度: 均匀分布的期望:()2a bE X +=均匀分布的方差:2()()12b a D X -=(2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩则称X 服从参数为λ的指数分布,记为 X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a ab x f ⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a ab x f指数分布的期望:1()E X λ=指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X 的概率密度为22()21()x f x ex μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()21()x f x ex μσ--=-∞<<+∞正态分布的期望:()E X μ=正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==2222()()x t xx ex e dt ϕφ---∞=⎰标准正态分布表的使用: (1)0()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数:设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
数据的基本分布类型数据的基本分布类型是统计学中常用的概念,用于描述数据的分布特征。
根据数据的性质和分布情况,可以将数据的基本分布类型分为离散型和连续型两大类。
一、离散型分布离散型分布是指数据取值有限且可数的情况。
在离散型分布中,每个数据点都是独立的,不存在连续的取值范围。
下面我们将介绍几种常见的离散型分布。
1. 二项分布二项分布是一种离散型分布,它描述了在n次独立重复实验中成功的次数的概率分布。
例如,抛硬币的结果可以看作是一次二项分布实验,成功表示正面朝上,失败表示反面朝上。
二项分布的概率质量函数可以用来计算在n次实验中成功k次的概率。
2. 泊松分布泊松分布是一种离散型分布,它描述了在一个固定时间段内,某事件发生的次数的概率分布。
泊松分布常用于描述稀有事件的发生情况,例如单位时间内电话呼叫的次数、单位面积内的交通事故次数等。
泊松分布的概率质量函数可以用来计算在给定时间段内事件发生k次的概率。
3. 几何分布几何分布是一种离散型分布,它描述了在一系列独立重复实验中,首次成功所需的实验次数的概率分布。
例如,抛硬币直到正面朝上为止的次数可以看作是一次几何分布实验。
几何分布的概率质量函数可以用来计算在第k次实验中首次成功的概率。
二、连续型分布连续型分布是指数据可以取任意实数值的情况。
在连续型分布中,数据点之间存在无穷多个取值可能,可以形成连续的取值范围。
下面我们将介绍几种常见的连续型分布。
1. 正态分布正态分布是一种连续型分布,也称为高斯分布。
正态分布是自然界中许多现象的分布模型,例如人的身高、智力水平等。
正态分布的概率密度函数呈钟形曲线,均值和标准差决定了分布的位置和形状。
2. 均匀分布均匀分布是一种连续型分布,它的概率密度函数在一个区间上是常数。
均匀分布常用于描述随机变量在一定范围内等可能地取值的情况,例如掷骰子的结果。
均匀分布的概率密度函数可以用来计算在给定区间内随机变量取值的概率。
3. 指数分布指数分布是一种连续型分布,它描述了事件发生的时间间隔的概率分布。
概率分布的种类与性质概率分布是概率论中的重要概念,用于描述随机变量的取值与其对应的概率。
不同的随机变量具有不同的概率分布,而概率分布又可以分为多种种类。
本文将介绍常见的概率分布种类及其性质。
一、离散型概率分布离散型概率分布是指随机变量取有限个或可数个值的概率分布。
常见的离散型概率分布有以下几种:1. 伯努利分布(Bernoulli Distribution)伯努利分布是最简单的离散型概率分布,它描述了只有两个可能结果的随机试验,如抛硬币的结果(正面或反面)。
伯努利分布的概率质量函数为:P(X=k) = p^k * (1-p)^(1-k),其中k=0或1,p为成功的概率。
2. 二项分布(Binomial Distribution)二项分布是一种重要的离散型概率分布,它描述了n次独立重复的伯努利试验中成功次数的概率分布。
二项分布的概率质量函数为: P(X=k) = C(n,k) * p^k * (1-p)^(n-k),其中k=0,1,...,n,C(n,k)为组合数,p为成功的概率。
3. 泊松分布(Poisson Distribution)泊松分布是一种用于描述单位时间或单位空间内随机事件发生次数的离散型概率分布。
泊松分布的概率质量函数为:P(X=k) = (λ^k * e^(-λ)) / k!,其中k=0,1,2,...,λ为平均发生率。
二、连续型概率分布连续型概率分布是指随机变量取值为连续区间内的概率分布。
常见的连续型概率分布有以下几种:1. 均匀分布(Uniform Distribution)均匀分布是一种简单的连续型概率分布,它在给定区间内的取值概率相等。
均匀分布的概率密度函数为:f(x) = 1 / (b-a),其中a为区间下界,b为区间上界。
2. 正态分布(Normal Distribution)正态分布是一种重要的连续型概率分布,也被称为高斯分布。
正态分布具有钟形曲线,对称分布于均值周围。
离散型的常见的分布0-1分布x只能取1或0,对应概率为p和1-pP(X=k)=p k(1−p)1−k有两种实验结果,实验只做⼀次这是⼆项分布的⼀个特例⼏何分布(Geometric distribution)P(A)=p,第k次⾸次发⽣,前k-1次未发⽣P(X=k)=(1−p)k−1p记作X~G(p)⼆项分布(Binomial Distribution)P(A)=p,做了n次实验,发⽣了k次P(X=k)=C k n p k(1−p)n−k记作X~B(p)最可能值1)(n+1)p不为整数,则将(n+1)p取整后达最⼤值 2)(n+1)p是整数,(n+1)p、(n+1)p-1是最⼤值泊松分布(Poisson distribution)P(X=k)=(λk∗e−λ)/k!记作X~P(λ)⽽计算泊松分布的值是⼀件很痛苦的事情,主要解决⽅法是查表使⽤泊松分布来近似⼆项分布要求:n⽐较⼤,p较⼩,np适中(n>=100,np<=10)令λ=np,查表超⼏何分布(Hypergeometric Distribution)超⼏何分布是统计学上⼀种离散概率分布。
它描述了从有限N个物件(其中包含M个指定种类的物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回)。
P(X=k)=C k M C n−k/C M NN−M记作X~H(n,M,N)超⼏何分布主要⽤来描述不放回抽样实验,当n相对于N很⼩时,P=M/N改变⼩,可以将不放回实验近似为放回实验故可以⽤⼆项分布进⾏近似(因为超⼏何分布计算困难)P(X=k)=C k M C n−k/C M N≈C k n p k(1−p)n−kN−M⼀些题的思路:超⼏何分布近似⼆项分布,⼆项分布近似泊松分布(λ=np),查表Processing math: 100%。
3种常用离散型分布的公式嘿,咱们来聊聊 3 种常用的离散型分布公式。
先来说说二项分布。
这二项分布啊,就好比你扔硬币。
假设你扔 10 次硬币,每次都只有正面和反面两种可能,而且每次扔硬币正面朝上的概率都一样。
那在这10 次中,出现正面的次数就可能符合二项分布。
我记得之前教过一个学生,他特别纠结这个二项分布的公式。
我就跟他说:“你就想象成你去抽奖,每次抽奖中奖的概率是固定的,抽了特定的次数,算一下总共中奖几次的可能性。
”他还是一脸懵。
于是我就给他举了个例子,假设抽奖中奖概率是 0.2,一共抽 5 次,那中奖 2次的概率咋算呢?这时候二项分布公式就派上用场啦。
二项分布的公式是:P(X = k) = C(n, k) * p^k * (1 - p)^(n - k) 。
这里的 n 就是试验次数,k 就是成功的次数,p 是每次试验成功的概率。
再讲讲泊松分布。
泊松分布就像是在一段时间或者一个区域内,某种事件发生的次数。
比如说,在一个小时内,某个路口发生交通事故的次数。
我曾经观察过我们学校门口的交通情况。
有一天,我特意在那站了一个小时,想看看大概会有多少起小的交通摩擦。
结果发现,差不多平均下来,一个小时会有那么两三起。
这其实就有点像泊松分布的情况。
泊松分布的公式是:P(X = k) = (λ^k * e^(-λ)) / k! ,这里的λ是单位时间或者单位面积内事件发生的平均次数。
最后说说几何分布。
几何分布就好像是你不断尝试做一件事,直到第一次成功为止,所需要的尝试次数。
有次我陪我家孩子玩猜谜语,他一直猜不对,我就告诉他,你猜猜看,平均几次能猜对一个。
这其实就和几何分布有点关系。
几何分布的公式是:P(X = k) = (1 - p)^(k - 1) * p ,其中 p 是每次试验成功的概率。
总之,这三种离散型分布公式在生活和学习中都有很多用处。
咱们多观察、多思考,就能更好地理解和运用它们啦!。
分布律的名词解释分布律,是指描述和表达随机变量在不同取值下的可能性的规则或规律。
它是概率论中的重要概念,用于描述随机事件发生的概率分布情况。
在不同的领域和学科中,分布律有着不同的表达方式和数学模型,用于研究和分析各种随机事件和现象的发生概率。
一、离散型分布律的名词解释离散型分布律用于描述随机变量只能取有限个或可数个值的情况。
常见的离散型分布律有以下几种:1. 伯努利分布:伯努利分布是最简单的分布律之一。
它描述了一个随机试验只有两个可能结果的情况,例如投硬币的结果可以是正面或反面。
伯努利分布的特点是只有一个参数p,表示事件发生的概率。
2. 二项分布:二项分布是一种多次独立且具有相同概率的伯努利试验的概率分布。
它描述了在多次重复试验中成功次数的概率分布。
二项分布有两个参数n和p,其中n表示试验次数,p表示每次试验成功的概率。
3. 泊松分布:泊松分布用于描述单位时间或单位面积内某事件发生的次数的概率分布情况。
它适用于描述独立事件在固定时间或空间上的随机性分布。
泊松分布只有一个参数λ,表示单位时间或单位面积内事件的平均发生次数。
二、连续型分布律的名词解释连续型分布律用于描述随机变量在一个区间内的值的概率分布情况。
与离散型分布律不同,连续型分布律无法用一个具体的值来表示,而是使用一个概率密度函数来表示。
1. 均匀分布:均匀分布是最简单的连续型分布之一,它描述了在一个区间内各个取值具有相同的概率密度。
均匀分布的概率密度函数为常数,表示取值在该区间内的均匀分布。
2. 正态分布:正态分布,也称为高斯分布或钟形曲线,是自然界中许多现象的分布规律。
它的概率密度函数是一个钟形曲线,对称于均值。
正态分布以其良好的数学性质和广泛适用性而在各个领域得到广泛应用。
3. 指数分布:指数分布是描述一些连续事件之间间隔时间的概率分布。
它常用于描述等待时间、寿命等现象。
指数分布的概率密度函数呈现出递减的指数函数形式。
三、应用与扩展分布律不仅仅用于描述和研究单个随机变量的概率分布,还能够通过随机过程、组合和变换等方式应用于更复杂的随机事件和现象。
常用离散型随机变量的概率分布一、离散型随机变量简介离散型随机变量是指只能取有限个或可数个值的随机变量。
在概率论与数理统计中,离散型随机变量的概率分布描述了该随机变量每个可能取值的概率。
在实际问题中,常用的离散型随机变量包括伯努利分布、二项分布、泊松分布和几何分布等。
二、伯努利分布伯努利分布是一种表示两个可能结果的离散型概率分布。
它的特点是每次试验只有两个可能结果:成功和失败。
该分布由一个参数p确定,表示成功的概率,成功的概率为p,失败的概率为1-p。
伯努利分布的概率质量函数如下:P(X=x) = p^x * (1-p)^(1-x)其中,x为随机变量X的取值(0或1),p为成功的概率。
三、二项分布二项分布是一种多次独立重复实验的离散型概率分布。
它描述了n次重复独立实验中成功次数的概率分布。
每次实验都有两个可能结果:成功和失败。
每次实验成功的概率为p,失败的概率为1-p。
二项分布的概率质量函数如下:P(X=k) = C(n,k) * p^k * (1-p)^(n-k)其中,X为成功次数的随机变量,k为取值,n表示实验的次数,p为每次实验成功的概率。
四、泊松分布泊松分布是描述单位时间(或单位空间)内某种事件发生次数的离散型概率分布。
泊松分布适用于很多事件发生的情况,例如到达人口数量、电话交换机接收到的呼叫数量等。
泊松分布的特点是事件的发生率稳定且独立。
泊松分布的概率质量函数如下:P(X=k) = (λ^k * e^(-λ)) / k!其中,X为事件发生次数的随机变量,k为取值,λ表示单位时间(或单位空间)内事件的平均发生次数。
五、几何分布几何分布是描述进行独立重复实验,直到第一次成功出现时的实验次数的离散型概率分布。
每次实验成功的概率为p,失败的概率为1-p。
几何分布的概率质量函数如下:P(X=k) = (1-p)^(k-1) * p其中,X为成功所需的实验次数的随机变量,k为取值,p为每次实验成功的概率。
离散型分布
Li Junrong
stat9@
随机变量的类型
●定量资料看作是连续型变量●定性资料看作是离散型变量
①、组合(Combination ):从个n 元素中抽取k 个元素组成一组(不考虑其顺序)的组合方式个数记为
!!()!
n n k k n k ⎛⎫=
⎪-⎝⎭2
333!6C =
322!(32)!21⎛⎫=== ⎪-⨯⎝⎭
k n n C k ⎛⎫ ⎪⎝⎭
或(n!为的阶乘,n!=1*2*……*n,0!=1)
回忆:数学概念
2
222)(b
ab a b a ++=+3
2
2
3
3
33)(b
ab b a a b a +++=+
②、牛顿二项展开式:
()()()(
)()()011
22
1
2
11
10()...n
n n n n n n n n n n n n
n n k n k
k k
a b a b a b a b a b a b a b
-----=+=+++++=∑
二项分布Binomial distribution
Bernoulli试验
毒性试验:小白鼠死亡——生存
临床试验:病人治愈——未愈
临床化验:血清阳性——阴性
事件成功(A)——失败(非A)这类“成功─失败型”试验称为Bernoulli试验。
一、二项分布定义
●任意一次试验中,只有事件A发生和不发生两种对立结果。
●A发生的概率是π,不发生的概率为(1-π)。
●若在相同的条件下,进行n次重复试验,其结果是相互独立的。
用X表示这n次试验中事件A发生的次数,那么X服从二项分布,记做X~B(n,π) 。
条件
二、二项分布的概率
例题:假设小白鼠接受一定剂量的毒物时,其死亡概率是80%。
对每只小白鼠来说,其死亡事件A发生的概率是0.8,不发生的概率是0.2。
试验用3只小白鼠,请列举可能出现的试验结果及发生的概率。
在n 次独立重复试验中,事件A (死亡)发
生的次数X (0,1,2,…,n)的概率P(X):
X ~B(n,π):随机变量X 服从以n,π为参数的二项分布。
(
)()(1)
n X
n X
X
P X π
π-=-()!
()!!
n X X
n
n C
n X X ==
-概率函数
●
在n 次独立重复试验中,事件A (死亡)至少发生k 次的概率:
●
在n 次独立重复试验中,事件A (死亡)至多发生k 次的概率:
分布函数
n
X=k
P X k)=P(k)+P(k+1)+...+P(n)=P(X)
≥∑(k
X=0
P X k)=P(0)+P(1)+...+P(k)=P(X)
≤∑(
三、二项分布的均数与标准差 X ~B(n,π):
X 的均数μX =n π
X 的方差σX 2 = n π(1-π)
X 的标准差:(1)
x n σππ=-
四、二项分布的图形
●图形特点:两个轴意义,对称、偏态、与正态分布的关系
●决定图形的两个参数:n,
五、样本率的均数和标准差
●样本率的均数μp :●样本率的标准差σp:●样本率的标准差(估计值)Sp:
11()p x n n n
μμππ===1(1)p x n n ππσσ-==(1)p p p S n
-=(标准误)
二项分布的应用:统计推断
●总体率区间估计
●样本率与总体率的比较
●两样本率的比较
(一)、总体率区间估计
●
查表法(基于二项分布原理)
●正态近似法(基于二项分布正态近似原理)条件:n 较大、p 与(1-p)均不太小,如np 及n(1-p)均大于5时。
95%CI:
π的p
p 1.96S ±
(二)样本率与总体率的比较
1、直接概率法(基于二项分布原理)
2、正态近似法(基于二项分布正态近似原理)
条件:n较大、p与(1-p)均不太小,如np
及n(1-p)均大于5时。
●例题:P118 例6-4
●分析题意,选择合适的计算统计量的方法。
假设检验过程
1.建立假设:
H0:π= 0.55
H1:π>0.55
2.确定显著性水平,α取0.05。
(单侧)
3.计算统计量:P(9)+P(10)直接得到P值。
4.比较P与α
5.做出推论
(三)两样本率的比较检验统计量u 的计算:
12
12p p p p u S --=注:可用卡方检验取代,了解即可。
不作要求:
家庭聚集性检验群检验
泊松分布Poisson distribution
问题的引出
●盒子中装有999个黑棋子和1个白棋子,在一次抽样中,抽中白棋子的概率为1/1000
●在100次抽样中,抽中0,1,2,…10个白棋子的概率分别是……
●放射性物质单位时间内的放射次数
●单位体积内粉尘的计数
●血细胞或微生物在显微镜下的计数
●单位面积内细菌计数
●人群中患病率很低的非传染性疾病的患病数
特点:罕见事件发生数的分布规律
Piosson 的概念●常用于描述单位时间、单位面积或单位空间中稀有事件发生数的随机分布规律。
●
若罕见事件A 的发生数为X(0,1,2,…),X 的发生概率P(X):则X 服从Piosson 分布,记为:X ~P ()。
Piosson 分布的总体均数为Piosson 分布的均数和方差相等。
=σ2 ()!
X e P X X λλ
-=σλ
=λ
λλ
Piosson分布的条件
●由于Piosson分布是二项分布的特例,所以,二项分布的三个条件也就是Piosson分布的适
用条件。
●另外,单位时间、面积或容积、人群中观察事件的分布应该均匀。
Piosson分布的特点
●Piosson分布的图形
●Piosson分布的可加性
●Piosson分布与正态分布及二项分布的关系。
泊松分布的图形
λ
λ
λλ
Piosson 分布的可加性
●
观察某一现象的发生数时,如果它呈Piosson 分布,那么把若干个小单位合并为一个大单位后,其总计数亦呈Piosson 分布。
●如果X 1~, X 2~,… X m ~,那么X=X 1+ X 2+… +X m ,则1()P λ2()P λ()m P λ12m λλλλ=+++ ()X P λ
Piosson 分布与
正态分布及二项分布的关系20λ≥二项分布
泊松分布正态分布
n 0,
n =ππλ→∞
→()n ,0.5n >5,n 1->5πππ↑→
Piosson分布的应用
●总体均数的区间估计
●样本均数与总体均数的比较
●两样本均数的比较
总体均数的区间估计
查表法(基于泊松分布原理)
正态近似法(基于泊松分布正态近似原理)条件:当X>20。
u a X X
样本均数与总体均数的比较
●直接概率法:例6-12 (P125)
●正态近似法:统计量u
例6-13 (P126)X
u
λ
λ
-=
两样本均数的比较
●两个样本观察单位相同时:计算统计量
●两个样本观察单位不同时:
12
12
X X u X X -=-1
212
122212
X X n n u X X n n -=+
例题:
●P127 例6-14
●P127 例6-15
负二项分布(略)
●常用于描述传染性疾病的分布●致病生物的分布
●毒理学中应用。