概率论中几种常用的重要的分布
- 格式:doc
- 大小:879.50 KB
- 文档页数:24
概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布): 若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x p p ====-<<,则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =-(2)二项分布:若一个随机变量X 的概率分布由式{}(1),0,1,...,.k kn k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)).两点分布的概率分布:{}(1),0,1,...,.k k n kn P x k C p p k n -==-= 二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k ek k λλλ-==>=,则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k ek k λλλ-==>=泊松分布的期望:()E X λ=;泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt-∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布: (1)均匀分布:若连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a a b x f ,则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度:⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a a b x f 均匀分布的期望:()2a bE X +=;均匀分布的方差:2()()12b a D X -= (2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩,则称X 服从参数为λ的指数分布,记为X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩指数分布的期望:1()E X λ=;指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X的概率密度为22()2()x f x x μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()2()x f x x μσ--=-∞<<+∞正态分布的期望:()E X μ=;正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==,2222()()x t xx x e dtϕφ---∞=标准正态分布表的使用: (1)()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数: 设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
高中概率分布知识点1. 引言概率分布是概率论中的重要概念,它描述了随机变量的取值及其对应的概率。
在高中数学中,我们学习了几种常见的概率分布,包括二项分布、泊松分布和正态分布。
本文将逐步介绍这些概率分布的概念、性质和应用。
2. 二项分布二项分布是一种离散型概率分布,它描述了在一系列独立重复的伯努利实验中成功次数的概率。
具体而言,对于一个伯努利实验,每次试验只有两个可能的结果,成功和失败,且成功的概率为p,失败的概率为q=1-p。
进行n次独立重复的伯努利实验后,成功次数的概率分布就服从二项分布。
二项分布的概率质量函数可以用公式表示为: P(X=k) = C(n,k) * p^k * q^(n-k)其中,X表示成功次数,k表示具体的成功次数,C(n,k)表示组合数,p表示成功的概率,q表示失败的概率。
二项分布的期望值和方差可以通过公式计算: E(X) = n * p Var(X) = n * p * q3. 泊松分布泊松分布是一种离散型概率分布,它描述了在一定的时间或空间范围内随机事件发生的次数的概率。
泊松分布适用于以下情况:事件在时间或空间上是独立发生的,事件发生的平均次数是已知的。
泊松分布的概率质量函数可以用公式表示为: P(X=k) = (e^(-λ) * λ^k) / k! 其中,X表示事件发生的次数,k表示具体的次数,λ表示事件发生的平均次数。
泊松分布的期望值和方差均等于λ:E(X) = λ Var(X) = λ4. 正态分布正态分布是一种连续型概率分布,也称为高斯分布。
它在自然界中的分布非常广泛,也是统计学中应用最广泛的分布。
正态分布的特点是对称、钟形曲线,其形状由两个参数决定:均值μ和标准差σ。
正态分布的概率密度函数可以用公式表示为:f(x) = (1 / (σ *sqrt(2π))) * e(-(x-μ)2 / (2σ^2)) 其中,x表示随机变量的取值,μ表示均值,σ表示标准差。
正态分布的期望值和方差分别等于μ和σ^2:E(X) = μ Var(X) = σ^25. 应用实例这些概率分布在实际问题中有广泛的应用。
附件6编号(注:此处编号作者不填,由论文收藏单位填写.正式论文此行提示信息删除并保留2空行.)学士学位论文概率统计中几种重要分布及关系学院名称:专业班级:学生姓名:学号:指导教师:完成日期:年月日摘要概率统计作为数学知识理论中的重要内容,对于数学学习有重要的作用.随机变量的分布是概率统计中的重要内容,对随机变量分布的学习,有利于全面掌握概率统计的相关内容.本文主要是对概率统计中几种重要分布及关系的研究,采用文献总结法和分析归纳法,通过对概率统计中二项分布、泊松分布、正态分布的概念进行阐述,对三种分布之间的联系进行分析研究,对三种分布在实际中的具体应用进行系统的表述,最终得出二项分布与泊松分布之间之间,当n的数值越大时,二者的相似度越高;二项分布与正态分布之间存在二项分布收敛于正态分布的关系;泊松分布与正态分布存在某种固定的内在联系。
通过对概率统计中几种重要分布及关系的研究,有利于旨在建立系统全面的概率统计的知识架构,加强学生对概率统计相关知识的掌握和学习.关键词:概率统计;分布;关系;应用Several important distributions and relations in probability andstatisticsAbstractProbability and statistics, as an important part of mathematical knowledge theory, plays an important role in mathematics learning. The distribution of random variables is an important part of probability and statistics. Learning the distribution of random variables is conducive to a comprehensive grasp of the relevant content of probability and statistics. This paper mainly studies several important distributions and relationships in probability and statistics, using the methods of literature summary and analysis induction, This paper expounds the concepts of binomial distribution, Poisson distribution and normal distribution in probability and statistics, analyzes the relationship between the three distributions, and systematically describes the specific application of the three distributions in practice. Finally, it comes to the conclusion that the greater the value of binomial distribution and Poisson distribution, the higher the similarity between them; there is a gap between binomial distribution and normal distribution In the relationship of binomial distribution converging to normal distribution, Poisson distribution and normal distribution have some fixed internal relations. Through the study of several important distributions and relationships in probability and statistics, it is helpful to establish a systematic and comprehensive knowledge framework of probability and statistics, and strengthen students' mastery and learning of probability and statistics related knowledge.Key words: probability and statistics; distribution; relation; application目录摘要 (I)ABSTRACT (II)1绪论 (1)1.1研究背景及意义 (1)1.1.1研究背景 (1)1.1.2研究意义 (1)1.2国内外研究现状 (1)1.2.1国内研究现状 (1)1.2.2国外研究现状 (2)1.3研究主要内容 (2)2相关概念 (4)2.1二项分布 (4)2.2泊松分布 (4)2.3正态分布 (5)3.三种分布间的联系 (7)3.1二项分布与泊松分布之间的联系 (7)3.2二项分布与正态分布之间的联系 (8)3.3泊松分布与正态分布之间的联系 (9)4.三种分布在实际中的应用 (11)4.1二项分布的具体应用 (11)4.2泊松分布的具体应用 (12)4.3正态分布的具体应用 (13)结论 (15)参考文献 (16)致谢 (17)1绪论1.1研究背景及意义1.1.1研究背景概率统计是数学课程中较为重要的数学知识点,二项分布、泊松分布、正态分布、指数分布是数学概率论中最为基础的数学知识点,也是日常练习过程中较为常见的概率分布。
概率论常见的几种分布常见的几种概率分布概率论是研究随机现象的数学理论,其中涉及到许多常见的概率分布。
概率分布描述了随机变量在不同取值上的概率分布情况。
本文将介绍几种常见的概率分布,包括均匀分布、正态分布、泊松分布和指数分布。
一、均匀分布均匀分布是最简单的概率分布之一,也被称为矩形分布。
在均匀分布中,随机变量在一定的取值范围内的概率是相等的。
例如,抛一枚公正的硬币,正面朝上和反面朝上的概率都是1/2。
均匀分布通常用于模拟随机数发生器的输出,或者在一定范围内随机选择一个数值。
二、正态分布正态分布是最重要的概率分布之一,也被称为高斯分布。
在正态分布中,随机变量在取值范围内的概率密度函数呈钟形曲线状。
正态分布具有许多重要的性质,例如均值、标准差等。
正态分布在自然界和社会科学中广泛应用,例如身高、体重、考试成绩等都符合正态分布。
三、泊松分布泊松分布描述了单位时间或空间内事件发生的次数的概率分布情况。
泊松分布的特点是,事件之间相互独立且平均发生率恒定。
泊松分布通常用于描述稀有事件的发生情况,例如单位时间内的电话呼叫次数、单位面积内的交通事故次数等。
四、指数分布指数分布描述了连续随机变量首次达到某一值的时间间隔的概率分布情况。
指数分布的特点是,事件之间相互独立且事件发生的概率与时间间隔成反比。
指数分布通常用于模拟随机事件的发生时间间隔,例如单位时间内的电话呼叫间隔、单位距离内的交通事故间隔等。
除了上述几种常见的概率分布外,还有许多其他概率分布,例如二项分布、伽玛分布、贝塔分布等。
每种概率分布都有其特定的应用场景和数学性质,对于不同的问题可以选择适合的概率分布进行建模和分析。
总结起来,概率论中常见的几种分布包括均匀分布、正态分布、泊松分布和指数分布。
这些分布在各自的领域有着广泛的应用,可以帮助我们理解和解决许多随机现象和问题。
对于研究概率论和统计学的人来说,熟悉这些常见的概率分布是非常重要的。
概率论分布类型概率论是数学中的一个分支,研究随机事件发生的概率和规律。
概率论中有很多重要的概念和方法,其中分布类型是一个非常重要的概念。
分布类型是指某个随机变量的取值在各个取值点上出现的概率分布情况,这种分布情况可以用分布函数或概率密度函数来描述。
下面我们来详细了解一下概率论中常见的分布类型。
1. 均匀分布均匀分布是指在一定范围内的每个取值点出现的概率都相等的一种分布类型。
例如掷骰子,每个点数出现的概率都是1/6,就是一个均匀分布。
均匀分布的概率密度函数是一个常数函数,分布函数是一个分段函数。
2. 正态分布正态分布是指在一定范围内,随机变量的取值呈现出钟形曲线的一种分布类型。
正态分布在自然界中非常普遍,例如人类身高、智商、体重等都服从正态分布。
正态分布的概率密度函数可以用公式表示,而分布函数则需要用积分来计算。
3. 泊松分布泊松分布是指在一定时间或空间内,某个事件发生的次数服从一定的概率分布规律。
例如,在某个时间段内接到电话的次数、某个地区某种疾病的发病率等都可以用泊松分布来描述。
泊松分布的概率密度函数和分布函数都可以用公式表示。
4. 二项分布二项分布是指在n次独立重复试验中,成功次数服从一定的概率分布规律。
例如抛硬币、掷骰子等都可以用二项分布来描述。
二项分布的概率密度函数和分布函数都可以用公式表示。
5. 负二项分布负二项分布是指在n次独立重复试验中,成功r次时停止试验所需的失败次数服从一定的概率分布规律。
例如,在某个网站上购买物品直到获得r个优惠券时所需的购买次数就可以用负二项分布来描述。
负二项分布的概率密度函数和分布函数都可以用公式表示。
6. 指数分布指数分布是指某个事件发生时间间隔服从一定的概率分布规律。
例如等待下一辆公交车的时间、两次地震间隔时间等都可以用指数分布来描述。
指数分布的概率密度函数和分布函数都可以用公式表示。
7. 伽马分布伽马分布是指在一定时间或空间内,某个事件发生次数服从一定的概率分布规律。
概率论与数理统计中的三种重要分布摘要:在概率论与数理统计课程中,我们研究了随机变量的分布,具体地研究了离散型随机变量的分布和连续型随机变量的分布,并简单的介绍了常见的离散型分布和连续型分布,其中二项分布、Poisson 分布、正态分布是概率论中三大重要的分布。
因此,在这篇文章中重点介绍二项分布、Poisson 分布和正态分布以及它们的性质、数学期望与方差,以此来进行一次比较完整的概率论分布的学习。
关键词:二项分布;Poisson 分布;正态分布;定义;性质一、二项分布二项分布是重要的离散型分布之一,它在理论上和应用上都占有很重要的地位,产生这种分布的重要现实源泉是所谓的伯努利试验。
(一)泊努利分布[Bernoulli distribution ] (两点分布、0-1分布)1.泊努利试验在许多实际问题中,我们感兴趣的是某事件A 是否发生。
例如在产品抽样检验中,关心的是抽到正品还是废品;掷硬币时,关心的是出现正面还是反面,等。
在这一类随机试验中,只有两个基本事件A 与A ,这种只有两种可能结果的随机试验称为伯努利试验。
为方便起见,在一次试验中,把出现A 称为“成功”,出现A 称为“失败” 通常记(),p A P = ()q p A P =-=1。
2.泊努利分布定义:在一次试验中,设p A P =)(,p q A P -==1)(,若以ξ记事件A 发生的次数,则⎪⎪⎭⎫⎝⎛ξp q 10~,称ξ服从参数为)10(<<p p 的Bernoulli 分布或两点分布,记为:),1(~p B ξ。
(二)二项分布[Binomial distribution]把一重Bernoulli 试验E 独立地重复地进行n 次得到n 重Bernoulli 试验。
定义:在n 重Bernoulli 试验中,设(),()1P A p P A q p ===-若以ξ记事件A 发生的次数,则ξ为一随机变量,且其可能取值为n ,,2,1,0 ,其对应的概率由二项分布给出:{}k n kk n p p C k P --==)1(ξ,n k ,,3,2,1,0 =,则称ξ服从参数为)10(,<<p p n 的二项分布,记为),(~p n B ξ。
概率论几种重要的分布
概率论中有许多重要的分布,包括以下几种:
1. 正态分布(Normal Distribution):也称为高斯分布,是最常见的分布之一。
它具有钟形曲线,对称,以及均值和方差完全定义。
在许多实际应用中,自然界中许多现象都遵循正态分布。
2. 二项分布(Binomial Distribution):描述了在固定次数的独立重复试验中成功次数的概率分布。
每个试验有两个可能的结果,成功和失败,并且每次试验的成功概率保持不变。
3. 泊松分布(Poisson Distribution):用于描述稀有事件在固定时间或空间上的发生次数的概率分布。
它假设事件发生的概率相等,且事件之间是相互独立的。
4. 均匀分布(Uniform Distribution):也称为矩形分布,是一种概率分布,其中所有可能的结果的概率是相等的。
在定义了一个范围之后,均匀分布将这个范围内的概率均匀地分布。
5. 指数分布(Exponential Distribution):用于描述独立事件发生间隔的概率分布。
它假设事件是以恒定速率独立地发生的,即它具有无记忆性。
6. t分布(Student t-Distribution):用于小样本情况下的统计推断,当样本量较小时,t分布的尾部更加重,与正态分布相比,更容易出现极端值。
以上只是一些重要的分布,概率论还有很多其他的分布,根据实际应用的不同,可以选择合适的分布模型。
概率论八大分布概率论是统计学的一个重要分支,它探究随机变量及其关联性,研究不同的现象的结果和概率分布之间的关系,提供量化的度量工具以确保实际应用的准确性。
概率论八大分布是概率论中应用最为广泛的几个分布,它们提供了研究各种随机现象的基础,影响了大量的现实问题的解决方案,其实质是根据大量试验获得的数据来拟合出不同类型的概率分布。
首先,概率论八大分布中首先涉及的是正态分布。
是一种最常见的概率分布,也称作高斯分布。
正态分布的图形可以表示为一个双峰的曲线,其特点是只有两个参数:均值μ和标准差σ,它可以用来描述平均值的概率密度分布情况,即随机变量的取值可能会靠近均值μ。
其次,另一个重要的概率分布是均匀分布。
均匀分布是一种两个参数(下限a和上限b)的概率分布,这两个参数分别代表了随机变量可能取值的范围,即该变量只能在a和b之间取值,其中每一个结果都有相同的概率。
第三,指数分布是另一种广泛使用的分布,它具有唯一的参数λ,该参数代表了随机变量的变化率。
指数分布的特性是,它可以用来衡量发生某种事件的时间间隔,以及研究受试者遭受某种不利影响的持续时间。
接下来,椭圆分布(又称偏态分布)是一种广泛应用的概率分布,它可以用来描述数据集中对称性差异。
椭圆分布有三个参数:均值μ、标准差σ和偏度γ,其中偏度γ决定了数据集中偏斜程度。
接着,卡方分布是一种常常用来拟合实验数据的分布,它用一个参数k来描述数据的分布形状。
卡方分布是一种双峰分布,它的参数k决定了其双峰形状陡峭程度。
此外,t-分布是一种密度比较大的分布,它是一种卡方分布的变种,但具有更大的连续性。
t-分布有两个参数,即自由度ν和不同的中心值μ,它主要用于检验两个样本之间的差异和单样本的参数估计。
接着,F-分布是t-分布的多变量拓展,如果两个样本是来自不同的总体,那么可以使用F-分布来检验这两个样本的差异。
F-分布的参数为两个自由度,即自由度1和自由度2,它最常用于在两个样本之间检验方差的差异。
常见概率分布类型解析概率分布是描述随机变量可能取值的概率的函数。
在统计学和概率论中,有许多常见的概率分布类型,它们在不同的情境下具有不同的特点和应用。
本文将对几种常见的概率分布类型进行解析,包括二项分布、泊松分布、正态分布和指数分布。
一、二项分布二项分布是最常见的离散概率分布之一,描述了在一系列独立重复的同一试验中成功的次数的概率分布。
在每次试验中,事件只有两种可能的结果,通常用“成功”和“失败”来表示。
二项分布的概率质量函数可以用以下公式表示:P(X=k) = C(n,k) * p^k * (1-p)^(n-k)其中,P(X=k)表示成功的次数为k的概率,n表示试验的总次数,p表示每次试验成功的概率,C(n,k)表示组合数。
二项分布常用于描述二元随机变量的分布,例如抛硬币、赌博游戏等。
在实际应用中,二项分布可以用来估计二元事件发生的概率,进行假设检验等。
二、泊松分布泊松分布是描述单位时间(或单位空间)内随机事件发生次数的概率分布。
泊松分布适用于事件发生的次数是独立的且平均发生率是恒定的情况。
泊松分布的概率质量函数可以用以下公式表示:P(X=k) = (λ^k * e^(-λ)) / k!其中,P(X=k)表示事件发生次数为k的概率,λ表示单位时间(或单位空间)内事件平均发生率。
泊松分布常用于描述稀有事件的发生情况,例如电话交换机接到的电话数、一天内发生的交通事故数等。
在实际应用中,泊松分布可以用来预测未来一段时间内事件发生的概率。
三、正态分布正态分布是最常见的连续概率分布之一,也称为高斯分布。
正态分布具有钟形曲线的特点,均值、方差完全决定了正态分布的形状。
正态分布的概率密度函数可以用以下公式表示:f(x) = (1 / (σ * sqrt(2π))) * e^(-(x-μ)^2 / (2σ^2))其中,f(x)表示随机变量X的概率密度函数,μ表示均值,σ表示标准差。
正态分布在自然界和社会现象中广泛存在,例如身高、体重、考试成绩等。
概率分布计算公式概率分布是概率论中重要的概念之一,它描述了随机变量在各个取值上的取值概率。
在实际问题中,我们常常需要计算概率分布以解决相关的概率统计问题。
本文将介绍几种常见的概率分布以及它们的计算公式。
一、二项分布(Binomial Distribution)二项分布是概率论中常用的离散型概率分布,它描述了在一定次数的独立重复试验中,成功事件发生的次数的概率分布。
其计算公式为:P(X=k) = C(n, k) * p^k * (1-p)^(n-k)其中,P(X=k)表示成功事件发生k次的概率,n表示试验次数,p表示每次试验成功的概率,C(n, k)表示组合数,可以使用n个数任取k个的方式计算。
二项分布的期望为E(X)=np,方差为Var(X)=np(1-p)。
二、泊松分布(Poisson Distribution)泊松分布是一种离散型概率分布,适用于描述单位时间(或单位空间)内随机事件发生的次数。
其计算公式为:P(X=k) = (λ^k * e^(-λ))/k!其中,P(X=k)表示事件发生k次的概率,λ表示单位时间(或单位空间)内事件发生的平均次数,e为自然对数的底。
泊松分布的期望为E(X)=λ,方差为Var(X)=λ。
三、正态分布(Normal Distribution)正态分布是概率论中最重要的连续型概率分布,也称为高斯分布。
它的形状呈钟型曲线,对称于均值。
正态分布在实际问题中得到广泛应用。
其概率密度函数的计算公式为:f(x) = (1 / (σ * √(2π))) * e^((-1/2)*((x-μ)/σ)^2)其中,f(x)表示随机变量X的概率密度函数,μ为均值,σ为标准差,π为数学常数3.14159。
正态分布的期望为E(X)=μ,方差为Var(X)=σ^2。
四、指数分布(Exponential Distribution)指数分布是一种连续型概率分布,其概率密度函数具有常数倍衰减的特点。
进阶的概率学知识概率学是数学的一个分支,它研究随机现象的规律性和不确定性。
在现代社会中,概率论不仅在数学领域起着重要的作用,而且广泛应用于统计学、物理学、生物学、经济学、计算机科学等领域。
本文将介绍概率学的一些进阶知识,帮助读者深入理解这个有趣而重要的学科。
一、概率分布概率分布是概率论的核心概念之一。
它描述了随机变量在每个可能取值上的概率。
常见的概率分布包括均匀分布、正态分布、泊松分布等。
其中,正态分布是最为重要的概率分布之一,也是自然界中普遍存在的分布。
正态分布的密度函数呈钟形曲线,具有均值和标准差两个参数,可以被广泛应用于统计分析和预测模型中。
二、条件概率与贝叶斯定理条件概率是指在已知一些附加信息的情况下,发生某一事件的概率。
它是概率论中的重要概念,常常用于解决实际问题中的推理和决策。
贝叶斯定理是概率论中的一个关键定理,它描述了在已知先验概率的情况下,如何根据新的观测数据来更新概率估计。
贝叶斯定理在机器学习、人工智能等领域具有广泛的应用,尤其在推荐系统、图像识别和自然语言处理等方面表现出色。
三、随机变量与期望随机变量是概率论中的一个重要概念,它用来描述随机实验的一种数值指标。
随机变量可以是离散型的,也可以是连续型的。
期望是度量随机变量平均值的一种概念,它是随机变量的加权平均值。
期望在概率论和统计学中被广泛应用,它可以帮助我们理解和推导随机变量的性质,同时也是许多概率分布的重要参数。
四、大数定律与中心极限定理大数定律和中心极限定理是概率论中的两个重要定理。
大数定律指出,当随机试验次数足够多时,随机事件的频率会趋近于其概率。
这一定律在统计推断和抽样理论中起着重要作用。
中心极限定理是指当独立随机变量的和服从一定分布时,这些随机变量的均值的分布会趋近于正态分布。
中心极限定理在统计学中有重要应用,因为它提供了对样本均值的分布进行推断的理论基础。
五、假设检验与置信区间假设检验是概率论和统计学中的重要方法,用于判断某个统计参数是否满足给定的假设。
第二章 随机变量及其分布I 教学基本要求1、了解随机变量的概念以及它与事件的联系;2、理解随机变量的分布函数的概念与性质;理解离散型随机变量的分布列、连续型随机变量的密度函数及它们的性质;3、掌握几种常用的重要分布:两点分布、二项分布、泊松分布、均匀分布、指数分布、正态分布,且能熟练运用;4、会求简单随机变量函数的分布.II 习题解答A 组1、检查两个产品,用T 表示合格品,F 表示不合格品,则样本空间中的四个样本点为1(,)F F ω=、2(,)T F ω=、3(,)F T ω=、4(,)T T ω=以X 表示两个产品中的合格品数.(1) 写出X 与样本点之间的对应关系;(2) 若此产品的合格品率为p ,求(1)p X =? 解:(1) 10ω→、21ω→、31ω→、42ω→;(2) 12(1)(1)2(1)p X C p p p p ==-=-.2、下列函数是否是某个随机变量的分布函数?(1) 021()2021x F x x x <-⎧⎪⎪=-≤<⎨⎪≥⎪⎩; (2) 21()1F x x =+ ()x -∞<<+∞. 解:(1) 显然()F x 是单调不减函数;0()1F x ≤≤,且()0F -∞=、()1F +∞=;(0)()F x F x +=,故()F x 是某个随机变量的分布函数.(2) 由于()01F +∞=≠,故()F x 不是某个随机变量的分布函数. 3、设X 的分布函数为(1)0()00x A e x F x x -⎧-≥=⎨<⎩求常数A 及(13)p X <≤?解:由()1F +∞=和lim (1)xx A e A -→+∞-=得1A =;(13)(3)(1)(3)(1)p X p X p X F F <≤=≤-≤=- 3113(1)(1)e e e e ----=---=-.4、设随机变量X 的分布函数为200()0111x F x Ax x x ≤⎧⎪=<≤⎨⎪>⎩求常数A 及(0.50.8)p X <≤?解:由(10)(1)F F +=得1A =;(0.50.8)(0.8)(0.5)(0.8)(0.5)p X p X p X F F <≤=≤-≤=- 220.80.50.39=-=.5、设随机变量X 的分布列为()ap X k N==(1,2,,)k N =L 求常数a ?解:由11ii p+∞==∑得11Nk aN ==∑ 1a ⇒=.6、一批产品共有100个,其中有10个次品,求任意取出的5个产品中次品数的分布列? 解:设X 表示5个产品中的次品数,则X 是离散型随机变量,其所有可能取值为0、1、…、5,且0510905100(0)C C p X C ==、1410905100(1)C C p X C ==、2310905100(2)C C p X C ==、3210905100(3)C C p X C ==、4110905100(4)C C p X C ==、5010905100(5)C C p X C ==于是X 的分布列为510905100()k k C C p X k C -== (0,1,,5)k =L . 7、设10件产品中有2件次品,进行连续无放回抽样,直至取到正品为止,以X 表示抽样次数,求(1) X 的分布列; (2) X 的分布函数?解:(1) 由题意知X 是离散型随机变量,其所有可能取值为1、2、3,且84(1)105p X ===、288(2)10945p X ==⨯=、2181(3)109845p X ==⨯⨯=于是X(2) 由(1)可知的分布函数为014125()44234513x x F x x x <⎧⎪⎪≤<⎪=⎨⎪≤<⎪⎪≥⎩.8、设随机变量X 的分布函数为010.211()0.3120.52313x x F x x x x <-⎧⎪-≤<⎪⎪=≤<⎨⎪≤<⎪≥⎪⎩ 求X 的分布列?解:X 9、求在同一时刻(1) 恰有2个设备被使用的概率; (2) 至少有3个设备被使用的概率; (3) 至多有3个设备被使用的概率?解:设X 表示被同时使用的供水设备数,则~(5,0.1)X b (1) 恰有2个设备被使用的概率为2235(2)(0.1)(0.9)0.0729p X C ===;(2) 至少有3个设备被使用的概率为(3)(3)(4)(5)p X p X p X p X ≥==+=+=33244550555(0.1)(0.9)(0.1)(0.9)(0.1)(0.9)0.00856C C C =++=;(3) 至多有3个设备被使用的概率为(3)1(4)(5)p X p X p X ≤=-=-=44550551(0.1)(0.9)(0.1)(0.9)0.99954C C =--=.10、经验表明:预定餐厅座位而不来就餐的顾客比例为20%,如今餐厅有50个座位,但预定给了52位顾客,求到时顾客来到餐厅而没有座位的概率是多少?解:设X 表示预定的52位顾客中不来就餐的顾客数,则~(52,0.2)X b ,由于“顾客来到餐厅没有座位”等价于“52位顾客中至多有1位不来就餐”,于是所求概率为005211515252(1)(0)(1)(0.2)(0.8)(0.2)(0.8)p X p X p X C C ≤==+==+0.0001279=.11、设某城市在一周内发生交通事故的次数服从参数为的泊松分布,求 (1) 在一周内恰好发生2次交通事故的概率; (2) 在一周内至少发生1次交通事故的概率?解:设X 表示该城市一周内发生交通事故的次数,则~(0.3)X P (1) 在一周内恰好发生2次交通事故的概率20.30.3(2)0.03332!p X e -===;(2) 在一周内至少发生1次交通事故的概率00.30.3(1)1(0)10.2590!p X P X e -≥=-==-=.12、设X 服从泊松分布,已知(1)(2)p X p X ===,求(4)p X =? 解:由(1)(2)p X p X ===得22ee λλλλ--=2λ⇒=422(4)0.09024!p X e -⇒===.13、一批产品的不合格品率为,现从中任取40件进行检查,若发现两件或两件以上不合格品就拒收这批产品,分别用以下方法求拒收的概率:(1) 用二项分布作精确计算;(2) 用泊松分布作的似计算?解:设X 表示抽取的40件产品中的不合格品数,则~(40,0.02)X b (1) 拒收的概率为(2)1(0)(1)p X p X p X ≥=-=-=0040113940401(0.02)(0.98)(0.02)(0.98)0.1905C C =--=;(2) 由于400.020.8λ=⨯=,于是拒收的概率为(2)1(0)(1)p X p X p X ≥=-=-= 0.80.810.80.1912e e --≈--=.14、设随机变量X 的密度函数为201()0x x f x ≤≤⎧=⎨⎩其它求X 的分布函数?解:由()()xF x f t dt -∞=⎰得当0x <时()()00xxF x f t dt dt -∞-∞===⎰⎰当01x ≤≤时2200()()02|x xxF x f t dt dt tdt t x -∞-∞==+==⎰⎰⎰当1x >时0121001()()020|1x xF x f t dt dt tdt dt t -∞-∞==++==⎰⎰⎰⎰于是所求分布函数为200()0111x F x x x x <⎧⎪=≤≤⎨⎪>⎩. 15、设随机变量X 的密度函数为212(1)12()0x f x x⎧-≤≤⎪=⎨⎪⎩其它求X 的分布函数?解:由()()xF x f t dt -∞=⎰得当1x <时()()00xxF x f t dt dt -∞-∞===⎰⎰当12x ≤≤时1121111()()02(1)2()|2(2)xxx F x f t dt dt dt t x t t x-∞-∞==+-=+=+-⎰⎰⎰ 当2x >时122121211()()02(1)02()|1xx F x f t dt dt dt dt t t t-∞-∞==+-+=+=⎰⎰⎰⎰于是所求分布函数为011()2(2)1212x F x x x x x <⎧⎪⎪=+-≤≤⎨⎪>⎪⎩. 16、设随机变量X 的密度函数为cos ()220A x x f x ππ⎧-≤≤⎪=⎨⎪⎩其它求(1) 常数A ;(2) X 的分布函数;(3) (0)4p X π<≤?解:(1) 由()1f x dx +∞-∞=⎰得2222220cos 0sin |21dt A xdx dt A x A ππππππ-+∞--∞-++===⎰⎰⎰12A ⇒=; (2) 当2x π<-时()()00xxF x f t dt dt -∞-∞===⎰⎰当22x ππ-≤≤时2221111()()0cos sin |sin 2222x xxF x f t dt dt tdt t x πππ---∞-∞-==+==+⎰⎰⎰当2x π>时22222211()()0cos 0sin |122xx F x f t dt dt tdt dt t ππππππ---∞-∞-==++==⎰⎰⎰⎰ 于是所求分布函数为0211()sin 222212x F x x x x ππππ⎧<-⎪⎪⎪=+-≤≤⎨⎪⎪>⎪⎩;(3) (0)()(0)()(0)444p X p X p X F F πππ<≤=≤-≤=-1111sin sin 0242224π=+--=. 17、设随机变量X 的分布函数为1()ln 11x F x xx e x e<⎧⎪=≤≤⎨⎪>⎩求(1) (03)p X <≤、(2)p X <、(2 2.5)p X <<;(2) X 的密度函数?解:(1) (03)(3)(0)(3)(0)101p X p X p X F F <≤=≤-≤=-=-=(2)(2)(2)(2)ln 2p X p X p X F <=≤-===5(2 2.5)(2 2.5)(2.5)(2)ln 2.5ln 2ln 4p X p X F F <<=<≤=-=-=;(2) 由于在()F x 的可导点处,有()()f x F x '=,于是X 的密度函数为11()0x ef x x⎧≤≤⎪=⎨⎪⎩其它.18、设~(1,6)K U ,求方程210x Kx ++=有实根的概率? 解:由~(1,6)K U 得K 的密度函数为116()5k f k ⎧<<⎪=⎨⎪⎩其它又由于方程210x Kx ++=有实根等价于240K -≥,即||2K ≥,于是方程有实根的概率为22(||2)(2)(2)()()p K p K p K f k dk f k dk -+∞-∞≥=≤-+≥=+⎰⎰621455dk ==⎰. 19、调查表明某商店从早晨开始营业起直至第一个顾客到达的等待时间X (单位:分钟)服从参数为0.4的指数分布,求下述事件的概率(1) X 至多3分钟; (2) X 至少4分钟;(3) X 在3分钟至4分钟之间; (4) X 恰为3分钟?解:(1) X 至多3分钟的概率为0.43 1.2(3)(3)11p X F e e -⨯-≤==-=-;(2) X 至少4分钟的概率为0.44 1.6(4)1(4)1(4)1(1)p X p X F e e -⨯-≥=-<=-=--=;(3) X 在3分钟至4分钟之间的概率为(34)(4)(3)(4)(3)p X p X p X F F ≤≤=≤-<=- 0.440.43 1.2 1.6(1)(1)e e e e -⨯-⨯--=---=-;(4) X 恰为3分钟的概率为(3)0p X ==.20、设~(0,1)X N ,求下列事件的概率( 2.35)p X ≤;( 1.24)p X ≤-;(|| 1.54)p X ≤?解:( 2.35)(2.35)0.9906p X ≤=Φ=;( 1.24)( 1.24)1(1.24)10.89250.1075p X ≤-=Φ-=-Φ=-=; (|| 1.54)( 1.54 1.54)(1.54)( 1.54)p X p X ≤=-≤≤=Φ-Φ- (1.54)[1(1.54)]2(1.54)120.938210.8764=Φ--Φ=Φ-=⨯-=.21、设~(3,4)X N ,(1) 求(25)p X <≤、(||2)p X >、(3)p X >;(2) 确定c ,使得()()p X c p X c >=≤;(3) 若d 满足()0.9p X d >≥,则d 至多为多少?解:(1) 23353(25)()222X p X p ---<≤=≤≤ (1)(0.5)(1)(0.5)10.84130.691510.5328=Φ-Φ-=Φ+Φ-=+-=23323(||2)1(||2)1()222X p X p X p ---->=-≤=-≤≤1(0.5)( 2.5)1(0.5)(2.5)=-Φ-+Φ-=+Φ-Φ10.69150.99380.6977=+-= 333(3)1(3)1()22X p X p X p -->=-≤=-≤ 1(0)10.50.5=-Φ=-=;(2) 由()()p X c p X c >=≤得1()()p X c p X c -≤=≤3330.5()()()222X c c p X c p ---⇒=≤=≤=Φ 3032c c -⇒=⇒=; (3) 由()0.9p X d >≥得3330.9()1()1()1()222X d d p X d p X d p ---≤>=-≤=-≤=-Φ 33()0.11()0.122d d--⇒Φ≤⇒-Φ≤ 33()0.9 1.2820.43622d d d --⇒Φ≥⇒≥⇒≤.22、从甲地飞住乙地的航班,每天上午10:10起飞,飞行时间X 服从均值为4h ,标准差为20min 的正态分布.(1) 该航班在下午2:30以后到达乙地的概率; (2) 该航班在下午2:20以前到达乙地的概率;(3) 该航班在下午1:50至2:30之间到达乙地的概率? 解:(1) 该航班在下午2:30以后到达乙地的概率为240260240240(260)()1(1)202020X X p X p p ---≥=≥=-< 1(1)10.84130.1587=-Φ=-=;(2) 该航班在下午2:20以前到达乙地的概率为240250240(250)()(0.5)0.69152020X p X p --≤=≤=Φ=; (3) 该航班在下午1:50至2:30之间到达乙地的概率为220240240260240(220260)()202020X p X p ---≤≤=≤≤(1)(1)2(1)120.841310.6826=Φ-Φ-=Φ-=⨯-=.23、某地抽样调查结果表明,考生的外语成绩(百分制)近似地服从2(72,)N σ,已知96分以上的人数占总数的%,试求考生的成绩在60分至84分之间的概率?解:设考生的外语成绩为X ,则2~(72,)X N σ 由96分以上的人数占总数的%得0.023(96)p X =>729672240.977(96)()()X p X p σσσ--⇒=≤=≤=Φ242σ⇒=12σ⇒=于是,考生的成绩在60分至84分之间的概率为6072728472(6084)()121212X p X p ---≤≤=≤≤ (1)(1)2(1)120.841310.6826=Φ-Φ-=Φ-=⨯-=.24求cos Y X =的分布列?解:由X于是Y25求2Y X =的分布列?解:由26、设随机变量的密度函数为2311()2X xx f x ⎧-<<⎪=⎨⎪⎩其它求随机变量3Y X =+的密度函数?解:由题意知,当2y ≤时,有()()0Y F y p Y y =≤=当24y <<时,有()()(3)(3)(3)Y X F y p Y y p X y p X y F y =≤=+≤=≤-=-当4y ≥时,有()()1Y F y p Y y =≤=即Y 的分布函数02()(3)2414Y X y F y F y y y ≤⎧⎪=-<<⎨⎪≥⎩于是,Y 的密度函数()()Y Y f y F y '=(3)240X F y y '-<<⎧=⎨⎩其它23(3)2420y y ⎧-<<⎪=⎨⎪⎩其它.27、设随机变量~(0,1)X U ,求随机变量XY e =的密度函数? 解:由题意知,当1y ≤时,有()()0Y F y p Y y =≤=当1y e <<时,有()()()(ln )(ln )X Y X F y p Y y p e y p X y F y =≤=≤=≤=当y e ≥时,有()()1Y F y p Y y =≤=即Y 的分布函数1()(ln )11Y X y F y F y y e y e≤⎧⎪=<<⎨⎪≥⎩于是,Y 的密度函数()()Y Y f y F y '=(ln )10XF y y e'<<⎧=⎨⎩其它110y ey ⎧<<⎪=⎨⎪⎩其它.28、随机变量X 的密度函数为()0xX e x f x x -⎧>=⎨≤⎩ 求随机变量2Y X =的密度函数?解:由于20Y X =≥,故当0y <时,有()()0Y F y p Y y =≤=;当0y ≥时,有2()()()(Y F y p Y y p X y p X =≤=≤=≤≤0()1x X f x dx dx e -===-即Y 的分布函数10()0Y e y F y y ⎧-≥⎪=⎨<⎪⎩于是,Y 的密度函数0()()00Y Y y f y F y y >'==≤⎩.29、设随机变量~(0,1)X N ,试求随机变量||Y X =的密度函数? 解:由于||0Y X =≥,故当0y <时,有()()0Y F y p Y y =≤=; 当0y ≥时,有()()(||)()2()1Y F y p Y y p X y p y X y y =≤=≤=-≤≤=Φ-即Y 的分布函数2()10()00Y y y F y y Φ-≥⎧=⎨<⎩于是,Y 的密度函数()()Y Y f y F y '=2()00y y y 'Φ>⎧=⎨≤⎩22000yy y ->=≤⎩.B 组1、A2、B3、D4、B5、B6、B7、C8、C9、C10、C11、设随机变量X 的分布函数为0111()21232x a x F x a x a b x <-⎧⎪-≤<⎪⎪=⎨-≤<⎪⎪+≥⎪⎩且1(2)2p X ==,求常数a 、b ? 解:由()1F +∞=及()()(0)p X a F a F a ==--得()121(2)(2)(20)()()32F a b p X F F a b a +∞=+=⎧⎪⎨==--=+--=⎪⎩1726a b a b +=⎧⎪⇒⎨+=⎪⎩1656a b ⎧=⎪⎪⇒⎨⎪=⎪⎩.12求常数a ?解:由11ii p+∞==∑得20.5121a a +-+=12a ⇒=±再由11202a a -≥⇒≤,可得12a =-. 13、口袋中有5个球,编号为1、2、3、4、5,从中任取3个,以X 表示取出的3个球中的最大号码.(1) 求X 的分布列; (2) 求X 的分布函数?解:(1) 由题意知X 是离散型随机变量,其所有可能取值为3、4、5,且22351(3)10C p X C ===、23353(4)10C p X C ===、24356(5)10C p X C ===于是X(2) 由(1)可知的分布函数为030.134()0.44515x x F x x x <⎧⎪≤<⎪=⎨≤<⎪⎪≥⎩.14、设随机变量X 的密度函数为||()x af x Ce -= (0)a >求(1) 常数C ;(2) X 的分布函数;(3) (||2)p X <?解:(1) 由()1f x dx +∞-∞=⎰得||0()2221x x aaf x dx C e dx C e dx aC +∞+∞+∞---∞====⎰⎰⎰12C a⇒=; (2) 当0x <时 ||111()()222t t xa a a x x x F x f t dt e dt e dt e a a --∞-∞-∞====⎰⎰⎰当0x ≥时||||0011()()22t t a a xx F x f t dt e dt e dt a a---∞-∞==+⎰⎰⎰ 001111222t t x a a a x e dt e dt e a a ---∞=+=-⎰⎰于是102()1102xa x a e x F x e x -⎧<⎪⎪=⎨⎪-≥⎪⎩;(3) 22211(||2)(22)(2)(2)1122a a a p X p X F F e e e ---<=-<<=--=--=-. 15、设随机变量X 的密度函数为201()0xx f x ≤≤⎧=⎨⎩其它以Y 表示对X 的三次独立重复观察中事件1{}2X ≤出现的次数,求(2)P Y =?解:由题意知:事件1{}2X ≤在一次观察中出现的概率为1112222001()02|4p f x dx dt xdx x -∞-∞==+==⎰⎰⎰ 且~(3,)Y b p ,于是223139(2)()()4464P Y C ===. 16、设顾客在某银行的窗口等待服务的时间X (单位:分钟)服从指数分布,其密度函数为510()5x e x f x x -⎧>⎪=⎨⎪≤⎩某顾客在窗口等待服务,若超过10分钟他就离开.他一个月要到银行5次,以Y 表示一个月内他未等到服务而离开窗口的次数,求(1)p Y ≥?解:由题意知:顾客在窗口等待服务的时间超过10分钟的概率为5521010101()|5x x p f x dx e dx e e +∞+∞--+∞-===-=⎰⎰且~(5,)Y b p ,于是02025255(1)1(0)1()(1)1(1)0.5167P Y P Y C e e e ---≥=-==--=--=.17、设随机变量2~(2,)X N σ且(24)0.3p X <<=,求(0)p X <? 解:由2~(2,)X N σ得224242(24)()()(0)0.3p X p X σσσ---<<=<<=Φ-Φ=2()0.8σ⇒Φ=0222(0)()()1()10.80.2p X p X σσσ-⇒<=<=Φ-=-Φ=-=.18、设随机变量X 的分布函数为()F x ,试求随机变量()Y F X =的密度函数? 解:由于0()1F X ≤≤,故当0Y <时,有()()0Y F y p Y y =≤=; 当01y ≤≤时,有11()()(())(())(())Y F y p Y y p F X y p X F y F F y y --=≤=≤=≤==当1y >时,有()()1Y F y p Y y =≤= 即Y 的分布函数00()0111Y y F y yy y <⎧⎪=≤≤⎨⎪>⎩于是,Y 的密度函数()()Y Y f y F y '=101y <<⎧=⎨⎩其它即随机变量Y 服从区间(0,1)上的均匀分布.。
概率论常见的几种分布常见的概率论分布有:均匀分布、正态分布、泊松分布和指数分布。
1. 均匀分布均匀分布是指在一段区间内,各个取值的概率是相等的。
比如在一个骰子的例子中,每个面出现的概率是相等的,为1/6。
均匀分布在实际应用中常用于随机数生成、样本抽取等场景。
2. 正态分布正态分布又被称为高斯分布,是最常见的概率分布之一。
正态分布的特点是呈钟形曲线,数据集中在均值周围,并且具有对称性。
正态分布在自然界中广泛存在,比如人的身高、体重等都近似服从正态分布。
在统计学和数据分析中,正态分布的应用非常广泛,例如在建模、假设检验和置信区间估计等方面。
3. 泊松分布泊松分布是一种离散概率分布,描述了在一段时间或空间内,某事件发生的次数的概率分布。
泊松分布的特点是事件之间是独立的,并且事件发生的平均速率是恒定的。
泊松分布在实际应用中常用于描述稀有事件的发生概率,比如电话呼叫中心的接听次数、交通事故的发生次数等。
4. 指数分布指数分布是描述连续随机变量的概率分布,用于描述时间间隔的概率分布。
指数分布的特点是事件之间是独立的,并且事件发生的速率是恒定的。
指数分布在实际应用中常用于描述如等待时间、寿命等连续性事件的概率分布。
这四种分布在概率论和统计学中都有广泛的应用。
它们分别适用于不同的场景和问题,能够帮助人们理解和分析数据。
在实际应用中,我们常常需要通过对数据进行建模和分析来确定数据的分布类型,从而更好地理解数据的特征和规律。
除了这四种常见的分布外,还有其他许多概率分布,例如二项分布、伽玛分布、贝塔分布等。
每种分布都有其独特的特点和应用领域。
在实际应用中,选择合适的分布模型对数据进行建模和分析是非常重要的,可以帮助我们更好地理解数据,做出准确的推断和预测。
概率论中常见的几种分布包括均匀分布、正态分布、泊松分布和指数分布。
每种分布都有其特点和应用场景,在实际问题中选择合适的分布模型对数据进行建模和分析是非常重要的。
通过对数据的分布进行研究,我们能够更好地理解数据的规律和特征,为决策提供科学依据。
概率论中几种常用的重要的分布摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。
其在实际中的应用。
关键词1 一维随机变量分布随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常用分布,即( 0 -1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布. 下面我们将对这六种分布逐一地进行讨论.随机事件是按试验结果而定出现与否的事件。
它是一种“定性”类型的概念。
为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。
称这种变数为随机变数。
本章内将讨论取实值的这种变数—— 一维随机变数。
定义1.1 设X 为一个随机变数,令()([(,)])([]),()F x P X x P X x x =∈-∞=-∞+∞.这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。
它是一个普通的函数。
成这个函数为随机函数X 的分布函数。
有的随机函数X 可能取的值只有有限多个或可数多个。
更确切地说:存在着有限多个值或可数多个值12,,...,a a 使得12([{,,...}])1P X a a ∈=称这样的随机变数为离散型随机变数。
称它的分布为离散型分布。
【例1】下列诸随机变数都是离散型随机变数。
(1)X 可能取的值只有一个,确切地说,存在着一个常数a ,使([])1P X a ==。
称这种随机变数的分布为退化分布。
一个退化分布可以用一个常数a 来确定。
(2)X 可能取的值只有两个。
确切地说,存在着两个常数a ,b ,使([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。
如果([])P X b p ==,那么,([])1P X a p ===-。
因此,一个两点分布可以用两个不同的常数,a b 及一个在区间(0,1)内的值p 来确定。
特殊地,当,a b 依次为0,1时,称这两点分布为零-壹分布。
概率数学分布函数归纳总结概率数学中的分布函数是指描述随机变量取值的概率分布的函数。
在概率论和统计学中,有许多常见的分布函数,它们都有各自的特点和应用领域。
在这篇文章中,我将对一些常见的分布函数进行归纳总结。
1.二项分布:二项分布是一种离散型的概率分布,描述了在一系列独立的、重复的伯努利试验中成功的次数。
它的概率质量函数为:P(X=k)=C(n,k)*p^k*(1-p)^(n-k),其中n表示试验的次数,k表示成功的次数,p表示每次试验成功的概率。
2.泊松分布:泊松分布是一种离散型的概率分布,描述了在一段时间或一定空间内随机事件发生的次数。
它的概率质量函数为:P(X=k)=(λ^k*e^(-λ))/k!,其中λ表示在单位时间或单位空间内平均发生的事件次数。
3. 正态分布:正态分布是一种连续型的概率分布,也被称为高斯分布。
它是概率理论中最重要的分布之一,具有广泛的应用。
正态分布由均值μ和方差σ^2完全描述,其概率密度函数为:f(x) = (1 / (σ * sqrt(2 * π))) * e^((-(x-μ)^2) / (2 * σ^2))。
4.均匀分布:均匀分布是一种连续型的概率分布,在一些区间内的取值概率是相等的。
它的概率密度函数为:f(x)=1/(b-a),其中a和b分别为区间的下界和上界。
5.指数分布:指数分布是一种连续型的概率分布,经常用于描述连续事件之间的时间间隔。
它的概率密度函数为:f(x)=λ*e^(-λx),其中λ为事件发生的速率参数。
6.γ分布:γ分布是一种连续型的概率分布,常用于描述连续变量的正值分布。
γ分布是指数分布的推广,它的概率密度函数为:f(x)=(1/(Γ(α)*β^α))*x^(α-1)*e^(-x/β),其中α和β为分布的形状参数。
7.β分布:β分布是一种连续型的概率分布,常用于表示随机事件概率的不确定性。
它的概率密度函数为:f(x)=(1/(β(α,β)))*x^(α-1)*(1-x)^(β-1),其中α和β为分布的形状参数。
伯努利试验、泊松过程、独立同分布生成的重要分布敖登(内蒙古大学数学科学学院2010级数理基地,01008104)摘要本文是一篇读书报告。
主要研究了伯努利试验与二项分布的关系,泊松过程生成泊松分布的过程和在泊松条件下的埃尔朗分布,正态分布的生成用到的独立同分布以及均匀分布生成任意分布的重要性质。
关键词:伯努利试验泊松分布独立同分布均匀分布的生成性Important in theory of probabilitydistribution of explorationAuthor:Ao DengTutor: Luo Cheng (School of Mathematical sciences ,Huhhot Inner Mongolia 01008104 )AbstractThis article mainly discusses the theory of several common distribution (0-1) distribution, binomial distribution, poisson distribution and uniform distribution, exponential distribution, normal distribution and normal distribution out three kinds of important distribution, distribution, distribution and the distribution of the source and the relationship among them and their application in actual.Key words: random variable; The discrete distribution ;Continuous distribution目录第一章伯努利试验生成二项分布 (4)第二章泊松过程生成泊松分布 (6)第三章独立同分布生成正态分布 (13)第四章均匀分布的生成性 (17)第五章几种重要分布的比较及应用 (19)小结 (22)致谢………………………………………………………………………………23. 参考文献…………………………………………………………………………24.第一章 伯努利试验生成二项分布考虑n 重伯努利实验中成功次数ξ.易见ξ的可能值为0,1,2,...,k n =.注意{}k ξ=当且仅当这n 次实验中恰有k 个成功A 与n k -个失败A .先考虑前k 次试验全成功而后n k -次试验全失败这一特殊情形.可得出现这种结果的概率{......}()...()()...()k n k k n k k n k p A A A A P A P A P A P A p q ---==个个个个注意所得结果仅与A 的个数k 有关,与A 出现在哪k 个位置上无关.再者,在这n次试验中选择k 次成功共有n k ⎛⎫⎪⎝⎭种方式,且各种方式两两不相容,故由可加性立得ξ的密度{}k n k n p k p q k ξ-⎛⎫== ⎪⎝⎭, 0,1,2,...,k n =一般地,任给定自然数n 及正数p ,(1)q p q +=,令0(;,)nk n k k n b k n p p q k -=⎛⎫= ⎪⎝⎭∑则(;,)0b k n p 且0(;,)nk n k k n b k n p p q k -=⎛⎫= ⎪⎝⎭∑()1n p q =+=称以{(;,)}b k n p 为密度的离散型分布为二项分布,记作(,)B n p .当1n =时的特例又称作伯努利分布.这是一个两点分布,其密度称阵为01 q p ⎛⎫⎪⎝⎭.上述推导表明,n 重伯努利试验的成功次数ξ服从参数为,n p 的二项分布(,)B n p .下面讨论二项分布的性质,对,考虑比值(;,)(1)(1)1(1;,)b k n p n k n p kb k n p kq kq-++-==+-易见,当(1)kn p +时,(;,)(1;,b k n p b k n p -:而当(1)kn p +时,(;,)(1;,b k n p b k n p -.这说明,对任何固定的参数n 与p ,(;,)b k n p 的值先随k的变大而上升,再随k 的变大而下降,于是必有最大值.如果(1)m n p =+是整数,则(;,)(1;,)b m n p b m n p =-同为(;,)b k n p 的最大值.如果(1)n p +不是整数,则(;,)b k n p 在[(1)]m n p =+处取到最大值(这里[]a 表示不超过a 的整数).我们称使(;,)b k n p 取到最大值的m 为二项分布随机变量的最可能值,或称为n 重伯努利试验的最可能成功次数。
由二项分布的导出可知,该种分布用于描述n 重伯努利试验中发生的概率为p .在研究某事件A 发生的概率时,我们对事件A 所在的试验进行独立重复观察,统计出事件A 发生的次数n μ。
这里n μ是一个随机变量,它就服从二项分布。
另外,一批种子能发芽的个数,一定人群中患某种疾病的人数,某时刻一个城市开着的灯的盏数都可以认为是服从二项分布的。
第二章 泊松过程生成泊松分布. 泊松分布是作为二项分布的极限分布而引入的。
事实上,泊松定理表明,当n 很大时,p 很小,np 适中时,(,)B n p 分布就近似于()P λ分布,其中np λ=。
由二项分布描述的内容可知,泊松分布主要用于描述大量独立重复实验中稀有事件发生的次数,所谓稀有事件指概率很小的事件。
由此,纺织品上的疵点数,印刷品中的错字数,某时间段内电话交换台接到的呼叫次数,某时间段内公共汽车站等车的乘客人数等均可用泊松分布来描述。
定理 2.1(二项分布的泊松逼近--泊松定理) 在n 重伯努利试验中,事件A 在一次实验中出现的概率为n p (与实验总数n 有关),如果当n →∞时,n np λ→(0λ常数),则有lim (;,),0,1,2,...!kn n b k n p e k k λλ-→∞==证明 记n n np λ=,则(;,)(1)k n kn n n n b k n p p p k -⎛⎫=- ⎪⎝⎭(1)...(1)1!kn kn n n n n k k n n λλ---+⎛⎫⎛⎫=- ⎪⎪⎝⎭⎝⎭12111...11!n kk n n k k n n n n λλ--⎛⎫⎛⎫⎛⎫⎛⎫=---- ⎪⎪⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭对于任一固定的k ,显然有l i mk k n n λλ→∞= l i m 1l i m 1nnnn kn knn n n n e n n λλλλλ---→∞→∞⎛⎫⎛⎫-=-= ⎪ ⎪⎝⎭⎝⎭还有11lim 1...11n k n n →∞-⎛⎫⎛⎫--= ⎪ ⎪⎝⎭⎝⎭从而lim (;,)!kn n b k n p e k λλ-→∞=对任意k (0,1,2,...k =)成立,定理得证。
定义2.1 若随机变量X 的概率分布为{},0,1,2,...!kP X k e k k λλ-===其中0λ为常数,则称X 服从参数为λ的泊松分布,记作~()X P λ泊松分布的性质:泊松分布的密度值(;)p k λ随k 的变化情况与二项分布类似。
考虑比值1(;)(1)!(1;)!k k p k k e p k k e k λλλλλλλ----==-, 1k ≥ 当kl 时有(1;)p k λ-,而当kl 时有(1;)(;)p k p k λλ-。
因此,随着k 由小变大,(;)p k λ的值先上升后下降,在[]m λ=处达到最大值,而λ当为整数时,(;)p k λ在m λ=及1m -同时取到它的最大值.这个m 称作泊松分布的最可能值。
上式也是分布的充分条件。
引理2.2.1(柯西) 若()f x 是连续函数(或单调函数),且对一切,x y (或一切0,0x y ≥≥)成立()()()f x f y f x y =+则()x f x a = 其中0a ≥,是某一常数.证明: 由()()()f x f y f x y =+知对任意x2()()02x f x f ⎡⎤=≥⎢⎥⎣⎦因此()f x 非负.反复使用()()()f x f y f x y =+,对任意正整数n 及实数x 有 []()()nf nx f x = 在上式中取1x n=,得 1(1)()n f f n ⎡⎤=⎢⎥⎣⎦记(1)0a f =≥,则11()n f a n=因此,对任意正整数m 及n ,成立1()()mmn m f f a n n ⎡⎤==⎢⎥⎣⎦这样,我们已证得()x f x a =对一切有理数成立,再利用连续性或单调性可以证明对无理数也成立,从而证明了定理。
泊松过程: 假定有一个于随即时刻陆续到来的质点流。
这里的“质点”可以是意外事故或是上面提到的α粒子等。
“于随机时间陆续到达”是指质点一个一个地到达,但质点到达的时间间隔都是随机变量。
对任何0t ≥,以t ξ代表在[)0,t 时段内到达的质点个数。
每个t ξ都是非负整值随机变量。
下面将证明,{,0}t t ξ≥添加一组通常的假设,是所谓的Possion 过程。
定理2.2假定于随机时间陆续到达的质点流满足以下条件:(1)独立增量性 在不相交时段内到达的质点数目相互独立。
即对任何12340t t t t ≤≤,任何12,0k k ≥,事件211{}t t k ξξ-=与432{}t t k ξξ-=相互独立。
(2) 平稳性 在长为t 的时段[),a a t +内到达个质点的概率,只与计时长度t 有关而与计时起点a 无关。
于是可记(){}k a t a P t P k ξξ+=-=(3) 普通性 在有限的时间区间内只有有限个质点,即对任意0t有()1kk P t ∞==∑。
并且在充分短的时间t 内最多只来一个质点,即假设多于一个质点到达的概率。
并排除总也不来质点的这种无意义的情形,即假设不恒等于1. 那么,必存在常数0λ,使对一切0t有,()()!k tk t P t e k λλ-=, 0,1,2,...k = 证明: 对任何t ,0t∆考察()k P t t +∆.运用全概率公式及独立增量性可得()()()k k i i k P t t P t P t ∞-=+∆=∆∑ , 0k ≥特别0k =时,上式化为00()()()k P t t P t P t +∆=∆.由于0()P t 是[)0,t 时段内无质点到达的概率,它关于t 单调非增.故作为上式函数方程的有界单调解. 0()P t 必为指数函数,即存在常数a ,01a ≤≤,使0()tP t a =,0t ≥. 但是0a =或1导致0()P t 恒为0或为1.这与3矛盾.故存在常数0λ,使a e λ-=,从而有()tP t e λ-=, 0t ≥ 这正是0k =时的()()!k tk t P t e k λλ-=. 以下用归纳法,设式为真,往证时式成立.当很小时,由普通性知220()()()()kk i i i i i P t P t P t o t ∞-==≤∆≤∆=∆∑∑于是()k P t t +∆的表达式可写为011()()()()()()k k k P t t P t P t P t P t o t -+∆=∆+∆+但由已证明的0()t P t eλ-=式有 0()1()P t t o t λ∆=-∆+∆从而再用普通性得102()1()()()i i P t P t P t t o t λ∞=∆=-∆-∆=∆+∆∑将上述二式代入011()()()()()()k k k P t t P t P t P t P t o t -+∆=∆+∆+,便得[]11()()()()(1)k k k k P t t P t P t P t o tλλ-+∆-+=+∆ 令0t ∆→,并据归纳法假设将1k -时的()()!k tk t P t e k λλ-=式代入,就得到()k P t 满足的一阶微分方程1()()(1)!k k t k k t P t P t e k λλλ--'+=-联合明显的初值条件(注意这里),便得上式方程的解为()()!k tk t P t e k λλ-= 定理于是得证.满足定理中各项条件的质点流的计数过程称作强度为的过程,由(){}k a t aP t P k ξξ+=-=及()()!k tk t P t e k λλ-=可知,任0t 随机变量t ξ服从参数为tλ的分布(){}!k tt t P k e k λλξ-==, 0,1,2,...k = 对过程的进一步研究,是随机过程论的重要内容。