概率论与数理统计离散性讲义随机变量及其分布函数
- 格式:ppt
- 大小:585.50 KB
- 文档页数:21
离散型随机变量与概率分布离散型随机变量(Discrete Random Variable)是指在一定范围内取有限个或可列个值的随机变量。
与之相对应的是连续型随机变量,后者可以取任意连续的值。
在概率论和数理统计中,离散型随机变量是一个重要的概念,它通常用于描述实验中可以明确计数的结果。
离散型随机变量的概率分布(Probability Distribution)描述了该变量取特定值的概率。
概率分布可以通过概率质量函数(Probability Mass Function,PMF)或累积分布函数(Cumulative Distribution Function,CDF)来表示。
下面将介绍离散型随机变量的概率质量函数和累积分布函数,并给出两个例子进行说明。
一、概率质量函数概率质量函数(PMF)是离散型随机变量取各个值的概率。
对于离散型随机变量X,其概率质量函数可以表示为P(X=x),其中x为该随机变量可能取的某个值。
概率质量函数需要满足以下两个条件:1. 非负性:对于所有可能的取值x,P(X=x) ≥ 0。
2. 概率的总和为1:所有可能取值的概率之和等于1,即∑P(X=x) = 1。
通过概率质量函数,我们可以计算出随机变量X取某个特定值的概率。
例如,假设有一个公平的六面骰子,投掷一次,随机变量X代表出现的点数。
则该骰子的概率质量函数为:P(X=1) = 1/6P(X=2) = 1/6P(X=3) = 1/6P(X=4) = 1/6P(X=5) = 1/6P(X=6) = 1/6二、累积分布函数累积分布函数(CDF)是离散型随机变量小于等于某个特定值的概率。
对于离散型随机变量X,其累积分布函数可以表示为F(x)=P(X≤x),其中x为该随机变量的某个值。
累积分布函数也需要满足概率的基本要求。
通过累积分布函数,我们可以计算出随机变量X小于等于某个特定值的概率。
以前述的六面骰子为例,该骰子的累积分布函数为:F(x) = P(X≤x)F(1) = 1/6F(2) = 2/6 = 1/3F(3) = 3/6 = 1/2F(4) = 4/6 = 2/3F(5) = 5/6F(6) = 1三、例子说明例子1:硬币投掷假设有一个公平的硬币,投掷一次,随机变量X代表正面朝上的次数。
概率论与数理统计讲义一、概率论1.1 引言概率论是研究随机现象的理论,广泛应用于自然科学、社会科学以及工程技术等领域。
它通过量化随机事件发生的可能性,帮助我们理解事件之间的关系和规律。
1.2 随机变量与概率分布随机变量是描述随机事件的事物,可以分为离散型随机变量和连续型随机变量。
概率分布则是描述随机变量取值的概率情况,包括离散型随机变量的概率质量函数和连续型随机变量的概率密度函数。
1.3 期望与方差期望是随机变量取值的平均值,用来描述随机变量的集中程度。
方差则是随机变量与其期望之间的差异程度,用来描述随机变量的离散程度。
1.4 概率分布函数的性质概率分布函数有许多重要的性质,包括非负性、归一性、单调性、可加性等。
这些性质能够帮助我们更好地理解随机事件的规律和特征。
二、数理统计2.1 统计学概述统计学是研究数据收集、分析和解释的学科,通过对样本数据的研究,推断出总体的一些特征和规律。
统计学广泛应用于社会调查、市场研究以及科学实验等领域。
2.2 描述统计学描述统计学是对数据进行总结和描述的统计学方法。
它包括数据的集中趋势度量、离散程度度量以及数据分布特征等内容。
2.3 参数估计参数估计是根据样本数据推断总体参数的一种统计学方法。
点估计通过寻找最优参数估计量来描述总体参数的真实值,区间估计则给出了参数估计的置信区间。
2.4 假设检验假设检验是用来判断总体参数是否满足某种假设的统计学方法。
它将原假设和备择假设相比较,通过计算统计量的值来判断是否拒绝原假设。
2.5 方差分析与回归分析方差分析和回归分析是用来研究多个变量之间关系的统计学方法。
方差分析用于比较多个总体均值是否相等,而回归分析则用于建立变量之间的数学模型。
三、应用案例3.1 金融风险管理概率论与数理统计在金融风险管理中发挥着重要作用。
通过对金融市场的随机波动性进行建模和分析,可以帮助投资者制定更合理的投资策略,降低风险。
3.2 医学研究数理统计在医学研究中具有广泛的应用。
概率论与数理统计随机变量与概率分布概率论与数理统计是一门研究随机现象规律的学科,它研究的对象包括随机事件、随机变量和概率分布等。
随机变量是概率论中的重要概念,它描述了在一次试验中可能出现的各种结果,并给出了每种结果发生的概率。
而概率分布则是随机变量取值的可能性分布情况。
一、随机变量随机变量是一种用数学模型来表示随机现象的变化情况的变量。
它可以是离散型的,也可以是连续型的。
离散型随机变量的取值是有限个或可数个,其概率分布通过概率质量函数(probability mass function)来定义。
连续型随机变量的取值是无穷个,其概率分布通过概率密度函数(probability density function)来定义。
对于离散型随机变量,常见的概率分布包括:伯努利分布、二项分布、泊松分布等。
伯努利分布表示了只有两个可能结果的随机事件,如抛硬币的结果;二项分布表示了重复进行相同随机试验的结果,如抛硬币若干次后正面朝上的次数;泊松分布则表示了在一段时间内某事件发生的次数,如一天内发生车祸的次数。
而对于连续型随机变量,常见的概率分布包括:均匀分布、正态分布、指数分布等。
均匀分布表示了在一段区间内各个取值的概率是相等的,如抛一个骰子得到的点数;正态分布则是最常见的概率分布之一,它呈钟形曲线,以均值和标准差来描述数据的分布情况;指数分布表示了某事件的发生间隔时间的概率分布,如等待公交车的时间。
二、概率分布概率分布描述了随机变量取不同值的概率。
对于离散型随机变量,概率分布通过概率质量函数来表示。
概率质量函数给出了每个取值的概率。
对于连续型随机变量,概率分布通过概率密度函数来表示。
概率密度函数给出了在某个取值附近的概率密度。
常见的概率分布函数有:二项分布的概率质量函数、正态分布的概率密度函数等。
以二项分布为例,它的概率质量函数为:P(X=k) = C(n,k) * p^k * (1-p)^(n-k)其中,n为试验次数,k为事件发生的次数,p为事件发生的概率。
第二节 离散型随机变量及其分布律内容分布图示★ 离散型随机变量 ★ 例1 ★ 例2 ★ 关于分布律的说明 ★ 退化分布 ★ 两点分布 ★ 例3 ★ n 个点上的均匀分布 ★ 二项分布 ★ 例4 ★ 例5 ★ 例6 ★ 几何分布 ★ 例7 ★ 超几何分布 ★ 泊松分布 ★ 例8 ★ 二项分布的泊松近似 ★ 例9 ★ 例10 ★ 例11 ★ 内容小结 ★ 课堂练习★ 习题2-2内容要点:一、离散型随机变量及其概率分布定义 设离散型随机变量X 的所有可能取值为),2,1( =i x i , 称,2,1,}{===i p x X P i i为X 的概率分布或分布律, 也称概率函数.常用表格形式来表示X 的概率分布:n i n p p p p x x x X 2121二、常用离散分布退化分布 两点分布 n 个点上的均匀分布 二项分布 几何分布 超几何分布泊松分布:泊松分布是概率论中最重要的几个分布之一. 实际问题中许多随机现象都服从或近似服从泊松分布.三、二项分布的泊松近似定理1 (泊松定理) 在n 重伯努利试验中, 事件A 在每次试验中发生的概率为n p (注意这与试验的次数n 有关), 如果∞→n 时, λ→n np (0>λ为常数), 则对任意给定的k , 有λλ-∞→=e k p n k b kn n !),,(lim .例题选讲:离散型随机变量及其概率分布例1 (讲义例1) 某篮球运动员投中篮圈的概率是0.9, 求他两次独立投篮投中次数X 的概率分布.解 X 可取0, 1, 2为值, 01.0)1.0)(1.0(}0{===X P 18.0)1.0)(9.0(2}1{===X P 81.0)9.0)(9.0(}2{===X P且1}2{}1{}0{==+=+=X P X P X P 于是, X 的概率分布可表示为 .81.018.001.0210i P X例2 设随机变量X 的概率分布为:0,,2,1,0,!}{>===λλ k k aK X P k.试确定常数a .解 依据概率分布的性质:,1}{0}{⎪⎩⎪⎨⎧==≥=∑kk X P k X P 欲使上述函数为概率分布应有,0≥a,1!0==∑∞=k kae K a λλ 从中解得.λ-=e a注: 这里用到了常见的幂级数展开式.!0∑∞==k kK e λλ两点分布例3 (讲义例2) 200件产品中, 有96件是正品, 4件是次品, 今从中随机地抽取一件, 若规定,,0,1⎩⎨⎧=取到次品取到正品X 则}1{=X P 200196=,98.0= }0{=X P 2004=.02.0= 于是, X 服从参数为0.98的两点分布.二项分布例4 (讲义例3) 已知100个产品中有5个次品, 现从中有放回地取3次, 每次任取1个, 求在所取的3个中恰有2个次品的概率.解 因为这是有放回地取3次, 因此这3次试验的条件完全相同且独立, 它是伯努利试验, 依题意, 每次试验取到次品的概率为0.05. 设X 为所取的3个中的次品数, 则),05.0,3(~b X于是, 所求概率为: .007125.0)95.0()05.0(}2{223===C X P 注: 若将本例中的 “有放回” 改为 “无放回”, 那么各次试验条件就不同了, 已不是伯努利概型, 此时, 只能用古典概型求解..00618.0}2{310025195≈==C C C X P例5 (讲义例4) 某人进行射击, 设每次射击的命中率为0.02, 独立射击400次, 试求至少击中两次的概率.解 将一次射击看成是一次试验. 设击中的次数为X , 则).02.0,400(~b XX 的分布律为,)98.0()02.0(400}{400kk k k X P -⎪⎪⎭⎫ ⎝⎛== .400,,1,0 =k 于是所求概率为}1{}0{1}2{=-=-=≥X P X P X P 399400)98.0)(02.0(400)98.0(1--=.9972.0=例6 设有80台同类型设备, 各台工作是相互独立的,发生故障的概率都是0.01, 且一台设备的故障能由一个人处理. 考虑两种配备维修工人的方法, 其一是由4人维护, 每人负责20台; 其二是由3人共同维护80台. 试比较这两种方法在设备发生故障时不能及时维修的概率的大小.解 按第一种方法. 以X 记 “第1人维护的20台中同一时刻发生故障的台数”, 以)4,3,2,1(=i A i 表示 “第i 人维护的20台中发生故障不能及时维修”, 则知80台中发生故障不能及时维修的概率为}.2{)()(14321≥=≥X P A P A A A A P而),01.0,20(~b X 故有 ∑==-=≥1}{1}2{k k X P X P k k k k -=∑⎪⎪⎭⎫ ⎝⎛-=2010)99.0()01.0(201.0169.0= 即.0169.0)(4321≥A A A A P按第二种方法. 以Y 记80台中同一时刻发生故障的台数. 此时),01.0,80(~b Y 故80台中发生故障而不能及时维修的概率为0087.0)99.0()01.0(801}4{8030=⎪⎪⎭⎫ ⎝⎛-=≥-=∑kk k k Y P 结果表明, 在后一种情况尽管任务重了(每人平均维护约27台), 但工作效率不仅没有降低, 反而提高了.几何分布例7 某射手连续向一目标射击, 直到命中为止, 已知他每发命中的概率是p , 求所需射击发数X 的概率分布.解显然, X 可能取的值是,,2,1 为计算},{k X P =,,2,1 =k 设=k A {第k 发命中},,,2,1 =k 则,)(}1{1p A P X P ===,)1()(}2{21p p A A P X P ⋅-===,)1()(}3{2321p p A A A P X P ⋅-===…………可见所求需射击发数X 的概率分布为,)1(}{1p p k X P k ⋅-==-.,2,1 =k泊松分布例8 (讲义例5) 某一城市每天发生火灾的次数X 服从参数8.0=λ的泊松分布, 求该城市一天内发生3次或3次以上火灾的概率.解 由概率的性质, 得}3{1}3{<-=≥X P X P }2{}1{}0{1=-=-=-=X P X P X P⎪⎪⎭⎫ ⎝⎛++-=-!28.0!18.0!08.012108.0e.0474.0≈二项分布的泊松近似例9 (讲义例6) 某公司生产的一种产品300件. 根据历史生产记录知废品率为0.01. 问现在这300件产品经检验废品数大于5的概率是多少?解 把每件产品的检验看作一次伯努利试验, 它有两个结果: =A {正品},=A {废品}.检验300件产品就是作300次独立的伯努利试验. 用X 表示检验出的废品数, 则),01.0,300(~b X我们要计算}.5{>X P对,01.0,300==p n 有,3==np λ 于是, 得∑∞==>6)01.0,300;(}5{k k b X P ∑=-=50)01.0,300;(1k k b .!3135-=∑-≈e k k k查泊松分布表, 得.08.0916082.01}5{=-≈>X P例10 (讲义例7) 一家商店采用科学管理,由该商店过去的销售记录知道, 某种商品每月的销售数可以用参数5=λ的泊松分布来描述, 为了以95%以上的把握保证不脱销, 问商店在月底至少应进某种商品多少件?解 设该商品每月的销售数为,X 已知X 服从参数5=λ的泊松分布. 设商店在月底应进该种商品m 件, 求满足95.0}{>≤m X P 的最小的,m 即95.0!505>∑=-mk kk e 查泊松分布表, 得,968172.0!595≈∑=-k kk e 931906.0!585≈∑=-k kk e 于是得9=m 件.例11 自1875年至1955年中的某63年间, 上海市夏季(5—9月)共发生大暴雨180次, 试建立上海市夏季暴雨发生次数的概率分布模型.解 每年夏季共有)3031313031(153++++==n 天, 每次暴雨发生以1天计算, 则夏季每天发生暴雨的概率).15363/(180⨯=p将暴雨发生看做稀有事件, 利用泊松分布来建立上海市一个夏季暴雨发生),2,1,0( =k k 次的概率分布模型.设X 表示夏季发生暴雨的次数, 由于,9.215363180153=⨯⨯==np λ 故得上海市暴雨发生次数的概率分布模型为,!9.2}{9.2-==e k k X P k .,2,1,0 =k由上述X 的概率分布计算63年中上海市夏季发生k 次暴雨的理论年数},{63k X P = 并将它与资料记载的实际年数作对照, 这些值及}{k X P =的值均列入下表.由上表可见, 按建立的概率分布模型计算的理论年数与实际年数总的来看符合得较好,这表明所建立的模型能近似描述上海市夏季暴雨发生次数的概率分布.课堂练习1.某类灯泡使用时数在1000小时以上的概率是0.2, 求三个灯泡在使用1000小时以后最多只有一个坏了的概率.2.一汽车沿一街道行驶, 需要通过三个均设有红绿信号灯的路口, 每个信号灯为红或绿与其它信号灯为红或绿相互独立, 且红绿两种信号灯显示的时间相等. 以X 表示该汽车首次遇到红灯前已通过的路口的个数, 求X 的概率分布.。
概率论与数理统计之随机变量函数的分布知识点总结
离散型随机变量的函数分布:
离散型随机变量函数的分布
求连续型随机变量的函数分布的方法:
(1)公式法
利用公式法求解连续型随机变量的函数分布
(2)定义法
利用定义法求连续型随机变量函数的分布
题型一:证明随机变量函数的服从某一分布
例1:假设随机变量X服从参数为2的指数分布,证明:随机变量Y=1-e^(-2X)在区间(0,1)上服从均匀分布。
证明:由题意得,随机变量X的分布函数为:
题型二:求随机变量函数的密度函数
例2:已知随机变量X的概率密度为f(x)=(1/2)exp(-|x|),x为全体实数,求Y=X^2的概率密度。
解题思路:本题利用定义法求解。
解:
总结:需要掌握利用定义法求随机变量函数的分布函数,这是考研中常考的题型。
随机变量,概率密度,分布函数理解随机变量是概率论与数理统计的重要概念之一。
它表示一个随机试验结果的数值化描述,可以是一个实数或者是一组实数。
随机变量与概率密度和分布函数密切相关,理解这些概念对于研究概率与统计学非常重要。
首先,让我们来了解随机变量的概念。
随机变量是指一个随机试验的结果可以用某个数值进行描述的量。
每个随机试验结果都对应着一个数值,在数学上可以用大写字母(如X)来表示随机变量。
随机变量可以是离散的,也可以是连续的。
离散随机变量是只能取某些特定数值的变量。
例如,抛硬币的结果可以用一个离散随机变量表示,他可以取两个值:正面和反面。
离散随机变量通常用概率质量函数来描述。
概率质量函数(Probability Mass Function, PMF)是一个函数,可以计算出随机变量取某个特定值的概率。
概率质量函数的定义如下:P(X = x) = P(x)其中,P(X = x)表示随机变量X取值为x的概率。
连续随机变量是可以取任意实数范围内的值的变量。
例如,一场考试的得分可以用一个连续随机变量来描述,他可以取0到100之间的任意实数值。
连续随机变量通常用概率密度函数来描述。
概率密度函数(Probability Density Function, PDF)是一个函数,用于计算随机变量落在某个区间内的概率密度。
概率密度函数的定义如下:f(x) = P(a≤X≤b) / (b-a)其中,f(x)表示随机变量X的概率密度函数,a和b表示区间。
分布函数是描述随机变量可取不同值的累积概率的函数。
离散随机变量和连续随机变量的分布函数有所不同。
对于离散随机变量,分布函数(Distribution Function, DF)是一个函数,描述随机变量小于等于某个值的概率。
分布函数的定义如下:F(x) = P(X ≤ x)其中,F(x)表示随机变量X的分布函数。
对于连续随机变量,分布函数也称为累积分布函数(Cumulative Distribution Function, CDF)。