边缘分布与条件分布
- 格式:ppt
- 大小:1.43 MB
- 文档页数:25
条件分布和边缘分布的关系条件分布和边缘分布是概率论和数理统计学中两个重要的概念,它们之间有一定的联系和关系。
下面我会具体介绍条件分布和边缘分布的概念,并且解释它们之间的关系。
首先,我们来介绍条件分布的概念。
在概率论中,条件分布是指在已知某些条件下,随机变量的分布情况。
换句话说,条件分布是指在已知某个条件时,所关心的随机变量的分布情况。
条件分布通常用P(Y|X)来表示,其中X是所关心的条件变量,Y是需要得到其分布的随机变量。
P(Y|X)表示在已知X的条件下,Y的分布情况。
举个例子来说明条件分布的概念。
假设我们研究一个班级的学生,X表示学生的年龄,Y表示学生的身高。
如果我们对条件分布P(Y|X)感兴趣,那么我们可以根据学生的年龄来推测学生的身高分布。
例如,当X为10岁时,Y的分布可能是一个正态分布,而当X为20岁时,Y的分布可能是另一个不同的正态分布。
接下来,我们来介绍边缘分布的概念。
在概率论中,边缘分布是指随机变量的分布情况,而不考虑其他变量的情况。
换句话说,边缘分布是指所关心的随机变量的分布情况,而不考虑其他随机变量的影响。
边缘分布通常用P(X)或P(Y)来表示,表示随机变量X或Y的分布情况。
继续以上面的例子来说明边缘分布的概念。
假设我们对边缘分布P(Y)感兴趣,表示学生的身高分布情况,而不考虑学生的年龄。
我们可以直接统计班级中学生的身高分布,而不需要考虑他们年龄的影响。
在条件分布和边缘分布之间存在一定的关系。
具体来说,边缘分布可以通过条件分布来计算得到。
这是因为边缘分布是在不考虑其他变量的情况下计算得到的,而条件分布是在已知某个条件下计算得到的。
通过概率论中的乘法规则,我们可以得到边缘分布的公式:P(X) = ∑ P(X, Y)。
这个公式表示随机变量X的边缘分布可以通过将随机变量X和Y的联合分布P(X, Y)在所有可能的取值情况下求和得到。
我们可以通过条件分布来计算边缘分布。
假设我们已知条件分布P(Y|X),我们可以通过边缘分布的公式,将Y积分掉,得到边缘分布P(X)。
社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。
2.其次看变量的取值能否比拟大小,不能这个变量只能是定类变量。
3.最后如果这个变量能够比拟大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。
三、变量层次的比拟定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。
四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次〔或频率〕分布的一种工具。
2.统计表必备的容:(1)表号、标题(2)标识行:变量名、对应数据说明〔频次、频率〕(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数〔cf↑〕和向下累加次数(cf↓)。
(2)累加频率:把各级的百分率逐渐相加。
也分为向下累加百分率和向下累加百分率。
2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。
3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。
➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。
2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组适宜,分为等距分组和非等距分组。
(2)组限:包括上限〔up〕和下限〔low〕(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。
(6)组中值:真实上限与真实下限的平均值。
第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。
2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。
§3.2 边缘分布二维随机向量),(Y X 的联合分布(联合分布函数或联合分布列或联合概率密度)完整地刻画了随机变量X 和Y 作为一个整体的概率分布规律。
为应用方便,我们还需要从这个完整的信息中挖掘出某些方面的信息。
这个完整的信息中包含如下信息:(1)每个分量(或部分分量)的概率分布,即边缘分布。
(2)各分量之间的统计联系。
本章将要介绍的随机变量的独立性,及条件分布以及下一章介绍的相关系数就是用来反映和描述他们的统计联系.一.边缘分布 1.边缘分布函数设二维随机向量),(Y X 具有联合分布函数为),(y x F ,而X 和Y 都是随机变量,各自也有分布函数,将它们分别记为)(x F X 和)(y F Y ,依次称为为),(Y X 关于X 和关于X 的边缘分布函数. 由概率的性质可得),(),(lim },{}{+∞==∞<≤=≤∆+∞→x F y x F Y x X P x X P y可见由),(Y X 的联合分布函数),(y x F 可以X 的边缘分布函数: ),()(+∞=x F x F X (1) 类似地可得),(Y X 关于Y 的边缘分布函数为),()(y F y F Y +∞= (2) 例3.2.1 设二维随机向量),(Y X 的联合分布函数为⎩⎨⎧≥≥+--=λ-----其他,00,0,1),(y x e e e y x F xy y x y x这个分布称为二维指数分布,其中参数0≥λ,求边缘分布函数。
解:易得X ,Y 的边缘分布函数分别为⎩⎨⎧<≥-=+∞=-0,00,1),()(x x e x F x F x X⎩⎨⎧<≥-=+∞=-0,00,1),()(y y e y F y F y Y这两个边缘分布同为指数分布,且与参数λ无关。
这说明边缘分布确定不了联合分布。
也说明联合分布中不仅含有每个分量的信息,还含有各分量之间统计联系方面的信息。
2.边缘分布律如果),(Y X 为二维离散型随机向量,那么它的每个分量都是离散随机变量。
考研数学概率论部分的重要考点与常见题型摘要:在考研数学中,概率论与数理统计是非常重要的一部分,这部分要想拿分,就要了解下它里面内容的重要考点和常考题型。
1、随机变量及其分布在考试中,该考点所占比重很大,每年分值在12分左右。
&bull重要考点:I、分布函数、分布律、概率密度的相关性质II、联合分布、边缘分布与条件分布的计算III、随机变量函数的分布以及随机变量独立性的判断IV、常见分布的相关性质以上考点中,要重点掌握边缘分布以及条件分布的定义与相关的计算公式、随机变量函数的分布,在历年考研数学中考查力度还是相当大的。
求解过程中重在理解分布函数的定义,尤其涉及到随机变量范围的讨论时,避免失误,各位考研君一定要多加注意!&bull常考题型:I、有关分布函数、分布律、概率密度的相关性质的考察II、离散型或连续型随机变量边缘分布、条件分布的计算III、求解随机变量函数的分布。
2、数字特征考研中对数字特征的考察,频率也是很高的,在考试中,此考点一般与随机变量结合出题,每年的平均分值大概也在8分左右,所以考研的小伙伴更是不能忽视呦!&bull重要考点:I、随机变量以及随机变量函数的期望、方差相关计算公式II、数字特征的常用性质、常见分布的数字特征及运用III、二维随机变量协方差、相关系数的计算及其性质IV、独立性与不相关性的讨论&bull常考题型:I、直接考察数字特征的计算II、考察数字特征的常用性质对于该常考考点,公式多,记忆量大,所以要把相关的公式以及性质进行有效记忆,避免出现公式错用、混用的情况。
在考研中该考点与考点1经常结合出题,构成考研数学概率中的一道大题,各位考研君一定要提高警惕!3、参数估计参数估计是数理统计的重要内容,也是考试的重点,考研中对此考点的考查方式多以大题为主。
&bull重要考点:点估计。
点估计方法中,以矩估计和最大似然估计为主。
在复习该重要考点时,重点把握两种估计方法的求解步骤。
【关键字】学习《概率论与数理统计》学习指导·内容提要·疑难分析·例题解析·自测试题安徽工业大学应用数学系编目录第三章多维随机变量及其分布内容提要1、二维随机变量及其联合分布函数设,为随机变量,则称它们的有序数组()为二维随机变量.设()为二维随机变量,对于任意实数、,称二元函数为()的联合分布函数.联合分布函数具有以下基本性质:(1)是变量或的非减函数;(2)且;(3)关于右连续,关于也右连续;(4)对任意点,若,则.上式表示随机点落在区域内的概率为:.2、二维离散型随机变量及其联合分布律如果二维随机变量所有可能取值是有限对或可列对,则称为二维离散型随机变量.设为二维离散型随机变量,它的所有可能取值为将或表3.1称为的联合分布律.表3.1联合分布律具有下列性质:(1);(2).3、二维连续型随机变量及其概率密度函数如果存在一个非负函数,使得二维随机变量的分布函数对任意实数有,则称是二维连续型随机变量,称为的联合密度函数(或概率密度函数).联合密度函数具有下列性质:(1)对一切实数,有;(2);(3)在任意平面域上,取值的概率;(4)如果在处连续,则.4、二维随机变量的边缘分布设为二维随机变量,则称,分别为关于和关于的边缘分布函数.当为离散型随机变量,则称分别为关于和关于的边缘分布律.当为连续型随机变量,则称分别为关于和关于的边缘密度函数.5、二维随机变量的条件分布(1)离散型随机变量的条件分布设为二维离散型随机变量,其联合分布律和边缘分布律分别为),2,1,(}{,}{,},{.. ========j i p y Y P p x X P p y Y x X P j j i i ij j i ,则当j 固定,且0}{.>==j j p y Y P 时,称,2,1,}{},{}|{.========i p p y Y P y Y x X P y Y x X P jij j j i j i 为j y Y =条件下随机变量X 的条件分布律.同理,有 ,2,1,}|{.====j p p x X y Y P i ij i j(2)连续型随机变量的条件分布设),(Y X 为二维连续型随机变量,其联合密度函数和边缘密度函数分别为:)(),(),,(y p x p y x p Y X .则当0)(>y p Y 时,在),(y x p 和)(x p X 的连续点处,),(Y X 在条件y Y =下,X 的条件概率密度函数为:)(),()|(|y p y x p y x p Y Y X =.同理,有)(),()|(|x p y x p y x p X X Y =. 6、随机变量的独立性设),(y x F 及)()(y F x F Y X 、分别是),(Y X 的联合分布函数及边缘分布函数.如果对任何实数y x ,有)()(),(y F x F y x F Y X ⋅=则称随机变量X 与Y 相互独立.设),(Y X 为二维离散型随机变量,X 与Y 相互独立的充要条件是),2,1,(.. ==j i p p p j i ij . 设),(Y X 为二维连续型随机变量,X 与Y 相互独立的充要条件是对任何实数y x ,,有)()(),(y p x p y x p Y X =.7、两个随机变量函数的分布设二维随机变量),(Y X 的联合概率密度函数为),(y x p ,),(Y X Z ϕ=是Y X ,的函数,则Z 的分布函数为dxdy y x p z F zy x Z ⎰⎰=≤),(),()(ϕ.(1)Y X Z +=的分布若),(Y X 为离散型随机变量,联合分布律为ij p ,则Z 的概率函数为: ∑-=ii k i k Z x z x p z P ),()(或∑-=jj k j k Z y z y p z P ),()(.若),(Y X 为连续型随机变量,概率密度函数为),(y x p ,则Z 的概率函数为:dy y y z p dx x z x p z p Z ⎰-=⎰-=+∞∞-+∞∞-),(),()(.(2)YXZ =的分布 若),(Y X 为连续型随机变量,概率密度函数为),(y x p ,则Z 的概率函数为:⎰=+∞∞-dy y yz p y z p Z ),()(.疑 难 分 析1、事件},{y Y x X ≤≤表示事件}{x X ≤与}{y Y ≤的积事件,为什么},{y Y x X P ≤≤不一定等于}{}{y Y P x X P ≤⋅≤?如同仅当事件B A 、相互独立时,才有)()()(B P A P AB P ⋅=一样,这里},{y Y x X P ≤≤依乘法原理}|{}{},{x X y Y P x X P y Y x X P ≤≤⋅≤=≤≤.只有事件}{x X P ≤与}{y Y P ≤相互独立时,才有}{}{},{y Y P x X P y Y x X P ≤⋅≤=≤≤,因为}{}|{y Y P x X y Y P ≤=≤≤.2、二维随机变量),(Y X 的联合分布、边缘分布及条件分布之间存在什么样的关系?由边缘分布与条件分布的定义与公式知,联合分布唯一确定边缘分布,因而也唯一确定条件分布.反之,边缘分布与条件分布都不能唯一确定联合分布.但由)|()(),(|x y p x p y x p X Y X ⋅=知,一个条件分布和它对应的边缘分布,能唯一确定联合分布.但是,如果Y X 、相互独立,则}{}{},{y Y P x X P y Y x X P ≤⋅≤=≤≤,即)()(),(y F x F y x F Y X ⋅=.说明当Y X 、独立时,边缘分布也唯一确定联合分布,从而条件分布也唯一确定联合分布. 3、两个随机变量相互独立的概念与两个事件相互独立是否相同?为什么?两个随机变量Y X 、相互独立,是指组成二维随机变量),(Y X 的两个分量Y X 、中一个分量的取值不受另一个分量取值的影响,满足}{}{},{y Y P x X P y Y x X P ≤⋅≤=≤≤.而两个事件的独立性,是指一个事件的发生不受另一个事件发生的影响,故有)()()(B P A P AB P ⋅=.两者可以说不是一个问题.但是,组成二维随机变量),(Y X 的两个分量Y X 、是同一试验E 的样本空间上的两个一维随机变量,而B A 、也是一个试验1E 的样本空间的两个事件.因此,若把“x X ≤”、“y Y ≤”看作两个事件,那么两者的意义近乎一致,从而独立性的定义几乎是相同的.例 题 解 析例 1 设某班车起点站上的乘客数X 服从参数为)0(>λλ的泊松分布,每位乘客中途下车的概率为)10(<<p p ,且中途下车与否相互独立,以Y 表示中途下车的人数,求二维随机变量),(Y X 的分布律.解例2 设随机变量),(Y X 的概率密度为 试求(1)系数c ;(2)),(Y X 落在圆)0(222R r r y x <<≤+内的概率.解 所以 33Rc π=(2) 设{},:,222r y x y)(x D ≤+=注: 利用分布函数的基本性质可以确定待定系数,从而可以计算二维随机变量落在某一区域内的概率,值得注意的是计算过程中,由于),(y x f 通常是分区域函数,故积分区域要特别小心,以免出错.例3 考虑一元二次方程02=++C Bx x ,其中C B ,分别是将一枚骰子接连掷两次先后出现的点数,求该方程有实根的概率p 和有重根的概率q .解 方程02=++C Bx x 有实根的充要条件是判别式042≥-=∆C B 或4/2B C ≤,由条件知,0+1+2+4+6+6=19所以36/19=p ,使方程有重根的充要条件是C B 42=,满足此条件的基本事件个数为0+1+0+1+0+0=2因此 18/136/2==q例4 设随机变量),(Y X 均匀分布于以)1,0(),0,1(),1,0(),0,1(--四项点所构成的正方形中,求X 与Y 的边缘密度函数.解1º当01<<x -时,⎰+==⎰=+--∞∞-11121),()(x x X x dy dy y x f x f当10<≤x 时,121),()(11+-=⎰=⎰=+--∞∞-x dy dy y x f x f x x X 所以2º类似1º可得例5 随机变量),(Y X 的密度函数为⎪⎩⎪⎨⎧>>++= 其它,00,0,)1/(2),(3y x y x y x p ,求1=X 条件下Y 的条件分布密度.分析:通过),(Y X 的联合密度和边缘密度函数,来求在1=X 条件下Y 条件分布密度.解:当0>x 时,有203)1/(1)1/(2)(x dy y x x p X +=⎰++=∞,故 .例6 在),0(a 线段上任意抛两个点(抛掷二点的位置在),0(a 上独立地服从均匀分布),试求两点间距离的分布函数.解 设抛掷两点的坐标分别为X 和Y ,则X 与Y 相互独立,且都服从)(a ,0上的均匀分布,故),(Y X 的联合概率密度为记两点距离为Z ,则||Y X Z -=的分布函数为 )|(|)(z Y X P z F Z ≤-=当0<z 时,显然0)(=z F Z ; 当a z <≤0时,当a z ≥时,1)(=z F Z 故两点距离Z 的分布函数为例7 假设一电路装有三个同种电气元件,其工作状态相互独立,且无故障时间都服从参数为0>λ的指数分布,当三个元件都无故障时,电路正常工作,否则整个电路不能正常工作,试求电路正常工作的时间T 的概率分布.解 设)3,2,1(=i X i 为第i 个电子元件无故障工作的时间,则321,,X X X 是独立同分布的随机变量,其分布函数为记)(t G 为了T 的分布函数,则 当0<t ,0)(=t G ; 当0≥t 时,所以 ⎪⎩⎪⎨⎧<≥-=λ-0,00,1)(3t t e t G t即电路正常工作时间T 服从参数为λ3的指数分布.例8 设随机变量X 与Y 独立同分布,其概率密度为 求随机变量22Y X Z +=的概率密度.解 由于X 与Y 独立同分布,故),(Y X 的联合概率密度为当0≤z 时,显然0)(=z F Z 当0>z 时,故22Y X Z +=的概率密度为例9.已知随机变量1}2/1{,4/34/110~=-=⎥⎦⎤⎢⎣⎡Y P X ,又n 维向量123,,a a a 线性无关。