二维随机变量边缘分布条件分布
- 格式:ppt
- 大小:3.69 MB
- 文档页数:120
第三章 二维随机变量及其分布■2009考试内容多维随机变量及其分布 二维离散型随机变量的概率分布、边缘分布和条件分布 二维连续型随机变量的概率密度、边缘概率密度和条件密度 随机变量的独立性和不相关性 常用二维随机变量的分布两个及两个以上随机变量简单函数的分布■2009考试要求1.理解多维随机变量的概念,理解多维随机变量的分布的概念和性质,理解二维离散型随机变量的概率分布、边缘分布和条件分布,理解二维离散型随机变量的概率密度、边缘密度和条件密度,会求与二维随机变量相关事件的概率。
2.理解随机变量的独立性及不相关性的概念,掌握随机变量相互独立的条件。
3.掌握二维均匀分布,了解二维正态分布N (221212,;,;)μμσσρ的概率密度,理解其中参数的概率意义。
4. 会求两个随机变量简单函数的分布,会求多个相互独立随机变量简单函数的分布。
本章的核心内容是离散3分布(联合、边缘和条件);连续3密度(联合、边缘和条件);均匀与正态。
介绍了作者原创的3个秘技(直角分割法、平移法和旋转法) 求分布问题。
本章是教育部关于概率论大题命题的重点。
一、二维随机变量(向量)的分布函数1.1 二维随机变量(向量)的分布函数的一般定义(), X Y 是二维随机变量,对任意实数x 和y ,称为(), X Y 的分布函数,又称联合分布函数。
●(), F x y 具有一维随机变量分布类似的性质。
① ()0, 1F x y ≤≤;② (), F x y 对x 和y 都是单调非减的,如()()1212, , x x F x y F x y >⇒≥; ③ (), F x y 对x 和y 都是右连续;④ ()()()()(), lim , 1, , , , 0,x x F F x y F F x F y →+∞→+∞+∞+∞==-∞-∞=-∞=-∞=●(), F x y 几何意义:表示(), F x y 在(), x y 的函数值就是随机点(), X Y 在X x =左侧和Y y =下方的无穷矩形内的概率。
二维正态分布的边缘分布推导二维正态分布是指满足以下条件的随机变量 $(X,Y)$ 分布:1. $X$ 和 $Y$ 在每个给定的 $z=x+iy$ 上都服从均值为 $\mu_z$,方差为 $\sigma_z^2$ 的单变量正态分布;2. $X$ 和 $Y$ 之间的协方差为$\operatorname{Cov}(X,Y)=\rho\sigma_X\sigma_Y$,其中$\sigma_X,\sigma_Y$ 分别表示 $X$ 和 $Y$ 的方差,$\rho$ 表示相关系数。
推导二维正态分布的边缘分布需要用到换元积分法和常态分布的一些性质。
假设$(X,Y)\sim\mathcal{N}(\boldsymbol{\mu},\boldsymbol{\Sigma})$,其中 $\boldsymbol{\mu}=(\mu_X,\mu_Y)$ 是均值向量,$\boldsymbol{\Sigma}$ 是协方差矩阵。
记$\boldsymbol{\Sigma}$ 的行列式为 $|\boldsymbol{\Sigma}|$,逆矩阵为 $\boldsymbol{\Sigma}^{-1}$。
同时,假设 $X$ 和 $Y$ 均为连续型变量。
首先,我们可以假设 $Y$ 的取值是固定的,即 $Y=y$。
此时,$(X,y)$ 的联合密度函数为:$$f_{X,Y}(x,y)=\frac{1}{2\pi\sqrt{|\boldsymbol{\Sigma}|}}\exp\left[-\frac{1}{2}(\boldsymbol{x}-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})\right]$$其中,$\boldsymbol{x}=(x,y)$。
为了推导 $X$ 的边缘分布,我们需要先计算 $f_X(x)$:$$f_X(x)=\int_{-\infty}^\infty f_{X,Y}(x,y)\text{d}y$$将上述联合密度函数代入到上式中,有:$$f_X(x)=\frac{1}{2\pi\sqrt{|\boldsymbol{\Sigma}|}}\int_{-\infty}^\infty \exp\left[-\frac{1}{2}(\begin{matrix} x \\ y\end{matrix} -\begin{matrix}\mu_X \\ \mu_Y\end{matrix})^T\boldsymbol{\Sigma}^{-1}(\begin{matrix} x \\ y \end{matrix} -\begin{matrix}\mu_X \\ \mu_Y\end{matrix})\right]\text{d}y$$为了方便计算,我们可以对上式中的指数部分进行如下换元:$$\begin{matrix} x' \\ y \end{matrix} =\begin{matrix} x \\ y\end{matrix} -\begin{matrix}\mu_X \\ \mu_Y \end{matrix} $$则有:$$\begin{aligned}f_X(x)&=\frac{1}{2\pi\sqrt{|\boldsymbol{\Sigma}|}}\int_{-\infty}^\infty \exp\left[-\frac{1}{2}(\begin{matrix} x' \\ y\end{matrix})^T\boldsymbol{\Sigma}^{-1}(\begin{matrix} x' \\ y \end{matrix})\right]\text{d}y \\&=\frac{1}{2\pi\sqrt{|\boldsymbol{\Sigma}|}}\exp\left[-\frac{1}{2}(\begin{matrix} x' \\ 0\end{matrix})^T\begin{pmatrix}\boldsymbol{\Sigma}_{11} &\boldsymbol{\Sigma}_{12} \\ \boldsymbol{\Sigma}_{21} &\boldsymbol{\Sigma}_{22} \end{pmatrix}^{-1}(\begin{matrix} x' \\ 0 \end{matrix})\right]\int_{-\infty}^\infty \exp\left[-\frac{1}{2}(\begin{matrix} 0 \\ y\end{matrix})^T\begin{pmatrix}\boldsymbol{\Sigma}_{11} &\boldsymbol{\Sigma}_{12} \\ \boldsymbol{\Sigma}_{21} &\boldsymbol{\Sigma}_{22} \end{pmatrix}^{-1}(\begin{matrix} 0 \\ y \end{matrix})\right]\text{d}y\\&=\frac{1}{\sqrt{2\pi\sigma_X^2}}\exp\left[-\frac{(x-\mu_X)^2}{2\sigma_X^2}\right]\end{aligned}$$其中,$\boldsymbol{\Sigma}_{11}$、$\boldsymbol{\Sigma}_{12}$、$\boldsymbol{\Sigma}_{21}$、$\boldsymbol{\Sigma}_{22}$ 分别表示 $\boldsymbol{\Sigma}$ 的子矩阵。
联合分布、边缘分布及条件分布之间的关系在概率论与数理统计中,联合分布、边缘分布及条件分布是重要的概念,它们描述了多个随机变量之间的关系。
联合分布指的是多个随机变量同时取某些值的概率分布;边缘分布是指某个或某些随机变量的概率分布;条件分布则是在给定某个或某些随机变量取某些值的条件下,其余随机变量的概率分布。
联合分布可以通过联合概率密度函数或联合概率质量函数来描述。
在二维情况下,联合概率密度函数可以用于连续型随机变量,联合概率质量函数则用于离散型随机变量。
联合分布可以通过计算随机变量同时满足某些条件的概率来获得。
边缘分布是指从联合分布中抽取某个或某些随机变量的概率分布。
通过对联合概率密度函数或联合概率质量函数进行边缘化,可以得到边缘分布。
边缘分布描述了某个或某些随机变量的单独行为,而忽略了其他随机变量的影响。
条件分布是指在给定某个或某些随机变量取某些值的条件下,其他随机变量的概率分布。
条件分布可以通过联合分布和边缘分布之间的关系求得。
假设有两个随机变量X和Y,它们的联合分布为P(X,Y),边缘分布分别为P(X)和P(Y)。
那么在给定X=x的条件下,随机变量Y的条件分布为P(Y|X=x)。
条件分布可以用于进行概率推断和预测。
联合分布、边缘分布及条件分布之间存在着紧密的关系。
给定一个联合分布,可以通过边缘化得到边缘分布。
而给定一个联合分布和某些随机变量的取值,可以通过条件概率的定义得到条件分布。
边缘分布和条件分布是联合分布的一种特殊情况。
在实际问题中,联合分布、边缘分布及条件分布的概念经常被使用。
例如,在统计建模中,我们常常需要研究多个变量之间的关系,通过分析它们的联合分布可以得到它们之间的相互作用。
而在机器学习领域,条件概率和条件分布被广泛应用于分类、回归等任务中。
联合分布、边缘分布及条件分布是概率论与数理统计中重要的概念,它们描述了多个随机变量之间的关系。
联合分布描述了多个随机变量同时取某些值的概率分布,边缘分布描述了某个或某些随机变量的概率分布,条件分布描述了在给定某个或某些随机变量取某些值的条件下,其他随机变量的概率分布。