第三章 多元正态分布
- 格式:ppt
- 大小:776.50 KB
- 文档页数:19
多元正态分布条件分布例题
多元正态分布是指具有多个随机变量的正态分布。
它的概率密度函数可以用矩阵符号来表示。
对于一个具有n个变量的多元正态分布,其概率密度函数可以写作:
f(x) = (1 / ( (2π)^(n/2) |Σ|^0.5 )) exp(-0.5 (x-μ)' Σ^(-1) (x-μ))。
其中,x是一个n维向量,μ是一个n维向量,Σ是一个n×n 的对称正定矩阵,|Σ|表示Σ的行列式。
这个概率密度函数描述了多元正态分布的形状和分布情况。
现在让我们来看一个条件分布的例题。
假设我们有一个二维多元正态分布,其均值向量为μ = [1, 2],协方差矩阵为Σ = [[2, 1], [1, 2]]。
我们想要求在给定X1 = 1 的条件下,X2 的条件分布。
首先,我们可以计算边缘分布,即X1的边缘分布。
X1的边缘
分布仍然是一个正态分布,其均值和方差可以通过均值向量和协方差矩阵的对应元素得到。
然后,我们可以计算条件分布。
在给定X1 = 1 的条件下,X2 的条件分布也是一个正态分布,其均值和方差可以通过边缘分布的均值和方差以及协方差矩阵的相关元素计算得到。
通过这个例题,我们可以理解多元正态分布的条件分布是如何计算的,以及如何利用均值向量和协方差矩阵来描述多元正态分布的形状和分布情况。
多元正态分布的概率密度函数
p(x) = (2π)^(−d/2) * ,Σ,^(-1/2) * exp[−1/2 *( x−μ )^T
Σ^(-1)(x−μ)]
其中,(2π)^(−d/2) 表示一个常数系数,Σ,^(-1/2) 表示协方差
矩阵的行列式的平方根的倒数,Σ^(-1)表示协方差矩阵的逆,exp[−1/2
*( x−μ )^T Σ^(-1)(x−μ)]表示对指数函数的指数部分进行运算。
在上述公式中,μ是一个d维向量,表示多元正态分布的均值向量,表示了数据在各个维度上的中心位置。
Σ是一个d×d的协方差矩阵,表
示不同维度之间的相互关系。
正态分布的主要特性是其均值和方差。
在多元正态分布中,均值向量
μ指示了分布在每个维度上的平均值。
协方差矩阵Σ则指示了分布在不
同维度间的相关性及展开度。
当协方差矩阵Σ是对角矩阵时,表示各个
维度之间是相互独立的,若协方差矩阵Σ中一些非对角元素为零,则表
示各个维度是独立的。
总之,多元正态分布的概率密度函数是一个描述多维空间中随机变量
分布的函数。
它通过均值向量和协方差矩阵来表示数据在不同维度上的中
心位置和相互关系,是统计学和概率论中一个重要的分布函数。
第三章多元正态分布均值向量和协方差的检验
1.基本思想和步骤
2.均值向量的检验
(1)分布:设且X与S相互独立,,则称统计量的分布为非中心分布
当时,称服从(中心)分布,记为
(2)转换为F分布:若且X与S相互独立,令,则
3.一个正态总体均值向量的检验
(1)协差阵已知,检验统计量为
(2)协差阵未知,检验统计量为
4.两个正态总体均值向量的检验
设为来自p维正态总体的容量为n的样本,
为来自p维正态总体的容量为m的样本,且两组样本相互独立
①针对共同已知协差阵,检验统计量为
②针对共同未知协差阵,检验统计量为
(2)协差阵不等
①针对n=m的情形,检验统计量为
②针对n≠m的情形,检验统计量为
5.多个正态总体均值向量的检验
(1)单因素方差分析:设k个正态总体分别为,从k个总体中取个独立样本,,假设H0成立,检验统计量为
其中,组间平方和为,组内平方和为,总平方和为,其中,
(2)若,则为X的广义方差,为样本广义方差
(3)Wilks分布:若且二者相互独立,
为Wilks统计量,分布为Wilks分布,简记为
(4)多元方差分析:检验统计量为
其中,,A为组间离差阵,E为组内离差阵,T为总离差阵,且T=A+E
6.协差阵的检验
(1)一个正态总体协差阵的检验:构造检验统计量
(2)多个协差阵相等的检验:构造检验统计量。
第三章 多元正态分布多元正态分布是一元正态分布在多元情形下的直接推广,一元正态分布在统计学理论和应用方面有着十分重要的地位,同样,多元正态分布在多元统计学中也占有相当重要的地位。
多元分析中的许多理论都是建立在多元正态分布基础上的,要学好多元统计分析,首先要熟悉多元正态分布及其性质。
第一节 一元统计分析中的有关概念多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,学习多元统计分析,首先要对随机向量和随机矩阵有所把握,为了学习的方便,先对一元统计分析中的有关概念和性质加以复习,并在此基础上推广给出多元统计分析中相应的概念和性质。
一、随机变量及概率分布函数 (一)随机变量随机变量是随机事件的数量表现,可用X 、Y 等表示。
随机变量X 有两个特点:一是取值的随机性,即事先不能够确定X 取哪个数值;二是取值的统计规律性,即完全可以确定X 取某个值或X 在某个区间取值的概率。
(二)随机变量的概率分布函数随机变量X 的概率分布函数,简称为分布函数,其定义为:)()(x X P x F ≤=随机变量有离散型随机变量和连续型随机变量,相对应的概率分布就有离散型概率分布和连续型概率分布。
1、离散型随机变量的概率分布若随机变量X 在有限个或可列个值上取值,则称X 为离散型随机变量。
设X 为离散型随机变量,可能取值为1x ,2x ,…,取这些值的概率分别为1p ,2p ,…,记为k k p x X P ==)((Λ,2,1=k )称k k p x XP ==)((Λ,2,1=k )为离散型随机变量X 的概率分布。
离散型随机变量的概率分布具有两个性质: (1)0≥k p ,Λ,2,1=k(2)11=∑∞=k k p2、连续型随机变量的概率分布若随机变量X 的分布函数可以表示为dt t f x F x⎰∞-=)()(对一切R x ∈都成立,则称X 为连续型随机变量,称)(x f 为X 的概率分布密度函数,简称为概率密度或密度函数。
第三章 正态分布一、教学大纲要求(一) 掌握内容1.正态分布的概念和特征 (1)正态分布的概念和两个参数; (2)正态曲线下面积分布规律。
2.标准正态分布标准正态分布的概念和标准化变换。
3.正态分布的应用 (1)估计频数分布; (2)制定参考值范围。
(二) 熟悉内容 标准正态分布表。
(三) 了解内容1.利用正态分布进行质量控制 2.正态分布是许多统计方法的基础二、教学内容精要(一)正态分布 1.正态分布若X 的密度函数(频率曲线)为正态函数(曲线)2.正态分布的特征服从正态分布的变量的频数分布由μ、σ完全决定。
(1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以x μ=为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。
σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
(二)标准正态分布1.标准正态分布是一种特殊的正态分布,标准正态分布的0=μ,12=σ ,通常用u(或Z )表示服从标准正态分布的变量,记为u ~N (0,21)。
2.标准化变换:σμ-=X u ,此变换有特性:若X 服从正态分布),(2σμN ,则u 就服从标准正态分布,故该变换被称为标准化变换。
3. 标准正态分布表标准正态分布表中列出了标准正态曲线下从-∞到u 范围内的面积比例()u Φ。
(三)正态曲线下面积分布1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。
不同),(21X X 范围内正态曲线下的面积可用公式3-2计算。
)()(2112)22(2)(21u u dx eD X X X Φ-Φ==--⎰σμπσ (3-2)1212X X u u μμσσ--==其中, , 。
2.几个重要的面积比例X 轴与正态曲线之间的面积恒等于1。