概率分布-正态分布
- 格式:pptx
- 大小:1.47 MB
- 文档页数:46
概率与统计中的正态分布正态分布是概率与统计学中最为重要的概率分布之一,也被称为高斯分布。
它在自然界和人类社会中广泛存在,被用于描述各种现象的分布规律,从而对数据进行分析和预测。
本文将详细介绍正态分布的定义、性质以及应用。
一、正态分布的定义和性质正态分布是一种连续型的概率分布,可以通过其概率密度函数来描述。
这个函数的图像呈现出钟形曲线,其形状对称轴对称,且在均值处达到最大值。
正态分布的概率密度函数可由以下公式表示:f(x) = 1 / (σ√(2π)) * e^(-((x-μ)^2) / (2σ^2))其中,μ表示均值,σ表示标准差,e表示自然对数的底数。
正态分布具有以下重要的性质:1. 对称性:正态分布的概率密度函数相对于均值呈现对称性,即左右两侧的曲线形状相同。
2. 峰度:正态分布的峰度为3,表示其曲线相较于正态分布的峰度更加平坦。
3. 标准正态分布:当均值μ为0,标准差σ为1时,所得的正态分布称为标准正态分布。
标准正态分布在统计学中具有重要的作用,经过适当的转换,可以将任何正态分布转化为标准正态分布。
二、正态分布的应用正态分布在自然科学、社会科学和工程技术等领域具有广泛的应用。
下面将介绍其中几个典型的应用。
1. 统计推断:由于正态分布具有丰富的性质和可靠的统计特征,在统计学中得到了广泛应用。
通过对观测数据的分析,可以利用正态分布进行参数估计和假设检验,从而得到关于总体的推断结果。
2. 质量控制:正态分布在质量控制中有着重要的应用。
例如,在生产过程中,通过对产品质量数据的测量和分析,可以使用正态分布来确定产品是否合格以及如何调整生产过程,以确保产品符合规定的质量标准。
3. 金融市场:正态分布在金融领域中的应用广泛而重要。
许多金融市场价格变动的模型都基于正态分布。
例如,根据正态分布模型,可以计算股票价格的变动概率,评估投资风险,并进行资产配置和风险管理。
4. 人口统计学:正态分布在人口统计学中的应用主要用于研究人口特征和人口变化规律。
正态分布的概率公式正态分布(Normal distribution),也称为高斯分布(Gaussian distribution),是一个广泛应用于自然和社会科学中的概率分布。
它被称为正态分布是因为它的概率密度函数在曲线图上呈现为一个钟形曲线,其均值和中位数相等,对称于均值。
$$f(某) = \frac{1}{\sigma\sqrt{2\pi}}\ e^{-(某-\mu)^2/2\sigma^2}$$其中,$\mu$ 是均值,$\sigma$ 是标准差,$e$ 是自然常数的底数,$某$ 是随机变量的取值。
这个公式告诉我们的是,在正态分布中,每个取值$某$所对应的概率密度是多少。
这种密度的形状是钟形曲线,它的峰值位于均值处,标准差越小,曲线越陡峭,反之曲线越平缓。
峰值处的高度由于函数式中分母中的$\sqrt{2\pi} \sigma$因子决定,在峰值处为$f(\mu) =\frac{1}{\sqrt{2\pi} \sigma}$。
这意味着正态分布的总面积为1。
标准正态分布的概率密度函数可以用以下公式表示:$$f(z) = \frac{1}{\sqrt{2\pi}}\ e^{-z^2/2}$$其中,$z = \frac{某-\mu}{\sigma}$,表示标准正态分布离均值有多少标准差。
我们可以使用标准正态分布的概率密度函数来计算一个正态分布内某个区间的概率。
具体来说,如果我们要求标准正态分布在一个区间$[a,b]$中的概率,我们可以计算:$$P(a < Z < b) = \int_a^b f(z)\ dz$$同样的,如果我们要求正态分布在一个区间$[a,b]$中的概率,我们可以将其标准化为一个标准正态分布:$$P(a < X < b) = P\left(\frac{a-\mu}{\sigma} < Z < \frac{b-\mu}{\sigma}\right)$$然后使用标准正态分布的概率密度函数计算该区间的概率。
正态分布概率正态分布是统计学中最为常见的连续概率分布之一,也被称为高斯分布。
它在自然界、社会科学和工程领域中具有广泛的应用。
正态分布的最重要特征是其对称性和集中性,因此它经常被用来对观测数据的分布进行建模和分析。
正态分布的概率密度函数由以下公式给出:f(x) = (1 / (σ * √(2π))) * e^(-(x-μ)² / (2σ²))其中,f(x) 表示随机变量 X 的概率密度函数值,e 是自然对数的底数,μ 是分布的均值,σ² 是分布的方差。
概率密度函数描述了在给定均值和方差的情况下,随机变量 X 取某一特定值的概率。
正态分布具有一些重要的特性,其中最重要的是:1. 对称性:正态分布是对称的,也就是说,它的概率密度函数在均值处达到最大值,并且两侧的概率密度相等。
2. 峰度:正态分布具有尖峰且平滑的形状。
如果一个分布的峰度是零,则称该分布为正态分布。
峰度的绝对值越大,分布的形状就越陡峭或扁平。
3. 标准化:正态分布可以通过减去均值并除以标准差来进行标准化,从而得到标准正态分布。
标准正态分布的均值为0,方差为1。
4. 中心极限定理:中心极限定理是正态分布的一个重要特性,它指出如果随机变量是由大量独立同分布的随机变量之和形成的,那么这个随机变量的分布将趋近于正态分布。
正态分布的概率计算是统计学中重要的任务之一。
我们可以使用正态分布表或计算机软件来计算特定区域的概率。
下面将介绍一些常用的概率计算方法。
1. 区间概率:给定一个间隔 [a, b],我们可以计算在该区间内随机变量 X 取值的概率。
这可以通过计算概率密度函数在该区间上的积分来实现。
2. 尾概率:尾概率是指随机变量 X 取值超过给定阈值的概率。
对于正态分布,我们可以使用标准正态分布表或计算机软件来计算尾概率。
3. 百分位数:百分位数是指给定概率下的随机变量取值。
对于正态分布,我们可以使用标准正态分布表或计算机软件来计算百分位数。
正态分布公式推导正态分布是一种常见的概率分布,其概率密度函数可以通过公式推导而得。
下面将介绍正态分布的起源以及其推导过程。
正态分布在19世纪由高斯(Gauss)引入,也因此被称为高斯分布。
高斯分布具有许多重要的性质,因此在统计学和自然科学中得到了广泛的应用。
正态分布的概率密度函数可以表示为:f(x)=(1/√(2πσ²))*e^((-(x-μ)²)/(2σ²))其中,f(x)是随机变量X的概率密度函数,x是变量的取值,μ是分布的均值,σ²是方差,e是自然对数的底。
下面将推导正态分布的概率密度函数。
首先,考虑标准正态分布,即均值为0,方差为1的正态分布。
其概率密度函数为:f(x)=1/√(2π)*e^(-x²/2)为了将概率密度函数推广到一般的正态分布,我们引入变量Z,用来表示标准正态分布的随机变量。
假设X是一个正态分布的随机变量,其均值为μ,方差为σ²。
我们可以将X表示为:X=μ+σZ其中,Z是标准正态分布的随机变量。
将X的表达式代入概率密度函数,我们得到:f(x)=1/(√(2π)σ)*e^(-((x-μ)/σ)²/2)通过这个表达式,我们可以看出,X是一个以μ为均值,以σ²为方差的正态分布。
为了进一步推导正态分布的公式,我们需要理解正态分布的性质。
具体来说,在正态分布中,68%的观测值位于均值加减1个标准差之间,95%的观测值位于均值加减2个标准差之间,99.7%的观测值位于均值加减3个标准差之间。
这些性质称为“三个标准差法则”或“68-95-99.7法则”。
基于这些性质,我们可以通过对概率密度函数进行适当的变换得到正态分布的常用公式。
首先,我们对标准正态分布的概率密度函数进行变换,得到:∫(-∞, x) (1/√(2π) * e^(-t²/2)) dt = ∫(-∞, (x-μ)/σ) (1/√(2π) * e^(-t²/2)) dt其中,左侧是标准正态分布的累积概率密度函数(CDF),右侧是一般正态分布的CDF。
概率论正态分布正态分布是概率论中最为重要的分布之一,它也被称为高斯分布,是一种连续概率分布。
正态分布在自然界中广泛存在,例如身高、体重、智力等指标都符合正态分布。
正态分布的研究对于统计学、经济学、物理学、生物学等学科都具有重要的意义。
正态分布的概率密度函数可以表示为:$$f(x)=frac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^2}{2sigma^2}}$$其中,$mu$ 是均值,$sigma$ 是标准差,$x$ 是随机变量。
正态分布的均值和方差分别为 $mu$ 和 $sigma^2$。
正态分布的图像呈钟形曲线,中心对称。
其中,均值 $mu$ 是曲线的对称轴,标准差 $sigma$ 决定了曲线的宽度。
当$sigma$ 越大时,曲线越平缓;当 $sigma$ 越小时,曲线越陡峭。
正态分布的性质正态分布具有许多重要的性质,以下是其中的一些:1. 正态分布的均值、中位数和众数相等。
2. 正态分布的曲线在均值处取得最大值。
3. 68.27% 的数据位于均值 $pm$ 1 个标准差之间。
4. 95.45% 的数据位于均值 $pm$ 2 个标准差之间。
5. 99.73% 的数据位于均值 $pm$ 3 个标准差之间。
6. 正态分布可以通过标准正态分布进行标准化,即将原始数据减去均值后除以标准差,得到的数据符合标准正态分布。
正态分布的应用正态分布在实际应用中非常广泛,以下是其中的一些应用:1. 统计学中,正态分布是许多假设检验和区间估计的基础。
2. 生物学中,正态分布可以用来描述许多生物特征,例如身高、体重、血压等。
3. 工程学中,正态分布可以用来描述许多工程参数,例如材料强度、电路噪声等。
4. 经济学中,正态分布可以用来描述许多经济指标,例如收入、消费、通货膨胀等。
5. 金融学中,正态分布可以用来描述许多金融指标,例如股票价格、汇率等。
正态分布的拟合检验在实际应用中,我们经常需要判断一个数据集是否符合正态分布。
概率论-正态分布概率论 - 正态分布正态分布具有⼀些有⽤的性质。
⽬录正态分布和标准正态分布的转换引理若随机变量X∽,则Z=\frac{X-\mu}{\sigma}\backsim N(0,1)证明由X\backsim N(\mu,\sigma^2),得P(X\leq x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx⽽P(Z\leq x)=P(\frac{X-\mu}{\sigma}\leq x)=P(X\leq x\sigma+\mu)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(x\sigma + \mu-\mu)^2}{2\sigma^2}}dx=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{x^2}{2}}dx记F(x)=P(X\leq x),H(x)=P(Z\leq x),则有H(x)=F(x\sigma+\mu)两边关于x取导,有:h(x)=\sigma f(x\sigma+\mu)=\sigma (\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{x^2}{2}}dx)'=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}=\varphi(x)得证。
结论若⼀个随机变量符合正态分布,那么它的标准化变量服从标准正态分布。
正态分布的性质内容源见引⽤。
1. n维正态随机变量(X_1,X_2,...,X_n)的每⼀个分量X_i都是正态随机变量;反之,若X_1,X_2,...,X_n都是正态随机变量,且相互独⽴,则(X_1,X_2,...,X_n)是n维正态随机变量。
什么是正态分布?正态分布(Normal Distribution),又称高斯分布(Gaussian Distribution),是概率论和统计学中最重要的连续型概率分布之一。
它的形状呈钟形曲线,两侧尾部逐渐趋于无穷远,中间部分较为集中。
正态分布在自然界和社会科学中广泛应用,被认为是一种理想的分布模型。
正态分布的概率密度函数可以用以下公式表示:$$f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$其中,$x$ 是随机变量的取值,$\mu$ 是均值,$\sigma$ 是标准差。
正态分布的均值决定了曲线的中心位置,标准差决定了曲线的宽度。
正态分布具有以下特点:1. 对称性:正态分布的概率密度函数关于均值对称,即曲线在均值处取得最大值,两侧的面积相等。
2. 唯一性:正态分布由均值和标准差唯一确定。
3. 稳定性:正态分布在多次独立抽样下,样本均值的分布仍然服从正态分布。
4. 中心极限定理:当样本容量足够大时,无论总体分布是什么形状,样本均值的分布都接近正态分布。
正态分布在实际应用中具有广泛的意义和重要性。
首先,许多自然现象和社会现象都服从正态分布,例如人的身高、体重、智力水平等。
其次,正态分布在统计推断中起到了重要的作用。
根据正态分布的特性,我们可以利用正态分布进行参数估计、假设检验、置信区间估计等统计推断方法。
此外,正态分布还在工程、经济学、金融学等领域中广泛应用,例如风速、股票收益率等。
正态分布的应用不仅限于单变量情况,还可以推广到多变量情况。
多变量正态分布是指多个随机变量同时服从正态分布的情况。
多变量正态分布的概率密度函数可以用多元高斯分布的形式表示。
多变量正态分布在多元统计分析中具有重要的地位,常用于描述多个变量之间的相关关系。
总之,正态分布是概率论和统计学中最重要的分布之一,具有对称性、唯一性、稳定性和中心极限定理等特点。
正态分布一、正态分布设随机变量X 具有概率密度+∞<<-∞=--x e x f x ,21)(222)(σμσπ其中)0(,>σσμ为常数,则称X 服从参数为2,σμ的正态分布,即),(~2σμN X 。
X 分布函数:()⎰∞---=x t dt e x F 222)(21σμσπ +∞<<∞-x二、标准正态分布 )1,0(~N X密度函数 2221)(x e x -=πϕ +∞<<∞-x 分布函数 ⎰∞--=x t dt e x 2221)(πφ +∞<<∞-x三、性质、计算1. )(1)(x x φφ-=-2. 若)1,0(~N X ,则{}()()a b b X a P φφ-=<<{}()12-=≤a a X P φ {}{}())1(21a a X P a X P φ-=<-=≥3.若),(~2σμN X ,则()⎪⎭⎫ ⎝⎛-=σμφx x F {}{}()()⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-=-=≤<=<<σμφσμφ12122121x x x F x F x X x P x X x P四、练习1.设)1,0(~N X ,求:{}1≤X P ,{}2≤X P ,{}3≤X P ,{}96.1>X P 。
2.设)4,1(~N X ,求:{}6.10≤≤X P ,{}2.75<<X P ,{}3.2≥X P3.从南区某地乘地铁前往北区火车站搭乘火车有两条路可走,第一条路线穿过市区,路程较短,但交通拥挤,所需时间(单位:min )服从正态分布N(50,100);第二条路线沿环城公路走,路线较长,但意外堵塞较少,所需时间(单位:min )服从正态分布N(60,16)。
若(1)有70分钟时间,(2)有65分钟时间,问在上述两种情况下应走哪一条路?(1-3题清华大学教材56-58页)五、标准正态分布的上α分位点设)1,0(~N X ,对于给定的)10<<αα(,如果αu 满足条件{}απαα==≥⎰+∞-u x dx e u X P 2221则称点αu 为标准正态分布的上α分位点。
概率分布中的正态分布与泊松分布概率分布是描述随机变量可能取值的概率的函数。
在统计学和概率论中,正态分布和泊松分布是两个重要的概率分布。
本文将介绍正态分布和泊松分布的特点、应用以及它们在实际问题中的意义。
一、正态分布正态分布,也称为高斯分布,是一种连续型概率分布。
它的概率密度函数具有钟形曲线的特点,呈现对称性。
正态分布的均值和标准差决定了曲线的位置和形状。
正态分布的概率密度函数可以用以下公式表示:f(x) = (1 / (σ * √(2π))) * e^(-((x-μ)^2 / (2σ^2)))其中,μ是均值,σ是标准差,e是自然对数的底。
正态分布的特点:1. 曲线的中心位于均值μ处,对称性使得均值、中位数和众数相等。
2. 标准差σ决定了曲线的宽窄,标准差越大,曲线越宽。
3. 68%的数据在均值加减一个标准差范围内,95%的数据在均值加减两个标准差范围内,99.7%的数据在均值加减三个标准差范围内。
正态分布的应用:1. 自然界中的现象,如身高、体重、智力等,往往服从正态分布。
2. 统计学中的假设检验和置信区间估计常常基于正态分布。
3. 金融学中的股票收益率、利率变动等也可以用正态分布进行建模。
二、泊松分布泊松分布是一种离散型概率分布。
它描述了在一段固定时间或空间内,事件发生的次数的概率分布。
泊松分布的参数λ表示单位时间或单位空间内事件的平均发生率。
泊松分布的概率质量函数可以用以下公式表示:P(X=k) = (e^(-λ) * λ^k) / k!其中,k是事件发生的次数,e是自然对数的底。
泊松分布的特点:1. 事件发生的次数必须是离散的,且事件之间相互独立。
2. 事件发生的平均速率λ在给定时间或空间段内是恒定的。
3. 当时间或空间段足够小,事件发生的概率近似服从泊松分布。
泊松分布的应用:1. 电话交换机的呼叫次数、单位时间内的事故发生次数等可以用泊松分布进行建模。
2. 利用泊松分布可以对罕见事件的发生概率进行估计,如地震、火灾等。
正态概率分布函数
正态概率分布函数(Normal Probability Distribution, NPD)是数学和统计学中最重要的概率分布之一。
它表示的是一类服从某种特定的分布的随机变量的概率,也称为正态分布。
它具有非常重要的理论意义,广泛应用于数理统计中。
正态概率密度函数,又称正态分布函数,是一种特殊的概率分布,应用最广泛的概率分布之一,主要原因是正态概率分布可以简化很多统计方法的计算,同时还可以具有非常实用的性质,其中包括中心极限定理等。
正态概率分布具有以下共同特征:样本均值(简称为均值)等于随机变量期望,样本方差等于随机变量方差,数据点符合均匀分布;另外,垂直于均值线的两条贝塞尔曲线位于两边,并且贝塞尔曲线是对称的。
一般来说,概率分布的形状取决于均值和方差,正态概率分布的形状由均值调节,方差决定,均值越高正态曲线就越高,方差越大,则曲线越宽,曲线的右边越低。
而当方差趋近于零时,正态曲线就由直线表示。
正态分布在概率统计里有着重要的意义,它能够准确地描述实际问题中的随机变量,同时也可以提供许多非常重要的性质,如中心极限定理,大数定律等。
总的来说,正态概率分布函数是统计学中最重要的概率分布之一,广泛运用于数理统计,同时也有着非常重要的理论意义,是很多统计方法的重要基础。
正态分布的概率分布
正态分布是一种常见的连续概率分布,又称为高斯分布。
它在许多自然和社会现象中都具有重要的应用,例如测量误差、人口统计学、金融风险等领域。
正态分布的概率密度函数具有以下形式:
f(x)= (1/(σ√(2π)))×exp(-(x-μ)²/(2σ²))
其中,μ表示均值,σ表示标准差,exp为自然指数函数,π为圆周率。
正态分布的形状是钟形曲线,中心对称,左右两端趋于无穷远,且均值、中位数、众数相等,这些特点使得它成为一种理想的模型分布。
对于正态分布,在给定的均值和标准差下,可以计算出许多与概率相关的指标,例如:
1. 标准正态分布:当μ=0,σ=1时,称为标准正态分布,其概率密度函数为:
f(x)=1/√(2π)×exp(-x²/2)
2. Z分数:指一个随机变量与其所在正态分布的均值之差除以标准差的比值,即:
Z=(X-μ)/σ
3. 标准正态分布表:给定一个Z分数,可以通过查表得到其对应的概率值,也可以根据概率值反推出对应的Z分数。
4. 概率计算:可以利用正态分布的概率密度函数计算出在给定区间内随机变量取值的概率,例如:
P(a≤X≤b)=∫a^b(1/(σ√(2π)))×exp(-(x-μ)²/(2σ²))dx
正态分布在实际应用中有着广泛的应用,例如在品质控制中评估产品的合格率、在社会科学中分析人口的身高、体重等等。
概率论正态分布概率论:正态分布第四章正态分布第一节第二节第三节第四节第五节正态分布的密度函数正态分布的数字特征正态分布的线性性质二维正态分布中心极限定理正态分布的密度函数正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,它在概率统计中占有特别重要的地位.比如,考察一群人的身高,个体的身高作为一个随机变量,其取值特点是:在平均身高附近的人较多,特别高和特别矮的人较少.一个班的一次考试成绩、测量误差等均有类似的特征.高斯在研究误差理论时曾用它来刻画误差,因此很多文献中亦称之为高斯分布. 进一步的理论研究表明,一个变量如果受到大量独立的因素的影响(无主导因素),则它一般服从正态分布,这是中心极限定理探讨的问题.一. 一般正态分布1. 定义若随机变量X的密度函数为1 2 2 f ( x) e 2其中 x ( x )2式中为实数, >0 .则称X服从参数为 ,2的正态分布,亦称高斯分布.记为N(, 2).可表为X~N(, 2). 图象见右上角正态分布有两个特性: (1) 单峰对称密度曲线关于直线x=对称1 f()=maxf(x)= 2(2) 的大小直接影响概率的分布越大,曲线越平坦; 越小,曲线越陡峻. 正态分布也称为高斯(Gauss)分布N ( 4,3 / 5)N ( 4,1)N ( 4,7 / 5)二. 标准正态分布参数=0,2=1的正态分布称为标准正态分布,记作X~N(0, 1)。
(x) 其密度函数为1 (x)2 ( x )x2 e 24 2 0(1) (0)=0.5( x ) P { X x}t2 x 1 e 2 2(2) (+∞)=1;dt , xf ( x) 1 e 2(3) (x)=1-(-x). 一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值.(P328附表1)如,若 X~N(0,1),(0.5)=0.6915, P{1.32正态分布的数字特征 (一) 一般正态分布N(, 2)( x)2 2 21 X ~ f (x) e 2, xE( X )xf ( x)dxt ( xt2 2 e dt 2x e 2( x )2 2 2D( X )) f ( x )dx(二)标准正态分布N(0, 1)X ~ f ( x)E( X )x2 e 2, xx2 e 2 dxxf ( x ) dx0(奇函数 )D( X ) E{[ X E ( X )] }2 x[ xE ( X )] f ( x)dxx2 e 2 dx三. 一般正态分布概率的计算若X~N(,2),>0,则有F ( x ) P { X x}x 1 e 2 (t ) 2 2 2x }F ( x) P{X x} P{ P{Z ( x ).} ( x ) /t2 1 e 2 dt 2一般地,有例1 设随机变量 X ~ N (1, 2 ) , 求 P{ 1.6 X 2.4} 解 P{ 1.6 X 2.4} P{ 1.6 1 X 1 2.4 1} P{ 2.6 X 1 1.4}P{ 2.6 / 2 ( X 1) / 2 1.4 / 2} P{ 1.3 ( X 1) / 2 0.7}(0.7) ( 1.3)(0.7) [1 (1.3)] 0.7580 [1 0.9032] 0.6612 .P{a X b} P{a X b } a b a Xb P{ } P{ Z } b a P{Z } P{Z } Z ~ N (0,1) b a( ) ( ) 2例2. 设 X N(,2),求P{-3解 P{ 3 X 3 } P{( 3 ) X( 3 ) } P{3 X 3 } P{ 3 X3 } P{ 3 ( X ) / 3} (3) ( 3)(3) [1 (3)] 2 (3) 1 0.9973本题结果称为3原则.在工程应用中,通常认为P{|X|≤3} ≈1,忽略{|X|>3}的值.如在质量控制中, 常用标准指标值±3作两条线,当生产过程的指标观察值落在两线之外时发出警报,表明生产出现异常.例 3 设随机变量 X ~ N ( 2, 2 ) , 且 P{2 X 4} 0 .3, 求 P{ X0}. 随机变量解 P{2 X 4} P{0 ( X 2) / 2 / } 标准化(2 / ) (0) 0.3, (2 / ) 0.3 (0) 0.8P{ X 0} P{( X 2) / 2 / } ( 2 / ) 1 (2 / ) 1 0.8 0.2 例 4 设随机变量 X ~ N ( 3, 4 ) , 且常数 C 满足 P{ X C } P{ X C }, 求常数 C . 解由P{ X C} P{ X C}, 即 1 P{ X C} P{ X C} 所以 P{ X C} 0.5 X 3 C 3 C 3 另一方面 , P{ XC} P{ } ( ) 0.5 2 2 2 C 3 0 , C 3. 2例 4(2021年) ( A)设 X ~ N (0 , 1), 对于给定的 (0,1), 数 ( B)满足 P{ X } . 若 P{ X x} , 则 x 等于( D) 1解 P { X x} P { x X x}1 P{ X x}2 故 x 1一种电子元件的使用寿命X(小时)服从正态分布N(100,152),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率. 解:设Y为使用的最初90小时内损坏的元件数,则Y~90 100 ) (0.67) 0.2514 其中 p P{ X 90} ( 15P{Y 0} (1 p ) 3 0.4195 故2 (2021年) 设随机变量X ~ N ( 1 , 12 ), Y ~ N ( 2 , 2 ),且 P{ X 1 1} P{ Y 2 1}, 则必有 ( A) 1 2 . ( B ) 1 2 . (C ) 1 2 . ( B) 1 2 .第二节正态分布的数字特征一. 一般正态分布N(, 2)( x)2 2 21 X ~ f (x) e 2, xE( X )xf ( x)dxt ( xt2 2 e dt 2x e 2( x )2 2 2D( X )) f ( x )dx标准正态分布N(0, 1)X ~ f ( x)E( X )x2 e 2, xx2 e 2 dxxf ( x ) dx0(奇函数 )D( X ) E{[ X E ( X )] }2 x[ xE ( X )] f ( x)dxx2 e 2 dx例1 已知随机变量X的密度函数为 1 x 2 2 x 1 f ( x) e ,x 求 E ( X )、D ( X ) .f ( x)x 2 x 11 e2 (1/ 2)( x 1) 2 2(1/ 2 ) 21 故 1, 2例2 设X服从N(0,1)分布,求E(X2),E(X3)1 解 f (x) e2 x2 x2 2 E ( X 2 ) x 2 f ( x)dxe dx 2 2 2x de 2x 2x 2 eE( X )3 xf ( x) dxx2 x3 2 e dxx2 e 2 dx 12021年(数一) 设随机变量X的分布函数为F ( x) 0.3 ( x) 0.7 ( 其中 ( x)为标准正态分布函数, 则EX ( A)0. ( B )0.3. (C )0.7. ( D)1.x 1 ), 2分析 : EX xf ( x )dx ,因此先求随机变量 X的概率密度函数 f ( x ).解 f ( x ) F ( x ) [ 0 . 3 ( x ) 0 . 7 (0 .7 x 1 0 . 3 ( x ) ( ) 2 2于是 EXx 1 ) ] 2xf ( x ) dxx[0.3 ( x )0 .7 x 1 ( )]dx 2 20.7 x 1 0.3 x ( x)dx x ( )dx 2 21 0 .3 x e 20 .7 dx x 21 x 12 ( ) 2 21 x 12 ( ) 1 2 2 e dx 20 .7 1 x 2 e 21 x 12 ) ( 0 .7 1 2 2 dx dx x 2 e 2x 1 令 t , 则dx 2dt , x 2t 1. 代入上式得 20 .7 1 x 2 e 21 x 12 ) ( 2 20 .7 1 dx (2t 1) 2 e 21 0 .7 2t e2 22 dt0 .7 1 2 e 20. 7 10 2 e 22dt 0.7dt 0.7.设随机变量 X与 Y相互独立 , 且 X服从标准正态分布 ,1 Y的概率分布为 P{Y 0} P{Y 1} .记 FZ ( z )为随机变量2 Z XY 的分布函数 , 则函数 FZ ( z )的间断点个数为 ( A) 0 . ( B )1. (C ) 2 . ( D )3 .解 FZ (z) P{Z z} P{XY z}P{Y 0}P{XY z | Y 0} P{Y 1}P{XY z | Y 1}1 [ P{ XY z | Y 0} P{ XY z | Y 1}]2 1 [ P{ X 0z | Y 0} P{ X 1 z | Y 1}] 2 为什么? 1 [ P { X 0 z }P { X z }] 21 (1)当z 0时, FZ ( z ) [ P{ X 0 z} P{ X z}] 21 1 [ P( ) P{ X z}] [0 P{ X z}]2 21 1 P{ X z} ( z )2 2 1 (2)当z 0时, FZ ( z ) [ P{ X0 z P{ X z}] 21 1 [ P() P{ X z}] [1 P{ X z}]2 2所以 , z 0为函数 FZ ( z )的间断点 . ( B )正确 .1 [1 ( z )] 2例 3 某地抽样调查结果表明 , 考生的外语成绩 (百分制) 近似服从正态分布 , 平均成绩为 72 分, 而 96以上的考生占总数的 2.3%, 求考生的外语成绩在 60 分至 84 分之间的概率 . 解设 X —考生的外语成绩, 依题设知X ~ N ( , 2 ), 其中72, 下求方差 2 X 96 由题设 P{ X 96} 0.023 P{ } 0.023 X 96 96 1 P{ } 0.023, 即 1 ( ) 0.023) 0.977,96 96 72 2, 12 2 2于是 , P{60 X 84 } P{60 72 X 84 72 X 1} P{ } P{ 1 12 12(1) (1) (1) [1 (1)]2 (1) 1 2 0.841 1 0.682例 4 假设测量的随机误差 X ~ N ( 0,10 2 ).试求在 100 次独立重复测量中 , 至少有三次测量的绝对值大于 19 .6 的概率 ,并利用泊松分布求出的近似值 . 解先求每次测量误差的绝对值大于19.6的概率 p p P{ X 19.6} 1 P{ X19.6} 1 P{19.6 X 19.6}1 P{ 19.619.6 0 X 19.6 0 } 1 P{ 10 10 X1 P{ 1.96 1.96} 1 [ (1.96) ( 1.96)]1 [ (1.96) ( 1.96)] 1 (1.96) [1 (1.96)]2 2 (1.96) 2 2 0.975 2 1.95 0.0519.6设 Y — 100次测量中绝对值大于19.6, 则Y ~ B (100,0.05)于是所求的概率为 P{Y 3} 1 P{Y 0} P{Y 1} P{Y2}0 1 1 C100 (0.05) 0 (0.95)100 C100 (0.05)1 (0.95)99 2 C100 (0.05) 2 (0.95)98np 100 0 .05 5, 故由泊松分布得52 1 e (1 ) 1 e 5 (1 5 ) 0.87 2 2习作题 1.设随机变量X N(0,1),Y U(0,1),Z B(5,0.5),且 X,Y,Z独立,求随机变量U=(2X+3Y)(4Z-1)的数学期望答:27 E (U ) E (2 X 3Y ) E (4 Z 1) 22 设随机变量 X 1 ,..., X n 相互独立,且均服从 N ( , 2 )1 n 分布,求随机变量 X X i 的数学期望 n i 1 1 n 答: E ( X ) E ( X i ) n i 11. 设随机变量X B(12,0.5),Y N(0,1), COV(X,Y)=-1,求V=4X+3Y+1与W=-2X+4Y 的方差与协方差.2. 某单位招聘2500人,按考试成绩从高分到低分依次录用,共有10000人报名.假定报名者的考试成绩X 服从正态分布 N ( , 2 ), 现已知90分以上有359人, 60分以下的有1151人,求被录用者中的最低分数.第三节正态分布的线性性质一. 线性性质例1 设随机变量X服从标准正态分布,求随机变量 Y a X b ~ N (b, a2 ) Y=aX+b的密度函数,且有y b 解: Y=ax+b关于x严单,反函数为 h( y ) ay b fY ( y) f X ( ) h( y) 1 a 2E (Y )y b a 2 e( y b ) 2 2a2y e 2 a( y b ) 2 2a 2dyax b 2x2 e 2 dxD (Y ) E{[YE (Y )]2 } [ y E (Y ) ]2 f ( y ) dy( y b)2 2 a 2 2 e dy a 2 a 直接由Y的密度函数,可观察到Y的数学期望与方差1 2a2 , 由 f ( y) e 2 a 可知随机变量Y服从正态分布, ( y b) 2( y b)2而且 E (Y ) b , D (Y ) a 2定理1 设随机变量X 服从正态分布N(, 2),则X的线性函数 Y a b X 也服从正态分布,且有 Y a bX ~ N ( a b , a 2 2 )已知X N(,2),求 Y解 Y X 关于x严格单调,反函数为 h( y) y 故 fY ( y) f X [h( y)] | h( y) | f X (y )y 2你能用正态分布的线性性质求解吗?二. 正态分布的可加性定理2 设随机变量X1,X2 相互独立且Xi 服从正态分布N(i ,i2),i=1,2, 则 2 2 2 2 a1 X 1 a2 X 2 ~ N (a1 1 a2 2 , a1 1 a2 2 ) 定理3 设随机变量X1, X2,..., Xn独立且Xi 服从正态分布N(i ,i2),i=1,...,n, 则a i X i ~ N ( a i i , a i2 i2 )i 1 i 1例1. 设随机变量X与Y独立且均服从标准正态分布,求证:Z=X+Y服从N(0,2)分布.解依题设 X ~ N ( 0,1) , Y ~ N ( 0,1) ; 故有E ( X ) 0 , D ( X ) 1 , E (Y ) 0 , D (Y )于是由定理 2可知 X Y服从正态分布 , 且有E ( X Y ) E ( X ) E (Y ) 0 0 0D ( X Y ) D ( X ) D (Y ) 1 1 2,即 X Y ~ N (0 , 2 )例2. 设随机变量X与Y独立,且X~ N(1,2),Y~N(0,1). 求证:(1)Z=2X-Y+3的密度函数;(2)P{2D ( Z ) D ( 2 X Y 3) 4 D ( X )E (Y ) 8 1 9Z 2 X Y 3 ~ N (5,9) 2 Z 8 Z (2) P{2 Z 8} P{ } P{ 1 1} (1) (1) (1) [1 (1)] 即2 (1) 1 2 0.8413 1 0.6826一. 密度函数若随机变量(X,Y)的密度函数为f ( x, y )1 212 11 ( x 1 )2 ( x 1 )( y 2 ) ( y 2 ) 2 [ ] 2 22 2 1 2 2( 1 ) 2 1其中,1、2为实数,1>0、2>0、| |( X , Y ) ~ N ( 1 , 2 , , , )2 1 2 2二、边缘密度函数 2 设(X, Y)~f(x,y),(x,y)R ,则称 f X ( x) f ( x, y )dy 为(X,Y)关于X的边缘密度函数;同理,称 fY ( y ) f ( x,y )dx为(X, Y)关于Y的边缘密度函数。
正态分布概率分布函数正态分布概率分布函数是统计学中非常重要的一种概率分布函数,也被称为高斯分布。
它描述了大量具有连续变量的现象的分布情况,如身高、体重、 IQ 等。
正态分布的概率密度函数是钟形曲线,两侧呈对称关系,因此也被称为“钟形曲线分布”。
正态分布是一个连续的概率分布,它的概率密度函数为:$$f(x)= \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$$\mu$ 是分布的均值,$\sigma$ 是分布的标准差。
这个函数的图像与 $\mu$ 和$\sigma$ 的值有关,如果 $\mu$ 值增大,曲线向右移动;如果 $\sigma$ 值增大,曲线变得更平缓,同时顶点也变得更加圆。
正态分布的概率密度函数可以解释为:一个连续型的变量以 $\mu$ 为中心,以$\sigma$ 为半径的范围内的数值出现的概率。
对于身高这个变量,我们可以用 $\mu$ 来表示平均身高,$\sigma$ 表示身高的标准差。
在这种情况下,正态分布的概率密度函数描述了一个人身高在某个区间内的可能性大小。
正态分布的概率密度函数在很多情况下都有着重要的应用。
在实际应用中,我们经常需要计算区间内的概率,也就是计算正态分布函数在特定区间内的面积。
这个过程需要通过积分来实现,但是由于正态分布曲线的对称性,我们可以利用一些规律来求解。
我们可以使用正态分布表来找到某个区间的概率,这些表通常被列成两个部分,第一部分列出了 Z 分数(标准正态分布对应的值),第二部分列出了面积。
如果要计算 $Z \leq 0.5$ 的概率,我们可以查表得到 $0.6915$。
如果我们要计算 $Z > 0.5$ 的概率,可以是用对称性 $P(Z > 0.5) = P(Z < -0.5) = 1 - 0.6915 = 0.3085$。
在实际应用过程中,有时候我们需要计算两个正态分布之间的概率,这个情况下又需要使用一些特定的公式来计算。
正态分布概率分布
正态分布,也称为高斯分布,是统计学中最重要的概率分布之一。
它具有许多重要的特性,因此在自然界和社会科学中经常出现。
正态分布的概率密度函数呈钟形曲线,对称轴对称,其形状由均值
和标准差决定。
在正态分布中,大部分的数据聚集在均值附近,而
离均值越远的数值出现的概率越小。
正态分布在现实世界中的应用非常广泛。
例如,在自然界中,
身高、体重、智力水平等许多特征都服从正态分布。
在工程和经济
学中,许多随机变量的分布也可以用正态分布来近似描述。
由于中
心极限定理的作用,许多随机现象都可以用正态分布来进行建模和
分析。
正态分布的数学性质也使其成为许多统计推断和假设检验的基础。
许多统计学方法都建立在对数据是否符合正态分布的假设上。
同时,正态分布也是许多随机过程和连续随机变量的理想模型。
总之,正态分布作为一种概率分布,在统计学和自然科学中发
挥着重要作用。
它的特性和应用广泛,对于研究和解释许多随机现
象都具有重要意义。
因此,正态分布的研究和应用将继续在各个领域中发挥重要作用。