- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
之比的极限. 这里, 如果把概率理解为质量,
则 f(x)相当于线密度.
由导数的定义,我们得到: 若不计高阶无穷小, 有
P{x<X≤x+△x}≈f(x)△x. 它表示随机变量X取值落入区间(x, x+△x]的 概率近似等于f(x)△x.
性质(5)是因为
a
a
P{X=a} lim f (x)dx f (x) 0.
下面我们就来介绍对连续型随机变量的 描述方法.
(一) 连续型随机变量的概率密度
定义 对于随机变量X , 如果存在一个非
负可积函数 f(x), 使得对于任意的实数x, 有
F(x)=P{-∞<X≤x}=
x
f (t)dt, x( ,). (4.1)
则称X为连续型随机变量, 其中函数f(x)称为
X的概率密度函数, 简称为概率密度或密度.
=P{X≤μ+σ x}
1
e dt, x
(t )2 2 2
2
令 t u,得到
P{Z≤x} P{ X ≤x}
1
x
e
u2 2
du
(x).
2
由此得到
Z X ~ N(0,1).
根据这个定理, 只要将标准正态分布的
(4.8)
则称X服从参数为μ和σ2的正态分布, 其中μ和
σ(σ >0)都是常数. 常记为X~N(μ, σ2). f (x)所
确定的曲线叫作正态曲线.
(2) 正态分布的图形特点 正态分布的概率密度图象见图2-11.
图2-11 正态分布的概率密度及参数μ,σ含义
正态分布的密度曲线是一条关于x=μ对 称的钟形曲线, 其特点是“两头小,中间大, 左右对称”. μ决定了图形的中心位置, 当μ取 不同值时, 图像将会发生平移; σ决定了图 形的峰的陡峭程度: 当σ较大时, 曲线较平坦; 当σ较小时, 曲线则较陡峭.
(4) 计算连续型随机变量X落入区间(a,b] 或[a,b)或[a,b]内的概率都用公式
P{a<X≤b}=P{a≤X<b}= P{a<X<b} = P{a≤X≤b}
= b f (x)dx, a
或 Pa≤X≤b F(b) F(a). (∵ P{X=a}=0)
五、常见常用的连续型随机变量的分布
常用的连续型随机变量的分布有均匀 分布、指数分布和正态分布.
由定义可以看出: 连续型分布函数F(x) 是处处连续的, 而一般定义(3.1)得到的分布 函数F(x)仅是右连续的.
概率密度f (x)的性质:
(1) f (x)≥0, x∈(-∞, +∞).
(2) f (x)dx 1.
(3) 对于任意实数x1, x2(x1≤x2),
P{ x1<X≤x2}=F(x2)-F(x1)=
一、提出问题
若随机变量X的所有的可能取值充满一 个区间, 那么就不能像离散型随机变量那样, 以指定它取每个值的概率的方式给出其概 率分布, 怎样来研究这种情形呢?
二、预备知识
1. 反常积分,原函数,定积分的几何
意义,定积分与反常积分计算;
2.奇偶函数,单调增函数,分布函数连 续性.
三、提出概念
连续型随机变量X的所有可能取值充满 一个区间, 对这种类型的随机变量, 不能像 离散型随机变量那样, 以指定它取每个值概 率的方式去给出其概率分布, 而是通过给出 所谓“概率密度函数”的方式.
1
x2
e 2 , x ,
2
1
x
x2
e 2 dx, x .
2
(4.10)
(4.11)
关于φ(x)和Φ(x)的图形见图2-12.
图2-12标准正态分布概率密度φ(x)和分布函数Φ(x)关系
关于分布函数Φ(x)和概率密度φ(x)
有以下性质: (i) Φ(0)=0.5,
φ(0)= 1 ;
f
(x)
1
x
e
,
0 ,
x 0, 其它.
(三) 正态分布 正态分布是应用最广泛的一种连续型分布. 正态分布在19世纪前叶由高斯(Gauss) 加以推广, 所以通常又称为高斯分布.
正态分布是概率论与数理统计中最常用 也是最重要的一种概率分布, 它在解决实际 问题中有着广泛的应用. 经验表明, 当一个 变量受到大量微小的、互相独立的随机因素 影响时, 这个变量往往服从或近似地服从正 态分布.
(二) 指数分布
若连续型随机变量X的概率密度为
ex ,
f (x) 0 ,
x 0, 其它.
(4.6)
则称 X 服从参数为λ的指数分布, 其中λ>0,
是一常数,记为 X~E(λ).
用分段积分的方法, 易知指数分布的分布
函数为 1 ex ,
F(x) 0 ,
x 0, x≤0.
(4.7)
例4 多年统计表明, 某厂生产的电视机 的寿命X~E(0.2) (单位:万小时).
F ( x)= 12
1
arcsin
x,
1≤x 1,
1, x≥1.
讲评 (1) 确定f(x)中的待定参数用公式
f (x)dx=1.
(2) 已知概率密度f(x), 求分布函数用定义
F(x)= x f (t)dt.
(3) 已知分布函数F(x), 求概率密度f(x)用关系
F(x)=f (x). 注意F(x)和f(x)为分段函数时的定义区间写法.
匀分布, 则X落入该区间中任一相等长度的子 区间内的概率相同, 即X落入任何子区间的概 率仅与该区间的长度成正比, 而与其位置无 关. 此性质进一步说明了几何概率定义的合理 性.
均匀分布常见于下列情形: 某一事件 等可能地在某一时间段发生; 在数值计算 中, 由于进行四舍五入, 小数点后某一位小 数舍入的误差, 例如对小数点后第一位是 按四舍五入原则得到时, 那么一般认为误 差在(-0.05, 0.05)上服从均匀分布.
例1 设连续型随机变量X的概率密度f (x)
如右式,试求:
(1) 常数k ; (2) P{|X|≤0.5};
f ( x)=
k , x 1, 1 x2
(3) X的分布函数.
0, x ≥1.
解 (1) 因为 f (x)dx=1,
故由
f (x)dx
1 1
k 1
x2
dx
k
arcsin
(一) 均匀分布
若连续型随机变量X的概率密度为
f
(x)
b
1
a
,
a
x
b,
(4.4)
0, 其它.
则称X在区间(a, b)上服从均匀分布, 其中a,b
为分布参数, 且a<b , 记为X~U(a, b).
均匀分布的分布函数为
0,
x a,
F
(
x)
x b
a a
,
a≤x b ,
(4.5)
1,
x≤b.
(1) 某人购买了一台该厂生产的电视机, 问其寿命超过4万小时的概率是多少?
(2) 某单位一次购买了10台这种电视机, 问至少有2台寿命大于4万小时的概率又是多 少?
解 由题设知, 随机变量X有概率密度
0.2e0.2x , x 0,
f (x) 0,
x≤0.
(1) 电视机寿命超过4万小时的概率为
P{X 4}
0.2e0.2xdx e0.2x
4
4
e0.8
0.4493.
(2) 设Y={10台电视视中寿命大于4万小时
的台数}, 则Y服从二项分布, 即有
Y~B(10, e0.8 ). 于是 P{Y≥2}=1-P{Y=0}-P{Y=1}
1 C100 (0.4493)0 (0.5507)10 C110 (0.4493)1 (0.5507)9
(3) 正态分布的分布函数
设X~N(μ,σ2), 则随机变量X的分布函数是
x
F(x)
1
e
(
x )2 2 2
dx,
x
.
2
ቤተ መጻሕፍቲ ባይዱ
(4.9)
(4) 标准正态分布
当μ=0, σ=1时, 得到的正态分布N(0, 1)称
为标准正态分布. 其密度函数和分布函数常
用φ(x)和Φ(x)表示. 这里
(x)
(x)
=0.9765.
讲评 (1) 这里X~E(0, 2), Y服从二项分布
Y~B(10, e0.8 ). 用到结论P{X>4}=e-0.8.
(2) 此题比较综合, 应引起重视.
指数分布常用于可靠性统计研究中,如 元件的寿命, 动植物的寿命, 服务系统的服务 时间等等.
连续型随机变量X的指数分布概率密度 还有形式:
由性质(2)知道, 介于曲线y = f (x) 与Ox 轴之间的面积 等于1(图2-7).
图 2-7
f (x)dx
1
由性质(3)知道, X落在区间(x1, x2]上的概 率P{ x1<X≤x2}等于区间(x1, x2]上曲线y = f (x) 之下的曲边梯形的面积值(图2-8).
图2-8 P{ x1 X≤x2}=
在正常条件下, 各种产品的质量指标, 零件的尺寸, 纤维的强度和张力,农作物的 产量, 小麦的穗长和株高,测量误差, 射击 目标的水平或垂直偏差, 信号噪声,等等, 都服从或近似地服从正态分布.
(1) 正态分布的定义
若随机变量X 的概率密度为
f (x)
1
(x )2
e 2 2 , x .
2
2
(ii) Φ(-x) = 1-Φ(x),
φ(-x) =φ(x).
标准正态分布的重要性在于,任何 一个一般的正态分布N(μ,σ2)都可以通过 “标准化”线性变换转化为标准正态分布.