第一节事件与概率
(一)概率的定义
?研究随机试验,需了解各种随机事件发生的可能性大小,以揭示这些事件的内在的
统计规律性。
?能够刻画事件发生可能性大小的数量指标称之为概率(probability)。事件A的概率
记为P(A)。
1.概率的古典定义(先验概率)
?随机试验具有以下特征,称为古典概型。
1.试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个;
2.各试验的结果出现的可能性相等,即所有基本事件的发生是等可能的;
3.试验的所有可能结果两两互不相容。
对于古典概型,概率的定义:
设样本空间由n 个等可能的基本事件所构成,其中事件A包含有m个基本事件,则事件A 的概率为m/n,即
P(A)=m/n
这样定义的概率称为古典概率
2.概率的统计定义(经验概率)
?在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为
随机事件A的频率;当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值p,那么就把p称为随机事件A的概率(probability)。
2.概率的运算法则
?加法法则:互斥事件A和B的和事件的概率等于事件A和事件B的概率之和。即
P(A+B)=P(A)+P(B)。
?加法定理对于多个两两互斥的事件也成立。P(A+B+…+N)=P(A)+P(B)+…P(N)
P(A+B)=P(A)+P(B)-P(AB)
乘法法则:
?如果A事件和B事件为独立事件,则事件A与B事件同时发生的概率等于两独立
事件概率的乘积,即:
P(AB)=P(A) ?P(B)
?乘法定理对于n个相互独立的事件也成立,即
P(A1A2 ??? An)=P(A1) P(A2) ???P (An)
书上例题
第二节常用离散变量的理论分布
一、二项分布
(一)贝努里试验及其概率函数:
指只有两种可能结果的随机试验,我们将其中比较关注的结果称为“成功”,另一个结果称为“失败”。
将某随机试验重复进行n次,若各次试验结果互不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称n次试验是独立的
对于n次独立的试验
如果每次试验结果出现且只出现对立事件A与之一,在每次试验中出现A的概率是常数p(0
在n 重贝努里试验中,事件 A 可能发生0,1,2,…,n 次,来求事件 A 恰好发
生k (0≤k ≤n )次的概率Pn (k )。
例:抛掷4次硬币,正面朝上(A )出现2次的概率。先取n =4,k =2。在4次试验
中,事件A 发生2次的方式有以下C42种:
一般,在n 重贝努里试验中,事件A 恰好发生k (0≤k ≤n)次的概率为
k =0,1,2…,n (二)二项分布的定义及性质 1、二项分布的定义:
设随机变量 x 所有可能取的值为零和正整数:0,1,2,…,n ,且有:
k =0,1,2…,n 其中p >0,q >0,p+q=1,则称随机变量x 服从参数为n 和p 的二项分布 ,记为:
B(x;n,p)。
二项分布是一种离散型随机变量的概率分布。参数n 称为正整数离散参数;p 是连
续参数,它能取0与1之间的任何数值(q =1-p )。
2、二项分布的性质:容易验证,二项分布具有概率分布的一切性质,即: (1)P(x=k)= Pn(k) (k=0,1,…,n ) (2)二项分布的概率之和等于1,即
(3) (4)
(5) (m1 3、二项分布的图形特征: 二项分布的图形由n 和p 两个参数决定: (1)当p 值较小且n 不大时,分布是偏斜的。但随着n 增大 ,分布逐渐趋于对称; (2)当p 值趋于0.5时,分布趋于对称; (3)对于固定n 及p ,当k 增加时 ,概率P (X=k ) 先是随之增加直至 达到最大值, 随后单调减少。 此外,在n 较大,np 、nq 较接近时 ,二项分布接近于正态分布;当n →∞时,二 项分布的极限分布是正态分布。(n ≥30,np ≥5,nq ≥5时,近似正态分布。) (三)二项分布概率计算及应用条件 二项分布的应用条件有三: 1.各观察单位只具有互相对立 的一种结果,属于二项分类资料; 2.已知发生某一结果的概率为p ,其对立结果的概率则为1-p=q ,要求p 是从大量观察中获得的稳定数值; 3.n 个观察单位的观察结果互相独立,即每个观察单位的结果不会影响到其它观察单位的观察结果 k n k k n n q p C k P -=)(k n k k n n q p C k P -=)(1)(0 =+=∑ =-n n k k n k k n p q q p C ∑ =-=≤=≤m k k n k k n n q p C m k P m x P 0)()(∑ =-=≥=≥n m k k n k k n n q p C m k P m x P )()(∑ =-=≤≤=≤≤21 )()(2121m m k k n k k n n q p C m k m p m x m P (四)二项分布的平均数与标准差 统计学证明,服从二项分布B (n ,p )的随机变量之平均数μ、标准差σ与参数n 、p 有如下关系: 当试验结果以事件A 发生次数k 表示时 μ= np σ= 三.几何分布(Geometry distribution) 在贝努里试验中,每次试验成功的概率为p ,失败的概率为q=1-p , 设试验进行到第 次才出现成功。 (xi)的分布列为 P k=1.2… (k=1.2…)是几何级数的 一般项。因此称它为几何分布记为 ~g(k ;p)。 四、超几何分布 对于抽样调查,只有在大群体(即总体比样本相对大很多)的情况下,二项分布的 独立试验要求才能够近似得到满足(重复抽样)。但如果研究对象是小群体,这时总体单位不多,一般只有几十个。假定总体只有两类,其中K 个成功类,(N-K )个为失败类,这时如果从总体中抽取一容量为n 的样本,那么成功的概率将不再恒定,也就是二相分布所要求的独立试验的条件不再被满足,而超几何分布将适合于这种 形式:P(X=k)= K=0,1,…超几何概型,例:产品检验。有N 个产品(其中有K 个合格品)从N 个产品中取n 个检验,求n 中有X 个合格品的概率。 (即X ——合格品个数) 不回置抽样! 期望:E (X )=nK/N=np 方差:D(X)=npq(N-n)/(N-1) 当研究对象是小群体,并且采用不回置抽样时,成功的概率将不再恒定,也就是二项分布所要求的独立试验的条件不再被满足,而超几何分布将适合于这种情况的研究。 当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,可用二项分布来近似超几何分布。一般当n/N ≤0.1时,这种近似就是可以采用的。 五、泊松分布 泊松分布是一种描述和分析稀有事件的概率分布。要观察到这类事件,样本含量 n 必须很大 。 例:盒子中装有999个黑棋子,一个白棋子,在一次抽样中,抽中白棋子的概率1/1000 (一)泊松分布的定义与特征 1、定义:若随机变量x(x=k)只取零和正整数值0,1,2,…,且其概率分布为 x=0,1,……(稀有事件出现的次数) 其中λ>0;e 是自然对数的底数(e =2.71828) ,则称 x 服从参数为λ的泊松分布 npq ξ ξ1)(-==k pq k ξ∑-1k pq ξ λ λ-==e x k x P x ! )( (Poisson ‘s distribution),记为P (x;λ) 2、泊松分布重要的特征 平均数和方差相等,都等于常数λ,即 μ=σ2=λ=np 3、泊松分布的图形特征: λ是泊松分布所依赖的唯一参数。 λ值愈小分布愈偏倚,随着λ的增大,分布趋于对称。 当λ= 20时分布接近于正态分布;当λ=50时,可以认为波松分布呈正态分布。 在实际工作中,当λ≥20时就可以用正态分布来近似地处理泊松分布的问题 (二)泊松分布的概率计算 泊松分布的概率计算依赖于参数λ,只要参数λ确定了,把k =0,1,2,…代入公式即可 求得各项的概率。但是在大多数服从泊松分布的实例中,分布参数λ往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为λ的估计值,将其代替公式中的λ,计算出k = 0,1,2,…时的各项概率。 例:一个合订本共100页,假定每页上印刷错误的,数目X 服从泊松分布(λ=1),计算该合订本中各页的印刷错误都不超过4个的概率。 解:由题目P(x;1). P(X ≤4)=P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)+ P(X=4). 查表求值 =?+?+?+?+? 所求概率为 (?)100=0.0045。 【例】为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如下 经计算得每毫升水中平均细菌数 =0.500,方差S2=0.496。两者很接近, 故可认为细菌数/ml(水) 服从泊松分布。以 =0.500代替公式中的λ,得 (k =0,1,2…) 计算结果如下表。 细菌数的泊松分布 可见细菌数的频率分布与λ=0.5的波松分布是相当吻合的,进一步说明用波松分布 描述单位容积(或面积)中细菌数的分布是适宜的。 注意:泊松分布的应用条件与二项分布相似 (三)泊松分布与二项分布 x x 5.0!5 .0)(-==e k k x P k 泊松定理:设随机变量B(x;n,p)。 当 n 其中λ=np 实际计算中,n ≥10,p ≤0.1,近似效果就较好,而 n ≥ 100, np ≤ 10 时近似效果就很好。 由泊松定理,n 重贝努里试验中稀有事件出现的次数近似地服从泊松分布。 例见:P133,例8.2.3 (四)泊松分布与正态分布的关系 当λ较小时, Piosson 分布呈偏态分布,随着λ增大,迅速接近正态分布,当λ ≥20 时,可以认为近似正态分布。 第三节 常用连续型随机变量的理论分布 一、正态分布 正态分布是最重要的概率分布。因为: 第一,许多自然现象与社会现象,都可用正态分布加以叙述; 第二,许多概率分布以正态分布为其极限; 第三,许多统计量的抽样分布呈现正态分布。 因此,许多统计分析方法都是以正态分布为基础的 (一)正态分布的概率函数 若连续型随机变量x 的概率分布密度函数为 其中μ为平均数,σ2为方差,则称随机变量x 服从正态分布(normal distribztion),记为x ~N (μ,σ2)。相应的概率分布函数为 标准正态分布的三个常用概率 2 22)(21)(σμπσ--=x e x f ? ∞---=x x dx e x F 2 22)(21)(σμπσ (二) 正态分布的特征 1. 正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x =μ; 2. f (x ) 在x =μ处达到极大,极大值 ; 3. f (x )是非负函数,以x 轴为渐近线,分布从-∞至+∞; 4. 曲线在x =μ±σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞) 区间上是下凸的,在[μ-σ,μ+σ]区间内是上凸的; 5. 正态分布有平均数μ和标准差σ两个参数。μ是位置参数,σ是变异度参数。 6. 分布密度曲线与横轴所夹面积为1,即: (三)标准正态分布 正态分布是依赖于参数μ和σ的一簇分布。将一般的N (μ,σ2)转换为μ= 0,σ2=1的正态分布,应用就方便了。 称μ=0,σ2=1的正态分布为标准正态分布 标准正态分布的概率密度函数及分布函数分别记作φ(z)和Φ(z),得: 2 2 2 1 ) ( z e z - = π ? 68.26% 95.46% 99.74% 121)(2 22)(==+∞<<-∞--∞+∞-? dx e x P x σμπ σ 随机变量z 服从标准正态分布,记作z ~N (0,1)。 对于任何一个服从正态分布N (μ,σ2)的随机变量x ,都可以通过标准化变换: z=(x-μ)/σ 将其变换为服从标准正态分布的随机变量z 。z 称为标准正态变量或标准正态离差 (四)正态分布的概率计算 1.标准正态分布的概率计算 设z 服从标准正态分布,则z 在[z1,z2 )何内取值的概率为: =Φ(z2)-Φ(z1) 而Φ(z1)与Φ(z2)可由附表查得 【例】 已知z -N(0,1),试求: (1) P (z <-1.64)=? (2) P (z ≥2.58)=? (3) P (|z |≥2.56)=? (4) P (0.34≤z <1.53) =? 关于标准正态分布,以下几种概率应当熟记: P (-1≤z <1)=0.6826 P (-2≤z <2)=0.9546 P (-3≤z <3)=0.9974 P (-1.96≤z <1.96)=0.95 P (-2.58≤z <2.58)=0.99 z 在上述区间以外取值的概率分别为: P (|z |≥1)=2Φ(-1)=1- P (-1≤z <1) =1-0.6826=0.3174 P (|z |≥2)=2Φ(-2) =1- P (-2≤z <2)=1-0.9545=0.0455 P (|z |≥3)=1-0.9973=0.0027 P (|z |≥1.96)=1-0.95=0.05 P (|z |≥2.58)=1-0.99=0.01 2.一般正态分布的概率计算 正态分布密度曲线和横轴围成的区域,其面积为1,是一个必然事件。 若随机变量x 服从正态分布N (μ,σ2),则x 的取值落在任意区间[x1, x2)的概率, 记作P (x1≤ x <x2),等于这部分曲边梯形面积。即: dz e z z z ? ∞ - - = 2 2 1 2 1 ) ( π φ dx e x x x P x x x ? --=<≤212 22)(2121)(σμπσ 对上式作变换z =(x -μ)/σ,得dx =σdz ,故有 其中,z 1=(x 1-μ)/σ,z 2=(x 2-μ)/σ) 这表明服从正态分布N (μ,σ2)的随机变量x 在[x1,x2)内取值的概率,等于服从标准正态分布的随机变量z 在[(x1-μ)/σ, (x2-μ)/σ)内取值的概率。因此,计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率表的方法求得概率了。 【例】设x 服从μ=30.26,σ2=5.102的正态分布,试求P (21.64≤x <32.98)。 令 则z 服从标准正态分布,故 =P (-1.69≤z <0.53) =Φ(0.53)-Φ(-1.69) =0.7019-0.04551=0.6564 关于一般正态分布,以下几个概率是经常用到的。 P (μ-σ≤x <μ+σ)=0.6826 P (μ-2σ≤x <μ+2σ) =0.9546 P (μ-3σ≤x <μ+3σ) =0.9974 P (μ-1.96σ≤x μ+1.96σ)=0.95 P (μ-2.58σ≤x μ+2.58σ)=0.99 3、正态分布分位点计算 正态分布的分位点的定义 标准正态分布 密度函数图形为 图中的点 称为标准正态分布的 的分位点,相当于已知 ) ( ) ( 1 2 2 1 2 1 2 2 1 z z d e z z z Φ - Φ = = ? - π du e du e x x x P x x u x x x σπ σ πσσ μσ μσμ? ? -----==<≤/)(/)(2 12)(2121221 2 2 2121)(αx )%1(α -αα αα-=≤=Φ1)()(x X p x 求其中的 4、单侧概率与双侧概率 统计学中,把随机变量 x 落在区间(μ-k σ,μ+k σ)之外的概率称为双侧(两尾)概率, 记作α。 对应于双侧概率可以求得随机变量x 小于μ-k σ或大于μ+k σ的概率,称为单侧 概率,记作α/2。 如,x 落在(μ-1.96σ,μ+1.96σ)之外的双侧概率为0.05,而单侧概率为0.025。即 P (x <μ-1.96σ)= P (x >μ+1.96σ)=0.025 x 落在(μ-2.58σ,μ+2.58σ)之外的双侧概率为0.01,而单侧概率 P (x <μ-2.58σ)= P (x > μ+2.58σ)=0.005 (五)二项分布及泊松分布与正态分布的关系 对于二项分布,在n →∞,p →0,且np =λ(较小常数)情况下,二项分布趋于泊松分 布。在这种场合,泊松分布中的参数 λ用二项分布的np 代之;在n →∞,p →0.5时,二项分布趋于正态分布。在这种场合,正态分布中的 μ、σ2用二项分布的np 、npq 代之。在实际计算中,当p <0.1且n 很大时 , 二项分布可由泊松分布近似; 当p >0.1且n 很大时 ,二项分布可由正态分布近似。对于泊松分布,当λ→∞时,泊松分布以正态分布为极限。在实际计算中,当λ≥20时,用泊松分布中的λ代替正态分布中的μ及σ2,即可由后者对前者进行近似计算。 二、抽样分布与中心极限定理 研究总体与从中抽取的样本之间的关系是统计学的中心内容。对这种关系的研究可 从两方面着手: 一是从总体到样本,这就是研究抽样分布(sampling distribution)的问题; 二是从样本到总体,这就是统计推断(statistical inference)问题 (一)抽样分布的含义与无偏估计量 1、抽样分布的含义:统计推断是以总体分布和样本抽样分布的理论关系为基础的。 由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量也将随样本的不同而有所不同。因而样本统计量也是随机变量,也有其概率分布,我们把统计量的概率分布称为抽样分布。 2、无偏估计 在统计学上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。 设有一N =3的总体,具有变量3,4,5;求得μ=4,σ2=0.6667, σ=0.8165 现以n=2作独立的回置抽样,总共得Nn =32=9个样本。 抽样结果列入下表: x 从上表的资料可以求出: 样本平均数的平均数μx =4 样本方差的平均数μS2=0.6667=σ2 样本标准差的平均数μS =0.6285≠0.8165=σ 所以,惟有样本标准差s 的平均数不是总体标准差σ的无偏差估计值。其余两个参数为无偏差估计值。 (二)样本平均数的抽样分布 1、样本平均数抽样分布的含义及其参数 设有一个总体 ,总体 平均数为μ,方差为σ2,总体中各变数为xi ,将 此总体称为原总体。现从这个总体中随机抽取含量为n 的样本,样本平均数记为 。可以设想,从原总体中可抽出很多甚至无穷多个含量为n 的样本。 如果从容量为N 的有限总体抽样,若每次抽取容量为n 的样本,那么一共可以得到 个样本(所有可能的样本个数)。 抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。 如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。 由平均数构成的新总体的分布,称为平均数的抽样分布。 随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。 由这些样本算得的平均数与原总体平均数μ相比往往表现出不同程度的差异。这种 差异是由随机抽样造成的,称为抽样误差(sampling error)。由样本平均数构成的总体称为样本平均数的抽样总体,其平均数和标准差分别记为 和 。 是样本平均数抽样总体的标准差,简称标准误(standard error),它表示平均数抽样 误差的大小。统计学上已证明总体的两个参数与x 总体的两个参数有如下关系: 2、中心极限定理 设有一个N =4的有限总体,变数为2,3,3,4。根据μ=Σx /N 和σ2=Σ(x -μ)2/N 求得该总体的μ、σ2、σ为: μ=3,σ2=1/2,σ=1/21/2=0.707 x μx σ x σ μ μ=x n x σσ= 从有限总体作回置随机抽样,所有可能的样本数为Nn 其中n 为样本含量 。以上述 总体而论,如果从中抽取n =2的样本,共可得 42=16 个样本;如果样本含量n 为4,则一共可抽得44=256个样本。分别求这些样本的平均数 ,其次数分布如下表所示。 在n =2的试验中,样本平均数抽样总体的平均数、方差与标准差分别为 =4/16=1/4=(1/2)/2= σ2/n 表 N =4, n =2和n=4时的次数分布 同理,可得n =4时: 验证了 的正确性。 也可以将表中两个样本平均数的抽样总体作次数分布图。 由以上模拟抽样试验可以看出,虽然原总体并非正态分布,但从中随机抽取样本,即使样本含量很小,样本平均数的分布却趋向于正态分布形式。随着样本含量 n 的增大,样本平均数的分布愈来愈从不连续趋向于连续的正态分布。当n >30时, 的分布就近似正态分布了。X 变量与 变量概率分布间的关系可由下列两个定理说明: μμ====∑ 316/0.48/n x N x f 1616/48148/)()(22222-= -=-=∑∑ ∑n n n x x N N x f x f N x f μσn x x σ σσ====2/214/12μ μ===3256/768x n x /4/)2/1(8/1256/322 2σσ====n x x /,σσμμ== (1) 若随机变量x 服从正态分布N (μ,σ2);x1、x2、…、xn ,是由x 总体得来的随机样本,则统计量 =Σx /n 的概率分布也是正态分布,且有 , 即服从正态分布N (μ,σ2/n )。 (2) 若随机变量x 服从平均数是μ,方差是σ2的分布(不是正态分布); x1、x2、…、xn ,是由此总体得来的随机样本,则统计量 =Σx /n 的概率分布,当n 相当大时逼近正态分布N (μ,σ2/n )。这就是中心极限定理。 中心极限定理告诉我们:不论x 变量是连续型还是离散型,也无论x 服从何种分布,一般只要n >30,就可认为 的分布是正态分布。若x 的分布不很偏斜,在n >20时 , 的分布就近似于正态分布了 由中心极限定理知,只要样本容量适当大,不论总体分布形状如何,其 的分布都可看 作为正态分布,且具平均数 和方差 。在实际应用上,如n >30就可以应用这 一定理。 平均数的标准化分布是将上述平均数 x 转换为z 变数。 3、标准误 标准误(平均数抽样总体的标准差) 的大小反映样本平均数 的抽样误 差的大小,即精确性的高低。标准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之, 小,样本平均数的精确性高。 的大小与原总体的标准差σ成正比,与样本含量n 的平方根成反比。从某特定总体抽样,因为σ是一常数,所以只有增大样本含量才能降低样本平均数 的抽样误差。 在实际工作中,总体标准差σ往往是未知的,因而无法求得 。此时,可用样本标准差S 估计σ。于是,以 估计 。记 为 , 称作样本标准误或均数标准误。样本标准误 是平均数抽样误差的估计值。若样本中各观测值为 x1、x2、…、xn ,则 注意:样本标准差与样本标准误是既有联系又有区别的两个统计量。 二者的区别是样本标准差S 是反映样本中各观测值的变异程度,它的大小说明了 对该样本代表性的强弱。 样本标准误是样本平均数 的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。 (二) 两个独立样本平均数差数的分布 假定有两个正态总体各具有平均数和标准差为 , 和 , ,从第一个总体随机抽取n 1个观察值,同时独立地从第二个总体随时机抽取n 2个观察值。这样计算出样本平均数和标准差 ,s 1和 ,s 2。 n x x z x σ μ σ μ ) ( ) ( - = - = μ2σ)1(/)()1()(222--=--== ∑∑ ∑n n n x x n n x x n S S x 1μ2μ1σ2σ1y 2 y 从统计理论可以推导出其样本平均数的差数( )的抽样分布,具有以下特性 (1) 如果两个总体各作正态分布,则其样本平均数差数 ( )准确地遵循正态分布律,无论样本容量大或小,都有N ( , )。 (2) 两个样本平均数差数分布的平均数必等于两个总体平均数的差数,即 (3) 两个独立的样本平均数差数分布的方差等于两个总体的样本平均数的方差总和,即 其差数标准差为: 这个分布也可标准化,获得z 值 小结: ● 若两个样本抽自于同一正态总体,则其平均数差数的抽样分布不论容量大小亦作正 态分布具: ● 若两个样本抽自于同一总体,但并非正态总体,则其平均数差数的抽样分布按中心 极限定理在n 1和n 2相当大时(大于30)才逐渐接近于正态分布。 ● 若两个样本抽自于两个非正态总体,当n 1和n 2相当大、而 与 相差不太远时,也可近似地应用正态接近方法估计平均数差数出现的概率,当然这种估计的可靠性得依两总体偏离正态的程度和相差大小而转移。 (三)二项总体的抽样分布 1、 二项总体的分布参数(成数) 平均数: 方差: 标准差: 2、 样本平均数(成数)的抽样分布 从二项总体进行抽样得到样本,样本平均数(成数)抽样分布的参数为: 平均数: n n y y z 2 2 2 1 2 1 2 1 2 1 ) ( ) ( σ σ μ μ + - - - = 21y y -21y y -2 1y y -μ221y y -σ2 121μμμ-=-y y 2 221212222121n n y y y y σσσσσ+=+=-n n y y 2 2 2121 21σσσ+=-n n y y y y 2 11102121+ ==--σσμ,2 1σ 22σp =μpq p p = -=)(12σpq p p =-=)(1σp y =μ 方差: 标准误: (四)不重复抽样的修正系数 前所讲的抽样分布和抽样平均误差的计算公 式,都是就重复抽样而言的。可以证明,采用不重复抽样时,平均数和比例的抽样平均误差应为: 这个系数称为不重复抽样修正系数。当N 很大时, (其中:n/N 为抽样 比例)。 实际中,当抽样比例很小时,(一般认为小于5%),不重复抽样的抽样误差常采用重复抽样的公式计算。 三、t 分布 1、t 分布的定义: 若x ~N(μ, σ2), 则 ~N (μ, σ2/n )。 将随机变量 标准化得: ,则z ~N (0,1)。 当总体标准差σ未知时, 以样本标准差S 代替σ所得到的统计量 记为t 。在计算 时,由于采用S 来代替σ,使得t 变量不再服从标准正态分布,而是服从t 分布(t -distribztion)。它的概率分布密度函数如下: 式中,t 的取值范围是(-∞,+∞); df=n-1为自由度。 Γ- 函 数 自由度df(degree of freedom )的含义 df=k=n-1 T 分布密度曲线 n pq y =2σn p p n pq y )1(-==σ) 1()1()1()1()() N n - 1(n )1() x (22N n n p p N n N n P P P N n N n --≈---=≈--=σσσσN n N n N -≈--112 1 2)1()2/(]2/)1[(1)(+-+Γ+Γ=df df t df df df t f π函数的定义:-Γ()? +∞ --=Γ0 1dx e x r x r () .,函数的定义域:∞+∞--Γ 2、t 分布的图形特征 t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布。 (1)t 分布受自由度的制约,每一个自由度都有一条t 分布密度曲线。 (2)t 分布密度曲线以纵轴为对称轴,左右对称,且在t =0时,分布密度函数取得最大值。 (3)与标准正态分布曲线相比,t 分布曲线顶部略低,两尾部稍高而平。df 越小这种趋势越明显。df 越大,t 分布越趋近于标准正态分布。 3、 分布分位点计算 在统计中经常对给定的 分布求它的分位点而不是求其概率。其分位点的定义与标准正态分布相同。 四、 分布(卡方分布) 分布是统计中经常用到的一个分布,通常是由 n 个相互独立的标准正态分布的平方和得到。它的概率密度函数为 假设从正态总体中抽取k 个独立样本z 12 、z 22 、z 32 、…、zk 2 ,则定义它们的和为x 2 , )(n t )(n t {}α α=>)()(n t n t p )(2n χ)(2n χ???????≤>=--Γ0 0 0 21 )(2122) 2(x x e x x f x n n n ,, x 2具有自由度df=n-1的连续型变量的分布,不同的自由度的x 2分布曲线不同。 附表7列出了各种自由度下的x 2分布的一尾(右尾)概率。例x 0.052(2)=5.99,x 0.012(2)=9.21。 x 2分布的特征: 1.x 2分布于区间[0,∞+); 2.x 2分布的偏斜度随自由度降低而增大,df=1时,曲线以纵轴为渐进线; 分布密度的图形随自由度n 的不同而变化,当n 很大时接近正态分布 分布分位点计算 在统计中经常对给定的 分布求它的分位点而不是求其概率。其分位点的定 义与标准正态分布相同。 五、 F 分布 1、F 分布的定义: 设从一正态总体N (μ,σ2)中随机抽取样本容量为n 1和 n 2的两个独立样本,其样 本方差为s 12和s 22,则定义s 12/ n 1和s 22 / n 2的比值为F 。此F 值具有s 12的自由度df1=n1-1和s 22的自由度df2=n2-1 。如果对一个正态总体特定的df1和df2进 ∑ ∑ = - = = + + = k i k i k x z z z z x 1 1 2 2 2 2 2 2 1 2 ) ( σ μ . )(2 n χ)(2n χ)(2n χ{} α χχα=>)()(2 2n n p 行 一系列随机抽样,则所有可能的F 值构成一个F 分布。F 分布记作F ( m , n )。m 、n 分别表示df1、df2。 分布的概率分布密度 分布也是统计中经常用到的一个分布,通常是由相互独立的自由度分别为m 和n 的 , 分布的函数得到。它的概率密度函数为: 2、F 分布的特征 (1)F 的取值区间[0,∞); (2)F 分布曲线仅决定于df1和df2 。df1=1或2时,曲线为反J 型;当df1≥3时,转为偏态曲线。 F 分布概率查附表8,如df1=4 ,df2=10时,F0.05=3.48, F0.01=5.99,为所有F 值大 于3.48的概率为0.05,大于5.99的概率为0.01 。 F 分布 3、 分布分位点计算 在统计中经常对给定的 分布,我们经常需要求它的分位点而不是求其概 率。其分位点的定义与前面相同。 ),(n m F ),(n m F )(2n χ)(2m χ???????<≥+Γ?Γ+Γ=+--000)1())(()2 ()2(2()(212 x x x n m x n m n m n m n m x f n m m ,,),(n m F {}α α=>),(),(n m F n m F p 几个重要的离散型随机变量的分布列 井 潇(鄂尔多斯市东胜区东联现代中学017000) 随着高中新课程标准在全国各地的逐步推行,新课标教材越来越受到人们的关注,新教材加强了对学生数学能力和数学应用意识的培养,而概率知识是现代公民应该具有的最基本的数学知识,掌握几种常见的离散型随机变量的分布列是新课标教材中对理科学生的最基本的要求,也是高考必考的内容,先结合新教材,具体谈一谈几个重要的离散型随机变量分布列及其简单的应用。 下面先了解几个概念: 随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量就叫随机变量.随机变量常用希腊字母,ξη等表示. 离散型随机变量:对于随机变量可能取的值,我们可以按一定次序一一列出,这样的随机变量就叫离散型随机变量. 离散型随机变量的分布列:一般地设离散型随机变量ξ可能取得值为 123,,,...,,...,i x x x x ξ取每一个值()1,2,3,...i x i =的概率()i i P x p ξ==,则称表 为随机变量ξ的概率分布,简称ξ的分布列. 由概率的性质可知,任一离散型随机变量的分布列都有以下两个性质 (1)0,1,2,3,...i P i ≥= (2)123...1P P P +++= 离散型随机变量在某个范围内取值的概率等于它取这个范围内各个值的概率的和. 一、 几何分布 在独立重复试验中,某事件第一次发生时所做试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示第k 次独立重复试验时事件第一次发生。如果把第k 次试验时事件A 发生记为k A 、事件A 不发生记为k A ,()() ,k k P A p P A q ==,那么 ()()1231...k k P k P A A A A A ξ-==,根据相互独立事件的概率的乘法公式得 ()()()()()()1231...k k P k P A P A P A P A P A ξ-==()11,2,3,...k q p k -==。 于是得到随机变量ξ的概率分布 §3 连续型随机变量 除了离散型随机变量之外,还有非离散型的随机变量,这些随机变量的取值已不再是有限个或可列个。在这类非离散型随机变量中,有一类常见而重要的类型,即所谓连续型随机变量。粗略地说,连续型随机变量可以在某特定区间内任何一点取值。例如某种树的高度;测量的误差;计算机的使用寿命等等都是连续型随机变量。对于连续型随机变量,不能一一列出它可能取值,因此不能像对离散型随机变量那样用它取各个可能值的概率来描述它的概率分布,而是要考虑该随机变量在某个区间上取值的概率,我们是用概率密度函数来研究连续型随机变量的。 一. 概率密度和连续型随机变量定义: 对于随机变量X ,如果存在非负可积函数 ()()f x x -∞<<+∞,使得对于任意实数, ,()a b a b <都有 {}()b a P a X b f x dx <<= ? , 则称X 为连续型随机变量;称()f x 为X 的概率密度函数,简称概率密度或密度. 由定义可知,分布密度()f x 具有如下基本性质: (1).()0()f x x ≥-∞<<+∞; (2). ()()1f x dx P X +∞ -∞ =-∞<<+∞=? . 这两条性质的几何意义是:概率分布密度曲线不在x 轴下方,且该曲线与x 轴所围的图形面积为1。性质(1)、(2)可以作为判定一个函数是否可以作为一个连续型随机变量的分布密度的条件。 对于连续型随机变量X 可以证明,它在某一点a 处取值的概率为零,即 对于任意实数a ,有()0P X a ==. 即研究X 在某一点处取值的概率是没有什么实际意义的。从而可知,研究X 在某区间上取值的概率时,该区间含不含端点,不影响概率值。即 (3).对于任意实数, ,()a b a b <都有 {}{}{}{}()b a P a X b P a X b P a X b P a X b f x dx <<=≤<=<≤=≤≤=? 【例1】 设X 是连续型随机变量,已知X 的概率密度为 其中λ为正常数. 试 确定常数A . 几种常用的连续型随机变量 给出一个新概念:广义概率密度函数。 设连续型随机变量ξ的概率密度函数为φ(x ), 那么任何与之成正比的函数f (x )∝φ(x ), 都叫做ξ的广义概率密度函数, 或者说, 一个函数f (x )是ξ的广义概率密度函数, 说明存在着一实数a , 使得 φ(x )=af (x ) (1) 而知道了广义概率密度函数, ξ的概率密度函数就可以根据性质1)(=?+∞ ∞ -dx x ?, 求出 将(1)式代入得: 1)()(??+∞ ∞ -+∞ ∞ -==dx x af dx x ? 则?∞+∞ -= dx x f a )(1 因此, 知道了广义概率密度函数就等于知道了一般的概率密度函数, 我们只需关心函数的形状就可以了解概率密度的性质了. 因此也不必关于那个常数是什么. 4.4 指数分布 指数分布的概率密度函数为 ?? ?>=-其它 )(x e x x λλ? 它的图形如下图所示: 它的期望和方差如下计算: () λ λ λ?ξλλλλλ1 1 )(0 =- =+-=-= = = ∞ +-∞+-∞ +-+∞ -+∞ -+∞ ∞ -????x x x x x e dx e xe e xd dx e x dx x x E () 2 20 202 2 2 2 2 2)(|λξλ λ?ξλλλλ= = +-=-= = = ????∞+-∞+-+∞ -+∞ -+∞∞ -E dx xe e x e d x dx e x dx x x E x x x x 2 2 2 221 1 2 )(λ λ λ ξξξ= - = -=E E D 指数分布常用来作为各种"寿命"分布的近似. 4.5 Γ-分布 如果一个随机变量ξ只取正值, 且在正半轴的广义概率密度函数的形式是x 的某次方x k 乘上指数函数e -λx , 即 ?? ?>->>=-其它 ) 0,1(0)(λλk x e x x f x k 那么就称ξ服从Γ-分布了. 上式中之所以要求k >-1, λ>0, 是因为广义积分 ?? +∞ -+∞ ∞ -= )(dx e x dx x f x k λ 只有在这种条件下才收敛. 此外, 传统上为了方便起见, 用另一个常数r =k +1, 因此广义概率密度函数写为 ?? ?>>>=--其它 ) 0,0(0)(1λλr x e x x f x r 而真实的概率密度函数φ(x )=af (x ), 可以给出常数a 由下式计算: ?∞ +--= 11 dx e x a x r λ 这样, 计算的关键就是要计算广义积分 ?+∞ --0 1dx e x x r λ, 作代换t =λx , 则x =t /λ, dx =dt /λ, 则???+∞ --+∞ --+∞ --= ? ?? ? ?=0 101 011 1 dt e t dt e t dx e x t r r t r x r λ λ λλ, 问题就转成怎样计算广义积分? +∞ --0 1dt e t t r , 这个积分有一个参数r >0, 在r 为一些特定 的参数时, 如当r =1时, 上面的广义积分还是可以计算的, 但是当r 为任意的正实数时, 此广 义积分就没有一般的公式, 一般的原函数表达式. 在这种情况下数学家常用的办法就是定义一个新的函数. 比如说, 在中学学的三角函数就无法用一个加减乘除的公式表示, 因此就发明了sin , cos 这样的记号来代表三角函数. 同样, 上面的广义积分的取值只依赖于参数r , 每给定一个r 值就有一个积分值与之对应, 因此也可以定义一个函数, 叫Γ-函数, 定义为 2-3随机变量及其分布 -- HW) T数字特征11 …. --- L-W Array「(两点分布〕 5店殊分布列)--憊几何分祠 -(二项分利 十[并件相互独立性)一価立重复试劇 5J ~(条件概率) ”、r<正态分布密度曲绚 f正态分布)一 要点归纳 一、离散型随机变量及其分布列 1.⑴随机变量:在随机试验中,我们确定了一个对应关 系,使得每一个试验结果都用一个确定的数字表示?在这个对应关系下,数字随着试验结果的变化而变化.像这种随着试验结果变化而变化的变量称为随机变量?通常用字母X, Y, E, n等表示. (2) 离散型随机变量:所有取值可以一一列出的随机变量称为离散型随 机变量. (3) 离散型随机变量的分布列: 一般地,若离散型随机变量 X可能取的不同值为X i, X2…,X i,…X n,X取每一个值X i(i = 1,2,…,n)的概率 P(X= X)= p i,以表格的形式表示如下: X的分布列.有时为了简单起见,也用等式P(X = X i) = p i, i = 1,2,…,n表示X的分布列. (4)离散型随机变量的分布列的性质: ①P i>0,i = 1,2,…,n; n ②P i = 1. i = 1 (5)常见的分布列: 两点分布:如果随机变量X 的分布列具有下表的形式,则 称X 服从两点分布,并称p = P(X = 1)为成功概率. 两点分布又称 0- 1分布,伯努利分布. 超几何分布:一般地,在含有 M 件次品的N 件产品中,任取 X 件次品,则事件{X = k }发生的概率为 P(X = 其中 m= min { M , n },且 n W N , M < N , n , M , N € N *.如 果随机变量X 的分布列具有上表的形式,则称随机变量 X 服从超几何分布. 2 .二项分布及其应用 (1)条件概率:一般地,设 A 和B 是两个事件,且 P(A)>0, p / AB) 称P(BA) = P ((A )为在事件A 发生的条件下,事件B 发生 的条件概率.P(B|A)读作A 发生的条件下B 发生的概率. ⑵条件概率的性质: ① 0 < P(BA)< 1; ② 必然事件的条件概率为1,不可能事件的条件概率为0; ③ 如果 B 和C 是两个互斥事件,则 P(B U C|A)= P(B|A) + P(C|A). (3) 事件的相互独立性:设 A, B 为两个事件,如果 P(AB)= P(A)P(B),则 称事件 A 与事件B 相互独立?如果事件 A 与B 相互独立,那么 A 与-,-与B ,-与-也都相互独立. (4) 独立重复试验:一般地,在相同条件下重复做的 n 次试 验称为n 次独立重复试验. c M c N-/i c N k = 0, 1, 2, ,m,即 n 件,其中恰有 k)= 离散型随机变量及其分布 知识点一:离散型随机变量的相关概念; 随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机 变量随机变量常用希腊字母、等表示 离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随 机变量叫做离散型随机变量。若 是随机变量, a b ,其中a 、b 是常数,则 也 是随机变量 连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的 变量就叫做连续型随机变量 离散型随机变量与连续型随机变量的区别与联系:离散型随机变量与连续型随机变 量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列 出,而连续性随机变量的结果不可以 --------------------- 列出 离散型随机变量的分布列:设离散型随机变量可能取的值为X i 、X 2 X i 取每一 个值X i i 1,2, 的概率为P( X ) p ,贝U 称表 为随机变量的概率分布,简称的分布列 知识点二:离散型随机变量分布列的两个性质; 任何随机事件发生的概率都满足:0 P(A) 1,并且不可能事件的概率为0,必然事 件的概率为 1.由此你可以得出离散型随机变量的分布列都具有下面两个性质: (1) P i 0, i 1,2, ; (2) RP.L 1 特别提醒:对于离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的 概率的和即P( 知识点二:两点分布: 若随机变量X 的分布列: 特别提醒:(1) 若随机变量X 的分布列为两点分布,则称X 服从两点分布,而称P(X=1为成 功 率? (2) 两点分布又称为0-1分布或伯努利分布 ⑶两点分布列的应用十分广泛,如抽取的彩票是否中奖;买回的一件产品是 否为正 品;新生婴儿的性别;投篮是否命中等等;都可以用两点分布列 来研究? 知识点三:超几何分布: 一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则 C k C n k X k ) P( X k ) P( X k 1) L 则称X 的分布列为两点分布列 第二章 随机变量及其数字特征 一、教学要求 1. 理解随机变量的概念,掌握离散型和连续型随机变量的描述方法,理解概率分布列和概率密度函数的概念和性质; 2. 理解分布函数的概念和性质,会利用概率分布计算有关事件的概率; 3. 会利用分布函数计算离散和连续随机变量函数的数字特征; 4. 熟练掌握退化分布、两点分布、二项分布、几何分布、超几何分布、泊松分布和正态分布、指数分布、均匀分布等常用概率分布及其数字特征的计算和相关概率的求解; 5. 应用公式会求简单随机变量函数的概率分布及数字特征。 二、重点与难点 本章的重点是随机变量概率分布及其性质,常见的几种分布,随机变量函数的分布、数学期望和方差的计算;难点是随机变量函数的分布及数学期望的计算。 §2.1 随机变量及其分布 一、 随机变量 1.引入随机变量的必要性 1)在随机现象中,有很大一部分问题与数值发生关系。如:产品检验问题中,抽样中 出现的废品数;在车间供电问题中某时刻正在工作的车床数;在电讯中,某段时间的话务量等等。 2)有些初看起来与数值无关的随机现象,也常常能联系数值来描述。如: 掷硬币问题中,记出现正面时为“1”,出现反面时为“0”。 注:这些例子中,试验的 结果能用一个数字X 来表示,这个数X 是随着试验的结果的不同而变化的,也即它是样本点的一个函数,这种量以后称为随机变量。 2.引例 先看一个具体的例子: 例1 袋中有3只黑球,2只白球,从中任意取出3只球,观察取出的3只球中的黑球的个数. 我们将3只黑球分别记作1,2,3号,2只白球分别记作4,5号,则该试验的样本空间为 ()()()()()()()()()()123124125134135145234235245345?? ? ??? Ω=? ??? ??? ? ,,,,,,,,,,,,,,,,,,,, 我们记取出的黑球数为 X ,则 X 的可能取值为1,2,3.因此, X 是一个变量. 但是, X 取什么值依赖于试验结果,即 X 的取值带有随机性,所以,我们称 X 为随机变量. 第七讲 连续型随机变量(续)及 随机变量的函数的分布 3. 三种重要的连续型随机变量 (1)均匀分布 设连续型随机变量X 具有概率密度 )5.4(,, 0,,1 )(??? ??<<-=其它b x a a b x f 则称X 在区间(a,b)上服从均匀分布, 记为X~U(a,b). X 的分布函数为 )6.4(. , 1,, ,,0)(???? ???≥<≤--<=b x b x a a b a x a x x F (2)指数分布 设连续型随机变量X 的概率密度为 )7.4(, , 0,0,e 1)(/?????>=-其它x x f x θ θ 其中θ>0为常数, 则称X 服从参数为θ的指数分布. 容易得到X 的分布函数为 )8.4(. , 0,0,1)(/?? ?>-=-其它x e x F x θ 如X 服从指数分布, 则任给s,t>0, 有 第二章 随机变量及其分布 §4 连续型随机变量 及其概率密度 1 =2 P{X>s+t | X > s}=P{X > t} (4.9) 事实上 }. {e e e )(1)(1}{}{} {)} (){(}|{//)(t X P s F t s F s X P t s X P s X P s X t s X P s X t s X P t s t s >===-+-=>+>= >>?+>=>+>--+-θ θθ 性质(4.9)称为无记忆性. 指数分布在可靠性理论和排队论中有广泛的运用. (3)正态分布 设连续型随机变量X 的概率密度为 ) 10.4(,,e 21)(2 22)(∞<<-∞= -- x x f x σμσ π其中μ,σ(σ>0)为常数, 则称X 服从参数为 μ,σ的正态分布或高斯(Gauss)分布, 记为 X~N(μ,2σ). 显然f(x)≥0, 下面来证明 1d )(=? +∞ ∞ -x x f 令t x =-σμ/)(, 得到 dx e dx e t x 2 2)(22 22121- ∞ +∞ --- ∞ +∞ -? ? = π σ πσμ . 1d 21d 21 ) 11.4(π 2d d e ,, d d ,d e 2 2)(20 2 22 /)(2 2 /2 2 22 222== ====? ??? ? ? ?∞ ∞ -- ∞ ∞ ---∞ - +∞∞-+∞ ∞ -+-∞∞ --x e x e r r I u t e I t I t x r u t t π σ πθσ μπ 于是 得转换为极坐标则有记f(x)具有的性质: f (x )的图形: 1.5 0.5 连续型随机变量的分布 (一)连续型随机变量及其概率密度函数 1.定义:对于随机变量X 的分布函数 F(X) ,若存在非负函数f(x), 使对于 任意的实数 x,有F ( x)x f(x) 称为 X f (t)dt ,则称X为连续性随机变量, 的概率密度函数,简称概率密度。 注: F(x)表示曲线下x 左边的面积,曲线下的整个面积为1。 2 .密度函数f(x) 的性质:注: f( x)不是概率。 1) f( x)≥ 0 + f ( x) dx = 1 2) ò-x 2 3)P{x 1 < X ? x 2 }òx1 f (x) dx = F (x 2 ) - F (x 1 ) 特别地,连续型随机变量在某一点的概率为零,即 P{ X = x} = 0. (但 { X=x} 并不一定是不可能事件) 因此P(a≤X ≤ b)= P(a< X 江苏科技大学 毕业论文(设计) 题目:连续型随机变量在实际生活中的应用 姓名:顾苗 学号:1140503102 教学院:数理学院 专业班级:11级统计一班 指导教师:王康康 完成时间:2015年06月10日 二零一伍年六月 连续型随机变量在实际生活中的应用Continuous random variables applied in real life 江苏科技大学毕业设计(论文) 江苏科技大学 毕业设计(论文)任务书 学院名称:数理学院专业:统计学 学生姓名:顾苗学号:1140503102 指导教师:王康康职称:讲师 江苏科技大学毕业设计(论文) 毕业设计(论文)题目: 连续型随机变量在实际生活中的应用 一、毕业设计(论文)内容及要求(包括原始数据、技术要求、达到的指标和应做的实验等) 连续型随机变量在现实生活中有广泛的应用,许多物理过程和社会现象均可以由各种常见的随机过程来刻画。如泊松过程、正态过程、马氏过程等等,其应用非常广泛。在实际运用时,我们考虑它们在各种经济模型中的应用和计算,它们种类繁多,形式各异。具有很强的现实意义。 1、给出连续型随机变量的基本概念。 2、给出几种常见的连续型随机变量的理论意义。 3、给出几种常见的连续型随机变量在各种经济模型中的应用。 二、完成后应交的作业(包括各种说明书、图纸等) 1、至少6000字以上的论文 2、教师指定阅读的外文文献原文 3、指定外文文献的译文6000字以上 三、完成日期及进度 2015.2.25~2015.3.16 文献检索与资料收集; 2015.3.16~2015.4.12 文献阅读及撰写开题报告; 2015.4.12~2015.5.8 论文构思与内容; 2015.5.8~2015.5.24 撰写论文; 2015.5.24~2015.6.9 论文评阅及答辩。 连续型随机变量及其分布 知识要点 1.分布函数 随机变量的分布可以用其分布函数来表示,随机变量X 取值不大于实数x 的概率 ()P X x ≤称为随机变量X 的分布函数,记作()F x , 即 ()(),F x P X x x =≤-∞<<∞. 2.分布函数()F x 的性质 (1) 0()1;F x ≤≤ (2) ()F x 是非减函数,即当12x x <时,有12()()F x F x ≤; (3) ()0,()1lim lim x x F x F x →-∞ →+∞ ==; (4) ()F x 是右连续函数,即0()()lim x a F x F a →+=. 由已知随机变量X 的分布函数()F x ,可算得X 落在任意区间(,]a b 内的概率 ()()();P a X b F b F a <≤=- 也可以求得 ()()(0)P X a F a F a ==--. 3.联合分布函数 二维随机变量(,)X Y 的联合分布函数规定为随机变量X 取值不大于x 实数的概率,同时随机变量Y 取值不大于实数y 的概率,并把联合分布函数记为(,)F x y ,即 (,)(,),,F x y P X x Y y x y =≤≤-∞<<+∞-∞<<+∞. 4.联合分布函数的性质 (1) 0(,)1F x y ≤≤; (2) (,)F x y 是变量x (固定y )或y (固定x )的非减函数; (3) (,)0,(,)0 lim lim x y F x y F x y →-∞ →-∞ ==, (,)0,(,)1 lim lim x x y y F x y F x y →-∞ →+∞→-∞ →+∞ ==; (4) (,)F x y 是变量x (固定y )或y (固定x )的右连续函数; (5) 121222211211(,)(,)(,)(,)(,)P x X x y Y y F x y F x y F x y F x y <≤<≤=--+. 5.连续型随机变量及其概率密度 设随机变量X 的分布函数为()F x ,如果存在一个非负函数()f x ,使得对于任一实数x ,有 ()()x F x f x dx -∞ =? 成立,则称X 为连续型随机变量,函数()f x 称为连续型随机变量X 的概率密度. 6.概率密度()f x 及连续型随机变量的性质 (1)()0;f x ≥ (2) ()1 f x dx +∞ -∞ =? ; 连续型随机变量的分布 (一)连续型随机变量及其概率密度函数 1.定义:对于随机变量X的分布函数F(X),若存在非负函数f(x),使 对于任意的实数x,有F(W(M,则称X为连续性随机变量,f(x)称 为X的概率密度函数,简称概率密度。 注:尺劝表示曲线下x左边的面积,曲线下的整个面积为 lo 2 .密度函数f(x)的性质:注:不是概率。 1)??f(x)M0?? 2)? j f(x)dx = \ 3)P{x, < X < x2} = ~f(x)(/x =F(x2) -F(Xj) 特别地,连续型随机变量在某一点的概率为零,即 P{X = x} = 0.(但{脸力并不一定是不可能事件) 因此PQWXWb)二P(a 注:iv)与离散型随机变量不同, 易知 ; (3) P(|X|<. 解⑴ P(XW 二①二 (2) P(X> =1- P(XW =1-①= (3) P(|X|< =P 离散型随机变量及其分布 知识点一:离散型随机变量的相关概念; 随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量随机变量常用希腊字母ξ、η等表示 离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。若ξ是随机变量,a b ηξ=+,其中a 、b 是常数,则η也是随机变量 连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量 离散型随机变量与连续型随机变量的区别与联系: 离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出 离散型随机变量的分布列:设离散型随机变量ξ可能取的值为12i x x x ??????、ξ取每一个值()1,2,i x i =???的概率为()i i P x p ξ==,则称表 为随机变量ξ的概率分布,简称ξ的分布列 知识点二:离散型随机变量分布列的两个性质; 任何随机事件发生的概率都满足:0()1P A ≤≤,并且不可能事件的概率为0,必然事件的概率为1.由此你可以得出离散型随机变量的分布列都具有下面两个性质: (1) 01,2,i p i ≥=???,;12(2) 1P P ++ = 特别提醒:对于离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的 概率的和即1()()()k k k P x P x P x ξξξ+≥==+=+ 知识点二:两点分布: 若随机变量X 的分布列: 则称 X 的分布列为两点分布列. 特别提醒:(1)若随机变量X 的分布列为两点分布, 则称X 服从两点分布,而称P(X=1) 为成功率. (2)两点分布又称为0-1分布或伯努利分布 (3)两点分布列的应用十分广泛,如抽取的彩票是否中奖;买回的一件产品是 否为正品;新生婴儿的性别;投篮是否命中等等;都可以用两点分布列来研究. 知识点三:超几何分布: 一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则 离散型随机变量及其概率分布列 第一课时 随机变量 学习目标: 1.离散型随机变量、事件空间的概念。区分离散型随机变量和非离散型随机变量。 2.理解随机变量所表示实验结果的含义,会用合适的数表示试验的结果。 3.会求离散型随机变量:()P X a =、()P X a <、()()P X a P b X a ≤<≤、。 预习:离散型随机变量、离散型随机变量概率分布列的概念。 新课 一、随机试验、随机变量、样本空间 引例:下列2个随机试验,结果能否用数字表达? 1.抛掷一枚质地均匀的骰子一次。 2.抛掷一枚质地均匀的硬币一次。 3.一枚电灯泡的使用寿命是否超过1000小时。 例题1 下列随机试验的结果能否用离散型随机变量表示?若能,请写出随机变量的样本空间和各个随机变量所对应的试验结果。 1.已知5件产品中有2件次品,任意一次抽取2件中含有的次品数。 2.抛掷质地均匀的2枚骰子一次,所得点数之和。 3.某球队在5次点球中,射进的球数。 4.任意抽取一瓶某种标有2500ml 的饮料,其实际量与规定量之差。 5.一枚电灯泡的使用寿命。 6.东圳水库2020年3月1日至7日,每天中午12点的水位。 练习:抛掷两枚骰子各一次,记第一枚骰子掷出的点数与第二枚骰子掷出的点数的差为ξ,试问:“ξ> 4”表示的试验结果是什么? 二、随机变量的概率 例题2 抛掷一枚质地均匀的骰子,数值X 表示抛掷出的点数。 (1)求X 的样本空间; (2)(5)P X =; (3)(5)P X <; (4)(5)P X ≤; (5)(35)P X <≤; (6)抛掷出偶数; 练习:投掷2枚质地均匀的硬币一次,用X 表示投掷出的正面数。求下列事件的概率。 (1)(0)P X = (2)(1)P X = 三、作业 《离散型随机变量及其分布列A 卷》1,2,3,5,8,10 《离散型随机变量及其分布列B 卷》3,5,7,11,13,15,16. 第二课时 随机变量的概率分布列 学习目标: 1. 随便变量概率分布列的概念。 2. 会求简单的离散型随机变量的概率分布列。认识概率分布列对刻画随机现象的重要性。 3. 掌握超几何分布概率分布列。 预习:随机变量概率分布列的概念 一、复习导入 1.随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量 随机变量常用希腊字母ξ、η等表示 2. 离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量 3.连续型随机变量: 对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量几个重要的离散型随机变量的分布列
连续型随机变量
几种常用连续型随机变量
选修2-3随机变量及其分布知识点总结典型例题
选修2-3离散型随机变量及其分布知识点
第二章-随机变量的分布及数字特征
讲连续型随机变量分布与随机变量的函数的分布
连续型随机变量的分布与例题讲解
连续型随机变量
连续型随机变量及其分布(精)
连续型随机变量的分布与例题讲解
选修2-3离散型随机变量及其分布知识点
离散型随机变量及其概率分布列(学生版)