王式安强化讲义概率论与数理统计(第课)剖析
- 格式:ppt
- 大小:7.60 MB
- 文档页数:66
第一章随机事件与概率§1.1 随机事件1.1.1 随机试验与样本空间概率论约定为研究随机现象所作的随机试验应具备以下三个特征:(1)在相同条件下试验是可重复的;(2)试验的全部可能结果不只一个,且都是事先可以知道的;(3)每一次试验都会出现上述可能结果中的某一个结果,至于是哪一个结果则事前无法预知。
为简单计,今后凡是随机试验皆简称试验,并记之以英文字母E。
称试验的每个可能结果为样本点,并称全体样本点的集合为试验的样本空间,分别用希腊字母ω和Ω表示样本点及样本空间。
必须指出的是这个样本空间并不完全由试验所决定,它部分地取决于实验的目的。
假设抛掷一枚硬币两次,出于某些目的,也许只需要考虑三种可能的结果就足够了,两次都是正面,两次都是反面,一次是正面一次是反面。
于是这三个结果就构成了样本空间Ω。
但是,如果要知道硬币出现正反面的精确次序,那么样本空间Ω就必须由四个可能的结果组成,正面-正面、反面-反面、正面-反面、反面-正面。
如果还考虑硬币降落的精确位置,它们在空中旋转的次数等事项,则可以获得其它可能的样本空间。
经常使用比绝对必要的样本空间较大的样本空间,因为它便于使用。
比如,在前面的例子中,由四个可能结果组成的样本空间便于问题的讨论,因为对于一个“均匀”的硬币这四个结果是“等可能”的。
尽管这在有3种结果的样本空间内是不对的。
例1.1.1E:从最简单的试验开始,这些试验只有两种结果。
在抛掷硬币这1一试验中出现“正面”或“反面”;在检查零件质量时,可能是“合格”或“不合格”;当用来模拟电子产品旋转的方向时,结果是“左边”或者“右边”;在这些情况下样本空间Ω简化为:Ω={正面,反面}。
E:更复杂一些,有的随机试验会产生多种可能的结果,比如掷一颗骰子,2观察出现的点数。
样本空间为:{1,2,3,4,5,6}Ω=。
E: 掷两枚硬币(或者观察两个零件或两个电子产品),可以得到3Ω={(正面,正面)、(反面,反面)、(正面,反面)、(反面,正面)} 读者可以将其推广到掷n个硬币,样本空间里有多少样本点呢?E:再复杂一些,一名射手向某目标射击,直至命中目标为止,观察其命中目4标所进行的射击次数。
2011考研强化班概率论与数理统计讲义第1讲随机事件和概率1.1 知识网络图1.2 重点考核点的分布(1)样本空间与随机事件.*(2)概率的定义与性质(含古典概型、几何概型、加法公式).*(3)条件概率与概率的乘法公式.**(4)事件之间的关系与运算(含事件的独立性).**(5)全概公式与贝叶斯(Bayes)公式.(6)伯努利(Bernoulli)概型.各个考核点前面加“**”表示重点考核点;“*”表示次重点考核点;括号前没有标注的表示一般考核点(下同).1.3 课上复习内容1.3.1 预备知识在复习“概率论”之前,我们需要掌握“二值集合”、“组合分析中的几个定理”、“随机现象及其统计规律”和“微积分”等内容,下面将有关内容作一简单介绍:1.3.1.1 二值集合集合是一个不能给出数学定义的概念,尽管如此,我们仍然可以给它一个定性描述.所谓集合就是按照某些规定能够识别的一些具体对象或事物的全体.构成集合的每一个对象或事物叫做集合的元素.集合通常用大写字母A,B,C表示,其元素用小写字母a,b,c表示.设A是一个集合,如果a是A的元素,记作a∈A,用“1”表示这一隶属关系;如果a 不是A的元素,记作a∈A(或a∉A),用“0”表示这一隶属关系.因此,我们称这种集合为“二值集合”,在初等概率论中,我们只研究这样的集合.有关二值集合的表示方法、基本性质在初等数学中已作过详细讨论,这里不再重复.下面仅就集合的“相等”与“等价”概念以及集合分类情况作一简单介绍.例1设A={2,4,8},则集合A的所有子集是,{2},{4},{8},{2,4},{2,8},{4,8},{2,4,8}.注意,在考虑集合A的所有子集时,不要把空集和它本身忘掉.设A,B是两个集合.如果A⊂B,B⊂A,那么称集合A与B相等,记作A=B.很明显,含有相同元素的两个集合相等.例2设A={0,2,3},B={x|x为方程x3-5x2+6x=0的解},则A=B.设A,B是两个集合.如果B的每一个元素对应于A的唯一的元素,反之A的每一个元素对应于B的唯一的元素,那么就说在A和B的元素之间建立了一一对应关系,并称A与B等价,记作A~B.与自然数集N等价的任何集合,称为可列集.显然,一切可列集彼此都是等价的.今后我们常称这类集合中元素的个数为可列个(或可数个),并把有限个或可列个统称为至多可列个(或至多可数个).例3设A={a|a=2n,n∈N},B={b|b=n2+1,n∈N},则A~B.由上面的讨论可以看出,集合的分类如下:1.3.1.2 组合分析中的几个定理1.加法原理定理1设完成一件事有n类方法,只要选择任何一类中的一种方法,这件事就可以完成.若第一类方法有m1种,第二类方法有m2种,……,第n类方法有m n种,并且这m1+m2+…+m n种方法里,任何两种方法都不相同,则完成这件事就有m1+m2+…+m n种方法.2.乘法原理定理2设完成一件事有n个步骤,第一步有m1种方法,第二步有m2种方法,……第n步有m n种方法,并且完成这件事必须经过每一步,则完成这件事共有m1m2…m n种方法.3.排列定义1 从n个不同元素中,每次取出m个元素,按照一定顺序排成一列,称为从n 个元素中每次取出m个元素的排列.定理3从n个不同元素中,有放回地逐一取出m个元素进行排列(简称为可重复排列),共有n m种不同的排列.例4 袋中有N个球,其中M个为白色,从中有放回地取出n个:①N=10,M=2,n=3;②N=10,M=4,n=3.考虑以下各事件的排列数:(Ⅰ)全不是白色的球.(Ⅱ)恰有两个白色的球.(Ⅲ)至少有两个白色的球.(Ⅳ)至多有两个白色的球.(Ⅴ)颜色相同.(Ⅵ)不考虑球的颜色.答案是:①当M=2时,(Ⅰ)83.(Ⅱ)3×22×8.(Ⅲ)3×22×8+23.(Ⅳ)3×22×8+3×2×83+83(或103-23).(Ⅴ)23+83.(Ⅵ)103.②当M=4时,将上面的2→4,8→6即可.分析这是一个可重复的排列问题.由定理3,可求出其排列数.问题恰有两个白色球的答案中为什么是3倍的22×8,而不是1倍或6倍的?提示根据加法原理.定理4 从n 个不同元素中,无放回地取出m 个(m ≤n )元素进行排列(简称为选排列)共有)!(!)1()1(m n n m n n n -=+--种不同的排列.选排列的种数用mn A (或mn P )表示,即)!(!m n n A m n -=特别地,当m =n 时的排列(简称为全排列)共有n ·(n -1)(n -2)·…·3·2·1=n ! 种不同排列.全排列的种数用P n (或nn A )表示,即P n =n !,并规定0!=1.4.组合定义2 从n 个不同元素中,每次取出m 个元素不考虑其先后顺序作为一组,称为从n 个元素中每次取出m 个元素的组合.定理5 从n 个不同元素中取出m 个元素的组合(简称为一般组合)共有(1)(1)!!!()!n n n m n m m n m --+=-种不同的组合.一般组合的组合种数用mn C (或⎪⎪⎭⎫⎝⎛m n )表示,即 ,)!(!!m n m n C m n -=并且规定.10=n C 不难看出m m nnm A C p =⋅例5 袋中有N 个球,其中M 个为白色,从中任取n 个: ①N =10,M =2,n =3;②N =10,M =4,n =3. 考虑以下各事件的组合数: (Ⅰ)全不是白色的球. (Ⅱ)恰有两个白色的球. (Ⅲ)至少有两个白色的球. (Ⅳ)至多有两个白色的球. (Ⅴ)颜色相同. (Ⅵ)不考虑球的颜色. 答案是:①当M =2时,(Ⅰ).0238C C (Ⅱ).1822C C (Ⅲ).1822C C(Ⅳ)211203328282810().C C C C C C C ++或 (Ⅴ).38C (Ⅵ)⋅310C②当M =4时,(Ⅰ).0436C C (Ⅱ).1624C C (Ⅲ).06341624C C C C +(Ⅳ))(34310360426141624C C C C C C C C -++或. (Ⅴ).3634C C +(Ⅵ)⋅310C分析(略)定理6 从不同的k 类元素中,取出m 个元素.从第1类n 1个不同元素中取出m 1个,从第2类n 2个不同的元素中取出m 2个,……,从第k 类n k 个不同的元素中取出m k 个,并且n i ≥m i >0(i =1,2,…,k )(简称为不同类元素的组合),共有iik k m n ki m n m n m n C CC C ∏==12211 种不同取法.例6 从3个电阻,4个电感,5个电容中,取出9个元件,问其中有2个电阻,3个电感,4个电容的取法有多少种?解 这是一个不同类元素的组合问题.由定理6知,共有60151413252423==C C C C C C即60种取法.例7 五双不同号的鞋,从中任取4只,取出的4只都不配对(即不成双),求(Ⅰ)排列数;(Ⅱ)组合数.答案是:(Ⅰ)141618110C C C C ;(Ⅱ).1212121245C C C C C分析(略)1.3.1.3 微积分概率论可以分为“高等概率论”与“初等概率论”.初等概率论是建立在排列组合和微积分等数学方法的基础上的.全国硕士研究生入学统一考试数学考试大纲中的“概率论”就是初等概率论.微积分作为初等概率论的基础知识,除了我们已经比较了解的“函数、极限、连续、可导、可积”等概念之外,还应了解下面的有关概念.1.可求积与不可求积在微积分中,求不定积分与求导数有很大不同,我们知道,任何初等函数的导数仍为初等函数,而许多初等函数的不定积分,例如x x x x x xx x x x x d 1,d sin ,d ln 1,d sin ,d e 322+⎰⎰⎰⎰⎰- 等,虽然它们的被积函数的表达式都很简单,但在初等函数的范围内却积不出来.这不是因为积分方法不够,而是由于被积函数的原函数不是初等函数的缘故.我们称这种函数是“不可求积”的.因此,我们可以将函数划分为:在初等概率论中,正态分布密度函数就是属于可积而不可求积的一类函数. 2.绝对收敛(1)任意项级数的绝对收敛所谓任意项级数是指级数的各项可以随意地取正数、负数或零.下面给出绝对收敛与条件收敛两个概念.定义3 若任意项级数nn u∑∞=1的各项取绝对值所成的级数||1nn u∑∞=收敛,则称级数nn u ∑∞=1是绝对收敛的;若||1nn u∑∞=发散,而级数n n u ∑∞=1收敛,则称级数n n u ∑∞=1是条件收敛的.例如,级数nn n 1)1(11+∞=-∑是收敛的,但各项取绝对值所成的级数 ++++=-+∞=∑nn n n 1...211|1)1(|11是发散的,因而级数n n n 1)1(11+∞=-∑是条件收敛.又如,级数2111)1(n n n +∞=-∑各项取绝对值所成级数++++=-+∞=∑222111211|1)1(|nnn n是收敛的,因而级数2111)1(n n n +∞=-∑是绝对收敛的. 定理7 若级数nn u∑∞=1绝对收敛,则nn u∑∞=1必定收敛.证明 令),2,1()0(0)0(|)|(21=⎩⎨⎧<≥=+=n u u u u u v n n n n n n ,,于是 )⋯=≥≥,2,1(0||n v u n n . 由||1nn u∑∞=收敛,根据正项级数的比较判别法,可知级数n n v ∑∞=1是收敛的.考虑到 ,||2n n n u v u -= 根据级数的基本性质,可知级数nn u∑∞=1也是收敛的.根据上面的定理,判断任意一个级数nn u∑∞=1的收敛性,可以先判断它是否绝对收敛.如果||1nn u∑∞=收敛,则n n u ∑∞=1也收敛.这样一来,我们可以借助于正项级数的判别法来判断任意项级数的敛散性了.但是,当级数||1nn u∑∞=发散时,不能由此推出级数n n u ∑∞=1也发散.在初等概率论中,我们将用绝对收敛这一概念来给出离散型随机变量均值的定义. (2)无穷积分的绝对收敛定义4 如果函数f (x )在任何有限区间[a ,b ](b >a )上可积,并且积分x x f ad |)(|⎰+∞收敛,那么,我们称积分x x f ad )(⎰+∞是绝对收敛的.此时,我们也称函数f (x )在无穷区间[a ,+∞)上绝对可积.定理8 若积分x x f ad )(⎰+∞绝对收敛,则x x f ad )(⎰+∞必定收敛.上面的定理的逆定理并不成立,也就是说,从x x f ad )(⎰+∞的收敛性,不能推出x x f ad |)(|⎰+∞也收敛,例如,积分⎰+∞-d sin x xx是收敛的,但是积分x xx d |sin |0⎰+∞却发散.这一点与定积分不同,对于定积分,从x x f bad )(⎰的存在性,必能推出xx f bad |)(|⎰存在.若积分x x f ad )(⎰+∞收敛,而积分x x f ad |)(|⎰+∞发散时,则称积分x x f ad )(⎰+∞为条件收敛的.例如积分x xxad sin ⎰+∞是条件收敛的. 在初等概率论中,我们将用绝对可积这一概念来给出连续型随机变量均值的定义. 1.3.2 样本空间与随机事件1.随机现象及其统计规律性在客观世界中存在着两类不同的现象:确定性现象和随机现象. 在一组不变的条件S 下,某种结果必定发生或必定不发生的现象称为确定性现象.这类现象的一个共同点是:事先可以断定其结果.在一组不变的条件S 下,具有多种可能发生的结果的现象称为随机现象.这类现象的一个共同点是:事先不能预言多种可能结果中究竟出现哪一种.一般来说,随机现象具有两重性:表面上的偶然性与内部蕴含着的必然规律性.随机现象的偶然性又称为它的随机性.在一次实验或观察中,结果的不确定性就是随机现象随机性的一面;在相同的条件下进行大量重复实验或观察时呈现出来的规律性是随机现象必然性的一面,称随机现象的必然性为统计规律性.2.随机试验与随机事件为了叙述方便,我们把对随机现象进行的一次观测或一次实验统称为它的一个试验.如果这个试验满足下面的三个条件:(1)在相同的条件下,试验可以重复地进行.(2)试验的结果不止一种,而且事先可以确知试验的所有结果.(3)在进行试验前不能确定出现哪一个结果.那么我们就称它是一个随机试验,以后简称为试验.一般用字母E表示.问题“一个具体的人,在一次乘车郊游时,因发生交通事故而受伤”,是否为随机试验?在随机试验中,每一个可能出现的不可分解的最简单的结果称为随机试验的基本事件或样本点,用ω表示;而由全体基本事件构成的集合称为基本事件空间或样本空间,记为Ω.例8设E1为在一定条件下抛掷一枚匀称的硬币,观察正、反面出现的情况.记ω1是出现正面,ω2是出现反面.于是Ω由两个基本事件ω1,ω2构成,即Ω={ω1,ω2}.例9 设E2为在一定条件下掷一粒骰子,观察出现的点数.记ωi为出现i个点(i=1,2,…,6).于是有Ω={ω1,ω2,…,ω6}.问题例8、例9中样本空间Ω的子集个数是多少?为什么?所谓随机事件是样本空间Ω的一个子集,随机事件简称为事件,用字母A,B,C等表示.因此,某个事件A发生当且仅当这个子集中的一个样本点ω发生,记为ω∈A.在例9中,Ω={ω1,ω2,…,ω6},而E2中的一个事件是具有某些特征的样本点组成的集合.例如,设事件A={出现偶数点},B={出现的点数大于4},C={出现3点},可见它们都是Ω的子集.显然,如果事件A发生,那么子集{ω2,ω4,ω6}中的一个样本点一定发生,反之亦然,故有A={ω2,ω4,ω6};类似地有B={ω5,ω6}和C={ω3}.一般而言,在例9中,任一由样本点组成的Ω的子集也都是随机事件.1.3.3 事件之间的关系与运算事件之间的关系有:“包含”、“等价(或相等)”、“互不相容(或互斥)”以及“独立”四种.事件之间的基本运算有:“并”、“交”以及“逆”.如果没有特别的说明,下面问题的讨论我们都假定是在同一样本空间Ω中进行的.1.事件的包含关系与等价关系设A,B为两个事件.如果A中的每一个样本点都属于B,那么称事件B包含事件A,或称事件A包含于事件B,记为A⊂B或B⊃A.如果A⊃B与B⊃A同时成立,那么称事件A与事件B等价或相等,记为A=B.在下面的讨论中,我们经常说“事件相同、对应概率相等”,这里的“相同”指的是两个事件“等价”.2.事件的并与交设A,B为两个事件.我们把至少属于A或B中一个的所有样本点构成的集合称为事件A与B的并或和,记为A∪B或A+B.设A ,B 为两个事件.我们把同时属于A 及B 的所有样本点构成的集合称为事件A 与B 的交或积,记为A ∩B 或A ·B ,有时也简记为AB .3.事件的互不相容关系与事件的逆设A ,B 为两个事件,如果A ·B =,那么称事件A 与B 是互不相容的(或互斥的). 对于事件A ,我们把不包含在A 中的所有样本点构成的集合称为事件A 的逆(或A 的对立事件),记为.A 我们规定它是事件的基本运算之一.在一次试验中,事件A 与A 不会同时发生(即A ·A =,称它们具有互斥性),而且A与A 至少有一个发生(即A +A =Ω,称它们具有完全性).这就是说,事件A 与A 满足:⎪⎩⎪⎨⎧=+∅=⋅.,ΩA A A A 问题 (1)事件的互不相容关系如何推广到多于两个事件的情形?(2)三个事件A ,B ,C ,ABC =与⎪⎩⎪⎨⎧∅=∅=∅=BC AC AB ,, 关系如何?根据事件的基本运算定义,这里给出事件之间运算的几个重要规律: (1)A (B +C )=AB +AC (分配律). (2)A +BC =(A +B )(A +C )(分配律).(3)B A B A ⋅=+ (德·摩根律).(4)B A B A +=⋅(德·摩根律).有了事件的三种基本运算我们就可以定义事件的其他一些运算.例如,我们称事件AB 为事件A 与B 的差,记为A -B .可见,事件A -B 是由包含于A 而不包含于B 的所有样本点构成的集合.例10 在数学系学生中任选一名学生.设事件A ={选出的学生是男生},B ={选出的学生是三年级学生},C ={选出的学生是科普队的}.(1)叙述事件ABC 的含义.(2)在什么条件下,ABC =C 成立? (3)在什么条件下,C ⊂B 成立?解 (1)事件ABC 的含义是,选出的学生是三年级的男生,不是科普队员.(2)由于ABC ⊂C ,故ABC =C 当且仅当C ⊂ABC .这又当且仅当C ⊂AB ,即科普队员都是三年级的男生.(3)当科普队员全是三年级学生时,C 是B 的子事件,即C ⊂B 成立. 4.事件的独立性设A ,B 是某一随机试验的任意两个随机事件,称A 与B 是相互独立的,如果P (AB )=P (A )P (B ).可见事件A 与B 相互独立是建立在概率基础上事件之间的一种关系.所谓事件A 与B 相互独立就是指其中一个事件发生与否不影响另一个事件发生的可能性,即当P (B )≠0时,A 与B 相互独立也可以用)()|(A P B A P =来定义.由两个随机事件相互独立的定义,我们可以得到:若事件A 与B 相互独立,则A 与B ,A 与B ,A 与B 也相互独立.如果事件A ,B ,C 满足⎪⎪⎩⎪⎪⎨⎧====),()()()(),()()(),()()(),()()(C P B P A P ABC P C P A P AC P C P B P BC P B P A P AB P 则称事件A ,B ,C 相互独立.注意,事件A ,B ,C 相互独立与事件A ,B ,C 两两独立不同,两两独立是指上述四个式子中前三个式子成立.因此,相互独立一定是两两独立,但反之不一定.例11 将一枚硬币独立地掷两次,引进事件:A ={掷第一次出现正面},B ={掷第二次出现正面},C ={正、反面各出现一次},则事件A ,B ,C 是相互独立,还是两两独立?解 由题设,可知P (AB )=P (A )P (B ),即A ,B 相互独立.而1()(())()()(),4P AC P A AB AB P AB P A P B =+===()()()()()(()())P A P C P A P AB AB P A P AB P AB =+=+⋅=+⨯=41)4121(21 故A ,C 相互独立,同理B ,C 也相互独立.但是P (ABC )=P (∅)=0, 而 ,81212121)()()(=⨯⨯=C P B P A P 即 )()()()(C P B P A P ABC P ≠,因此A ,B ,C 两两独立.问题 (1)两个事件的“独立”与“互斥”之间有没有关系?在一般情况下,即P (A )>0,P (B )>0时,有关系吗?为什么?(2)设0<P (A )<1,0<P (B )<1,P (B |A )+P (B |A )=1.问A 与B 是否独立,为什么?由此可以得到什么结论?1.3.4 概率的定义与性质1.概率的公理化定义定义5 设E 是一个随机试验,Ω为它的样本空间,以E 中所有的随机事件组成的集合为定义域,定义一个函数P (A )(其中A 为任一随机事件),且P (A )满足以下三条公理,则称函数P (A )为事件A 的概率.公理1(非负性) 0≤P (A )≤1.公理2(规范性) P (Ω)=1.公理3(可列可加性) 若A 1,A 2,…,A n ,…两两互斥,则).()(11i i i i A P A P ∑∞=∞==由上面三条公理可以推导出概率的一些基本性质. 性质1(有限可加性) 设A 1,A 2,…,A n 两两互斥,则).()(11i ni i n i A P A P ∑===性质2(加法公式) 设A ,B 为任意两个随机事件,则P (A +B )=P (A )+P (B )-P (AB ).性质3 设A 为任意随机事件,则P (A )=1-P (A ).性质4 设A ,B 为两个任意的随机事件,若A ⊂B ,则P (B -A )=P (B )-P (A ).由于P (B -A )≥0,根据性质4可以推得,当A ⊂B 时,P (A )≤P (B ). 例12 设A ,B ,C 是三个随机事件,且=====)()(,41)()()(CB P AB P C P B P A p 0,81)(=AC P ,求A ,B ,C 中至少有一个发生的概率. 解 设D ={A ,B ,C 中至少有一个发生},则D =A +B +C ,于是 P (D )=P (A +B +C )=P (A )+P (B )+P (C )-P (AB )-P (BC )-P (AC )+P (ABC ).又因为,41)()()(===C P B P A P ,0)()(==CB P AB P 81)(=AC P ,而由P (AB )=0,有P (ABC )=0,所以⋅=-=858143)(D P 问题 怎样由P (AB )=0推出P (ABC )=0? 提示 利用事件的关系与运算导出.例13 设事件A 与B 相互独立,P (A )=a ,P (B )=b .若事件C 发生,必然导致A 与B 同时发生,求A ,B ,C 都不发生的概率.解 由于事件A 与B 相互独立,因此P (AB )=P (A )·P (B )=a ·b .考虑到C ⊂AB ,故有,B A B A AB C ⊃+=⊃因此).1)(1()()()()(b a B P A P B A P C B A P --===2.概率的统计定义定义6 在一组不变的条件S 下,独立地重复做n 次试验.设μ是n 次试验中事件A 发生的次数,当试验次数n 很大时,如果A 的频率f n (A )稳定地在某一数值p 附近摆动;而且一般说来随着试验次数的增多,这种摆动的幅度会越来越小,则称数值p 为事件A 在条件组S 下发生的概率,记作.)(p A P =问题 (1)试判断下式p n n =∞→μlim成立吗?为什么?(2)野生资源调查问题 池塘中有鱼若干(不妨假设为x 条),先捞上200条作记号,放回后再捞上200条,发现其中有4条带记号.用A 表示事件{任捞一条带记号},问下面两个数2004,200x 哪个是A 的频率?哪个是A 的概率?为什么?3.古典概型古典型试验:(Ⅰ)结果为有限个;(Ⅱ)每个结果出现的可能性是相同的.等概完备事件组:(Ⅰ)完全性;(Ⅱ)互斥性;(Ⅲ)等概性.(满足(Ⅰ),(Ⅱ)两条的事件组称为完备事件组)定义7 设古典概型随机试验的基本事件空间由n 个基本事件组成,即Ω={ω1,ω2,…,ωn }.如果事件A 是由上述n 个事件中的m 个组成,则称事件A 发生的概率为⋅=nm A P )( (1-1) 所谓古典概型就是利用式(1-1)来讨论事件发生的概率的数学模型.根据概率的古典定义可以计算古典型随机试验中事件的概率.在古典概型中确定事件A 的概率时,只需求出基本事件的总数n 以及事件A 包含的基本事件的个数m .为此弄清随机试验的全部基本事件是什么以及所讨论的事件A 包含了哪些基本事件是非常重要的.例14 掷两枚匀称的硬币,求它们都是正面的概率.解 设A ={出现正正},其基本事件空间可以有下面三种情况:(Ⅰ)Ω1={同面、异面},n 1=2.(Ⅱ)Ω2={正正、反反、一正一反},n 2=3.(Ⅲ)Ω3={正正、反反、反正、正反},n 3=4.于是,根据古典概型,对于(Ⅰ)来说,由于两个都出现正面,即同面出现,因此,m 1=1,于是有21)(=A P . 而对于(Ⅱ)来说,m 2=1,于是有31)(=A P . 而对于(Ⅲ)来说,m 3=1,于是有41)(=A P . 问题 以上讨论的三个结果哪个正确,为什么?例15 求1.3.1预备知识的例5中(Ⅰ)至(Ⅴ)问的概率.答案是:①当M =2时,(Ⅰ)⋅31038/C C (Ⅱ)⋅31018/C C (Ⅲ)⋅31018/C C (Ⅳ)1. (Ⅴ)⋅31038/C C②当M =4时,(Ⅰ)⋅31038/C C (Ⅱ)⋅3101624/C C C (Ⅲ)310341624/)(C C C C +.(Ⅳ)31034310/)(C C C -. (Ⅴ) 3103634/)(C C C +. 分析(略)问题 (1)例15中各问可否使用排列做,为什么?(2)用排列或组合完成例15时哪种方法较为简便?例16 求1.3.1预备知识的例4中(Ⅰ)至(Ⅴ)问的概率.答案是:①当M =2时,(Ⅰ)3310/8. (Ⅱ)3210/823⨯⨯. (Ⅲ)33210/)2823(+⨯⨯.(Ⅳ)33310/)210(-. (Ⅴ)33310/)82(+.②当M =4时,将上面的2→4,8→6即可.分析(略)问题 (1)例16中各问可否使用组合做,为什么?(2)用元素可重复的排列或组合完成例16时,哪种方法较为简便?(3)小结一下“古典概型”中“有放回地抽取”与“无放回地抽取”时分别应采用的方法.例17 求1.3.1预备知识的例7中“取出的4只都不配对”的概率.答案是:410141618110/P C C C C 或 4111145222210/C C C C C C . 分析(略)例18 从一副扑克牌的13张梅花中,有放回地取3次,求三张都不同号的概率. 解 这是一个古典概型问题.设A ={三张都不同号}.由题意,有n =133,m =313P ,则 ⋅==169132)(n m A P问题 如果我们进一步问三张都同号,三张中恰有两张同号如何求出?另外,本题可否使用二项概型计算?例19 在20枚硬币的背面分别写上5或10,两者各半,从中任意翻转10枚硬币,这10枚硬币背面的数字之和为100,95,90,…,55,50,共有十一种不同情况.问出现“70,75,80”与出现“100,95,90,85,65,60,55,50”的可能性哪个大,为什么?答案是:出现“70,75,80”可能性大,约为82%.分析 这是一个古典概型问题.设A ={出现“70,75,80”},由题意,有,2,6104105105101020C C C C m C n +==则 ⋅==184756151704)(n m A P 4.几何概型几何型试验:(Ⅰ)结果为无限不可数;(Ⅱ)每个结果出现的可能性是均匀的.定义4 设E 为几何型的随机试验,其基本事件空间中的所有基本事件可以用一个有界区域来描述,而其中一部分区域可以表示事件A 所包含的基本事件,则称事件A 发生的概率为,)()()(Ω=L A L A P (1-2) 其中L (Ω)与L (A )分别为Ω与A 的几何度量.所谓几何概型就是利用式(1-2)来讨论事件发生的概率的数学模型.注意,上述事件A 的概率P (A )只与L (A )有关,而与L (A )对应区域的位置及形状无关. 例20 候车问题 某地铁每隔5 min 有一列车通过,在乘客对列车通过该站时间完全不知道的情况下,求每一个乘客到站等车时间不多于2 min 的概率.解 设A ={每一个乘客等车时间不多于2 min}.由于乘客可以在接连两列车之间的任何一个时刻到达车站,因此每一乘客到达站台时刻t 可以看成是均匀地出现在长为5 min 的时间区间上的一个随机点,即Ω=[0,5).又设前一列车在时刻T 1开出,后一列车在时刻T 2到达,线段T 1T 2长为5(见图1-1),即L (Ω)=5;T 0是T 1T 2上一点,且T 0T 2长为2.显然,乘客只有在T 0之后到达(即只有t 落在线段T 0T 2上),等车时间才不会多于2min ,即L (A )=2.因此图1-1⋅=Ω=52)()()(L A L A P 问题 (1)例20可否使用一维均匀分布来计算?(2)举例说明:(Ⅰ)概率为0的事件不一定是不可能事件.(Ⅱ)概率为1的事件不一定是必然事件.例21 会面问题 甲乙两艘轮船驶向一个不能同时停泊两艘轮船的码头,它们在一昼夜内到达的时间是等可能的,如果甲船和乙船停泊的时间都是两小时,它们同日到达时会面的概率是多少?解 这是一个几何概型问题.设A ={它们会面}.又设甲乙两船到达的时刻分别是x ,y ,则0≤x ≤24,0≤y ≤24.由题意可知,若要甲乙会面,必须满足|x -y |≤2,即图中阴影部分.由图1-2可知:L (Ω)是由x =0,x =24,y =0,y =24图1-2所围图形面积S =242,而L (A )=242-222,因此.)2422(1242224)()()(2222-=-=Ω=L A L A P 问题 例21可否使用二维均匀分布来计算?1.3.5 条件概率与概率的乘法公式1.条件概率前面我们所讨论的事件B 的概率P S (B ),都是指在一组不变条件S 下事件B 发生的概率(但是为了叙述简练,一般不再提及条件组S ,而把P S (B )简记为P (B )).在实际问题中,除了考虑概率P S (B )外,有时还需要考虑“在事件A 已发生”这一附加条件下,事件B 发生的概率.与前者相区别,称后者为条件概率,记作P (B |A ),读作在A 发生的条件下事件B 的概率.在一般情况下,如果A ,B 是条件S 下的两个随机事件,且P (A )≠0,则在A 发生的前提下B 发生的概率(即条件概率)为)()()|(A P AB P A B P =, (1-3) 并且满足下面三个性质:(1)(非负性)P (B |A )≥0;(2)(规范性)P (Ω|A )=1;(3)(可列可加性)如果事件B 1,B 2,…互不相容,那么).|()|(11A B P A B P i i i i ∑∞=∞==问题 (1)条件概率在原样本空间Ω中是某一个事件的概率吗?(2)如何判断一个问题中所求的是条件概率还是无条件概率?(3)在一个具体问题中条件概率如何获得?例22 设随机事件B 是A 的子事件,已知P (A )=1/4,P (B )=1/6,求P (B |A ).分析 这是一个条件概率问题.解 因为B ⊂A ,所以P (B )=P (AB ),因此⋅===32)()()()()|(A P B P A P AB P A B P 2.概率的乘法公式在条件概率公式(1-3)的两边同乘P (A ),即得P (AB )=P (A )P (B |A ). (1-4)例23 在100件产品中有5件是不合格的,无放回地抽取两件,问第一次取到正品而第二次取到次品的概率是多少?解 设事件A ={第一次取到正品},B ={第二次取到次品}.用古典概型方法求出.010095)(=/=A P 由于第一次取到正品后不放回,那么第二次是在99件中(不合格品仍是5件)任取一件,所以⋅=995)|(A B P 由公式(1-4), ⋅=⨯==3961999510095)|()()(A B P A P AB P问题 (1)例23中,问两件产品为一件正品,一件次品的概率是多少?(2)例23中,将“无放回地抽取”改为“有放回地抽取”,答案与上题一样吗?为什么?例24 抓阄问题 五个人抓一个有物之阄,求第二个人抓到的概率.分析 (1)什么是“抓阄”问题,如何判断它?(2)例24中“求第二个人抓到的概率”是指“在第一人没有抓到的条件下,第二个人抓到的概率”吗?解 这是一个乘法公式的问题.设A i ={第i 个人抓到有物之阄}(i =1,2,3,4,5),有⋅=+∅=+=+=Ω=2121212111222)(A A A A A A A A A A A A A根据事件相同,对应概率相等有).|()()()(121212A A P A P A A P A P ==又因为,41)|(,54)(,51)(1211===A A P A P A P所以⋅=⨯=514154)(2A P 问题 (1)本题还有其他方法解决吗?(2)若改成n 个人抓m 个有物之阄(m <n ),下面的结论),,2,1()(n k nm A P k == 还成立吗?例25 设袋中有4个乒乓球,其中1个涂有白色,1个涂有红色,1个涂有蓝色,1个涂有白、红、蓝三种颜色.今从袋中随机地取一个球,设事件A ={取出的球涂有白色},B ={取出的球涂有红色},C ={取出的球涂有蓝色}.试验证事件A ,B ,C 两两相互独立,但不相互独立.证 根据古典概型,我们有n =4,而事件A ,B 同时发生,只能是取到的球是涂有白、红、蓝三种颜色的球,即m =1,因而⋅=41)(AB P 同理,事件A 发生,只能是取到的球是涂红色的球或涂三种颜色的球,因而⋅==⋅==2142)(2142)(B P A P 因此,有 ,412121)()(=⨯=B P A P 所以 P (AB )=P (A )P (B ),即事件A ,B 相互独立.类似可证,事件A ,C 相互独立,事件B ,C 相互独立,即A ,B ,C 两两相互独立,但是由于,41)(=ABC P 而 ,4181212121)()()(=/=⨯⨯=C P B P A P 所以A ,B ,C 并不相互独立.例26 加工某一零件共需经过四道工序,设第一、二、三、四道工序的次品率分别是2%、3%、5%、3%,假定各道工序是互不影响的,求加工出来的零件的次品率.答案是:0.124(或1-0.98×0.97×0.95×0.97).问题 本题使用加法公式还是乘法公式较为简便?例27 一批零件共100个,其中有次品10个.每次从中任取一个零件,取出的零件不再放回去,求第一、二次取到的是次品,第三次才取到正品的概率. 答案是:)989099910010(0084.0⨯⨯或.。
第1章 抽样调查§1.1 引言绪论中关于数理统计学的概念的阐述可以看出数理统计面对的就是数据,而数据的“质量”对最终的得出的结论的可靠性有着重大影响.对于普查的数据,数据的有效性、准确性很重要(这类数据的研究不属于数理统计学的范畴).对于抽查数据,数据的概率性质很重要.本章简要地介绍抽样调查的一些概念和技术以及相关理论.在数理统计学中还有另一种获取数据的方法--试验设计(将在后面介绍).抽样调查是从总体中抽取一小部分个体以获取总体的有关信息.根据研究对象即总体的不同特点需要设计不同的抽样方法以获取高“质量”的数据.抽样技术在很多领域都有应用. 随机抽样至少有以下的益处:∙ 抽取个体的随机性排除了调查者的偏见,即使是无意识的。
∙ 与完全枚举(即普查)相比,减少很多成本,调查更省时。
∙随机抽样的结论实际上可能比完全枚举更精确。
小样本的数据质量更容易监控,完全枚举需要大量的调查人员去实施,由此可能带来更多业务不精的职员。
∙ 随机抽样技术使得抽样误差估计变得可能。
∙ 在抽样设计时,通常可以确定出满足预设误差水平的样本容量。
抽样调查大多是指大规模抽样调查,总体往往是具体的人或物且其中的个体数目很大,但我们总是假定个体数目是有限的、已知的,常用N 表示总体中的个体数目。
在具体的抽样调查问题中,我们总是调查个体的某项(或多项)指标.这种指标可以是数值的,也可以是非数值的.对于非数值的指标我们总可以用数字表示。
最常见的非数值的指标是分类数据(或属性数据),比如将总体中的成员依据某一属性分成r 类,我们可以用数值r ,, 1(或11,0-r ,, )分别代表各个类别,最常见的是分为二类(比如正品与次品,男性与女性),我们称之为二分变量.总体中的N 个个体的数量指标值记为N x ,,x ,x 21.这里N x ,,x ,x 21中可以有相同的。
例1.1 作为本章的第一个例子,我们利用Herkson(1976)的研究来解释一些思想.总体由393=N 个短期居留医院组成.我们关注于医院一个月内出院人数.令i x 表示1968年1月份第i 个医院的出院人数,那么总体为39321x ,,x ,x .总体均值为6.814,总体标准差为7.589.总体的数值都是知道的,我们可通过频数直方图显示总体数值的分布,见P139图7.1.这里举这个例子是为了教学目的,后面还会用这个例子来说明一些方法和思想.实际中,我们往往是不知道总体中各个个体的数值,而是希望通过抽样而获得的数据去了解总体的信息,比如估计总体均值等.在抽样调查的统计问题中,我们关注的是总体的一些数值特征(也称为参数). (1)总体均值(population mean )∑==Ni i x N11μ在分类数据中,各类别的比例.尤其是对于二分总体,我们用0和1代表两个类别,则常关注总体中取值为1的个体所占的比例:=p ∑=Ni i x N 11 这里i x 取0或1(2)总体总数(population total) ∑==Ni ix1τ(3)总体方差(population variance)∑==Ni i2)-x(N121μσ,易见21221μ-=σ∑=N i i x N在二分总体情况下,总体方差为p)p -1(. 总体标准差(population standard deviation)2σσ=.一般地,总体中的个体的数量指标值N x ,,x ,x 21是未知的,因而总体的特征数(或参数)也是未知的,而我们要做的工作就是通过调查到的结果即样本来获取总体参数的信息. §1.2 简单随机抽样抽样技术本质上具有概率性,即总体中每个个体都以特定的概率出现在样本中(简称为入样),并且样本的实际构成是随机的. 不同的抽样方法决定了样本的不同概率性质(也与总体的概率结构有关),或反过来说,不同的抽样方法就是由样本的不同概率性质来定义的. 最初级的抽样方法是简单随机抽样:每个个体都以相同的概率入样.简单随机抽样可分为有放回的简单随机抽样(也称为有重复的简单随机抽样)和不放回的简单随机抽样(也称为无重复的简单随机抽样)两种方式. 有放回的简单随机抽样所得的样本)X ,,(X n 1的概率性质有: (1) 各个i X 具有相同的分布; (2)n X ,,X 1相互独立.不放回的简单随机抽样所得的样本)X ,,(X n 1的概率性质有: (1)各个i X 具有相同的分布;(2)n X ,,X 1不相互独立. 任意指定的n 个个体组成样本的概率均为n NC 1。
概率论与数理统计讲义稿第⼀章随机事件与概率§1.1 随机事件1.1.1 随机试验与样本空间概率论约定为研究随机现象所作的随机试验应具备以下三个特征:(1)在相同条件下试验是可重复的;(2)试验的全部可能结果不只⼀个,且都是事先可以知道的;(3)每⼀次试验都会出现上述可能结果中的某⼀个结果,⾄于是哪⼀个结果则事前⽆法预知。
为简单计,今后凡是随机试验皆简称试验,并记之以英⽂字母E。
称试验的每个可能结果为样本点,并称全体样本点的集合为试验的样本空间,分别⽤希腊字母ω和Ω表⽰样本点及样本空间。
必须指出的是这个样本空间并不完全由试验所决定,它部分地取决于实验的⽬的。
假设抛掷⼀枚硬币两次,出于某些⽬的,也许只需要考虑三种可能的结果就⾜够了,两次都是正⾯,两次都是反⾯,⼀次是正⾯⼀次是反⾯。
于是这三个结果就构成了样本空间Ω。
但是,如果要知道硬币出现正反⾯的精确次序,那么样本空间Ω就必须由四个可能的结果组成,正⾯-正⾯、反⾯-反⾯、正⾯-反⾯、反⾯-正⾯。
如果还考虑硬币降落的精确位置,它们在空中旋转的次数等事项,则可以获得其它可能的样本空间。
经常使⽤⽐绝对必要的样本空间较⼤的样本空间,因为它便于使⽤。
⽐如,在前⾯的例⼦中,由四个可能结果组成的样本空间便于问题的讨论,因为对于⼀个“均匀”的硬币这四个结果是“等可能”的。
尽管这在有3种结果的样本空间内是不对的。
例 1.1.1 1E :从最简单的试验开始,这些试验只有两种结果。
在抛掷硬币这⼀试验中出现“正⾯”或“反⾯”;在检查零件质量时,可能是“合格”或“不合格”;当⽤来模拟电⼦产品旋转的⽅向时,结果是“左边”或者“右边”;在这些情况下样本空间Ω简化为:Ω={正⾯,反⾯}。
2E :更复杂⼀些,有的随机试验会产⽣多种可能的结果,⽐如掷⼀颗骰⼦,观察出现的点数。
样本空间为:{1,2,3,4,5,6}Ω=。
3E : 掷两枚硬币(或者观察两个零件或两个电⼦产品),可以得到Ω={(正⾯,正⾯)、(反⾯,反⾯)、(正⾯,反⾯)、(反⾯,正⾯) }读者可以将其推⼴到掷n 个硬币,样本空间⾥有多少样本点呢?4E :再复杂⼀些,⼀名射⼿向某⽬标射击,直⾄命中⽬标为⽌,观察其命中⽬标所进⾏的射击次数。
概率统计主要参考书1、2009年全国硕士研究生入学统一考试,数学考试大纲。
2、概率论与数理统计(浙江大学或经济数学编写组)3、2009年考研数学标准全书(理工类)对外经贸大学出版社4、2009年考研数学标准全书(经济类)对外经贸大学出版社5、2009年考研数学理念真题解析(数一,二,三,四)对外经贸大学出版社6、考研数学知识点必备手册对外经贸大学出版社7、2009年硕士研究生入学考试数学(一)/(二)/(三)/(四)8卷模拟试卷对外经贸大学出版社第一讲随机事件和概率考试要求:数学一、三、四要求一致。
了解:样本空间的概念理解:随机事件,概率,条件概率,事件独立性,独立重复试验掌握:事件的关系与运算,概率的基本性质,五大公式(加法、减法、乘法、全概率、贝叶斯),独立性计算,独立重复试验就算会计算:古典概率和几何型概率。
§1随机事件与样本空间一、随机试验:E(1)可重复(2)知道所有可能结果(3)无法预知二、样本空间试验的每一可能结果——样本点ω 所有样本点全体——样本空间Ω 三、随机事件样本空间的子集——随机事件 A B C 样本点——基本事件, 随机事件由基本事件组成。
如果一次试验结果,某一基本事件ω出现——ω发生,ω出现 如果组成事件A 的基本事件出现——A 发生,A 出现 Ω——必然事件 Φ——不可能事件§2 事件间的关系与运算一.事件间关系包含,相等,互斥,对立,完全事件组,独立 二.事件间的运算: 并,交,差运算规律:交换律,结合律,分配律,对偶律 概率定义,集合定义,记号,称法,图 三.事件的文字叙述与符号表示例2 从一批产品中每次一件抽取三次,用(1,2,3)i A i =表示事件:“第二次抽取到的是正品”试用文字叙述下列事件: (1)122313A A A A A A ; (2)123A A A ;(3)123A A A ; (4)123123123A A A A A A A A A ; 再用123,,A A A 表示下列事件:(5)都取到正品; (6)至少有一件次品; (7)只有一件次品; (8)取到次品不多于一件。
《概率论与数理统计A》知识点说明第一章随机事件与概率主要内容:随机事件和样本空间;概率的定义和性质(重点);古典概型和几何概型;条件概率与全概率公式(重点与难点)。
要求(1)掌握概率的定义和性质;条件概率;事件的独立性;全概率公式和Bayes公式;了解事件的关系和运算;古典概型。
(2)选讲:几何概型;涉及到比较难的排列组合古典概型题目。
第二章随机变量及其分布主要内容:随机变量和分布函数(重点);离散型随机变量;连续型随机变量(重点);正态分布(重点);随机变量函数的分布(重点与难点)。
要求理解一维随机变量定义;掌握分布函数的定义及性质;掌握离散型随机变量的分布律;连续型随机变量的分布密度等基本概念;掌握几种常见离散和连续型随机变量;掌握随机变量函数的分布。
第三章二维随机变量及其分布主要内容:二维随机变量的概念及其分布函数(重点);二维离散型随机变量;二维连续型随机变量及二维随机变量函数的分布(重点与难点)。
要求(1)理解二维随机变量;联合分布函数、边缘分布函数等定义;掌握二维离散型随机变量的联合分布律、边缘分布律及独立性;掌握二维连续型随机变量的联合分布密度、边缘分布密度及独立性;掌握二维离散型随机变量函数的分布;掌握用定义法求二维连续型随机变量函数的分布;掌握和的分布;掌握最值分布。
(2)选讲:条件分布律及条件密度;商的分布。
第四章随机变量的数字特征主要内容:数学期望(重点);方差(重点);协方差、相关系数和矩。
要求(1)掌握随机变量的数学期望和方差的定义、计算及性质;了解协方差、相关系数及二阶矩。
(2)选讲:高阶矩(大于2)、协方差矩阵。
第五章大数定律和中心极限定理主要内容:大数定律(重点、难点);中心极限定理(重点)。
要求(1)掌握切比雪夫不等式;了解四个大数定律;理解中心极限定理。
(2)选讲:相关证明。
第六章数理统计的基本概念主要内容:样本与统计量,抽样分布(重点与难点)。
要求χ分布,t分布,F分布的定(1)理解总体和个体、随机样本和统计量等基本概念;掌握2χ分布,t分布,F分布的分布表;会用标准正态分布表查标准正态分布分位义及性质;会查2数;掌握单正态总体样本均值和样本方差相关结论。