超几何分布与二项分布的区别ppt课件
- 格式:ppt
- 大小:460.50 KB
- 文档页数:8
《二项分布与超几何分布》讲义在概率论中,二项分布和超几何分布是两个非常重要的离散型概率分布。
它们在实际生活和科学研究中有着广泛的应用,理解和掌握这两种分布对于解决各种概率相关的问题至关重要。
一、二项分布(一)定义二项分布是指进行\(n\)次独立的伯努利试验,每次试验中成功的概率为\(p\),失败的概率为\(1 p\)。
设随机变量\(X\)表示在\(n\)次试验中成功的次数,则\(X\)服从参数为\(n\)和\(p\)的二项分布,记为\(X ~ B(n, p)\)。
(二)概率质量函数二项分布的概率质量函数为:\(P(X = k) = C_{n}^k p^k (1 p)^{n k}\),其中\(C_{n}^k\)表示从\(n\)个元素中选取\(k\)个元素的组合数。
(三)期望和方差二项分布的期望为\(E(X) = np\),方差为\(Var(X) = np(1 p)\)。
(四)应用场景二项分布在很多实际问题中都有应用。
例如,抛硬币多次,计算正面朝上的次数;产品抽检中,确定不合格产品的数量等。
二、超几何分布(一)定义超几何分布描述的是从有限\(N\)个物件(其中包含\(M\)个成功物件)中,不放回地抽取\(n\)个物件,成功物件的数量为随机变量\(X\),则\(X\)服从超几何分布。
(二)概率质量函数超几何分布的概率质量函数为:\(P(X = k) =\frac{C_{M}^k C_{N M}^{n k}}{C_{N}^n}\)。
(三)期望和方差超几何分布的期望为\(E(X) = n\frac{M}{N}\),方差为\(Var(X) = n\frac{M}{N}(1 \frac{M}{N})\frac{N n}{N 1}\)。
(四)应用场景超几何分布常用于抽样调查,比如从一批产品中随机抽取一定数量的产品,计算其中合格品的数量;从一个班级中抽取若干学生,统计其中男生的人数等。
三、二项分布与超几何分布的比较(一)相同点1、都是离散型概率分布,用于描述随机变量取不同值的概率。
123510 15 20 25 参加人数活动次数二项分布与超几何分布辨析超几何分布和二项分布都是离散型分布 超几何分布和二项分布的区别:超几何分布需要知道总体的容量,而二项分布不需要;超几何分布是不放回抽取,而二项分布是放回抽取(独立重复) 当总体的容量非常大时,超几何分布近似于二项分布.........例1 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求: (1)有放回抽样时,取到黑球的个数X的分布列; (2)不放回抽样时,取到黑球的个数Y的分布列.例2.某市十所重点中学进行高三联考,共有5000名考生,为了了解数学学科的学习情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:(1)根据上面的频率分布表,求①,②,③,④处的数值; (2)根据上面的频率分布表,在所给的坐标系中画出在区间[]80,150上的频率分布直方图;(3)如果把表中的频率近似地看作每个学生在这次考试中取得相应成绩的概率,那么从总体中任意抽取3个个体,成绩落在[]100,120中的个体数为ξ,求ξ的分布列和数学期望.练习2.为从甲、乙两名运动员中选拔一人参加2010年广州亚运会跳水项目,对甲、乙两名运动员进行培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得出茎叶图如图所示(Ⅰ)从平均成绩及发挥稳定性的角度考虑,你认为选派哪名运动员合适?(Ⅱ)若将频率视为概率,对甲运动员在今后3次比赛成绩进行预测,记这3次成绩中高于80分的次数为ξ,求ξ的分布列及数学期望E ξ。
例3.按照新课程的要求, 高中学生在每学期都要至少参 加一次社会实践活动(以下简称活动).某校高一· 一班50名学生在上学期参加活动的次数统计如条形图所示.(I )求该班学生参加活动的人均次数x ; (II )从该班中任意选两名学生,求他们参加活动次数恰好相等的概率;(III )从该班中任选两名学生,用ξ表示这两人参分组 频数 频率 ①② 0.0500.20036 0.300 0.275 12 ③ 0.050合计④加活动次数之差的绝对值,求随机变量ξ的分布列及数学期望E ξ.(要求:答案用最简分数表示)练习3.某校参加高一年级期中考试的学生中随机抽出60名学生,将其数学成绩分成六段[40,50]、[50,60]、…、[90,100]后得到如下部分频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80]内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)若从60名学生中随抽取2人,抽到的学生成绩在[40,60]记0分,在[60,80]记1分,在[80,100]记2分,用ξ表示抽取结束后的总记分,求ξ的分布列和数学期望。
二项分布与超几何分布
的区别
Company number【1089WT-1898YT-1W8CB-9UUT-92108】
二项分布与超几何分布的区别:
定义:若有N 件产品,其中M 件是废品,无返回...
地任意抽取n 件,则其中恰有的废品件数X 是服从超几何分布的。
概率为()k n K M N M n N
C C P X k C --==. 若有N 件产品,其中M 件是废品,有.返回..
地任意抽取n 件,则其中恰有的废品件数X 是服从二项分布的。
概率为()()1n k k k n P X k C p p -==-,其中M p N
=. 区别:(1)二项分布是做相同的n 次试验(n 次独立重复试验),
(2)当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布。
在废品为确定数M 的足够多的产品中,任意抽取n 个(由于产品个数N 无限多,无返回与有返回无区别,故可看作n 次独立重复试验)中含有k 个废品的概率当然服从二项分布。
在这里,超几何分布转化为二项分布的条件是①产品个数应无限多,否则无返回地抽取n 件产品是不能看作n 次独立试验的.②在产品个数N 无限增加的过程中,废品数应按相应的“比例”增大,否则上述事实也是不成立的。
(3)实际上,在以样本估计总体时,从样本中无返回地任意抽取n 件,当然废品件数X 服从超几何分布的;而从总体中无返回地任意抽取n 件,理想认为....
废品件数X 服从二项分布的。
超几何分布和二项分布的联系和区别超几何分布和二项分布的联系和区别开滦一中 张智民在最近的几次考试中,总有半数的的学生搞不清二项分布和超几何分布,二者到底该如何区分呢?什么时候利用二项分布的公式解决这道概率问题?什么时候用超几何分布的公式去解决呢?好多学生查阅各种资料甚至于上网寻找答案,其实这个问题的回答就出现在教材上,人教版新课标选修2-3从两个方面给出了很好的解释.诚可谓:众里寻他千百度,蓦然回首,那人却在灯火阑珊处! 一、 两者的定义是不同的教材中的定义: (一)超几何分布的定义在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)=nNk-n M -N k M C C C , ,2,1,0k =, m,其中m=min{M,n},且n ≤N,M ≤N,n,M,N ∈N,称随机变量X 服从超几何分布(二)独立重复试验和二项分布的定义1)独立重复试验:在相同条件下重复做的n 次试验,且各次试验试验的结果相互独立,称为n 次独立重复试验,其中A(i=1,2,…,n)是第ⅰ次试验结果,则P(A1A2A3…An)=P(A 1)P(A2)P(A3)…P(An) 2)二项分布在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中事件A 发生的概率为P,则P(X=k)=k n k p p --)1(C k n(k=0,1,2,…,n),此时称随机变量X 服从二项分布,记作X~B(n,p),并称P 为成功概率。
1.本质区别(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题;(2)超几何分布中的概率计算实质上是古典概型问题;二项分布中的概率计算实质上是相互独立事件的概率问题2.计算公式超几何分布:在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)[错解分析]第二问的选人问题是不放回抽样问题,按照定义先考虑超几何分布,但是题目中又明确给出:“以这16人的样本数据来估计整个社区的总体数据,从该社区(人数很多)任选3人”,说明不是从16人中任选3人,而是从该社区(人数很多)任选3人,所以可以近似看作是3次独立重复试验,应该按照二项分布去求解,而不能按照超几何分布去处理【正解】(1) (1)由茎叶图可知,抽取的16人中“幸福”的人数有12人,其他的有4人;记“从这16人中随机选取3人,至少有2人是“幸福”,”为事件A.由题意得140121709140111)(3161122431634=--=⨯--=C C C C C A P 2)由茎叶图知任选一人,该人幸福度为“幸福”的概率为43,ξ的可能取值为0,1,2,3,显然)43,3(B ~ξ则64141)0(3=⎪⎭⎫ ⎝⎛==ξP ;6494143)1(213=⎪⎭⎫ ⎝⎛⋅⋅==C P ξ; 64274143)2(223=⎪⎭⎫ ⎝⎛⋅⎪⎭⎫ ⎝⎛⋅==C P ξ;642743)3(3=⎪⎭⎫⎝⎛==ξP ;从以上解题过程中我们还发现,错解中的期望值与正解中的期望值相等,好多学生都觉得不可思议,怎么会出现相同的结果呢?其实这还是由于前面解释过的原因,超几何分布与二项分布是有联系的,看它们的期望公式:(1)在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,随机变量Ⅹ服从超几何分布,超几何分布的期望计算公式为EX=NnM(可以根据组合数公式以及期望的定义推导);(2)随机变量X 服从二项分布,记作X~B(n,p), EX=np;当超几何分布中的∞→N 时,p NM→,此时可以把超几何分布中的不放回抽样问题,近似看作是有放回抽样问题,再次说明∞→N 时,可以把超几何分布看作是二项分布。
超几何分布和二项分布的联系和区别超几何分布和二项分布的联系和区别开滦一中 张智民在最近的几次考试中,总有半数的的学生搞不清二项分布和超几何分布,二者到底该如何区分呢?什么时候利用二项分布的公式解决这道概率问题?什么时候用超几何分布的公式去解决呢?好多学生查阅各种资料甚至于上网寻找答案,其实这个问题的回答就出现在教材上,人教版新课标选修2-3从两个方面给出了很好的解释.诚可谓:众里寻他千百度,蓦然回首,那人却在灯火阑珊处! 一、 两者的定义是不同的教材中的定义: (一)超几何分布的定义在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)=nNk-n M -N k M C C C ,Λ,2,1,0k =, m,其中m=min{M,n},且n ≤N,M ≤N,n,M,N ∈N,称随机变量X 服从超几何分布(二)独立重复试验和二项分布的定义1)独立重复试验:在相同条件下重复做的n 次试验,且各次试验试验的结果相互独立,称为n 次独立重复试验,其中A(i=1,2,…,n)是第ⅰ次试验结果,则P(A1A2A3…An)=P(A 1)P(A2)P(A3)…P(An) 2)二项分布在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中事件A 发生的概率为P,则P(X=k)=k n k p p --)1(C k n(k=0,1,2,…,n),此时称随机变量X 服从二项分布,记作X~B(n,p),并称P 为成功概率。
1.本质区别(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题;(2)超几何分布中的概率计算实质上是古典概型问题;二项分布中的概率计算实质上是相互独立事件的概率问题2.计算公式超几何分布:在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)的球的数目N 很大时,X 的分布列近似于二项分布,并且随着N 的增加,这种近似的精度也增加。
二项分布与超几何分布的区别与联系1.定义:(1)超几何分布:设有总数为N件的两类..物品,其中一类有M件,从所有物品中任取n件(n≤N),这n件中所含这类物品件数X是一个离散型随机变量,它取值为m时的概率为()m n mM N MnNC CP X mC --== (0≤m≤l,l为n和M中较小的一个),则称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X服从参数为N,M,n的超几何分布.(2)二项分布:若将事件A发生的次数设为X,发生的概率为p,不发生的概率q=1-p,那么在n次独立重复试验中,事件A恰好发生k次的概率是P(X=k)=C k n p k(1-p)n-k(k=0,1,2,…,n) ,于是得到X的分布列(q+p)n=C0n p0q n+C1n p1q n-1+…+C k n p k q n-k+…+C n n p n q0各对应项的值,称这样的离散型随机变量X服从参数为n,p的二项分布,记做X~B(n,p).2.本质区别:(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题,也就是说二项分布中每个事件之间是相互独立的,而超几何分布不是;(2)超几何分布中的概率计算实质上是古典概型问题,二项分布中的概率计算实质上是相互独立事件的概率问题.温馨提示:(1)超几何分布需要知道总体的容量,也就是总体个数有限;而二项分布不需要知道总体容量,但需要知道“成功率”.(2)当题目中出现“用样本数据估计×××的总体数据”是均为二项分布;(3)二项分布与超几何分布两者之间存在着联系:当调查研究的样本容量非常大时,在有放回地抽取与无放回地抽取条件下,计算得到的概率非常接近,可以近似把超几何分布认为是二项分布.概率论中的二项分布与超几何分布都是古典概型。
【典例】某批n 件产品的次品率为2%,现从中任意地依次抽出3件进行检验,问: (1)当500,5000,50000n =时,分别以放回和不放回的方式抽取,恰好抽到1件次品的概率是多少?(2)根据(1)你对超几何分布与二项分布的关系有何认识?【解】(1)在放回的方式抽取中,每次抽取时都从这n 件产品中抽取,从而抽到品的概率都为0.02.可以把3次抽取看成是3次独立重复试验,这样抽到的次品数X ~(3,0.02)B ,恰好抽到1件次品的概率为1223(1)0.02(10.02)30.020.980057624=.P X C ==⨯⨯-⨯⨯≈在不放回的方式抽取中,抽到的次品数X 是随机变量,X 服从超几何分布,X 的分布与产品的总数n 有关,所以需要分3种情况计算:①500n =时,产品的总数为500件,其中次品的件数为500⨯2%=10,合格品的件数为490件。
《二项分布与超几何分布》讲义一、引言在概率统计的学习中,二项分布和超几何分布是两个非常重要的概念。
它们在实际生活中的应用广泛,例如质量检测、抽样调查、生物遗传等领域。
理解这两种分布的特点和区别,对于正确解决概率问题至关重要。
二、二项分布(一)定义二项分布是一种离散概率分布,用于描述在 n 次独立重复的伯努利试验中,成功的次数 X 的概率分布。
(二)特点1、每次试验只有两种可能的结果:成功或失败。
2、每次试验的成功概率 p 保持不变。
3、各次试验相互独立。
(三)概率计算公式如果随机变量 X 服从参数为 n 和 p 的二项分布,记为 X ~ B(n, p),那么 X = k 的概率为:P(X = k) = C(n, k) p^k (1 p)^(n k) (其中 C(n, k) 表示从 n 个元素中选取 k 个元素的组合数)(四)期望与方差期望 E(X) = np方差 D(X) = np(1 p)(五)应用举例假设某射手每次射击命中目标的概率为 08,进行 5 次射击,求命中目标 3 次的概率。
解:这里 n = 5,p = 08,要求 P(X = 3)。
P(X = 3) = C(5, 3) 08^3 (1 08)^(5 3)= 10 0512 004= 02048三、超几何分布(一)定义超几何分布是统计学上一种离散概率分布,描述了从有限 N 个物件(其中包含 M 个指定种类的物件)中抽出 n 个物件,成功抽出指定种类的物件的次数 X 的概率分布。
(二)特点1、总体分为两类。
2、抽取的样本数量 n 小于总体数量 N。
3、抽样方式为不放回抽样。
(三)概率计算公式如果随机变量 X 服从参数为 N、M 和 n 的超几何分布,记为 X ~H(N, M, n),那么 X = k 的概率为:P(X = k) = C(M, k) C(N M, n k) / C(N, n)(四)期望与方差期望 E(X) = n M / N方差 D(X) = n M / N (1 M / N) (N n) /(N 1)(五)应用举例一批产品共有 100 件,其中次品有 10 件,从中随机抽取 5 件,求抽到次品数 X 的概率分布。
二项分布和超几何分布,五分钟让你再也不迷糊!有一次被学生问到:老师您给我讲讲二项分布和超几何分布的区别吧。
我想,二项分布和超几何分布的区别大着呀,没道理会把它们弄混。
但是既然学生提出来了,就说明这样的疑惑的确存在,我们今天就来捋一捋,让疑者不疑,不疑者更明。
发生条件的不同二项分布:描述n次独立重复试验,而且该随机试验只有两种可能结果:发生或者不发生(也常说试验成功或失败)。
“独立”强调的是各次试验互相不干扰,“重复”强调的是每次试验中事件发生与否的概率保持不变。
超几何分布:描述由N个物件(其中有M个指定物件)中抽出n 个物件。
随机变量的不同二项分布的随机变量ξ是n次独立重复试验中试验成功的次数k。
超几何分布的随机变量ξ是抽出的n个物件中抽到指定种类的物件的个数m。
概率:在二项分布中,P(ξ=k)= C(n, k) * p^k * (1-p)^(n-k).在超几何分布中,P(ξ=m)= C(M, m) * C(N-M, n-m) / C(N,n).用一个“抽取合格品/次品”(换成双色小球也是一样)模型来对比上述两种分布:现有N件产品,其中M件合格品,N-M件次品。
1.从中抽取一件产品,为合格品的概率是?p=M/N2.每次抽取一件产品,抽完放回,抽n次(这里的n与N无关),共抽到k次合格品的概率是?C(n, k) * p^k * (1-p)^(n-k),其中p为第1问里的p.3.每次抽取一件产品,抽完不放回,抽n次(这里的不大于N),共抽到m次合格品的概率是?C(M, m) * C(N-M, n-m) / C(N,n)对于第3问中的情况,和1次性抽出n件产品,其中有m件合格品的概率是一样的。
能不能像第2问一样,用分步做乘法的方法来写概率呢?也可以的,不过因为不放回,产品总数在递减,每次抽到合格品的概率受之前抽到合格品还是次品的结果影响,所以不是独立重复实验了!为了帮助大家进一步看清楚,我举一个数目较小的具体例子来演示,3件产品,其中2件合格品,1件次品。
超几何分布与二项分布[知识点]关键是判断超几何分布与二项分布判断一个随机变量是否服从超几何分布,关键是要看随机变量是否满足超几何分布的特征:一个总体(共有N 个)内含有两种不同的事物()A M 个、()B N M -个,任取n 个,其中恰有X 个A .符合该条件的即可断定是超几何分布,按照超几何分布的分布列()k n k M N MnNC C P X k C --==(0,1,2,,k m = )进行处理就可以了.二项分布必须同时满足以下两个条件:①在一次试验中试验结果只有A 与A 这两个,且事件A 发生的概率为p ,事件A 发生的概率为1p -;②试验可以独立重复地进行,即每次重复做一次试验,事件A 发生的概率都是同一常数p ,事件A 发生的概率为1p -.1、某厂生产的产品在出厂前都要做质量检测,每一件一等品都能通过检测,每一件二等品通过检测的概率为23.现有10件产品,其中6件是一等品,4件是二等品.(Ⅰ)随机选取1件产品,求能够通过检测的概率;(Ⅱ)随机选取3件产品,其中一等品的件数记为X ,求X 的分布列;(Ⅲ)随机选取3件产品,求这三件产品都不能通过检测的概率.【解析】(Ⅰ)设随机选取一件产品,能够通过检测的事件为A…………………………1分事件A 等于事件“选取一等品都通过检测或者是选取二等品通过检测”……………2分151332104106)(=⨯+=A p …………………………4分(Ⅱ)由题可知X 可能取值为0,1,2,3.30463101(0)30C C P X C ===,21463103(1)10C C P X C ===,12463101(2)2C C P X C ===,03463101(3)6C C P X C ===.………………8分故X 的分布列为……………9分X 0123P3011032161(Ⅲ)设随机选取3件产品都不能通过检测的事件为B……………10分事件B 等于事件“随机选取3件产品都是二等品且都不能通过检测”所以,3111()()303810P B =⋅=.……………13分2、第26届世界大学生夏季运动会将于2011年8月12日到23日在深圳举行,为了搞好接待工作,组委会在某学院招募了12名男志愿者和18名女志愿者。