二项分布与超几何分布问题区别举例
- 格式:docx
- 大小:40.79 KB
- 文档页数:5
二项分布与超几何分布辨析山东 韩文文二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.例 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求: (1)有放回抽样时,取到黑球的个数X的分布列; (2)不放回抽样时,取到黑球的个数Y的分布列.解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均为,3次取球可以看成3次独立重复试验,则1~35X B ⎛⎫⎪⎝⎭,.0331464(0)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭∴;12131448(1)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭;21231412(2)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭;3033141(3)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭.因此,X 的分布列为X 01 2 3 P64125481251212511252.不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有: 03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101(2)15C C P Y C ===.因此,Y 的分布列为Y 01 2 P715715115辨析:通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的.超几何分布和二项分布都是离散型分布超几何分布和二项分布的区别:超几何分布需要知道总体的容量,而二项分布不需要;超几何分布是不放回抽取,而二项分布是放回抽取(独立重复)当总体的容量非常大时,超几何分布近似于二项分布.........1.离散型随机变量分布列的性质(1)Pi≥0,(2)P1+P2+…+Pn+…=1.(i=1,2,3…)2.离散型随机变量的期望与方差.(1)若离散型随机变量ξ的分布列为则Eξ= x1p1+x2p2+…+xnpn+ …(2)期望的性质E(c) = c,E(aξ+ b) = aEξ+ b(3)离散型随机变量的方差若离散型随机变量ξ的分布列为则Dξ= (x1-Eξ)2p1+(x2-Eξ)2p2+…+ (xn-Eξ)2pn+… (4)方差的性质:D(c) = 0,D(aξ+ b)=a2Dξ,Dξ=Eξ2-(Eξ)2.3.二项分布,几何分布的期望与方差若ξ~B (n, p),则Eξ=np,Dξ=np(1-p).变式新题型1.(2005年高考·浙江卷·理19)袋子A 中装有若干个均匀的红球和白球,从A中摸出一个红球的概率是31.(Ⅰ)从A 中有放回地摸球,每次摸出一个,有3次摸到红球即停止. (i) 求恰好摸5次停止的概率;(ii )记5次之内(含5次)摸到红球的次数为ξ,求随机变量ξ的分布列及数学期望E ξ. 解:(Ⅰ) (i )2224121833381C ⎛⎫⎛⎫⨯⨯⨯= ⎪ ⎪⎝⎭⎝⎭(ii)随机变量ξ的取值为0,1,2,3,; 由n 次独立重复试验概率公式()()1n kkkn n P k C pp -=-,得()55132013243P C ξ⎛⎫==⨯-=⎪⎝⎭; ()41511801133243P C ξ⎛⎫==⨯⨯-=⎪⎝⎭ ()232511802133243P C ξ⎛⎫⎛⎫==⨯⨯-=⎪ ⎪⎝⎭⎝⎭ ()323511173133243P C ξ⎛⎫⎛⎫==⨯⨯-=⎪ ⎪⎝⎭⎝⎭(或()328021731243243P ξ+⨯==-=) 随机变量ξ的分布列是ξ1 2 3 P32243802438024317243ξ的数学期望是32808017131012324324324324381E ξ=⨯+⨯+⨯+⨯=。
超几何分布和二项分布辨别材料:假设一批产品有100件,其中次品为10件。
那么:(1)有放回的抽样,抽n次,出现正品数的分布。
这个就是二项分布了,首先,这n次试验可能出现的正品数为0~n;它相当于做了n次试验,每次都是两点分布,也就是说你这抽取n次,每次是正品的概率都是0.9。
(2)如果不放回抽取m(≤100)个,这m件产品次品数的分布如何?此问就是超几何分布了,当然这个时候要讨论m与10谁大,以便确认分布的可能取值。
当总体足够大的时候,而抽取的样本有比较小(比如说十好几亿件产品只抽10个),此时两种分布就近似一样了。
二项分布解决的问题是独立重复试验,“重复”的意思是每次事件发生的概率相等。
题目中的条件是进行n次独立重复试验,每次试验中成功的概率为p,二项分布研究的是这n次试验中成功k次的概率。
当我们应用抽样调查的结论对总体进行估计时一般会用到二项分布,这时我们不知道总体的量。
一、二项分布1.某公司的一次招聘中,应聘者都要经过三个独立项目A,B,C的测试,如果通过两个或三个项目的测试即可被录用.若甲、乙、丙三人通过A,B,C每个项目测试的概率都是.(1)求甲恰好通过两个项目测试的概率;(2)设甲、乙、丙三人中被录用的人数为X,求X的概率分布和数学期望.【分析】(1)利用二项分布计算甲恰好有2次发生的概率;(2)由每人被录用的概率值,求出随机变量X的概率分布,计算数学期望值.【解答】解:(1)甲恰好通过两个项目测试的概率为;(2)因为每人可被录用的概率为,所以,,,;故随机变量X的概率分布表为:省略所以,X的数学期望为.2.生蚝即牡蛎(oyster)是所有食物中含锌最丰富的,在亚热带、热带沿海都适宜生蚝的养殖,我国分布很广,北起鸭绿江,南至海南岛,沿海皆可产生蚝,生蚝乃软体有壳,衣服寄生的动物,咸淡水交界所产尤为肥美,因此生蚝称为了一年四季不可或缺的一类美食,某饭店从某水产养殖厂购进一批生蚝,并随机抽取了40只统计质量,得到结果如表所示:质量(g)[5,15)[15,25)[25,35)[35,45)[45,55]数量6101284(1)若购进这批生蚝500kg,且同一组数据用该组区间的中点值代表,试估计这批生蚝的数量(所得结果保留整数);(2)以频率估计概率,若在本次购买的生蚝中随机挑选4个,记质量在[5,25)间的生蚝的个数为X,求X的分布列及数学期望.【解答】解:(1)由表中的数据可以估算妹纸生蚝的质量为:,所以购进500kg,生蚝的数量为500000÷28.5≈17554(只).(2)由表中数据知,任意挑选一只,质量在[5,25)间的概率为,X的可能取值为0,1,2,3,4,则,,∴X的分布列为:X01234P∴.【点评】本题考查概率的求法及应用,考查离散型随机变量的分布列及数学期望的求法,考查排列组合、古典概型等基础知识,考查运算求解能力,考查函数与方程思想,是中档题.3.随着我国互联网信息技术的发展,网络购物已经成为许多人消费的一种重要方式,某市为了了解本市市民的网络购物情况,特委托一家网络公示进行了网络问卷调查,并从参与调查的10000名网民中随机抽取了200人进行抽样分析,得到了下表所示数据:经常进行网络购物偶尔或从不进行网络购物合计男性5050100女性6040100合计11090200(1)依据上述数据,能否在犯错误的概率不超过0.15的前提下认为该市市民进行网络购物的情况与性别有关?(2)现从所抽取的女性网民中利用分层抽样的方法再抽取5人,从这5人中随机选出3人赠送网络优惠券,求出选出的3人中至少有两人是经常进行网络购物的概率;(3)将频率视为概率,从该市所有的参与调查的网民中随机抽取10人赠送礼物,记经常进行网络购物的人数为X,求X的期望和方差.附:,其中n=a+b+c+dP(K2≥k0)0.150.100.050.0250.010k0 2.072 2.706 3.841 5.024 6.635【分析】(1)由列联表数据求出K2≈2.020<2.072,从而不能在犯错误的概率不超过0.15的前提下认为该市市民网购情况与性别有关.(2)由题意,抽取的5名女性网民中,经常进行网购的有3人,偶尔或从不进行网购的有2人,由此能求出从这5人中选出3人至少有2人经常进行网购的概率.(3)由列联表可知,经常进行网购的频率为,由题意,从该市市民中任意抽取1人恰好是经常进行网购的概率是,由于该市市民数量很大,故可以认为X~B(10,),由此能求出X 的期望和方差.【解答】解:(1)由列联表数据计算K2=≈2.020<2.072,∴不能在犯错误的概率不超过0.15的前提下认为该市市民网购情况与性别有关.(2)由题意,抽取的5名女性网民中,经常进行网购的有5×=3人,偶尔或从不进行网购的有5×=2人,故从这5人中选出3人至少有2人经常进行网购的概率是p=+=.(3)由列联表可知,经常进行网购的频率为,由题意,从该市市民中任意抽取1人恰好是经常进行网购的概率是,由于该市市民数量很大,故可以认为X~B(10,),∴E(X)=,D(X)==.二、超几何分布1.随着网络营销和电子商务的兴起,人们的购物方式更具多样化,某调查机构随机抽取10名购物者进行采访,5名男性购物者中有3名倾向于选择网购,2名倾向于选择实体店,5名女性购物者中有2名倾向于选择网购,3名倾向于选择实体店.(Ⅰ)若从这10名购物者中随机抽取2名,其中男、女各一名,求至少1名倾向于选择实体店的概率;(Ⅱ)若从这10名购物者中随机抽取3名,设X表示抽到倾向于选择网购的男性购物者的人数,求随机变量X的分布列及数学期望.【分析】(Ⅰ)设“至少1名倾向于选择实体店”为事件A,则表示事件“随机抽取2名,(其中男、女各一名)都选择网购”,则P(A)=1﹣P.(Ⅱ)X的取值为0,1,2,3.P(X=k)=,即可得出.【解答】解:(Ⅰ)设“至少1名倾向于选择实体店”为事件A,则表示事件“随机抽取2名,(其中男、女各一名)都选择网购”,则P(A)=1﹣P=1﹣=.(Ⅱ)X的取值为0,1,2,3.P(X=k)=,P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=.X的分布列为:X0123PE(X)=0×+1×+2×+3×=.2.中国北斗卫星导航系统是中国自行研制的全球卫星导航系统,作为国家战略性空间基础设施,我国北斗卫星导航系统不仅对国防安全意义重大,而且在民用领域的精准化应用也越来越广泛.据统计,2016年卫星导航与位置服务产业总产值达到2118亿元,较2015年约增长22.06%.下面是40个城市北斗卫星导航系统与位置服务产业的产值(单位:万元)的频率分布直方图:(1)根据频率分布直方图,求产值小于500万元的城市个数;(2)在上述抽取的40个城市中任取2个,设Y为产值不超过500万元的城市个数,求Y的分布列及期望和方差.【分析】(1)根据频率分布直方图,能求出产值小于500万元的城市个数.(2)由Y的所有可能取值为0,1,2.分别滶出相应的概率,由此能求出Y的分布列及期望和方差.【解答】解:(1)根据频率分布直方图可知,产值小于500万元的城市个数为:[(0.03+0.04)×5]×40=14.(2)Y的所有可能取值为0,1,2.,,.∴Y的分布列为:Y012P期望为:,方差为:.。
关于二项分布与超几何分布问题区别举例Company number:【0089WT-8898YT-W8CCB-BUUT-202108】关于“二项分布”与“超几何分布”问题举例一.基本概念 1.超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件X=k 发生的概率为:P(X=k)=n Nk n MN k M C C C --⋅,k= 0,1,2,3,,m ;其中,m = minM,n,且n N , M N . n,M,N N 为超几何分布;如果一个变量X 的分布列为超几何分布列,则称随几变量X 服从超几何分布.其中,EX= n MN2.二项分布在n次独立重复试验中,设事件A 发生的次数为X,在每次试验中,事件A 发生的概率为P,那么在n次独立重复试中,事件A恰好发生k次的概率为:P(X=k)= C n k p k(1-p)n-k(k=0,1,2,3,,n),此时称随机变量X服从二项分布.记作:X B(n,p),EX= np3.“二项分布”与“超几何分布”的联系与区别(1)“二项分布”所满足的条件每次试验中,事件发生的概率是相同的;是一种放回抽样.各次试验中的事件是相互独立的;每次试验只有两种结果,事件要么发生,要么不发生;随机变量是这n次独立重复试验中事件发生的次数.(2)“超几何分布”的本质:在每次试验中某一事件发生的概率不相同,是不放回抽样,“当样本容量很大时,超几何分布近似于二项分布;合”,使得“超几何分布”期望的计算大简化.共同点:每次试验只有两种可能的结果:成功或失败。
不同点:1、超几何分布是不放回抽取,二项分布是放回抽取;2、超几何分布需要知道总体的容量,二项分布不需要知道总体容量,但需要知道“成功率”;联系:当产品的总数很大时,超几何分布近似于二项分布。
因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的. 二.典型例题例1:袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求:(1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列.解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均为15,3次取球可以看成3次独立重复试验,则1~35X B ⎛⎫⎪⎝⎭,. 03031464(0)55125P X C ⎛⎫⎛⎫==⨯=⎪ ⎪⎝⎭⎝⎭∴;12131448(1)55125P X C ⎛⎫⎛⎫==⨯=⎪ ⎪⎝⎭⎝⎭; 21231412(2)55125P X C ⎛⎫⎛⎫==⨯=⎪ ⎪⎝⎭⎝⎭; 333141(3)55125P X C ⎛⎫⎛⎫==⨯=⎪ ⎪⎝⎭⎝⎭.因此,X 的分布列为(2).不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有:03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101(2)15C C P YC ===.因此,Y 的分布列为例2.在10件产品中,有3件一等品,4件二等品,3件三等品,从这10件产品中任取3件,求:(1) 取出的3件产品中一等品件数多于二等品件数的概率.(2) 记:X表示“取出的3件产品中一等品件数多于二等品件数的数量”,求X 的分布列并求EX;分析:由题可知:从10件产品中分别任取两次得到“一等品”或“二等品”的概率是不相等的,因此是一种不放回抽样;随机变量 X服从超几何分布.解:(1) 记A1:取出3件一等品;A2:取出2件一等品;A3:取出1件一等品,二件三等品.A1、A2、A3互斥,P(A 1)= C 33C 103 = 1120 , P(A 2)= C 32C 71C 103 =740,P(A 3)= C 31C 72C 103 = 340 ; 所以,P =P(A 1)+ P(A 2)+ P(A 3)= 31120 .(2)X=0,1,2,3; X 服从超几何分布,所以P(X=0)= P(一件一等品,一件二等品,一件三等品)=310131413C C C C =310;P(X=1)=P (二件一等品,一件二等品) =3101423C C C =110; P(X=2)=P(三件一等品,一件二等品)=3101433C C C =130 ; P(X=3)= P (三件一等品,零件二等品)= 3100433C C C = 1120;EX = nM N = 3310=说明:谨防错误地认为随机变量X 服从二项分布,即:XB(3, 31120).例3.从某高中学校随机抽取16名学生,经校医检查得到每位学生的视力,其中“好视力”4人,以这16人的样本数据来估计整个学校的整体数据,若从该校(人数很多)任选3人,记X表示抽到“好视力”学生的人数,求X的分布列及数学期望.分析:本题就是从“该校(人数很多)任选3人”,由此得到“好视力”人数X,若每次从该校任取一名学生为“好视力”这一事件的概率显然是相等的,因为该校“人数很多”相当于“有放回抽样”,因此,随机变量X服从“二项分布”而不是“超几何分布”.解:由题可知:X= 0,1,2,3;由样本估计总体,每次任取一人为“好视力”的概率为: P = 416 = 14,则XB(3,14 );P(X=0)= C 30( 14 )0(1- 14)3-0 = 2764; P(X=1)= C 31( 14 )1(1- 14)3-1 = 2764 ;P(X=2)= C 32( 14 )2(1- 14 )3-2 = 964 ;P(X=3)= C 33( 14 )3(1- 14 )3-3 = 164;EX = 3×14 = 34. 说明:假设问题变为:“从16名学生中任取3名,记X 表示抽到“好视力”学生的人数,求X 的分布列及数学期望”.那么X 服从“超几何分布”,即:P(X=k)= 3163124C C C k k ,(X=0,1,2,3),其中,数学期望值不变,即为:EX= 3×416 = 34.。
关于超几何分布和二项分布的小题目徐峰在教学过程中发现学生在学习完超几何分布和二项分布以后,学生不能正确的理解好什么是超几何分布(古典概型利用组合数计数)、什么是二项分布(利用独立性,互斥性)及其区别.下面我通过几个例子说明一下两者的区别超几何分布:在产品质量的不放回抽检中,若N 件产品中有M 件次品,抽检n 件时所得次品数X=k 则P(X=k)此时我们称随机变量X 服从超几何分布(hypergeometric distribution ) 1)超几何分布的模型是不放回抽样 2)超几何分布中的参数是M,N,n上述超几何分布记作X~H(n ,M ,N)。
二项分布:二项分布(Binomial Distribution ),即重复n 次的伯努力试验(Bernoulli Experiment ),用ξ表示随机试验的结果.如果事件发生的概率是P,则不发生的概率q=1-p ,N 次独立重 复试验中发生k 次的概率是k n k kn q p k P C -==)(ξ 上述二项分布记作),(~p n B ξ下面我通过几个例子说明一下两者的区别【例1】某人参加一次英语考试,已知在备选题的10道试题中能答出其中的4道题,规定每次考试从备选题中随机抽取3题进行测试,求答对题数ξ的分布列?解:由题意得0=ξ,1,2,3.ξ服从参数为10=N ,4=M ,3=n 的超几何分布.6112020)0(31036====C C P ξ2112060)1(3102614==•==C C C P ξ10312036)2(3101624==•==C C C P ξ3011204)3(31034====CC P ξ故ξ的分布列把事件发生的概率看做是0.4。
【例2】甲乙两人玩秒表游戏,按开始键,然后随机按暂停键,观察秒表最后一位数,若出现0,1,2,3则甲赢,若最后一位出现6,7,8,9则乙赢,若最后一位出现4,5是平局.玩三次,记甲赢的次数为变量X ,求X 的分布列解:由题意得:0=X ,1,2,3216.06.0)0(303===C X P 432.04.06.0)1(213=⨯⨯==C X P 288.04.06.0)2(223=⨯⨯==C X P 064.04.0)3(333===C X P点评:学生这是一道二项分布的题目,学生容易看成超几何分布,认为服从10=N ,4=M ,3=n 的超几何分布。
超几何分布和二项分布的联系和区别开滦一中张智民在最近的几次考试中,总有半数的的学生搞不清二项分布和超几何分布,二者到底该如何区分呢?什么时候利用二项分布的公式解决这道概率问题?什么时候用超几何分布的公式去解决呢?好多学生查阅各种资料甚至于上网寻找答案,其实这个问题的回答就出现在教材上,人教版新课标选修2-3从两个方面给出了很好的解释.诚可谓:众里寻他千百度,蓦然回首,那人却在灯火阑珊处! 一、两者的定义是不同的教材中的定义: (一)超几何分布的定义在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k) =nNk -n M-N k MCC C,,2,1,0k, m,其中m=min{M,n},且n ≤N,M ≤N,n,M,N ∈N,称随机变量X 服从超几何分布(二)独立重复试验和二项分布的定义1)独立重复试验:在相同条件下重复做的n 次试验,且各次试验试验的结果相互独立,称为n 次独立重复试验,其中A(i=1,2,…,n)是第ⅰ次试验结果,则P(A1A2A3…An)=P(A 1)P(A2)P(A3)…P(An)2)二项分布在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中事件A 发生的概率为P,则P(X=k)=kn kp p )1(Ck n(k=0,1,2,…,n),此时称随机变量X 服从二项分布,记作X~B(n,p),并称P 为成功概率。
1.本质区别(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题; (2)超几何分布中的概率计算实质上是古典概型问题;二项分布中的概率计算实质上是相互独立事件的概率问题2.计算公式超几何分布:在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)=nNk -n M-N k MCC C,,2,1,0k, m,二项分布:在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中事件A 发生的概率为P,则P(X=k)=kn kp p )1(Ck n(k=0,1,2,…,n),温馨提示:当题目中出现“用样本数据估计XXX 的总体数据”时,均为二项分布问题。
二项分布与超几何分布辨析超几何分布和二项分布都是离散型分布超几何分布和二项分布的区别:超几何分布需要知道总体的容量,而二项分布不需要;超几何分布是不放回抽取,而二项分布是放回抽取(独立重复)当总体的容量非常大时,超几何分布近似于二项分布.........例1袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求:(1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列.例2.某市十所重点中学进行高三联考,共有5000名考生,为了了解数学学科的学习情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表: (1)根据上面的频率分布表,求①,②,③,④处的数值;(2)根据上面的频率分布表,在所给的坐标系中画出在区间[]80,150上的频率分布直方图; (3)如果把表中的频率近似地看作每个学生在这次考试中取得相应成绩的概率,那么从总体中任意抽取3个个体,成绩落在[]100,120中的个体数为ξ,求ξ的分布列和数学期望.练习2.为从甲、乙两名运动员中选拔一人参加2010年广州亚运会跳水项目,对甲、乙两名运动员进行培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得出茎叶图如图所示(Ⅰ)从平均成绩及发挥稳定性的角度考虑,你认为选派哪名运动员合适? (Ⅱ)若将频率视为概率,对甲运动员在今后3次比赛成绩进行预测,记这3次成绩中高于80分的次数为ξ,求ξ的分布列及数学期望E ξ。
分组频数 频率 [)80,90 ① ② [)90,100 0.050 [)100,110 0.200 [)110,12036 0.300 [)120,130 0.275 [)130,14012 ③ [)140,1500.050 合计④甲 乙5 32 58 0 3 5 5 4 1 9 8 7 9123510152025 参加人数 活动次数例3.按照新课程的要求, 高中学生在每学期都要至少参 加一次社会实践活动(以下简称活动).某校高一· 一班50名学生在上学期参加活动的次数统计如条 形图所示.(I )求该班学生参加活动的人均次数x ;(II )从该班中任意选两名学生,求他们参加活动 次数恰好相等的概率;(III )从该班中任选两名学生,用ξ表示这两人参加活动次数之差的绝对值,求随机变量ξ的分布列及数学期望E ξ.(要求:答案用最简分数表示)练习3.某校参加高一年级期中考试的学生中随机抽出60名学生,将其数学成绩分成六段[40,50]、[50,60]、…、[90,100]后得到如下部分频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80]内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)若从60名学生中随抽取2人,抽到的学生成绩在[40,60]记0分,在[60,80]记1分,在[80,100]记2分,用ξ表示抽取结束后的总记分,求ξ的分布列和数学期望。
超几何分布与二项分布辨析对于离散型随机变量的这两种分布列,学生经常分不清楚,特别是对于同一个具体问题错误的使用另一种分布列模型时所求的期望又是正确的,这更加使学生感到困惑。
下面从两个方面来区分这两种分布列。
一、基本概念1.独立重复试验与二项分布(1)一般地,在相同条件下,重复做的n 次试验称为n 次独立重复试验.各次试验的结果不受其它试验的影响.(2)一般地,在n 次独立重复试验中,设事件A 发生的次数为X ,在每次试验中事件A 发生的概率都为p ,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为P (X =k )=C k n p k (1-p )n -k ,k =0,1,2,…,n . 则称随机变量X 服从参数为n 、p 的二项分布,记作X ~B (n ,p ),并称p 为成功概率.2.超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{X =k }发生的概率为P (X =k )=nNkn MN k M C C C --,k =0,1,2,…,m ,(其中m 是M ,n 中的最小值,n ≤N ,M ≤N ,n 、M 、N ∈N *). 则称分布列为超几何分布列,如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布记作X ~H(N 、M 、n).3.二项分布、超几何分布的均值、方差(1)若X ~B (n ,p ),则E (X )=np ,D (X )=np (1-p ). (2)若X ~H (N 、M 、n ),则E (X )=nMN.二、两种分布列的区别(一)从抽样方法来区分例1、盒子中有大小相同的4个红球和6个黑球.(1)从中每次取出1个球然后放回,连续抽取三次,求取到红球次数X 的分布列。
解:由已知X~N(3,0.4),()())3,2,1,0(,4.014.033=-⋅⋅==-k C k X P kk k所以,X 的分布列为:()2.14.03=⨯=X E(2)从中逐个不放回的抽取出3个球(效果等同于一次同时取出3个球),求取到红球个数Y 的分布列。
用个例子解答吧:假设一批产品有100件,其中次品为10件。
那么:
(1)从中抽取一件产品,为正品的概率?像这种可能结果只有两种(抽的结果正品或次品)情况下就可以归纳为两点分布。
(2)有放回的抽样,抽n次,出现正品数的分布。
这个就是二项分布了,首先,这n 次试验可能出现的正品数为0~n;它相当于做了n次试验,每次都是两点分布,也就是说你这抽取n次,每次是正品的概率都是0.9。
(3)如果不放回抽取m(≤100)个,这m件产品次品数的分布如何?此问就是超几何分布了,当然这个时候要讨论m与10谁大,以便确认分布的可能取值,这里不赘述了。
(4)正态分布是自然界最常见的一种分布。
该分布由两个参数——平均值和方差决定。
它和其它各种分布都有着直接或间接的联系,比如说此题中二项分布,其实每个人抽取n次,最后的结果都是不尽相同的,这是由于抽样误差引起的。
但是,如果好多人(N)都做这么一次试验(每个人都抽n次,并记录下正品数),那么这N个人抽到的正品数的分布就是一个正态分布了。
(正太分布往往是和其它分布的极限分布联系起来的,也就是说N→∞;如果N为有限的<假设为4个>那么N的分布最复杂也就是4个结果)
超几何分布和二项分布都是离散型分布
超几何分布和二项分布的区别:
超几何分布需要知道总体的容量,而二项分布不需要;
超几何分布是不放回抽取,而二项分布是放回抽取(独立重复)当总体的容量非常大时,超几何分布近似于二项分布.........阅读(131)|评论(1)。
关于“二项分布”与“超几何分布”问题举例
一.基本概念
1.超几何分布
一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,
则事件X=k 发生的概率为:P(X=k)= n
N
k n M
N k M C C C --⋅,k= 0,1,2,3,,m ;其中,m = minM,n,且n N , M N . n,M,N N 为超几何分布;如果一个变量X 的分布列为超几何分布列,则称随几变量X 服从超几何分布.其中,EX= n M
N
2.二项分布
在n 次独立重复试验中,设事件A 发生的次数为X,在每次试验中,事件A 发生的概率为P,那么在n 次独立重复试中,事件A 恰好发生k 次的概率为:
P(X=k)= C n k
p k
(1-p)n-k
(k=0,1,2,3,,n),此时称随机变量X 服从二项分布.
记作:X B(n,p),EX= np
3.“二项分布”与“超几何分布”的联系与区别
(1)“二项分布”所满足的条件
每次试验中,事件发生的概率是相同的;是一种放回抽样.各次试验中的事件是相互独立的;每次试验只有两种结果,事件要么发生,要么不发生;随机变量是这n 次独立重复试验中事件发生的次数.
(2)“超几何分布”的本质:在每次试验中某一事件发生的概率不相同,是不放回抽样,“当样本容量很大时,超几何分布近似于二项分布;
(3)“二项分布”和“超几何分布”是两种不同的分布,但其期望是相等的.即:把一个分布看成是“二项分布”或“超几何分布”时,它们的期望是相同的.
分布”和“二项分布”的这种“巧合”,使得“超几何分布”期望的计算大简化.
共同点:每次试验只有两种可能的结果:成功或失败。
不同点:1、超几何分布是不放回抽取,二项分布是放回抽取;
2、超几何分布需要知道总体的容量,二项分布不需要知道总体容量,但
需要知道“成功率”;
联系:当产品的总数很大时,超几何分布近似于二项分布。
因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的.
二.典型例题
例1:袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求:
(1)有放回抽样时,取到黑球的个数X的分布列;
(2)不放回抽样时,取到黑球的个数Y的分布列.
解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次
取到黑球的概率均为15,3次取球可以看成3次独立重复试验,则1
~35X B ⎛⎫ ⎪⎝⎭,.
3
03
1464(0)55125
P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭∴;
12
13
1448(1)55125P X C ⎛⎫⎛⎫
==⨯= ⎪ ⎪⎝⎭⎝⎭
;
2
1
23
1412(2)55125P X C ⎛⎫⎛⎫
==⨯= ⎪ ⎪⎝⎭⎝⎭;
3
33
141(3)55125
P X C ⎛⎫⎛⎫
==⨯= ⎪ ⎪⎝⎭⎝⎭.
因此,X 的分布列为
(2).不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有:
03
283107
(0)15
C C P Y C ===
;12283107(1)15C C P Y C ===;21
283101
(2)15
C C P
Y C ===.
因此,Y 的分布列为
例2.在10件产品中,有3件一等品,4件二等品,3件三等品,从这10件产品中任取3件,求:
(1) 取出的3件产品中一等品件数多于二等品件数的概率.
(2) 记:X 表示“取出的3件产品中一等品件数多于二等品件数的数量”,求X 的分布列并求EX;
分析:由题可知:从10件产品中分别任取两次得到“一等品”或“二等品”的概率是不相等的,因此是一种不放回抽样;随机变量 X 服从超几何分布.
解:(1) 记A 1:取出3件一等品;A 2:取出2件一等品;A 3:取出1件一等品,二件三等品.A 1、A 2、A 3互斥,P(A 1)= C 33C 103 = 1120 , P(A 2)= C 32C 71C 103 = 7
40 ,
P(A 3)= C 31C 72C 103 = 340 ; 所以,P = P(A 1)+ P(A 2)+ P(A 3)= 31
120 .
(2)X=0,1,2,3; X 服从超几何分布,
所以P(X=0)= P(一件一等品,一件二等品,一件三等品)=310
13
1413C C C C = 310 ;
P(X=1)=P (二件一等品,一件二等品) = 31014
23C C C = 110 ;
P(X=2)=P(三件一等品,一件二等品)= 310
14
33C C C = 130 ;
P(X=3)= P (三件一等品,零件二等品)= 3
10
433C C C = 1120
;
EX =
nM N = 33
10
=
说明:谨防错误地认为随机变量X 服从二项分布,即:XB(3, 31120
).
例3.从某高中学校随机抽取16名学生,经校医检查得到每位学生的视力,其中“好视力”4人,以这16人的样本数据来估计整个学校的整体数据,若从该校(人数很多)任选3人,记X 表示抽到“好视力”学生的人数,求X 的分布列及数学期望.
分析:本题就是从“该校(人数很多)任选3人”,由此得到“好视力”人数X ,若每次从该校任取一名学生为“好视力”这一事件的概率显然是相等的,因为该校“人数很多”相当于“有放回抽样”,因此,随机变量X 服从“二项分布”而不是“超几何分布”.
解:由题可知:X= 0,1,2,3;由样本估计总体,每次任取一人为“好视力”的概率为: P = 416 = 14 ,则XB(3,14 );P(X=0)= C 30
( 14 )0(1- 14 )3-0 = 2764 ;
P(X=1)= C 31( 14 )1(1- 14 )3-1 = 2764 ;P(X=2)= C 32( 14 )2(1- 14 )3-2 = 9
64 ;
P(X=3)= C 33
( 14 )3(1- 14 )3-3 = 164 ;EX = 3×14 = 3
4
.
说明:假设问题变为:“从16名学生中任取3名,记X 表示抽到“好视力”学生
的人数,求X 的分布列及数学期望”.那么X 服从“超几何分布”,即:P(X=k)=
3
16
312
4C C C k
k ,(X=0,1,2,3),其中,数学期望值不变,即为:EX= 3×416 = 34 .。