超几何分布与二项分布的联系
- 格式:doc
- 大小:61.00 KB
- 文档页数:5
§超几何分布与二项分布的区别与联系1、二项分布:一般地,在n 次独立重复试验中,设事件A 发生的次数为X ,在每次试验中事件A 发生的概率为p ,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为()(1),0,1,2,...,.k k n k n P X k C p p k n -==-=此时称随机变量X 服从二项分布,记作X ~(,)n p ,并称p 为成功概率。
2.超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则(),0,1,2,...,.k N K M N M n NC C P X k k m C --⋅=== 此时称随机变量X 服从超几何分布。
注意:超几何分布中必须同时满足两个条件:一是抽取的产品不再放回去; 二是产品数是有限个为N (总数较少).当这两个条件中任意一个发生改变,则不再是超几何分布.一、 当抽取的方式从无放回变为有放回,超几何分布变为二项分布【例1】从含有3件次品的10产品中有放回地逐次取,每次取一个,取3次,用X 表示次品数。
(1) 求X 的分布列;(2) 求()E X 和()D X二、 当产品总数N 很大时,超几何分布变为二项分布【例2】 从批量较大的产品中,随机取出10件产品进行质量检测,若这批产品的不合格率为0.05,随机变量ξ表示这10件产品中的不合格品数,求随机变量ξ的数学期望()E ξ【例3】根据我国相关法规则定,食品的含汞量不得超过1.00ppm,沿海某市对一种贝类海鲜产品进行抽样检查,抽出样本20个,测得含汞量(单位:ppm)数据如下表所示:(1)若从这20个产品中随机任取3个,求恰有一个含汞量超标的概率;(2)以此20个产品的样本数据来估计这批贝类海鲜产品的总体,若从这批数量很大的贝类海鲜产品中任选3个,记ξ表示抽到的产品含汞量超标的个数,求ξ的分布列及数学期望Eξ.()【例5】一条生产线上生产的产品按质量情况分为三类:A类、B类、C类。
超几何分布和二项分布超几何分布和二项分布是概率论中两种重要的离散型概率分布。
它们都在描述了离散型随机变量的分布规律,但在具体的描述和应用上有一定的区别。
本文将分别介绍超几何分布和二项分布的定义、特点、性质和应用,并对两者之间的关系和区别进行详细的比较分析。
一、超几何分布的定义、特点和性质超几何分布是描述了一种从有限个物件中抽出样本不放回地抽取成功次数的概率分布。
具体来说,超几何分布描述了在总体中有M个成功物件和N-M个失败物件时,从总体中抽取n个物件,其中成功物件的个数X的分布概率。
其概率质量函数为:P(X=k) = (M choose k) * (N-M choose n-k) / (N choose n),其中(M choose k)表示从M个物件中抽取k个物件的组合数。
超几何分布的特点有以下几点:1.超几何分布是离散型概率分布,其取值只能是非负整数。
2.超几何分布的期望值和方差分别为E(X) = n * M/N, Var(X) =n * M/N * (N-M)/N * (N-n)/(N-1)。
3.超几何分布的分布形状随着总体大小和成功物件的比例而改变,当总体很大时,超几何分布近似于二项分布。
超几何分布在实际应用中有着广泛的应用。
例如在质量抽样、抽样调查、生物统计学等领域,常常需要进行不放回地从总体中抽取物件的情况,而超几何分布恰好可以描述这类情况下随机变量的分布规律。
二、二项分布的定义、特点和性质二项分布是描述了n次独立重复的伯努利试验中成功次数的概率分布。
具体来说,二项分布描述了n次重复试验中成功的次数X的概率分布。
其概率质量函数为:P(X=k) = (n choose k) * p^k * (1-p)^(n-k),其中(n choose k)表示从n次试验中成功k次的组合数。
二项分布的特点有以下几点:1.二项分布是离散型概率分布,其取值只能是非负整数。
2.二项分布的期望值和方差分别为E(X) = np, Var(X) = np(1-p)。
超几何分布与二项分布的联系超几何分布和二项分布确实有着密切的联系,但也有明显的区别。
课本对于超几何分布的定义是这样的:一般的,若一个随机变量的分布列为,其中,,则称服从超几何分布,记为。
其概率分布表为:对于二项分布的定义是这样的:若随机变量的分布列为,则称服从参数为的二项分布,记为。
其概率分布表为: 超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量的取值都从0连续变化到,对应概率和三个值密切相关.可见两种分布之间有着密切的联系.课本中对超几何分布的模型建立是这样的:若有N件产品,其中M件是废品,无返回地任意抽取n件,则其中恰有的废品件数X是服从超几何分布的。
而对二项分布则使用比较容易理解的射击问题来建立模型。
若将但超几何分布的概率模型改成:若有N件产品,其中M件是废品,有返回的任意抽取n件,则其中恰有的废品件数X是服从二项分布的。
在这里,两种分布的差别就在于“有”与“无”的差别,只要将概率模型中的“无”改为“有”,或将“有”改为“无”,就可以实现两种分布之间的转化。
“返回”和“不返回”就是两种分布转换的关键。
如在2.2节有这样一个例题:高三(1)班的联欢会上设计了一项游戏:在一个口袋中装有10个红球、20个白球,这些球除颜色外完全相同,一次从中摸出5个球,摸到4个红球1个白球就是一等奖,求获一等奖的概率。
本题采用的解法是摸出球中的红球个数X服从超几何分布,但是如果将“一次从中摸出5个球”改为“摸出一球记下颜色,放回后再摸一球,反复5次”,则摸出球中的红球个数X将不再服从超几何分布,而是服从二项分布。
我们分别来计算两种分布所对应的概率: 这时发现发现两种不同的分布其对应的概率之间的差距进一步缩小了,我们做出这样的猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布!也就是说,下面我们对以上猜想作出证明:产品个数N无限大,设废品率为p,则, 以上的证明与我们的直观思想相吻合:在废品为确定数M的足够多的产品中,任意抽取n个(由于产品个数N无限多,无返回与有返回无区别,故可看作n次独立试验)中含有k个废品的概率当然服从二项分布。
关于“二项分布”与“超几何分布”问题举例概率问题是历年高考必考内容,也是高考试题研究的热点话题;因此,对于这部分内容,我们在备考复习中也投入了大量的精力,作了充分的准备;然而,在平时的练习和模考中,经常会发现学生的错误频频,准确地讲:对“二项分布”和“超几何分布”的概念模糊,判断不准,互相误用,导致错误;为此,本文对“二项分布”和“超几何分布”的概念和应用作出具体的剖析. 一.基本概念 1.超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件⎨X=k ⎬发生的概率为:P(X=k)= nNkn MN k M C C C --⋅,k= 0,1,2,3,⋯⋯,m ;其中,m = min ⎨M,n ⎬,且n ≤ N , M ≤ N . n,M,N ∈ N *为超几何分布;如果一个变量X 的分布列为超几何分布列,则称随几变量X 服从超几何分布.其中,EX= n ⋅ M N2.二项分布在n 次独立重复试验中,设事件A 发生的次数为X,在每次试验中,事件A 发生的概率为P ,那么在n 次独立重复试中,事件A 恰好发生k 次的概率为: P(X=k)= C n k p k (1-p)n-k (k=0,1,2,3,⋯,n),此时称随机变量X 服从二项分布. 记作:X ~ B(n,p),EX= np3.“二项分布”与“超几何分布”的联系与区别 (1)“二项分布”所满足的条件每次试验中,事件发生的概率是相同的;是一种放回抽样. 各次试验中的事件是相互独立的;●每次试验只有两种结果,事件要么发生,要么不发生;❍随机变量是这n次独立重复试验中事件发生的次数.(2)“超几何分布”的本质:在每次试验中某一事件发生的概率不相同,是不放回抽样,“当样本容量很大时,超几何分布近似于二项分布;(3)“二项分布”和“超几何分布”是两种不同的分布,但其期望是相等的.几何分布”和“二项分布”的这种“巧合”,使得“超几何分布”期望的计算大简化.共同点:每次试验只有两种可能的结果:成功或失败。
二项分布和超几何分布二项分布和超几何分布是统计学中比较常见的两个概率分布,它们都是很重要的知识点,被应用在许多领域,尤其是生物和药物研究等统计分析中。
在本文中,我们将对这两个概率分布进行介绍和比较,包括定义、性质、应用、关系以及如何求解这两个概率分布。
一、二项分布二项分布是一种偏态分布,也被称为二项概率分布,它以独立的事件进行描述,用来描述一个独立的试验或该试验的结果。
它形成了一种定义精确的概率模型,用来对实际问题进行分析、预测和解决。
二项分布中有两个参数,即n(试验次数)和p(每次试验成功的概率)。
假设有一个试验,该试验有n次,每次试验成功的概率为p,则最终成功的次数X服从二项分布:X~B(n,p)。
其性质如下:(1)二项分布的期望值E[X] = np。
(2)二项分布的方差 D[X]= npq=np(1-p)。
(3)当n趋于无穷大,p趋于某一定值时,此时X服从泊松分布。
(4)二项分布的n和p均大于0,当n=1时,二项分布即成为伯努利分布。
二项分布的应用非常广泛,常被应用在质量控制、生物学、总体调查中。
比如,在质量检验中,二项分布被应用在检验样本中不良品率检验;在生物学中,可以用二项分布研究DNA分子的突变率;在总体调查中,也可用二项分布来描述一个样本是否属于某一总体。
求解二项分布的方法:一般通过概率计算和抽样模拟的方法。
概率计算方法是对二项分布概率的精确计算,即在已知成功的概率p和试验次数n的情况下,可以精确算出在n次试验中成功m次出现的概率。
而抽样模拟方法是通过实际模拟事件,用实际上发生的次数来估计概率,为此可以用计算机模拟,从而统计概率出现的次数。
二、超几何分布超几何分布也称为无限取样分布,是一种古典的概率分布,用来描述一系列独立事件中指定类型的成功次数的分布情况。
它和二项分布很相似,但它的背后的模型是不同的。
超几何分布有三个参数,即n(试验次数)、N(总体样本数)和p(每次试验成功的概率)。
超几何分布和二项分布
超几何分布与二项分布是统计分析中常用的概率分布,它们通常
在不同的环境中应用。
深入了解这两种分布有助于我们理解统计模型,并精确地将现实世界与数学理论联系起来。
首先,超几何分布是一种分布,它描述了一件事情中事件发生的
概率。
这件事情可以是抛洒抛骰子,当抛n次投掷骰子时,超几何分
布就可以描述这次投掷中,某个特定的数字骰子的概率分布。
特别的,如果我们观察那些有共同特征的事件发生的情况,超几何分布可以描
述该情况的发生概率。
其次,二项分布是另一种分布,它是超几何分布的一般化。
也就
是说,二项分布是一种由n个独立试验组成的随机实验,每次试验能
返回True或False两种结果。
在该实验中,某种指定的结果“True”
发生的概率就是超几何分布,而当观察两个或更多事件发生的状况,
就将特征整合到二项分布中去了。
此外,超几何分布和二项分布都可以用于模拟不同事件的发生概率。
超几何分布用于模拟单次实验的发生概率,而二项分布则可以用
于模拟两个或更多事件发生的状况。
也就是说,超几何分布更偏向于
简单的一次实验,而二项分布则可以用来模拟现实世界更复杂的事件
发生概率。
最后,超几何分布和二项分布都是统计学中常用的概率分布形式。
超几何分布用于模拟单次实验的发生概率,适用于单一特征的实验;
二项分布则可以模拟多事件发生的情况,通常在多特征实验中使用。
理解这两种概率分布的基本原理和应用,将有助于理解统计模型,帮
助我们更准确地把现实世界与数学理论联系起来。
二项分布与超几何分布知识点
二项分布与超几何分布都是概率论中的重要分布,下面为你介绍两者的知识点:
- 定义不同:
- 超几何分布:描述的是不放回抽样问题。
- 二项分布:描述的是放回抽样问题。
- 概率计算不同:
- 超几何分布中的概率计算实质上是古典概型问题。
- 二项分布中的概率计算实质上是相互独立事件的概率问题。
- 联系:当调查研究的样本容量非常大时,在有放回地抽取与无放回地抽取条件下,计算得到的概率非常接近,可以近似把超几何分布认为是二项分布。
二项分布和超几何分布在概率论中有广泛的应用,包括试验设计、数据分析和决策制定等。
如果你想了解更多相关内容,可以继续向我提问。
二项分布和超几何分布的区别超几何分布和二项分布的区别:超几何分布需要知道总体的容量,而二项分布不需要;超几何分布是不放回抽取,而二项分布是放回抽取〔独立重复〕当总体的容量非常大时,超几何分布近似于二项分布。
超几何分布和二项分布的区别:超几何分布需要知道总体的容量,而二项分布不需要;超几何分布是不放回抽取,而二项分布是放回抽取〔独立重复〕当总体的容量非常大时,超几何分布近似于二项分布。
超几何分布和二项分布的区别一样点:
超几何分布和二项分布都是离散型分布
超几何分布和二项分布的区别:
〔1〕超几何分布需要知道总体的容量,而二项分布不需要;
〔2〕超几何分布是“不放回〞抽取,而二项分布是“有放回〞抽取〔独立重复〕。
〔3〕当总体的容量非常大时,超几何分布近似于二项分布。
1。
吉林教育·教学7/2013二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。
在实际应用中,如何理解它们的关联性同时又能区分两个概率模型呢?本文笔者就此问题予以阐述。
一、超几何分布与二项分布的定义1.一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为P (X=k)=C M k C n-m n-kC Nn,k=0,1,2,…,m其中m=min {M,n},且n ≤N ,M ≤N ,n ,M ,N ∈N*。
其分布列为超几何分布列。
如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。
2.一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验。
在n 次独立重复试验中,设事件A 发生的次数X ,在每次试验事件A 发生的概率为p,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为P (X=k)=C n k P k(1-p )n-k,k=0,1,2,…,n 。
此时称随机变量X 服从二项分布,记作X ~B (n ,p),并称p 为成功概率。
二、超几何分布与二项分布的区别从它们的定义不难看出超几何分布研究的是试验后的结果(不研究试验中先后取的顺序),并且是无放回的抽取;二项分布研究的是既有研究先后发生的顺序又有试验结果,并且是有放回的抽取。
超几何分布是无放回的抽取,即每做一次试验,下一次再发生同一事件A 的概率已经发生了变化,即每次发生的概率都不相等。
实质上,超几何分布是古典概型的一种特例。
二项分布是有放回的抽取,每做一次试验,发生同一事件A 的概率都相同。
这就是二者之间的区别。
本文笔者举例说明:例1:在装有4个黑球6个白球的袋子中,任取2个,试求:(1)不放回地抽取,取到黑球数X 的分布列;(2)有放回地抽取,取到黑球数的分布列。
解:(1)是不放回地抽取,X 服从超几何分布。
二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。
在实际应用中,如何理解它们的关联性同时又能区分两个概率模型呢?本文笔者就此问题予以阐述。
一、超几何分布与二项分布的定义1.一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为P (X=k)=C M k C n-m n-kC Nn,k=0,1,2,…,m其中m=min {M,n},且n ≤N ,M ≤N ,n ,M ,N ∈N*。
其分布列为超几何分布列。
如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。
2.一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验。
在n 次独立重复试验中,设事件A 发生的次数X ,在每次试验事件A 发生的概率为p,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为P (X=k)=C n k P k(1-p )n-k,k=0,1,2,…,n 。
此时称随机变量X 服从二项分布,记作X ~B (n ,p),并称p 为成功概率。
二、超几何分布与二项分布的区别从它们的定义不难看出超几何分布研究的是试验后的结果(不研究试验中先后取的顺序),并且是无放回的抽取;二项分布研究的是既有研究先后发生的顺序又有试验结果,并且是有放回的抽取。
超几何分布是无放回的抽取,即每做一次试验,下一次再发生同一事件A 的概率已经发生了变化,即每次发生的概率都不相等。
实质上,超几何分布是古典概型的一种特例。
二项分布是有放回的抽取,每做一次试验,发生同一事件A 的概率都相同。
这就是二者之间的区别。
本文笔者举例说明:例1:在装有4个黑球6个白球的袋子中,任取2个,试求:(1)不放回地抽取,取到黑球数X 的分布列;(2)有放回地抽取,取到黑球数的分布列。
解:(1)是不放回地抽取,X 服从超几何分布。
从10个球中任取2球的结果数为C 102,从10个球中任取2个,其中恰有k 个黑球的结果数为C 4k C 62-k,那么从10个球中任取2个,其中恰有k 个黑球的概率为P (X=k )=C 4k C 62-kC 102,k=0,1,2。
二项分布与超几何分布的区别与联系1.定义:(1)超几何分布:设有总数为N件的两类..物品,其中一类有M件,从所有物品中任取n件(n≤N),这n件中所含这类物品件数X是一个离散型随机变量,它取值为m时的概率为()m n mM N MnNC CP X mC --== (0≤m≤l,l为n和M中较小的一个),则称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X服从参数为N,M,n的超几何分布.(2)二项分布:若将事件A发生的次数设为X,发生的概率为p,不发生的概率q=1-p,那么在n次独立重复试验中,事件A恰好发生k次的概率是P(X=k)=C k n p k(1-p)n-k(k=0,1,2,…,n) ,于是得到X的分布列(q+p)n=C0n p0q n+C1n p1q n-1+…+C k n p k q n-k+…+C n n p n q0各对应项的值,称这样的离散型随机变量X服从参数为n,p的二项分布,记做X~B(n,p).2.本质区别:(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题,也就是说二项分布中每个事件之间是相互独立的,而超几何分布不是;(2)超几何分布中的概率计算实质上是古典概型问题,二项分布中的概率计算实质上是相互独立事件的概率问题.温馨提示:(1)超几何分布需要知道总体的容量,也就是总体个数有限;而二项分布不需要知道总体容量,但需要知道“成功率”.(2)当题目中出现“用样本数据估计×××的总体数据”是均为二项分布;(3)二项分布与超几何分布两者之间存在着联系:当调查研究的样本容量非常大时,在有放回地抽取与无放回地抽取条件下,计算得到的概率非常接近,可以近似把超几何分布认为是二项分布.概率论中的二项分布与超几何分布都是古典概型。
【典例】某批n 件产品的次品率为2%,现从中任意地依次抽出3件进行检验,问: (1)当500,5000,50000n =时,分别以放回和不放回的方式抽取,恰好抽到1件次品的概率是多少?(2)根据(1)你对超几何分布与二项分布的关系有何认识?【解】(1)在放回的方式抽取中,每次抽取时都从这n 件产品中抽取,从而抽到品的概率都为0.02.可以把3次抽取看成是3次独立重复试验,这样抽到的次品数X ~(3,0.02)B ,恰好抽到1件次品的概率为1223(1)0.02(10.02)30.020.980057624=.P X C ==⨯⨯-⨯⨯≈在不放回的方式抽取中,抽到的次品数X 是随机变量,X 服从超几何分布,X 的分布与产品的总数n 有关,所以需要分3种情况计算:①500n =时,产品的总数为500件,其中次品的件数为500⨯2%=10,合格品的件数为490件。
浅谈超几何分布与二项分布的区别与联系摘要:离散型随机变量及其分布是高中数学的一个重要章节,超几何分布和二项分布是其中的两个非常重要的分布。
本文将从两个典型例题出发,辨析两种离散型随机变量的分布的区别与联系,希望能给平时的教育教学工作一定的指导。
关键词:离散型随机变量;超几何分布;二项分布;区别;联系.引言:笔者在教学过程中发现,学生在平时学习考试中,处理超几何分布和二项分布的相关问题时会遇到很多困难。
比如不能准确判断出所给题目符合哪一种分布,不能准确求出每个随机变量的取值所对应的概率,或者用错误方法求出了期望的正确结果,不理解为什么会有这样的结果。
下面笔者将从两个典型例题出发,辨析超几何分布与二项分布的区别与联系。
一、例题呈现例1.不透明的抽奖箱中有形状大小完全相同的白球和黑球一共20个,其中有白球15个,黑球5个。
(1)从袋子中任意抽取4个球,记取出的白球个数为,求的分布列和数学期望;1.从袋子中任意抽取4次球,每次记下颜色后放回,记取出的白球个数为,求的分布列和数学期望。
分析:由题干描述可知,本题第(1)小题是不放回抽取,白球个数服从超几何分布;第(2)小题是放回抽取,每一次抽取相当于做重复试验,且试验结果是相互独立的,白球个数服从二项分布。
解:(1)由题意可得服从参数为20,15,4的超几何分布,的可能取值为0,1,2,3,4,,,,,所以, .(2)由题意知,每一次抽取过程中,抽到白球的概率均为,所以 ,的可能取值为0,1,2,3,4,,,,,.所以,.通过本例,我们可以很明显地观察到超几何分布与二项分布的区别:1、随机变量的概率计算公式不同;2、随机变量的每一个取值概率也不同。
同样我们也不难发现这二者的相同点:无论随机变量的取值是多少及概率是多少,最终求得的数学期望是同一个值。
接下来我们来深入分析一下超几何分布与二项分布的区别与联系。
二、概念辨析1.区别我们先来看看课本给出的定义.北师大版高中数学选修2-3对超几何分布和二项分布的定义如下:超几何分布:一般地,设有件产品,其中有件次品.从中任取件产品,用表示取出的件产品中次品的件数,那么(其中为非负整数).如果一个随机变量的分布列由上式确定,则称服从参数为的超几何分布.二项分布:进行次试验,如果满足以下条件:1.每次试验只有两个相互对立的结果,可以分别称为“成功”和“失败”;2.每次试验“成功”的概率为,“失败”的概率为;3.各次试验是相互独立的.用表示这次试验中成功的次数,则的分布列如上所述,称服从参数为的二项分布,简记为若一个随机变量由定义可以明显看出二者之间的不同点:1.随机试验不同:超几何分布中的试验是符合古典概型的随机试验;二项分布的随机试验是n次独立重复试验。
超几何分布与二项分布的关系超几何分布与二项分布都是概率论中常用的离散概率分布。
它们之间存在一定的关系,但又有一些明显的区别。
本文将详细介绍超几何分布和二项分布的定义、特点以及它们之间的联系。
超几何分布在描述离散事件的概率分布中起到了重要的作用。
在进行一系列独立实验时,若每次实验中成功和失败的概率不变,并且每次实验是相互独立的,那么这个实验服从二项分布。
而在超几何分布中,每次抽样并不是相互独立的,所以超几何分布常用于描述有限总体中的抽样实验。
首先,我们来看一下超几何分布的定义和特点。
超几何分布用于描述从有限总体中抽取固定数量的样本时,成功的次数的概率分布。
它的概率质量函数(Probability Mass Function,PMF)为:P(X=k) = (M choose k) * (N-M choose n-k)/(N choose n)其中,X是成功的次数,k是成功的次数,N是总体中的总样本数,M是总体中的成功样本数,n是抽取的样本数。
超几何分布的特点有以下几点:1. 每次抽样都会改变总体中的样本数,所以每次抽样的概率并不相等。
2. 概率质量函数是非对称的,呈现左偏态分布。
3. 超几何分布没有平均值和方差,因为每次抽样的样本数不一样。
4. 超几何分布的取值范围为0到min(n,M),即不能超过抽样个数和总体中成功样本数。
现在我们来看一下二项分布的定义和特点。
二项分布用于描述一系列独立实验中成功次数的概率分布。
它的概率质量函数(PMF)为:P(X=k) = (n choose k) * p^k * (1-p)^(n-k)其中,X是成功次数,k是成功次数,n是实验次数,p是每次实验成功的概率。
二项分布的特点有以下几点:1. 每次实验的成功和失败的概率是相等的,并且每次实验都是相互独立的。
2. 概率质量函数是对称的,呈现钟形曲线。
3. 二项分布的平均值为np,方差为np(1-p),即平均值和方差的乘积是相等的。
超几何分布和二项分布的联系和区别超几何分布和二项分布的联系和区别开滦一中 张智民在最近的几次考试中,总有半数的的学生搞不清二项分布和超几何分布,二者到底该如何区分呢?什么时候利用二项分布的公式解决这道概率问题?什么时候用超几何分布的公式去解决呢?好多学生查阅各种资料甚至于上网寻找答案,其实这个问题的回答就出现在教材上,人教版新课标选修2-3从两个方面给出了很好的解释.诚可谓:众里寻他千百度,蓦然回首,那人却在灯火阑珊处! 一、 两者的定义是不同的教材中的定义: (一)超几何分布的定义在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)=nNk-n M -N k M C C C , ,2,1,0k =, m,其中m=min{M,n},且n ≤N,M ≤N,n,M,N ∈N,称随机变量X 服从超几何分布(二)独立重复试验和二项分布的定义1)独立重复试验:在相同条件下重复做的n 次试验,且各次试验试验的结果相互独立,称为n 次独立重复试验,其中A(i=1,2,…,n)是第ⅰ次试验结果,则P(A1A2A3…An)=P(A 1)P(A2)P(A3)…P(An) 2)二项分布在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中事件A 发生的概率为P,则P(X=k)=k n k p p --)1(C k n(k=0,1,2,…,n),此时称随机变量X 服从二项分布,记作X~B(n,p),并称P 为成功概率。
1.本质区别(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题;(2)超几何分布中的概率计算实质上是古典概型问题;二项分布中的概率计算实质上是相互独立事件的概率问题2.计算公式超几何分布:在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P(X=k)的球的数目N 很大时,X 的分布列近似于二项分布,并且随着N 的增加,这种近似的精度也增加。
超几何分布与二项分布的联系
超几何分布和二项分布确实有着密切的联系,但也有明显的区别。
课本对于超几何分布的定义是这样的:一般的, 若一个随机变量 X 的分布列为( k n k M N M n N
C C P X k C --==, 其中 0,1,2, , k l = , min(, l n M =,则称 X 服从超几何分布,记为(, , X H n M N 。
其概率分布表为:
对于二项分布的定义是这样的:若随机变量 X 的分布列为 ( (1 k k n k n P X k C p p -==-, 则
称 X 服从参数为 , n p 的二项分布,记为 (, X B n p 。
其概率分布表为:
超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量 X 的取值都从 0连续变化到 l ,对应概率和 , , N n l 三个值密切相关 . 可见两种分布之间有着密切的联系 . 课本中对超几何分布的模型建立是这样的:若有 N 件产品, 其中 M 件是废品,无返回地任意抽取 n 件,则其中恰有的废品件数 X 是服从超几何分布的。
而对二项分布则使用比较容易理解的射击问题来建立模型。
若将但超几何分布的概率模型改成:若有 N 件产品,其中 M 件是废品,有返回的任意抽取 n 件,则其中恰有的废品件数 X 是服从二项分布的。
在这里,两种分布的差别就在于“ 有” 与“ 无” 的差别,只要将概率模型中的“ 无” 改为“ 有” ,或将“ 有” 改为“ 无” ,就可以实现两种分布之间的转化。
“ 返回” 和“ 不返回” 就是两种分布转换的关键。
如在 2.2节有这样一个例题:高三(1班的联欢会上设计了一项游戏:在一个口袋中装有 10个红球、 20个白球,这些球除颜色外完全相同,一次从中摸出 5个球,摸到4个红球 1个白球就是一等奖,求获一等奖的概率。
本题采用的解法是摸出球中的红球个数 X 服从超几何分布,但是如果将“ 一次从中摸出 5个球” 改为“ 摸出一球记下颜色,放回后再摸一球,反复 5次” ,则摸出球中的红球个数 X 将不再服从超几何分布,而是服从二项分布。
我们分别来计算两种分布所对应的概率:
这时发现发现两种不同的分布其对应的概率之间的差距进一步缩小了, 我们做出这样的猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布!也就是说 lim (1 k n k k k n k M N M n n N N
C C C p p C ---→+∞=-,下面我们对以上猜想作出证明: 产品个数 N 无限大,设废品率为 p ,则 lim N M p N
→+∞=,
以上的证明与我们的直观思想相吻合:在废品为确定数 M 的足够多的产品中,任意抽取 n 个(由于产品个数 N 无限多,无返回与有返回无区别,故可看作 n 次独立试验中含有 k 个废品的概率当然服从二项分布。
在这里,超几何分布转化为二项分布的条件是 (1 产品个数应无限多, 否则无返回地抽取 n 件产品是不能看作 n 次独立试验的 .(2 在产品个数 N 无限增加的过程中, 废品数应按相应的“ 比例” 增大,否则上述事实也是不成立的。
对于超几何分布的数学期望 ( M E X n N =⋅,二项分布的数学期望 ( E X np =,当我们将“ 不返回” 改为“ 返回” 时, M p N
=, 两种分布的数学期望相等, 方差之间没有相等关系。
超几何分布和二项分布的数学期望和方差是否也具有我们以上猜想并证明的极限关系呢?
事实上超几何分布的数学期望 ( M
E X n N =⋅, 方差 2( (
( (1 nM N n N M
D X N N --=-,
当
这两个极限值分别是二项分布的数学期望与方差。
需要指明的是这一性质并非只为超几何分布与二项分布之间所具有, 一般地, 如果随机变量依分布收敛于随机变量, 则随机变量的数学期望和方差分别是随机变量的数学期望和方差的极限。
这样超几何分布与二项分布达到了统一。
一般说来, 有返回抽样与无返回抽样计算的概率是不同的, 特别在抽取对象数目不大时更是如此。
但当被抽取的对象数目较大时, 有返回抽样与无返回抽样所计算的概率相差不大, 人们在实际工作中常利用这一点, 把抽取对象数量较大时的无返回抽样 (例如破坏性试验发射炮弹;产品的寿命试验等 ,当作有返回来处理 .
那么,除了在有无“ 返回” 上做文章,有没有什么办法快速实现超几何分布向二项分布的转化呢?
设想 N 件产品装在一个大袋中,其中 M 件为废品, 无返回地从中抽取 n 件, 那么其中废品件数 X 服从超几何分布。
现若在大袋中再放进两个小袋,一袋装正品,一袋装废品,然后从大袋中任摸一个小袋,无返回地从中任取一件产品,则这样任取 n 件,其中废品件数 X 就不再服从超几何分布,而应服从的二项分布了。
事实上,我们把摸到正品袋中的产品看作“ 成功” ,摸到废品袋中的产品看作“ 失败” ,则“ 成功” 与“ 失败” 的概率相等,皆为且每次试验是相互独立的,正是典型的伯努力试验概型,因此可用二项分布去刻划其概率分布列
.
从这一点上讲,两种分布仅“ 一袋之隔” 。
将正品和废品隔离,则超几何分布将成为二项分布 .
超几何分布和二项分布这两种离散型随机变量的概率分布表面上看来风马牛不相及, 但通过以上的论证, 我们发现这两种分布可以通过有无“ 返回” ,隔离正品和
次品等方法来互相转换,抛开转换问题,也可把二项分布看作超几何分布的极限,它们的期望和方差之间也存在这种极限关系 .。