负二项分布的性质特征及在流行病学研究中的应用
- 格式:doc
- 大小:34.00 KB
- 文档页数:3
概率与统计中的二项分布概率与统计是数学中的重要分支,涉及到随机事件的概率计算和统计数据的分析。
在这个领域中,二项分布是一种常见且重要的概率分布。
一、二项分布的定义及特点二项分布是离散型概率分布的一种,用于描述在一系列独立重复的伯努利试验中成功次数的概率分布。
伯努利试验指的是只有两个可能结果的随机试验,如抛硬币的正反面或者某产品合格与否等。
二项分布的特点如下:1. 每次试验的结果只有两个可能,记为成功(S)和失败(F)。
2. 每次试验的成功概率为p,失败概率为1-p。
3. 每次试验独立重复进行,试验次数记为n。
4. 求得成功次数k的概率。
二、二项分布的概率计算对于二项分布而言,可以通过以下公式来计算成功次数k的概率:P(X=k) = C(n, k) * p^k * (1-p)^(n-k)其中,P(X=k)表示成功次数为k的概率,即二项分布的概率质量函数;C(n, k)表示从n次试验中取出k次成功的组合数;p^k表示k次成功的概率;(1-p)^(n-k)表示n-k次失败的概率。
三、二项分布的应用举例1. 投掷硬币的例子假设我们有一枚均匀硬币,投掷10次,成功定义为出现正面,失败定义为出现反面。
设定成功概率p为0.5,那么可以利用二项分布计算出在10次投掷中出现k次正面的概率。
2. 测试产品合格率的例子假设某产品的合格率为0.8,现从中抽取20个样本进行测试,成功定义为抽取的产品合格,失败定义为抽取的产品不合格。
可以利用二项分布计算出在20个样本中有k个合格产品的概率。
四、二项分布的性质二项分布具有以下重要性质:1. 期望与方差:二项分布的概率分布的期望值和方差分别为E(X) = np,Var(X) = np(1-p)。
其中,E(X)表示成功次数的平均值,Var(X)表示成功次数的方差。
2. 定理:当试验次数n足够大,成功概率p足够小(或足够大),则二项分布可以近似为泊松分布或正态分布。
五、总结在概率与统计中,二项分布是一种常见的离散型概率分布,适用于描述在多次独立重复的伯努利试验中成功次数的概率分布。
负二项分布抽样中的患病率无偏估计李宝月/金欢/罗剑锋/姜庆五/赵耐青【内容提要】目的本次研究以第三次全国血吸虫病流行病学调查为背景~对其部分抽样过程进行计算机模拟~采用负二项分布抽样方法~得到感染率的无偏估计~并与传统的抽样方法比较~综合评价两种抽样方法的优缺点。
方法分别在样本量相同及样本量不同两种情况下对抽样结果估计感染率的绝对误差、相对误差及正确率作统计学描述分析~并综合评价。
结果在相同样本量下~两种抽样方法估计的感染率在绝对误差、相对误差、正确率及可信区间宽度方面差别的P值均大于0.05,当感染率为0.6%时~两者的正确率及可信区间宽度差别P值接近0.05,,在样本量不同时~两种抽样方法估计的感染率在正确率方面差异无统计学意义(P值均大于0.05)~在绝对误差、相对误差及可信区间方面差别的P值均小于0.01~仅在感染率较高时,大于10%,两者差异无统计学意义。
结论在样本量一致情况下~两种抽样方法在不同的感染率范围内的估计精度相当。
当实际感染率较小时,如小于1%,~采用负二项分布抽样可实现抽到足够的患者,当实际感染率未知且无法预测时~该方法又是一种探索性的抽样方法。
【关键词】负二项分布/血吸虫感染率/随机模拟一、研究背景卫生部分别于1989、1995和2004年开展了第一、二、三次全国血吸虫病流行病学抽样调查,为防治规划提供了科学依据。
第三次全国血吸虫病抽样调查,采取分层、整群、随机抽样方法,在抽样范围内抽取样本村作为调查点。
抽样范围:湖北、湖南、江西、安徽、江苏、四川和云南七省中,未达到传播阻断标准乡镇的所有流行村。
第一亚层:在抽样范围内,根据流行类型划分为8个不同层次:湖沼型流行区湖汊亚型、洲滩亚型,洲垸亚型、垸内亚型,水网型流行区水网亚型,山丘型流行区丘陵亚型、高山峡谷亚型、平坝亚型。
第二亚层:在第一亚层的基础上,根据流行区县(市、区)血防所(站)的最近一次查病结果、钉螺分布现状以及多年血防信息的感染率粗略预估计,将各流行村的居民血吸虫估计感染率分为,1%、1%,、5%,、10%,等4个层次。
负二项回归分析负二项回归分析是一种有效的统计分析方法,旨在探讨实验结果与变量之间的关系。
它主要用于模型评估,了解数据中可能出现的趋势和差异,以及其对研究变量的影响。
负二项回归分析可以用于了解一个变量与另一个变量之间的关系,可以用于比较多个变量的相互影响,也可以用于多个变量的回归分析。
负二项回归分析是一种基本的统计分析方法,它可用于研究许多科学领域,如药物研究、公共卫生、社会学和经济学等。
它是一种应用广泛的分析方法,被用于分析病例对照研究、横断面研究、长期跟踪研究、双盲实验和回归分析等。
负二项回归分析通常用于评估一个实验结果变量与不同水平的变量之间的关系。
这种分析通过确定该变量的比率,来判断实验结果变量如何随着变量水平的变化而变化。
负二项回归分析结果表明,不同水平的自变量对实验结果变量具有负面或正面的影响。
负二项回归分析具有许多优点,例如,它可以用于统计分析的变量有多个水平,而这些水平有可能是连续的或分类的;它可以用于不同变量之间的多个因素,并可以评估该变量对实验结果变量的影响;它能够有效地对比实验变量对实验结果变量的影响,从而判断天然或人为因素是否影响实验结果;它可以用于线性和非线性的分析,以及多种模型中的多种类型的分析;它可以用于量化特定变量之间的关系;它可以用于定量计量研究,能够有效的衡量不同水平的变量对研究结果的影响。
负二项回归分析的局限性在于,它不能检验实验变量与实验结果变量之间的因果关系;它也不能用于分析双变量之间的关联;它也不能用于分析非参数性数据;它也不能用于预测实验结果变量的变化。
总之,负二项回归分析是一种常用的统计分析方法,它可以用于发现多个变量之间的关系,以及分析实验结果变量如何受不同变量水平的影响,从而得出合理的结论和推论。
它具有许多优点,但也有一些局限性。
因此,在使用负二项回归分析进行统计分析之前,应该仔细评估这种分析方法的优缺点,以确保获得有价值的统计结果。
概率论中的二项分布与泊松分布概率论是数学中的一个重要分支,研究随机事件发生的概率以及它们之间的关系。
在概率论中,二项分布和泊松分布是两个常见且重要的概率分布。
本文将分别介绍二项分布和泊松分布的定义、特点以及应用。
一、二项分布二项分布是指在一系列独立的、相同概率的伯努利试验中,成功事件发生的次数服从二项分布的概率分布。
其中,伯努利试验是指只有两个可能结果的试验,如抛硬币的结果只有正面和反面两种情况。
二项分布的概率质量函数可以表示为:P(X=k)=C(n,k)p^k(1-p)^(n-k),其中,n代表试验次数,k代表成功事件发生的次数,p代表每次试验成功的概率,C(n,k)代表组合数。
二项分布的特点有以下几点:1. 二项分布的随机变量只能取非负整数值,即k只能取0,1,2,...,n。
2. 二项分布的期望值为E(X)=np,方差为Var(X)=np(1-p)。
3. 当试验次数n趋向于无穷大时,二项分布逼近于泊松分布。
二项分布在实际应用中有广泛的应用,比如在质量控制中,可以使用二项分布来计算在一定数量的产品中出现不合格品的概率;在投资决策中,可以使用二项分布来计算在一系列投资项目中成功项目的数量等。
二、泊松分布泊松分布是指在一段时间或区域内,事件发生的次数服从泊松分布的概率分布。
泊松分布适用于事件发生的概率很小,但试验次数很大的情况。
泊松分布的概率质量函数可以表示为:P(X=k)=(e^(-λ)*λ^k)/k!,其中,λ代表单位时间或单位区域内事件的平均发生率。
泊松分布的特点有以下几点:1. 泊松分布的随机变量只能取非负整数值,即k只能取0,1,2,...。
2. 泊松分布的期望值和方差均为λ。
3. 当试验次数n趋向于无穷大,每次试验成功的概率p趋向于0,但np保持不变时,二项分布逼近于泊松分布。
泊松分布在实际应用中也有广泛的应用,比如在电话交换机的排队系统中,可以使用泊松分布来描述单位时间内到达电话的数量;在可靠性工程中,可以使用泊松分布来描述设备的故障率等。
负二项分布的优良特性及其在风险管理中的应用王丙参;何万生;戴宁【摘要】This article discusses the properties and promotion of the two basic negative binomial distributions,gives closed of conditional probabilities and a non-classical confidence interval estimate under thefirst negative binomial distribution,discusses the relationship between the second negative binomial distribution to poisson distribution.%研究了负二项分布的两个基本模型及推广,得到第一类负二项分布条件概率具有封闭性且给出参数的一个非经典置信区间估计,特别研究了第二类负二项分布与泊松分布的关系。
【期刊名称】《延安大学学报(自然科学版)》【年(卷),期】2011(030)004【总页数】5页(P14-18)【关键词】负二项分布;索赔次数;估计值;矩母函数【作者】王丙参;何万生;戴宁【作者单位】天水师范学院数学与统计学院,甘肃天水741001;天水师范学院数学与统计学院,甘肃天水741001;郑州大学数学系,河南郑州450002【正文语种】中文【中图分类】O211.3当投保集体同质时,投保次数服从泊松分布,而实际中的投保集体都或多或少地存在一定的非同质性,这就为负二项分布的应用创造了条件,负二项分布的方差越大于其均值,表明投保集体存在的非同质性越严重[1-3]。
导致非同质的原因可能多种多样,譬如,由于保险公司和保单持有人增强了风险防范意识,大多数保单不会发生保险事故;或者因为保险公司应用了免赔额或无赔款折扣等条款,许多被保险人在发生轻微事故时不会提出索赔;在这些情况下,如果仍然使用泊松回归模型,可能会低估参数的标准误差,高估其显著性水平,从而在模型中保留多余的解释变量,最终导致不合理的费率厘定结果。
概率与统计中的二项分布概率与统计是数学中的一个分支,它研究随机事件的发生概率以及对这些概率进行推断和决策。
在概率与统计的研究中,二项分布起到了重要的作用。
本文将介绍二项分布的概念、特性和应用。
一、二项分布的概念二项分布是概率与统计中最基本的离散概率分布之一。
它描述了在一系列独立的重复试验中成功的次数。
一个二项分布的参数有两个,一个是重复试验的次数n,另一个是每次试验成功的概率p。
我们用X 表示在n次重复试验中成功的次数,则X服从参数为n和p的二项分布,记作X~B(n,p)。
这里,n满足n∈N*,p满足0≤p≤1。
二、二项分布的特性1. 期望值和方差:对于参数为n和p的二项分布X~B(n,p),其期望值μ=np,方差σ^2=np(1-p)。
这个特性在实际问题中非常有用,可以通过期望和方差来判断和推断二项分布的分布情况。
2. 概率函数:二项分布的概率函数被称为概率质量函数(PMF),可以用来计算在给定参数n和p的情况下,随机变量X等于某个固定值k的概率。
二项分布的概率质量函数为:P(X=k) = C(n, k) * p^k * (1-p)^(n-k),其中C(n, k)表示从n个试验中选取k个成功的方式数。
通过概率质量函数,我们可以计算任意二项分布随机变量X的概率。
3. 单调性:在概率与统计中,二项分布的单调性是一个重要特性。
随着成功概率p的增加,成功次数k的概率P(X=k)会随之增加,即,随着成功概率的增加,成功的可能性也会随之增加。
三、二项分布的应用二项分布在实际问题中有广泛的应用。
以下是一些常见应用场景:1. 投硬币问题:如果我们将一枚硬币抛掷n次,而每次正面朝上的概率为p,那么正面朝上的次数X就符合二项分布B(n,p)。
通过计算可以得出每次抛硬币正面朝上的概率,从而判断其是公平硬币还是有偏倚。
2. 质检问题:在质量控制过程中,我们需要判断在一次批次生产中,某个产品合格的概率是多少。
如果我们在批量生产中随机抽取n个产品进行检查,而每个产品合格的概率为p,那么合格产品的数量X就符合二项分布B(n,p)。
《二项分布》之实例引入【摘要】二项分布是概率论中一种重要的分布,可以描述进行n次独立重复的二分类实验中成功次数的概率分布。
本文将介绍二项分布的定义、特点以及应用举例,并通过实例分析和模型验证展现其实用价值。
通过实例引入,读者能更直观地理解二项分布的概念和应用。
二项分布在实际中有着广泛应用,比如在质量控制、市场营销和金融风险评估中都有着重要作用。
本文总结了二项分布的重要性,并展望其在未来的应用前景。
通过本文的学习,读者将深入了解二项分布的概念、特点和应用场景,从而更好地应用于实际问题的解决。
【关键词】关键词:二项分布、引入、定义、特点、应用、举例、实例分析、模型验证、总结、重要性、展望1. 引言1.1 什么是二项分布二项分布是概率论中非常重要的一个分布,在统计学和数据分析领域被广泛应用。
二项分布是指在n次独立重复的伯努利试验中成功次数的概率分布。
简单来说,二项分布描述了在一系列相互独立的重复试验中,成功事件发生的次数。
具体地,二项分布的概率质量函数可以表示为P(X=k) = C(n, k) * p^k * (1-p)^(n-k),其中n表示试验的总次数,p表示每次试验成功的概率,k表示成功的次数,C(n,k)表示组合数。
二项分布是一种离散概率分布,其特点是具有明确的数学形式和严格的数学性质。
它的期望值为np,方差为np(1-p)。
二项分布在统计学中有着广泛的应用,比如在假设检验、置信区间估计、风险分析等方面都会涉及到二项分布的使用。
了解二项分布可以帮助我们更好地理解随机现象背后的规律,从而进行更准确的预测和决策。
在接下来的部分,我们将通过具体的实例引入来更深入地探讨二项分布的应用和重要性。
1.2 为什么要研究二项分布二项分布作为概率论中的重要分布之一,具有广泛的应用场景,对于研究者们来说,深入了解和掌握二项分布的特性和应用是至关重要的。
二项分布是概率论中最基本的离散概率分布之一,它可以描述在n次独立重复的伯努利试验中成功的次数的分布。
《二项分布》之实例引入1. 引言1.1 介绍二项分布的概念和重要性二项分布是概率论中一个非常重要的分布,它描述了在一系列独立重复的伯努利试验中成功次数的概率分布。
在二项分布中,每次试验只有两种可能的结果,通常称为成功和失败。
这种分布的重要性在于它可以帮助我们预测在一定数量的试验中成功的次数,从而在决策和实际应用中提供准确的参考。
二项分布的概念可以被简单地解释为每次试验成功的概率为p,失败的概率为1-p,而且每次试验是相互独立的。
这样一来,我们可以计算出在n次独立重复试验中成功的次数符合二项分布的概率分布。
这种分布在模拟实验、质量控制、金融风险管理等领域中都有广泛的应用。
了解二项分布的概念和性质对于很多领域的研究和决策都至关重要。
通过研究二项分布,我们可以更好地理解概率分布和随机现象之间的关系,从而提高我们在实际应用中的决策能力和准确性。
深入了解二项分布的概念和重要性对于我们在各个领域的工作和研究都有着积极的影响。
2. 正文2.1 二项分布的定义二项分布是概率论中一种重要的离散型概率分布。
它描述了在重复n次独立的成功-失败试验中,成功的次数的概率分布。
在二项分布中,每次试验只有两种可能的结果,即成功和失败,且这两种结果的概率保持不变。
具体而言,二项分布的定义如下:设每次试验成功的概率为p,失败的概率为1-p,则进行n次独立的二项试验后,成功的次数X的概率分布为二项分布。
用数学公式表示为:P(X=k) = (n choose k) * p^k * (1-p)^(n-k),其中n为试验次数,k为成功的次数,(n choose k)表示组合数,即从n个物体中取k个物体的组合数。
二项分布的特点包括:1. 单次试验只有两种结果;2. 每次试验的成功概率为p,失败概率为1-p;3. 试验之间是独立的;4. 试验次数固定为n。
二项分布在实际中有着广泛的应用。
在制造业中,可以用二项分布来分析产品的合格率;在市场调查中,可以用二项分布来估计客户对某一产品的接受程度;在医学研究中,可以用二项分布来分析疾病的传播率等等。
负二项分布的性质特征及在流行病学研究中的应用
【摘要】 给出了负二项分布的分解定理,进一步研究了负二项分布的有关性质及参数 的
无偏一致估计,以及在流行病学该分布的生物学意义。
【关键词】 负二项分布; 无偏一致估计; 应用
负二项分布是概率论中常用的重要的离散型随机分布,它在医学中主要用于聚集性疾病及生
物、微生物、寄生虫分布模型等的研究。具体地说,当个体间发病概率不相等可以拟合负二
项分布,如单位人数内某传染病的发病人数,某地方病、遗传病的发病人数等,这些均可通
过负二项分布进行处理。本文从概率论的角度阐述负二项分布的性质及参数 的最小方差无
偏估计,并且以该分布在流行病学中应用为例证讨论了其生物学意义。
1 负二项分布的概率模型
负二项分布又称帕斯卡分布(Pascal),它有两种基本模型[1]:
模型Ⅰ:假定每次试验可能的结果只有两个:可归结为成功或失败,每次试验之间是独
立,每次成功的概率均为 π,直到恰好出现r(指定的一个自然数)次成功所需试验次数
X,则X的概率分布为:
p(X=K)=πCr-1k-1πk-1(1-π)k-r=Cr-1k-1π-(1-π)k-r
k=r,r+1…(1)
模型Ⅱ:假定每次试验可能的结果只有两个:可归结为成功或失败,每次试验之间是独
立,每次成功的概率均为π ,试验进行到r次成功为止,记X为试验共进行的次数,则X
的概率分布为[3]:
p(X=k)=Cr-1k+r-1πk(1-π)k k=0,1,2,…(2)
此分布的概率是πr(1-(1-π))-r 的幂级数展开式的项,负二项分布由此而得名
记作 X~f(k,r,π) , 或 X~NB(r,π)
一个重要的特例是 r=1。 这时(2)成为
p(X=k)=π(1-π)k k=0,1,2,…(3)
称为几何分布。
2 性质特征
为研究负二项分布的性质,我们先给出一个重要的结论:
引理: 设X~NB(r,π),则其特征函数为ψx(t)=πr(1-(1-π)eit)-r
证明: ψx(t)=E(eitx)=∑∞i=0Cr-1i+r-1πr(1-π)i eitr
=∑∞i=0Cr-1i+r-1πr((1-π) e)rti
=πr∑∞i=0Cr-1i+r-1((1-π) ert)i
=πr(1-(1-π)eit)-r
定理1 设: X1,X2,…,Xr(3)的iid样本,如果
X=∑ri=1Xi, 则X=∑ri=1Xi~NB(r,π)
证明:因为X1,X2,…,Xr独立同分布,又有引理知 X=∑ri=1Xi的特征函数为:
φ(t)=πr(1-(1-π) eit)-r
=πr∑∞k=0(-r)(-r01)…(-r-k+1)k! ((1-π) eit)k(-1)keitr
=πr∑∞k=0(r+k-1)!(r-1)!k! (1-π)k eit(k+1)
=∑∞k=0πr(1-π)k eit(k+r) Cr-1r+k-1
这正是 p(X=k)=Cr-1r+k-1(1-π)k 的概率分布
则 X=∑ri=1Xi~NB(r,π)
定理2 设:X=X1,X2,…,Xn)是(1)的iid样本,则T(X)=∑ni=0Xi~NB(nr,π),
则有
p(T=k)=Cnr-1k-1πnr(1-π)k-nr k=nr,nr+1,…(4)
证明: 设ξ 的特征函数为f(t) ,那么
f(t)=∑∞x=reitxCr-1N-1πN(1-π)N-r =πeit1-(1-π)eitr
因为x是ξ 的iid样本,所以Xi 的特征函数fi(t)=f(t),i=1,2,…,n
有特征函数的性质得T的特征函数为:
∏ni=1fi(t)πeit1-(1-π)eitr
由于特征函数与概率分布唯一对应,所以T~f(k,nr,π) ,其概率分布便是(4)。
定理3 设:X=(X1,X2,…,Xn)是(1)的iid样本,则
T(X)=nr-1∑ni=1Xi-1, 则它是π 的最小方差无偏估计。
证明: 由定理2可知
E(T(X))=∑∞k=nrnr-1k-1Cnr-1k-1πnr(1-π)k-nr
=π∑∞k-1=nr-1 C(nr-1)-1(K-1)-1 πnr-1×(1-π)(k-1)-(nr-1)
=π
所以T(X)是π 的无偏估计。
又由于E(T(X))=π ,有切贝晓夫不等式,对ε>0, 有
p(|T(X)-π|≥ω)≤V(T(X))ε2 而
V(T(X)=∑∞k=nrnr-1k-12Cnr-1k-1πnr(1-π)k-nr
=π2 ∑∞k=nrnr-1k-1×k-2nr-2-1×C(nr-2)-1(k-2)-1πnr-2(1-π)k-nr
=π2 ∑∞k=nr1(k-1) (k-nr)(nr-2)×C(nr-2)-1(k-2)-1πnr-2(1-π)k-nr <
π2nr-2 ∑∞k=nr C(nr-2)-1(k-2)-1πnr-2(1-π)(k-2)-(nr-2)
=π2nr-2
所以,对ε>0, 都有linn→∞p(|T(X)-π|≥ω)=0 ,可见T(X)是π 的一致估计。
又因为E(T(X))=π ,根据 Lehmannscheff定理,π 的最小方差无偏估计必存在,而
T(X)=nr-1 ∑ni=1Xi-1,只依赖T(X)= ∑ni=1Xi , 即 T(X)=nr-1 ∑ni=1Xi-1 是π 的一
致最小方差无偏估计。
3 负二项分布的最可能数和概率的最大值
如果X~k=p(X=k)=Cr-1k-1πrqk-r k=r+1,r+2,…,其中q=1-π,则 当r-q1-q不为整
数时,k0=r-q1-q时为负二项分布的唯一最可能的数,即 k=k0时,p(X=k0)达到最大值。
证明:∵ pkpk-1=Cr-1k-1πrqk-rCr-1k-2πrqk-1-r=q(k-1)k-r
=>1时,kpk-1,随k增大,概率增大
r-q1-q, pk =1时,k=r-q1-q, pk=pk-1
∴ 当r-q1-q不为整数时,则存在唯一k0=r-q1-q 满足 r-q1-q-1<
k0 使 pk0-1< pk0>pk0+1,从而k0=r-q1-q是唯一最可能的数,即 k=k0时,p(X=k0)
达到最大值。
4 流行病中实例分析
假设血吸虫成虫随机地分布于人群中,即所有的个体均有同等的机会获得新感染,将致
成虫在人群中呈Poisson分布。然而,由于暴露的危险性不等、易感性不一致及可能存在的
获得性免疫等将导致感染的机会不等,而出现成虫集中在某一部分的人群中。一些可以直接
通过驱虫获得人群虫负荷分布的资料及某些尸检资料均提示蠕虫的成虫(如蛔虫、钩虫、曼
氏血吸虫、鞭虫)在人群中的分布具有聚集块。聚集块内病例个体的平均数又服从 Γ分
布。即:病例的数目H服从均数为λ 的poisson分布,由于λ 是变化的,假定其概率分布
可用Γ分布表示。于是对于给定的λ ,条件概率为:
p(H=h|λ)=λhe-λh!, h=0,1,2,…,λ>0
此时λ 的概率密度函数为:
f(λ)=βαΓ(α) λα-1e-λβ,λ>0,其中α>0,β>0 都是参数。当α和β 变化时,
可产生一族分布曲线。可以证明,ΓPoisson 分布就是负二项分布。
因为 ,ex= ∑∞k=0 xkk!
H是离散型随机变量, λ是连续型随机变量,H的边际概率函数是:
p(H=h)=〖JF(Z〗∞0e-λλhh! βαΓ(α)λα-1eλβd λ〖JF)〗
=βαh!Γ(α) 〖JF(Z〗∞0λα+h-1eλ(1+β)d λ〖JF)〗
=βαh!(k-1)! (α+h-1)!(β+1)h+α
=Chh+α-1 (ββ+1)α (1-ββ+1)h
=Chh+k-1 πk (1-π)h, (j=0,1,2…)
其中,0<π<ββ+1<1, k=α, 此即为负二项分布。
5 讨论
负二项分布是当poisson中参数λ服从Γ 分布时所得的复合分布,分布中的参数λ 是不
定的变化的,且其变化是有规律的。呈现的特点是病例聚集群内病例个体的密度服从Γ 分
布,病例个体间的流行病学联系与Γ 分布有关,由于Γ 分布的概率密度函数及图形为:
f(x)=βαΓ(α) xα-1e-βx, x>0
0, x≤0
因此,负二项分布来源于poisson分布,它改进了poisson的等概条件,如在流行病研究
人群中的患病数时,则单位人数中的个体数是无穷大,且患病率不应太大[4],若以负二
项分布进行拟合。再应用以上证明的负二项分布的性质、对其参数π 使用最小方差无偏估
计,将对负二项分布的应用起着重要作用。