第五章概率统计模型
一、主要内容
1、利用初等概率知识建立几个初等概率模型,它们都是实际生活中常碰到的问题。
2、利用存储知识建立随机存储模型。
3、利用决策论知识建立随机性决策模型。
4、利用排队论知识建立排除类问题的模型,这里仅探讨其中M/M/1排除模型中较简单的部分。
二、学习目标
1、掌握初等概率模型建模方法,熟悉常用的随机变量的分布及数字特征。
2、了解随机性存储论概念,理解随机性存储模型的建立与简单分析。
3、掌握随机性决策模型,会建立实际问题的随机性决策模型,并能进行相关分析。
4、了解排除论基本知识,会求解简单的排队问题模型。
三、本章知识结构
四、重点和难点:
重点:初等概率模型、存储模型、决策模型、排队模型的建立思路与解法。
难点:存储模型、排队模型的建立
五、学习方法建议
一是要大量阅读、思考别人做过的模型,二是要亲自动手,认真地做上几个实际题目我们的具体建议如下:
(1)学习中随时翻阅相关数学专业知识方面的书籍,《概率论与数理统计》、与《运筹学》专业书籍,应放在身边随时备查
(2)开始时可能感到无从入手,不必担扰,随着学习过程逐渐展开,只要你是认真的,定会一步一步解脱困惑.
(3)尽早复习一下概率统计知识,熟悉不确定事物的处理勤动脑,勤思考与勤动手是学好数学建模课的关键,务求落实
六、重点难点辅导:
1、初等概率模型主要介绍了可靠性模型、传染病流行估计、常染色体遗传模型等三类
问题:
(1) 可靠性模型
计算抓住一点:元件串通则可靠度相乘;元件并联则不可靠度相乘。
设某种机器的工作系统由N个部件组成,各部件之间是串联的,即只要有一个部件失
灵,整个系统就不能正常工作.为了提高系统的可靠性,在每个部件上都装有主要元件的备用件及自动投入装置(即当所使用元件损坏时,备用元件可自动替代之而开始工作)明显地,可以把问题当作并联来处理,备用件越多,整个系统正常工作的可靠性就越大,?但是,备
用件过多势必导至整个系统的成本、重量和体积相应增大,工作精度也会降低?因此,配置
的最优化问题便被提出来了:在某些限制性条件之下,如何确定各部件的备用件数量,使整个系统的工作可靠性最大?这就有了约束条件。
易见,问题的目标函数为非线性的,决策变量又取整数,故为非线性整数规划问题.
(2) 传染病流行估计的数学模型
假定人群中有病人或更确切地说是带菌者,也有健康人,即可能感染者,任何两人之间的接
触是随机的,当健康人与病人接触时健康人是否被感染也是随机的?问题在于一旦掌握了随
机规律,那么如何去估计平均每天有多少健康人被感染,这种估计的准确性有多大?
?设人群只分病人和健康人两类,病人数和健康人数分别记为i和s,总数n不变,即
i +s=n (1)
?人群中任何二人的接触是相互独立的,具有相同概率P,每人每天平均与m人接触;
当健康人与一病人接触时,健康人被感染的概率为入.
由假设2知道一个健康人每天接触的人数服从二项分布,且平均值是m则
m= ( n -1) p
于是
n -1
又设一健康人被一名指定病人接触并感染的概率为口,则由假设3及⑵式得
r 入m
P"! =,P =
n T
那么一健康人每天被感染的概率P2为
肖(4)
由于健康人被感染的人数也服从二项分布,其平均值卩为,
—sp =(n - i)p2
标准差二为
:;f』SP2(1 - P2)十扣2(1 - P2)(n —i)
注意,通常n…m,, n 1,取(5.4)式右端展开式的前两项,有
平均值"的相对误差的度量
(3)常染色体遗传模型
为了揭示生命的奥秘,现代人越来越重视遗传学的研究,特别是遗传特征的逐代传播, 引起人们更多的重视?无论是人还是动植物都会将本身的特征遗传给下一代,这是因为后代 继承了双亲的基因,形成了自己的基因对,而基因对则确定了后代所应具有的特征 .以下仅
就常染色体遗传方式建立遗传数学模型, 来分析逐代总体的基因型分布趋势,
为有目的的遗
传控制提供依据。
问题分析
所谓常染色体遗传,是指后代从每个亲体的基因中各继承一个基因从而形成自己的基因 型?如果所考虑的遗传特征是由两个基因
A 和
B 控制的,那么就有三种可能的基因型: AA ,
AB 和BB.例如,金鱼草是由两个遗传基因决定它开花的颜色, AA 型开红花,AB 型的开粉
花,而BB 型的开白花?这里的AA 型和AB 型表示了同一外部特征(红色),则人们认为基因 A 支配基因
B ,也说成基因B 对于A 是隐性的?当一个亲体的基因型为 AB ,另一个亲体的基因 型为BB ,那么后代便可从 BB 型中得到基因 B,从AB 型中得到A 或B ,且是等可能性地得 到。
问题:某植物园中一种植物的基因型为 AA ,AB 和BB .现计划采用 AA 型植物与每种基
因型植物相结合的方案培育植物后代, 试预测,若干年后,这种植物的任一代的三种基因型
分布情况。
模型假设
(1)按问题分析,后代从上一代亲体中继承基因 A 或B 是等可能的,即有双亲体基因型 的所有可能结合使其后代形成每种基因型的概率分布情况如表
。
?以n n 和n 分别表示第n 代植物中基因型为 AA AB 和BB 的植物总数的百分率,
x (n )表示第n 代植物的基因型分布,即有
p 2 : 1 —(1
mi n
最后得到
hmi( n —i)
r*8 =
n
(8)
(9) (8)式给出了健康人每天平均被感染的人数 ?与n 、i 、m 入的关系,(9)式廿/卩可看作对 其中 1/2 1/2 利用(14)进行递推,便可获得第 n 代基因型分布的数学模型 通过求解,得 或写为 x (n) b n n =0,1,2, (10) 特别当n=0时,x (0^ (a 0,b 0,c 0)T 表示植物基因型的初始分布,显然有 a 0 b 0 5=1. 首先考虑第n 代中的AA 型,按上表所给数据,第 n 代AA 型所占百分率为 1 a n =1 a nj b n J 0 C n j 2 n 代的AA 型,第n-1代的AB 型与AA 型结合只 即第n-1代的AA 与AA 型结合全部进入第 有一半进入第 AA 型,故有 n 代AA 型,第n-1代的BB 型与AA 型结合没有一个成为 AA 型而进入第n 代 同理,第 1 a n =an 」■ — b nJ 2 n 代的AB 型和BB 型所占有比率分别为 (11) 将(11)、(12)、 b ^2bnj Cnj C n = ° (13)式联立,并用矩阵形式表示, 得到 (12) (13) (n) (n 」) x ( ' =Mx ( 1 (n =1,2/ ) (14) X (n) =Mx (nJ ^M 2 X (Z ==M n x (0) (15) (15)式明确表示了历代基因型分布均可由初始分布 X (0)与矩阵M 确定. x (n) a n b n 1 2n 0 1 一丄 2* 4 1 」 0 a 。 b a n =1 —(2)n b o —(2)七 心=(2)出+(;)叫0 C n = 0 由上式可见,当nr「时,有 a n r 1,b n r 0,C n r 0 即当繁殖代数很大时,所培育出的植物基本上呈现的是AA型,AB型的极少,BB型不存在? 2、随机性决策模型 所谓行为决策理论,就是用行为科学的观点和方法,对决策活动进行描述,解释和预测 的一种理论。 它以人的决策行为作业基本要素,以自然科学的实证方法(精神物理学等)作为主要手段,归纳出一套建立在经验证据基础上的理论观点,拓展了决策论的研究范围。 合理的决策必须具备三个条件: 1、目标合理; 2、决策结果满足预定目标的要求; 3、决策本身符合效率、满意、有限合理、经济性的原则。 所谓风险型决策是指在作出决策时,往往有某些随机性的因素影响,而决策者对于这些因素的了解不足,但是对各种因素发生的概率已知或者可估算出来,因此这种决策因存在一 定的风险? ①风险决策模型的基本要素 决策者一一进行决策的个人、委员会或某个组织?在问题比较重大和严肃时,通常应以 后者形式出现? 方案或策略一一参谋人员为决策者提供的各种可行计划和谋略?如渔民要决定出海打 鱼与否便是两个方案或称两个策略? 准则一一衡量所选方案正确性的标准?作为风险型决策,采用的比较多的准则是期望效益值准则,也即根据每个方案的数学期望值作出判断?对收益讲,期望效益值越大的方案越 好;反之对于损失来讲,期望效益值越小的方案越好 事件或状态一一不为决策者可控制的客观存在的且将发生的自然状态称为状态(事件), 如下小雨,下大雨和下暴雨即为三个事件或称三种状态,均为人所不可控因素 结果一一某事件(状态)发生带来的收益或损失值? ②风险决策方法 *利用树形图法表示决策过程具有直观简便的特点,将其称为决策树的方法?充分利用灵敏度分析(即优化后分析)方法对决策结果作进一步的推广和分析?决策树一般都是自上而下的来生成的。 选择分割的方法有好几种,但是目的都是一致的:对目标类尝试进行最佳的分割。 从根到叶子节点都有一条路径,这条路径就是一条“规则”。 决策树可以是二叉的,也可以是多叉的。 对每个节点的衡量: 1) 通过该节点的记录数 2) 如果是叶子节点的话,分类的路径 3) 对叶子节点正确分类的比例。 有些规则的效果可以比其他的一些规则要好。 决策树对于常规统计方法的优点。 构造好的决策树的关键在于如何选择好的逻辑判断或属性。对于同样一组例子,可以 有很多决策树能符合这组例子。人们研究出,一般情况下或具有较大概率地说, 树越小则树 的预测能力越强。要构造尽可能小的决策树, 关键在于选择恰当的逻辑判断或属性。 由于构 造最小的树是NP-难问题,因此只能采取用启发式策略选择好的逻辑判断或属性 天龙服装厂设计了一款新式女装准备推向全国。如果直接大批量生产与销售,主观估 计成功与失败的概率各为 0.5,其分别的获利为1200万元与-500万元,如取消生产销售计 划,则损失设计与准备费用 40万元。为稳妥起见,可先小批量生产试销,试销的投入需 45 万元。据历史资料与专家估计,试销成功与失败的概率分别为 0.6与0.4,又据过去情况, 大批生产销售为成功的例子中,试销成功的占 84%大批生产销售失败的事例中,试销成功 的占36%试根据以上数据,通过建立决策树模型按期望值准则确定最优决策。 解答:本题显然是要考核风险性决策模型的建立能力。按照这类模型的建立思路,我 们有: (一)问题分析与模型假设 1?问题涉及直接大批量生产与销售、取消生产销售计划和小批量试销售这样三个决策 方案的取舍,在每种方案下又分为成功或失败两种结果; 2. 决策目标在表面上看是获利大小,实际上是要决定试销与否; 3. 尚需注意后面几句话:“大批生产销售为成功的例子中,试销成功的占 84%大批生 产销售失败的事例中,试销成功的占 36%',这意味着要计算两个概率,其一是当试销成功 时,大批量销售成功与失败的概率; 其二是试销失败情况下, 大批量销售成功与失败的概率, 这意味着要利用贝叶斯概率公式; 4. 设定以下变量 A --试销成功,则 A --试销失败; B --大量销售成功,则 B --大量销售失败。 (二)模型建立 P(A/B) =0.84,P(B) =0.6,P(A/B) =0.36,代入贝叶 斯概率公式 P P (A /B )P(B ) P(A/ B)P(B) +P(A/ B)P(B) 0.84 汇 0.6 0.84 0.6 0.36 0.4 从而P (B/A ) =0.22.即当试销成功时,大批量销售成功与失败的概率分别为 0.78和0.22. 同理可以算出在试销失败情况下,大批量销售成功与失败的概率分别为 0.22和0.78. 1.先来计算两个概率,注意到 :-0.78,