数学建模博弈模型29页PPT

格式：ppt
大小：2.98 MB
文档页数：29

下载文档原格式

数学建模第十讲博弈模型演示教学

赢得函数：当局势出现后，对策的结果也就确定了。也就是说，对任一局势s∈S，局中人i可以得到一个赢得Hi(s)。
显然， Hi(s)是局势s的函数，称之为第i局中人的赢得函数。
10.1 二人零和对策
1﹒二人有限零和对策：是指有两个参加对策的局中人，每个局中人都只有有限个策略可供选择，在任一局势下，两个局中人的赢得之和总等于零。
数学建模第十讲博弈模型
问题二:囚徒困境
甲乙两个嫌疑犯因同一罪行被逮捕,如果双方均坦白，则各获刑3年，如果双方均不坦白，则各获刑 2年，如果其中一人坦白，另一人不坦白，则坦白一方宽大释放，另一方获刑5年，两个嫌疑犯各自应采取什么策略才能使自己的刑期最短。
问题分析：问题中所涉及的要素
（1）决定者—甲、乙嫌疑犯两人；（2）可用的决定—坦白、不坦白；
的完整的行动方案，称为一个策略。设i为局中人，i 的所有策略构成的集合Si称为i的策略集。
3﹒赢得函数（支付函数）
局势: 在一局对策中，各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略，则n个局中人的策略组s={s1， s2，…， sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔乘积表示，即S=S1× S2×… × Sn
因此局中人Ⅱ的策略应为β 2 。总之，局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ，β 2。
4﹒矩阵对策的解定义1 设G={S1 ， S2；A}为矩阵对策，其中
S1={α1,α2, …,αm}，S2={ β 1, β 2, …, β n} ， A= （aij）m×n
若等式
max
i
min
j
aij=minj
am1 am2 …amn 局中人Ⅱ的赢得矩阵为﹣A。

数学建模博弈模型

博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择，为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为，为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制，为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系，揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中，两个猎人一起打猎，猎物可以平分。如果一个猎人选择合作而另一个选择背叛，则背叛者可以独吞猎物。但如果两个猎人都不合作，则都没有猎物可吃。最佳策略是合作，但个体理性可能导致两个猎人都不合作，造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略，揭示了合作与竞争的平衡。
详细描述
在智猪博弈中，一个大猪和一个小猪共同生活在一个猪圈里。每天都有一桶食物放在食槽中，大猪和小猪需要竞争才能吃到食物。如果大猪和小猪同时到达食槽，大猪会因为体型优势占据更多食物。但如果小猪先到食槽等待，大猪到来时已经没有食物可吃。最佳策略是小猪等待，大猪先吃，然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中，当所有参与者都选择最优策略时，达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采取的策略。
均衡分析
通过分析收益函数和策略空间，找出博弈的均衡点。

数学建模博弈模型PPT31页

谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路，那么，任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远，吾将上下而求索。——屈原 75、内外相应，言行相称。——韩非
数学建模博弈模型
16、自己选择的路、跪着也要把它走完。 17、一般情况下)不想三年以后的事，只想现在的事。现在有成就，以后才能更辉煌。 19、学习的关键--重复。
20、懦弱的人只会裹足不前，莽撞的人只能引为烧身，只有真正勇敢的人才能所向披靡。

数学建模博弈模型

λ↑，报童利润↑ ，报社利润↓ 利润的任意分配比例都可达到
回收协议模型
模型一回收价格协议回收价b (p>w>b>v) 整体最优
pw F (Qr ) p b
原订货量
pw F (Qr ) pv
pc F (Q ) pv
*
达到协调
pc pw p v p b
cv w wb (b) b ( p b) pv
• 双方总能成交吗？（效率估计）
模型假设与建立
• 卖方知道物品对自己的价值，但买方不知道. • 买方知道物品对自己的价值，但卖方不知道. • 双方都知道（如猜出）对方价值的分布信息. 卖方价值vs, 买方价值vb, 均服从 [0,1] 上的均匀分布
卖方报价ps, 买方报价pb, pb ≥ ps时成交价p＝ (pb+ps)/2 成交效用：卖方U1=p- vs, 买方U2= vb –p; 不成交: 0
0 0
xF ( x) |0 F ( x)dx Q (1 F (Q )) Q F ( x)dx
期望存货量
I (Q) Q S (Q) F ( x)dx
0
Q
期望利润 G(Q) pS(Q) vI (Q) wQ ( p v)S (Q) (w v)Q 最优订购量Qr
pc 假设报社与报童联合，整体利润最大 F (Q ) pv pw *>c Q (w*) <Q* F (Qr ) 一般w r pv 整体利润有损失能否改善(协调)？
*
价格折扣协议模型
折扣方案wd(Q) 下，报童效用(期望利润)
U r ( wd (Q)) ( p v)S (Q) ( wd (Q) v)Q

博弈论与数学模型PPT教案

零和的要求限制了矩阵博弈在经济学中的应用，也阻碍了非合作博弈向多人推广。
对两人非零和有限博弈，双方收益需用两个矩阵表示，称为双矩阵博弈（bimatrix game）。
1960年，Lemke和Howson给出了求解双矩阵博弈解的算法，但该算法是指数时间的。
第22页/共67页
John Forbes Nash
EconomicBehavior》出版，这是博弈论正式形成的标志。 Princeton Press，1944
第2页/共67页
博弈论的发展简史
1950-1953年，Nash先后发表四篇论文，提出了Nash均衡，讨价还价等一系列重要概念。
二十世纪六七十年代起，经济学、社会学和生物学领域开始大量应用博弈论，并逐渐在经济学界取得重要地位。
• 1994年，三位博弈论研究者Nash，Harsanyi，Selten获诺贝尔经济学奖，博弈论开始走入大众视野。
第3页/共67页
博弈的要素
参与者（player）：参与博弈的决策主体。行动（actions）：参与者可以采取的行动（策略）方案的全体；
所有参与者采取各自的行动后形成的状态称为局势（outcome）。收益（payoff）：各个参与者在不同局势下获得的利益。规则（rule）：对参与者行动的先后顺序、参与者获知信息的多少
第41页/共67页
Hotelling 模型
第42页/共67页
最优反应函数
第43页/共67页
Nash均衡
(1/2,1/2)是Nash均衡，两家快餐店开在同一地点，平分所有的客源。
该模型可推广为居民住址服从任意连续分布的情形。若分布的中位数m为，则Nash 均衡为（m,m）。
第44页/共67页

数学建模-博弈模型

就是在文化娱乐方面，也能运用海滩占位的博弈结论予以解释。如果把电视中高雅艺术节目与较低档的节目比作海滩的两端，那么众多的电视观众就可以看作是散布在海滩上的游客。电视台常常将黄金时段的电视节目定位在中等档次，以提高收视率。
例三智猪争食猪圈里喂养两头猪，一头大猪，一头小猪。猪圈的一边有一个猪食槽，对面的一边装有控制开关。只要猪用鼻头去拱控制开关，就会一次有6个单位的饲料流进猪食槽。如果大猪和小猪都不去拱开关，那么它们都吃不到饲料。如果小猪去拱开关，那么等它跑到另一边的猪食槽时，大猪已将流出的饲料全部都吃光了。如果大猪去拱开关，那么等它跑到猪食槽旁边，小猪差不多已吃掉了5个单位的饲料，结果大猪只能吃到1个单位的饲料。如果大猪、小猪一起去拱开关，再一起跑去吃食，那么大猪可抢到4个单位的饲料，小猪也只能吃掉2个单位的饲料。假定每拱一次开关需要消耗0.5个单位饲料的能量。大猪和小猪长期在一起进食，上面所说的情况（信息、知识）已为它们所掌握。仿照例一囚徒困境的情形，就可以画出如图1－4所示的双变量矩阵。
博弈论囚徒困境问题提供的解是战略组合（坦白，坦白）。严格的定义与详细的阐述留到第2章讨论。这个战略组合是个占优战略组合，因为无论对方如何选择，自己的最优选择都是坦白。如果囚徒2不坦白，囚徒1坦白的话他就会马上获释，不坦白的话还得坐一个月的牢，所以坦白比不坦白好；如果囚徒2坦白，囚徒 1坦白的话要判6个月，不坦白的话则要判9个月，这样对囚徒1来说，还是坦白比不坦白好。因此坦白是囚徒 1的占优战略。同样的分析表明，坦白也是囚徒2的占优战略。均衡的结果是每个囚徒都选择坦白，各判刑6 个月。
博弈模型
第一部分、博弈论基本概念
一、引言
宇宙间处处存在矛盾、冲突、争斗、合作、共生等现象，这些现象很很早就引起各类学者的重视。哲学家们对此作过深刻讨论，毛泽东的《矛盾论》便是其中的代表。另一方面，数学被认为是科学的语言，能否用数学语言描述各种带有矛盾因素的模型或现象？博弈论便是这样一种处理各类带有矛盾因素的模型的数学工具，现在已被数学、经济学、社会学、军事学、生物学等专家广泛应用于讨论各类带有冲突、矛盾、合作、竞争、进化等问题及相关模型之中。博弈论已成为人们分析复杂系统与作重大决策时的有力工具。

数学建模-博弈模型

数学研究的方法是从大量的同类现象中抽象出基本要素，进步构造出能描述这类现象的模型。许多冲突模型在游戏中就存在，博弈论早期就是由研究国际象棋开始的，所以被命名为Game Theory。人们很快认识到此种理论可用于经济、政治、军事等领域，所谓“世事纷争一棋局”，正说明其中一些道理。 1944年冯· 诺曼（John，Von Neumann）和奥· 摩根斯特恩（Osker Mor－gentern）合著的《竞赛论与经济行为》（Theory Of GSmes and Economic Behavior）问世，总结了初期研究成果，奠定了博弈论的基础。由于该理论主要讨论在复杂的矛盾冲突等活动中，局中人（Player）采取何种合理的策略（strategy）而能处于“优越”的地位，以便取得较好效益，所以将它译为博弈论。
常见的游戏如棋类，两人对奕，此两人便称为局中人，他们各有一套棋路，或善于用马，或长于用炮。在每次轮到一方走子时，他可能有许多走法，这些走法依赖于当时棋局形势以及棋手想要达到的目的，以及他惯用的走法，从而形成他走棋的指导思想。对奕时指导棋手行动的思想便称为策略。对局终了可能有三种结局：甲胜；乙胜；和局。如果用数量表示各种结局，例如胜家赢得彩金若干（设所得彩金由输家付给，则输家当然失去若干），和局时都不能取得彩金，此种表示结局的数称为支付（payoff）。局中人、策略、支付是博弈论中常见的基本概念。
在这个博弈中，大猪与小猪都有两种战略选择：拱、不拱。在这个例子中可以发现，不论大猪选择拱还是不供，小猪的最优选择总是不拱。这是因为，如果大猪去拱开关，小猪不拱（等在猪食槽旁边）比拱后再跑回去争食要划算（5>1.5）；如果大猪不去拱开关，小猪不拱顶多都不得食，而去拱就要白白消耗能量，不划算（0>-0.5）。所以，不拱是小猪的占优战略。给定小猪总是选择不拱，大猪的最优选择总是拱。这样，智猪争食问题的博弈论解是战略组合（拱，不拱）。

数学建模第十讲博弈模型31页PPT

数学建模第十讲博弈模型
51、没有哪个社会可以制订一部永远适用的宪法，甚至一条永远适用的法律。 ——杰斐逊 52、法律源于人的自卫本能。——英格索尔
53、人们通常会发现，法律就是这样一种的网，触犯法律的人，小的可以穿网而过，大的可以破网而出，只有中等的才会坠入网中。 ——申斯通 54、法律就是法律它是一座雄伟的大夏，庇护着我们大家；它的每一块砖石都垒在另一块砖石上。 ——高尔斯华绥 55、今天的法律未必明天仍是法律。 ——罗·伯顿
▪
30、意志是一个强壮的盲人，倚靠在明眼的跛子肩上。——叔本华
谢谢！
31
▪
26、要使整个人生都过得舒适、愉快，这是不可能的，因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情，化为上进的力量，才是成功的保证。好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇

博弈模型数模共52页

ቤተ መጻሕፍቲ ባይዱ 66、节制使快乐增加并使享受加强。 ——德谟克利特 67、今天应做的事没有做，明天再早也是耽误了。——裴斯泰洛齐 68、决定一个人的一生，以及整个命运的，只是一瞬之间。 ——歌德 69、懒人无法享受休息之乐。——拉布克 70、浪费时间是一桩大罪过。——卢梭
博弈模型数模
26、机遇对于有准备的头脑有特别的亲和力。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力量泉源之一，也是成功的利器之一。没有它，天才也会在矛盾无定的迷径中，徒劳无功。- -查士德斐尔爵士。 29、困难就是机遇。--温斯顿．丘吉尔。 30、我奋斗，所以我快乐。--格林斯潘。

数学建模优秀讲座课件之博弈论

，
Page 20
囚徒困境可以用来说明许多现象。
• 广告战
两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。
此二公司可以有二选择：
互相达成协议，减少广告的开支。（合作）
Page 14
纳什均衡的定义
• 纳什均衡简单说就是，一策略组合中，所有的参与者面临这样的一种情况：当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。
Page 15
•寻找纳什均衡的方法———条件策略下画线法
Page 17
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果两个犯罪嫌疑人都坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪，各被判刑8年；如果只有一个犯罪嫌疑人坦白，另一个人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑 2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。
-3y+2(1-y)=2y+(-1)*(1-y)
解的：
y=3/8，
而美女每次的期望收益则是2(1-y)-3y=1/8元。
Page 28
由以上结果可知，在双方都采取最优策略的情况下，平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案，不论你再采用什么方案，都是不能改变局面的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

数学建模博弈模型29页PPT

合集下载

数学建模第十讲博弈模型演示教学

数学建模博弈模型

数学建模博弈模型PPT31页

数学建模博弈模型

博弈论与数学模型PPT教案

数学建模-博弈模型

数学建模-博弈模型

数学建模第十讲博弈模型31页PPT

博弈模型数模共52页

数学建模优秀讲座课件之博弈论

文档推荐

最新文档

数学建模博弈模型29页PPT

合集下载

数学建模第十讲博弈模型演示教学

数学建模博弈模型

数学建模博弈模型PPT31页

数学建模博弈模型

博弈论与数学模型PPT教案

数学建模-博弈模型

数学建模-博弈模型

数学建模第十讲博弈模型31页PPT

博弈模型 数模共52页

数学建模优秀讲座课件之博弈论

文档推荐

最新文档

博弈模型数模共52页