博弈论7
- 格式:ppt
- 大小:210.00 KB
- 文档页数:58
博弈论总结第1篇最大化自己最坏情况下的收益。
着眼于自己的收益,保证自己收益,防止风险使得自己的收益变小。
以性别之战为例子:首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育 xxx子期望收益(着眼于自己的期望收益): Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表(妻子收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,妻子的收益可能为0;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看体育,收益同样最小)这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为:minUw(p,q) = min(1-P,2P)5.最大化最坏收益: max(min(1-P,2P))解的:P=1/3则妻子的maxmin策略为:1/3概率选择韩剧,2/3概率选择体育。
同理得丈夫的maxmin策略为:1/3概率选择体育,2/3概率选择韩剧。
minmax策略 1.最小化对手最好情况下的收益。
是着眼于对手的收益。
还是这样的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育2.丈夫期望收益(着眼于对方的期望收益):(与maxmin不同要注意!!)Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表(丈夫收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,如果这时妻子也想看体育,丈夫收益到2;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看韩剧,收益同最大1)这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为:maxUw(p,q) = max(2-2P,P) 5.最小化最好收益: min(max(1-P,2P))妻子的minmax策略:2/3概率选择韩剧,1/3概率选择体育同里丈夫为的minmax为…在零和博弈中,maxmin策略和minmax策略是等价的。
第七章 重复博弈7.1 启发性例子博弈论中最为著名的模型大概是第二章中介绍的“囚徒困境”模型,它告诉我们一个局中人之间非合作的故事。
按照博弈论中关于局中人为理性人的假定:“囚徒困境”中局中人之间的不合作似乎是必然的结果。
但是,从另一方面看,现实生活中存在着诸多的合作现象,并且,对于经济学家来说,制度的形成及演化必定需要合作行为作为其基础。
因此,研究在一个长期环境中合作是否和怎样得以维持是非常重要的。
更为一般地,如果博弈是重复进行的,其结果是不是有所不同呢?当“囚徒困境”中的小偷在出狱后还会再次联合作案时,他们就不得不考虑今次出卖同伙会在今后受到同伙惩罚的可能,因而其选择“坦白”的战略就增加了一个额外的成本。
我们要探求的是在什么样的条件下,在他们两个人之间的长期关系会有助于他们之间的合作。
表7.1 囚徒困境21 抵赖坦白在性别战博弈中(见表7.2,其中F 表示“足球”,B 表示“芭蕾”),(F ,F )和(,)B B 都是纳什均衡,并且分别给出收入或者支付向量(2,1)和(1,2)(还有第三个纳什均衡,但它给出一个较低的总期望收入)。
如果这个博弈重复进行许多次,可不可达到((F ,F )和(C ,C )在各个时期交替出现,得到期望收入(1.5,1.5)?或者,我们是否能达到对于任意a ∈(0,1)的支付向量(2(1-),2(1-)a a a a ++)?这些就是我们需要回答的问题。
表7.2 性别战(其中F 表示“足球”,C 表示“芭蕾”)21 F B我们将只讨论无限次重复博弈的情形。
有两个理由使得我们这样做:首先,关于有限次重复博弈,如果阶段博弈只有一个纳什均衡,假定局中人极大化每个时期获得收入的贴现和,则重复博弈也只有一个平凡的完美纳什均衡,即阶段博弈纳什均衡的重复。
这意味着在有限次合伙作案中,囚徒们每次被逮住都会如实招供的。
所以,此时重复博弈并不能带来合作。
其次,我们认为一个长久且有着确定性结束时刻的关系是相当不现实的。