第二章 完全信息静态博弈2
- 格式:ppt
- 大小:1.05 MB
- 文档页数:41
第二章完全信息静态博弈2 2.4 混合策略和混合策略纳什均衡严格竞争博弈和混合策略多重均衡博弈和混合策略混合策略和严格下策反复消去法混合策略反应函数石头剪子布石头0, 01, -1-1, 1剪子-1, 10, 01, -1布1, -1-1, 10, 0MinMax32.4.1 严格竞争博弈和混合策略原则一:策略选择不能被另一方猜到原则二:行为不能存在规律性,即随机选择策略原则三:选择策略的概率分布,恰好使对方无机可乘混合策略:在博弈中,博弈方的策略空间为,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈”。
混合策略纳什均衡:包含混合策略的纳什均衡策略组合。
},,;,,{11n n u u S S G ⋯⋯=i },,{1ik i i s s S ⋯=k i ),,(1ik i i p p p ⋯=10≤≤ij p ki ,,1⋯=11=+⋯+ik i p p 4混合策略、混合策略博弈和混合策略纳什均衡2,35,23,11,5C D A B博弈方2博弈方1博弈方1的策略选择:5213⨯+⨯=⨯+⨯B A B A p p p p 1352⨯+⨯=⨯+⨯D C D C p p p p 1=+B A p p 1=+D C p p 博弈方2的策略选择:2,35,23,11,5C D A B博弈方2博弈方1),(),(),(),(11111D B u P P C B u P P D A u P P C A u P P u D B C B D A C A ⋅⋅+⋅⋅+⋅⋅+⋅⋅=6.212.02.038.02.052.08.028.08.0=⨯⨯+⨯⨯+⨯⨯+⨯⨯=),(),(),(),(22222D B u P P C B u P P D A u P P C A u P P u D B B C A D A C ⋅⋅+⋅⋅+⋅⋅+⋅⋅=6.252.02.012.08.028.02.038.08.0=⨯⨯+⨯⨯+⨯⨯+⨯⨯=策略得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2)2.6V ,-D-P ,00,S 0,0睡不睡偷不偷守卫小偷-D ’-D10守卫得益((睡)S P t 小偷偷的概率加重对守卫的处罚:短期效果是使守卫更尽职但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率7小偷和守卫*tP *t PV10-P -P ’小偷得益(偷)P g 守卫睡的概率加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会使得守卫更多的偷懒8小偷和守卫的博弈*g P *g P V ,-D-P ,00,S 0,0睡不睡偷不偷守卫小偷9激励的悖论加重对小偷的处罚,最终加大的是守卫偷懒的概率加重对守卫的处罚,才降低了盗窃发生的概率一、夫妻之争2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争3)(0)(0)(1)(⨯+⨯=⨯+⨯F p C p F p C p w w w w 1)(0)(0)(2)(⨯+⨯=⨯+⨯F p C p F p C p h h h h 妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡策略得益妻子(0.75,0.25)0.67丈夫(1/3,2/3)0.751)()(=+F p C p w w 1)()(=+F p C p h h 102.4.2 多重均衡博弈和混合策略1,30,00,02,2AB A B厂商2厂商1制式问题制式问题混合策略纳什均衡A B 得益厂商1:0.4 0.6 0.664厂商2:0.67 0.33 1.29611二、制式问题-50,-50100,00,1000,0进不进进不进厂商2厂商1市场机会进不进得益厂商1:2/3 1/3 0厂商2:2/3 1/3 012三、市场机会博弈包括混合策略之后,严格下策反复消去法仍然成立。
第二章 完全信息静态博弈完全信息:每一个参与者对其他所有参与者的策略空间及得益有准确的知识。
静态:所有参与者同时选择策略,每一个参与者事先并不知道其他参与者的具体策略选择第二章 完全信息静态博弈2.1严格优势策略均衡 2.2严格劣势策略消去法 2.3相对优势策略划线法 2.4多重纳什均衡的选择 2.5无限策略博弈反应函数法 2.6混合策略纳什均衡2.1 严格优势策略均衡引子:囚徒困境(Prisoner ’s Dilemma)参与者:囚徒1、囚徒2 策略空间:坦白、抵赖 得益:1、一个坦白并作证,另一个抵赖,抵赖者入狱五年,坦白者将得到宽大释放; 2、都坦白,每人入狱三年;3、都不坦白,每人以妨碍公务罪入狱一年。
得益矩阵 得益矩阵 得益矩阵 囚徒 2 坦白抵赖囚徒1 抵赖11 055 033坦白 坦白策略被称为囚徒1的全面的严格的优势策略。
简称严格优势策略全面的:不论对方采用何种策略,此策略总显示优势 严格的:此策略严格好于其他策略由严格优势策略组成的博弈均衡,称为 “严格优势策略均衡”囚徒困境的严格优势策略均衡为(坦白,坦白) 双方的得益为(-3,-3)启示:“个人理性”与“集体理性”的冲突例1:公共品供给的囚徒困境李四 修不修张 修 三不修不修 00 133111修路的成本为4,各自获得的好处为3例2:价格战百事可乐低价 高价可 低价口口可 高价 乐乐 55 611 633注:囚徒困境得益+6第二章 完全信息静态博弈2.1严格优势策略均衡 2.2严格劣势策略消去法 2.3相对优势策略划线法 2.4多重纳什均衡的选择 2.5无限策略博弈反应函数法 2.6混合策略纳什均衡2.2 严格劣势策略消去法引子:智猪博弈按钮食槽小猪大猪 按一下按钮会有10单位的猪食进槽,但按按钮然后 再跑到猪食槽需要付出2单位成本参与者:大猪、小猪策略空间:按按钮、坐等其食 得益:1、同时按按钮并跑过来,大猪吃到7个单位,小猪 吃到3个单位。