第二章 完全信息静态博弈的基本理论解析
- 格式:doc
- 大小:202.50 KB
- 文档页数:12
第二章完全信息静态博弈2在完全信息静态博弈中,各博弈方同时决策,且所有博弈方对各方得益都完全了解。
完全信息静态博弈属于非合作博弈最基本类型。
本章介绍该类博弈的一般分析方法、纳什均衡概念及分析方法的扩展。
2.1 基本分析方法3上策均衡严格下策反复消去法划线法箭头法上策均衡4 (Dominant-strategy Equilibrium)上策(Dominant-strategy) :不管其它博弈方选择什么策略,一个博弈方的某个策略给他带来的得益至少不低于其他策略。
例:囚徒困境Idea..?5上策均衡与均衡结果:上策均衡(坦白,坦白)均衡得益(-5,-5)“坦白”相对于“抵赖”是每个囚徒的上策(优势策略)-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒B囚徒A上策均衡6 (Dominant-strategy Equilibrium)上策均衡:由每个博弈方的上策所组成的策略组合。
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。
博弈方2博弈方1A B C a3,22,35,4 b2,11,23,3 c1,61,44,5例寻找上策(优势策略)检查一下你是否存在上策,如果有,就选择它。
站在其他方的位置上思考问题如果你没有上策,那么从其他博弈方角度考虑。
如果其他博弈方有上策,预期他将选择自己的上策。
严格下策:不管其它博弈方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,称前一种策略为相对于后一种策略的“严格下策”。
1,01,30,40,2左中1,01,3左中1,01,30,10,40,22,0左中右上下211,3中上例:巡逻6,24,48,00,0巡逻不巡逻穷人不巡逻富人WELCOME富人与穷人1112处于强势的博弈方为维护自己利益采取某种决策时,为其他弱势博弈方提供了搭便车的机会公司里的大股东与小股东每一个博弈方针对其他方的每一种策略,在自己的最大可能得益下划线2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争划线法13划线法:通过在最佳对策得益下划线分析博弈的方法。
博弈论⽇记(2)完全信息静态博弈基础理论1.1.博弈的标准式和纳什均衡1.1A.博弈的标准式表述⾸先我们来说明⼀下什么是完全信息静态博弈,静态博弈指开始时由参与者同时选择⾏动,然后根据所有参与者的选择,每个参与者得到各⾃的结果。
完全信息博弈即每⼀个参与者的收益函数(根据所有参与者选择⾏动的不同组合决定某⼀参与者收益的函数)在所有参与者之间是共同知识。
之所以称为基础理论,是因为本⼩结要解决两个基本问题:如何描述⼀个博弈以及如何求博弈的解。
定义:在⼀个n⼈博弈的标准式的表述中,参与者的战略空间为S1,S2,……,Sn,收益函数为u1,u2,……,un,我们⽤G={S1,S2,……,Sn;u1,u2,……,un}表⽰此博弈。
1.2B.重复剔除严格劣策略上⾯是博弈论的表述⽅法,下⾯是⼀个关于博弈论的解的⽅法(虽然不常⽤)。
定义:在标准式的博弈G={S1,S2,……,S3;u1,u2,……,un}中,令Si′和Si″代表参与者i的两个可⾏战略(即Si′和Si″是Si中的元素)。
如果对其他参与者每⼀个可能的战略组合,i选择Si′的收益都⼩于其选择Si″的收益,则称战略Si′相对于Si″是严格劣战略。
ui(S1,S2,…,Si′,…,Sn;u1,u2,…,ui′,…un}<ui{S1,S2,…,Si″,…,Sn;u1,u2,…,ui″,…un}1/2 L2 R2 M2L1 1,0 1,2 0,1R1 0,3 0,1 2,0参与⼈1有两个可选策略,S1={L1,R1},参与⼈2有三个可选策略S2={L2,R2,M2}。
在这个博弈中,对参与⼈1来说L1和R1都不是严格占优的。
因为如果参与⼈2选择L2,参与⼈1L1优于R1;参与⼈2选择R2,参与⼈1L1优于R1;参与⼈2选择R2,参与⼈1R1优于L1;但对参与⼈2来讲,M2是严格劣于R2的,因此理性的参与⼈2是不可能选择M2的,就可以把M2在战略空间中剔除,如果参与⼈1知道参与⼈2是理性的,那么他就可以将这个博弈视为下图:1/2 L2 R2L1 1,0 1,2R1 0,3 0,1此时⼜产⽣了⼀个新的情况,对于参与⼈1来讲,R1⼜是严格劣与L1的,因此就可以将R1在参与⼈1的战略空间中剔除,博弈⼜变成了如下情况:1/2 L2 R2L1 1,0 1,2此时双产⽣了⼀个新的情况,对于参与⼈2来讲,L2⼜是严格劣与R2的,因此就可以将L2在参与⼈2的战略空间中剔除,博弈双变成了如下情况:1/2 R2L1 1,2上述的过程就可以称为“重复剔除严格劣策略”。