当前位置:文档之家› 博弈模型建立

博弈模型建立

博弈模型建立
博弈模型建立

博弈论期末测评姓名:游龙城

专业:土木工程

班级:104

学号:1008070417 任课老师:胡鸣时间:2011 12 28

1:博弈模型的建立

“海盗分赃”模型

5个海盗抢到100颗宝石,在如何分赃的问题上争吵不休。于

是他们决定:

(1)抽签决定个人的号码[1,2,3,4,5]。

(2)由1号提出分配方案。然后5人表决,如果方案超过半数同意就被通过,否则就把1号丢入大海。

(3)1号死后,由2号提出分配方案。然后4人表决,当且仅当超过半数同意时方案通过,否则就把2号丢入大海。

(4)以此类推,直到找到一个大多数人能接受的方案。如果只剩下5号,他一人获得全部宝石。

现在假定每个强盗都是足够理智能判断得失的“理性人”。为了避免不必要的争执,我们还假定每个方案都能顺利表决并按照约定规则执行。那么,如果你是第一个海盗,你该如何提出分配方案使自己的利益最大化?

2: 三要素,博弈方,支付函数,博弈分析和结果,均衡结果,博弈结果,博弈结果的效率分析。

严酷的分配规则给人的第一印象是:如果我抽到了1号,那将是一件十分不幸的事。因为作为第一个提出分配方案的人,能活下去的机会微乎其微。即使1颗宝石都不要,全部都给其余4人,分配方案也有可能被大家反对,只有死路一条。

如果你也这样想,那么答案会大大出乎你的意料:1号海盗留给3号1颗宝石,留给5号2颗宝石,自己独得97颗。分配方案可以写成[97,0,1,0,2]。

只要你没有被吓倒,不妨站在剩下4人的角度分析:显然,5号是最不合作的,因为他没有死亡的威胁,从直觉上说,每扔下一个对手他就离获得全部宝石更近一步。4号正好相反,他的生存机会完全取决于前面有人活着,因此4号值得争取。3号对前面2位的命运完全不在乎,因为轮到他提出方案时,他只需要得到4号的支持再加上自己一票即可通过。那么2号呢?他需要得到3票才能活命......

现在,你有思路了吧!下面我将通过严格的逻辑思维去推想他们的决定。

5号的策略最简单:巴不得把所有人扔下海(这并不是说他将对每个分配方案投反对票,他也会考虑别人的方案通过的情况,因为他是足够理智能判断得失的“理性人”。)

再看4号。如果前面3个人都被扔下大海,只剩他和5号。5号一定会投反对票将他扔下大海,进而独得所有宝石。所以4号一定会支持3号的分配方案以求得活命。

3号知道这一点,一定会提出[100,0,0]的分配方案,因为4号即使1颗宝石也得不到,也会因为不想死而投赞同票,这样2:1方案就通过了。

不过2号会针对3号的策略,提出[98,0,1,1]的分配方案。即放弃3号,给4号和5号各1颗宝石。因为3号的方案是自己独吞,对于4号和5号来说,不但能活命还能得到1颗宝石,显然2号的分配方案更好,因此他们会投赞同票支持2号的方案。

同样,2号的策略也会被1号洞悉。所以1号会提出[97,0,1,0,2]或者[97,0,1,2,0]的分配方案。由于1号的分配方案由于2号提出的方案,他会获得自己、3号和5号或者自己、3号和4号3票的支持。这样1号的分配方案通过,97颗宝石轻松落入腰包。

但是还有另一种可能,就是4号提出[0,100]的分配方案,因为5号可以在不杀死4号的情况下独得所有宝石,所以他有可能同意4号的分配方案,因为毕竟是理性人,如果可以不杀死人是最好的。这样4号支持3号和反对3号都可以活命的话,3号的保险分配方案应该是[99,1,0]。即为了争取4号而分给他1颗宝石。同理,2号的分配方案也应调整为[97,0,2,1]。1号的分配方案将是[97,0,1,0,2]或者[96,0,1,3,0]两个方案相比较,显然同样稳妥的情况下,前者收益更好。

至此,1号的最佳分配方案终于出炉![97,0,1,0,2]

在"海盗分赃"模型中,任何"分配者"想让自己的方案获得通过的关键是,事先考虑清楚"挑战者"的分配方案是什么,并用最小的代价获取最大收益,拉拢"挑战者"分配方案中最不得意的人们。1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。

不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。

首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。

如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓!

再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。这样,结果又当如何?

通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的奶酪?”可以料想,一旦1号所提方案和其所想的不符,就会有人大闹……当大家都闹起来的时候,1号能拿着97枚金币毫发无损、镇定自若地走出去吗?最大的可能就是,海盗们会要求修改规则,然后重新分配。想一想二战前的希特勒德国吧!

而假如由一次博弈变成重复博弈呢?比如,大家讲清楚下次再得100枚金币时,先由2号海盗来分……然后是3号……这颇有点像美国总统选举,轮流主政。说白了,其实是民主形式下的分赃制。

最可怕的是其他四人形成一个反1号的大联盟并制定出新规则:四人平分金币,将1号扔进大海……这就是阿Q式的革命理想:高举平均主义的旗帜,将富人扔进死亡深渊……

制度规范行为,理性战胜愚昧!

如果假设变为,是10人分100枚金币,投票50%或以上才能通过,否则他将被扔入大海喂鲨鱼,依此类推。50%是问题的关键,海盗可以投自己的票。因此如果剩下两个人,无论什么方案都会被通过,即100,0。

往上推一步,3个人时,倒数第三个人知道如果出现两个人的情况,因此它会团结第一个人,给他一个金币

“往前推一步。现在加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。所以P3知道,只要给P1一枚金币,P1就会同意他的方案(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。

P4的情况差不多。他只要得一票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。

依此类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。

结果,“海盗分金”最后的结果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。

在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

真地是难以置信。P10看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大收益。而P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。

3:建议或措施,参考文献。

在分赃的过程中,作为第一个制定规则的人,应当充分考虑自己更低级的分赃者,有足够清晰的头脑和聪明的思维,拉拢竞争者分配方案中最不得意的人,使自己的利益最大化,不过也要考虑其他的任何情况,以使自己处于最优的地位。

制度规范行为,理性战胜愚昧!

参考文献:

1:海盗分金百度百科

2:wangxxmdl的博客2009-06-09临海望月网易博客

3:支付函数百度知道2008-09-19 910579535

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

第二卷智猪博弈案例

第二卷智猪博弈案例 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 1 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

关于“智猪博弈”和激励

关于“智猪博弈”和激励 近日,看了一本书,讲了“智猪博弈”的故事,很有启发。 智猪博弈讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会 抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 大猪为何要这样呢?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。从而形成“小猪躺大猪跑”的结果。由此想到一个关于企业员工激励的问题来:这是一个人力资源管理的问题,人力资源指数=能力×意愿。企业中员工的能力各不相同,对收入的期望各不相同,工作意愿更是各有千秋,

就像“大猪”和“小猪”。马斯洛的需求层告诉我们,提高工作意愿可以满足员工的以下五个层次:生理需求、安全需求、社交需求、尊重需求和自我实现需求。就这五个层次而言,需求必须是逐层上升的,所以,较低层次的需求必先被满足——归根就是生活必须的钱。于是我们联想起智猪博弈和企业的利益分配问题。在企业中,如果实行的是利益均等的这种“天朝田亩制度”形式,刚开始的时候,大家肯定会热情高涨,人人有钱,永不落空,久而久之后,状况出来了:就像“智猪博弈”中的搭便车的小猪,发现了即使自己偷懒后仍然能吃到东西,因为有其他人在努力!而偷懒带来的享乐远远大于对自身带来的损失。这样的现象在很多国营和民营企业中,都或多或少的存在,我们经常看到有些企业老板(领导)凡事亲力亲为,每天疲于奔命,而手下的员工做事得过且过,只会偷懒。其实老板(领导)就是博弈中的“大猪”,因为企业的利益和自身有莫大的利益相关,自然要呕心沥血。而作为收入较少的一线员工(“小猪”),部分人会站在自己的利益立场:即使对公司损失巨大,做得差的员工只不过是少一百几十元,而偷懒去炒股或上网的员工得到的是利益和享乐,少赚百十元,却可以享受每天农场偷菜的悠闲生活,虽然这是一种不思进取的思想,但不能否认,对于部分人“等待”是最优的策略。而对于一些卓越的企业领导者,只是通看看报表,指明战略方向,制定目标,就能让企

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期 用博弈论分析生活现象论文

博弈论分析生活中现象 博弈论它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域,主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的,所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利,我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。 比如某一天你觉得应该是你女朋友的生日,但又不能肯定,如果是女朋友的生日的话,你可以送一束花,女朋友会特别高兴,你不送花,女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话,你可以送女朋友一束花女朋友感到意外的惊喜,你不送花结果生活同往常一样。 生日非生日 买花 1 ,1 2 ,1 不买花-1,-1 0 ,0 确定今天是女朋友的生日或确定今天不是女朋友的生日,但你的最好行动都是买花。 谈到博弈论我们不得不说到囚徒困境,其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年刑但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。两个犯

人陷入的就是囚徒困境, A B 招不招 招 5 ,5 无罪释放,10 不招10,无罪释放 1 ,1 其结果就是A和B都招,判5年刑。如果两人协商后选择不招,但如果A或B其中一人招了,另一人就会判10年,而招的一人就会无罪释放,这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。 人际交往中的博弈 人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损两败俱伤。如果是朋友,也会因不断发生“负和游戏”而逐渐疏远,夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。如果不使性负气,而是互相谅解,与人交往采取合作态度,便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高,采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

智猪博弈理

智猪博弈理论 拼音:Zhìzhū Bóyì Lǐlùn(Zhizhu Boyi Lilun) 英文:Boxed Pig Game 同义词条:Boxed Pig Game 目录[ 隐藏 ] ?1智猪博弈理论简介 ?2经典案例 ?3智猪博弈理论的启示 ?4从“智猪博弈”到“新智猪博弈” ?5“新智猪博弈”理论的运用 智猪博弈理论:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃一点残羹。

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有两头猪,一头大猪,一头小猪。 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食

槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待,一份也得不到;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新

智猪博弈案例整理

案例一、 有一个经典案例,就是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只就是运送犯人的费用要等到犯人送到澳洲后才由政府按实到犯人人数支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 案例二、 公司并购中的搭便车: 面对收购者,如果存在大股持有人与小股持有人,小股持有人宁愿当搭便车者,因为收购之后的股价会超出收购价格- 收购溢价,由于小股持有人无论出售股权还就是保留股权都不能成为承购成功与否的决定因素,所以以不变应万变,存在不卖的优势策略。而大股持有人只有出售才能促成收购的成功,不出卖就得不到收购价格,逼迫她出卖股权,而小股东也会得利。 为了打击小股东的搭便车行为,往往在公司成立之初就会通过法律来届定权利,比如规定收购者一旦接管公司有权利稀释那些没有转让的股权。 案例三、 员工与企业也就是一个“智猪博弈”过程,员工就就是大猪,员工有两种选择,努力工作或者消磨时间。如果员工努力工作那么企业与员工都受益,如果员工敷衍工作,拿多少工资干多少活,那么最终会被企业辞退。员工只有行动才会受益,不行动则不受益或者受损。而企业可以选择物资奖励,也可以选择说教等待,物资奖励企业必先拿出部分资金作为奖励品,显然收益为负,而等待则不受损,即使辞退员工也可以有人填补空缺,让员工有危机感反而会促进员工的积极性。所以聪明的员工会选择努力工作引起领导注意而得到加薪。 案例四、 在现实生活中,我们随时随地都在扮演着“小猪”或就是“大猪”,进行着一场场“智猪博弈”,只就是我们并没发现而已。下面将具体从“学生社团”的案例来具体说明“智猪博弈”在生活学习中的存在性以及其作用。 在学校,参加社团就是一件很平常的事情,但社团里的那些事情,其实也就是一场场生动的博弈论案例。就我自己的经历来说,大二时我当上了某个校社团的会长,社团里还有多个部长,

智猪博弈理论

智猪博弈是经济学中一个很典型的博弈理论,在这个理论中会有许多经典的意义所在,现在让我们来了解一下吧。 【问题】 假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。 两头猪场面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。 如果某一头猪作出自己去按按钮的选择,它必须付出如下代价: 第一,它需要收益相当于两个单位的成本;

第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。 假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪和小猪各吃到4个单位的猪食;若两头猪同时到(两头猪都选择等待,实际上两头猪都吃不到猪食),大猪吃到6个单位的猪食,小猪吃到4个单位的猪食。 问:大小猪的最优决策是什么?最后的结果很可能是什么样子的?? 【答案】 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 从这个矩阵上不难看出,小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)是最佳选择。 原因很简单:在大猪选择行动的前提下,小猪选择等待的话,在大猪返回食槽之前,小猪可得到4个单位的纯收益,大猪到达之后只能得

到剩下的6个单位,实得4个单位;而小猪和大猪同时行动的话,则它们同时到达食槽,分别得到1个单位和5个单位的纯收益;在大猪选择等待的前提下,小猪如果行动的话,小猪在返回到达食槽之前,大猪已吃了9个单位,小猪只能吃到剩下的1个单位,则小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 【启示】 博弈与制度 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

战略风险投资博弈模型分析

战略风险投资博弈模型分析 本文此处将通过对风险投资公司投资处于成长阶段创新企业的活动的分析和研究,提出信号传递博弈模型的企业价值评估方法。通过信号传递博弈模型来分析企业向风险投资公司传递信号(企划书)对价值评估结果的影响,给风险投资公司进一步量化风险和预期投资收益提供思路和参考。 4.1 如何对风险投资目标企业进行价值评估 目前国际上对一个成熟的企业的价值评估一般分为以下五个步骤:分析历史绩效、预测绩效、资本成本评估、连续价值评估、计算并解释结果。这几个步骤有些因为创新企业还远未成熟而无法进行,比如历史绩效分析时很可能财务数据不健全,目标市场价值权数选取时也因为主观预测成分很大而具有很大风险性;最重要一点,由于创新企业急需要注入大笔资金才能继续生存和发展,风险投资公司必须在尽量短的时间内作完考查工作,因为时间价值可谓创新企业的生命价值,错过发展时机肯定是要牺牲的。在这尽量短的时间内,创新企业需要一定的融资技巧,而且有很强的信息优势,风险投资公司除应在投资合约中对其进行约束之外,也要根据自己的观察结果给企业定价,以作为谈判和投资的基础。本文拟引入信息经济学中信号传递博弈模型的企业价值评估方法,风险投资公司结合以往投资经验和统计结果对相应估计结果进行调整,以便客观评估企业的价值及是否值得投资。作为创新企业经营者一方面应利用信息优势影响评价结果,另外对企业有初步的估价以免在价格谈判中贱卖了企业,所以该模型对谈判双方都具有一定的实际价值。 4.2 信号传递博弈模型介绍 信号传递模型(Signaling Games)是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这类博弈中,有两个参与人,i= 1,2,参与人1称信号发送者,参与人2为信号接受者;参与人1的类型是私人信息,参与人2的类型是公共信息。博弈顺序如下: (1)“自然”首先选择参与人1的类型θ∈Ω,此处Ω={θ1,…,θK}是参与人1的类型空间,参与人1知道θ,但参与人2不知道,只知道参与人1属于θ的先

智猪博弈理论

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 目录 介绍 博弈与制度 由智猪博弈故事得到的启示 编辑本段介绍 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 小猪 行动等待 大猪行动5,14,4 等待9,-10,0  从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 编辑本段博弈与制度 由智猪博弈故事得到的启示 在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。 还有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 关于这一问题,现任招商局掌门人秦晓先生在最近做客央视《对话》节目时,也谈了他的一些看法。他认为:企业领导人应该去制定游戏规则,而不应该单纯地去做裁判。他觉得制度应当比个人的权威

经济学基础复习资料答案版

经济学基础复习资料 一、填空题 1、被誉为“经济学之父”,他于1776年发表了代表作《》,这是近代经济学的奠基之作,是“第一部系统的伟大的经济学著作”。 2、经济学上说说的稀缺性是指。 3、经济学家用来描述对现有行动计划的微小增量调整。 4. 市场本身不能有效配置资源的状况被称为。 5、经济资源通常可以分为两大部分:一是,二是。 6、如果考察没有剔除物价变动前的名义GDP 与剔除了物价变动后的实际GDP 的比值,我们可以得到。 7、经济学上用来作为衡量一国贫富差距的标准。 8、买者的支付意愿减去买者的实际支付量,所得的差额被称为。 9、价格效应包括和。 10、从经济因素角度看,规模不经济可以分为和。 11、,经济学家把不同竞争与垄断程度的市场分为四种基本类型:、、 和。 12、理性厂商的利润最大化原则是。 13、货币在经济中的职能主要有、和。 14、奥肯定理揭示了和之间的关系。 15、描述失业率和通货膨胀率替代关系的曲线被称为。 16、是反映一定时期经济发展水平变化程度的动态指标,也是反映一个国

家经济是否具有活力的基本指标。 17、一种经济行为给外部造成积极影响,使他人减少成本,增加收益,这种经济行为被称为 。 18、一个国家的出口额与进口额的差额被称为。 19、目前,我国实行的就是以市场供求为基础,参考一篮子货币进行调节、有管理的汇率制度。 20、最常见的衡量市场垄断权力程度的指标是。 21、在博弈论中,由所有参与人最优策略组成的策略组合称之为。 22、均衡价格也被称为。 23、曲线是用来衡量社会收入分配(或财产分配)平均程度的曲线。 24、一般价格水平的普遍和持续上涨称为。 25、当我们选择了某种行动时,所放弃的其他可供选择的最好用途的价值就是这种行动的。 二、单项选择题 1、被誉为“经济学之父”的是() A、凯恩斯 B、马歇尔 C、亚当·斯密 D、保罗·萨缪尔森 2、经济学上所说的“稀缺性”指的是() A、资源绝对量的多少 B、欲望的相对有限性 C、欲望的无限性

博弈模型

有趣味的博弈论模型 按语: 本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页;在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”;2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”(请看最后附录),这篇科普文章名列首位,我们还有一篇文章名列第七。如果读者有兴趣可以去看看,或等我有时间找出来。我觉得,把新兴科学应用通俗易懂的语言写出来,有利于科学知识普及。这也应该是一个科学工作者的责任。 在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。 博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。 “囚徒困境”模型 囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠 诚,则背叛者将无罪释放(收益为T ) ;坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为R S P ) 。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。 自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

博弈模型分析

1.3 管理型医疗概念研究 - 概念提出 - 博弈关系杨燕绥/王瑶平 - 分析模型岳公正 管理型医疗中的博弈关系:模型分析 (暂题) 概括地讲,管理型医疗是一种主要由医院(或者医生)、患者(或者受益人)、医疗保险管理机构(或者医疗保险经办机构)、政府四方参与的管理过程,是建立在互惠基础上的进行多方合作的医疗社会管理机制。由于经济发展水平、人文环境、行政管理具体情况等的不同,各个国家和地区的管理型医疗的结构和内容应当有其特点,具体操作方式和方法也很自然地存在差异。但是,从逻辑实质看,各个国家和地区存在着诸多差异的管理型医疗在本质上都是一个由医院、患者、医疗保险管理机构、政府四方围绕医疗服务定价、服务标准和成本控制等问题进行协商、规范和监督的管理过程。 本节的研究内容:1、对于管理型医疗中的博弈关系进行划分;2、对于管理型医疗中主要的博弈关系进行分析。 1 管理型医疗中博弈关系的划分 一般分析,医疗保险涉及的主体主要由医院、患者、医疗保险管理机构、政府四方组成。但是,在通常情况下,医疗保险在实际操作上涉及的主体还包括参保人、缴费人、受益人、基金管理公司、基金托管机构、医疗服务机构(营利和非营利)、药店、类似医生协会和药品协会的NGO组织、社会保障部门和卫生部门、监督评价机构等等。如何将这些组织和机构协调起来,从而降低医疗费用,提高医疗服务的质量是管理型医疗的主要内容。

图1-3—1 医疗保险的运行关系1 依据图1-3—1分析,医疗保险的运行中,包括了多元主体(医院、医疗保险经办机构、雇主、雇员、药店等)之间复杂的多维的相互制约与相互影响的关系。 1、医院和医疗保险经办机构的关系; 2、医院和受益人的关系; 3、医疗保险经办机构和受益人的关系; 4、医疗保险经办机构和药店的关系; 5、受益人和药店的关系; 6、医疗保险经办机构和政府的关系; 7、医疗保险经办机构和雇主(企业)的关系; 8、医疗保险经办机构和雇员(患者、投保人)的关系; 9、雇主和雇员的关系; 1杨燕绥著:《劳动与社会保障立法国际比较研究》,第239页,中国劳动社会保障出版社,2001年

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

智猪博弈的例子

智猪博弈的例子···· 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“**主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不

相关主题
文本预览
相关文档 最新文档