当前位置:文档之家› 博弈论经典案例智猪博弈

博弈论经典案例智猪博弈

博弈论经典案例智猪博弈
博弈论经典案例智猪博弈

.

在经济学中,“在经济学中,“智猪博弈”(Pigs'payoffs)(Boxed Pigs)是一个著名博弈论例子。

这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。

如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

专业资料.

.

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成本不高,但收获最

大。

原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有专业资料.

.

效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”

增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。

许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具

有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。

”(Pigs'payoffs)是一个著名博弈论例子。

这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一专业资料.

.

只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。

规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。

如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

专业资料.

.

改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着

踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。

原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”

专业资料.

.

增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。

许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。

///////////////////

博弈理论(game theory)是现代经济学的基础理论之一,它所研究的是人们的决策选择以及相应的均衡问题。举一个经典的博弈案例有助于我们了解什么是博弈,这就是著名的智猪博弈。

这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃一点残羹。现在问:两只猪各会采取什么策略?答案是:小猪将舒舒服服地等在食槽边,而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。这个博弈结果被经济学家们用来解释了一系列的社会经济现象,其中也包括本人在北航澡堂里所遇到的那次经历。

上个星期天我在澡堂里当了一次大猪。那时我们第一批冲进了澡堂,结果发现水管里的水还没有放尽。谁先踩踏板,谁就会溅一身的凉水;如果大家都不先踩踏板,显然就都洗不成澡。但如果一部分人先踩踏板,另一部分人就可以……于是满浴室的人们就象智猪那样博弈了起来。博弈的结果是:大家都不去踩那踏板,而是看着一个大猪--笔者本人,在那里傻乎乎地淋着冷水。一个淋浴器的放水速度实在太慢了,冰凉的水流没完没了地溅在身上,冻得龇牙咧嘴的我环顾了一下四周才惊异地发现,大家都瑟瑟的站在那里,不时地抬头看着我头顶那喷涌的淋浴。我这才明白原来他们是在等我一个人把冷水排净!这下我真的僵硬了,随后的冰冷感觉可以用悲壮来形容。我要感谢后来走进浴室的另一位大猪帮我放水,缓解并缩短了我的苦难,也使这些小猪们欢快的洗上了热水澡。

聪明的小猪们依靠沉着和智慧在这场智猪博弈中轻松地击败了大猪。败下阵来以后,我对这次经专业资料.

.

历进行了认真的反思,得出以下几条结论:

首先,如果我和另外一只大猪不首先踩踏板,小猪中会不会有人首先去踩踏板?我认为一定会有的。长时间陷于困境的群体中总会出现一个敢于为群体的利益而献身的傻瓜,但他的下场一定是悲壮的。

其次,当群体道德丧失殆尽的时候,社会是否还有向前发展的可能?我认为是有可能的。如果浴室的管理人员在浴室中增加几个放水开关,小猪们就可以利用这一先进的装置迅速地放掉冷水,增进群体的福利。也就是说,即使社会道德水准降低到了极限(所有的人都变得绝对自私),技术进步仍然可以增进全社会的福利。也许这就是所谓的发展才是硬道理。

再次,制度约束能否替代道德约束?能不能建立一套制度,通过这套制度逐步改善这种群体的无效行为?我认为这也是有可能的。如果浴室改成按洗浴时间的长短来收费的制度,来增加小猪们的投机成本,他们中就会有相当多的人变成大猪。这就是现代西方经济学家们正在绞尽脑汁去探寻的途径。

最后,是否可以通过教育来解决这个问题?我认为这是最根本的出路。但这种教育与通常的思想政治教育应该是不同的。与其说北航是一个大家庭,不如说人们期望北航是一个大家庭,人们都向往生活在一个团结友爱、互助互让的大家庭里,但在建设这个大家庭时,人们很大程度上忽视了家庭赖以形成的最根本因素,那就是宽容和爱护。一个在没有宽

第二卷智猪博弈案例

第二卷智猪博弈案例 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 1 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

智慧树知到《博弈策略与完美思维》章节测试题[完整答案]

智慧树知到《博弈策略与完美思维》章节测 试题[完整答案] 见面课:信号博弈 2、如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,这就是该动态博弈的一个子博弈完美纳什均衡。 A.对 B.错 正确答案:对 3、颤抖手均衡解决了博弈方犯错误的问题,因此能够保证它的预测一定就是实际博弈的结果。 A.对 B.错 正确答案:错 4、不完全信息动态博弈分析的基本方法也是逆推归纳法。 A.对 B.错 正确答案:错 5、在动态经济博弈论问题中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。

B.错 正确答案:对 见面课:纳什均衡与应用 1、在囚徒困境的博弈中,两个囚徒合作的策略会形成( )。 A.纳什均衡 B.占优策略均衡 C.重复剔除的占优均衡 D.非纳什均衡 正确答案:非纳什均衡 2、在社会福利博弈中,流浪汉和政府博弈的均衡属于( )。 A.纯战略纳什均衡 B.混合战略纳什均衡 C.重复剔除的占优均衡 D.占优策略均衡 正确答案:混合战略纳什均衡 3、合作博弈就是博弈方采取相互合作态度的博弈。 A.对 B.错 正确答案:错 4、任何理性的博弈方都不可能采用严格下策。 A.对

正确答案:对 5、在考虑混合策略的情况下,我们不可利用重复剔除的方法进行分析求解。 A.对 B.错 正确答案:对 6、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 A.对 B.错 正确答案:错 见面课:纳什生平故事漫谈 1、下列哪个博弈属于零和博弈( )。 A.囚徒困境 B.懦夫博弈 C.智猪博弈 D.硬币博弈 正确答案:硬币博弈 2、“敌不动,我不动”指的就是纳什均衡。 A.对

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

智猪博弈案例整理

案例一、 有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府按实到犯人人数支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 案例二、 公司并购中的搭便车: 面对收购者,如果存在大股持有人和小股持有人,小股持有人宁愿当搭便车者,因为收购之后的股价会超出收购价格- 收购溢价,由于小股持有人无论出售股权还是保留股权都不能成为承购成功与否的决定因素,所以以不变应万变,存在不卖的优势策略。而大股持有人只有出售才能促成收购的成功,不出卖就得不到收购价格,逼迫他出卖股权,而小股东也会得利。 为了打击小股东的搭便车行为,往往在公司成立之初就会通过法律来届定权利,比如规定收购者一旦接管公司有权利稀释那些没有转让的股权。 案例三、 员工和企业也是一个“智猪博弈”过程,员工就是大猪,员工有两种选择,努力工作或者消磨时间。如果员工努力工作那么企业和员工都受益,如果员工敷衍工作,拿多少工资干多少活,那么最终会被企业辞退。员工只有行动才会受益,不行动则不受益或者受损。而企业可以选择物资奖励,也可以选择说教等待,物资奖励企业必先拿出部分资金作为奖励品,显然收益为负,而等待则不受损,即使辞退员工也可以有人填补空缺,让员工有危机感反而会促进员工的积极性。所以聪明的员工会选择努力工作引起领导注意而得到加薪。 案例四、 在现实生活中,我们随时随地都在扮演着“小猪”或是“大猪”,进行着一场场“智猪博弈”,只是我们并没发现而已。下面将具体从“学生社团”的案例来具体说明“智猪博弈”在生活学习中的存在性以及其作用。 在学校,参加社团是一件很平常的事情,但社团里的那些事情,其实也是一场场生动的博弈

博弈论 教案

《两种常见的博弈论模型》一课教案 审签: 2010 年 4 月 13日 班 级 课程名称 经济学基础 教 师 授课 时间 课 型 授课地点 课 题 项 目 认识完全信息静态博弈、完全信息动态博弈 课 时 任 务 通过学习完全信息静态、动态博弈,认识价格战及搭便车现象。 任务分解 1、知识准备:明确博弈论常见的5种分类及类型。 2、案例举例:囚徒困境、智猪博弈 3、模拟测试:分小组,应用所学独立解决智猪博弈问题。 教学 目标 专业能力 通过学习,能够运用博弈论知识分析解决“双寡头价格战问题”及生活中的搭便车现象。 知识目标 1.掌握博弈论的分类; 2.掌握完全信息静态及完全信息动态博弈论模型; 3.学会运用博弈论知识分析、解决分析价格战、搭便车的问题。 方法能力 1、培养学生的独立思考的能力; 2、培养学生学习博弈论的兴趣及爱好; 2、培养学生的团队合作及逻辑思维能力。 重 点 掌握完全信息静态博弈及其扩展运用。 难 点 运用博弈论知识解决分析价格战等恶性竞争问题及搭便车现象。 课堂练习 小组合作完成完全信息动态博案例—“卖鞭炮的选择” 课后作业 完成课后思考题 教学策略与方法 启发 讲解 任务驱动 多媒体演示 自主 描述 案例 分析 小组 讨论 归纳总结 实践 操作 √ √ √ √ √ √ √ √ 课后回顾 本次课程的优点: 存在的问题: 改进设想:

项目名称:博弈论与决策策略 任务:能够自主分析博弈论的模型并分析解决问题 一教学组织活动总过程设计:1、师生问好2、班长报告人数 老师活动:1、问好2、环顾学生 学生活动:1起立问好2、坐姿端正3、班长清 点人数,向老师报告。 活动达到的目标时间分配 创设情境,使学生注 意力集中,进入学习 状态 1分钟 二课程导入情境导入: 复习旧课,导入新课 以《囚徒困境》博弈论案例视频引入 老师活动: (1)老师引导学生回忆上节 课所学的内容,复习博弈论的五种 基本分类方式及类型。(2)播放关 于囚徒困境的视频,点出其中的重 点,并向学生提问。 学生活动: 跟着老师的思路回 忆上节课所学的内容。 认真观看视频并思考老 师所提问题。 活动达到的 目标: 复习旧课内 容为新课做 铺垫,视频 引入抓住学 生焦点。 时间分 配: 5分钟 三教学过程认识完全信息静态博弈 活动项目一:囚徒困境(11分钟) 1、首先,老师给出囚徒困境的博弈论模型。“囚徒困境模型”:该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑6年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑3年,而坦白者有功被减刑6年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。 提问:对于囚犯A而言,他会选择什么样的策略,囚犯B如何呢?(给2分钟时间让学生思考并分析此问题,并让他们尝试通过表格表达出囚犯A及B可能选择的策略及面临的后果) 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑6年。(老师讲解,板书,学生对照自己所写跟老师是否一致) 提问:那么囚徒困境在我们生活中的哪些地方同样存在呢? 补充介绍“囚犯困境”的扩展:双寡头企业价格战、军备竞赛等。 归纳总结完全信息静态博弈的3点特性:(1)同时做出选择;(2)明确对方的选择与游戏规则(共同知识);(3)不管是否沟通过,无法做出有约束力的承诺(非合作)(最好由学生归纳出)

从_囚徒困境_走向_智猪博弈_关于学术交流博弈策略的理性思考

CANGSANG 从“囚徒困境”走向“智猪博弈” —— —关于学术交流博弈策略的理性思考 朱逊贤 摘要学术交流是提升研究生科学研究能力的重要手段,在研究生培养和学校建设过程中有着重要的地位和作用。但是“囚徒困境”是影响学术交流的主要掣肘,基于“囚徒困境”的非合作博弈成为影响学生综合素质塑造的重要矛盾和问题。而“智猪博弈”是推动学术交流的共赢策略,即采取“合作博弈”的方式,达到学术交流的本质和目的。 关键词博弈论囚徒困境智猪博弈学术交流 学术交流是关于任一领域的学者通过正式和非正式渠道接收、使用和传播信息的交流活动[1],是科学技术工作中个人钻研和集体智慧相结合的一种形式[2],是原始创新的源头之一,是科学研究、技术进步的“催化剂”,是创新发明突发灵感的“点火器”,是科学新理论、新思想的“摇篮”[3]。激发、启迪才是学术交流最本质的、核心的意义。 研究生学术交流主要是指研究生参加的涉及有关学科前沿领域、新理论、新技术、新方法和应用的集会、讨论、报告、比赛等活动,是研究生培养的重要组成部分,是激励研究生创新的主要途径,是与外界互动,把握时代脉搏,学习、吸纳营养,逐步塑造、完善自己的有效渠道。这种交流可以是正式组织发起的,可以是同一专业的一些学生自发交流的,也可以是跨学科、跨专业的学生针对自己研究领域的前沿或者自己的思想、经验、方法等与大家交流,恳请予以评价、指正。交流的根本在于人与人之间的交流,通过交流实现优化,促进全面发展。参加学术交流的前提是:心态是主动的,希望和大家交流,想听听别人的意见和建议。只有这样才能真正达到交流的目的。 一、囚徒困境:影响学术交流的主要掣肘 著名的博弈论案例“囚徒困境”讲的是两个嫌疑犯A和B 作案后被警察抓住,分别关押在不同的屋子里受审讯。警察告诉他们:如果两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年(因证据不足);如果其中一人坦白另一人抵赖,坦白的无罪释放,抵赖的判刑10年。这里,每个囚徒都有两个战略:坦白或抵赖。在这个例子里,占有战略均衡就是(坦白,坦白),就是说不论对方如何选择,个人的最优选择都是坦白。比如说,如果B不坦白,A坦白的话被释放,不坦白的话被判1年,所以坦白比不坦白好;如果B坦白,A坦白的话被判8年,不坦白的话被判10年,所以坦白还是比不坦白好。这样,坦白就是A的占有战略。同理,坦白也是B的占有战略。结果是,每个人都选择坦白,各判刑8年。 囚徒困境反映了一个很深刻的问题,就是个体理性与集体理性的矛盾。如果两个人都抵赖,各判刑1年,显然比都判刑8年好。但是,两个人为了自己的眼前利益最大,而不愿意改变决策,导致集体利益最小,并且自身利益也没有达到最大化,反而受到了一定的损失。 博弈通常是建立在个体行为理性基础上的非合作博弈,追求个体利益的最大化。由于他们之间没有建立一个攻守同盟或者没有人积极性遵守协定,个体理性不一定能达到自己的目标。 这个例子是实际生活中许多现象的一个抽象概括。同学间“非合作博弈”不可避免地凸显,并逐渐成为影响学生综合素质塑造的重要矛盾和问题,这种现象在我校的研究生培养中亦不可避免地存在着。学校提供给的各项资源是有限的,不能满足所有学生的要求。由于个体利益的客观存在,为抓住发展机遇,个体之间表现为竞争对手的态势,从而围绕各项资源展开“非合作博弈”。传统的个体意识导致个体为了眼前利益和现实利益,会使个体之间存在形形色色的自我保护壁垒。由于个体自身发展水平和学校自身实力有限,学术交流给个体和学校带来的利益短期内不可能明显的表现出来,致使个体保护行为有了存在的理由,解决这个问题的难度也很大。 这种相互割据、自行其是的局面带来了很坏的影响。一是导致学校的资源不能得到充分利用,出现严重的浪费现象;二是导致学校在提高教学质量、培养创新人才等发展缓慢,制约学校服务学生、服务社会的能力和水平;三是使个体之间的比较优势不仅不能相互结合、充分发挥,反而在很大程度上出现相互制约,甚至出现不良竞争。 二、智猪博弈:推动学术交流的共赢策略 在经济学中,智猪博弈是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一头有个踏板,每踩一下踏板,在远离踏板的猪圈的另一头的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭便车策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲 学术争鸣 73 -- ··2011·2

智猪博弈案例整理

案例一、 有一个经典案例,就是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只就是运送犯人的费用要等到犯人送到澳洲后才由政府按实到犯人人数支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 案例二、 公司并购中的搭便车: 面对收购者,如果存在大股持有人与小股持有人,小股持有人宁愿当搭便车者,因为收购之后的股价会超出收购价格- 收购溢价,由于小股持有人无论出售股权还就是保留股权都不能成为承购成功与否的决定因素,所以以不变应万变,存在不卖的优势策略。而大股持有人只有出售才能促成收购的成功,不出卖就得不到收购价格,逼迫她出卖股权,而小股东也会得利。 为了打击小股东的搭便车行为,往往在公司成立之初就会通过法律来届定权利,比如规定收购者一旦接管公司有权利稀释那些没有转让的股权。 案例三、 员工与企业也就是一个“智猪博弈”过程,员工就就是大猪,员工有两种选择,努力工作或者消磨时间。如果员工努力工作那么企业与员工都受益,如果员工敷衍工作,拿多少工资干多少活,那么最终会被企业辞退。员工只有行动才会受益,不行动则不受益或者受损。而企业可以选择物资奖励,也可以选择说教等待,物资奖励企业必先拿出部分资金作为奖励品,显然收益为负,而等待则不受损,即使辞退员工也可以有人填补空缺,让员工有危机感反而会促进员工的积极性。所以聪明的员工会选择努力工作引起领导注意而得到加薪。 案例四、 在现实生活中,我们随时随地都在扮演着“小猪”或就是“大猪”,进行着一场场“智猪博弈”,只就是我们并没发现而已。下面将具体从“学生社团”的案例来具体说明“智猪博弈”在生活学习中的存在性以及其作用。 在学校,参加社团就是一件很平常的事情,但社团里的那些事情,其实也就是一场场生动的博弈论案例。就我自己的经历来说,大二时我当上了某个校社团的会长,社团里还有多个部长,

博弈论(生存智慧大全集)_同生共存:竞争中的智猪博弈

有一些公司经常会利用“智猪博弈”:笼子的一头有一个按钮,另一头是饲料的出口和食槽。摁一下按钮,将有相当于10个单位的猪食进槽。但是,摁动按钮所需付出的“劳动”,要消耗相当于2个单位的猪食。每只猪都必须要做出决策是等在食槽旁边还是去摁动按钮。问题在于按钮和食槽分置笼子的两端,付出劳动摁动按钮的猪跑到食槽的时候,坐享其成的另一头猪早已开吃。如果大猪先到,大猪吃到9个单位的猪食,小猪只能吃到1个单位的猪食;如果同时到达,大猪吃到7个单位猪食,小猪吃到3个单位猪食;如果小猪先到,小猪可以吃到4个单位猪食,而大猪就只能吃到6个单位的猪食。 这场博弈的结果,依赖和取决于大猪的行为判断。如果小猪去摁动按钮,大猪当然乐于等待在食槽旁吃掉9个单位的猪食。如果小猪等待,那么大猪将先去摁动按钮再跑回来以获得相当于4个单位的猪食,这总比饿肚子等待要好。对小猪来说,无论大猪如何行动,它最好的办法就是等在食槽旁边。于是就会出现这个博弈的均衡结果:每次都是小猪在食槽边等着大猪去摁动按钮,然后小猪先吃,大猪再赶来吃——共同生存。 从“智猪博弈”中可以看出,在市场上一个占主导地位、控制着市场的公司和它的一个较小的竞争对手之间可能发生的竞争情况,取决于占主导地位的公司如何看待这个较小的竞争对手对它的威胁程度。当然,“智猪博弈”中“共同生存”的均衡结果,只有在大猪的食物份额没有受到小猪严重威胁时才会出现,才会实现真正的“共同生存”。 商场竞争中的小公司就类似于“智猪博弈”中的“小猪”。如果公司是弱小的一方,则可以选择如下策略: 一是等待。允许市场上占主导地位的品牌开拓本行业所有产品的市场需求。将自己的品牌定位在较低价格上,以享受主导品牌的强大广告所带来的市场机会。 二是不要贪婪。只要主导品牌认为弱小公司不会对自己形成威胁,它就会不断创造市场需求。因此,公司可以将自己定位在一个引起不了主导品牌兴趣的较小的细分市场,以限制自己对主导品牌的威胁。如果大公司在行业市场中占主导地位,则可采取接受小公司的策略。 作为主导品牌,加强广告宣传,创造和开拓对行业所有产品的市场需求才是真正的利益所在。不要采取降价这种浪费资源的做法与小企业竞争,除非它对公司形成了真正的威胁。正是小企业采取的低价格阻止了潜在进入者的涌入。对威胁的限制要清楚:如果小企业发展壮大到了构成威胁的程度,大公司就应该迅速做出进攻性的反应,并且让小企业清楚地知道它们在什么样的规模水平之下才是可以被容忍的,否则就会招致大公司强有力的回击。如果小公司知道对它们的限制,也就不会再有兴趣超越这种限制。 通过运用“智猪博弈”原理的分析,竞争双方应对自己在竞争博弈中的地位和作用有一个清醒的认识,这一点非常重要。认清自己真正的利益所在,避免残酷的价格战的发生,两个地位相差甚远的最终就能够达成一种和平的生存模式,这就是共同生存。

智猪博弈理

智猪博弈理论 拼音:Zhìzhū Bóyì Lǐlùn(Zhizhu Boyi Lilun) 英文:Boxed Pig Game 同义词条:Boxed Pig Game 目录[ 隐藏 ] ?1智猪博弈理论简介 ?2经典案例 ?3智猪博弈理论的启示 ?4从“智猪博弈”到“新智猪博弈” ?5“新智猪博弈”理论的运用 智猪博弈理论:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃一点残羹。

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有两头猪,一头大猪,一头小猪。 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食

槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待,一份也得不到;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新

智猪博弈理论

智猪博弈是经济学中一个很典型的博弈理论,在这个理论中会有许多经典的意义所在,现在让我们来了解一下吧。 【问题】 假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。 两头猪场面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。 如果某一头猪作出自己去按按钮的选择,它必须付出如下代价: 第一,它需要收益相当于两个单位的成本;

第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。 假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪和小猪各吃到4个单位的猪食;若两头猪同时到(两头猪都选择等待,实际上两头猪都吃不到猪食),大猪吃到6个单位的猪食,小猪吃到4个单位的猪食。 问:大小猪的最优决策是什么?最后的结果很可能是什么样子的?? 【答案】 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 从这个矩阵上不难看出,小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)是最佳选择。 原因很简单:在大猪选择行动的前提下,小猪选择等待的话,在大猪返回食槽之前,小猪可得到4个单位的纯收益,大猪到达之后只能得

到剩下的6个单位,实得4个单位;而小猪和大猪同时行动的话,则它们同时到达食槽,分别得到1个单位和5个单位的纯收益;在大猪选择等待的前提下,小猪如果行动的话,小猪在返回到达食槽之前,大猪已吃了9个单位,小猪只能吃到剩下的1个单位,则小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 【启示】 博弈与制度 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论复习讨论题

1、人与人之间的博弈是什么关系? 既可以是竞争关系,也可以是合作关系 2、因为博弈论的研究而获得1994年诺贝尔经济学奖的是 泽尔腾、海萨尼、纳什 3、学习博弈论的目的只是为了在今后与他人的博弈中能够打败对手(×) 4、博弈是指在一定的游戏规则约束下,基于(直接)相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 5、如果博弈前的损益总和与博弈后的损益总和相等,该博弈称为零和博弈 6、策略具有以下特性:完整性、不可观察性、多样性 7、人在博弈中并不是完全理性的(√) 8、博弈论的建立基于两大假设,其中除了人的理性以外,还有一个是(人的认知) 9、囚犯困境的根本原因在于个人行为的负外部性(私人成本与社会成本的差异) 10、在囚犯困境的博弈中,事先订立攻守同盟一定是有用的(×) 11、(占优)策略是指无论其他参与者采取什么策略,某参与者采用该策略的结果都优于或不劣于其他策略。 12、以下现象哪些明显属于“囚犯困境”?价格战、公地悲剧、环境污染 13、“好货不便宜、便宜没好货”其实是一个“智猪博弈”,这是因为不懂行的人占了懂行的人的便宜 14、之所以会出现“万元陷阱”,是因为:不懂得止损、沉没成本 15、智猪博弈是一个搭便车的博弈。一方付出了相应的代价,双方共享了所得到的收益。(√) 16、人在“亏损”的情况下,会从一个风险(厌恶)者变成了风险偏好者。 17、以下哪些博弈不属于竞争关系?同学聚会 18、哪些行业是赢者通吃的?演艺界、搜索引擎、门户网站 19、杭州试行的“谦让牌”之所以没效果,是因为宣传力度不够(×) 20、汇合点(Meeting point)必须是(共同)知识才有用 21、以下是某教授和学生张三之间的策略表达式:教授选择放过该学生的概率是多少?50% 22、以下是某教授和学生张三之间的策略表达式:张三选择平时勤快的概率是多少?20% 23、纯策略是指如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动(√)

智猪博弈理论

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 目录 介绍 博弈与制度 由智猪博弈故事得到的启示 编辑本段介绍 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 小猪 行动等待 大猪行动5,14,4 等待9,-10,0  从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 编辑本段博弈与制度 由智猪博弈故事得到的启示 在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。 还有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 关于这一问题,现任招商局掌门人秦晓先生在最近做客央视《对话》节目时,也谈了他的一些看法。他认为:企业领导人应该去制定游戏规则,而不应该单纯地去做裁判。他觉得制度应当比个人的权威

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

活学活用博弈成功智慧_第五章 智猪博弈:多劳不多得的悖论情境

聪明猪与笨和尚 博弈论里面有个十分卡通的博弈模型,叫做“智猪博弈”。 假设猪圈里有两头猪同在一个食槽里进食,一头大猪,一头小猪(假设它们都是有着认识和实现自身目标的充分理性的“智猪”)。猪圈两头距离很远,一头安装了一只控制饲料供应的踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一头就会有相当于10份的饲料进槽,而踩踏板以及跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的饲料。 这两头猪各有两个选择:自己去踩踏板或等待另一头猪踩踏板。其中选择自己踩踏板的猪,不仅要付出劳动,消耗掉2份饲料,而且由于踏板远离饲料,它将比另一头猪后到食槽,从而减少吃到饲料的数量。下面假定:若两头猪都选择等待,那就都吃不到饲料,即双方得益均为0;若小猪踩踏板,大猪将吃到9份的饲料,小猪只能吃到l份的饲料,最后双方得益为[9,一1](小猪付出劳动之后消耗掉2份饲料);若大猪踩踏板,大猪和小猪将分别吃到6份和4份的饲料,最后双方得益为[4,4];若两头猪同时踩踏板,同时跑向食槽,大猪吃到7份的饲料,小猪吃到3份的饲料,即双方得益为[5,1]。 由上面的分析可以看出:小猪踩踏板只能得到l份甚至有可能损失1份饲料,不踩踏板反而有可能得到4份饲料。对小猪而言,无论大猪是否踩动踏板,小猪都不去踩踏板,而舒舒服服地等在食槽边,都是最好的选择。 小猪选定了“等待”之后,大猪便只剩下了两个选择:等待就吃不到;踩踏板得到4份饲料。所以踩踏板就变成了大猪的优势策略,当大猪知道小猪是不会去踩动踏板时,自己亲自去踩踏板总比不踩强,只好为自己的4份饲料不知疲倦地奔忙于踏板和食槽之间。 如果采用重复剔除劣势策略的方法,那么首先,无论大猪选择什么策略,选择踩踏板对小猪都是一个严格劣势策略,应该首先加以剔除。在剔除小猪踩踏板这一选择后的新博弈中,小猪只有等待一个选择,而大猪则有两个可供选择的策略。在大猪这两个可供选择的策略中,选择等待是一个严格劣势策略,我们再剔除薪博弈中大猪的严格劣势策略——等待。剩下的新博弈中只有小猪等待、大猪踩踏板这一个可供选择的策略,这就是智猪博弈的理陛解。 智猪博弈与囚徒困境的不同之处在于:囚徒困境中的犯罪嫌疑人都有自己的严格优势策略(也就是坦白);智猪博弈中,只有小猪有严格优势策略(等待),而大猪没有。 这样就出现了一个多劳不多得的悖论情境:小猪躺着大猪跑。 智猪博弈存在的基础,就是双方都无法摆脱共存局面,而且必有一方要付出代价换取双方的利益。而一旦有一方的力量足够打破这种平衡,共存的局面便不复存在,期望将重新被设定,智猪博弈的局面也随之被破解。 中国有个美术片叫做《三个和尚》,里面说“一个和尚挑水吃,两个和尚抬水吃,三个和尚没水吃”,看上去,他们都想做那只“智猪”,但是却因为无人愿意承担起义务而导致每个人都无法获得利益。 用我们日常的话来讲,智猪博弈,就是一个不同期望值之间的博弈,如果所有各方的期望值

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

智猪博弈的例子

智猪博弈的例子···· 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“**主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不

相关主题
文本预览
相关文档 最新文档