当前位置:文档之家› (整理)“智猪博弈”模型对员工激励机制的启示.

(整理)“智猪博弈”模型对员工激励机制的启示.

(整理)“智猪博弈”模型对员工激励机制的启示.
(整理)“智猪博弈”模型对员工激励机制的启示.

内容摘要:在现代企业中,人已经成为企业发展最为重要的因素。而企业能否成功地对员工实施激励,发挥员工的积极性和创造性,直接决定其未来的市场竞争地位。本文以企业的激励机制为背景,通过对“智猪博弈”模型及其改进的分析,将其与企业激励机制相结合,最后得出改善企业员工激励机制的措施。

关键词:激励机制“智猪博弈”模型

人力资源是现代企业的战略性资源,也是企业发展的关键因素。激励是人力资源中的重要内容,它是指激发员工的工作动机,也就是说用各种有效的方法去调动员工的积极性和创造性,使员工努力去完成组织的任务,实现组织的目标。因此,企业实行激励机制的最根本目的是正确激发员工的工作热情,使他们在实现组织目标的同时实现自身的需要,增加其满意度,从而使他们的积极性和创造性继续保持下去。可见,激励机制运用的好坏在一定程度上是决定企业兴衰的重要因素。如何运用好激励机制也就成为各个企业面临的一个重要问题。

研究背景

企业的发展壮大是与员工密不可分的。在调动员工的积极性,使其全心全意为企业服务这一方面,激励机制发挥的作用尤为重要。笔者针对某企业对其员工进行的调查研究,得出该企业现有的激励机制的优势与劣势。

(一)企业激励机制的优势

1.大量的员工培训。该企业对入职员工进行大量的入职培训,让员工掌握岗位最基本工作技能与操作,以便使他们尽快适应工作环境。

2.培训结果与晋升挂钩。该企业对入职员工培训后,对其培训效果进行评估,成绩好的员工被任为助理。

(二)企业激励机制的劣势

1.工资过低。该企业的员工包括管理层、月薪工和时薪工三种。其中,月薪工和时薪工的工资都偏低,特别是时薪工。

2.没有制定绩效改进计划。年度评估后,没有给出员工具体的方向,使得评估的作用发挥不大。同时因为绩效考评没有和薪酬有机结合起来,使得绩效考评的激励作用也不明显。

总的来说,员工出勤率、工作效率都相对比较低,工作的积极性不高,原有的激励机制并不够完善,没有起到应有的作用。笔者试从“智猪博弈”模型的构造与改进的分析中,得出改善该企业的时薪工激励机制的措施。

“智猪博弈”模型构造

博弈论是研究各个理性决策主体在其行为发生直接相互作用时的决策及决策均衡问题,它是有关一个主体受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。在博弈论中有一个经典的模型即“智猪博弈”模型,其博弈的结果和策略对企业的激励机制很有启示。

(一)“智猪博弈”模型

“智猪博弈”讲的是猪圈里有两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装着一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但按动按钮的劳动将消耗相当于2个单位的猪食。若大猪等待小猪按钮,大猪吃9个单位,小猪只能吃1个单位;若大猪按动按钮,小猪等待,大猪吃6个单位,小猪吃4个单位;若两头猪同时按钮,大小猪分别吃7个单位和3个单位。两猪博弈对应的不同战略组合的支付水平如表1所示。

每只猪都必须做出决策,是在食槽边等待,还是去按按钮。对于小猪来说,如果它等待,要么吃4个单位,要么不吃(最终结果取决于大猪的决策);如果它按按钮,要么吃1个单位,要么吃-1个单位(最终结果也取决于大猪的决策)。因此,小猪的选择非常明显,即等待。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强,所以只好亲力亲为了。最终小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

(二)“智猪博弈”模型的改进

那么,是什么导致“小猪躺着大猪跑”的现象呢?其实这是由于规则的核心指标所导致的:每次落下的食物数量和踏板与投食口之间的距离。笔者改变这两个关键条件,再来看看相应的策略:

1.减量方案。减量方案即投食为原来的一半份量。结果是小猪、大猪都不去踩踏板了。因为谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

2.增量方案。增量方案即投食为原来的一倍份量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义社会”,但竞争意识却不会很强。

3.减量加移位方案。减量加移位方案即投食为原来的一半份量,但同时将投食口移到踏

板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。因为等待者不得食,而多劳者多得。

“智猪博弈”模型对激励机制的启示

不完善的激励机制不但不会发挥激励作用,还很有可能带来一系列的问题,给企业造成重大的损失。“智猪博弈”原模型的激励机制一旦在企业中的应用,其产生的后果将甚为严重。

企业运用的激励手段不当,就会出现“小猪躺着大猪跑”的现象。从长期看,这种现象危害极大。首先,“大猪”做很多事情却回报甚少,他可能会选择离开这个是非之地,当然,如果他心理极不平衡,他可能会去传播损害企业形象的事。同时,“小猪”会继续其受益者的角色,成为“坏一锅汤的老鼠”,对企业文化的负面影响巨大。长期下来,企业将受到挑战,这种激励机制的结果是,企业中会留下越来越多的“小猪”,经济效益大幅下滑,企业可能最终走向灭亡。因此,企业想要生存,想要发展,就必须建立完善的激励机制,避免出现上面所述的问题。

(一)针对工资过低问题的激励机制

1.减量方案下的策略。据调查,表2为某企业及其竞争对手的时薪工的工资情况。

从表2可以看出,对于竞争对手来说,该企业员工的工资相对偏低,特别是时薪工。该企业采取的策略属于模型中的减量方案,可是其薪酬水平对外不具有竞争力,很有可能导致员工流失,更说不上激励员工了。

目前企业普遍认为进行有效的薪酬管理应遵循对外具有竞争力的原则。企业支付高于或等于劳动力市场水平的薪酬,确保企业的薪酬水平与类似行业、类似企业的薪酬水平相一致,虽然不一定完全相同,但是相差不宜太大。因为如果企业薪酬水平太低,则必然使企业对人才失去吸引力,导致人才流失。

因此,企业制定其薪酬结构时,首先必须进行薪酬调查,了解市场薪酬的25%点处、中点或50%点处和75%点处。然后根据企业支付能力,确定其薪酬水平。一般企业应注意中点薪酬水平。

既然减量方案对该企业不适合,我们来尝试一下增量方案。

2.增量方案下的策略。例如,一家企业在每年春节,老板都会额外给员工发放一笔5000元的奖金。但几年下来,老板感到这笔奖金正在丧失它应有的作用,因为员工在领取奖金时的反应相当平淡,每个人都像领取自己的薪水一样自然。并且在随后的工作中也没有人会为这5000元表现得特别努力。

在案例中,老板采取的激励措施其实就相当于增量方案,可并没有取到激励员工的作用。之所以这样的一个重要的原因就是他把作为“激励因素”的奖金转化为了“保健因素”。美国心理学家赫茨伯格在1959年提出“双因素理论”。只能起保持人的积极性和维持工作现状作用的因素称为“保健因素”。与“保健因素”相区别的是“激励因素”。赫茨伯格认为,只有“激励因素”才能真正起到对员工的激励作用。而案例中这笔奖金有固定的发放日期,并且每个人得到的数额都相等,所以在性质上就与员工每月固定领取的、属于“保健因素”的薪水没有什么区别,这就割裂了奖金与员工业绩之间的关系,助长了员工工作的惰性。

若该企业采取增量方案,把员工工资提高到与竞争对手一致或者更高。在刚开始的一段时间内,确实可以对原有的员工起到一定的激励作用,甚至会吸引一定量的人才跳槽过来。可是长期而言,提升的工资已经成为了“保健因素”,不但成本高了,对员工也没有激励作用,员工的竞争也不激烈。因此,增量方案也不适合该企业。下面笔者结合第二个问题,试得出解决两个问题的措施。

(二)针对年度评估问题的激励机制

若该企业保持原有的工资水平,势必要从其它方面来补充,建立不同于同行业的激励机制,才能真正激励员工。经过研究,该企业在年度评估方面,可以提出以下改善的激励机制:

1.引进3P模式,使绩效与薪酬挂钩。应主要关注并导入现代人力资源管理的核心技术—3P模式。即:首先,根据企业的生产经营特点,进行职务分析,明确所有员工各自的岗位职责;其次,根据企业的岗位职责,设计人力资源的工作绩效考核方案和工具;最后,使用绩效考核方案和工具,对企业所有员工进行定期考核,并根据绩效考核结果,设计薪酬福利,具体到奖金发放方案。3P模式应用于该企业,笔者试从以下方面改进其激励机制:第一,不强调资历,不以员工的资历为薪酬根据。要注重其现实的工作表现,定量评价与定性分析相结合,业绩考核与工资待遇、奖惩相互依存,其考核是客观依据,待遇、奖惩是结果,工作报酬和工作奖惩的统一性。第二,实行宽带薪酬制度。宽带薪酬制度是指工资跨度模糊,没有明显的工资等级。不按照职位来划分工资等级,崇尚用业绩说话。也就是说,不同岗位员工的薪酬可能是一样的。同一岗位的员工的薪酬不一定是一样的,比如对于一般职员,由于他这个月的工作贡献率高,就完全有可能得到的薪酬比其上司主管高好几倍。第三,取消时薪工的工资制度,同样使他们的业绩与薪酬直接挂钩。所谓的时薪工就是按照工作时间来确定薪酬的,可是这样存在着一个极大的弊端,时薪工无论付出多少,得到的报酬都一样,因此,他们在规定的时间内,必定是得过且过,熬够时间就下班。因此,要激励时薪工,我们应该一改以前的做法,把他们的业绩直接跟薪酬挂钩。例如收银台服务员,应对其收银服务数量、质量进行绩效考核,数量多质量高者相应得到的薪酬就高,从而提高其工作效率。

2.制定绩效改进计划,落实改进方案。据调查,该企业针对员工的工作表现会进行一系列的绩效评估。可是评估后没有根据评估结果制定绩效改进计划,落实改进措施,绩效评估等于空话。有效的绩效评估是对工作表现好的员工给予肯定并给予物质和精神上的鼓励,使其行为发扬光大并有更大的提高;对工作表现不好有待改进的员工给予具体的改进措施,给员工指明正确的改进方案。笔者认为该企业具体可以从以下方面改进其绩效评估:第一,绩效评估连续3次评为“优”的时薪工,可以申请提为月薪工,激励时薪工认真工作;第二,对于绩效评估出现“不及格”的员工,要及时进行面谈沟通,发现问题的所在,并与员工共同制定改进措施;第三,绩效评估与培训挂钩,通过绩效评估得出员工的培训需求,并制定长期、连续的培训,提高其工作能力。

(三)“智猪博弈”模型下激励机制的其它措施

1.利用“鲶鱼效应”,引进更强的“大猪”,激发员工活力。“鲶鱼效应”讲的是:挪威人喜欢吃沙丁鱼,尤其是活鱼。市场上活沙丁鱼的价格要比死鱼高许多。所以渔民总是千方百计让沙丁鱼活着回到渔港。可是虽然经过种种努力,绝大部分沙丁鱼还是在中途因窒息而死亡。但却有一条渔船总能让大部分沙丁鱼活着回到渔港。原来是船长在装满沙丁鱼的鱼槽里放进了一条以鱼为主要食物的鲶鱼。鲶鱼进入鱼槽后,由于环境陌生,便四处游动。沙丁鱼见了鲶鱼十分紧张,左冲右突,四处躲避,加速游动。这样一来,一条条沙丁鱼欢蹦乱跳地回到了渔港。可见,沙丁鱼是受了外界刺激才保持了生机与活力。“鲶鱼效应”是企业领导层激发员工活力的有效措施之一。该企业应该不断补充新鲜血液,比如外聘竞争对手的员工,把那些富有朝气、思维敏捷的年轻生力军引入职工队伍中甚至管理层,给那些固步自封、因循守旧的懒惰员工和官僚带来竞争压力,这样才能唤起“小猪”们的生存意识和竞争求胜之心。

2.对“小猪”培训,提高“小猪”的工作能力。培训就是通过学习、训导的手段,提高员工的工作能力、知识水平和潜能发挥,最大限度地使员工的个人素质与工作需求相匹配,进而促进员工现在和将来的工作绩效提高。通过培训,可以提高工作绩效水平,提高员工的工作能力,增强组织或个人的应变和适应能力,提高和增强组织企业员工对组织的认同和归属。

该企业有大量的培训,但主要是针对新入职者。其目的是使员工掌握最基本的岗位工作技能与操作,使他们尽快适应工作环境。然而这并不足够,“小猪”之所以选择等待,主要是因为它的能力有限,不足以与“大猪”进行较量。因此,某企业应对“小猪”进行一定的技能提高与专项能力培训,使其在工作能力上得以提高,从而激励其与“大猪”竞争。

综上所述,如果激励不当,将对企业的发展造成阻碍。反之,合适的、完善的激励机制将对企业产生巨大的收益。企业要运用好激励机制,使其在企业管理中发挥积极的作用。具体地说,它能促进企业的发展,能调动员工的工作积极性和主动性,开发员工的创造性和培养良好的职业道德。这种收益,不是短时间就能够显示出来。它本身是一种潜移默化对员工及企业的影响,但这种潜在的影响却是决定企业兴衰的一个重要因素。

当然,完善的激励机制不是短时间内就可以建立起来,它必须经过时间的考验。该企业要根据自己的激励机制实施情况来提出问题,发现问题,解决问题,从而使得自己的激励机制不断完善再完善,从而为该企业的创新、发展和壮大打下坚实的基础。

参考文献:

1.魏新,欧阳洁,刘苑辉.人力资源管理—理论与实务.香港新华人民出版社,2003

2.刘加福.博弈学.中国纺织出版社,2005

3.劳动和社会保障部组织编写.企业人力资源管理人员.中国劳动社会保障出版社,2002

4.张维迎.博弈论与信息经济学.上海人民出版社,2000

第二卷智猪博弈案例

第二卷智猪博弈案例 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 1 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

智慧树知到《博弈策略与完美思维》章节测试题[完整答案]

智慧树知到《博弈策略与完美思维》章节测 试题[完整答案] 见面课:信号博弈 2、如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,这就是该动态博弈的一个子博弈完美纳什均衡。 A.对 B.错 正确答案:对 3、颤抖手均衡解决了博弈方犯错误的问题,因此能够保证它的预测一定就是实际博弈的结果。 A.对 B.错 正确答案:错 4、不完全信息动态博弈分析的基本方法也是逆推归纳法。 A.对 B.错 正确答案:错 5、在动态经济博弈论问题中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。

B.错 正确答案:对 见面课:纳什均衡与应用 1、在囚徒困境的博弈中,两个囚徒合作的策略会形成( )。 A.纳什均衡 B.占优策略均衡 C.重复剔除的占优均衡 D.非纳什均衡 正确答案:非纳什均衡 2、在社会福利博弈中,流浪汉和政府博弈的均衡属于( )。 A.纯战略纳什均衡 B.混合战略纳什均衡 C.重复剔除的占优均衡 D.占优策略均衡 正确答案:混合战略纳什均衡 3、合作博弈就是博弈方采取相互合作态度的博弈。 A.对 B.错 正确答案:错 4、任何理性的博弈方都不可能采用严格下策。 A.对

正确答案:对 5、在考虑混合策略的情况下,我们不可利用重复剔除的方法进行分析求解。 A.对 B.错 正确答案:对 6、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 A.对 B.错 正确答案:错 见面课:纳什生平故事漫谈 1、下列哪个博弈属于零和博弈( )。 A.囚徒困境 B.懦夫博弈 C.智猪博弈 D.硬币博弈 正确答案:硬币博弈 2、“敌不动,我不动”指的就是纳什均衡。 A.对

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

智猪博弈案例整理

案例一、 有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府按实到犯人人数支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 案例二、 公司并购中的搭便车: 面对收购者,如果存在大股持有人和小股持有人,小股持有人宁愿当搭便车者,因为收购之后的股价会超出收购价格- 收购溢价,由于小股持有人无论出售股权还是保留股权都不能成为承购成功与否的决定因素,所以以不变应万变,存在不卖的优势策略。而大股持有人只有出售才能促成收购的成功,不出卖就得不到收购价格,逼迫他出卖股权,而小股东也会得利。 为了打击小股东的搭便车行为,往往在公司成立之初就会通过法律来届定权利,比如规定收购者一旦接管公司有权利稀释那些没有转让的股权。 案例三、 员工和企业也是一个“智猪博弈”过程,员工就是大猪,员工有两种选择,努力工作或者消磨时间。如果员工努力工作那么企业和员工都受益,如果员工敷衍工作,拿多少工资干多少活,那么最终会被企业辞退。员工只有行动才会受益,不行动则不受益或者受损。而企业可以选择物资奖励,也可以选择说教等待,物资奖励企业必先拿出部分资金作为奖励品,显然收益为负,而等待则不受损,即使辞退员工也可以有人填补空缺,让员工有危机感反而会促进员工的积极性。所以聪明的员工会选择努力工作引起领导注意而得到加薪。 案例四、 在现实生活中,我们随时随地都在扮演着“小猪”或是“大猪”,进行着一场场“智猪博弈”,只是我们并没发现而已。下面将具体从“学生社团”的案例来具体说明“智猪博弈”在生活学习中的存在性以及其作用。 在学校,参加社团是一件很平常的事情,但社团里的那些事情,其实也是一场场生动的博弈

博弈论 教案

《两种常见的博弈论模型》一课教案 审签: 2010 年 4 月 13日 班 级 课程名称 经济学基础 教 师 授课 时间 课 型 授课地点 课 题 项 目 认识完全信息静态博弈、完全信息动态博弈 课 时 任 务 通过学习完全信息静态、动态博弈,认识价格战及搭便车现象。 任务分解 1、知识准备:明确博弈论常见的5种分类及类型。 2、案例举例:囚徒困境、智猪博弈 3、模拟测试:分小组,应用所学独立解决智猪博弈问题。 教学 目标 专业能力 通过学习,能够运用博弈论知识分析解决“双寡头价格战问题”及生活中的搭便车现象。 知识目标 1.掌握博弈论的分类; 2.掌握完全信息静态及完全信息动态博弈论模型; 3.学会运用博弈论知识分析、解决分析价格战、搭便车的问题。 方法能力 1、培养学生的独立思考的能力; 2、培养学生学习博弈论的兴趣及爱好; 2、培养学生的团队合作及逻辑思维能力。 重 点 掌握完全信息静态博弈及其扩展运用。 难 点 运用博弈论知识解决分析价格战等恶性竞争问题及搭便车现象。 课堂练习 小组合作完成完全信息动态博案例—“卖鞭炮的选择” 课后作业 完成课后思考题 教学策略与方法 启发 讲解 任务驱动 多媒体演示 自主 描述 案例 分析 小组 讨论 归纳总结 实践 操作 √ √ √ √ √ √ √ √ 课后回顾 本次课程的优点: 存在的问题: 改进设想:

项目名称:博弈论与决策策略 任务:能够自主分析博弈论的模型并分析解决问题 一教学组织活动总过程设计:1、师生问好2、班长报告人数 老师活动:1、问好2、环顾学生 学生活动:1起立问好2、坐姿端正3、班长清 点人数,向老师报告。 活动达到的目标时间分配 创设情境,使学生注 意力集中,进入学习 状态 1分钟 二课程导入情境导入: 复习旧课,导入新课 以《囚徒困境》博弈论案例视频引入 老师活动: (1)老师引导学生回忆上节 课所学的内容,复习博弈论的五种 基本分类方式及类型。(2)播放关 于囚徒困境的视频,点出其中的重 点,并向学生提问。 学生活动: 跟着老师的思路回 忆上节课所学的内容。 认真观看视频并思考老 师所提问题。 活动达到的 目标: 复习旧课内 容为新课做 铺垫,视频 引入抓住学 生焦点。 时间分 配: 5分钟 三教学过程认识完全信息静态博弈 活动项目一:囚徒困境(11分钟) 1、首先,老师给出囚徒困境的博弈论模型。“囚徒困境模型”:该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑6年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑3年,而坦白者有功被减刑6年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。 提问:对于囚犯A而言,他会选择什么样的策略,囚犯B如何呢?(给2分钟时间让学生思考并分析此问题,并让他们尝试通过表格表达出囚犯A及B可能选择的策略及面临的后果) 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑6年。(老师讲解,板书,学生对照自己所写跟老师是否一致) 提问:那么囚徒困境在我们生活中的哪些地方同样存在呢? 补充介绍“囚犯困境”的扩展:双寡头企业价格战、军备竞赛等。 归纳总结完全信息静态博弈的3点特性:(1)同时做出选择;(2)明确对方的选择与游戏规则(共同知识);(3)不管是否沟通过,无法做出有约束力的承诺(非合作)(最好由学生归纳出)

从_囚徒困境_走向_智猪博弈_关于学术交流博弈策略的理性思考

CANGSANG 从“囚徒困境”走向“智猪博弈” —— —关于学术交流博弈策略的理性思考 朱逊贤 摘要学术交流是提升研究生科学研究能力的重要手段,在研究生培养和学校建设过程中有着重要的地位和作用。但是“囚徒困境”是影响学术交流的主要掣肘,基于“囚徒困境”的非合作博弈成为影响学生综合素质塑造的重要矛盾和问题。而“智猪博弈”是推动学术交流的共赢策略,即采取“合作博弈”的方式,达到学术交流的本质和目的。 关键词博弈论囚徒困境智猪博弈学术交流 学术交流是关于任一领域的学者通过正式和非正式渠道接收、使用和传播信息的交流活动[1],是科学技术工作中个人钻研和集体智慧相结合的一种形式[2],是原始创新的源头之一,是科学研究、技术进步的“催化剂”,是创新发明突发灵感的“点火器”,是科学新理论、新思想的“摇篮”[3]。激发、启迪才是学术交流最本质的、核心的意义。 研究生学术交流主要是指研究生参加的涉及有关学科前沿领域、新理论、新技术、新方法和应用的集会、讨论、报告、比赛等活动,是研究生培养的重要组成部分,是激励研究生创新的主要途径,是与外界互动,把握时代脉搏,学习、吸纳营养,逐步塑造、完善自己的有效渠道。这种交流可以是正式组织发起的,可以是同一专业的一些学生自发交流的,也可以是跨学科、跨专业的学生针对自己研究领域的前沿或者自己的思想、经验、方法等与大家交流,恳请予以评价、指正。交流的根本在于人与人之间的交流,通过交流实现优化,促进全面发展。参加学术交流的前提是:心态是主动的,希望和大家交流,想听听别人的意见和建议。只有这样才能真正达到交流的目的。 一、囚徒困境:影响学术交流的主要掣肘 著名的博弈论案例“囚徒困境”讲的是两个嫌疑犯A和B 作案后被警察抓住,分别关押在不同的屋子里受审讯。警察告诉他们:如果两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年(因证据不足);如果其中一人坦白另一人抵赖,坦白的无罪释放,抵赖的判刑10年。这里,每个囚徒都有两个战略:坦白或抵赖。在这个例子里,占有战略均衡就是(坦白,坦白),就是说不论对方如何选择,个人的最优选择都是坦白。比如说,如果B不坦白,A坦白的话被释放,不坦白的话被判1年,所以坦白比不坦白好;如果B坦白,A坦白的话被判8年,不坦白的话被判10年,所以坦白还是比不坦白好。这样,坦白就是A的占有战略。同理,坦白也是B的占有战略。结果是,每个人都选择坦白,各判刑8年。 囚徒困境反映了一个很深刻的问题,就是个体理性与集体理性的矛盾。如果两个人都抵赖,各判刑1年,显然比都判刑8年好。但是,两个人为了自己的眼前利益最大,而不愿意改变决策,导致集体利益最小,并且自身利益也没有达到最大化,反而受到了一定的损失。 博弈通常是建立在个体行为理性基础上的非合作博弈,追求个体利益的最大化。由于他们之间没有建立一个攻守同盟或者没有人积极性遵守协定,个体理性不一定能达到自己的目标。 这个例子是实际生活中许多现象的一个抽象概括。同学间“非合作博弈”不可避免地凸显,并逐渐成为影响学生综合素质塑造的重要矛盾和问题,这种现象在我校的研究生培养中亦不可避免地存在着。学校提供给的各项资源是有限的,不能满足所有学生的要求。由于个体利益的客观存在,为抓住发展机遇,个体之间表现为竞争对手的态势,从而围绕各项资源展开“非合作博弈”。传统的个体意识导致个体为了眼前利益和现实利益,会使个体之间存在形形色色的自我保护壁垒。由于个体自身发展水平和学校自身实力有限,学术交流给个体和学校带来的利益短期内不可能明显的表现出来,致使个体保护行为有了存在的理由,解决这个问题的难度也很大。 这种相互割据、自行其是的局面带来了很坏的影响。一是导致学校的资源不能得到充分利用,出现严重的浪费现象;二是导致学校在提高教学质量、培养创新人才等发展缓慢,制约学校服务学生、服务社会的能力和水平;三是使个体之间的比较优势不仅不能相互结合、充分发挥,反而在很大程度上出现相互制约,甚至出现不良竞争。 二、智猪博弈:推动学术交流的共赢策略 在经济学中,智猪博弈是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一头有个踏板,每踩一下踏板,在远离踏板的猪圈的另一头的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭便车策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲 学术争鸣 73 -- ··2011·2

智猪博弈案例整理

案例一、 有一个经典案例,就是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只就是运送犯人的费用要等到犯人送到澳洲后才由政府按实到犯人人数支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 案例二、 公司并购中的搭便车: 面对收购者,如果存在大股持有人与小股持有人,小股持有人宁愿当搭便车者,因为收购之后的股价会超出收购价格- 收购溢价,由于小股持有人无论出售股权还就是保留股权都不能成为承购成功与否的决定因素,所以以不变应万变,存在不卖的优势策略。而大股持有人只有出售才能促成收购的成功,不出卖就得不到收购价格,逼迫她出卖股权,而小股东也会得利。 为了打击小股东的搭便车行为,往往在公司成立之初就会通过法律来届定权利,比如规定收购者一旦接管公司有权利稀释那些没有转让的股权。 案例三、 员工与企业也就是一个“智猪博弈”过程,员工就就是大猪,员工有两种选择,努力工作或者消磨时间。如果员工努力工作那么企业与员工都受益,如果员工敷衍工作,拿多少工资干多少活,那么最终会被企业辞退。员工只有行动才会受益,不行动则不受益或者受损。而企业可以选择物资奖励,也可以选择说教等待,物资奖励企业必先拿出部分资金作为奖励品,显然收益为负,而等待则不受损,即使辞退员工也可以有人填补空缺,让员工有危机感反而会促进员工的积极性。所以聪明的员工会选择努力工作引起领导注意而得到加薪。 案例四、 在现实生活中,我们随时随地都在扮演着“小猪”或就是“大猪”,进行着一场场“智猪博弈”,只就是我们并没发现而已。下面将具体从“学生社团”的案例来具体说明“智猪博弈”在生活学习中的存在性以及其作用。 在学校,参加社团就是一件很平常的事情,但社团里的那些事情,其实也就是一场场生动的博弈论案例。就我自己的经历来说,大二时我当上了某个校社团的会长,社团里还有多个部长,

博弈论(生存智慧大全集)_同生共存:竞争中的智猪博弈

有一些公司经常会利用“智猪博弈”:笼子的一头有一个按钮,另一头是饲料的出口和食槽。摁一下按钮,将有相当于10个单位的猪食进槽。但是,摁动按钮所需付出的“劳动”,要消耗相当于2个单位的猪食。每只猪都必须要做出决策是等在食槽旁边还是去摁动按钮。问题在于按钮和食槽分置笼子的两端,付出劳动摁动按钮的猪跑到食槽的时候,坐享其成的另一头猪早已开吃。如果大猪先到,大猪吃到9个单位的猪食,小猪只能吃到1个单位的猪食;如果同时到达,大猪吃到7个单位猪食,小猪吃到3个单位猪食;如果小猪先到,小猪可以吃到4个单位猪食,而大猪就只能吃到6个单位的猪食。 这场博弈的结果,依赖和取决于大猪的行为判断。如果小猪去摁动按钮,大猪当然乐于等待在食槽旁吃掉9个单位的猪食。如果小猪等待,那么大猪将先去摁动按钮再跑回来以获得相当于4个单位的猪食,这总比饿肚子等待要好。对小猪来说,无论大猪如何行动,它最好的办法就是等在食槽旁边。于是就会出现这个博弈的均衡结果:每次都是小猪在食槽边等着大猪去摁动按钮,然后小猪先吃,大猪再赶来吃——共同生存。 从“智猪博弈”中可以看出,在市场上一个占主导地位、控制着市场的公司和它的一个较小的竞争对手之间可能发生的竞争情况,取决于占主导地位的公司如何看待这个较小的竞争对手对它的威胁程度。当然,“智猪博弈”中“共同生存”的均衡结果,只有在大猪的食物份额没有受到小猪严重威胁时才会出现,才会实现真正的“共同生存”。 商场竞争中的小公司就类似于“智猪博弈”中的“小猪”。如果公司是弱小的一方,则可以选择如下策略: 一是等待。允许市场上占主导地位的品牌开拓本行业所有产品的市场需求。将自己的品牌定位在较低价格上,以享受主导品牌的强大广告所带来的市场机会。 二是不要贪婪。只要主导品牌认为弱小公司不会对自己形成威胁,它就会不断创造市场需求。因此,公司可以将自己定位在一个引起不了主导品牌兴趣的较小的细分市场,以限制自己对主导品牌的威胁。如果大公司在行业市场中占主导地位,则可采取接受小公司的策略。 作为主导品牌,加强广告宣传,创造和开拓对行业所有产品的市场需求才是真正的利益所在。不要采取降价这种浪费资源的做法与小企业竞争,除非它对公司形成了真正的威胁。正是小企业采取的低价格阻止了潜在进入者的涌入。对威胁的限制要清楚:如果小企业发展壮大到了构成威胁的程度,大公司就应该迅速做出进攻性的反应,并且让小企业清楚地知道它们在什么样的规模水平之下才是可以被容忍的,否则就会招致大公司强有力的回击。如果小公司知道对它们的限制,也就不会再有兴趣超越这种限制。 通过运用“智猪博弈”原理的分析,竞争双方应对自己在竞争博弈中的地位和作用有一个清醒的认识,这一点非常重要。认清自己真正的利益所在,避免残酷的价格战的发生,两个地位相差甚远的最终就能够达成一种和平的生存模式,这就是共同生存。

智猪博弈理

智猪博弈理论 拼音:Zhìzhū Bóyì Lǐlùn(Zhizhu Boyi Lilun) 英文:Boxed Pig Game 同义词条:Boxed Pig Game 目录[ 隐藏 ] ?1智猪博弈理论简介 ?2经典案例 ?3智猪博弈理论的启示 ?4从“智猪博弈”到“新智猪博弈” ?5“新智猪博弈”理论的运用 智猪博弈理论:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃一点残羹。

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有两头猪,一头大猪,一头小猪。 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食

槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待,一份也得不到;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新

智猪博弈理论

智猪博弈是经济学中一个很典型的博弈理论,在这个理论中会有许多经典的意义所在,现在让我们来了解一下吧。 【问题】 假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。 两头猪场面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。 如果某一头猪作出自己去按按钮的选择,它必须付出如下代价: 第一,它需要收益相当于两个单位的成本;

第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。 假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪和小猪各吃到4个单位的猪食;若两头猪同时到(两头猪都选择等待,实际上两头猪都吃不到猪食),大猪吃到6个单位的猪食,小猪吃到4个单位的猪食。 问:大小猪的最优决策是什么?最后的结果很可能是什么样子的?? 【答案】 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 从这个矩阵上不难看出,小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)是最佳选择。 原因很简单:在大猪选择行动的前提下,小猪选择等待的话,在大猪返回食槽之前,小猪可得到4个单位的纯收益,大猪到达之后只能得

到剩下的6个单位,实得4个单位;而小猪和大猪同时行动的话,则它们同时到达食槽,分别得到1个单位和5个单位的纯收益;在大猪选择等待的前提下,小猪如果行动的话,小猪在返回到达食槽之前,大猪已吃了9个单位,小猪只能吃到剩下的1个单位,则小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 【启示】 博弈与制度 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论复习讨论题

1、人与人之间的博弈是什么关系? 既可以是竞争关系,也可以是合作关系 2、因为博弈论的研究而获得1994年诺贝尔经济学奖的是 泽尔腾、海萨尼、纳什 3、学习博弈论的目的只是为了在今后与他人的博弈中能够打败对手(×) 4、博弈是指在一定的游戏规则约束下,基于(直接)相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 5、如果博弈前的损益总和与博弈后的损益总和相等,该博弈称为零和博弈 6、策略具有以下特性:完整性、不可观察性、多样性 7、人在博弈中并不是完全理性的(√) 8、博弈论的建立基于两大假设,其中除了人的理性以外,还有一个是(人的认知) 9、囚犯困境的根本原因在于个人行为的负外部性(私人成本与社会成本的差异) 10、在囚犯困境的博弈中,事先订立攻守同盟一定是有用的(×) 11、(占优)策略是指无论其他参与者采取什么策略,某参与者采用该策略的结果都优于或不劣于其他策略。 12、以下现象哪些明显属于“囚犯困境”?价格战、公地悲剧、环境污染 13、“好货不便宜、便宜没好货”其实是一个“智猪博弈”,这是因为不懂行的人占了懂行的人的便宜 14、之所以会出现“万元陷阱”,是因为:不懂得止损、沉没成本 15、智猪博弈是一个搭便车的博弈。一方付出了相应的代价,双方共享了所得到的收益。(√) 16、人在“亏损”的情况下,会从一个风险(厌恶)者变成了风险偏好者。 17、以下哪些博弈不属于竞争关系?同学聚会 18、哪些行业是赢者通吃的?演艺界、搜索引擎、门户网站 19、杭州试行的“谦让牌”之所以没效果,是因为宣传力度不够(×) 20、汇合点(Meeting point)必须是(共同)知识才有用 21、以下是某教授和学生张三之间的策略表达式:教授选择放过该学生的概率是多少?50% 22、以下是某教授和学生张三之间的策略表达式:张三选择平时勤快的概率是多少?20% 23、纯策略是指如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动(√)

智猪博弈理论

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 目录 介绍 博弈与制度 由智猪博弈故事得到的启示 编辑本段介绍 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 小猪 行动等待 大猪行动5,14,4 等待9,-10,0  从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 编辑本段博弈与制度 由智猪博弈故事得到的启示 在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。 还有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 关于这一问题,现任招商局掌门人秦晓先生在最近做客央视《对话》节目时,也谈了他的一些看法。他认为:企业领导人应该去制定游戏规则,而不应该单纯地去做裁判。他觉得制度应当比个人的权威

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

活学活用博弈成功智慧_第五章 智猪博弈:多劳不多得的悖论情境

聪明猪与笨和尚 博弈论里面有个十分卡通的博弈模型,叫做“智猪博弈”。 假设猪圈里有两头猪同在一个食槽里进食,一头大猪,一头小猪(假设它们都是有着认识和实现自身目标的充分理性的“智猪”)。猪圈两头距离很远,一头安装了一只控制饲料供应的踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一头就会有相当于10份的饲料进槽,而踩踏板以及跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的饲料。 这两头猪各有两个选择:自己去踩踏板或等待另一头猪踩踏板。其中选择自己踩踏板的猪,不仅要付出劳动,消耗掉2份饲料,而且由于踏板远离饲料,它将比另一头猪后到食槽,从而减少吃到饲料的数量。下面假定:若两头猪都选择等待,那就都吃不到饲料,即双方得益均为0;若小猪踩踏板,大猪将吃到9份的饲料,小猪只能吃到l份的饲料,最后双方得益为[9,一1](小猪付出劳动之后消耗掉2份饲料);若大猪踩踏板,大猪和小猪将分别吃到6份和4份的饲料,最后双方得益为[4,4];若两头猪同时踩踏板,同时跑向食槽,大猪吃到7份的饲料,小猪吃到3份的饲料,即双方得益为[5,1]。 由上面的分析可以看出:小猪踩踏板只能得到l份甚至有可能损失1份饲料,不踩踏板反而有可能得到4份饲料。对小猪而言,无论大猪是否踩动踏板,小猪都不去踩踏板,而舒舒服服地等在食槽边,都是最好的选择。 小猪选定了“等待”之后,大猪便只剩下了两个选择:等待就吃不到;踩踏板得到4份饲料。所以踩踏板就变成了大猪的优势策略,当大猪知道小猪是不会去踩动踏板时,自己亲自去踩踏板总比不踩强,只好为自己的4份饲料不知疲倦地奔忙于踏板和食槽之间。 如果采用重复剔除劣势策略的方法,那么首先,无论大猪选择什么策略,选择踩踏板对小猪都是一个严格劣势策略,应该首先加以剔除。在剔除小猪踩踏板这一选择后的新博弈中,小猪只有等待一个选择,而大猪则有两个可供选择的策略。在大猪这两个可供选择的策略中,选择等待是一个严格劣势策略,我们再剔除薪博弈中大猪的严格劣势策略——等待。剩下的新博弈中只有小猪等待、大猪踩踏板这一个可供选择的策略,这就是智猪博弈的理陛解。 智猪博弈与囚徒困境的不同之处在于:囚徒困境中的犯罪嫌疑人都有自己的严格优势策略(也就是坦白);智猪博弈中,只有小猪有严格优势策略(等待),而大猪没有。 这样就出现了一个多劳不多得的悖论情境:小猪躺着大猪跑。 智猪博弈存在的基础,就是双方都无法摆脱共存局面,而且必有一方要付出代价换取双方的利益。而一旦有一方的力量足够打破这种平衡,共存的局面便不复存在,期望将重新被设定,智猪博弈的局面也随之被破解。 中国有个美术片叫做《三个和尚》,里面说“一个和尚挑水吃,两个和尚抬水吃,三个和尚没水吃”,看上去,他们都想做那只“智猪”,但是却因为无人愿意承担起义务而导致每个人都无法获得利益。 用我们日常的话来讲,智猪博弈,就是一个不同期望值之间的博弈,如果所有各方的期望值

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

智猪博弈的例子

智猪博弈的例子···· 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“**主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不

相关主题
文本预览
相关文档 最新文档