囚徒困境实验报告解读
- 格式:doc
- 大小:218.50 KB
- 文档页数:12
《囚徒困境——博弈在绩效考核中的应用》囚徒困境——博弈在绩效考核中的应用绩效考核作为人力资源工作的一项重要组成部分,历来受到人力资源工作者的重视。
人力资源工作者往往希望员工及用人部门能够提供客观公正的原始资料,但在实际工作中,由于绩效考核运作模式往往直接影响到员工的个人收入,员工倾向于有意高估自己的工作绩效,以追求个人利益最大化;而用人主管人员为了避免挫伤员工积极性,而采取尽可能在本部门内部解决问题方式,客观上纵容了员工的行为。
由于人力资源部门所收到的原始资料缺乏应有的价值,因而在考核管理中,人力资源部应有的权力制衡作用受到削减,对及员工个人发展产生不利影响。
为了避免员工有意高估问题产生,许多采取单纯的上对下评估方式,但这种做法使员工完全失去了考核权力,往往降低工作积极性及员工满意度,进而影响到的长期发展;另一方面,由于主管的权力过大,加上部门主管不可能都具有较高的人力资源管理水平,尤其在部门主管管理水平偏低的情况下,有可能限制了一部分员工的发展,从而增加了公司员工,特别是重要员工的流失率。
在方面,大多数只提倡”用人主管应提高管理素质,保证公正客观的考核,但由于缺乏应有的制度加以规范,收效并不十分理想。
如果从”囚徒困境”博弈的有关理论出发,此问题可以得到较大程度缓解。
一、”囚徒困境”模型分析在博弈论中,有一个被人们多次引用的经典案例一一”囚徒困境”。
它的来源是这样的:警察抓住了两个罪犯,但是警察却缺乏足够的证据指证他们所犯下的罪行,如果罪犯中至少一人供认罪行,就能确认罪名成立。
为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人中有一人认罪,则坦白者立即释放而另一人将判8年徒刑;如果两人都坦白认罪,则他们将被各判5年监禁;当然若两人都拒不认罪,因警察手上缺乏证据,则他们会被处以较轻的妨碍公务罪各判1年徒刑。
注:带*号表示囚徒B的决策收益如果我们用-1、-5、-8分别表示罪犯被判1年、5年、8年的决策收益,用0表示罪犯被立即释放的决策收益,则可以用表5—1的决策收益矩阵把这个博弈表示出来。
《实验经济学》结课论文总分囚徒困境实验报告学院财政税务学院专业12级资产评估姓名李岩学号************囚徒困境实验分析一、 实验目的根据囚徒困境经典悖论,通过实验来探寻单词与多次重复结果,分析结论。
然后通过研究“囚徒困境”,了解囚徒困境产生的原因,想出走出囚徒困境的方法,并且理解和利用囚徒困境解决生活中与经济中的实际问题。
二、 实验原理囚徒困境是博弈论的非零和博弈中具代表性的例子。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:三、 实验说明通过角色扮演的方式再现经典的囚徒困境。
实验者两人一组,扮演囚徒。
在甲沉默甲背叛乙沉默二人同服刑1年乙服刑10年,甲即时获释乙背叛 甲服刑10年,乙即时获释 二人同服刑8年相同的情境下看不同的实验者如何选择策略来完成实验。
实验并没有考虑其他客观因素,是在完全假设的没有任何干扰囚徒做出选择的因素的情境下进行的。
实验规则:实验参与人被随机地分配到有两个人组成的不同小组中。
如果小组中的两个成员都选择坦白,那他们将会分别获得6年的刑期;如果小组中的两个成员都选择否认,那他们将会分别获得3年的刑期;如果小组中有一个成员选择坦白、另一个选择否认,那么选择坦白的成员获得1年的刑期,选择否认的成员获得10年的刑期。
四、实验准备实验小组一共五人,通过抽签的方式分出两人,一人为囚徒一,一人为囚徒二。
实验分为两种,一个是单次,一个为多次。
另外三人分别记录单次实验与多次试验的结果,分析数据。
五、实验步骤1、在单次实验的情况下,囚徒一与囚徒二分别只有一次机会选择拒绝或坦白。
囚徒困境拓展实验报告1. 背景介绍囚徒困境是博弈论中的一个经典问题,讲述了两名罪犯被单独审问,被告诱供出对方的情况。
在此情景下,博弈的最优策略是什么?这个问题引发了学术界广泛的探讨,而囚徒困境拓展实验也是在此背景下展开的。
2. 实验设计为了更好地研究囚徒困境的策略选择,我们设计了一个拓展实验。
实验中参与者以角色扮演的方式,扮演囚徒和警察,通过决策和博弈来模拟真实的囚徒困境。
实验的主要内容如下:2.1 参与者分组我们招募了一百名参与者,将其以随机方式分为囚徒组和警察组。
每组各有五十名参与者。
2.2 游戏规则游戏分为五轮进行。
每个回合的游戏规则如下:- 每个囚徒对每个警察进行一次选择,可以选择合作或背叛。
- 合作表示不揭发对方,获得3分。
- 背叛表示揭发对方,获得1分。
- 如果两个囚徒都选择合作,则每个人获得2分。
- 如果一个囚徒选择背叛,而另一个选择合作,则背叛的囚徒获得5分,合作的囚徒获得0分。
2.3 统计数据在游戏进行的同时,我们记录了每一轮的参与者选择和获得分数情况。
通过统计数据,我们可以分析参与者的策略选择和博弈效果。
3. 实验结果经过五轮的游戏,我们得到了如下实验结果:3.1 囚徒组策略选择分析囚徒组中,参与者的策略选择大致分为两种:- 个体理性:有一部分囚徒参与者在前几轮中选择了背叛,以追求更高的个体收益,但在后续观察到其他囚徒普遍合作后,逐渐倾向于选择合作。
- 合作主义:另一部分囚徒参与者一直坚持选择合作,始终希望通过团队合作获得更高的总体收益。
3.2 警察组策略选择分析警察组中,参与者也有两种策略选择:- 鸽派:一部分警察参与者倾向于选择合作,希望通过与囚徒团结合作,减少犯罪行为,从而获得更好的社会效益。
- 鹰派:另一部分警察参与者更倾向于选择背叛,以对付囚徒的“欺骗”,以自身利益为出发点。
3.3 获得分数统计通过实验记录的数据,我们计算了每个参与者的平均得分。
囚徒组中,个体理性囚徒的平均得分为4.2分,合作主义者的平均得分为2.8分。
社会科学中的囚徒困境现象及其解、囚徒困境与外部性人是社会关系的总和。
所谓的“鲁滨逊”式的人只是一种假设世界无摩擦的理想世界,人类社会的进步史在一定意义上也是部社会的分工史。
从原始社会到现代社会,社会分工已经极度精细化。
而这种分工不是说人们之间的合作减少了,相反地,这种分工是建立在更为紧密的合作的基础之上:人们通过分工生产更为专业化的商品,用来同其他人生产的商品进行组合,生产出最终产品;或者与其他人生产的商品进行交换获得自己需要的产品。
从这个意义上来说,“合作”是人类社会的主题之一。
但现实世界中,人类很多的行为会伤害到他们之间的合作,如欺诈、掠夺、偷盗以及敲竹杠(holdup) 以及搭便车(free rid ,er) 等,我们称这类行为具有外部性(externality) 。
现实世界中,人们的行为选择都或多或少地具有外部性特征,当我们把外部性问题形式化表达时,发现它们大多可以表达为囚徒困境(prisoner's dilemma) 的形式。
囚徒困境中每个囚徒的行为选择都会影响到另一个人的收益,如一囚徒选择合作(不坦白) ,则此行为对另一囚徒具有正的外部性;如他选择不合作( 坦白) ,则会给另一囚徒带来负的外部性。
当行为选择具有正的外部性,而又不能保证这种正外部性的排他性”和“竞争性”时,这种正的外部性则会带来搭便车行为,因为其他人可以不付出或少付出努力就可获得外部性收益。
而搭便车行为就是一个典型的囚徒困境问题。
当行为选择具有负外部性时,若没有合适的机制来对此进行制约,则会造成私人成本与社会成本的不一致,从而个人利益的最优会损害社会利益的最优。
而个人利益与社会利益的不一致正是囚徒困境表达的内容:当每个囚徒都追求个人利益最大化时,选择不合作策略是一个严格占优策略,尽管这种策略不是社会最优的。
这也表明,这种外部性问题可以形式地表达为囚徒困境问题。
囚徒困境问题部分地否定了Smith 的思想。
Smith(1776) 认为,人们在追逐个人利益时,会在无意中促进整个社会利益;而囚徒困境问题告诉我们,个人在追求个人利益时,常常损害了社会利益。
天津商业大学学生实验报告附件2开课实验室:219 开课时间 2015 年 11月20日实验报告2015 年 12月 13 日注1.每个实验项目一份实验报告。
2.实验报告第一页学生必须使用规定的实验报告纸书写,附页用实验报告附页纸或A4纸书写,字迹工整,曲线要画在坐标纸上,线路图要整齐、清楚(不得徒手画)。
3.实验教师必须对每份实验报告进行批改,用红笔指出实验报告中的错、漏之处,并给出评语、成绩,签全名、注明日期。
4.待实验课程结束以后,要求学生把实验报告整理好,交给实验指导教师,加上实验课学生考勤及成绩登记表(见附件2)、目录和学院统一的封面(见附件3)后,统一装订成册存档。
共页第页制表单位:设备处天津商业大学学生实验报告附页开课实验室: 219 开课时间2015 年月日实验报告2015 年月日因为不知道匹配者是谁,所以不知道他人品怎么样,所以比较谨慎,选择了动作一,接受者也选择了动作一,双方受益都还不错,到后面三轮我都充当的接受者,既然人家都那么大方我自己不能太小气,于是全选择动作二,双方都得到了较好收益。
最后一轮我又充当了提倡者,于是乎仍然选择了动作一。
、实验结果分析:由图表知提议者选动作一接受者大部分选动作一,只有少部分接受者选择的动作二,则说明大多数人是理性的。
当提倡者选择动作一为了是收益更大选择动作二,当提倡者选择动作二,接受者为了尽可能多收益也应该选择动作二。
作为提议者在面临“收益”时,不会考虑随机配对者如何选择策略,总是会采取作为一个“理性人”的策略,即选择利益最大化。
同样,人具有有限理性和机会主义,在利益的驱使下,可能会作出非“理性人”的抉择。
知道自己是与一个人固定搭配的,大家是要长期合作的,所以一定要让他觉得跟我合作还不赖,共页第页制表单位:设备处。
博弈论经典案例“囚徒困境”及其实证分析最近三四十年,经济学经历了一场“博弈论革命”,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。
诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。
博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。
博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。
一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。
A和B均坦白是这个博弈的纳什均衡。
这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。
即是说,不管A坦白或抵赖,B的最佳选择都是坦白。
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。
结果,两个人都选择了坦白,各判刑8年。
生活中的囚徒困境案例分析“囚徒困境”案例说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
现在有两个囚犯,他们分别是A和B,囚犯A不是个傻子,他马上意识到,他根本无法相信他的同伙B不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但囚犯B也意识到,他的同伙A也不是傻子,也会这样来设想他。
所以两个囚犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,囚犯A 反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
囚徒困境实验
实验材料:四张纸片,2张白,2张黑。
实验人员:两位同学,一人为甲,一人为乙。
实验内容:每人将1张纸片放在桌子前方,你拿出的纸片和小组内另一位同学出的牌将共同决定你的分数。
将分为两种,一个是单次,另一个是多次。
实验规则:如果甲同学出白纸片,乙同学也出白纸片两位各得3分,若乙同学出黑纸片,
实验将进行若干轮。
实验过程:开始第一轮,请在决定出什么纸片的时候,放在桌子的前方,请同时公布,并做记录。
……
开始第五轮,请在决定出什么纸片的时候,放在桌子的前方,请同时公布,并
做记录。
继续第6轮……
一直到第10轮左右结束。
实验分析:囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
多次重复的情况下,博弈被反复进行。
因而每个参与者都有机会去“惩罚”另
一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合
作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
(来自于百度文库)。
论“囚徒困境”与解决方式两个涉嫌共谋犯罪的嫌疑犯被捕后被警察关在相互隔离的牢房中。
他们面临的选择是:或者坦白或者保持沉默(即不坦白)。
他们被告知:①如果某个嫌疑犯坦白而其同伙不坦白,则坦白者可获自由而拒不坦白者要被判10年监禁;②如果二人都坦白,则二人都被判5年监禁;③如果二人都不坦白,则二人皆被判1年监禁。
在这种情况下,两个嫌疑犯将如何决策和选择呢?在囚徒困境的分析和推论中有以下的前提性设定:①每个局中人(在囚徒困境中就是两个囚徒)都知道“博奕的规则”和“博奕结果”的支付矩阵;②每个局中人都是理性的,而这里的所谓“理性”是指只要给出两种备择策略,将总是选择其中对他更有利的那种策略;③局中人是相互隔离不能“串通”,不能“结盟”的。
从甲的“立场”来看,共有两种可能情况。
第一种可能情况是乙采取坦白的策略,这时,如果他也坦白则要入狱5年,如果他不坦白,则更糟:要入狱10年;两相比较,结论是他应以坦白“对付”乙的坦白策略。
第二种可能情况是乙采取沉默的策略,这时他若也沉默,要入狱1 年,如果他坦白,则可获得自由;两相比较,结论是他应以坦白对付乙的“沉默”策略。
把以上两种可能情况的结论归纳在一起,“总结论”是:无论乙采用坦白策略还是沉默策略,甲都以采取坦白策略为更“佳”的对策;所以,甲要采取坦白策略。
很显然,以上推理对于乙也是适用的。
这样,两个囚徒在“精心推理”之后都采取了坦白策略,结局是两人都被判5年徒刑。
不难看出,这个推理中似乎带有某种悖论性的因素;因为,如果甲、乙两个囚徒都采取沉默策略,则二人都只被判1年徒刑,显然它是一个比二人都入狱5年更好的结果。
然而,甲、乙两个富于“理性计算”精神的囚徒在“逻辑上正确”的计算一番之后都采取了坦白策略,获得了都被判5年徒刑的结果。
以上所诉就是所谓的“囚徒困境”,那么怎样解决这种困境呢?通过对“囚徒困境”的若干分析及实例来看解决方式。
一、关于“囚徒困境”的分析有人说:“囚徒的苦恼在于他们不能商量沟通,于是,有人便提出了如下的解决问题的途径:两个局中人可以进行通信,然后进行合作。
囚徒困境理论囚徒困境是博弈论中一种经典问题,其理论对于研究合作与竞争的冲突具有重要意义。
本文将介绍囚徒困境理论的背景、问题描述以及可能的解决方案。
一、背景介绍囚徒困境理论最早由美国数学家A·W·塔克在1950年提出,后来由加拿大数学家梅尔文·邓纳姆发展完善。
它从博弈论的角度探讨了个体与整体之间的合作与竞争的问题。
囚徒困境是指在某些情况下,个体追求自身利益最大化会导致整体利益的减小,而合作对于整体利益的最大化是有利的。
二、囚徒困境的问题描述囚徒困境的典型情景是这样的:两名嫌疑犯被警方抓获,被控犯有一起抢劫案。
警察将两人分开审讯,没有足够的证据定罪,但如果两人都认罪,警方将对两人定罪,每人判5年监禁。
如果只有一个人认罪,而另一个人不认罪,认罪的人将被判10年监禁,不认罪的人将被判1年监禁。
两人都不认罪,警方只能以非法拘禁的罪名对两人各判刑3年。
这个问题给了每个嫌疑犯两个选择:合作或背叛。
合作即都不认罪,背叛即只有一个人认罪。
根据每个人的利益最大化原则,认罪是一个利于个体的选择,因为无论对方合作与否,认罪都能使自己的刑期缩短。
三、囚徒困境的解决方案囚徒困境的解决方案中,最为经典的是“互相背叛”的结果。
因为无论对方如何,背叛都能使个体的利益最大化。
在现实生活中,这种结果带来了相互不信任及合作无序的后果。
然而,有许多研究者在囚徒困境的研究中寻求寻找其他的解决方案。
其中最有名的是“互相合作”的策略。
这种策略的核心是建立信任,通过共同合作来达到整体利益的最大化。
如果嫌疑犯们能够相互合作,拒绝认罪,那么他们都可以只被判3年监禁,从而使得整体利益得到最大化。
这需要在囚徒困境中,个体放弃短期利益,选择合作,以求获得更大的长期回报。
四、囚徒困境理论的应用囚徒困境理论被广泛应用于多个领域,例如经济学、国际关系、生物学等。
在经济学中,囚徒困境理论被用来解释市场中的合作与竞争。
在国际关系中,它被应用于研究不同国家之间的合作与冲突。
《实验经济学》结课论文总分
囚徒困境实验报告
学院财政税务学院
专业 12级资产评估
姓名李岩
学号 201222370506
囚徒困境实验分析
一、 实验目的
根据囚徒困境经典悖论,通过实验来探寻单词与多次重复结果,分析结论。
然后通过研究“囚徒困境”,了解囚徒困境产生的原因,想出走出囚徒困境的方法,并且理解和利用囚徒困境解决生活中与经济中的实际问题。
二、 实验原理
囚徒困境是博弈论的非零和博弈中具代表性的例子。
经典的囚徒困境如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方
分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:
三、 实验说明
通过角色扮演的方式再现经典的囚徒困境。
实验者两人一组,扮演囚徒。
在相同的情境下看不同的实验者如何选择策略来完成实验。
实验并没有考虑其他客观因素,是在完全假设的没有任何干扰囚徒做出选择
甲沉默
甲背叛
乙沉默
二人同服刑1年
乙服刑10年,甲即时获释
乙背叛 甲服刑10年,乙即时获释 二人同服刑8年
的因素的情境下进行的。
实验规则:实验参与人被随机地分配到有两个人组成的不同小组中。
如果小组中的两个成员都选择坦白,那他们将会分别获得6年的刑期;如果小组中的两个成员都选择否认,那他们将会分别获得3年的刑期;如果小组中有一个成员选择坦白、另一个选择否认,那么选择坦白的成员获得1年的刑期,选择否认的成员获得10年的刑期。
四、实验准备
实验小组一共五人,通过抽签的方式分出两人,一人为囚徒一,一人为囚徒二。
实验分为两种,一个是单次,一个为多次。
另外三人分别记录单次实验与多次试验的结果,分析数据。
五、实验步骤
1、在单次实验的情况下,囚徒一与囚徒二分别只有一次机会选择拒绝或坦白。
2、在多次重复实验的情况下,分为三轮,囚徒一与囚徒二分别有十次机会来选择坦白或拒绝。
3、收集实验数据,画出折线图,并分析实验结果。
具体来说,实验分为两个阶段。
第一阶段,囚徒一和囚徒二要熟悉实验程序的实验过程和收益情况,并选择坦白或否认。
程序界面如下图所示。
己在本轮次获得的刑期。
程序界面如下图所示
六、实验结果分析
1、单次实验
单次实验的结果理论上有四种,即
囚徒一与囚徒二都拒绝,各判三年;
囚徒一与囚徒二都坦白,各判六年;
囚徒一坦白,判一年,囚徒二拒绝,判十年;
囚徒一拒绝,判十年,囚徒二坦白,判一年。
然而,实验的结果是,囚徒一与囚徒二均选择坦白,双方各判六年。
因为二
人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择坦白。
坦
白是两种策略之中的支配性策略。
因此,双方坦白是这场博弈中唯一可能达到的纳什均衡。
2、多次实验
对于多次实验发生的结果。
我们一共进行了三轮实验,每轮实验均进行十次,从而来总结最后的结果,根据每轮结果的折线图和三轮总结果的折线图来看,每轮得到的实验结果均与均衡结果有偏差,但是三轮总结果的折线图却偏向于均衡结果,即两人均坦白,各判6年。
结果是纳什均衡逐渐趋于帕累托最优。
实验表格如下图所示:
第一轮实验结果折线图如下所示
第二轮试验结果折线图如下所示:
第三轮实验结果如下图所示:
三轮实验结果汇总折线图:
七、实验结论
1、单次实验结论
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。
以全体利益而言,如果囚徒一和囚徒二都拒绝,两人都只会被判刑3年,总体利益更高,结果也比两人都坦白,判6年的情况较佳。
但二人均为理性的个人,为实现个人利益的最大化,均衡状况会是两个囚徒都选择坦白,结果二人判决均比合作为高,总体利益较合作为低。
这证明了:在非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2、多次实验结论
实验被反复地进行。
因而每个囚徒都有机会去“惩罚”另一个囚徒前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
坦白的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
八、实际事例
上述实验结果可能过于抽象,但现实中,无类似囚徒困境的例子还是很多的。
不论是社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都有问题可以用囚徒困境来分析。
这种博弈方法的重要性可见一斑。
下面我就为大家举些囚徒困境的例子:
1、经济例子
中国电信与中国联通,两边都希望赚取市场利润,但是如何在话费价格定位上有着不同的选择,如果我的价格低对方价格高的话我就会占有市场,但是缺点是我会减少利润,但是如果我的价格高对方的价格低的话,我就会失去市场,在双方没有达成cartel的情况下会出现“囚徒困境”模式,就是双方都以低价位来抢占市场但是双方的利润都没有最大化。
2、政治实例
50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑,我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国本土。
所以双方都是以出兵和不出兵考虑,如果出兵,会有经济损失,如果不出兵会威胁自己的领土,所以双方在“囚徒困境”模式下都选择了出兵,最后两败俱伤。
3、军事例子
台湾要买美国的F16,中国希望欧洲对华军售,两个地区的政府都在为武器画着大价钱从而损失了国家的经济发展力,这也是囚徒困境的模式,都会担心如果一旦开战会对自己不利,如果我没有先进武器,你有先进武器,那么开战的话我就会吃亏。
如果我有先进武器你没有的话,我就会得利。
所以我一定要有先进武器。
殊不知如果两岸达成和平条约,双方都不购买先进武器,把资金都放在经济发展人民收入上,那才是真的双赢。
4、环法自行车赛
每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。
而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。
通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。
而通常的情况是,在最前面次数最多的选手(合作)通常会
到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。
5、广告竞争
两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。
但若二者同时期发出质量类似的广告,收入增加很少但成本增加。
但若不提高广告质量,生意又会被对方夺走。
此二公司可以有二选择:
互相达成协议,减少广告的开支。
(合作)
增加广告开支,设法提升广告的质量,压倒对方。
(背叛)
若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。
在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。
囚徒困境在生活中是普遍存在的,因此,我们需要在理解与互相信任的基础上达到最优合作,实现双方利益的共赢。
读书的好处
1、行万里路,读万卷书。
2、书山有路勤为径,学海无涯苦作舟。
3、读书破万卷,下笔如有神。
4、我所学到的任何有价值的知识都是由自学中得来的。
——达尔文
5、少壮不努力,老大徒悲伤。
6、黑发不知勤学早,白首方悔读书迟。
——颜真卿
7、宝剑锋从磨砺出,梅花香自苦寒来。
8、读书要三到:心到、眼到、口到
9、玉不琢、不成器,人不学、不知义。
10、一日无书,百事荒废。
——陈寿
11、书是人类进步的阶梯。
12、一日不读口生,一日不写手生。
13、我扑在书上,就像饥饿的人扑在面包上。
——高尔基
14、书到用时方恨少、事非经过不知难。
——陆游
15、读一本好书,就如同和一个高尚的人在交谈——歌德
16、读一切好书,就是和许多高尚的人谈话。
——笛卡儿
17、学习永远不晚。
——高尔基
18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。
——刘向
19、学而不思则惘,思而不学则殆。
——孔子
20、读书给人以快乐、给人以光彩、给人以才干。
——培根。