当前位置：文档之家› 博弈论泽尔腾简介

博弈论泽尔腾简介

莱茵哈德?泽尔腾简介

一、人物生平

莱茵哈德?泽尔腾（Reinhard Selten），德国人，1930年10月10日出生于德国的布莱斯劳。由于犹太人的身份，泽尔腾自小对政治、经济学感兴趣，对数学的爱好伴随其一生。

1951～1957年，他在法兰克福大学学习数学，1957年获硕士学位。

1961年，泽尔腾获得马恩法兰克福大学的数学博士学位。

1967～1968年，泽尔腾去伯克利加州大学商学院当客座教授。

1969年接受柏林大学聘请，担任经济学教授至1972年。

1984年，他到波恩大学任经济学教授。

1991年，泽尔腾和夫人伊丽莎白都患上了严重的糖尿病。伊丽莎白因此下肢瘫痪，并且视力也接近失明。但泽尔腾夫妇对生活仍充满了自信。泽尔腾多次来中国访问，并到过多所大学进行学术演讲。泽尔腾在学术报告中展示出的大师的学术精神与态度、深刻的思想见解以及伟大的学术抱负令聆听其报告的每一个人所敬佩。

1994年泽尔腾教授因在“非合作博弈理论中开创性的均衡分析”方面的杰出贡献而荣获诺贝尔经济学奖。

泽尔腾现还任计量经济学社团委员、美国艺术与科学学院外籍名誉院士、青岛大学名誉教授、南开大学公司治理研究中心顾问、南京审计学院名誉教授。

二、主要著作和学术贡献

1、主要著作

泽尔腾的主要学术论著有：《一项寡头垄断实验》、《关于扩展性博弈中均衡完善概念的再检验》、《连锁商店之谜》、《博弈中均衡选择通论》、《价格制定者厂商的一般均衡》（1974年）、《博弈均衡选择的一般理论》（1988年，与哈萨尼合作）、《战略理性模型与决策理论丛书：《系列C：博弈论、数学规划及运筹学研究》（1988年）。1994年，由于“莱茵哈德?泽尔腾教授的均衡分析中的完善性的观念大大扩展了非合作博弈论的应用”，他与约翰?纳什、约翰?哈萨尼共同荣获该年度诺贝尔经济学奖。

2、学术贡献

他的主要学术研究领域为博弈论及其应用、实验经济学等。博弈论是作为数学的一个分支出现的，但是它在军事、政治、经济许多方面都有很多重要的运用，其中以在经济学内的运用最多也最为成功。博弈论整个改写了经济学理论。博弈论对人类的更大贡献是，加强了国际间的交流合作机会。各国对博弈论的研究，促进了人类社会的文明发展。此外，博弈论的思维方式推动了人类思维模式更高层次的发展。

泽尔腾针对纳什均衡中的静态分析的不足，在1965年将扩展型博弈推广为动态博弈，并提出了子博弈的概念和子博弈完美均衡的概念，发展了倒推归纳法。1975年发表“关于扩展型博弈中完美均衡概念的再检验”一文，提出了被称之为“颤抖手完美纳什均衡”的概念，

从而进一步扩大了纳什均衡的概念和应用范围。

泽尔腾发现纳什均衡有两个明显的局限性，首先纳什均衡是静态的分析。其次，假定任何局中人没有单方面改变策略的意愿。1965年他提出了子博弈概念和子博弈完美均衡的概念，从而区分了合理的纳什均衡与不合理的纳什均衡。

所谓子博弈是原博弈的一部分，同时自身也构成一个博弈。他指出：参与人的均衡战略应在各个博弈上都构成均衡，否则，如果存在一个子博弈，在该子博弈上，博弈解就构不成均衡，那么当该子博弈到达时，至少有一个参与人有积极性偏离均衡，从而这个解就不能自动生效。泽尔腾把满足在所有子博弈上都构成均衡的解释称为精炼均衡。需要特别强调的是，一个精炼均衡首先必须是一个纳什均衡，但纳什均衡不一定是精炼均衡。只有那些不包含不可臵信的纳什均衡才是精炼纳什均衡。

不可臵信的威胁引出信息经济学中一个十分重要的概念———承诺行动。通过前面的分析已经知道，有些纳什均衡之所以不是精炼均衡，是因为它们包含了不可臵信的威胁战略。这一点意味着，如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数，原来不可臵信的威胁就可能变得可臵信，博弈的精炼均衡就会相应改变。这些为改变博弈结果而采取的措施称为“承诺行动”。“承诺行动”是当事人使自己的威胁策略变成可臵信的行动。承诺行动表明当事人将为自己的“失信”付出成本。尽管这种成本并不一定真正发生，但当事人如不实施威胁策略，就会受更大的损失。承诺行动因使威胁

变得可以臵信，从而可以改变均衡结果，给当事人带来很大的好处。例如成语中“背水一战”、“破釜沉舟”等，都是一种“决一死战”的承诺行动。

泽尔腾于1975年提出了“颤抖手完美点”的概念，其意蕴是：在博弈中每个局中人按纳什均衡点进行策略选择时难免会犯错误，即偶尔偏离均衡策略（形象地说，可能手会颤抖）。这样局中人应该选择这样的纳什均衡点，即使自己犯错误时，其他人按照他们的最佳反应策略，仍如同自己未发生错误一样做出同样的策略选择。事实上，这意味着局中人在策略选择时应考虑到自己有可能做出错误选择，从而会力图避免因自己的偶然错误而蒙受其他局中人改变相应策略给自己带来的损失。当然这一概念假定对任何一方的颤抖概率都是一样的。其实，在博弈中人们会更小心地避免在损失大的方向上犯错误，这样向不同方向的颤抖概率就会不同。在颤抖手均衡点概念中，泽尔腾利用人类行为包含非理性因素（局中人会犯错）这一特点，形成对理性概念的一种新理解。这种方法无疑是博弈理论的一个重大突破。

三、评价与感想

从博弈论中我们知道，泽尔腾的这种“颤抖手均衡(trembling hand equilibrium)”也是一种精炼纳什均衡。大致说来，泽尔腾(1975)假定，在博弈中存在一种数值极小但又不为0的概率，即在每个博弈者选择对他来说所有可行的一项策略时，可能会偶尔出错，这就是所谓的“颤抖之手”。因之，一个博弈者的均衡策略是在考虑到其对手可能“颤

抖”(偶尔出错)的情况下对其对手策略选择所作的最好的策略回应。单从这一点来看，在演进博弈论中，最初的演进稳定性的出现，并不完全来自博弈双方的理性计算，而实际上可能是随机形成的(往往取决于博弈双方“察言观色”的一念之差)。按照这一分析思路，我们也可以认为，人们对一种习俗(演进稳定性)的偏离，也可能出自泽尔腾所说的那种人们社会博弈中的“颤抖”。博弈论告诉人们，要学会理解他人都有自己的思想。博弈论是一门以数学为基础的研究对抗冲突中最优解决问题的学科，对于人类而言，它最重要的贡献就在于它能够促进人类思维的发展，促进人类的相互了解与合作。

很多人一辈子追求诺贝尔奖而不得，泽尔腾却从未刻意想要得奖。他说，当初投身“博弈论”研究，根本没有目标，完全出于对科学的着迷，“内心不断提出的问题，激发我的兴趣。对于我，做研究既是工作，也是游戏，这就是我几十年沉醉其中的理由。”

创新需要灵感，灵感来自何方？泽尔腾的回答是，不要固守自己的研究领域，跨学科合作非常有必要。75岁的泽尔腾非常怀念在德国比勒菲尔德大学10年的研究生活，那里有个特点，许多专业委员会要求有非本专业人士参加，他作为经济学家就先后参与了心理学、社会学、生物学等多个专业委员会的研究工作，让他发现了博弈理论在多个领域的应用。

同时，泽尔滕教授也对中国日益增长的房价做出了相关评价，泽尔腾警告说，如果房地产领域出现问题，中国经济增长率可能会下降3%。风险已如悬挂在头顶的达摩克利斯之剑，我们虽然不能预知这

把剑何时落下，但宝剑的寒光已经让人望而生畏。好在，日前召开的中央经济工作会议，已经明确将调整产生结构、改善民生现状，作为明年工作的重点。积极采取措施，引导泛滥的资金流入实体经济，实现我国经济的平稳着陆，无疑是明智之举。

发展房地产并不是致富捷径，而是一座建筑在浮沙上的城堡。如果实体经济不能有效“止血”或者主动“造血”，经济很难真正“康复”。当世界各国通过增加市场流动性来刺激经济

复苏时，如果这些增加的流动性不是流入实体经济而是流入地产、金融及资产市场，那么，说不定第二波通货膨胀和金融危机还会来。

由此，我们不仅仅可以从泽尔腾的博弈论的学术贡献中有所感，更能从他的生平经历和学术创作中得到启发。诺贝尔学奖是许多科学家一生的追求，但是，泽尔腾在追求学术的过程中自然而然地就获得了诺贝尔学奖。有时，专注于自己的专业，而不是致力于追求荣誉，或许，荣誉就在前方等着自己。

四、参考文献

《1994年诺贝尔经济学奖获得者》

《泽尔腾与中国房地产危机》《中国城市金融》

《泽尔腾在青岛大学的讲话》

范里安《微观经济学：现代观点》(第9版)课后习题详解-(博弈论的应用)【圣才出品】

第30章博弈论的应用 1．在一个双人博弈纳什均衡中，每一个参与人都在针对什么作出最优的反应？在一个占优策略均衡中，每一个参与人又都在针对什么作出最优的反应？答：（1）在纳什均衡中，每个参与人都对其他选手的最优反应作出了自己的最优反应。（2）在一个占优策略均衡中，每个参与人的选择都是对其他选手所有选择的最优反应。特别地，占优均衡一定是纳什均衡，但纳什均衡却未必是占优均衡。 2．在有关混合策略的章节中，考虑行参与人和列参与人的最优反应。它们会产生最优反应函数吗？答：行参与人和列参与人没有最优反应函数。如图30-1所示，这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应。曲线的交点就是纳什均衡。在这种情况下，博弈存在三个均衡，其中，两个是纯策略均衡，一个是混合策略均衡。当行参与人选择r＝2/3时，列参与人存在无穷多个最优反应，而不是像函数的数学定义所要求的那样，只有一个最优反应。

图30-1 最优反应曲线 3．在一个合作博弈中，如果博弈双方作出相同的选择，那么，结果对于他们两个对这都令人满意。这个结论是否正确？答：这个说法不正确。这是因为合作博弈的结果取决于博弈的收益，而非两个人是否选择相同的策略。比如在汽车博弈中，如果双方都选择直线驾驶，他们将陷入最糟糕的境况。 4．本章正文指出，在均衡状态，行参与人在62%的时间内会得分。这个数值是如何得到的？答：博弈的均衡策略为“行参与人按0.7的概率踢向左方，而列参与人以0.6的概率扑向左方”，由于射门方向和扑救方向共有四种组合，从而得到每种组合的概率分布如表30-1所示。表30-1不同组合的概率分布

博弈论教学大纲

【博弈论】课程教学大纲【课程代码】0410955 【学分】2 【参考学时】32 【讲授学时】32 【实验学时】0 【实习学时】0 【课程性质】专业选修【参考教材】《经济博弈论》（复旦大学出版社）【课程基础】具备一定的高等数学基础，包括微积分、线性代数与概率统计。具备微观经济学与宏观经济学的学生将会发现本门课程分析问题的崭新角度，因而特别推荐经济学专业的学生选修此门课程。【适应对象】尽管本门课程的大多数例子是经济学的，但也不乏其他学科的，如法律、政治学、社会学等。这样不仅可以使经济类专业的学生开阔视野，同时也可以为其他学科有兴趣的同学提供接触经济学，了解经济学的机会，但这里强烈建议那些非经济类预选本门课程的同学，先掌握一些基本的经济学常识及一定的数学基础。【教学目的】著名经济学家Jean Tirole说过“正如理性预期使宏观经济学发生革命一样，博弈论广泛而深远地改变了经济学家的思维方式”。现实情况也确实如此，新古典经济学的前提假设与现实相距甚远，非完全竞争市场和不完全信息时的价格制度常常不是实现合作和解决冲突的最有效安排。而非价格制度的最显著特征是参与人之间行为的相互作用，此种情况下发展起来的通用方法便是博弈论。通过本科的学习使学生能够基本了解博弈论的基本思想与方法，具备一定的运用博弈论分析现实经济与社会问题的能力。【内容提要】博弈论是近年来现代经济学中发展最迅速的分支学科。博弈论研究多人决策问题，在社会经济的各个层面都有许多可用博弈论分析或解决的决策问题，因此博弈论在经济学理论和应用学科有着广泛的应用，是掌握现代经济学的关键。第一章导论一、什么是博弈论

博弈论经典例子

博弈论经典例子篇一:《博弈论三大经典案例》经典的囚徒困境 1950年，由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论，后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述，并命名为"囚徒困境"。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方(相关术语称"背叛"对方)，而对方保持沉默，此人将即时获释，沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作")，则二人同样判监半年。若二人都互相检举(互相"背叛")，则二人同样判监2年。用表格概述如下：甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者(即"囚徒")都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为"严格劣势"，理性的参与者绝不会选择。另外，没有任何

其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁，并不知道对方选择;而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工;前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者：————————————————————————————————日期：

博弈论在管理中的应用不知道大家有没有为这些事情困惑过：为什么员工技能竞赛，技能比拼很难开展，即便开展了，为什么工作效率也没有像预想的那样提高？为什么企业中总有些人拖大家的后退而不努力工作？为什么有的领导手段强硬，有的领导风格怀柔？你是否为“办公室政治”烦恼不已？你有没与遇到过和你看法不一致，总是与你针锋相对的下属？遇到强硬的下属你该怎么办？为什么酒店联盟或者企业间的联盟总是很难做？你是否在做决策之时衡量反复却不知道选择何种策略？。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理？你如何提出科学而又合理解决方法？以上种种问题，你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识，并以隐藏在我们身边的博弈为例子，给大家提供解决某些实际问题的思路。那么什么是博弈论呢？所谓博弈论，就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式，既谋略性思考问题的方式。对博弈论通俗的理解就是，关于人与人的斗争中“老谋深算”的学问。假如你正跟恋人用手机通电话，突然信号断了。这时你是会立即拨电话过去，还是等你的恋人拨电话过来？很显然，你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨，那么另一方最好是等待；如果一方等待，那么另一方最好拨过去。如果双方都拨，那么就会出现线路忙；如果双方都等待，那么时间就会在等待中消逝。这，就是博弈。

博弈论及其应用(期末学习报告)

博弈论及其应用长虹与同行家电业的价格战姓名：学号：学院：专业：

博弈论及其应用长虹与同行家电业们的价格战一、事件背景由军工厂转型的长虹是国内最早从日本松下引进彩电生产线的企业。1985年，军人气质十足的倪润峰执掌长虹。1994年，长虹在上海证交所上市；1995宣布自己成为“中国最大彩电基地”。 1996年，长虹的指挥官倪润峰决定拿出更大的动作。提出一个令人意外的“产业报国”计划。1996年，本土彩电企业陷入最艰难的苦战时刻，一个潜在的危机正在步步逼近。4月1日开始，彩电的进口关税将大幅下降。3月26日，长虹宣布，所有品种彩电一律大幅度让利销售，降价幅度从8％到18％。随后，猝不及防的其他中国厂家纷纷选择跟进。彩电业的价格大战，就在这样一种“产业报国”的氛围之中，拉开大幕。价格战刚刚开打一个月，长虹的市场占有率就上升到19%，比降价前增加了7.9%。到年底，长虹坐稳了“彩电大王”的宝座。中国每卖出三台彩电，有一台出自长虹，有一台是外资品牌，还有一台才是其他国内品牌。倪润峰逐渐把国内同行们逼到了死角。在此战之前，国内各省市其实还有60多个地方性的彩电品牌，它们大部分是国有企业，作为当地的支柱产业割据一方，小富即安。然而在长虹的降价冲击下，大多数企业迅速凋零，成为行业重组中一颗颗散落的棋子，只能到长虹、康佳、TCL那里请求收购。彩电业从此步入由五六家大公司瓜分市场的时代。这一年，预算内国有企业的净销售利润率降低到历史最低点，亏损总数是1985年的28.6倍。相比之下，全国乡镇企业的产值增长22％，中外合资企业的所得税增长40％。 1997年，用价格战给中国企业家们好好上了一课的倪润峰被推上了事业的巅峰，1998年，在价格战中得到洗礼的国内同行开始显山露水。1999年，长虹的净利润下降74%；2000年5月，倪润峰卸下总经理职务，退隐江湖。2000年6月9日，康佳和TCL在内的九大国内彩电巨头联手组成价格联盟，准备正面迎击长虹的价格战。2005年4月16日，在这个特意挑选的休市日，长虹公布了2004年年报，抛出中国股市有史以来上市公司亏损之最：36.81亿元。价格战的发明者和坚决的拥护者，为最后的豪赌交出了最昂贵的学费。二、各方的观点

博弈论教材2013-2

第三章纳什均衡及其应用 3.1 混合策略纳什均衡 1 鹰鸽博弈我们知道老鹰具有攻击性，而鸽子爱好和平。在原始社会里有两个部落，可以做出两个行动：一是进攻一是和平，分别用鹰和鸽表示。表1 鹰鸽博弈乙甲鹰鸽该博弈的那是均衡为（鹰，鸽），（鸽，鹰）。一些学者研究发现，在同一个地域内，“鹰”和“鸽”的比例为0.36：0.64。事实上，设鹰鸽比为:1z z -，可以得出如下结果： ()2514(1)1439E e z z z =-+-=-； ()95(1)514E d z z z =-+-=- 9 0.3625 z = = 聪明的做法是：当鹰鸽比小雨0.36时，选择鹰策略；否则选择鸽策略。使用混合策略方法分析：第一步：混合策略型表示：乙鹰鸽甲鹰 p 鸽 1-p 第二步：计算期望效用： (925)514(259)514E p q q E q p p =-+-=++-甲乙第三步：作出最优反应函数

91 259[0,1] 2590 25q p q q ???若若若， 90 259[0,1] 259 1 25p q p p ? ?? 如果如果如果第四步：作出反应函数的图像第五步：根据交点，找出纳什均衡：其中（ 99 ,2525 ）是混合策略纳什均衡。 2 斗鸡博弈我的老家地处安徽最北部，苏鲁豫皖四省交界之处，东北处有条小河。河边的棉花地里，经常有鹌鹑栖息在其间。秋末冬初的农闲时节，小鹌鹑刚好长成。村民结网捕鹌鹑把玩、斗鸟儿为乐。每天早晨4点多钟出发，大约7点钟回来，雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑，真正熟练了，才拿出来和别人的相斗。设想两只鹌鹑要在场子里一决雌雄。每只鹌鹑都有两个策略：攻击或逃跑。由于两只鹌鹑实力相当，若同时选择进攻会两败俱伤；若一只进攻，一只逃跑，进攻者胜利。逃跑的鹌鹑算是玩完了，以后再也没胆量进场子，主人也不回在把玩它，会用一块黑布把它的笼子蒙起来，培养成“叫子”，以后后捕鹌鹑的时候拎出去吸引同伴。若同时逃跑不会败掉，以后还能斗，但是都会挨饿一天。 1 p q

博弈论在工作生活中的应用

东北财经大学MBA学院博弈论在工作生活中的应用姓名：毕哲学号：2013121098 班级：2013级MBA3班课程名称：策略思维与决策任课教师：宗计川

博弈论在工作生活中的应用博弈论，又称对策论，是指在存在利益竞争的活动中，一个人采取行动的结果。有仅与自己有关，而且与整个活动中其他人的行为有关，即一门研究博奔中局中人各自所选策略的科学。近半个世纪来，人类思想正经历着一场博弈论革命。不论是在经济学上，或是其他社会科学，甚至自然科学领域，博弈论都有着广泛的应用，它已遍及人类生活的方方面面。一、博弈论概述博弈论是分析人们在博弈中的理性行为的理论，是讨论人们在博弈的交互作用中如何决策的理论，是一种“游戏理论”。对其具体来说是：一些个人、团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略中，进行选择，加以实施，并从中各自取得相应结果或收益的过程。它考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。随着博弈理论的发展和博弈研究的不断深入，人们意识到要用博弈论解决现实经济中的决策问题，对现实经济的发展变化趋势进行预测，就必须解决博弈模型的理论抽象和假设与经济问题实际情况的差距问题，具体包括博弈规则、信息结构等的来源和变化问题，相关各方利益关系的设定问题，博弈方的行为模式，能力和理性水平问题。对这些问题的考虑和分析引出了博弈基础理论研究的许多有价值的课题，其中包括理性种类和理性层次、博弈结构的不确定性和动态变化等有待进一步研究发展的领域。这充分保证了博弈论在未来相当长时间内的发展潜力。二、博弈论的类型根据不同的基准，博弈论的分类不同。关于博弈论最基本的分类有两个：一是按照博弈各方是否同时决策，分为静态博弈和动态博弈，同时决策或者同时行动的博弈属于静态博弈，先后或序贯决策或者行动的博弈属于动态博弈。另一分类，是按照大家是否都清楚各种对局情况下每个局中人的得益，分为完全信息博弈和不完全信息博弈。最后，博弈还分为合作博弈与非合作博弈。如果一个博弈允许参与人之中出现有行动约束力的联

博弈论基础复习

《博弈论基础》主要知识点一、名词解释（5×2＝10分）策略型博弈它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。混合策略局中人的混合策略是其纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。扩展型博弈博弈存在着局中人行动的先后次序，是对具有动态结构的决策形式进行研究的规范分析工具。博弈树对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。完美信息博弈是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。类型 :一般地，将一个参与人所拥有的所有私人信息称为他的类型。信号博弈是研究具有信息传递作用的信号机制的一般博弈模型，其基本特征是两个博弈方，分别称为信号发出方和信号接收方。分离均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号，接收者完全可以通过信号来准确判断出发送者的类型。混同均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息，无法对先验信念进行修正。特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。联盟

博弈论在经济学中的应用

博弈论在经济学中的应用刘肃素（华中师范大学经济与工商管理学院 2011211086）摘要：博弈论是研究策略博弈的数学理论，亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈，这就需要了解博弈的思想，用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。关键词：博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

博弈论中的几个经典问题

几个博弈论中的经典问题博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。几个重要的概念 1、策略(strategies)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。 2、得失(payoffs)：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。 3、次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。 4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a，那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

初探博弈论及其应用【开题报告】

毕业论文开题报告信息与计算科学初探博弈论及其应用一、选题的背景与意义在人类历史上，很早就有了博弈思想的故事，如众所周知的“田忌赛马”。在社会生活中，我们也能碰到类似的情形和现象，如下棋、打扑克、猜拳等想用自己的战术去取胜，这就是所谓的博弈现象。博弈论是研究理性的个体在相互依存时如何做出决策的一门理论知识，主要是强调决策主体的行为而引起的直接相互作用。上世纪80年代以后，博弈论经历了突飞猛进的发展，主要是在经济方面的发展，越来越多的人把它归为主流经济学的重要组成部分。不仅是在经济上有广泛的应用，而且在军事、信息、政治等方面也能看见它的影子。1994年的诺贝尔经济学奖获得者就是三位博弈论的专家。以后又有三次奖授给了与博弈论有关的专家。在我国，经济学界对经济博弈论的关注和兴趣也在迅速增强。由于博弈论应用的广泛性和实用性，越来越来多的人开始学习和研究博弈论。可以说，博弈论正将进入一个崭新的阶段。二、论文的主要思想博弈论研究理性的个体在相互依存时如何作出决策。因此博弈论在研究时需要作出一定的假设，当然也包括一些基本定义。所以本文从介绍博弈论的基本假设和基本概念开始，在对基本概念了解的基础上学习博弈论中的经典模型，从中学习博弈过程中的双方博弈思维，然后再选取一些实际中的例子，运用所学的博弈论思维，从博弈双方的角度考虑得出该做出何种决策。三、研究的步骤及方法研究步骤 1. 1.10——1.20 明确毕业论文的设计方向，查阅文献资料，完成开题报告。 2. 2.10——2.25 撰写文献综述，翻译外文资料。 3. 2.26——3.05 列出论文正文部分的撰写提纲。 4. 3.06——4.01 撰写论文初稿。 5. 4.02——4.20 根据指导老师的建议进一步修改。 6. 4.21——4.27 论文定稿，装订成册，按时完成其它各项任务，准备答辩。研究方法

博弈论课程概要(I)

交通大学博弈论课程概要 (I) 周林二零零四年十二月主要教材：博弈论（Fudenberg & Tirole ）引言：博弈论与决策论的差别. 例子：田忌赛马，换钱. 第一部分：完全信息策略式博弈 — 静态博弈 1. 策略式博弈的基本三要素：博弈者，策略空间，收益函数 2. 策略式博弈的基本三解法： a. 占优策略. 例子: 囚徒困境，二价拍卖（Ebay ，易趣网） b. 重复剔除劣策略. 例子：双寡头Cournot 竞争（线性需求） c. Nash 均衡 (最重要的概念) 三种解法的合理性依次减低，而三种解法的适用范围(存在性)依次增加. 3. Nash 均衡存在性定理：如果策略空间是凸紧集，收益函数连续和自拟凹，至少存在一个Nash 均衡. 证明基本思路：最佳反应映射是从策略空间到策略空间的(上半)连续映射(Berge 定理), 最佳反应映射的不动点就是Nash 均衡. 利用(Kakutani 不动点定理)Brouwer 不动点定理找出不动点.（注意：这里的最佳反应映射不是一个压缩映射, 因此不能用迭代法逼近不动点.）推论：任何有限策略博弈至少有一个混合策略Nash 均衡. 4. Nash 均衡一般非唯一，非Pareto 最优. 可以通过外在信号机制改善收益. 相关均衡：公共信号仅将不同的Nash 均衡混合，私人信号更为有效. 作业：1.1，1.2, 1.5, 1.7, 1.10, 1.12, 2.2 （F&T ）. 以及下面的题目： A ．证明任何一个满足Nash 均衡存在性定理的对称博弈(首先给出一个合理的定义)一定存在一个对称的Nash 均衡. B ．画出下列博弈中所有的相关均衡生成的收益向量: 博弈者 2 博弈者 1 T W

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

(作业)博弈论在工作生活中的应用

博弈论在工作生活中的应用一、博弈论概述：博弈论（game theory），又称对策论，是指在存在利益竞争的活动中，一个人采取行动的结果。有仅与自己有关，而且与整个活动中其他人的行为有关，即一门研究博奔中局中人各自所选策略的科学。近十年来博弈论在西方已成为最热门的学科，用博弈论去研究经济生活中的问题，已成为现代经济学最前沿的课题。研究对象：冲突、竞争现象的定量分析理论。参加竞争的各方为了获胜而需研究出一组对付对方的策略。博弈论研究的意义对于博弈论发展的贡献也许更大的是，博弈论正是在这个时期开始受到经济学真正广泛的重视，并被看作重要的经济理论和经济学的核心分析方法，开始贯穿几乎整个微观经济学、产业组织理论，在环境、劳动、福利、国际经济学科中也开始占越来越重要的地位，大有“吞噬”整个现代西方经济理论的气势。也正是在这个阶段开始，博弈论开始成为西方国家经济学专业和许多相关专业学生的一门必读课，有志于攻读经济学博士学位者，更是必须熟练掌握和运用博弈论的原理和方法。博弈论的思想、词汇也开始在经济学专业杂志上大量出现，不懂博弈论的学者开始在阅读经济学文献方面遇到越来越大的困难和限制，几乎到了不懂博弈论就意味着不懂现代经济学的地步。上述趋势由于90年代中期的两次诺贝尔奖而进一步得到加强。首先是1994年三位致力于博弈论的基础理论研究，对非合作博弈理论的产生和发展作出了巨大贡献的学者，纳什、海萨尼(J．Harsanyi)、塞尔顿(R．Selten)，共同获得经济学诺贝尔奖，使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定：此后是1996年，诺贝尔经济学奖又由博弈论和信息经济学家莫里斯(James A. Mirrless)和维克瑞(William Vickrey)，因为在不对称信息条件下激励机制问题(这种激励问题实际上就是一种不完全信息的博弈问题)方面的基础性研究而获得，更进一步强化了博弈论的发展趋势。将80、90年代看作博弈论的成熟期，并不意味着此后博弈论将进入衰退阶段。事实上，至少到目前为止，博弈论的发展还远远没有达到顶峰。首先，由于博弈理论本身优美深刻的本质魅力，新的博弈分析工具和应用领域的不断发现，以及博弈分析的价值得到越来越充分的认识，不断吸引新的理论和实践工作者学习、应用博弈论，吸引大量学者加入研究队伍。这是博弈论继续向前发展的根本基础和保证。其次，随着博弈理论的发展和博弈研究的不断深入，人们意识到这种理论还存在不少问题，特别是它的理论基础方面还存在一些没有很好解决的根本性问题。要用博弈论解决现实经济中的决策问题，对现实经济的发展变化趋势进行预测，就必须解决博弈模型的理论抽象和假设与经济问题实际情况的差距问题，具体包括博弈规则、信息结构等的来源和变化问题，相关各方利益关系的设定问题，博弈方的行为模式，能力和理性水平问题。对这些问题的考虑和分析引出了博弈基础理论研究的许多有价值的课题，其中包括理性种类和理性层次、博弈结构的不确定性和动态变化等有待进一步研究发展的领域。这充分保证了博弈论在未来相当长时间内的发展潜力。第三，金融、贸易、法律、政治等众多领域，不断提出新的博弈论应用课题，也不断有新的应用博弈模型产生，这些应用问题和成果与博弈理论的发展之间形成了一种相互促进的良性循杯。这也是今后博弈论进一步发展的巨大动力。第四，在合作博弈和非合作博弈两大类博弈中，目前非合作博弈理论的成熟程度大大高于合作博弈理论，非合作博弈是博弈论的主流。但事实上合作博弈理论同样是非常重要的博

博弈论的经典案例与分析

博弈论的经典案例与分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；以中小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负，一个学校最好不减负，因为这样做，可以带来比其他学校更高的升学率。给定其他学校不减负，这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。请用同样的方法分析其他例子。智猪博弈的例子：大企业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。破釜沉舟是一个承诺行动。目的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。自己也会付出更大的代价。

博弈论的基础知识与应用

博弈论的基础知识与应用(转) 1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论（如同计算科学理论和许多其他的贡献一样）是由约翰.冯.诺伊曼（John von Neumann）创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦（Oskar Morgenstern）共同写成的《博弈论与经济行为》（The Theory of Games and Economic Behavior）。当然，摩根斯坦把新古典经济学的思想带入了合作中，但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻由于诺伊曼的工作，在更广阔的人类行为互动的范围内，“博弈”成为了一个科学的隐喻。在人类的互动行为中，结局依赖于两个或更多的人们所采取的交互式的战略，这些人们具有相反的动机或者最好的组合动机（mixed motives）。在博弈论中常常讨论的问题包括：1）当结局依赖于其他人所选择的战略以及信息是完全的时候，“理性地”选择战略意味着什么？ 2）在允许共同得益或者共同损失的“博弈”中，寻求合作以实现共同得益（或避免共同损失）是否“理性”？或者，采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失，这是否是“理性”的？ 3）如果对2）的回答是“有时候是”，那么在什么样的环境下侵略是理性的，在什么样的情况下合作是理性的？ 4）在特定情况下，正在持续的关系与单方退出这种关系是不同的吗？ 5）在理性的自我主义者的行为互动中，合作的道德规则可以自然而然地出现吗？ 6）在这些情况下，真正的人类行为与“理性”行为是否相符？ 7）如果不符，在那些方面不符？相对于“理性”，人们更倾向于合作？或者更倾向于侵略？抑或二者皆是？因而，博弈论研究的“博弈”包括：破产门口的野蛮人（Barbarians at the Gate）网络战（Battle of the Networks）货物出门，概不退换（Caveat Emptor）征召（Conscription）协调（Coordination）逃避（Escape and Evasion）青蛙呼叫配偶（Frogs Call for Mates）鹰鸽博弈（Hawk versus Dove） Mutually Assured Destruction 多数决定原则（Majority Rule） Market Niche 共同防卫（Mutual Defense）囚徒困境（Prisoner’s Dilemma）补贴小商业Subsidized Small Business 公共地悲剧Tragedy of the Commons 最后通牒Ultimatum

博弈论三大经典案例

经典的囚徒困境 1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择： ?若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。 ?若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。 ?若二人都互相检举（互相“背叛”），则二人同样判监2年。用表格概述如下：甲沉默（合作）甲认罪（背叛）乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择： ?若对方沉默、背叛会让我获释，所以会选择背叛。 ?若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工; 前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人都超负荷工作如果某人不听从吩咐，其他人听从吩咐，则此人下岗。其他人继续工作如果所有人都不听从经理吩咐，则经理下岗但是，由于员工之间信息是不透明的，而且，都担心别人听话自己不听话而下岗，所以，大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。