当前位置：文档之家› 博弈论复习大纲下

博弈论复习大纲下

博弈论第六讲--第九讲复习大纲

第六讲声誉和对称信息重复博弈

1、重复博弈（Repeated Game）：是动态博弈的一种特殊情况。在重复博弈里，完全相同的环境一次次重复出现，参与人在重复出现的相同环境中做出决策。重复博弈是一类很重要的动态博弈。

2、有限次重复博弈例子：连锁店悖论：现象---博弈的重复进行对进入威慑博弈和囚徒困境的结果基本上没有影响；结论---在位者在包括第1个市场的所有市场上都将选择合谋。这个结论称为连锁店悖论。

通过对连锁店悖论的分析，得出结论：如果当事人完全理性，有限次重复博弈的均衡解和一次博弈没有区别。把这个结论推广到囚徒困境博弈中，就是说，尽管两个人都选择不坦白是集体最优的，但如果同样的博弈重复有限次，这个重复博弈的均衡仍然是（坦白，坦白）。

重复博弈比不重复进行的一次性博弈要复杂得多。在现实中，如果当事人不那么理性，或者看起来不那么理性，那么有限次重复博弈的结果有可能和一次博弈不同。那么在有限次博弈的囚徒困境中，就有可能实现（抵赖、抵赖）的结果。

3、无名氏定理：重复博弈中最重要也是最有名的结果是“无名氏定理”，该定理认为，只要局中人有足够的耐心，那么任何理性的可行盈利都可以在均衡中得以实施。换句话说，只要局中人的耐心足够地大，一次博弈中可行的理性结局总是可以与重复博弈中某均衡结局相一致。

无名氏定理告诉我们：在无限次重复博弈中声称完美均衡导致了某一特定的行为是没有意义的。

4、声誉：在重复进行的囚徒困境博弈里，只有博弈将重复进行无限次时，参与人才会选择合作。这是声誉的一个大问题。因为每个人都知道一个参与人将在最后一期选择坦白，那么为什么他们还要假设这个参与人会在目前建立起自己的声誉呢？

声誉应用：

5、折现率的概念以及无限次重复博弈中合作条件的推导，以产量卡特尔为例。

6、价格竞争对制造商的影响

7、进化与囚徒困境，鸽鹰博弈

8、零售商的价格竞争对制造商的影响

第七讲：序贯博弈的扩展式表述、信息与贝叶斯法则

1、序贯博弈的描述方法：扩展式、博弈树。

2、定义：

结（Node）:博弈中某一参与人或自然采取行动的时点，或者博弈结束的时点。

后续节（Successor）前续结（Predecessor）

起始节（Starting node）终点节（End node）

枝（Branch）在一个特定结上某参与人的行动集中的一个行动。

路径（Path）：从起始结到终点结由结和枝组成的系列。

信息集：参与人在博弈的任何时点上的信息集（Information Set）是指在博弈树中他认为有可能是实际结的不同结的集合，而参与人靠直接观察

是无法从中区分的。

共同知识：如果某一信息是所有参与人都知道的，如果每个参与人都知道所有参与人知道这一信息，如果每个参与人都知道所有参与人知道

所有参与人知道这一信息，且如此这般直至无穷，那么这一信息

便称为共同知识。

3、对博弈的信息结构可用不同的方式加以分类：（了解）

完美信息（Perfect information）博弈：博弈中的每个信息集都是单结的。否则该博弈就是不完美信息博弈。

确定性博弈：在任一参与人行动之后，就再没有自然的行动了。否则就是不确定性博弈。

对称信息（Symmetric information）博弈：任一参与人在任何他应选择行动的结点或者终点处的信息集，都至少包含与其它参与人的信息集相同的元

素。否则，该博弈就是不对称信息博弈。

不完全信息（Incomplete information）博弈：自然首先行动且它的行动至少对某一参与人来说是不可观测的。否则，该博弈就是一个完全信息博弈。

完美信息博弈满足了对于信息的最强的要求，在这样的博弈中，每个参与人对于

自己置身于博弈树中的位置总是一清二楚的，没有行动是同时进行的，且所有参与人都观察到了自然的行动。

一个具有不完全信息的博弈也具有不完美信息。

4、贝叶斯均衡指参与人按照贝叶斯法则来更新信念所形成的纳什均衡。（了解）第八讲：对称信息序贯博弈

1、序贯理性（Sequential rationality）：一个参与人在博弈的每一个点上都重新优化自己的选择并且把自己将来会重新优化其选择这一点纳入到考虑中。

2、利用序贯理性的概念区分可置信威胁、不可置信威胁

3、能够利用序贯理性的思想寻找对称信息序贯博弈的均衡。

4、经典模型：进入威慑博弈、要挟诉讼博弈。能够推导要挟诉讼的私了赔偿区间。

第九讲：道德风险、逆向选择与有限信息下的生存

1、信息不对称理论是由三位美国经济学家——约瑟夫·斯蒂格利茨（Joseph Stiglitz ）、乔治·阿克尔洛夫（George Akerlof）和迈克尔·斯彭斯（Michael Spence ）提出的。信息不对称理论是指在市场经济活动中，各类人员对有关信息的了解是有差异的；掌握信息比较充分的人员，往往处于比较有利的地位，而信息贫乏的人员，则处于比较不利的地位。该理论认为:市场中卖方比买方更了解有关商品的各种信息；掌握更多信息的一方可以通过向信息贫乏的一方传递可靠信息而在市场中获益；买卖双方中拥有信息较少的一方会努力从另一方获取信息；市场信号显示在一定程度上可以弥补信息不对称的问题。

2、信息不对称是市场经济的弊病,要想减少信息不对称对经济产生的危害,政府应在市场体系中发挥强有力的作用。这一理论为很多市场现象如股市沉浮、就业与失业、信贷配给、商品促销、商品的市场占有等提供了解释,并成为现代信息经济学的核心,被广泛应用到从传统的农产品市场到现代金融市场等各个领域。

3、信息不对称不仅要说明信息的重要性,更要研究市场中的人因获得信息渠道之不同、信息量的多寡而承担的不同风险和收益。

4、信息不对称的例子：二手车市场、保险市场、大学毕业生就业市场、信贷市场。

5、有限信息下的生存（教材第9章）：

1）灌木丛的作用

2）教育与信号

3）种族歧视的意外收获

4）瞪羚的跳跃（45.7cm）

5）质量保证证书

6）为什么男性要在情人节送玫瑰花（特点：昂贵、容易枯萎而且到处都是刺）给女朋友？

7）名人代言

6、信息不对称的结果——道德风险（Moral hazard）和逆选择（Adverse selection）1）道德风险：是指参与合同的一方所面临的对方可能改变行为而损害到本方利益的风险。

2）逆向选择：是指由于交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品，进而出现市场交易产品平均质量下降的现象。（生活中的逆向选择：二手车市场等，教材第八章。）

7、道德风险与委托代理理论（了解）

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×） ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√） — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论视角去思考生活中的问题与现象

姓名：学院：专业：年级：2010级学号：题目：博弈论视角去思考生活中的问题与现象关键词：经济学，大学生，考试作弊。内容摘要：考试是人才培养过程中的一个重要的教学环节,是检查教师教学效果, 是检验学生对知识和技术掌握程度的一种手段。近年来考试作弊现象越来越普遍、越来越严重,并呈现不断蔓延之势,严重影响了考试应有的严肃性、公正性和科学性,引起了社会公众的广泛关注。考试作弊行为的存在严重影响着考试功能的正常发挥,同时也严重损害着学生的心理健康和品德培养。如何有效地杜绝和减少学生考试作弊行为已成为近年来高等教育势在必行的一项工作。本文从从成本-收益分析维度对考试作弊行为进行简要分析,通过分析考生作弊的成本，提出控制作弊的对策。一、大学生考试作弊的成本-收益之博弈作弊行为包括夹带小抄、桌面留言、互对答案、偷看他人答卷、互换试卷、替考等,呈现出方式多样化、主体多样化、规模集团化、过程组织化、人员职业化、手段现代化、水平专业化等特点.经济学原理告诉我们,经济活动主体总是在一定约束条件下追求自身利益的最大化,这也正是大学生考试作弊的内在动因。因为考试成绩是衡量学生表现的关键指标,它直接影响着大学生的奖学金、评优、入党、提干、推研、就业和心理满足。在这一动因的作用下,大学生在考试中可能会违背学校规定,具有作弊、不作弊和按照一定的概率分布进行作弊等三种不同的行为选择。寻求最佳的作弊与不作弊的概率分布是大学生的行为选择。在个体理性作用下,大学生选择行为时常从两方面考虑,一是将作弊带来的超常收益与作弊被发现而受惩罚的损失进行对比,若作弊的超常收益低于受惩罚的损失,将不会试图作弊,否则,作弊有利可图,就会发生作弊现象;二是估计作弊被监考教师发现的可能性,如果这一可能性很大,作弊概率就小,否则作弊概率就大。 1.学习机会成本大，课堂学习收益小

制度公正与博弈均衡——一种关于法律制度的博弈论分析

制度公正与博弈均衡——一种关于法律制度的博弈论分析; ;内容提要：从博弈论的角度看，公正是社会多元利益关系多次复杂博弈的相对均衡，法律制度的形成与实施实际上就是对这种博弈均衡的确认与保障，同时也只有法律的制定与实施体现社会主体的利益博弈的相对均衡才能形成公正和良好的法律制度。关键词：法律制度公正博弈均衡 Justice of Legal Institutions and Equilibrium of Games Abstract: From the point of Game Theory, justice is the comparative equilibrium of the complicated games of interests in the society, and the forming and enforcing of legal institutions conform and ensure the interests game equilibrium. On the other hand, legal institutions should embody the comparative equilibrium of the games of interests. Key Words: Legal Institution; Justice; Game Equilibrium 从汉语语义来看，公正至少应该包含公平、正义两个含义，而公正与公平、正义在多数情况下所表达的意思基本相同，相当于英文中的“Justice”。1 作为法律的基本价值之一的公正，固然是一个很抽象的范畴，但同时公正又是一个表达社会行为主体利益关系复杂博弈，进而形成的均衡的实实在在的概念。博弈论2按学科分类属于数学的一个分支，其核心内容在于运用数学方法构造人类行为的理论。博弈论发展至今，尤其是社会学界提出的结构博弈3的思想无疑对法学研究具有重要的方法论意义。对社

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者：————————————————————————————————日期：

博弈论在管理中的应用不知道大家有没有为这些事情困惑过：为什么员工技能竞赛，技能比拼很难开展，即便开展了，为什么工作效率也没有像预想的那样提高？为什么企业中总有些人拖大家的后退而不努力工作？为什么有的领导手段强硬，有的领导风格怀柔？你是否为“办公室政治”烦恼不已？你有没与遇到过和你看法不一致，总是与你针锋相对的下属？遇到强硬的下属你该怎么办？为什么酒店联盟或者企业间的联盟总是很难做？你是否在做决策之时衡量反复却不知道选择何种策略？。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理？你如何提出科学而又合理解决方法？以上种种问题，你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识，并以隐藏在我们身边的博弈为例子，给大家提供解决某些实际问题的思路。那么什么是博弈论呢？所谓博弈论，就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式，既谋略性思考问题的方式。对博弈论通俗的理解就是，关于人与人的斗争中“老谋深算”的学问。假如你正跟恋人用手机通电话，突然信号断了。这时你是会立即拨电话过去，还是等你的恋人拨电话过来？很显然，你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨，那么另一方最好是等待；如果一方等待，那么另一方最好拨过去。如果双方都拨，那么就会出现线路忙；如果双方都等待，那么时间就会在等待中消逝。这，就是博弈。

博弈论的基概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。参与者可以是自然人，也可以是团体。 ?信息：信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。如果n个参与者没人选择一个策略，那么s=（s1，s2，…，s n）称为一个策略组合。 ?收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益，它是策略组合的函数。 ?均衡：均衡是所有参与者的最优策略组合，记为s*。几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一人认罪，否则警方无充分证据将他们按最论刑。警方把他们隔离审讯，并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。

完整word版,博弈论期末复习题

一、支付矩阵 1、试给出下述战略式表述博弈的纳什均衡 B A U D 解：由划线解得知有一个纯战略均衡（R D ,）再看看它是否有混合战略均衡设B 以)1,(γγ-玩混合战略，则有均衡条件： γγγ-=-+?=2)1(21)(U V A γγγ26)1(64)(-=-+?=D V A γγ262-=- 得14>=γ，这是不可能的，故无混合战略均衡，只有这一个纯战略均衡。 2、试将题一中的支付作一修改使其有混合战略均衡解：由奇数定理，若使它先有两个纯战略均衡，则很可能就有另一个混合战略均衡。 B A U D 将博弈改成上述模型，则 )1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 5 4 = γ 同样，设A 的混合战略为)1,(θθ-，则

)1(25)1(16θθθθ-+=-?+ θθ3251+=+ 2 1= θ 于是混合战略均衡为? ???????? ????? ??51,54,21,21。二、逆向归纳法 1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上，1认为2选a 的概率为P ，则1选L '的支付P P P 32)1(25+=-+= 1选R '的支付P P P P 3233)1(36+>+=-+=

故1必选R '。 ? 给定1在第二个决策结上选R '，2在左边决策结上会选a ，故子博弈精炼均衡为 {}),(,,d a R L ' 四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为 11q c =，其中1q 为厂商1的产量。第2个厂商的成本函数为22cq c =，其中2q 为厂商 2的产量，c 为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c 是厂商2的“私人信息”，厂商1认为c 在?? ????2 3,21上呈均匀分布。设市场需求函数为 214q q P --=，其中P 为价格，两个厂商都以其产量为纯战略，问纯战略贝叶斯均衡为何？解：给定2q ，厂商1的问题是 1 211 1)14( )1(max 1 q q q q P q ---=-=π 因)(22c q q =。厂商1不知道c ，故目标函数为 ?? ????--=---??2 /3212 112 /31212112 11 )(3max )1)(4(max dc c q q q q dc q c q q q q 一阶条件： 0)(232 /3212 1 =- -? dc c q q 得 ?-=2 /3212 1)(2123dc c q q （1）厂商2的问题是： 22 2122212 2)4( )4( )(max 2 q q q q c q c q q q c P q ---=---=-=π 一阶条件： 02)4(21=---q q c

社会福利之中的博弈论视角

社会福利之中的博弈论视角 20091020234 社会工作赵志东根据福利政策制定者和社会福利之享有者双方来划分，可以将两者广义的看做是局中人，往往政府在其中扮演着决策者，而福利的享有者未必可以真正在其中扮演好对抗者。后者往往动作是滞后的、默认的、被动的，但最终占优。而在这一过程之中，双方的博弈开始逐渐衍化，又起初的对抗变为合作博弈，而也会从追求均衡到非零和，共同寻求发展。我单纯的认为将政府和最广大的福利享有者以博弈论的视角下来看，两者博弈的狭义应该是从博弈双方变化为博弈内容，也就是说由开始的对抗者追求享有福利的权益，变化为已享有福利者对于福利内容的追求，这里所指的追求可以是保障或是对于福利内容再界定。对抗者往往处于被动，因此对抗者只能寄希望于决策者劣势的策略选择，但是在博弈中不能忽视的是博弈双方往往存在着信息不对等的问题，因此对抗者很难通过单纯的对抗来获得优势。因为双方不同的社会作用和地位，在这个博弈之中，几乎不会出现一方打倒一方的情况，只能出现优势的倾斜。参与博弈的对抗者想通过这一过程来扩大自身的福利，或是争取自身的福利。而决策者则要考虑更多，如何

寻找到双方博弈的平衡点应该是决策者首先考虑的因素。而决策者要害更多顾虑，由于决策者的政策往往具备了对社会产生影响的能力，因此决策者并不能在单纯刨除了自身利益关联及其他因素之后，就能完全的偏向对抗者的意愿，决策者必须使得规则在顾及了全体局中人和参与者的意愿之后，又不存在种种可能产生不良后果的诱因。决策者与对抗者的种种矛盾决定了两者在社会福利的制定、实施、修改、完善等各方面都充斥着博弈行为，而且这一系列的博弈是不可消除的，同时也是不能逆的，因为在博弈双方不断试探和找寻平衡点的过程中，社会福利也随着进步，无论是哪一方面。福利享有者在享有了福利之后，便不会再忍受福利的倒退，而决策者也必须充分听取最广大社会成员的意见，毕竟那是权利构成的基础。如果将在社会福利相关之中的双方的博弈行为看着是不断发展的，那么中国的社会福利无疑还处在第一阶段的博弈，即社会成员还在追求自身的福利，而同时表现出了不同的博弈者所追求的福利界定还不尽相同。在具体的操作上由政府代表国家提供福利。表面看来，福利的提供主体是政府，实际上，政府只是一个中介机构，真正提供福利的是国民，其基本途径来自于税收。然后相较于knowledge is power 这句名言，power is power 似乎更能说明在中国产生差异的原因。过于注重权力导致了上重下轻的社会结构，大量的资源集中在了掌握权力的人群手中，相较而言，权力缺乏的人群往往得不到福利的保障，或者只能得到可以涵盖绝大多数人的部分福利。

博弈论经典例子

博弈论经典例子篇一:《博弈论三大经典案例》经典的囚徒困境 1950年，由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论，后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述，并命名为"囚徒困境"。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方(相关术语称"背叛"对方)，而对方保持沉默，此人将即时获释，沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作")，则二人同样判监半年。若二人都互相检举(互相"背叛")，则二人同样判监2年。用表格概述如下：甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者(即"囚徒")都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为"严格劣势"，理性的参与者绝不会选择。另外，没有任何

其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁，并不知道对方选择;而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工;前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人

博弈论基础复习

《博弈论基础》主要知识点一、名词解释（5×2＝10分）策略型博弈它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。混合策略局中人的混合策略是其纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。扩展型博弈博弈存在着局中人行动的先后次序，是对具有动态结构的决策形式进行研究的规范分析工具。博弈树对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。完美信息博弈是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。类型 :一般地，将一个参与人所拥有的所有私人信息称为他的类型。信号博弈是研究具有信息传递作用的信号机制的一般博弈模型，其基本特征是两个博弈方，分别称为信号发出方和信号接收方。分离均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号，接收者完全可以通过信号来准确判断出发送者的类型。混同均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息，无法对先验信念进行修正。特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。联盟

关于法律制度博弈论分析

关于法律制度博弈论分析内容提要：从博弈论的角度看，公正是社会多元利益关系多次复杂博弈的相对均衡，法律制度的形成与实施实际上就是对这种博弈均衡的确认与保障，同时也只有法律的制定与实施体现社会主体的利益博弈的相对均衡才能形成公正和良好的法律制度。关键词：法律制度公正博弈均衡从汉语语义来看，公正至少应该包含公平、正义两个含义，而公正与公平、正义在多数情况下所表达的意思基本相同，相当于英文中的“Justice”。1 作为法律的基本价值之一的公正，固然是一个很抽象的范畴，但同时公正又是一个表达社会行为主体利益关系复杂博弈，进而形成的均衡的实实在在的概念。博弈论2按学科分类属于数学的一个分支，其核心内容在于运用数学方法构造人类行为的理论。博弈论发展至今，尤其是社会

学界提出的结构博弈3的思想无疑对法学研究具有重要的方法论意义。对社会中各种行为、各种利益关系进行博弈论的分析，在此基础上研究法律制度的形成与实施，无疑具有重要意义。一、制度公正与利益博弈公正是一种社会观念形态，是建立在一定经济基础之上的，经过多元利益主体多次反复博弈而形成的社会意识形态。正如马克思所讲，生产当事人之间进行交易的正义性在于：这种交易是从生产关系中作为自然结果生产出来的。交易的法律形式——契约，其内容只要与生产方式相适应，相一致，就是正义的；只要与生产方式相矛盾，就是非正义的。在资本主义生产方式的基础上，奴隶制是非正义的；在商品质量上弄虚作假也是非正义的。4就是说，公正观念始终是一定生产方式的观念形态。法律制度的公正总是相对的，变化发展的，没有永恒的公正，公正“具有一张普洛透斯似的脸，变幻无穷，随时可呈不同形状，并具有极不相同的面貌。”5之所以说公正

博弈论在管理中的应用

管理中的博弈论在博弈中，你必须考虑对方的选择来确定你的最优选择，而对方也必须考虑你的选择来确定他的最优选择，你从博弈中得到的赢利——或者说是利益，不仅取决于你自己的行动，也取决于对方的行动，而对对方来说也是如此，你们当中的每一方都试图尽可能的使自己的利益最大化。总之，你们的行动既互相影响又相互依赖，这正是博弈最本质的特征。在一场博弈中，每个人的目标都是其利益的最大化。在博弈理论中，有一个基本的假设，就是人们不会有道德，良心和情感上的考虑，所有的一切都只以是否符合自身利益作为选择标准。不过我们有时候也会从心理上、情感上对这一假设进行修正。不过，这种假设在绝大多数情况下是成立的。虽然我们研究的是对抗性行为，但是我们不要寄希望于博弈论可以使你所向无敌，不过博弈论确实可以增强你对某些局势的洞察力，因为它有自己独特而又保持逻辑内在一致性的思考方法。我们来看一个现实的例子。一个经理，为了提高工作效率而让手下有两个主管进行比赛，获胜者将得到一笔奖金。如果这两个员工都拼命工作，那么每人都有1/2的概率得到奖金，但是每个人也都会承受艰苦工作而带来的负效用，而经理自然可以得到好处。但是这两个员工实际上也可以合谋而皆不努力，这时他们两个得到奖金的概率仍然是1/2，但是谁也不需要承担艰苦劳动所带来的负效用，这使得每个员工都从合谋中得到了好处。不过，经理遭殃了，因为预期的工作效率下降了。假如你是这个经理，你会怎么做？有什么办法来防范合谋呢？大家可能会想到监督。监督的确可以防范合谋，但是进行有效的监督是很困难的，一是监督者也有可能与被监督者合谋，二是对于隐性的默契合谋，监督对此无能为力。那么有什么办法来防范合谋呢？一个办法就是对员工进行歧视。比如，两名员工是一男一女，那么这个歧视的方案是男员工在比赛中胜出将获得100元，而女员工则只能获得50元。这个方案会导致女员工不努力，而男员工为了胜出将努力而不与女员工合谋。实际上，组织正是通过打击某些员工而拉拢另一些员工来瓦解员工之间的合谋行为的。不过，这个方案有个问题，她会使被歧视员工不再努力，另外由于法律的相关因素，这样的显性歧视方案不会被广泛采用。我们可以借鉴的是隐形歧视理论。比如在组织中两个员工为了争夺一个更高的职位而竞争。显然，两个员工也可以合谋而不努力，让老天来决定谁来得到这个岗位，并且约定，不管是谁得到这个岗位都需要对对方进行补偿。这个问题仍然

博弈论的考试复习资料

一、简答题 2、什么是信号传递博弈？请举例说明。信号传递博弈是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这个博弈中，有两个参与人，i=1、2，参与人成为信号发送者，参与2称为信号接收者；参与人1的类型是私人信息，参与人2的类型是公共信息（即只有一个类型）。举例：（1）“市场进入阻挠”是产业经济学中的一个典型例子。设想有一个垄断企业已在市场上(称为“在位者”)处于优势地位,另一个企业虎视眈眈谋求进入(称为“进入者”)。在位者若要保持自己的垄断优势,就会想方设法阻挠进入者进入。动态博弈通常用博弈树表示,如下图中,进入者先选择行动(进入或不进),在位者然后默许或斗争,最后的数字是支付水平。如进入者选择“进入”,在位者选择默许,支付水平分别为40和50。用不完全信息动态博弈分析“市场进入”例子。在这个博弈中,在位者可能是低成本,也可能是高成本,进入者无法得知。假设在位者先行动———比如说定价。用P表示价格,那么,P 本身可能包含有关在位者成本函数的信息,因为不同成本函数下的最优价格是不一样的。假定存在一个价格P3,只有低成本企业才有利可图,而高成本企业是不敢模仿这个价格的。那么,精炼贝叶斯均衡是,低成本在位者选择P3,高成本企业选择一个较高的垄断价格;如果进入者观察到在位者选择了P3,就推断其为低成本,不进入;否则,就认为在位者是高成本,进入。这就说著名的“垄断限价模型”。

这里，在位者是信号发送者，进入者是信号接受者。当在位者选择价格时，他知道进入者将根据自己选择的价格判断自己是高成本还是低成本的概率；进入者确实是根据观测到的价格修正对在位者类型的判断，然后选择进入还是不进入。 3、“在动态博弈中，因为后行动的博弈方可以观测到先行动方的选择，因此，总是有利的。”此说法正确吗？为什么？不正确，因为在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业可能具有先动优势。 4、简述不完全信息静态博弈由哪些要素构成？

管理博弈论

管理博弈论管理博弈论(Game Theory of Management) [编辑] 什么是管理博弈论[1] 管理博弈论也称管理激励与约束机制设计理论，是指管理博弈论是对近年来的管理激励与约束机制设计中不同模型、不同方法研究成果的概括和提炼。所以可以说管理博弈论就是围绕管理激励与约束机制设计的一系列理论与方法，是博弈论在管理学领域的运用与发展。 [编辑] 管理博弈论的产生[1] 现代管理的核心职能是激发人最大限度地发挥主观能动性，创造性地开展工作，这其中自然包含了管理者和被管理者之间的博弈。但由于管理对象是有限理性的社会人，不是理性的经济人；由于管理环境是复杂多变而组织目标是相对稳定的，因而管理活动更具多阶段特性；由于被管理者的需求是多方面的，因而管理激励与约束是多因素的；还由于管理活动通常具有多目标、多层次的特点，使博弈论方法在管理学中的应用远比在其他领域的应用更为复杂、多样。由于引入了管理激励与约束机制设计的概念，使得管理和博弈有了结合部，博突论在管理学的应用有了切入点。之所以说管理激励与约束机制是管理博弈论产生和发展的载体，是由于它既切合管理实践发展需要，又能将个人理性与非理性、优化结果的定量与定性描述、需求的单因素与多因素、管理的单目标与多目标、单阶段与多阶段、单一管理层次与多管理层次有机地结合起来，从而为博弈论在管理学中的应用与发展开辟了道路。 [编辑] 管理博弈论的基本内容管理博弈论的基本内容包括：需要激励，目标激励，榜样激励，压力约束，纠偏约束。 [编辑] 管理博弈论管理的核心[2]

管理博弈论管理的核心是如何最大限度地发挥主观能动性创造性地开展工作，这其中就包含了管理者与被管理者之间的博弈。现代管理是以人为中心的管理，一个组织内部的效率取决于全体员工的努力水平。因此，激励与约束就成了管理的核心职能。在企业中如何提高员工的素质，如何创造出使员工感到上下级平等的环境，如何达成组织目标和个人目标的统一，这都是一个组织在进行管理的时候考虑如何运用管理激励与约束手段的问题。从社会现实来看，假冒伪劣产品的出现，污染问题，体育比赛中的黑哨问题，运动员的违规问题等等都是管理激励与约束措施不当造成的。建立有效的管理与约束机制已经成为现代管理实践的迫切需要。管理博弈论就是一门关于激励与约束机制体系设计的新学科，它是博弈论在管理应用中的一个重要的、新的分支，管理博弈论进行定量化．模型化研究的基本数学基础就是博弈论。 [编辑] 管理博弈论的学科特点[1] 管理博弈论作为一门以管理激励与约束机制设计为研究对象的新兴学科，有自己产生的时代背景，有自己明确的研究对象与范围，有自己的理论基础，是应管理实践需要而生的。具体而言这门新学科具有如下一些特点： (1)管理博弈论是一门新兴综合性交叉学科。管理博弈论研究的对象是管理激励与约束机制设计，管理激励与约束机制问题往往非常复杂。由于管理者与被管理者之间一般信息是不对称的，他们既可能是合作关系，也可能是非合作的关系，管理激励与约束机制设计中需要综合运用合作博弈、非合作博弈、非对称信息博弈的理论与方法，还可能用到各种现代数学最优化理论，还要以管理学激励与约束理论为指导。因此，管理博突论是由众多学科理论交叉形成的，以特定的管理激励与约束机制设计为研究对象的综合性新学科。 (2)管理博弈论是一门应用性管理类新学科。管理博弈论是根据管理实践的需求而产生发展的，它的问题来源于管理实践，它的研究服务在于管理实践，故而它是一门理论与实践紧密结合的应用性管理类新学科。 (3)博弈模型的机制式表述。博弈论中博弈模型的基本表述形式有战略式表述、扩展式表述；非对称信息博弈论中博弈模型的基本表述形式为特征函数式表述。这些博弈模型的表述形式都是管理博弈论中博弈模型可采用的表述形式，但是，由于对复杂的多目标、多样因素、多阶段博弈难以表述，故其应用具有很大的局限性。为此，管理博弈论提出了适应于解决多目标、多因素、多阶段复杂的管理激励与约束机制模型的基本表述形式——机制式表述。 (4)定性要素研究与定量要素研究相结合。博弈论与非对称信息博弈论中博弈模型不仅可容纳的要素较少，而且要求要素只能是定量的。管理问题中涉及的资源要素不仅多，而且定性要素占的比重很大。不能反映定性要素作用的模型，显然不足以反映问题的全貌，设计出的模型必然是有缺陷的。管理博弈论强调定性要素研究与定量要素研究相结合，在其机制式表述中，通过定性因素定量化，将定性因素纳入模型，研究其作用与影响,力图达到充分全面反映问题的目的。

博弈论视角下的公共决策分析梁伟

第9卷第1期 2012年1月Journal of Hubei University of Economics(Humanities and Social Sciences) 湖北经济学院学报（人文社会科学版） Jan.2012Vol.9No.1 传统的公共决策视角是一种权力视角，这种视角从权力主体的单一立场出发，其决策的结果往往背离公共决策公共性价值，造成决策失误，给社会和人们带来严重的危害和经济损失。基于这个事实，本章将引进博弈论的视角对公共决策的主体、内涵以及决策过程进行重新考量，以促进公共决策正义性价值的实现。一、公共决策中博弈论视角引入的背景随着市场经济的不断完善以及政治体制改革的逐步推进，利益结构的多元化已成为一个不可回避的现实。利益主体对自我利益的强烈关注以及整个社会对利益主体权利义务的理性认识提升了各利益群体对决策介入的迫切需要。那些在利益格局中本已存在的或新近出现的诸多主体都有着表达其要求，希望政府作出利于自己决策，以维护自我既得权益的强烈愿望。可以说，中国30年改革开放的过程就是国家和人民从封闭走向开放、公民权利意识从沉睡走向觉醒，利益的主体从一元走向多元的过程。在这种背景下，以“权力视角”为中心，以政府为单一决策主体的公共决策已无法适应时代发展的需要，公共决策领域急需引入另一种视角———“关系视角”。博弈论视角正是这种关系视角，它是“研究决策主体的行为发生直接作用时候的决策以及这种决策的均衡问题”。 [1] 在博弈论里，个人效用函数不仅依赖于他自己的选择，而且依赖于他人的选择；个人的最优选择是其他人选择的函数。简而言之，决策主体在做出决策时，在考虑其他理性人最大效用的基础上实现自己效用的最大化。同时，它充分尊重所有决策主体参与决策的自由和权利，强调决策中各博弈主体力量的规制与均衡。这种通过利益相关方自由博弈的“关系视角”正迎合了时代对公共决策正义的吁求。笔者把博弈论引入公共决策分析，首先从公共选择理论中得到启示。公共选择理论认为：人类社会可以分为两种市场：一个是经济市场，另一个是政治市场。经济市场在尊重每个理性人基础上分配利益,政治市场不仅分配具体的利益，更重的是它还分配人的权利。如果人的平等、自由、受尊重等权利在分配利益的经济市场里能得到完整和维护，它更理应在分配权利的政治市场里受到同样的对待。原因显而易见，在经济市场和政治市场上活动的是同一个人，没有理由认为同一个人在两个不同的市场上会根据两种完全不同的行为动机进行活动。博弈论是应用于经济市场的重要理论，它从个体选择出发，尊重个体选择过程中的理性行为，在公共决策中引入博弈论视域，尊重个体理性，体现了个体理性在“两种市场”选择逻辑的一致性。其次，作决策是个人、集体、国家运行中常见的事项。决策可分为个人决策、集体决策、公共决策等。个人决策决定的是具有私人独享性的个人利益，集体决策决定的是具有组织分享性的集体利益，公共决策决定的是具有社会分享性的公共利益。博弈论作为20世纪40年代开始兴起的现代决策理论，被个体决策和集体决策广泛应用于决策的过程中。公共决策分配的是公共利益，内含公共性价值，与每个人的利益密切相关。如果个体决策和集体决策都不是单方面单角度的决定过程，而是博弈的过程，那么公共决策更应该如此，即充分尊重利益相关主体选择的自由和权利，让他们参与到具体决策的博弈中，这是公共决策正义价值的一个重要体现。再次，当今中国发生的一些公共决策案例很好地证明了这种假设：在公共决策中，如果公民和社会团体能够出场和公权力进行博弈，则会促进公共决策的公平正义。比如：2004年深圳西部通道工程原计划要经过居民小区，小区居民因为工程的污染而意见纷纷，此后，政府和小区居民进行了一场声势浩大的博弈，博弈的结果皆大欢喜，小区居民作出了让步———同意工程继续进行，政府机构也作出了妥协———改变工程设计方案，以尽可能减少对沿边居民的影响。基于以为理论上和实践上的三点理由，我有理由认为“博弈论视角下的公共决策分析”并非是不合时宜的，问题在于，对此探讨的努力能在多大程度上促进这种时宜。二、博弈论视角下公共决策内涵的重新考量传统“权力视角”的公共决策主体单一化，公共决策目标更为强调效率，公共利益模糊化和虚拟化，博弈论视角下的公共决策内涵必然要从以下几方面重新审视和考量。第一，公共决策主体。博弈论视域下的公共决策主体不同于政府单向度的传统公共决策，它是多向化的。现代社会“人们已经不能再接受这样的观念,即政府的公共政策是由那些掌握权力,声称代表公共利益，但拒绝公民参与政策过程的少数领导人制定的。”[2]西方一些学者把政治现代化概括成专制政治向民主政治转化的过程，从历史考察，这种过程的逻辑模博弈论视角下的公共决策分析梁伟（广东培正学院，广东广州510830）摘要：博弈论是应用于经济市场的重要理论，本论题把博弈论视角引入公共决策中，试图对公共决策的主体、目标、公共利益作重新的考量和分析，以寻找公共决策正义的进路。关键词：博弈论；关系视角；公共决策 45··

法律博弈论及其核心构造

法律博弈论及其核心构造* 金梦内容提要法律博弈论把博弈理论运用到法经济学研究的全新视域中，研究法律策略主体在行为直接发生相互作用时的策略选择以及这种策略选择所产生的均衡问题。法律博弈论的核心是法律均衡，法律均衡是通过法律博弈最终实现“法律的帕累托最优”。公平正义法律价值的实现，是“法律的帕累托最优”状态的展现，也是法律博弈的终极目标和价值追求。关键词博弈论法律博弈论法律均衡法律博弈论从法经济学作为独立学科之日起就已经贯穿其研究的始终。博弈论①为研究法律问题提供了新的方法和视域。如果说科斯定理的提出是法经济学作为一门独立学科的标志，那么从理论上说，自从有了科斯定理，法经济学就成了法律博弈论。②而且博弈理论在经济学领域的充分运用和对经济学的完善与改造引起了诸多法学学者的关注。艾尔斯在评论埃里克·拉斯穆森的《博弈与信息》一书时，提及了博弈论在法律中的应用及其趋势，着重论述了法律规则的策略选择问题。③布里梅耶运用博弈论分析法律冲突问题。④拜尔、格纳特和皮克在合著的《法律的博弈分析》一书中指出，现代博弈理论为人们理解法律规则如何影响人的行为提供了非常深刻的洞察力。此书是第一本全面系统运用博弈论分析法律问题的著作，它的出版开启了法律博弈论研究的新篇章。⑤ 时至今日，作为法经济学的主导分析范式，法律博弈论在一定程度上具有法学方法论的意义。博弈论在法学研究和法律实践中被游刃有余、“无孔不入”地运用，使得法学这门古老又常新的社会学科更加年轻化、精量化和现实化。为了更好地使用博弈论分析和解决法律问题，亟需解释法律博弈论的涵义到底是什么？法律博弈论的运作机理是怎样的？作为一种纯理论⑥，法律博弈论在法律冲突、法律价值选择和司法实践中如何具体操作适用？以上是本文关注的重点问题。何谓“法律博弈论” （一）法律博弈论的涵义 “博弈论”，英文的表达是Game Theory或者Theory of Games；“法律博弈论”，英文的表达一般是Law and Game Theory或者Legal Game Theory，很多学者也使用Game Theory and Law，翻译成中文是“法律的博弈分析”抑或“博弈论与法律”。“法律博弈论”在国内外还没有学者作出专门系统且深入的研究，更没有一个确定的涵义和深厚的理论基础。使用“法律博弈论”一词通常是在运用博弈论分析具体法律问题时，所以在通常意义上讲，学者所做的研究叫做“法律的博弈分析”，而不是“法律博弈论”。“法律博弈论”的使用和表达方式首先是把它看做一种独立成家的理论，而不仅仅是博弈方法在法学中的运用。既然是一种理论，就必须明确其定义，厘清其组成要素和适用方法，同时还需要深入考察其是否具有体系化的特征。在给“法律博弈论”下定义之前，需要先明确“博弈论”的定义。通说认为，博弈论是研究公式化了的激励结构（游戏或者博弈）间的相互作用以及具有斗争或竞争性 822*本文系国家社科基金重大项目“完善以宪法为核心的中国特色社会主义法律体系研究”（项目号：14ZDC008）的阶段性成果。

课程名称管理博弈论教学大纲-北京理工大学研究生院

课程名称：管理博弈论教学大纲一、课程编码：2100181 课内学时： 32 学分： 2 二、适用学科专业：工商管理三、先修课程：经济学四、教学目标通过本课程的学习，掌握管理博弈论的基本思想、理论与方法，提升学生从博弈视角认识、分析复杂社会经济现象的基本能力，为其开展管理与经济领域的科学研究和解决实际问题提供一种方法论和有效的理论工具。五、教学方式课堂教授为主，辅以课堂讨论、课堂习题解析、自学的教学方式。六、主要内容及学时分配 1. 管理博弈论概述（4学时） 1.1关于博弈论 1.2博弈论的产生与发展 1.3博弈论的一些基本概念 1.4博弈论的基本内容 2.合作博弈论（4学时） 2.1合作博弈的含义 2.2双人合作博弈 2.3多人合作博弈 2.4夏普利值 3.完全信息静态博弈（6学时） 3.1博弈的战略表述式 3.2纳什均衡 3.3库诺特寡头竞争模型 3.4贝特兰德双头垄断模型 3.5混合战略纳什均衡 4.完全信息动态博弈（6学时） 4.1博弈的扩展式表述 4.2扩展式表述博弈的纳什均衡 4.3子博弈精炼纳什均衡 4.4子博弈精炼纳什均衡应用——斯坦克尔伯格的寡头竞争模型 4.5重复博弈

5.不完全信息静态博弈（6学时） 5.1不完全信息静态博弈和贝叶斯纳什均衡 5.2贝叶斯均衡的若干例子 5.3贝叶斯博弈与混合战略 5.4双向拍卖 5.5显示原理 6.不完全信息动态博弈（6学时） 6.1精炼贝叶斯纳什均衡 6.2信号传递博弈 6.3不完全信息重复博弈与声誉模型 6.4精炼贝叶斯均衡的再精炼及其他均衡概念七、考核与成绩评定考核：平时考核（包括课堂测试、作业、论文报告、考勤等）+期末考试成绩评定：平时考核占40%；期末考试成绩占60%。八、参考书及学生必读参考资料 1.侯光明，李存金.管理博弈论[M].北京：北京理工大学出版社，2005. 2.李存金，侯光明.管理博弈论习题解析[M].北京：北京理工大学出版社，2006. 3.张维迎.博弈论与信息经济学[M].上海：上海人民出版社，1996. 4.谢识予.经济博弈论[M].上海：复旦大学出版社，1997. 5.罗伯特.吉本斯.博弈论基础[M].北京：中国社会科学出版社，1999. 九、大纲撰写人：李存金

博弈论中的相关概念

新古典经济学前提：理性选择——减少不确定； ——经济系统效用最大化。理性——新古典经济学与博弈论的纽带博弈论决策前提：理性的战略选择。博弈论决策基础：最优反应，即带来最大收益的战略。但是，在博弈论中最优反应不是理性的唯一表现，也不总是假定人是理性的。新古典经济学决策的背景：理性的个体面临特定的制度环境（产权、货币、高度竞争的市场），在此基础上以获取利益最大化为目的。隐含的基础：只需考虑自身情况和市场条件，而不考虑他人行为。弊端： ——限制了理论的使用范围，现实中竞争并不完全； ——无法解决货币经济以外的决策难题。博弈论的优势： ——不仅考虑自身条件和市场环境，最重要的是还需考虑他人的行为。游戏规则：两个选手，轮流取币；每次至少取一枚硬币；只能从一行中取任意数量的硬币，不许从两行中选取；取走最后一枚硬币的为胜者囚徒困境的启示：囚徒困境仅仅是二人博弈，多人博弈在现实中更多；如果囚犯可以交流，结果显著不同；如果多轮博弈，结果也有不同；导致困境结论的分析过程令人注目，但最后结论并非理性。通常假设参与者将采取最优反应战略而理性行事，最大化利润、力争在游戏中获胜、达到主观收益最大化，或者惩罚最小化，皆属于理性行为。最优反应战略是在其他参与者战略已知或可预测条件下，给某参与者带来最大化收益的战略。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。依据新古典经济学，我们把一个参与者的最优反应（best response）定义为，在其他参与者已经选定战略，或者可以预计到他们将选择何种战略时，能够给该参与者带来的最大收益的战略。标准式——数字矩阵；扩展式——树形图不确定事件（contingency）：相机战略（contingent strategy）：仅在不确定事件发生时才会采取的战略信息集（information set）：节点2包含了决策者掌握的所有信息，因此也称为信息集。扩展式的优势： ——展示了每一阶段掌握的信息； ——展示了参与者掌握信息的不完全所有博弈问题均可用标准式描述，即绘制一个表格，边缘列出参与者的战略，里面列出参与者的收益；