当前位置：文档之家› 090223博弈论引论已看

090223博弈论引论已看

欢迎选修

博弈论与行为经济学

博弈论与

章平

pzhng(a)https://www.doczj.com/doc/8018579228.html,

2653-8247

深圳大学中国经济特区研究中心

行为经济学

Game Theory & Behavioral Economics

课程计划

试验

探索

引论：什么是策略行为 2.23 2.5

同时决策博弈3.2

3.9 3.5

混合策略纳什均衡3.16

3.235

序贯决策博弈3.30

4.6

4.13

Homework 1 4.1交5

同时博弈与序贯博弈4.20

4.27

5.4

零和博弈与霍特林模型5.11

5.18Homework 2

6.1交3

行为经济学的挑战5.25

6.1 3.5

偏好理论和前景理论6.8

6.15Homework 3

7.1交5

行为经济学的新方向 6.22 3.5

考核与成绩评定

?期末考试形式为闭卷考试。

?平时成绩（包括习题、课堂讨论报告或读书笔记）所占比例40%、期末考试成绩所占比例为60%。

?考勤：如何点名？

?教材:

?王则柯, 李杰. 博弈论教程. 北京：中国人民大学出版社,2005.

?参考教材:

?阿维纳什·K.迪克西特，巴里·J.奈尔伯夫. 策略思维. 北京：中国人民大学出版社,2002.

课程简介

?经济学是什么？

?博弈论和行为经济学是两门课。所谓“博弈论与行为经济学”是一个筐，希望让大家了解经济学思维方式是目的所在。?关键词：行为；选择；效率；替代

经济学是什么？

?几乎所有新生都会提出这个问题。

对必修的同学而言，刚上这一门课，就像接到一份礼物，恨不得立即开封，看看是什么东西；

对选修的同学言，选一门课就像买一本书，不知道内容大概就花钱是愚蠢的。那么，经济学是什么？

经济学不研究什么

?经济学家不讨论物理法则。他们会以比喻的方式提到物理法则，但不会去做实验、分析等研究。

?经济学家不会只提出社会理想的内容。他们有时也会提出社会理想，但不认为社会必须该如此不可，而是思考该如何实现。?经济学家不分析个别人的行为。这属于心理学的领域。

理解人的行为

?所有社会科学都是有关人的行为的科学，但不同学科的方法、假设、着眼点不同；?经济学：从个人到社会(from micro to macro)

?社会学：从社会到个人(from macro to micro)

?心理学：用观察、实验的方法看人们实际上是怎么行为的。（行为科学）

我们所理解的经济学?分析问题的视角：原初假设——一个人的偏好、技术和制度约束、资源禀赋。

?着眼点：效率。

?帕累托效率标准

?一种变革没有使任何人的处境变坏，至少有一个人的处境变好

?卡尔多-希克斯效率标准

?如果一种变革使得受益者的所得足以弥补受损者的所失，这种变革就是一个卡尔多-希克斯改进。

讨论

?考虑两种情形：

–情形A：某店主雇人将竞争对手的店门堵上，使后者不能营业；

–情形B：某店主以更低的价格和更优良的服务将竞争对手打垮。

?这两种情形有什么不同？为什么法律允许第二种情形而不允许第一种情形？

博弈论

?博弈论是有关“互动行为”(interactive behavior)的科学。

是研究决策主体的行为直接相互作用的决策以及这种决策的均衡问题。

?分歧终端机

?由两片带把手的ABS塑料组成一个圆筒。使用时，有分歧的两人分别将手伸进塑料筒，在筒中各自出招，然后一齐喊“一二三”，分别用另外一只手把塑料圆筒上的小把手拉开，这样两人都不能临时变招了。

行为经济学

?行为经济学是作为实用的经济学，它将行为分析理论与经济运行规律、心理学与经济科学有机结合起来，以发现现今经济学模型中的错误或遗漏，进而修正主流经济学关于人的理性、自利、完全信息、效用最大化及偏好一致基本假设的不足。

有趣的实验

1个球拍和一个球总共花了1.10美元，球拍比球多花1美元，请问买

球花了多少钱？

1基本概念

1.1博弈三要素1.2博弈分类

1.3博弈表达

Eg.1

如果给你两个师的兵力，由你来当司令，任务是攻克敌人占据的一个城市，通往城市的道路只有甲乙两条，而敌军的守备力量是三个师。规定：双方兵力只能整师调动；当你发起攻击时，你的兵力超过敌人，你就获胜；你的兵力比敌人守军少或相等，你就失败。那么，你将如何制订攻城方案？

——王则柯《人人博弈论》p.6

规则和兵力都有利于敌方，你一定输吗？

敌方行动方案：

A 3个师守甲

B 2个师守甲，1个师守乙

C 1个师守甲，2个师守乙D

3个师守

你的行动方案：

c 2个师从甲攻

b 1个师从甲攻，1个师从乙攻

c 2个师从乙攻

敌

A B C D

++——a——++你—++—b+——+

——++ c++——

攻守博弈

诺曼底登陆模拟

?比较A和B：

?如果我采取a，则敌军采取A或B都会赢，结果一样。

?如果我采取b，则敌军采取A会输，采取B会赢。

?如果我采取c，则敌军采取A或B都会输，结果一样。

?可见，站在敌军的立场，B优于A；

?同样比较敌军的C和D，可知C优于D。

?在此基础上，可知我的策略中，c最差。

?所以最终情况是：

?敌军必取“2+1”；而且我则是集中兵力攻击敌军一处，当然是薄弱处。

博弈论经典例子

博弈论经典例子篇一:《博弈论三大经典案例》经典的囚徒困境 1950年，由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论，后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述，并命名为"囚徒困境"。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方(相关术语称"背叛"对方)，而对方保持沉默，此人将即时获释，沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作")，则二人同样判监半年。若二人都互相检举(互相"背叛")，则二人同样判监2年。用表格概述如下：甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者(即"囚徒")都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为"严格劣势"，理性的参与者绝不会选择。另外，没有任何

其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁，并不知道对方选择;而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工;前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；以中小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负，一个学校最好不减负，因为这样做，可以带来比其他学校更高的升学率。给定其他学校不减负，这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。请用同样的方法分析其他例子。智猪博弈的例子：大企业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。破釜沉舟是一个承诺行动。目的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。自己也会付出更大的代价。

博弈论经典案例分析

博弈论经典案例分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P,I)，其中P为市场价格，I为消

费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 2、参与人的行动顺序，即每个参与人在何时行动； 3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息； 4、参与人的支付函数。比较： 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论基础作业及答案【最新资料】

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是：每一个局中人选择一个策略，由所有局中人的策略构成了一个策略组合；在其它局中人选定策略不变的情况下，若某一个局中人单独地违背自己已选的策略，那么他的收益只会下降（或收益不会增加）。这样的策略组合构成一个均衡局势，并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时，就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈中，若均为G 的其纳什均衡，若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?，0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡； (2)至少有两个纳什均衡，并且其中之一是帕累托占优均衡。（1 ）不存在纯策略的纳什均衡：该博弈不存在纯策略的纳什均衡（2）该博弈有三个纳什均衡：（战争，战争）、（和平，和平）和一个混合策略纳什均衡。很显然，（和平，和平）是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业，它们的成本函数分别为： TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品，其市场需求函数为：Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。解：由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争和平国家 1战争-5，-58，-10和平-10，810，10

博弈论与社会科学方法论(潘天群)

通识课课程中文名称：博弈论与社会科学方法论课程英文名称：Game Theory and Methodology of Social Sciences 课程代号：开课学期：第一学期（秋学期）主讲教师：潘天群职称：教授、博导研究专长：博弈论、逻辑学、科学方法论所在院系：哲学联系电邮：tqpan@https://www.doczj.com/doc/8018579228.html, 授课对象：全校二、三年级本科生（不限专业）一、主讲教师简介：潘天群，哲学博士，现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才（2006）。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。主要研究领域为：逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部：《行动科学方法论》，《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》，自2002年出版以来深受读者欢迎，为畅销书与长销书，已出版第三版。主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”（2009）。二、课程简介由于“他人”与“我”是既合作又竞争的关系，研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来，对社会现象表现出强大的解释力，已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖，许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学（如生物学、人工智能）之中。本课程突破数理博弈论的框架，结合主讲教师十年来的研究工作，构建适合

博弈论作业及答案浙江财经大学张老师作业答案

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作，每家企业只有一个工作岗位。工作申请规则如下：每个学生只能向其中一家企业申请工作；如果一家企业只有一个学生申请，该学生获得工作；如果一家企业有两个学生申请，则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足：W1/2

博弈论案例分析

(1)失火了，你往哪个门跑失火了，你往哪个门跑——这就是博弈论一天晚上，你参加一个派对，屋里有很多人，你玩得很开心。这时候，屋里突然失火，火势很大，无法扑灭。此时你想逃生。你的面前有两个门，左门和右门，你必须在它们之间选择。但问题是，其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的，那么你将因人多拥挤、冲不出去而烧死；相反，如果你选择的是较少人选择的，那么你将逃生。这里我们不考虑道德因素，你将如何选择？这就是博弈论！你的选择必须考虑其他人的选择，而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付，不仅取决于你的行动选择——博弈论称之为策略选择，同时取决于他人的策略选择。你和这群人构成一个博弈（game）。上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型，被称之为少数者博弈或少数派博弈（Minority Game）。当然，原来的博弈形式不是这么简单，这里我把它简化了，我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。生活中博弈的案例很多，你会见到很多例子。只要涉及到人群的互动，就有博弈。什么叫博弈？博弈的英文为game，我们一般将它翻译成“游戏”。而在西方，game的意义不同于汉语中的游戏。在英语中，game即是

人们遵循一定规则下的活动，进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中，game有竞赛的意思，进行game的人是很认真的，不同于汉语中游戏的概念。在汉语中，游戏有儿戏的味道。因此将关于game的理论，即game theory翻译成博弈论或者对策论，是恰当的。本书下面统称game theory为博弈论。博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦，他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家，他同时对计算机的发明作出了巨大贡献，他去世时博弈论还未对经济学产生广泛影响，否则经济学的诺贝尔奖肯定有他的名字，因为诺贝尔奖有规定，只颁发给在世的学者。谈到博弈论，不能忽略博弈论天才纳什（John Nash）。纳什的开创性论文《n人博弈的均衡点》（1950）、《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。博弈论对于社会科学有着重要的意义，它正成为社会科学研究范式中的一种核心工具，以至于我们可称博弈论是“社会科学的数学”，或者说是关于社会的数学。从理论上讲，博弈论是研究理性的行动者（agents）相互作用的形式理论，而实际上它正深入到经济学、政治学、社会学等等，被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家：纳什、塞尔屯、哈桑尼（），而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论导论

第一部分理性决策制定

1 单人决策问题晨起穿衣，你准备享用早餐。天生也幸，你生活在一个提供丰富自助餐的大学生宿舍，桌上食物种类繁多，可以左挑右拣。也可能你是一位不那么走运的研究生，工作间的壁橱里只有两盒半空的荞麦食品，所选乏味之极。但无论是哪种情况，你都面临着同样一个问题：你该如何享用你的早餐？这类情况正是随处可见的决策问题的一个例子。不管是作为个人还是群体（如企业和其他组织），我们每天都要面对各种各样的决策问题。此种例子不胜枚举：企业经理需要就是否开展一项新的研发计划做出决策；国会议员需要决定是否投票赞成某项法案；本科生需要选择自己的主修科目；棒球投手想要掷出何种类型的球；再如迷路的驴友们困惑于该朝哪个方向走。这种情况的列表可以无穷无尽。有些决策微不足道，比如你如何选择早餐。举个例子，如果Apple Jacks和Bran Flakes是你的壁橱里仅有的两种荞麦食品，而且如果你不喜欢Bran Flakes（它们属于你的室友），那么你的选择显然会是吃Apple Jacks。与此相比，一名经理是否选择启动一项有风险的研发项目，或者一个立法者对法案的抉择则是一些更加复杂的决策问题。本章将介绍一种分析语言，它可以给出严格的基础以支持博弈中潜在的策略互动这一思想。这种分析语言是比较形式化的，它可以表达各类问题中的决策主体，为我们思考决策问题在结构方式方面提供一套工具。这种分析上的正式性帮助我们澄清思想，磨砺思维。当然，在保持问题更为现实层面的能力和意愿上，这种形式化的努力不能在分析的内核上对之有所冲淡。引入这种形式语言，我们必须就决策者或者参与人的行为给出一套假设。有时候，这些假设似乎接受起来不会遇到什么质疑。不过在另外一些时候，这些假设却不大能为我们所接受，因为它们可能会构成对我们信念的重大挑战。尽管如此，正如我们的分析所将展示的那样，我们还是会由衷的赞叹由这些假设出发而得到的结论其洞察力是何等的敏锐。和任何理论框架一样，我们从中所得到的结论的价值，最多只能和我们在假设上的洞察力一样好。在计算机科学中有一句名言——“垃圾进，垃圾出！”——意思是说，如果进入计算系统的数据有问题，那么最终结果也会有问题。尽管

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案如果图片不显示，用打印预览就可以了。 P127 第一题：领悟精神就可以了，而且每本书上都有这些例题，不找了。第二题： UMD 为参与人1的战略，LMR 为参与人2的战略。前面的数字代表参与人1的得益，后面的代表参与人2的得益。参与人2的R 战略严格优于M 战略，剔除参与人2的M 战略，参与人1的U 战略优于M 战略，剔除参与人1的M 战略，参与人1的U 战略优于D 战略，剔除参与人1的D 战略，参与人2的L 战略优于R 战略，剔除参与人2的R 战略。最后均衡为U ，L （4，3）。这样可能看不清，按照步骤一步步画出图就好多了。第三题：恩爱型厌恶型用划线法解出，恩爱的都活着或者都死，厌恶的或者受罪，死了对方另一个人开心的不得了。第四题：没有人会选择比原来少的钱，战略空间为{原来的钱，比原来多的钱}。支付为{0，原来的钱，比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。第五题：n 个企业，其中的一个方程：π1＝q 1（a －（q 1＋q 2＋q 3……q n ）－c ），其他的类似就可以了，然后求导数，结果为每个值都相等，q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题：在静态的情况下，没有一个企业愿意冒险将定价高于自己的单位成本C ，最终P=C ，利润为0。因为每个参与人都能预测到万一自己的定价高于C ，其他人定价为C 那么自己的利益就是负的（考虑到生产的成本无法回收）。就算两个企业之间有交流也是不可信的，最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争，一定会取得一个P 1=P 2=P 均衡。此时利润不为零，双方将不在进行价格竞争。第七题：设企业的成本相同为C ，企业1的价格为P 1，企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2)，π2=(P 2-C)(a-P 2+P 1)。一阶最优：a-2P 1+C+P 2=0，a-2P 2+C+P 1=0。解得：P 1=P 2=a+C ，π1=π2=a 2。第八题：不会！到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。第十题：无纯战略纳什均衡，设参与人1为P 1～P 4，参与人2为Q 1～Q 4。得到：-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3，推出：Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子，老虎，鸡，虫子中选择一个。

博弈论的经典案例与分析

博弈论的经典案例与分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征： 1. 研究对象的普遍性和应用范围的广泛性人们的行为之间存在相互作用与相互依赖，不同的行为主体及其不同的行为方式所形成的利益冲突与合作，已成为一种普遍现象，这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实，使博弈论的研究内容和应用范围十分广泛，涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域，在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性一是运用数学模型来描述所研究的问题，使博弈论的分析更为精确。二是研究方法具有抽象化的特征，由于博弈论分析大量使用了现代数学，使它所描述和分析的过程及所揭示的结论都带有抽象、一般化的特点。三是博弈论分析方法所体现的模式化特征，博弈论为人们提供了一个统一的分析框架或基本范式，从而使博弈论能够分析和处理其它数学工具难以处理的复杂行为，成为对行为主体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中，不仅要应用现代数学的大量知识，还涉及到经济学、管理学、心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性博弈论中的最佳策略是经济学意义上的最优化，它只回答是什么导致博弈均衡，均衡的结果是什么，所遵循的基本原则是科学结论的客观性和普遍性。从实践上看，博弈论突破了传统的完全竞争、完全信息假定，更加强调决策者的个人理性，强调不完全信息、不完全竞争条件下的经济分析，强调决策个体之间的相互影响和相互作用等外部性，强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致，等等。作为一门方法论科学，除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外，还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说，博弈论方法具有实证的特征，使研究结果更具有真实性。

历史的制度分析：博弈论分析方法

历史的制度分析：博弈论分析方法把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究，目前主要有两种方法。一种是“进化博弈论方法”（evolutionary game approach）。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比，研究人类经济行为中的策略和行为方式的均衡，以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为，社会制度并不是由什么人有意设计出来的，而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入，就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视，主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程，从而在纳什均衡的理性主义解释遇到理论困难时，显示出了通过进化机制实现纳什均衡的可能性。应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”（repeated game approach），它运用更精细的均衡概念，如“子博弈精炼均衡”（subgame perfect equilibrium）来分析历史与现实中的制度选择与变迁过程。其中最具代表性的，就是格瑞夫进行的“历史的比较制度分析”。所谓的重复博弈，实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同，它是由若干个阶段博弈（stage game）构成的一个完整的和相对长期的博弈过程。因此，在重复博弈中，各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益，而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时，他必须考察到其在当前阶段的博弈中所采取的策略，不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说，他不能像在一次性博弈中那样，毫不顾及其他博弈方的利益。有时，一方若作出一种合作姿态，可能会使其他博弈方在随后的阶段中也采取合作态度，从而实现共同的长远利益。这样，在重复博弈中就存在着比一次性博弈更大的合作的可能性，也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征，为它说明人类之间的合作行为，特别是说明历史与现实社会中体制与制度的演变过程，提供了强有力的支持。在历史的比较制度分析那里，制度被定义为本身是“自我实施的对行为的非技术决定的约束” ，即所谓的自我实施制度（self-enforcing institution ）。自我实施制度的一个最基本的特征，就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同，自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此，历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程，也就是制度博弈各方在特定的战略局势中，根据自己不同的目标自主地选择各自的最优策略与对手进行博弈，最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”，恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说，一个子博弈精炼均衡，必须是各博弈方在整个博弈的每个阶段（子博弈）都选择了不愿单独改变的策略（纳什均衡）的最终结果。如果我们从博弈论的角度来观察自我实施制度，就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说，自我实施制度所具有的自发产生和自我实施的基本属性，说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果，也即实现子博弈精炼均衡的结果。更直接地说，自我实施制度的产生，必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说，如果一个制度博弈实现了子博弈精炼均衡的结果，那它也应该是自我实施的。

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论三大经典案例

经典的囚徒困境 1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择： ?若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。 ?若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。 ?若二人都互相检举（互相“背叛”），则二人同样判监2年。用表格概述如下：甲沉默（合作）甲认罪（背叛）乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择： ?若对方沉默、背叛会让我获释，所以会选择背叛。 ?若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工; 前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人都超负荷工作如果某人不听从吩咐，其他人听从吩咐，则此人下岗。其他人继续工作如果所有人都不听从经理吩咐，则经理下岗但是，由于员工之间信息是不透明的，而且，都担心别人听话自己不听话而下岗，所以，大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

论文-博弈论方法在经济学中

经济生活中的博弈论应用摘要：博弈，这个原来只是在学术圈出现的名词，如今已经越来越多地走进了我们的生活。博弈论是运筹学的一个重要分支，其中，非合作博弈（non- cooperative game）是现代博弈理论中的核心内容和重要基础，下面通过对经典案例囚徒困境和智猪博弈的分析，对纳什均衡相关定义的研究，得到了在经济决策中行为人如何决定最优决策的方法。在此基础上，以纳什均衡作为理论支撑点，结合得益矩阵分析解决了经济生活中商家价格战的一些实际问题。关键词：博弈论；均衡点；得益矩阵；纳什均衡

目录一.引言 (3) 二．博弈论与纳什均衡的主要内容 (3) 2.1博弈论的主要思想 (3) 2.2博弈论的分类 (4) 2.3纳什均衡 (4) 2.4 纳什均衡的分类 (4) 三．案例分析 (5) 3.1 囚徒困境（1950年，图克） (5) 3.1.1案例分析 (5) 3.1.2案例应用 (6) 3.2 智猪博弈（1950年，约翰.纳什） (6) 3.1.1 案例分析 (7) 3.1.2 案例应用 (7) 四．价格战博弈 (8)

一.引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）以及冯·诺伊曼（V on·Neumann）。1928年冯·诺伊曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺伊曼和摩根斯坦共同撰写了时代巨著《博弈论与经济行为》并将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学期的基础和理论体系。1950-1951，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，以此为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼等人的研究也对博弈论的发展起到了不小的推动作用。二．博弈论与纳什均衡的主要内容 2.1博弈论的主要思想书上是这样定义的：博弈是指一些个人或者组织面对一定的环境条件，在一定的规则下同时或者先后一次或者多次从各自允许选择的行为或策略中进行选择并加以实施，进而各自取得相应结果的结果。现代科学将这种“对策论”、“对局理论”称之为博弈论，主要研究公式化了的激励结构间的相互作用。从上述定义中可以看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益（得益矩阵）、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4，1 0，0 3，0 0，1 2，2 2，2 纯战略纳什均衡：( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡：( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡：( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡：( R, M ’ ) 子博弈精炼纳什均衡：( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2，2 2，2 3，0 0，1 0，1 3，0 六种纯战略组合，每种组合中都至少有一方存在偏离的动机，因此不存在纯战略纳什均衡，因此也就不存在纯战略精炼贝叶斯均衡。求混合战略精炼贝叶斯均衡：设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下，参与者2选择L ’和R ’的收益无差异，则： 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略，参与者1选择L 、M 、R 的收益无差异，则： 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又联立得所以 L L M L L M L R L

4.3答案（见4.5） 4.4 表示方法第一个括号，逗号左边为type 1发送者信号，逗号右边为type 1发送者信号；第二个括号，逗号左边为接收到L 信号的反应，逗号右边为接收到R 信号的反应； P 为信号接收者对type 1发送L 的推断，q 为信号接收者对type 1发送R 的推断（a ） [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== （b ） [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案（a ） [(,),(,),1/3,1/2]R R u d p q >= （b ） 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

文档之家