当前位置：文档之家› 1.完全信息静态博弈实验指南(2020)

1.完全信息静态博弈实验指南(2020)

西方经济学实验一：完全信息静态博弈实验指南

一、博弈论概述

博弈论(game theory)又被称为“对策论”、“赛局论”。博弈论是研究相互依赖、相互影响的决策主体的理性决策行为及这些决策的均衡结果的理论。

博弈主要包括局中人、行动、信息、战略、支付（效用）、结果和均衡等要素，其中，局中人、战略和支付是描述一个博弈所需的最少要素。局中人、行动和结果统称为“博弈规则”。

（1）依据博弈参与者相互作用时能否达成一个具有约束力的协议，可将博弈分为合作博弈和非合作博弈。如果有具有约束力的协议，就是合作博弈；如果没有，就是非合作博弈。

（2）依据博弈局中人行为的时间序列性，可将博弈分为静态博弈、动态博弈两类。静态博弈是指在博弈中，局中人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，局中人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。

（3）按照局中人对其他局中人的了解程度，可将博弈分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中，每位局中人对其他局中人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果局中人对其他局中人的特征、策略空间及收益函数信息了解得不够准确，或者不是对所有局中人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博理论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈可分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈，其对应的均衡概念和理论研究的代表人物如表1所示。

（1）纳什均衡

纳什均衡（Nash equilibrium）的核心思想是：博弈的理想结局是，每个局中人选择的策略是对其他局中人所选策略的最佳反应，其中每一个局中人都不能因单方面改变自己的策略而获益。

纳什均衡有一个很重要的特点，是可以自我实施的，即信念和选择之间的一致性。就是说，基于信念的选择是合理的，同时支持这个选择的信念也是正确的。如果所有人都认为这个结果会出现，这个结果就真的会出现。

如果局中人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳

（2）混合战略纳什均衡

工人

偷懒不偷懒

老板

监督不监督员工不偷懒、老板不监督是最好的（总收益最大）但如果员工知道老板不监督，员工则偷懒；如果老板知道员工偷懒，老板则监督……形成一个循环。

假如老板认为员工偷懒的概率是P ，不偷懒的概率是1-P ，

从老板的角度看，监督的预期收益是： 1×P+(-1)×(1-P)=2P-1……（1）不监督的预期收益为： (-2)×P+2×(1-P)=1-4P ……（2）令（1）=（2），得P=1/3，这时，员工选择以1/3的概率偷懒，2/3的概率不偷懒，老板监督与不监督，老板的收益一样的。

假如员工认为老板监督的概率为Q ，不监督的概率为1-Q ，

这时，从员工的角度，偷懒的预期收益是： (-1)×Q+3×(1-Q)=3-4Q (3)

不偷懒的预期收益为： 2×Q+2×(1-Q)=2 (4)

要使员工的选择在这两者之间无差异，则令（3）=（4），得Q=1/4；意味着老板以1/4的概率监督，3/4的概率不监督，员工的的收益一样的。

因此，混合战略纳什均衡是：员工以1/3的概率偷懒，2/3的概率不偷懒；老板以1/4的概率监督，3/4的概率不监督。

***纳什均衡的存在性问题：（一般存在奇数个纳什均衡）

1、每一个有限博弈至少存在一个纳什均衡（纯战略或混合战略）；

2、如果一个博弈存在两个纯战略纳什均衡，那么，一定存在第三个混合战略纳什均衡。（3）高风险下的纳什均衡

在一些特殊情况下，即使犯错误的可能性很小也可能导致大的灾难（比如核电站，出问题就非常严重），纳什均衡就可能不会产生有说服力的解释。考虑如下博弈：

乙

甲

上下这个例子说明，个体可能不想我们所假设的那样完全理性，在遇到高风险的情况下，人们会考虑风险，从而使得最终结果可能偏离纳什均衡战略。

（4）占优策略均衡

在一些特殊博弈中，一个局中人的最优策略选择可能并不依赖于其他局中人的策略选择，即无论其他局中人选择什么策略，他的最优策略是唯一的，这种最优策略被称为“占优策略”。该策略只要求行动者是理性的，对手是否理性不作要求。

在一个博弈里，如果所有局中人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的局中人会选择劣策略。

（5）重复剔除占优均衡

“劣”战略：无论对方选择什么，如果自己选择A 得到的收益总是小于选择B 得到的收益，A 就是相对于B 的劣战略。把这个劣战略剔除；然后再剔除剩下的博弈中对手的劣战略；继续这个过程，直到没有劣战略存在。如果剩下

的战略组合是唯一的，这个唯一的战略组合就是“重复剔除占优均衡”。

最初的智猪博弈收益矩阵

首先剔除小猪行动劣策略所得的收

益矩阵为：其次，再剔除了大猪等待劣策略的

智猪博弈均衡

小猪

小猪小猪

大猪行动大猪行动大猪

行动等待等待等待

理性共识：

0阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；

1阶理性共识：每个人是理性的，并且知道其他每个人也都是理性的，但并不知道其他人是否知道自己是理性的；

2阶理性共识：每个人是理性的，并且知道其他每个人也都是理性的，并且知道其他人知道自己是理性的，但不知道其他人是否知道自己知道其他人都是理性的……三阶、四阶……n 阶依次类推。

重复剔除不仅要求每个人是理性的，而且要求每个人知道其他人都是理性的，每个人知道每个人知道每个人是理性的，如此等等，即理性是“共识”。

（1）囚徒困境：

假定有两个犯罪嫌疑人共同作案。警察抓住他们以后，分开拘押，并告诉他们：可以选择坦白，或是不坦白；如果一个人坦白，而另一个人不坦白，则坦白的一方会被立即释放，而不坦白的一方被判10年；如果两人都坦白，则会每人各判8年；如果两人都抵赖，因证据不足，则每人在关押1年后释放。那么，这两个犯罪嫌疑人该如何选择呢？该博弈体现了哪种均衡？

乙

甲

坦白不坦白

我们假设局中人是理性的，都不想坐牢，能少坐牢尽量少坐牢。我们先考虑甲的选择，他面对的问题是：如果乙坦白的话，自己坦白判8年，不坦白判10年，那么坦白比不坦白好；如果乙不坦白，自己坦白会被立即释放，不坦白则判1年，坦白还是比不坦白好。因此，不论对方坦白不坦白，甲或乙自己的最优选择都是坦白。由囚徒困境我们可以看出，一个人的最优选择并不依赖于他人的选择，因此囚徒困境博弈有占优均衡，所以其结果很容易预测。

（2）智猪博弈

假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，谁先按按钮，谁会后到食槽边。而且按按钮的那一方就少吃2个单位的食物（按按钮的成本），若大猪按按钮，那么小猪先到槽边，大小猪吃到食物的收益比是4∶4，如果两只猪同时按按钮，它们同时到槽边，大小猪吃到的食物比是5∶1；如果小猪按按钮，那么大猪先到槽边，大小猪吃到的食物比是9∶-1；当然如果两只猪都选择等待，那么没有食物进入食槽，两只猪的收益比就为0：0。

小猪

行动等待

（3）混合战略纳什均衡

足球队的点球手走向罚球点时需要做一个重要决策：踢向网的左边还是右边（为了简单起见，忽略踢向中间或高球或低平球的选项）。守门员将力图预测点球手的行为，决定扑向左边还是右边。如果他扑向了罚点球的方向，那他很有可能将球扑出；如果他扑错了方向，那点球手就很可能取得进球。再次地，为了简单起见，假定守门员扑的方向正确就一定能扑出点球，不正确就会失球。相应的支付矩阵：

守门员

点球手

左

右

下地通过抛硬币来决定你罚点球的方向。正面朝上就踢向右边，反面朝上就踢向左边；或者反之。

如果某个局中人有n 个纯战略，那么，混合战略就是在这n 个纯战略上的概率分布（p 1,p 2,...,p n ），即以 p i 的概率选择纯战略i

，

=∑=n

i i

。若p i =0，则说明纯战略i 被选到的概率为0。

indifferent ）。

原因在于，如果某个纯战略严格地好于其他纯战略，那么，该局中人应该以1的概率选择那个纯战略，而这与混

概率选择的纯战略差。

原因在于，如果局中人的均衡混合战略中以正概率选择的纯战略比以0概率选择的纯战略差，那么，该局中人的那个所谓均衡混合战略就不是他的最优选择，这与混合战略纳什均衡矛盾。

（2）梅西罚丢点球应该得到原谅！（

3）博弈论的主旨是换位思考。

二、实验目的

通过完全信息静态博弈实验，使学生直接参与博弈游戏并亲身感受“囚徒困境”，从而让学生进一步理解博弈论中的占优战略、纳什均衡等有关概念，并能够应用这些概念分析完全信息静态博弈问题。

三、实验过程

1、实验材料（扑克牌）一副，用作标记实验参与者身份及编号；

2、每位实验参与者有1份“完全信息静态博弈实验者收益记录表”，8轮均有“完全信息静态博弈决策（第X 轮）”；

3、工作人员填写“完全信息静态博弈实验记录表”、“完全信息静态博弈实验数据汇总表”、“完全信息静态博弈实验全班收益汇总表”。

1、抽取4-5人为试验工作人员，保证全班按照偶数原则落实实验参与者。

2、按红、黑扑克牌颜色将实验者分为两组，编号分别为A1、A2、……An；编号分别为B1、B2、……Bn。A组坐教室一边，B组坐教室另一边，中间隔离，方便工作人员收发扑克牌。

3、按照特定牌落实工作人员。

1、在博弈过程中不允许合谋、欺诈欺骗等行为发生，出牌前不能让对方任何人看到自己的决策；

2、每个实验者都以追求最大收益为目标；

3、每位实验参与者在每轮博弈中仅可做出“红”或“黑”的选择。

4、本实验分两个阶段共8轮实验，每轮实验流程相同。首先，AB两组工作人员随机发牌，每位实验参与者需要确定自己的牌和身份编号。分发“完全信息静态博弈实验者收益记录表”，每位实验参与者填写相关信息。其次，AB两组工作人员分发“完全信息静态博弈决策”，每位实验参与者填写“完全信息静态博弈决策”，并在“完全信息静态博弈实验者收益记录表”中记录“我的牌”、“我的编号”、“我的决策”。将填写好的“完全信息静态博弈决策”交给本组的工作人员。第三，AB组工作人员清点“完全信息静态博弈决策”无误后，交给统计人员。第四，AB组工作人员回收扑克牌，洗牌，等待“本轮实验结束，开始下一轮实验”指令。

5、教师公布配对博弈规则，工作人员记录每轮每对实验参与者的决策结果，填写每一轮的“完全信息静态博弈实验记录表”。记录完毕以后，向全体实验参与者宣读配对结果，全体实验参与者自行计算本轮个人收益，并将结果填入“完全信息静态博弈实验者收益记录表”。8轮实验结束后，实验参与者完成“完全信息静态博弈实验者收益记录表”，并交到各自组工作人员。AB组工作人员清点无误后，交给统计人员。

6、工作人员应及时汇总、计算实验数据，完成“完全信息静态博弈实验数据汇总表”和“完全信息静态博弈实验全班收益汇总表”，并予以发布。

4、工作人员须保存好A、B组工作人员移交上来的所有实验表格，以备汇总统计和查询之用。

5、实验参与者的收益为8轮实验个人收益总和。A、B组工作人员和统计人员收益数值为全班平均收益。

7、实验分为两个阶段，第一阶段进行1-4轮博弈, 收益计算如下：

(1)两人同时出红牌，则两人都将获得5元收益；

(2)两人同时出黑牌，则两人都将获得6元收益；

(3)两人出牌花色不同时，出红的同学获得11元收益，出黑的同学获得0元收益。

第二阶段共进行博弈5-8轮，收益计算如下：

(1)两人同时出红牌，则两人都将获得5元收益；

(2)两人同时出黑牌，则两人都将获得11元收益；

(3)两人出牌花色不同时，出红的同学获得16元收益，出黑的同学获得0元收益。

四、实验表格小样

1、

完全信息静态博弈决策（第X轮）

2、

完全信息静态博弈实验者收益记录表

1、

2、

完全信息静态博弈实验数据汇总表班级：日期：

注：理论最高收益是指一对实验参与者收益最高的均衡，即两个实验参与者“黑-黑”策略组合的收益之和。

3、

完全信息静态博弈实验全班收益汇总表

班级：日期：

五、实验结果讨论和实验报告填写

1、各组根据工作人员发布的实验数据汇总表，进行数据分析和说明。

2、回答实验指南问题：

（1）前四轮实验中同学们选择最多的策略是什么，为什么？

（2）前四轮实验选择黑牌的理由是什么？

（3）后四轮实验和前四轮实验中选择策略组合是否有变化，为什么？

3、回答实验报告册问题。

六、写作完成实验报告，制作小组报告PPT，并在下次课堂发布。

第二章完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论 0．完全信息（complete information）博弈与不完全信息（incomplete information）博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识；只要有一个参与人的支付函数不是该博弈的公共知识，就意味着该博弈是不完全信息博弈。特别提示：如果该博弈是完全信息博弈，这意味着参与人不仅知道自己是什么类型的人，也知道对手们是什么类型的人。一．求解方法之一：剔除严格劣策略 1.占优策略与劣策略。严格占优策略与严格劣策略：不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于b策略，则称a策略是相对于b策略的严格占优策略（strictly dominating strategy），b策略是相对于a策略的严格劣策略（strictly dominated strategy）。弱占优策略与弱劣策略：不管对手采取什么策略，如果参与人采取a策略所获得的支付不低于b策略，且至少有一种情况下的支付会严格大于b策略，则称b策略是相对于a策略的弱劣策略（weakly dominated strategy ）；a策略则是相对于b策略的弱占优策略（weakly dominating strategy）。占优策略就是我们平时所说的上策，劣策略就是我们平时所说的下策。特别提示：本文对占优策略的理解与其他教材不同，本文可以将以上述方式定义出来的占优策略称为局部占优策略；如果不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于其他所有策略，则称a策略是全局严格占优策略。类似地，可以定义局部劣策略与全局劣策略。理性的人在博弈时绝对不会选择严格劣策略。通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。 2.案例案例1 乙甲坦白不坦白

1.完全信息静态博弈实验指南(2020)

西方经济学实验一：完全信息静态博弈实验指南一、博弈论概述博弈论(game theory)又被称为“对策论”、“赛局论”。博弈论是研究相互依赖、相互影响的决策主体的理性决策行为及这些决策的均衡结果的理论。博弈主要包括局中人、行动、信息、战略、支付（效用）、结果和均衡等要素，其中，局中人、战略和支付是描述一个博弈所需的最少要素。局中人、行动和结果统称为“博弈规则”。（1）依据博弈参与者相互作用时能否达成一个具有约束力的协议，可将博弈分为合作博弈和非合作博弈。如果有具有约束力的协议，就是合作博弈；如果没有，就是非合作博弈。（2）依据博弈局中人行为的时间序列性，可将博弈分为静态博弈、动态博弈两类。静态博弈是指在博弈中，局中人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，局中人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。（3）按照局中人对其他局中人的了解程度，可将博弈分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中，每位局中人对其他局中人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果局中人对其他局中人的特征、策略空间及收益函数信息了解得不够准确，或者不是对所有局中人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博理论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈可分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈，其对应的均衡概念和理论研究的代表人物如表1所示。（1）纳什均衡纳什均衡（Nash equilibrium）的核心思想是：博弈的理想结局是，每个局中人选择的策略是对其他局中人所选策略的最佳反应，其中每一个局中人都不能因单方面改变自己的策略而获益。纳什均衡有一个很重要的特点，是可以自我实施的，即信念和选择之间的一致性。就是说，基于信念的选择是合理的，同时支持这个选择的信念也是正确的。如果所有人都认为这个结果会出现，这个结果就真的会出现。如果局中人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳

完全信息静态博弈及其纳什均衡解

1 第四章完全信息动态博弈及其均衡解 1.完全且完美信息动态博弈完全信息博弈指的是参与者的收益是共同知识。完全且完美信息动态博弈指的是：博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。因此，我完全且完美信息动态博弈的特点：（1）行动是顺序发生的；（2）下一步行动选择之前所有以前的行动都可以被观察到；（3）每一可能的行动组合下的参与人的收益都是公共知识。而不完美信息博弈指的是，在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。例4.1．我们来考虑这样一个动态博弈: 假定甲在开采一个价值4万元的金矿时需要1万元资金，乙有1万元资金。甲向乙借钱来开金矿。在这个博弈的第一阶段，甲向乙承诺: 如果乙借钱给他的话，那么他就会将采到的金子与乙对半分成，即(2，3)——乙得到2万元的金子，同时收回自己的1万元投资。对于甲的承诺，乙如果不借钱给甲的话，那么博弈到此为止，双方收益为(0，1)。如果乙借钱给甲的话，那么博弈进入第二个阶段。在第二阶段中，若甲遵守他的承诺，分给乙一半的金子，这样两人的收益为(2，3)，其中1万元为投资成本。〖JP3〗然而，若甲违背自己的承诺，博弈就会进入到第三个阶段: 如果乙同甲打官司，那么由于打官司费时费力，两个人的收益为(0，1)；若乙不打官司，那么两个人的收益就为(5，0)。参见图1。乙借不借甲分不分（0，1）乙乙（2，3）打官司不打官司（1，2）（5，0）图1. 借钱博弈的博弈树 2.逆向归纳法与子博弈纳什均衡解逆向归纳法（Backward induction ）又称逆推法，是指这样一种动态博弈求解方法：从博弈的最后一步开始，计算最后一步的参与人的最优行动，逐步逆推到博弈开始时进行第一步的参与人的最优行动，从而确定每个参与人的最优行动。在动态博弈中逆向归纳法能够进行的前提：参与人是理性的——任何一步参与人都选择甲乙

不完全信息下的静态博弈习题

非完全信息静态博弈习题 1、考虑下面的Cournot 双头垄断模型。市场的反需求函数为Q a Q p -=)(，其中21q q Q +=为市场总产量，两个企业的总成本都为()i i i cq q c =，但需求却不确定：分别以θ的概率为高（H a a =）,以θ-1的概率为低（L a a =）,此外，信息也是非对称的：企业1知道需求是高还是低，但企业2不知道，所有这些都是共同知识，两企业同时进行决策。要求：假定H a 、L a 、θ和c 的取值范围使得所有均衡产出都是正数，试问此博弈的贝叶斯纳什均衡是什么？解：在市场需求为高时，企业1的最优战略为： ()H H H q c q q a Max 121?--- 由一阶条件可以推出2 21c q a q H H --= (1) 在市场需求为低时，企业1的最优战略为： ()L L L q c q q a Max 121?--- 由一阶条件可以推出2 21c q a q L L --= (2) 企业2的最优战略为 ()()(){}2212211q c q q a q c q q a Max L L H H ----+---θθ 由一阶条件可得： ()()()211*2c q a q a q L L H H ---+=-θθ (3) 方程(1)、(2)和(3)联立可得： ()()()()6 21311*1c q a q a q L L H H H ------=θθ ()6 22*1c a a q H L L --+=θθ ()31*2c a a q H L -+-=θθ 由此可知，企业1的战略()*1*1,L H q q 和企业2的战略* 2q 构成贝叶斯纳什均衡。

几个博弈案例

几个博弈案例 1.囚徒困境警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；果两人都坦白认罪，则他们将被各判8年监禁。问：两个罪犯会如何选择（坦白还是抵赖）？ 2.智猪博弈（占优战略均衡）猪圈里有一头大猪，一头小猪。猪圈的边缘有个踏板，每踩一下，远离踏板的投食口就会落下少量食物。如果是小猪踩踏板，大猪会在小猪跑到食槽之前吃光所有食物；若是大猪踩踏板，则小猪还有机会吃到一点残羹冷炙，因为小猪食量小嘛。那么，两头猪会采取什么策略呢？答案是：小猪将安安心心地等在食槽边，而大猪则不知疲倦地奔忙于踏板和食槽之间。办公室里也会出现这样的场景：有人做“小猪”，舒舒服服地躲起来偷懒；有人做“大猪”，疲于奔命，吃力不讨好。但不管怎么样，“小猪”笃定一件事：大家是一个团队，就是有责罚，也是落在团队身上，所以总会有“大猪”悲壮地跳出来完成任务。想一想，你在办公室里扮演的角色，是“大猪”，还是“小猪”？(其实小猪的决策是明智的，想想同一个公司，小股东和大股东的行为。) 3.性别之争（多重纳什均衡） “有一对夫妻，丈夫喜欢看足球赛节目，妻子喜欢看肥皂剧节目，但是家里只有一台电视，于是就产生了争夺频道的矛盾。假设双方都同意看足球赛，则丈夫可得到2单位效用，妻子得到一单位效用；如果都同意看肥皂剧，则丈夫可得到1单位效用，妻子得到2单位效用；如果双方意见不一致，结果只好大家都不看，各自只能得到0单位效用。这个博弈的策略式表达如下：

不完全信息静态博弈案例扶老人林志涵

让道德与理性同行 ——不完全信息静态博弈案例分析 2012333501054 林志涵 12经济学1班摘要：通过简单的博弈论分析方法对日常生活中具有现实意义的社会现象进行分析，从而在理性人假设的前提下，在各种因素的影响下，在个人取得利益最大化的同时，通过政策或法律的有效实施来使得道德能得到发扬提倡。关键词：不完全信息静态博弈社会现象道德与理性不完全信息静态博弈在不完全信息静态博弈里，参与人并不完全清楚有关博弈的一些信息，所有参与人在共同决策环境中同时选择行动策略，每个参与人只选择一次。纳什均衡，在给定的其他参与人选择的前提下，参与人根据自身收益选择的最优战略。 1.背景： “除非有人证物证，否则我不会再去扶跌倒的老人！”广东肇庆的阿华在扶起倒地的70多岁阿婆却遭诬陷后表示。事发7月15日早上，阿华开摩托车上行人道准备买早餐,看到路边有位老太太跌倒在求救，阿华立刻停下来，扶起老奶奶，殊不知却遭到阿婆的诬陷，随后和阿婆的女婿发生争执。阿婆被送到医院住院观察。为调查真相，交警暂扣了阿华的摩托车。事发后几天，阿华说没睡过一次好觉，还向单位请了几天假，天天在附近找证人，就是为了证实自己清白。这一案件的真想不言而喻，老婆婆家人蛮不讲理地要求赔偿和阿华地好心搀扶倒地老婆婆形成了鲜明的对比，好心被当驴肝肺的事情就这么真真实实的发生在了我们的身边，社会风气遇到了极大的挑战，这引发了社会各界针对这一事件的激烈讨论。到底该不该扶？本文将在经济人假设的前提下，通过不完全信息静态博弈的思想进行分析阐述，并探讨我们如何通过一系列客观因素的影响，来使得利益与道德同行。 2.博弈的假设与建模：假设： ①参与博弈的双方是理性人，都会选择个人利益最大化的行动。 ②假设阿婆在未有人搀扶时便决定是否坑钱，而路人并不知道阿婆是否会坑钱，即参与人在决策时不知道对方的策略同时也并不知道对方能够的收益函数。 ③假定当事人双方最终解决方法由交警决定，当事人将面临交警正确处理和错误处理两种。参与人：阿婆、路人行动选择：路人——帮忙扶起、不帮忙扶起阿婆——被扶起后坑钱、不坑钱 3.支付收益： 1)在不考虑交警是否正确判断因素下，阿婆倒地没人扶会有-10的身体伤害，在阿婆不坑钱的情况下仍然没有人扶会多产生负收益-10的心灵损失（路人不知道阿婆是否坑钱）；路人选择帮忙且阿婆不坑钱会产生10

完全信息静态博弈

博弈论第二章练习 8.设股诺模型中有n家厂商，qi为厂商i的产量，Q=q1+……+qn为市场总产量。P为市场出清价格，且已知P=P(Q)=a-Q（当Qa+ C1,则纳什均衡产量又为多少？答：当情形变为两个厂商，则利润分别为 u1=Pq1-c1q1=(a-q1-q2)q1-c1q1 u2=Pq2-c2q2=(a-q1-q2)q2-c2q2 对q求导并令其为0得 a-q1-c1-2q1=0 a-q2-c2-2q2=0 反应函数为q1=(a-q2-c1)/2 q2=(a-q1-c2)/2 若0a+c1时，q2<0,厂商1垄断了市场，此时纳什均衡产量为q1=q*=(a-c1)/2 思考题：卡特尔能够持久存在吗？为什么石油输出国组织能长期维持？答：（1）我认为卡特尔不能持久存在。因为有两个因素导致了卡特尔具有天然的不稳定性：第一，潜在进入者的威胁：一旦卡特尔把价格维持得较高水平，那么就会吸引新企业进入这个市场，而新企业进入后，可以通过降价扩大市场份额，此时卡特尔要想继续维持原来的高价就很不容易了。第二，卡特尔内部成员所具有的欺骗动机：这是一个典型的“囚徒困境”，给定其他企业的生产数量和价格都不变，那么一个成员企业偷偷地增加产量将会获得额外的巨大好处，这会激励成员企业偷偷增加产量，如果每个成员企业都偷偷增加产量，显然市场总供给大量增加，市场价格必然下降，卡特尔限产提价的努力将瓦解。如果卡特尔不能有效解决这个问题，最终将导致卡特尔的解体。事实上，经济学家研究得出，世界上卡特尔的平均存续期间约为6.6年，最短的两年就瓦解了此外，随着各国政府反垄断法的实施，卡特尔也可能因为违反了政府法

不完全信息静态博弈

第八章不完全信息静态博弈这一章里我们讨论不完全信息静态博弈，也称为贝叶斯博弈(Bayes)。不完全信息博弈中，至少有一个参与者不能确定另一参与者的收益函数。非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction)：每一报价方知道自己对所售商品的估价，但不知道任何其他报价方对商品的估价；各方的报价放在密封的信封里上交，从而参与者的行动可以被看作是同时的。静态贝叶斯博弈问题的主要来源也是现实经济活动，许多静态博弈关系都有不完全信息的特征，研究贝叶斯博弈不仅是完善博弈理论的需要，也是解决实际问题的需要。 8.1 静态贝叶斯博弈和贝叶斯纳什均衡为了更好的说明不完全信息与完全信息之间的差异，我们用一个典型静态贝叶斯博弈作为例子，自然的引进静态贝叶斯博弈概念。 8.1.1不完全信息古诺模型考虑如下两寡头进行同时决策的产量竞争模型。其中市场反需求函数由Q a Q P -=)(给出，这里21q q Q +=为市场中的总产量。企业1的成本函数为1111)(q c q C =，不过企业2的成本函数以θ的概率为222)(q c q C H =，以θ-1的概率为222)(q c q C L =，这里H L c c <。并且信息是不对称的：企业2知道自己的成本函数和企业1的成本函数，企业1知道自己的成本函数，但却只知道企业2边际成本为高的概率是θ，边际成本为低的概率是 θ-1(企业2可能是新进入这一行业的企业，也可能刚刚发明一项新的生产技术)。上述一切都是共同知识：企业1知道企业2享有信息优势，企业2知道企业1知道自己的信息优势，如此等等。现在我们来分析这个静态贝叶斯博弈。一般情况下，企业2的边际成本较高时选择较低的产量，边际成本较低时，选择较高的产量。企业1从自己的角度，会预测到企业2根据其成本情况将选择不同的产量。设企业1的最佳产量选择为*1q ，企业2 边际成本为H c 时的最佳产量选择为)(*2H c q ，企业2 边际成本为L c 时的最佳产量选择为)(* 2L c q ，如果企业2的成本较高，它会选择)(*2H c q 满足： 22*1])[(max 2q c q q a H q --- 类似地，如果企业2的成本较低，)(*2L c q 应满足： 22*1])[(max 2q c q q a L q --- 从而，企业l 为了使利润最大化，选择*1q 应满足： }])()[(1(])([(max {11*2111*212q c c q q a q c c q q a L H q ----+---θθ 三个最优化问题的一阶条件为： 2)( ,2)(*1*2*1* 2L L H H c q a c q c q a c q --=--=

完全信息静态博弈例子(作业)

例1：完全信息静态博弈在银行监管中的应用一、完全信息静态博弈模型的建立 (一)博弈的参与人商业银行(监管对象)作为理性经济人,其行为动机是部门、个人利益最大化。但由于在管理体制、经营方式、技术手段、人员素质、资产质量与外资银行之间存在差距,其经营难度和盈利能力都会受到不利的冲击。在遵循一定条件下的预期效用最大化的原则下,商业银行有足够的动力进行违规操作,例如私自变动利率或进行不符合政策的违规金融创新,借以获得竞争优势,实现最大化效用。银监会作为监管者,通过行使行政管理、现场检查、非现场检查以及违规处罚等监管权力,对商业银行的市场准入和退出,日常业务营运等进行指导、监督、管理。而在目前市场经济没有完善的条件下,无论是现场检查还是非现场检查,都存在监管工作量大,连续性强的特点。因此,实行严格监管策略有着较高的成本:监管费用增加,监管机构“暗箱”操作增长,创造经济租金使商业银行寻租行为增多,商业银行内部创新能力削弱等等。监管成本的增加可能会超过市场交易成本。 (二)博弈的假设前提 (1)银监会的策略空间为严格监管和宽松监管;(2)银监会在进行严格监管工作时,有成本支出。当商业银行违规经营时,可采用罚款、取消高级人员资格等措施。但在商业银行合规经营时,银监会宽松监管会带来收益;(3)商业银行的策略空间是违规经营和合规经营;(4)商业银行合规经营时,无论监管者监管与否,商业银行都将得到自己的正常收益;(5)商业银行违规经营的期望收益是违规所得,其在违规经营中将获得超额利润,但在银监会严格监管的条件下也将付出成本。注:R1、R2分别是银监会宽松监管,商业银行合规经营的正常收益。A为银监会采取监管措施所花费的成本;B为银监会在商业银行违规经营情况下,采取宽松监管所遭受的损失;C 为商业银行在违规经营条件下受到严格监管所造成的损失;M为银监会采取宽松监管,商业银行违规经营所获得的超额收益。其中A,B,C都与M成正相关。P为银监会严格监管的概率,1-p 是银监会宽松监管的概率;q是商业银行合规经营的概率,1-q是商业银行违规经营的概率。二、博弈模型的分析当商业银行合规经营时,银监会宽松监管的收益大于严格监管的收益,所以其最优选择是采取宽松监管;当商业银行违规经营时,银监会是采取严格监管还是宽松监管主要取决于A与B的比较。当A>B时,银监会采取宽松监管,商业银行的最优选择则是违规经营;当AB时,不管M与C的大小如何,银监会与商业银行之间存在纯策略纳什均衡(宽松监管,违规经营)。其含义为:银监会采取严格监管措施付出的成本大于商业银行违规经营对其造成的损失

文档之家

1.完全信息静态博弈实验指南(2020)

第二章 完全信息静态博弈的基本理论

1.完全信息静态博弈实验指南(2020)

完全信息静态博弈及其纳什均衡解

不完全信息下的静态博弈习题

几个博弈案例

不完全信息静态博弈案例 扶老人 林志涵

完全信息静态博弈

不完全信息静态博弈

完全信息静态博弈例子(作业)

第二章完全信息静态博弈的基本理论

不完全信息静态博弈案例扶老人林志涵