博弈论基础讲义-第四章

格式：pdf
大小：293.27 KB
文档页数：61

下载文档原格式

经典博弈论普及课件

Q
1
我们通过记 b 和式；即，从这个观点出发我们将使用的逆需求函数为 P=a–bQ
a
来简化这个（逆）需求曲线的表达
假设每家公司的成本函数相同，并且每单元成本不随生产的单元数变化。更正规一些，每家公司具有常数边际成本函数；生产数量Qi的成本为cQi，其中c > 0是常数边际成本， i = 1，2。
每家公司的生产数量
价格
每家公司的利润
(a c) 8b
2
ac 4b
ac 2
注意到如果公司如卡特尔那样经营，它们比起在纳什均衡里的产量生产得少一些；卡特尔的产量是古诺特-纳什均衡产量水平的75%。在纳什均衡中，两家公司比起它们象卡特尔那样经营来利润较低（因为在纳什均衡里，它们过度地生产）。
卡特尔解
作为对比，如果两个公司如卡特尔那样地运作，即，如果它们对于它们的生产决策进行协调，我们来计算它们将生产的产量，如果公司经营为卡特尔，可以合理地假设它们以最大化它们的联合利润——或总利润这样的方式来设置生产目标。预先指定生产“配额”为Q1与Q2；它们的选择是使得总利润最大化：
MaxQ1 ,Q2 [a b(Q1 Q2 ) c][Q1 Q2 ]
0，8 0，8
低（L）
8，0
8，0
4，4
案例研究：动物王国中的纳什均衡
荒漠蜘蛛的故事，雌蜘蛛在网里产卵，由于这样的网很难搭建，因此，网是稀少的。生物学家看到雌蜘蛛经常为已有的蜘蛛网争斗——或者几乎是争斗；两只雌性并排在网前，并且作出诸如猛烈地摇晃网这样的威胁姿态（虽然它们很少有真正的肉体接触），当一只蜘蛛撤退而留下另一只单独地占有蜘蛛网时，冲突就得到了解决。生物学家试图解释有关动物争斗的两个特定程式的事实： 1. 多数冲突无需战斗而得到解决。此外，冲突的胜利者常常从失败者那儿“以不同的方式获得”某种维持生命必需的东西。。

博弈论课件第四章

3
合作博弈
参与者之间可以合作并制定共同策略，追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念，指的是当参与者根据对手的选择来选择自己的策略时，不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等概率性决策中，以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零，一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作，每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科，第四章将介绍博弈论的基本概念、应用领域、主要模型以及纳什均衡理论和混合策略的应用，同时提供实际应用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多次对局中，通过随机选择策略以增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注决策，以提高筹码的价值和战略性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略

博弈论第四章

（1）起始结是一个单结的信息结;
（2）子博弈保留了原博弈的所有结构。则称它为原博弈的一个子博弈（子博弈）。
按照博弈树的延伸的时序，或者按照博弈树生长的时序，我们用一个扁椭圆形的虚线的圈，把所论局中人在同一个时点的若
干决策节点罩起来，成为他的一个信息集。
（1）起始结是一个单结的信息结
x1
L L 1 2 S L 2 S （1，1）（2，2） 1 （-1，-1）（-1，-1） S 2 L L S （2，2）
镇上能卖6000元；但如果另一家商铺同时在小镇上卖
鞭炮，价格下跌使得这批鞭炮只能卖4000元。纳什均
衡是什么？
• 假设甲先行动，商铺乙看到对方的选择后再决定是否
进货，子博弈精炼纳什均衡是什么？
如果甲先行动，但在博弈开始前商铺主乙有一次行动A 的机会，利用子博弈精炼均衡概念分析下述两种情况下
的博弈结果：何行动他都不会改变这个决定；
一颗大树表示一个博弈，一颗小树同样可以表示
一个博弈。如果小树是大树的一颗子树，并且
小树表示的博弈不破坏大树表示的博弈的结构，
那么小树表示的博弈，就叫做大树表示的博弈
的子博弈。
一、子博弈（sub-game）
子博弈定义：在一个扩展型博弈中，如果一个博弈由它的一个决策结及其所有后续结构成，并满足:
信息集的时候，面临决策的局中人对于博弈迄今的历史是
不清楚的，他不清楚博弈具体走到了他的这个信息集里面的哪个决策节点。
在市场进入博弈中，包含3个子博弈（包括原博弈）。而在囚徒博弈中，只有一个子博弈(?)
收益： A
B 容忍
进入抵抗 A 不进入 B
B
抵赖
B 抵赖
-1 ，-1 -9 ，0 0 ，-9

博弈论讲义完整PPT课件

• 两个寡头企业选择产量的博弈：
如果两个企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多的利润。给定对方遵守协议的情况下，每个企业都想增加产量，结果是，每个企业都只得到纳什均衡产量的利润，它严格小于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章导论-囚徒困境
知识：完全信息博弈和不完全信息博弈。 ❖完全信息：每一个参与人对所有其他参与人的（对手）的特征、
战略空间及支付函数有准确的知识，否则为不完全信息。
第33页/共293页
第一章导论-基本概念
• 博弈的划分：
行动顺序信息
完全信息
静态
完全信息静态博弈纳什均衡
纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
0，300 0，300
纳什均衡：进入，默许；不进入，斗争
第29页/共293页
第一章导论
• 人生是永不停歇的博弈过程，博弈意略达到合意的结果。 • 作为博弈者，最佳策略是最大限度地利用游戏规则，最
大化自己的利益； • 作为社会最佳策略，是通过规则使社会整体福利增加。
第30页/共293页
第一章导论-基本概念
一只河蚌正张开壳晒太阳，不料，飞来了一只鸟，张嘴去啄他的肉，河蚌连忙合起两张壳，紧紧钳住鸟的嘴巴，鸟说：“今天不下雨，明天不下雨，就会有死蚌肉。” 河蚌说：“今天不放你，明天不放你，就会有死鸟。”谁也不肯松口，有一个渔夫看见了，便过来把他们一起捉走了。
第17页/共293页
第一章导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”？
第20页/共293页

博弈论讲义004

重复博弈的策略、子博弈和均衡路径
(1) 重复博弈的策略。在动态博弈中，博弈方的一个策略是指每一次轮到其选择时针对每种可能情况如何选择的计划。由于重复博弈中每个博弈方在每个阶段都必须进行策略选择，因此博弈方的一个策略就是在每次重复时, 针对其前面阶段所有可能的情况如何进行行动的计划。
(2) 重复博弈的子博弈重复博弈是动态博弈，因此也有阶段子博弈的概念。我们已经知道子博弈是全部博弈的一部分，当全部博弈进行到任何一个阶段，到此为止的进行过程已成为各博弈方的共同知识，其后尚未开始的博弈部分就是一个子博弈。重复博弈的子博弈就是从某个阶段（除第一阶段以外）开始，包括此后所有阶段的重复博弈部分。重复博弈的子博弈要么仍然是重复博弈，只是重复的次数较少，要么就是原博弈。定义：在有限次重复博弈G（T）中，由第t+1阶段开始的一个子博弈为G进行T-t次的重复博弈。在无限重复博弈G （∞,δ）中，由第t+1阶段开始每个子博弈都等同于初始博弈G（∞,δ）。
2
终于有一天，有一位女士问他：难道你不知道 10块钱比1块钱更多一些钱吗？他如此回答道：如果我有一次选择了10块钱，就不会有人来找我让我在1块钱与10块钱之间选择了，我也讨不到钱了。
3
第一节重复博弈基本概念
一次动态博弈也称为“序贯博弈”。重复博弈：指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。如囚徒困境。重复博弈的特征： 1、阶段博弈之间没有“物质上”的联系，即前一阶段的博弈不改变后一阶段的结构； 2、所有参与人都观测到博弈过去的历史； 3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。贴现因子：下一期的一单位支付在这一期的价值。注意：在每个阶段，参与人可同时行动，也可不同时行动。

经济博弈论4

现值为：
4.51 2 4.5
1
如果厂商2偏离上述触发策略，则他在第一阶段
所选产量应为给定厂商1产量为1.5时，自己的最大利
润产量，即满足：
max8 1.5 q q 2q max4.5 q q
q2
2
2
2
q2
2
2
解得 q 2.25 ，此时利润为5.0625，高于触 2
发策略第一阶段得益4.5。
对任意博弈方i都成立，而足够接近1，那么无限
厂商2
次重复博弈G(, )中一定存在一个子博弈完美纳
得益
(5,0) 什均衡，各博弈方的平均得益为(x1 , (1,4)
, xn )
(3,3)
(1,1)
(4,1) (5,0)
厂商1得益
4.3.3 无限次重复古诺模型
假定：P 8 Q,其中Q q q ，边际成本都为2。
1
2
在无限次重复古诺模型中，当贴现率满足一
定条件时，两厂商采用下列触发策略构成一个子博弈
完美纳什均衡：
在第一阶段生产垄断产量的一半1.5；在第 t 阶段，如果前 t-1 阶段结果都是(1.5,1.5)，则继续生产1.5，否则生产古诺产量2。
设厂商1已采用该触发策略，若厂商2也采用该触
发策略，则每期得益4.5，无限次重复博弈总得益的
4.2.4 有限次重复博弈的民间定理
个体理性得益：不管其它博弈方的行为如何，一博弈方在某个博弈中只要自己采取某种特定的策略，最低限度保证能获得的得益
可实现得益：博弈中所有纯策略组合得益的加权平均数组定理：设原博弈的一次性博弈有均衡得益数组优于w，那么
在该博弈的多次重复中所有不小于个体理性得益的可实现得益，都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们

博弈论前四章笔记整理

博弈论前四章笔记整理第一章：博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下，多个参与者（至少两个）进行策略选择并得到相应结果（收益）的过程。

- 要素包括参与者（局中人）、策略（每个参与者可选择的行动方案）、收益（每个参与者在不同策略组合下的所得）。

例如在“囚徒困境”中，两个囚犯是参与者，坦白或不坦白是他们的策略，不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈（正面或反面两种策略），企业的产量竞争（产量可在一定范围内连续取值）可能是无限博弈。

- 按收益情况分为零和博弈（一方的收益就是另一方的损失，总和为零，如赌博）、常和博弈（收益总和为常数）和非零和博弈（收益总和不为零，如企业合作共同开拓市场，双方都可能获利）。

第二章：完全信息静态博弈。

- 策略式表述（标准式表述）- 通常用一个矩阵来表示，行代表一个参与者的策略，列代表另一个参与者的策略，矩阵中的元素是对应的收益组合。

以“性别战”为例，丈夫和妻子选择看电影或看球赛，就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略，该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略，那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中，每个囚徒的占优策略都是坦白，所以（坦白，坦白）是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中，每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略，没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同，纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中，（看电影，看电影）和（看球赛，看球赛）都是纳什均衡。

第三章：完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建，节点表示参与者的决策点，树枝表示可选择的策略，终端节点表示博弈的结果并标有相应的收益。

博弈论课件4重复博弈

5 1 1 2 5
如果博弈方2采用H，总得益现值为：
1
V 4 V
因此当 1/ 4时，此触发策略纳什均衡策略。
4.3.2 惟一纯策略纳什均衡的无限次重复博弈
无限次重复博弈民间定理（弗里德曼，1971）
设G是一个完全信息的静态博弈，用(e1, , en )记G的纳什均衡得益，
用(x , 1
重复囚徒困境悖论和连锁店悖论
☻理论和实践的直觉矛盾，现实中寡头之间的价格战问题并不十分普遍，重复次数较大的实验研究的结果（重复200 次的囚徒困境）
☻泽尔腾(1978)，“连锁店悖论” （导论中的先来后到博弈），实际中对开头几个市场的进入者不计代价的打击
☻问题的症结与蜈蚣博弈类似，在于在较多阶段的动态博弈中逆推归纳法的适用性T t1t 1t1 2 23
t1
t 1
t
4.1.2 基本概念
平均得益：如果一常数作为重复博弈（有限次重复博弈或
无限次重复博弈）各个阶段的得益，能产生与得益序列
1， 2,相同的现在值，则称为1， 2,的平均得益
无限次重复博弈时
2 (1 )
1 2 23
4.2.3 多个纯策略纳什均衡的有限次重复博弈
三价博弈的两次重复博弈
+1
厂H 商M
1L
H
5，5 6，0 2，0
厂商2
M 0，6 3，3 2，0
L
0，2 0，2 1，1
+3
厂H 商M 1L
H
8，8 7，1 3，1
厂商2 M
1，7 4，4 3，1
L
1，3 1，3 2，2
三价博弈
两次重复三价博弈的等价博弈
有限次重复博弈民间定理

博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；
• 相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人的得益。
供万无一失的应对办法。
学习交流PPT
5
例1：无谓竞争（The GPA Rat Race）
• 你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40 ％的人能得良好。
• 所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
• 某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。
• 没有某个这样的暗示，默契的合作就完全不可能。
学习交流PPT
9
例3：为什么教授如此苛刻？
• 许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
• 教授们为何如此苛刻？
• 如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。
• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。

博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t，但知道t的概率分布。

博弈的时序：（1）参与人1选择行动a1∈A1;（2）参与人2观察a1，选择a2∈A2博弈的收益：u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2，10，0参与人 1 M0, 20，1R1, 31, 3纯战略纳什均衡: (L，L'), (R，R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡：要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下，博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间：{ t1，t2，t3，t4 }行动空间：A= { L，R}推断p i: 观察到L后，参与人1的类型是t i的概率。

推断q i: 观察到R后，参与人1的类型是t i的概率。

p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略： t 1选 L ，t 2选 L ， t 3选R ，t 4 选R 。

参与人2对p i 与 q i 的推断：p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。

第四篇博弈论PPT课件

• 此情况下由于博弈没有可预测的明确的博弈结果，所以就不能确定博弈方的策略。但是是否在这样的博弈中，各博弈方选择任何策略都是一样的，因此可以随意选择吗？
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) （严格竞争博弈）
（麻将、赌博、猜硬币）
• 常和博弈 (Constant-sum Games)
博弈）
（固定数量利润、财产分配的讨价还价
• 变和博弈（Variable-sum Games) (囚徒困境博弈、古诺模型）
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果： -5）
（坦白，坦白）——（-5，
• 集体理性决策的结果： -1）
（抵赖，抵赖）——（-1，
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型：价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬正面币反面方
猜硬币方
正面
反面
-1，1
• 博弈论是系统研究各种博弈问题，寻求博弈方合理的策略选择和合理选择策略时的博弈结果，并分析结果的经济、效率意义的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型（Cournot) （1838）（两寡头通过产量决策进行竞争的模型;
• 伯特兰德模型（Bertrand) （1883）（价格竞争） • 《博弈论与经济行为》（1944）
六、博弈的表示方法
• 标准型（normal form ）收益矩阵
对简单的博弈适用（二人有限博弈）
• 扩展型（extensive form ）
博弈树
适用于动态博弈
• 特征式

博弈论课件第四章

第四讲重复博弈
1
精选PPT
何为“重复博弈”？
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则和得益都是相同的----是特殊的动态博弈；
– 形式上是基本博弈的重复进行，但博弈方的行为和博弈结果不一定是基本博弈的简单重复，因为博弈方对于博弈会重复进行的意识，会使他们对利益的判断发送变化，从而使他们在重复博弈过程不同阶段的行为选择受到影响。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果，下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
7
种策略组合，那么重复两次就有m2条博弈路径，重复次就有mt条博弈路径。
精选PPT
重复博弈的得益
任何博弈博弈方策略选择依据都是得益的大小。计算重复博弈的“总得益”。计算各阶段的“平均得益”。时间有先后，引入贴现系数
推广：非零和或多个博弈方，博弈方的利益严格对立，
没有纯策略纳什均衡的其他严格竞争博弈中。在以这
些博弈作为原博弈构成的有限次重复博弈中，惟一的
子博弈完美纳什均衡就是所有博弈方都始终采用原博
12
弈的混合策略纳什均衡策略。
精选PPT
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。
精选PPT
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。
合作的可能性根本不存在。即使双方都知道还要重复进行许多次基本博弈，也不会改变它们在当前阶段博弈中的行动方式，不可能变得（哪怕是暂时的）合作和顾及对方的利益。
所有以零和博弈为原博弈的有限次重复博弈，博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。

博弈论基础

博弈论博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

参见：行为生态学（behavioral ecology）。

约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。

博弈论思想古已有之，中国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

近代对于博弈论的研究，开始于策墨洛（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。

1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的策墨洛（Zermelo)基础。

纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。

此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

博弈论第4章答案

R R M 4.1.a 标准式1↖2 L ’ R ’4，1 0，0 3，0 0，1 2，2 2，2纯战略纳什均衡：( L, L ’ ) ( R, R ’ )子博弈精炼纳什均衡：( L, L ’ ) ( R, R ’ )精炼贝叶斯纳什均衡：( L, L ’ )4.1.b 标准式1↖2 L ’ M ’ R ’1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4纯战略纳什均衡：( R, M ’ )子博弈精炼纳什均衡：( R, M ’ )精炼贝叶斯均衡: 没有4.2标准式1↖2 L ’ R ’2，2 2，2 3，0 0，1 0，1 3，0六种纯战略组合，每种组合中都至少有一方存在偏离的动机，因此不存在纯战略纳什均衡，因此也就不存在纯战略精炼贝叶斯均衡。

求混合战略精炼贝叶斯均衡：设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−参与者2选择L ’和R ’的概率分别为,(1)q q −在给定参与者1的战略下，参与者2选择L ’和R ’的收益无差异，则： 1212120*1*1*0*p p p p p p +=+⇒=给定参与者2的战略，参与者1选择L 、M 、R 的收益无差异，则：12121212[3*0*(1)][0*3*(1)]2*(1)41:**,*112p q q p q q p p p p p p q +−=+−=−−====又联立得所以 L LML LM L RL4.3答案（见4.5）4.4表示方法第一个括号，逗号左边为type 1发送者信号，逗号右边为type 1发送者信号；第二个括号，逗号左边为接收到L 信号的反应，逗号右边为接收到R 信号的反应； P 为信号接收者对type 1发送L 的推断，q 为信号接收者对type 1发送R 的推断（a ）[(,),(,),1/2][(,),(,),1/2][(,),((1),),1/2][(,),(,),1,0]R R u u p R R d u p R R d u u p L R u d p q αα><+−===（b ）[(,),(,),1/2,2/3][(,),(,),1,0][(,),(,),0,1]L L u u p q L R d u p q R L u d p q =<====中文版习题4.5答案（a ）[(,),(,),1/3,1/2]R R u d p q >=（b ）12121212[(,,),(,),1/3,1/2][(,,),(,),1/2,0]L L L u u p p q q L L R u d p p q q ==+<==+=。

《博弈论》精品讲义

7
➢长街上的超市（海滩占位模型）
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然？
✓其它相似情形：旅行社的热门路线；黄金时间的电视节目；总统竞选。
博弈论20092009
正大光明公正無私
8
➢狩猎与投资狩猎：
两个猎人围住一头鹿，各卡住两个关口中的一个，齐心协力即可成功获得并平分猎物。此时有一群兔子跑过，任何一人去抓兔子必可成功，但鹿会跑掉。
博弈论20092009
正大光明公正無私
5
1．博弈现象
➢田忌赛马：正确的策略可以反败为胜。 ➢囚徒困境：
乙甲
理性的人是自私自利的；理性选择不是全局最优。
博弈论20092009
正大光明公正無私
6
➢经济合作：
乙甲
诚信的价值；一报还一报策略；人类生存环境启示。
博弈论20092009
正大光明公正無私
如两人写的一样，就认为他们讲真话，并按所写数额赔偿；如果两人写的不一样，就认定低者讲真话，并照此价格赔偿。同时，对讲真话的旅客奖励2元钱，对讲假话的旅客罚款2元。
理性原则下，他们会写多少价格呢？
博弈论20092009
正大光明公正無私
11
2. 博弈概念
➢什么是博弈：
个人或团体间在依存和对抗、合作和冲突中的决策问题。
正大光明公正無私
43
∴I的最优混合策略为
(1,2)
(1, 4
3) 4
同理，II的最优混合策略为
G＝8
(1,2)
(1, 2
1) 2

博弈论战略分析入门第四章课后题答案

Instructor’s Guide to Game Theory: A Nontechnical Introduction to theAnalysis of StrategyChapter 4. Nash Equilibrium1.Objectives and ConceptsThe principle objective of this chapter is to introduce the Nash equilibrium and to convey some notion of the range of possibilities and applications, including the possibilities that there may be no Nash equilibria in pure strategies and the possibility that there may be plural Nash equilibria. (Since mixed strategy equilibria are not introduced until Chapter 8, it is not possible to give a meaningful definition of pure strategies at this point, and is necessary to talk around it a bit.) Important subsidiary concepts are coordination games and Schelling points (or focal point equilibria), heuristic methods of finding the Nash equilibria, such as underlining, and refinement of Nash equilibrium.The chapter begins with an example that is based on Warren Nutter’s game-theoretic version of Bertrand competition, except that in this instance a kind of quality competition is considered. The solution to this game can be found by iterated elimination of dominated strategies (which will not be covered until Chapter 11) and reflects the intuition that it is best to be just one step ahead of the competition. Thus, while it does not have a dominant strategy equilibrium, it has some dominated strategies and a unique Nash equilibrium, and hopefully forms a natural bridge from the study of dominant strategy equilibrium.Games with plural equilibria are introduced with the game of Choosing Radio Formats. The idea that history (or other clues) can establish a Schelling point also comes in with this example. The Market Day game reinforces the idea that plural Nashequilibria can have explanatory value – explaining the persistence of what seem to be arbitrary conventions. Games without Nash equilibria (in pure strategies) are introduced with an escape-evasion game. This is an important category in itself, though the most important applications are in differential games and thus beyond the scope of the book.Accordingly, the concepts areNash EquilibriumUnique Nash EquilibriaFinding Nash EquilibriaPlural Nash EquilibriaThe difficulty of choosing among plural Nash equilibriaSchelling PointsCustom, convention and history as Schelling pointsSchelling points from the logic of the gameRefinementGames without Nash equilibria in pure strategies2. Common Study ProblemsStudents who have not yet grasped the best-response idea will find Nash equilibria even more difficult than dominant strategy equilibria. This is the crisis point for students who have not “got” best response. The best response tables (such as table 2 in the chapter) are designed to make this a little easier, so urge the student to rely on them and on underlining as intermediate steps in their analysis. I sometimes suggest to mystudents that they physically move their fingers along the column or row to pick out the biggest payoff. Making the solution as mechanical as possible will help students over that hump. Another (less troubling) problem is the relationship between Nash and dominant strategy equilibria. Taking dominant strategy equilibria first is a pedagogical convenience, since it is a little easier and will be familiar to students who have seen the Prisoner’s Dilemma in another class, but it can produce the impression that dominant strategy equilibria are not Nash equilibria. The Venn diagram (Figure 1) is meant to speak to that problem, and may need some stress in class.3. For Business StudentsThe key business concepts for this chapter are strategies of location and market niche, in the Location, Location, Location example, but also in the Radio Formats example and in the Hairstyle example in the exercises and discussion questions.4. Class AgendaFirst hour:1)Quiz on earlier material2)Introductory presentation: Nash Equilibria•Assignments3)Discussion: The Blonde Problem AgainSecond Hour:1)Discussion of quiz and assignments2)Play a coordination game in class, with random matching and without discussion.A handout description of the game is given on the next page.Another Random-Matching Two-Person GameOnce again, each person chooses between the strategies of collusion or defecting from the collusive arrangement.Put in your name and circle one of the two statements: either "my strategy is collude" or "my strategy is defect." Your instructor will tell you whether to follow directions A) or B) below.A)After you turn it in, your strategy choice will be matched with that of anotherclass member AT RANDOM, and your bonus points will be based on the payofftable above. There is to be no discussion of your strategy choices.B)You will be matched with your neighbor and may discuss your strategy choice ifyou wish.Payoffs are in GameBucks.TableArt's StrategyCollude DefectCollude (3,3)(0,2)Bob's StrategyDefect(2,0)(1,1)What will you do? Go for the big reward with a "collude" strategy or protect yourself with an "defect" strategy?Student name ____________________________My strategy is (circle one)ColludeDefect3)Discussion:a.Results of the in-class game.b.Give other examples of Schelling points in coordination games. Ideally,these should come from the students, but the following instances maystimulate the discussion if it comes slowly:i.Driving on the right or left-hand side of the road.ii.Speaking the same language.iii.Choosing a profession. Assumption: if both choose the sameprofession, it does not pay well because it is too crowded. Howmany business majors in the class? Engineering? Communications,etc?5. Answers to Exercises and Discussion Questions1.Solving the Game. Explain the advantages and disadvantages of NashEquilibrium as a solution concept for noncooperative games.Nash equilibrium is based on the idea that each player chooses the best response tothe strategy chosen by the other player. This is a clear concept of rationality wheneach person chooses in isolation from the other. Among the shortcomings are 1)Nash equilibrium may not be unique, posing the problem of determining which oftwo or more Nash equilibria may actually be chosen by rational agents, and 2) considering only the list of strategies for the game in normal form, that is, the“pure” strategies, there may not be a Nash equilibrium.2.Location, Location, Location (Again) Not all location problems have similarsolutions. Here is another one: Gacey's and Mimbel's are deciding where to puttheir stores in Metropolis, the town across the river from Gotham City. The three strategies for Metropolis are to locate downtown, in Old Town, or in the Garden District. The payoffs are shown in Table E1.Table E1 Payoffs in a New Location GameGacey'sDowntown Old Town Garden DistrictDowntown70,6060,12080,100Old Town110,7040,40120,110Mimbel'sGardenDistrict120,80110,12050,50Does this game have Nash equilibria? What strategies, if so? Which strategies would you predict that Gacey's and Mimbel's would choose? Compare and contrast this game with the location game in the chapter. What would you say about the relative importance of congestion in the location decisions of the firms in the two cases?A table modified to show the highest payouts for each player for each decision is as follows:Gacey's Downtown Old Town Garden District Downtown 70, 6060, 12080, 100Old Town110, 7040, 40120, 110M i m b e l 's Garden District 120, 80110, 12050, 50There are two Nash Equilibria. When Gacey’s locates in Old Town, Mimbels will locate in the Garden District, and vice versa. Which solution will actually be chosen is not definite.This problem is different from the one in the chapter since there are 2 NashEquilibriums instead of one, which requires a little guesswork as to which one will be the final solution. It is similar in that there is not a dominant strategy equilibrium.Congestion must be more of a problem in this scenario than in the chapterproblem. There is never a Nash equilibrium when both pick the same site. This could be explained by the congestion problem3. Drive on. Two cars meet, crossing, at the intersection of Pigtown Pike and Hiccup Lane. Each has two strategies: wait or go. The payoffs are shown in Table E2.Table E2. The Drive On Game Mercedeswait go wait0,01,5Buick go 5,1-100,-100Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? Would you predict which strategies rational drivers would choose in this game?Which? Why? Pigtown Borough has decided to put a stoplight at this intersection. How could that make a difference in the game?Here is a table modified to show the maximum payout for each driver:Mercedes Wait Go Wait0, 05, 1B u i c kGo 5, 1-100,-100Once again, there are 2 Nash Equilibria. They are for the Buick to wait and the Mercedes go, or vice versa.To determine which will happen requires guesswork. The personality of thedrivers might determine what happens. If I were in the Mercedes, I would probably not want to risk an expensive car getting damaged. Someone else, say in a CL600, mightfigure that his car is faster and that he can beat the other driver. Also, one of the drivers might just wave the other on rather than have both wait or both go.It is possible that both drivers might wait rather than run the risk of an accident, i.e. choose a risk dominant strategy.The stoplight would provide a Schelling Point to select for the equilibrium at which the driver with the green light chooses go.4. Rock, Paper, Scissors. Here is another common school-yard game called Rock, Paper, Scissors. Two children (we will call them Susan and Tess) simultaneously choose a symbol for rock, paper or scissors. The rules for winning and losing are:Paper covers rock (paper wins over rock)Rock breaks scissors (rock wins over scissors)Scissors cut paper (scissors win over paper)The payoff table is shown as Table E3.Table E3. Rock, Paper, ScissorsSusanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibria? What strategies, if so? How do you think the little girls will try to play the game?Here is a table modified to show the best responses.Susanpaper stone scissors.paper0,01,-1-1,1Tessstone-1,10,01,-1scissors1,-1-1,10,0We see that there are no dominant strategies, nor are there Nash equilibriain terms of the strategies shown here. We have no basis (so far) to decide how the girls will play the game.NOTE TO INSTRUCTOR For the purist, it is not correct to say here that “thereare no Nash equilibria,” since this game has a mixed-strategy equilibrium. But, of course, we will not cover mixed strategy equilibria until a later chapter. Thecorrect statement is that there is no equilibrium in pure strategies.5. The Great Escape. Refer to Chapter 2, Question 2.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Does it have Nash equilibrium? What strategies, if so? How can these two opponents each rationally choose a strategy?WardenGuard walls Inspect cellsclimb No escape, success inpreventing escape Escape,failurePrisonerdig Escape,failure No escape, success inpreventing escapeThe numerical payoffs can be assigned in many different ways. Here is a simple version that interprets “no escape” as minus one for the prisoner, plus one for the warden, and “escape” as vice versa. As the underlines show, there is no Nash equilibrium. Thus far, we have no basis to say how a rational person would choose strategies in this case.WardenGuard walls Inspect cellsclimb-1,11,-1Prisonerdig1,-1-1,16. Sibling Rivalry. Refer to Chapter 2, Question 1.Discuss this game, from the point of view of noncooperative solutions. Does it have a dominant strategy equilibrium? Determine all the Nash equilibria in this game. Do some Nash Equilibria seem likelier to occur than others? Why?Irismath litmath 3.7, 3.8 4.0, 4.0Julialit 3.8, 4.0 3.7, 4.0If the siblings act independently, rationally and with self- interest (non-cooperatively), we can find two Nash equilibrium's strategies: (literature, math), (math, literature).We note that there is a Schelling point in this game: (Math, Lit) yields a certain 4.0 for both girls, which is a reason it might attract attention, and probably is more likely to be observed.7. Hairsyle.Shaggmopp, Inc. and Shear Delight are hair-cutting salons in the same strip mall, each groping for a market niche. Each can choose one of three styles: punker, contemporary sophisticate, or traditional. Those are their strategies. They already have somewhat different images, based on the personalities of the proprietors, as the names may suggest. The payoff table is shown as Table E4.Table E4. Payoffs for HaircuttersShearpunker sophisticate traditionalpunker35,2050,4060,30Shaggmoppsophisticate30,4025,2535,55traditional20,4040,4520,20Are there any dominant strategies in this game? Is there a dominant strategy equilibrium? Are there any Nash equilibria? How many? Which? How do you know?Once again, here is the modified table:ShearPunkerSophisticate Traditional Punker 35, 2050, 4060, 30Sophisticate 30, 4025, 2535, 55S h a g g m o p pTraditional20, 4040, 4520, 20Shaggmopp’s best strategy is to go punker regardless of what Shear does. This is his dominant strategy. Since Shear has no such dominant strategy, there is no dominant strategy equilibrium.The only Nash equilibrium is when Shear decides to go with the sophisticate look.Since Shear knows that Shaggmopp will probably go punk rather than sophisticate, it will choose sophisticate.6. Quiz questionPlaced on the next page for convenience in copying and printing.Student name ____________________________Quiz – Game TheoryFelix and Oscarina share their home with two cats. Felix, who has a sharp sense of smell, would like for the cat boxes to be cleaned twice a week. Oscarina, whose sense of smell is less acute, would be satisfied if they were cleaned once a week. Each would prefer not to be the one to clean the cat boxes. Their payoffs are shown on the following table.Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3Find any and all Nash equilibria for the catbox game? Are there dominated strategies? Which? Is there a dominant strategy equilibrium? Explain.Answer:A payoff table with best responses underlined follows:Oscarinadon't clean clean once clean twicedon't clean-5,-30,-17,-5Felixclean once-2,45,26,-4clean twice0,51,32,-3The Nash equilibrium is where Felix cleans the cat box twice and Oscarina never cleans. “Clean twice” is a dominated strategy for Oscarina. Since the best response for each person depends on the strategy chosen by the other, there is no dominant strategy equilibrium.It seems that Felix, whose need is greater, will empty the catbox, if the two companions act noncooperatively. Now, it may seem odd that people who live together would act noncooperatively , but life is strange, and odd things do happen. However, a couple of years ago, Oscarina gave Felix a Christmas present – a year of catbox cleaning – and has renewed the gift, so love triumphs after all.。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子：一般计算2.例子：分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的，即在给定信念的条件下，以及其他参与人的选择条件下，自身选择是最优的例1：子博弈最优——纳什均衡(,)L l是否合理？——如果参与人2有机会选择，肯定选r而不是l；——(,)L l不是子博弈精炼纳什均衡。

例2：单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡；——但如果参与人2有机会选择，但肯定选择d；——(,,)D a l不满足单点信息集理性。

例3：多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡；——(,)A r不满足多点信息集理性。

2.一致信念例1：与客观事实一致u=是否合理？——参与人2的信念2/3——2/3u=是不合理的，因为任何到达参与人2信息集都不可能产生此后验概率；——后验信念必须与先念信念保持一致。

例2：前后信念一致——参与人2的第2个信息集上的信念，是否合理？——不合理，给定参与人战略和第1个信息集的信念，利用贝叶斯法则计算信念与此不一致；——参与人前后信念保持一致。

例3：独立偏离——参与人3的信念0.9u =是否合理？——参与人1和参与人3的偏离是独立的，所以参与人3的合理信念为0.1u =；——不同参与人之间的偏离是独立的总结，一致信念要求：参与人偏离最小化,，参与人之间偏离是独立的；二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性；——定义信息集1.3和2.2的信念？2.定义a.行为战略：参与人在某个信息集到行动集映射，——如果某个状态真正发生，参与人如何决策；——序贯理性是否满足？b.序贯理性：在任何信息集上，参与人在给定信念和所有后续行为战略，选择自身行为战略最大化预期效用。

在单结信息集上，参与人i 的行动满足：max [,] is i is s arg U x σσρ-∈ （1）在多结信息集上，参与人i 的行动满足：max ()[,] is is i is s arg x U x σπσρ-∈∑ （2）——含义，在任何信息集上行动总是最优。

c.信念一致性：在任何信息集上参与人的信念必须和行动保持一致。

如果参与人i 信念集有正概率到达，则：()()()is y sP x x P y σπσ∈=∑ （3）如果参与人i 的信息集是零概率到达，则：lim () ()lim ()k is k P x x P y σπσ=∑ （4） ——k σ是让所有信息集都到达的行为战略；——k σσ→，收敛于现有行为战略；——仅仅需求存在一个序列满足以上条件。

d.满足（1）（2）（3）和（4），则称行为战略和信念系统(,)σπ是序贯均衡。

仅满足（1）（2）和（3），则称为弱序贯均衡，但弱序贯均衡不一定是纳什均衡。

如例子中121(,,)b w z 是弱序贯均衡，但不是纳什均衡，关键在于参与人1在1.1和1.3行为没有协调一致。

标准4是非常关键的，正式把定义非均衡路径上的信念，从而定义非均衡路径上参与人的合理行为。

3.存在性a.存在性定理——任何博弈都存在代理人标准式的颤抖手均衡；——任何代理人标准式的颤抖手均衡一定是序贯均衡。

b.和纳什均衡的关系——是纳什均衡；——可利用反证法和库恩等价定理证明。

三.计算 1.例子——在信息集2.2时，参与人2的最优行为战略为'L；——给定参与人2的最优选择，参与人1在信息集1.1的最优行为战略为L。

2.例子：考虑下图扩展式博弈，求解所有的序贯均衡3,8 2,61,0 -2,7 -1,9 -1,7——首先考虑在信息集2.3时最优行动：333: 80(1)8: 77(1)7: 69(1)93e f g αααααααα⋅+⋅-=⋅+-=⋅+-=-由此可得结论：3337/8 ;2/37/8;2/3 ;e f g ααα≥⇒≤≤⇒≤⇒最优选择最优选择最优选择——分析纯战略序贯均衡3. 7/8A e α≥⇒最优选择此时参与人1最优行为战略为121.1 1.2x x →→，则这与7/8α≥矛盾。

3. 2/37/8B f α≤≤⇒最优选择为此时参与人1的最优行为战略为121.1, 1.2y y →→。

所以，根据标准4扰动行为战略满足：12121227εαεεεεε=⇒≤≤+序贯均衡：[]123,, 2/37/8y y f α≤≤3. 2/3C g α≤⇒最优选择为此时参与人1最优行为战略121.1 1.2,2/3x y α→→≤则与矛盾。

——分析混合行为战略序贯均衡33. 7/8A e f α=⇒和混合.. 7/8α=的唯一可能就是1x 和2x 的使用概率为0，或参与人1在信息集1.2上选择2x 和2y 无差异。

由此可以得到参与人2的最优行为战略：3(1)0 x 1/42(1)0 x=2/3x x x x --≤⇒≤--=⇒7/8α=时考虑参与人1的最优行为战略： 1/4x ≤，构造扰动战略11212778εαεεεε==⇒=+ 2/3x =，此时在信息集1.1最优选择为1x ，1.2的最优选择：171 y=187y α==⇒+ …序贯均衡：12337[, , (1)] x 1/48y y x e x f α=⋅+-≤ 1223371621 [, , ]87733x x y e f α=++ 33. 2/3B f g α=⇒和的混合2/3α=的唯一可能就是1x 和2x 选择概率都为0，此时要求3f 使用概率大于等于2/3。

所以，扰动的行为战略满足：11212223εαεεεε==⇒=+ …序贯均衡：12332[, , x (1)] x 2/33y y f x g α=⋅+-⋅≥3.例子：问在什么条件下（c，eg）是一个序贯均衡——构造扰动行为战略[1212,,1εεεε--]——在信息2.2最优行为是e 的条件：33(1)1/2ααα⋅≤-⇒≤，也就是：1211221/222εαεεεε=≤⇒≥+——参与人在2.3时信息集β满足：211211240.824εεβεεεε=≥=++——所以g 要成为最优选择的条件：0.20.82 x 8x ⨯≥⨯⇒≥第二节.序贯均衡的应用一.信号传递模型1.假设——存在两个参与人，信号发送者和信号接受者；——信号接受者没有私人信息，信号发送者有两种类型，t和2t；1——信号发送者首先发送信号，信号接受者在观察到发送者信号再决定自己的行动。

2.分析求解分离均衡：不同类型参与人发送不同的信号12, t H t T →→——此时参与人2的后验信念为1, q=0p =——此时参与人2的最优选择为(,)H T——显然类型为2t 的参与人肯定不是最优选择12, t T t H →→——此时参与人2的后验信念为0, q=1p =——此时参与人2的最优选择为(,)T H——此时类型为2t 的参与人肯定不是最优选择。

混同均衡：不同类型参与人发送相同的信号12, t H t H →→——此时参与人2的后验信念为0.8, 0q 1p =≤≤——此时参与人2在信息集2.2最优选择为H ；——如果参与人类型为2t 没有积极性偏离，则参与人2在2.3信息集应该选择T ，由此要求1/2q ≤——所以混同均衡为(,,) p=0.8 q 0.5H H T ≤12, t T t T →→——此时参与人2的后验信念为0.8 0p 1q =≤≤——此时参与人2在信息集2.3最优选择为H ；——如果参与人1类型为1t 的没有积极性偏离，则参与人2在2.2选择为T ，也就是要求0.5p ≤——所以混同均衡为(,,) p 0.5 q=0.8T H T ≤教育学历和信号发送的关系二.动态非对称息讨价还价1.假设——工会和企业老板就员工工资进行讨价还价；——员工的保留效用0，企业利润π服从[]0,H π上的均匀分布，企业利润是老板的私人信息；——在第一阶段，工会提出工资要求1w ，如果企业老板接受，则博弈结束，老板支付为1w π-，工会为1w ；如果拒绝，则博弈进入第二阶段；——在第二阶段，工会同样提出工资要求2w ，如果老板接受，则企业老板得到2w π-，工会得到2w ；如果拒绝，则双方各得到0； ——现在假定双方的贴现因子都为δ。

2.分析和求解——假定只有一个阶段博弈，则工会最优工资w ：0H H H www πππ-⨯+⨯ 所以*/2H w π=——给定工会最优战略12(,)w w ，企业在第一阶段最优决定为：如果1ππ>，则接受工资1w ；反之则拒绝，1π满足：1211121[] 1w w w w δπδππδ-⋅-=⋅-=-即:——给定企业老板的第一阶段的最优决策，工会的后验信念为企业利润服从1[0,]π上的均匀分布，所以工会最优工资*21/2w π= ——由此可以得到：1122w πδ=-——工会第一阶段的最优决策为：11111max /2H H Hw arg w πππδπππ-∈⨯+⨯⨯ ——最优一阶条件为：11122*1222022(2)(2)2(43)H H w w w w πδδδδδπδ--+⨯=----=⨯-——所以序贯均衡为：工会第一阶段提出工资*1w ，第二阶段为*1/2;π企业在第一阶段如果*1ππ>则接受*1w ，反之则拒绝，在第二阶段如果*2w π>则接受，反之则拒绝。

三.声誉模型1.囚徒困境S2S1坦白抗拒坦白+2,+2 8,+0 抗拒+0,8 +7,+72.假设——假定囚徒有α类型为合作类型，1α-类型为自私类型——合作类型坚持冷酷战略，一开始抗拒，一旦发现对手选择坦白，则坦白到永远——自私类型的支付矩降如上图所示——以上博弈重复有限次T，并且每一阶段都能被下一阶段所观察δ=到，假定贴现因子13.分析——如以上博弈重复3次，合作是否会出现？..自私类型选择合作的最小收益：[778](1)[022]αα⨯+++-⨯++..自私类型选择不合作的最大收益：[822](1)[822]αα⨯+++-⨯++所以如果满足：4/9α≥显然在第一阶段合作是自私类型的最优选择。

——无论α多么小，只要重复次数足够大，合作肯定会出现 ..合作的最小收益：[77...8](1)[02...2]αα⨯++++-⨯+++..不合作的最大收益：[82...2](1)[82...2]αα⨯++++-⨯+++..自私类型人在第一阶段合作的条件：5(1)8(1)08/(53)T T ααα-⨯--≥⇒≥+..更加一般地，只要重复次数足够大，则所有0t T ≤，自私参与人总选择合作..机制分析…合作收益 5(1)T α-⨯…不合作收益 (1)α-…合作收益是长远收益，随着时间增加而增加，而不合作收益是眼前的利益..如果考虑贴现因子，则合作收益随着贴现因子与δ增加而增加 …合作的最小收益11[77...78](1)[02...22]T T T Tαδδδαδδδ--⨯++++-⨯+++ …不合作的最小收益11[82...22](1)[82...22]T T T T αδδδαδδδ--⨯++++-⨯+++…两者差距随着贴现因子增加而增加 1158(1)1Tδαδαδ⎡⎤--+⨯--⎢⎥-⎣⎦四.序贯均衡之再炼1.剔除劣战略标准——如果对于某一类型参与人i t ，满足以下条件，则我们称m 为i t 类型严格劣信号,[,,][,,]S i i a aMaxU m a t Min m a t < ——如果可能，i t 类参与人发送信号m 的概率为0，即信号接受者后验信()0i P t m =——以上信号传递模型存在两个信号混同均衡：(,,), 0.8, 1/2H H T p q =≤(,,), 0.5 0.8T H T P q ≤= ——利用以上标准检验： ..检验混同均衡1 对于类型1t 存在以下关系：11[,,]3[,,]0S a a MaxU H a t Min T a t =>= 11[,,]2[,,]1S a a MaxU T a t Min H a t =>=对于类型2t 存在以下关系：1111[,,]2[,,]1[,,]3[,,]0S a a S a a MaxU H a t Min T a t MaxU T a t Min H a t =>==>=T H 和都不是1t 和2t 类型的严格劣信号，因此，0.5q ≤是合理后验信念。

博弈论基础讲义-第四章

合集下载

经典博弈论普及课件

博弈论课件第四章

博弈论第四章

博弈论讲义完整PPT课件

博弈论讲义004

经济博弈论4

博弈论前四章笔记整理

博弈论课件4重复博弈

博弈论最全完整-讲解课件

博弈论第四章

第四篇博弈论PPT课件

博弈论课件第四章

博弈论基础

博弈论第4章答案

《博弈论》精品讲义

博弈论战略分析入门第四章课后题答案

文档推荐

最新文档

博弈论基础讲义-第四章

合集下载

经典博弈论普及课件

博弈论课件第四章

博弈论第四章

博弈论讲义完整PPT课件

博弈论讲义004

经济博弈论4

博弈论前四章笔记整理

博弈论课件4重复博弈

博弈论最全完整-讲解课件

博弈论第四章

第四篇博弈论PPT课件

博弈论课件 第四章

博弈论基础

博弈论第4章答案

《博弈论》精品讲义

博弈论 战略分析入门第四章课后题答案

文档推荐

最新文档

博弈论课件第四章

博弈论战略分析入门第四章课后题答案