博弈论第一章

格式：doc
大小：333.80 KB
文档页数：21

下载文档原格式

/ 21

博弈论第一章

1完整信息静态博弈1.0 对策论研究的内容与根本形式对策论研究的内容对策论研究多个行为主体的决议问题。

对策论研究的形式博弈 (game)，由多个行为主体组成的系统。

例Stackelberg modelCournot model博弈的种类参加者行动的时间与次序同时行动——静态博弈；先后行动——动向博弈。

参加者的信息多少信息同样——完整信息；信息不一样——不完整信息。

1.1 根本理论 : 博弈的标准式和纳什平衡例 1少儿游戏：“石头、剪刀、布〞。

博弈的准式表示(normal-form representation)(1) 参加人( player).n个参加人： 1, 2, ⋯, i, ⋯, n.(2)略 (strategy).一个参加人的略是他采纳的一个行。

参加人 i 的略： s i.参加人 i 的略空 : S i .略的一个合 : s ={s1，s2, ⋯, s n}.化表示： s-i ={ s1，⋯, s i -1， s i+1, ⋯ , s n }.(3)利润 (payoff).参加人i 的利润： u i= u i(s1，s2, ⋯, s n)n 个参加人博弈的准形式表示:G = {S1, S2,⋯S,n；u1, u2,⋯u,n}完整信息 (complete information) ：每个参加人知道其余人的略空和利润。

静博弈(static game)：全部的参加人同行。

每一个人行，不知道其余人的行。

例 1〔〕：博弈 {石、剪刀、布 } 的描绘：参加人：1，2。

略空：S1 = S2 = {石、剪刀、布 }利润：两人出手的函数u1 (石，石 ) = 0， u1 (石，剪刀 ) = 1， u1 (石，布 ) = -1⋯u2 (石，石 ) = 0， u2 (石，剪刀 ) = -1，u2 (石，布 ) = 1⋯⋯利润表：两个参加人，有限个略的博弈的表示方法。

P2石头剪刀布石头0 ， 01，-1-1 ，1P剪刀-1，10 ， 0 1 ，-11布 1 ，-1-1，10 ， 0博弈的：可否知道每个参加人的略？例 2: 囚犯窘境 (The Prisoner ’s Dilemma)囚犯2缄默招认缄默-1 ，-1-9 ，0囚犯1招认0 ，-9-6 ，-6囚犯 1 的考：无方缄默是招，自己“招〞好于“缄默〞。

第一章博弈论概述PPT课件

博弈论与信息经济学
Game Theory and Information Economics 天津大学管理与经济学部
授课：XXX
1
第一章博弈论概述（Game Theory）
授课：XXX
2
一、博弈论的定义
又称对策论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
➢ 博弈分析的基本假设（1）个人理性假设当事人在决策时能够充分考虑他所面临的局势，并能做出合乎理性的选择。
（2）最大化自己的收益假设当事人在决策时通常选择使自己收益最
大化的策略。
授课：XXX
12
坦白抵赖
➢ 博弈问题的基本要素
坦白
（1）局中人（Players）
抵赖
参与对抗的各方；不一定指自然人
若二人均不坦白，则只能因藏有枪支而被判刑1年；若有一人坦白而另一个不坦白，则坦白者无罪释放，
不坦白者被判刑10年；若二人都坦白了，则同判8年。此二人确系抢劫犯，请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8，-8 -10，0
抵赖 0，-10 -1，-1
授课：XXX
均衡解：二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》，该影片获得了2002年奥斯卡金像奖的四项大奖
授课：XXX
7
2002年北京国际数学家大会（ICM）
授课：XXX
8
• 主演
罗素·克劳，Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课：XXX
9
1. 囚犯困境（Prisoners’ dilemma

博弈论-第一章

二、博弈的基本式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来（科学）描述一个博弈，就称为博弈表达的基本式。
三、博弈的扩展式
博弈的扩展式就是非常详细地描绘出一个博弈的参与者、策略、行动顺序以及行动时拥有的信息、可能的结果和收益等细节就称为博弈的扩展式。
四、信息和顺序
完全信息和非完全信息，完全和非完全判断的标准就是如果有些信息只有一部分参与者知道，并不是所有的信息都是公共信息，那么博弈就是非完全信息博弈。
静态博弈和动态博弈，静态和动态的区别并不在于时间上是否同时，而是在信息上的一种同时行动。
公共知识与一般信息的区别。
定义1.2 博弈论是专门研究博弈如何出现均衡的规律的学科。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
第二节博弈论的经济学渊源
博弈论与经济学存在着不解之缘，主要是由于下面几个方面：（1）博弈论的核心问题是经济学最早提出并加以系统研究的。（2）博弈论理论发展主要是经济学的需要推动的，也主要是由经济学家加以发展。（3）博弈论中的主要问题基本上都涉及到经济利益冲突问题。
定义1.1 博弈是指利益存在冲突的决策主体（个人，企业，集团，政党，国家等等）在相互对抗（或合作）中，对抗双方（或多方）相互依存的一系列策略和行动的过程集合。
在定义1.1中，我们最需要注意的就是策略的相互依存性。对于策略的相互依存性，传统的经济学不是不想研究，而是缺乏有效的工具。从这个意义上而言，博弈论正是为了解决这一问题而产生的。也是从这个意义上讲，我们有了博弈论的定义。
• • • •

1博弈论第一章

i 1
n n
n
厂商i的收益：
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关，还与其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
哲理：相生相克，以柔克刚
猜硬币方正面反面 1， -1 -1， 1 参与人 1 石头剪子布石头 0， 0 -1， 1 1， -1 参与人2 剪子 1， -1 0， 0 -1， 1 布 -1， 1 1， -1 0， 0
盖硬币方
正面反面
-1， 1 1， -1
1.2.3 产量决策Cournot模型
4
2015/12/5
1.3.1 博弈中的参与人
参与人：独立决策、独立承担博弈结果的个人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果，不管一个组织有多大，甚至大到一个国家或多国，都可以作为一个参与人。囚徒困境中的警察、田忌赛马中的孙膑都不是参与人。

一、单人博弈——只有一个参与人的博弈
严格地讲，单人博弈由于不存在其他参与人的反应和反作用，因此不属于博弈论的研究对象。但是讨论单人博弈会使理论更完整，为多人博弈提供基础和启示。例一：单人迷宫扩展型
入口右 A B 0 出口(奖金M) 右 M
A,1
左 B,1

博弈规则面前参与人之间平等，不因参与人之间权利、地位的差异而改变参与人数量对博弈结果和分析有影响。根
两个囚徒的收益矩阵

博弈论教程

囚徒A 坦白不坦白
－5,－5
－10,0
0,－10
－1,－1
2.1.2 严格下策反复消去法（逐步剔除严格劣战略）例
L M R
U M 8,3 2,1 5,1 8,4 6,2 3,6
D
3,0
9,6
2,8
可以预测该博弈的合理结局为(U,L),即参与人A
选择策略U,而参与人B选择策略L。
2.2 Nash 均衡 2.2.1 Nash 均衡的定义 Nash 均衡是指这样的策略组合(或剖面): 为了极大化自己的收益(或效用), 每一个参与人所采取的策略一定应该是关于其他参与人所采取的策略的最佳反应. 因此没有一个参与人会轻率地偏离这个策略组合而使自己蒙受损失。
博
弈
论
第一章导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
游戏都有一些共同的特点:
1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
一、博弈论概述
1.1.1 博弈论的定义
博弈论研究的是人与人之间利益相互制约下策略选择时的理性行为及相应结局。豪尔绍尼（John C.Harsanyi）1994年诺贝尔经济学奖获奖致词：博弈论是关于策略相互作用的理论。博弈论研究人与人之间“斗智”的形式和后果，当人们利益存在冲突时，每个人所获得的利益不仅取决于自己所获取的行动，还依赖于其他人采取的行动，每个人都需要针对对方的行为选择作出对自己最有利的反应。
定义在有n个参与人的博弈 G={S1,S2…Sn;u1,u2,…un)中,策略组合 s*=(s1 *,s2 *,…sn *)是一个Nash均衡,如果对于每一个i, si*是给定其他参与人的选择: S-i*=(s1*,…si-1*,si+1*,…sn*)的情况下,第i个人的最优策略,即 ui(si*,s-i*)≥ui(si,s-i*) ,对所有的i∈Γ 或者用另一种表示方式,si*是下述最大化问题的解: si*∈arg ui(s1*,…si-1*,si,si+1*,…sn*),i=1,2,…n S *∈Si 因此,当且仅当没有一个参与人能从单方面背离某个策略组合的预见中增加自己的得益时,这个策略组合就是Nash均衡。

北京大学博弈论课件第1章-博弈论概述

POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
二、博弈的分类
❖ 根据博弈参与者能否达成相互合作的和约束性协议
合作博弈（Cooperative Games）非合作博弈（Non-Cooperative Games）
完全信息静态博弈（Static Game with Complete Information）
完全信息动态博弈（ Dynamic Game with Complete Information）
第一节：博弈的定义和实例
❖ 博弈论（Game Theory）又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用，任何一方的决策策略（Strategy）都不能完全独立于其他各方策略时，各方的决策过程及均衡问题。
20 世纪 70 年代，约翰 ·海萨尼（John Harsanyi）和莱因哈德 ·泽尔腾（Reinhard Selten）等将不完全信息理论融入到博弈论的研究中。
20 世纪 90 年代之后，博弈论作为一种方法被普遍运用到经济学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
如果甲、乙都坦白，则甲、乙均得到 5 年徒刑如果甲、乙都不坦白，则甲、乙均得到 2 年徒刑如果甲坦白、乙不坦白，则甲得到 1 年、乙得到 10 年有期徒刑如果甲不坦白、乙坦白，则甲得到 10 年、乙得到 1年有期徒刑

博弈论第一章ppt课件

qj ( j k) 必须使(3)式极大化.于是,令
j 0 , j1,2,,n.
qj
n
于是有 a2bqj b qkc0
(4)
kj1
n
即 bjq acb qk, j1,2,,n (5)
k1 .
n
n
将这 n个式子相加得 b qj n(ac)nb qj
j1
j1
行业的总产量为
n j1
qj
n(ac) b(n1)
设市场需求为
n
pab(qj) a0,b0 j1
（2）
当然a >c（否则会有问题，后面可以看到）,由
(1)与(2)两式易知企业 j 的利润为
.
n
j(q1,q2,qn)(ab qj)qjcqj （3） j1
所谓古诺均衡,便是存在一个产量：
q(q1 ,q2 ,,qn )使得每个企业的利润都达到
最大.即当所有别的企业的产量 qk 时q，k
.
1·2 应用举例古诺(1838年)提出了纳什所定义的均衡(但只是在特定的双头垄断模型中),但是他并没有从理论上系统的定义均衡的意义.古诺的研究被认为是最早的博弈论的经典文献之一. 此模型告诉我们；（1）如何对一个问题的非正式描述转化为一
个博弈的标准式表述；（2）如何通过计算解出博弈的纳什均衡；（3）重复剔除严格劣战略的步骤.
所选战略的函数,假定企业的i 收益就是其利润
ui(si,sj)i(qi,qj)qi[a(qiqj)c]
i1 ,j2(i2,j1 )
.
一对战略 (s1, s如2)是纳什均衡,则对每个参与
者
i，s
i
应满足:
ui(si,sj)ui(si,sj) （NE）

第1篇博弈论

囚徒A 囚徒A
坦白抵赖
不管B 不管B坦白不坦白，坦白，我坦白总是会少坐一些牢
每一个人的结局不仅取决于自身的选择, 每一个人的结局不仅取决于自身的选择,同时也取决于对手的选择
School of Mathematics and Computer Science
1.1.1 代表性博弈模型
虽然从两名囚犯共同利益看，最好的选择是合作，即同时选择保持沉默，然而，由于猜忌，试图获得更大好处等竞争性动机阻碍了它们达到更好的互利选择。启示：启示：个人理性决策常导致集体非理性结果（个人理性与集体理性之间的矛盾）。囚徒困境在双寡头垄断、公共产品的供给、军备竞赛等许多经济学问题中有着广泛的应用。个人理性与集体理性的矛盾说明了为什么社会中一些大家公认为好的改革却不能实现，关键在于一项好的制度安排应符合纳什均衡。
小猪按等待按 5,1 9,-1 等待 4,4 0,0
School of Mathematics and Computer Science
大猪
1.1.1 代表性博弈模型
市场中大企业与小企业：他们的关系就类似于市场中大企业与小企业：智猪博弈，大企业进行研究开发，为新产品做广告，智猪博弈，大企业进行研究开发，为新产品做广告，而对小企业来说，这些工作可能得不偿失，因此，而对小企业来说，这些工作可能得不偿失，因此，小企业就将精力放在模仿上，小企业就将精力放在模仿上，或等大企业用广告打开市场以后再出售廉价产品。开市场以后再出售廉价产品。股票市场中大户与散户：“散户跟大户” 股票市场中大户与散户：散户跟大户” 股份公司中大股东与小股东：大股东投票，股份公司中大股东与小股东：大股东投票，小股东不投票的制度安排是一个均衡结果

博弈论(第一章)

博弈的表述方法的例题
例：囚徒困境博弈的集合表示：G=（（坦白，不坦白），（坦白，不坦白）；（-5，-5），（0，-8），（-8， 0），（-1，-1））例：在两个公司竞争出售同一产品的博弈中，两个公司是两个博弈方，两个公司的各自销售量q1，q2是策略空间，
两个公司的所获利润u1（q1，q2），u2（q1，q2）是得
①用损益矩阵表示例1：故事齐威王与大将田忌赛马，赛马的规则是这样的，每次双方各出三匹马，一对一比赛三场，每一场的输方要赔1000斤铜给赢方，齐威王的三匹马和田忌的三匹马按实力都可以分为上，中，下三等，但齐威王的上，中，下三匹马分别比田忌的上，中，下三匹马略胜一筹，由于总是同等次的马进行比赛，因此田忌都是连输三场。实际上，田忌的上马尽管不如齐威王的上马，却比齐威王的中马和下马要好，而田忌的中马比齐威王的下马要好一些。因此，田忌的谋士孙膑为田忌出了个主意，用自己的下马对齐威王的上马，上马对齐威王的中马，中马对齐威王的下马。这样，二胜一负，田忌反而能赢齐威王1000斤铜，试写出其标准式表述。
你能否写出上述问题的矩阵形式？
（3）囚徒困境的应用
③ 假定你是一个公司的采购人员，考虑向两家供应商采购100万只零件，每只零件的成本为6元。如果你分别向两家供应商各订购50万只，则每个供应商就会把价格定在10元。你可以设计一个采购策略，以便在两家供应商之间制造出囚徒困境的情形，从而给自己带来好处。如何取定这样的采购政策，并写出其矩阵的表达形式。同时，考虑你的采购策略的使用条件是什么？
低价
80， 80 100， 20
20， 100 50， 50
（3）囚徒困境的应用
② 公共产品的供给也可以看作是一个囚徒困境问题，如果大家都出钱兴办公用事业，所有的人福利都会增加。问题是，如果我出钱你不出钱，我得不偿失，而如果你出钱我不出钱，我可以占你的便宜。所以每个人的最优选择都是“不出钱”，但是这种状态使得所有人的福利得不到提高。

博弈论第一章引言

第一章引言一、博弈的定义二、博弈的要素三、博弈的结构与分类四、博弈的发展历程五、主要应用领域一、博弈的定义博弈就是策略对抗，或策略起关键作用的游戏←博弈Game，博弈论Game Theory，Game即游戏、竞技←游戏和竞技等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦一、博弈的定义一个非技术性定义定义：博弈就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。

一、博弈的定义1、博弈论是研究决策主体的行为相互作用时的策略以及这种策略均衡问题的理论——张维迎《博弈论与信息经济学》2、博弈论可以定义为对理性决策者之间冲突与合作的数学模型的研究——R.B.Myerson(2007年诺奖得主）《博弈论——矛盾冲突分析》1991年开篇第一句话四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs）←1、博弈方和局中人：博弈中的决策主体，通过选择行动(或策略）以最大化自己的支付（效用、收益）。

可以是自然人，也可以是团体，比如企业、国家等←2、虚拟参与人（pseudo-player）：又称“自然”（nature)指决定外生随机变量的概率分布机制。

比如，市场需求的大小，就业率的高低等等。

←3、策略（战略）：相机行动方案（支配参与者在什么时候选择什么行动）。

注：a 战略是行动规则，而不是行动自身；b 静态博弈中，战略等同于行动；c 战略必须是完备的，它要给出参与人在每一种可想象到的情况下的行动选择，即使参与人并不预期这些情况会发生。

←4、支付（收益）：参与者策略选择并实施后的结果，是参与人从博弈中获得多少的体现，与策略组合相对应。

博弈论第一章

招认囚徒１沉默
囚徒２招认沉默 –5, -5 0, -8 -8, 0 -1 , -1
囚徒的困境
策略“沉默”严格劣于策略“招认”
博弈分析的目的：预测博弈的均衡结果，即给定每个参与人都是理性的是共同知识，什么是每个参与人的最优策略？什么是所有参与人的最优策略组合？
*肯定性（sure-thing）或替代性（substitution）公理：一个决策者在事件Ａ发生的偏好选项１胜于选项２，并且在事件Ａ不发生时也偏好选项１胜于选项２，那么就有，他在知道事件Ａ无论是发生还是不发生之前都应该偏好选项１胜于选项２。
Chapter 1 完全信息静态博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move) games,we restrict attention to games of complete information. That
招认
囚徒２招认沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒１
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game; (2)the strategies available to each player; (3)the payoff received by each player for each combination of strategies that could be chosen by the players.

博弈论-第1章

4任何纳什均衡策略组合必须仅仅在没有严格劣势策略上或更一般地在重复剔除严格劣势策略后遗留下来的策略上赋予权重原因是参与人总是可以通过将劣势策略替代为优于它的策略而增加他的收益
博弈论
主讲人:燕志雄
第1章策略式博弈和纳什均衡
• • • • • 1、卢梭博弈参与人：猎人策略:猎兔与猎鹿; 收益：猎鹿（2）或猎兔（1）结果:合作与非合作;
C C D 1，1 2，-1
D -1，2 0，0
图1-7
例1.2 二级价格拍卖
• • • • • • • • 1、博弈的构成要素 ——参与人；策略；效用；公共知识。 2、策略选择 ——对于每个参与人来说，以他的估价进行投标的策略弱优于所有其他策略，令ri=maxj≠i sj。 ——设si>vi，如果ri≥si，0，不会更好；如果ri ≤ si，vi- ri ， vi- ri，不会更好；如果vi< ri<si，vi- ri<0，更差。 ——设si<vi，类似地。 ——在二级价格拍卖中，投标者以估价投标是一种优势策略。投标者I赢标，效用为他与I-1两者的估价之差。 ——投标者是否具有彼此估价的信息并不重要。即使投标者知道他们自己但不知道其他投标者的估价，每个投标者以估价出价仍然是一种优势策略。
注意事项
• ——对劣势纯策略赋予正概率的混合策略是劣势的； • ——即便它仅对非劣势的纯策略赋予正概率，一个混合策略也有可能是严格劣势的，如图13。 σ1=(1/2,1/2,0)<D。
L U M D 1,3 -2,0 0,1
R -2,0 1,3 0,1
图1-3
“稳健性”检验
• ——在某些极端情况下，通过重复严格优势获得的唯一策略组合(U,L)与现实中的结果(D,L)并不吻合，如图1-4。 • ——这个例子说明了，收益、策略空间与理性是共同知识的假设是有作用的。图1-4 说明了参与人的行为对于不确定性是非常敏感的。

博弈论1 (2)全篇

6．据得益特征：零和博弈；常和博弈；变和博弈
6
四、古典博弈论的三个基本假设：参与人是理性的；他们有这些理性的共同知识；他们知道博弈规则。
理性的三个基本内涵：理性的局中人具有关于博弈的完全知识；可以确切知道整个状态空间；具有相对无限的逻辑能力。
五、博弈的典型例子
1 ．囚徒困境坦白
坦白
不坦白
-6，-6 -1，-8
3
2、博弈与一般决策的区别
二、博弈模型要素
1、参与人：博弈中的决策主体。他的目的是通过选择策略以最大化自己的支付（效用）水平。
虚拟参与人（自然）：指决定外生的随机变量的概率分布的机制。自然作为虚拟参与人没有自己的支付与目标函数，即所有的结果对它都是无差异的。
2、策略：参与人在给定信息集（信息集包含了一个参与人有关其他参与人之前行动的知识，可理解为参与人在特定时刻有关变量值的知识。一个参与人无法准确知道的变量全体属于一个信息集）的情况下的行动规则。它规定参与人在什么时候选择什么行动。[策略是可供局中人选择对付其它局中人的完整行动方案。]
21
例某个地方的居民均匀地环绕一个圆形湖居住。两小贩来此地推销商品。1）若居民都选择离自己较近的小贩购买商品，问小贩选择推销地点博弈的NE是什么？2）若有三个小贩同时到此地推销商品，则推销地点博弈的NE又是什么？3）若圆形湖的周长是1（千米），居民的购买量是Q=1-D，D为居民与小贩推销点距离，则两个和三个小贩博弈的NE各是什么？
14
例6 设 s1 [10,0] s2 [3,0]
u1 (s) 10s1 7s1s2 s12
u2 s 15s2 5s1s2 s22
求NE。
15
例7 设 s1 [10,0] s2 [3,0]

博弈论第一章

ui表第个与的付效水）示 i 参人支（用平 u = u， 2，， i，， n 为个的付合（ 1 u L u L u） n 人支组 ui是有与战选的数所参人略择函： ui =ui {s , s2,L si ,L sn} , , 1
• 博弈的基本特征是一个参与人的支付不仅取决于自己的战略选择，己的战略选择，而且取决于所有其他参与人的战略选择
• 第二节博弈论与经济学的关系 • 1、从研究对象看：对手的反应、从研究对象看： • 2、利益最大化下的合作与冲突、 • 3、完全竞争与完全信息假定、 • • • • • • • 第三节经济博弈论的形成与发展古诺、古诺、伯特兰诺依曼、冯.诺依曼、摩根斯特恩：《博弈论与经济行为》诺依曼摩根斯特恩：博弈论与经济行为》纳什：经济均衡－博弈均衡纳什：经济均衡－泽尔腾：动态博弈：泽尔腾：动态博弈：子博弈均衡豪尔绍尼：不完全信息博弈：贝叶斯－豪尔绍尼：不完全信息博弈：贝叶斯－纳什均衡维克里、莫里斯：维克里、莫里斯：不对称信息下的激励问题
• 第四节博弈的分类 • 1、合作博弈（cooperative game）和非、合作博弈（）合作博弈（合作博弈（non- cooperative game ）： • 人们的行为相互作用时，人们的行为相互作用时，当事人能不能达成一个具有约束力的协议，如果有，能达成一个具有约束力的协议，如果有，就是合作博弈；反之，则是非合作博弈。就是合作博弈；反之，则是非合作博弈。 • 现在经济学家谈到博弈论，现在经济学家谈到博弈论，一般指的是非合作博弈，很少指合作博弈。是非合作博弈，很少指合作博弈。
• • • •
猜谜游戏两个儿童各拿一枚硬币，若同时正面朝上或朝下，A给B 1分钱，若只有一面朝上，B给A 1分钱。

博弈论第一章

1.1.2一个非技本性的定义规定或定义一个博弈需要以下几个方面： 1．参与人(Player)(局中人）指博弈中的决策主体，他的目的是通过选择行动（或策略）以最大化自己的支付（效用）水平，参与人可以是自然人、团体、自然（“上帝”作为虚拟的参与人）。 2．各个参与人各自可选择行动集(action set),Ai={ai}, 是其可以采用的全部行动的集合。一个行动组合(action proile)是一个由博弈中的n个参与人每个选取一个行动所组成的有序集a=(a1,a2,…an)。
1.3.2 博弈中的策略博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。博弈中各博弈方的决策内容称为“策略“，但应注意到并不是每个博弈方都有相同的可选策略。如果在一个博弈中每个博弈方的策略数都是有限的，则称该博弈为有限博弈；否则就称为无限博弈。 1.3.3 博弈中的得益(支付,payoff) 得益指在一个特定的策略组合下参与人得到效用水平, 即各个博弈方从博弈中所获得的利益.
如果一个决策者在追逐其目标时能其前后一致地做决策，我们就称他是理性的(rational) 如果局中人知道我们付此博弈所知道的一切，并能做出我们对此局势所做的一切推断，我们就称此博弈的局中人是智能的。
1.2 几类经典的博弈模型
1.2.1 囚徒的困境(prisoners’ dilemma)
囚徒B
坦白坦白不坦白
囚徒A
－8,－8
－10,0
0,－10
－1,－1
不坦白
这个例子本身就部分奠定了非合作博弈论的基础。
1.2.2 智猪博弈猪圈里有两头猪:大猪和小猪,猪圈的一头有一个猪食槽,另－头装有－个按纽,控制着猪食的供应,按一下就会有10单位的猪食进槽,但谁按谁就要付出相当于2单位猪食的成本;当猪食进槽时,若下猪先到,大猪可吃到9单位;小猪先到, 则小猪可吃到4单位,大猪吃6单位;若两者同时到,叫大猪可吃7单位,小猪吃3单位。

第一章博弈论的发展

第一章博弈论的发展一、博弈论的由来博弈论是一门年轻的学科，起源于本世纪初，在二战后发展成为一门完整而丰富的理论体系。

其中博弈译自英文的Game，字面意义可直译为游戏，我国学术界的另一种译法是博弈。

从名称上可以体会到博弈论的来源。

如同概率论来自对掷色子，彩票等随机性行为的观察和研究（概率论的起源有一个故事，两个人为一笔奖金而打赌，约定谁先赢到一定局数就获得全部奖金，但因故没有赌完，各自赢得一定局数，于是请数学家裁定每个人应该得到多少，数学家分析了各自获得最终胜利的概率，应按比例进行分配），博弈论起源于对国际象棋，扑克等竞赛活动的认识。

这也许可以说体现了西方精神与东方精神的差别，在中国人不屑深究其内在意义的地方西方人发展起了一种科学。

一旦以严肃认真的科学态度去分析游戏，它的思想成果即刻就超越了它原来的研究对象，博弈论的对象很快扩展为广泛存在于人类生活各个方面的人与人之间利益相互制约下进行策略选择时的理性行为及相应结局。

豪尔绍尼在诺贝尔获奖辞中是这样定义博弈论的：“博弈论是关于策略相互作用的理论，就是说，它是关于社会形势中理性行为的理论，其中，每个局中人对自己行动的选择必须以他对其他局中人将如何反应的判断为基础”。

简言之，博弈论研究人与人之间“斗智”的形式和后果。

当人们的利益存在着冲突时，每个人所获得的利益不仅取决于自己所采取的行动，也取决于其他人同时采取的行动或者对自己行动的反应。

例如，我国人们喝酒时有猜拳的习气，一个人是否被罚一杯不仅取决于自己伸出的手指数目与说出的数字，还取决于对手的选择。

由于人与人之间利益存在磨擦的情况出现于几乎所有的人类活动中，博弈论即具有了广阔的用武之地。

值得注意的是，博弈论研究的目的并非帮助特定一方胜券在握，而是描述在这种形势中各方理性选择自己的行动会达成的结果。

由于它研究人们决策相互影响的形势，国内为了突出它博弈略的强调，常常将其译为学术气氛更浓的博弈论。

博弈论这种译法来自于港台，由于它更贴近英语原文的风格以及更为直观，现下逐渐流行起来。

博弈论第一章总结

博弈论第一章总结那咱就开始唠唠博弈论第一章的那些事儿哈。

博弈论啊，这可是个超级有趣的东西呢。

第一章就像是打开博弈论大门的一把小钥匙，虽然小，但可重要啦。

这第一章啊，主要就是给咱介绍啥是博弈论的基本概念。

就好比是你要去一个新地方，先得知道这个地方是干啥的，大概啥样对吧。

博弈论呢，简单来说就是研究在不同的决策情况下，人们或者各方之间是怎么互相影响的。

比如说啊，下象棋的时候，你走一步，对方走一步，你每一步的决策都要考虑到对方可能会干啥，对方也是一样，这就是一种博弈呀。

这里面有个很重要的点就是参与者。

这些参与者就像一场大戏里的演员，每个参与者都有自己的目标，就像演员都有自己的角色任务一样。

比如说在商业竞争里，那些公司就是参与者，每个公司都想赚更多的钱，扩大自己的市场份额，这就是他们的目标啦。

而且这些参与者的决策可不是瞎做的哦，都是为了达到自己的目标去想办法的。

再说说策略这个事儿。

策略就像是每个参与者手里的武器或者魔法棒。

不同的参与者有不同的策略可以选择。

还拿商业竞争举例哈，如果一家公司想要增加市场份额，它可以选择降低价格，提高产品质量，或者做很多广告这些策略。

而且每个策略都会对其他参与者产生影响呢。

比如说你降价了，别的公司可能就会受到影响，也跟着降价或者想出其他办法来应对。

信息也是博弈论第一章里不能少的部分。

信息就像是在黑暗里的灯光，有多少信息就决定了你能多清楚地看清局势。

要是你知道很多关于其他参与者的信息，比如他们的策略啦，他们的目标啦，那你做决策的时候就更有把握。

但是要是你啥都不知道，就像在黑夜里瞎摸，那可就危险啦。

比如说在谈判的时候，如果一方知道另一方的底线，那这一方就有更大的优势，能更好地争取自己的利益。

这第一章的博弈论啊，其实就是把这些基本的东西一股脑儿地摆在我们面前，让我们对博弈论有个初步的认识。

它告诉我们在各种情况下，人与人、公司与公司、国家与国家之间的互动都是有规律可循的。

就像我们解开一个谜题一样，每一个概念都是一块小拼图，当我们把这些小拼图都搞清楚了，就能慢慢看到整个博弈论这个大拼图的全貌啦。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1 完全信息静态博弈1.0 对策论研究的内容与基本形式对策论研究的内容对策论研究多个行为主体的决策问题。

对策论研究的形式博弈(game)，由多个行为主体构成的系统。

例Stackelberg modelCournot model博弈的类型参与者行动的时间与顺序同时行动——静态博弈；先后行动——动态博弈。

参与者的信息多少信息相同——完全信息；信息不同——不完全信息。

1.1 基本理论: 博弈的标准式和纳什均衡例1 儿童游戏：“石头、剪刀、布”。

博弈的标准式表示(normal-form representation)(1) 参与人( player).n 个参与人：1, 2, …, i, …, n.(2) 战略(strategy).一个参与人的战略是他采取的一个行动。

参与人i 的战略：s i.参与人i 的战略空间: S i.战略的一个组合: s ={s1，s2, …, s n}.简化表示：s-i ={ s1，…, s i -1，s i+1, …, s n }.(3) 收益(payoff).参与人i 的收益：u i= u i(s1，s2, …, s n)n个参与人博弈的标准形式表示:G = {S1, S2, …, S n；u1, u2, … , u n}完全信息(complete information)：每个参与人知道其他人的战略空间和收益。

静态博弈(static game)：所有的参与人同时行动。

每个人行动时，不知道其他人的行动。

例1（续）：博弈{石头、剪刀、布} 的描述：参与人：1，2。

战略空间：S1 = S2 = {石头、剪刀、布}收益：两人出手的函数u1 (石头，石头) = 0，u1 (石头，剪刀) = 1，u1 (石头，布) = -1 …u2 (石头，石头) = 0，u2 (石头，剪刀) = -1，u2 (石头，布) = 1 ……收益表：两个参与人，有限个战略的博弈的表示方法。

P2石头剪刀布石头0 ，0 1 ，-1 -1 ，1P1剪刀-1 ，1 0 ，0 1 ，-1布 1 ，-1 -1 ，1 0 ，0博弈的问题：能否知道每个参与人选择的战略？例2: 囚徒困境(The Prisoner’s Dilemma)囚徒 2沉默招认沉默-1 ，-1 -9 ，0囚徒 1招认0 ，-9 -6 ，-6囚徒1的考虑：无论对方选沉默还是招认，自己选“招认”好于“沉默”。

囚徒2的考虑：无论对方选什么，“招认”好于“沉默”。

两人的选择: (招认，招认)。

定义：s i'是s i''的严格劣势战略（strictly dominated），如果:u i(s i'，s-i) <u i(s i''，s-i)“沉默”是“招认”的严格劣战略例3:参与人2左中右上 1 ，01，3 3 ，0参与人1 中0, 2 0 ，1 6 ，0下0, 2 2, 4 5, 3参与人1: 没有严格劣战略。

参与人2: “右”严格劣于“中”考虑：重复剔除严格劣战略(iterated elimination of strictly dominated strategies)可预见的两人选择: (下, 中)。

例4: 图 1.1.4参与人2左中右上0 ，4 4，0 5 ，3参与人1 中4, 0 0 ，4 5 ，3下3, 5 3, 5 6, 6两人都没有严格劣战略。

两人会如何选择各自的战略？定义：s * = (s 1*，…，s n *)是一个纳什均衡(Nash equilibrium), 如果u i (s i *，s -i *) ≥ u i (s i ，s -i *)纳什均衡为最大化问题的解ii S s ∈max u i = u i (s 1*, …, s i , …, s n *)各例中的纳什均衡: 囚徒困境: （招认，招认）例3: （下，中）例4（图1. 1. 4）: (下, 右).纳什均衡与重复剔除严格劣势战略的关系: 没有被剔除的唯一的战略组合是纳什均衡.如果战略是一个纳什均衡，它们在重复剔除严格劣势战略后留下.多个纳什均衡例5 性别战 (the battle of the Sexes)帕特歌剧拳击歌剧 2 ，1 0 ，0克里斯拳击 0 ，0 1 ，2纳什均衡: (歌剧,歌剧)，(拳击,拳击)1.2 应用例古诺双头垄断模型（Cournot Model of Duopoly ）二个企业，生产产量: q 1, q 2市场需求: P = a – Q , Q = q 1 + q 2 企业成本: C i (q i ) = cq i , i = 1, 2.企业利润：πi (q 1, q 2) = Pq i – C i (q i ) = (a – (q 1 + q 2))q i – cq i ，博弈的描述：参与人：企业1，企业2 战略：产量 q i 收益：πi (q 1, q 2) 企业 i 选择产量求ii S s ∈max πi (s i , , s j *):一阶条件11dq d π = a – c – 2q 1 – q 2* = 0 和22dq d π = a – c –q 1* –2q 2 = 0 厂商选择自己利润最大的产量q 1 =22q c a -- q 2 =21q c a -- 解纳什均衡得q 1* = q 2* =3ca -利润π1 = π2 = ( a – c – (3c a -+3c a -))3ca - = 9)(2c a -当 u i 是可微分的时候 , 纳什均衡为下列方程组的的解：in i s s s s u ∂∂),...,,(21= 0, i = 1,…, n思考：用重复剔除严格劣势战略求纳什均衡比较：如果两个厂商生产q 1 = q 2 =4ca - 利润π1 =π2 = ( a – c – (4c a -+4c a -))4ca - = 8)(2c a -例贝特兰德双头垄断模型（Bertrand Model of Duopoly ）两个企业生产有差别的商品。

消费者对企业 i 的需求q i (p i , p j ) = a – p i + bp j ，成本: C i (q i ) = cq i , i = 1, 2. 战略 s i : p i ≥ 0收益: πi (p i , p j ) = (a – p i + bp j )( p i – c )纳什均衡 (p 1*, p 2*) 满足max πi (p i , p j *) = max (a – p i + bp j *)( p i – c )解得 p 1* = p 2* = bca -+2例最后要价仲裁 (Final-offer Arbitration)一个企业和一个工会，通过一个仲裁人决定工资。

企业和工会同时提出工资: w f, w u仲裁人有一个标准：x，选择双方提议中比较靠近x的提议：如果x < ( w f + w u )/2，则w f如果x > ( w f + w u )/2，则w uw f(w f + w u )/2x w u企业和工会不知道x，但知道x的分布函数F(x)和密度函数f(x)。

分析w f 被选择的概率：Prob {x <2ufww+} = F⎪⎪⎭⎫⎝⎛+2ufwww u被选择的概率：Prob{ x >2ufww+} = 1 –F⎪⎪⎭⎫⎝⎛+2ufww期望工资Ew = w f F⎪⎪⎭⎫⎝⎛+2ufww+ w u 1 –F⎪⎪⎭⎫⎝⎛+2ufwww f* 满足fwm in w f F⎪⎪⎭⎫⎝⎛+2*ufww+ w u* 1 –F⎪⎪⎭⎫⎝⎛+2*ufwww u* 满足uwmax w f*F⎪⎪⎭⎫⎝⎛+2*ufww+ w u 1 –F⎪⎪⎭⎫⎝⎛+2*ufww由一阶条件F⎪⎪⎭⎫⎝⎛+2ufww+21wf f ⎪⎪⎭⎫⎝⎛+2ufww-21wu f ⎪⎪⎭⎫⎝⎛+2ufww= 021wf f ⎪⎪⎭⎫⎝⎛+2ufww+ 1 - F⎪⎪⎭⎫⎝⎛+2ufww-21wu f ⎪⎪⎭⎫⎝⎛+2ufww= 0 由此解出工资的均衡提议。

两式相减F⎪⎪⎭⎫⎝⎛+2ufww=21两式相加w u*f ⎪⎪⎭⎫⎝⎛+2ufww–w f*f ⎪⎪⎭⎫⎝⎛+2ufww= 1如果x为正态分布: x ~ N(m, σ2)2**ufww+= mw u* –w f*=)(1mf= 22πσ,纳什均衡w u* = m +2/2πσ, w f* = m–2/2πσ例公共财产问题一个村庄,有n个村民，在公共草地上放羊。

村民i放牧的羊数：g i全村的羊总数：G = g1+ ... + g n养一只羊的(私人)成本为c，一只羊的价值为v(G)当G < G max, v(G) > 0, v'(G) < 0, v''(G) < 0当G > G max , v (G ) = 0每个村民选择养羊数量使自己收益最大g i v (G ) – cg i 一阶条件v (G ) + g i v ' (G ) – c = 0, i = 1,..., n 将n 个等式相加得到nv (G ) + G v ' (G ) – nc = 0 即纳什均衡G 1满足v (G 1) +nG 1v ' (G 1) – c = 0 全村在总收益最大的放牧数G 2满足max G 2 v (G 2) – cG 2 一阶条件v (G 2) + G 2 v ' (G 2) – c = 0 G 1与 G 2哪一个大？ G1大vv (G ) O G max GG v ' (G )/nv' (G)G v' (G)决策问题：在条件变差时, 收益上升还是下降？在通常的(一人)决策中，如果有几个选择，决策者选择收益最大的一个。

如果外界条件改变，使他的一个或几个收益下降，则它无论怎样选择，都不会使收益比原来更大。

例在一块田里选择种植的(纯)收入：棉花3000元花生3700元玉米3500元如果成本上升，收入变为棉花3000元花生3200元玉米3400元人决策收益通常下降例在多人决策时的收益下降与增加（1）初始时参与人 2T1T2S15，48，3参与人1S2 4 ，3 6 ，5均衡为（S1，T1），参与人1的收益为5。

（2）外界条件使参与人1在选择S1时的收益下降参与人2T1T2S13，45，2参与人1S24, 3 6，5均衡变为（S2，T2）参与人1的收益为6。

多人决策时，收益可能上升。

1.3 混合战略和均衡的存在例1 儿童游戏：“石头、剪刀、布”不存在纳什均衡。

如何选择战略？例6 猜硬币(Matching Pennies)参与人2正面反面正面-1，1 1，-1参与人1反面1，-1 -1，1也不存在纳什均衡。

博弈论第一章

合集下载

博弈论第一章

第一章博弈论概述PPT课件

博弈论-第一章

1博弈论第一章

博弈论教程

北京大学博弈论课件第1章-博弈论概述

博弈论第一章ppt课件

第1篇博弈论

博弈论(第一章)

博弈论第一章引言

博弈论第一章

博弈论-第1章

博弈论1 (2)全篇

博弈论第一章

博弈论第一章

第一章博弈论的发展

博弈论第一章总结

文档推荐

最新文档

博弈论 第一章

合集下载

博弈论第一章

第一章 博弈论概述PPT课件

博弈论-第一章

1博弈论第一章

博弈论教程

北京大学博弈论课件第1章-博弈论概述

博弈论第一章ppt课件

第1篇 博弈论

博弈论(第一章)

博弈论第一章 引言

博弈论第一章

博弈论-第1章

博弈论1 (2)全篇

博弈论 第一章

博弈论第一章

第一章博弈论的发展

博弈论第一章总结

文档推荐

最新文档

博弈论第一章

第一章博弈论概述PPT课件

第1篇博弈论

博弈论第一章引言

博弈论第一章