第五讲博弈论基础

格式：ppt
大小：485.00 KB
文档页数：71

下载文档原格式

博弈论精品课件 (5)

但在博弈论(至少是传统的博弈论) 中，博弈被严格定义为完全理性的个人或群体的行为发生直接相互作用的情形，而博弈论正是研究这种情形下个人或群体的选择(即决策)以及这种选择所导致的结果的理论。
那么博弈论与传统的决策理论之间究竟有怎样的区别？
博弈论与传统决策理论的区别
决策：从若干个备选方案中选择一个。例如出门带伞问题就是一个决策问题。决策人 ( 主体 ) 对该问题的选择 ( 或决策)，取决于对未来天气状况的判断，而且决策的结果(带伞或不带伞)对未来的天气状况也不会产生任何影响。
2. 静态博弈与动态博弈
根据参与人的先后顺序来划分。 1) 静态博弈：同时行动； 2) 动态博弈：行动分先后。
3. 完全信息博弈与不完全信息博弈
参与人对其他参与人的特征，战略空间及支付函数在博弈开始是否已知。 1) 完全信息博弈：博弈开始时没有不确定的因素。 2) 不完全信息博弈：博弈开始时存在不确定的因素。
• Reinhard Selten将Nash均衡的概念扩展到动态的甚至是多阶段博弈。 • Harsanyi提出了如何将当时人们认为无法分析的不完全信息博弈，转换为运用已有的博弈理论及其他的数学方法便可以分析的博弈模型的一般方法，将博弈论的发展推向了另一个全新的发展阶段。
• 在对博弈问题进行理论研究的同时，博弈论的应用研究也得到了很大的发展，其应用范围已由20世纪五十年代初的军事领域，扩展到经济、政治、文化及法律等诸多领域。甚至对进化生物学和计算科学等自然科学也产生了重要影响。
猜硬币——游戏2
• 甲乙猜硬币正反：甲选择硬币的正反，若乙猜对，则甲给乙一元钱;若乙猜错，则乙给甲一元钱。 • 特点：自己的选择影响其他人的选择，反过来又影响自己的选择，也就是说：存在反作用。

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论基础-A-xjh(共48张PPT)

行动所组成的有序集。
例如：
—— 出门：带伞或不带伞 —— 打牌：出牌
信息（information）指局中人在博弈中的知识，特别是有关其他局中人（竞争者或对手）的特征和行动的知识。
一般地，信息是以信息集（information set）的概念来模型化的。可以将局中人的信息集看成是其在特定时点对于不同变量的取值的了解程度。
评论2：在重复博弈中，以往的经历或做法通常就确局定了中聚人点的B位置。
通零俗和地博说弈，指博在弈博结弈果中总一和组为局零中的人博所弈得称到为的零支左和付博（弈或。收益）恰好是另右一组局中人的损失。
——对产品的了解
（三）划分博弈的主要概上念
2， 1
完全信息——如“石头、剪刀、布”游戏
0， 0
局中人A 完备信息——“石头、剪刀、布”游戏中，你知道对方40%出石头，30%出布，30%出剪刀
林自由大学、比勒菲尔特大学和波恩大学。其主要贡献是在博弈论中引入了动态分析。
1920年Harsanyi出生于匈牙利，1947年获布达佩斯大学博士学位，后到，1954年获斯坦福大学博士学位，曾先后任教于澳大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献是将不完全信息引入了博弈论的研究。
S4＝。可以选择的花的品种为3种。
不同的花在不同的气候条件下的收成为：
天气
S1
S2
S3
S4
品种
A1
12
10
9
0
A2
8
8
4
4
A3
161232概率0.2
例如：
出门 ——对天气的判断
打牌
——对其他人的判断装修
——对产品的了解

博弈论入门(课堂PPT)

共同价值和赢者的诅咒
• 两家代理：1个积极估价，1个消极估价
prob(v/s)11//22
vs2 vs2
• v均匀分布
• 出价b=?（一家和两家出价时有不同吗）
• 考察b=s-1这样一个对称策略
• 德士古公司的例子
15
几种常见的拍卖形式
• 英式公开叫价拍卖 • 荷式公开叫价拍卖 • 一价密封拍卖 • 二价密封拍卖
• 通过改革，陪审团制度在美国得到了比英国更好的发展。
22
投票程序
23
• 每个陪审员在陪审之前已经有一个大体的判断
• 他们的类型 • 非专业性——从众行为
– 如果评判有罪的人数多于无罪，则投有罪 – 如果评判无罪的人数多于有罪，则投无罪 – 如果双方人数相等，则依照自己的评判结果
投票
24
• 陪1：假设投有罪 • 陪2：若评判有罪，则投有罪；若评判无
• 在被问及对最终的价格是否感到意外时，Frija抛下一个“不”字，随即离开了
11
简化的暗标拍卖
密封递交标书统一时间公正开标标价最高者以所报标价中标中标博弈方的得益不仅取决于标价，还取决于他对拍
卖标的物的带有很大主观性的估计每个博弈方的估价通常是自己的私人信息
12
0.6
0.4
• 考虑这样一个对称策略：给定其他两个委员采取相同策略，以及对于其他成员拥有哪个政策更好的知识的信念，不论这个参与者什么类型，采取这个策略都使他收益最大。
19
• 自然决定四项：哪个政策更好，以及三个委员的类型。
• 当一个委员了解新政策时：投票给自己认为更好的策略是一个弱占优策略。
– 当另外两位投票相同时 – 当另外两位投票分歧时

纳什均衡——博弈论的基础

纳什均衡——博弈论的基础下载温馨提示：该文档是我店铺精心编制而成，希望大家下载以后，能够帮助大家解决实际的问题。

文档下载后可定制随意修改，请根据实际需要进行相应的调整和使用，谢谢!并且，本店铺为大家提供各种各样类型的实用资料，如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等，如想了解不同资料格式和写法，敬请关注!Download tips: This document is carefully compiled by the editor. I hope that after you download them, they can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!In addition, our shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!纳什均衡——博弈论的基础引言博弈论作为一门交叉学科，融合了数学、经济学、政治学等多个领域的知识，旨在研究决策者在相互影响下的最佳策略选择。

博弈论知识点总结完整版

博弈论一：基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈：a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足：uisi;s-i>uisi';s-is-i; si' sib、占优均衡：一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡：a、“严劣”和“弱劣”的含义：设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义：重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二：纳什均衡Nash Equilibrium2.1纳什均衡定义：对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即：u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义：纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合：当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择；没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理：Nash在1950年证明：任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立；定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三：混合策略Mixed Strategies 纳什均衡3.1定义：混合策略的定义：在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是： UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义：基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义：对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法：a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四：多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是：在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是：多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如：参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点：人们通常会协调彼此的行为..你弱他就强；先例产生的影响远大于逻辑或者法律效力；人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义：如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五：动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合：i=1; … ;N..用N表示虚拟参与人“自然”；自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动；参与人的行动空间actionset：在每次行动时;参与人可选择的行动集合；参与人的信息集information set：每次行动时参与人知道什么；参与人的收益函数：在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是：各阶段各参与人的行动数目有限；博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点；终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注：每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义：当A选择开发时;B选择大括号中前面的策略；当A选择不开发时;B选择大括号中后面的策略..B的纯策略为：{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为：SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法：a逆向归纳法求解策略：从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较：如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件：x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法：前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是：参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理：令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..（七）不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。

第五讲.博弈论

定义：博弈就是一些个人、队组或其他组织，面对一定的环定义境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs)
二、50年代中后期一直到70年代博弈论发展的青年期 1954-1955年提出了“微分博弈”（Differential games）的概念。奥曼则在1959年提出了“强均衡”（Strong equilibrium）的概念。 “重复博弈”（Repeated games）也是在50年代末开始研 Repeated games 50 究的，这自然引出了关于重复博弈的“民间定理”（Folk Folk theorem）。 1960年（Thomas C. Schelling）引进了“焦点”（Focal point）的概念。博弈论在进化生物学（Evolutionary Biology）中的公开应用也是在60年代初出现的。
一、基本模型
囚徒 2 坦白囚坦白徒 1 不坦白囚徒1：坦白囚徒2：坦白 -5， -5 不坦白 0， -8
-8， 0
-1， -1
两个罪犯的得益矩阵
二、双寡头削价竞争
寡头2 寡头高价寡头 1 高价低价 100，100 150，20 低价 20，105 70，70
双寡头的得益矩阵政府组织协调的必要性和重要性
重复博弈：同一个博弈反复进行所构成的博弈，重复博弈提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题有限次重复博弈无限次重复博弈
1.3.5 博弈的信息结构

五讲博弈论基础共72页

第一节博弈论导论
博弈的四要素： 1.博奕的参加者，即博奕方或参与人。
2.各博奕方可选择的全部策略或行为的集合。
3.进行博奕的次序。
4.博奕方的得益。例：囚徒困境
囚徒A
坦白抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为：A、B都选择坦白，各判8年刑
第一节博弈论导论
比如说：夜间唱歌
科斯定理图示
农场主的边际净损失
牧羊的边际利润
S
P
O
社会最优量
牧养人放牧的数量
说明
如果产权归农场主，农场主可以禁止放牧（点0），小于社会最优量S；但此时，增加放牧给牧羊人带来的边际利润大于给农场主造成的损失，牧羊人将有积极性贿赂农场主，直到放牧量达到S为止；
如果产权归牧羊人，牧羊人的利润最大点是P，大于社会最优量S；但此时，减少放牧量对牧羊人的边际利润损失小于给农场主节约的边际成本，所以，农场主将有积极性贿赂牧羊人，直到S；
博奕论前提假设：博弈的参与者都是理性人所谓理性人是指有一个很好定义的偏好，在面临给定的约束下最大化自己的偏好。理性人可能是利己主义者，也可能是利它主义者。
第一节博弈论导论
例：囚徒困境
囚徒A
坦白抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为：A、B都选择坦白，各判8年刑
革命通常不是一个帕累托改进。
外部性与科斯定理
个人收益与社会收益：一项活动的社会收益等于决策者个人得到的收益加社会其他成员得到的收益，如养花；
个人成本与社会成本：社会成本等于决策者的个人承担的成本加社会其他成员承担的成本，如环境污染，交通堵塞；

《博弈论的基本概念》课件

智猪博弈
• 总结词：描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述：在智猪博弈中，一个大猪和一个小猪共同生活在一个猪圈里，食槽位于猪圈的一端。每次食物被放入食槽时，大猪和小猪都有两种选择：冲向食槽或继续等待。如果大猪选择冲向食槽，小猪的最佳策略是等待，因为大猪吃掉大部分食物后，小猪可以享用剩余的食物。相反，如果小猪选择冲向食槽，大猪的最佳策略也是等待，因为小猪可能无法抢到任何食物。因此，无论大猪如何选择，小猪的最佳策略都是等待；同样地，无论小猪如何选择，大猪的最佳策略也是等待。
合作博弈
特征
强调合作、协议和联盟，目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动，目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递，策略和行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论：研究决策主体在相互影响、相互作用的环境中如何进行决策，以及这种决策的均衡结果的学科。
02
博弈论强调参与者之间的互动关系，通过数学模型和理论分析来研究策略选择和均衡结果。
应用领域：拍卖机制设计、保险市场分析、医疗资源分配等。

03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中，参与者是决策的主体，可以是个人或组织。

博弈论基础5

27
4
第一节矩阵型表示与展开型表示
垄断者
{容忍,容忍} {抵抗,抵抗} {抵抗,容忍} {容忍,抵抗}
进入者
进入
5 1 -2 10 0 0
2 -2 4 0
2 1 10 0
5 4
不进
5
第一节矩阵型表示与展开型表示
矩阵型表示→ 矩阵型表示→展开型表示
囚徒困境中分开关押的囚犯决策把参与者1、2之间的同时行动博弈表示如下：
13
第二节同时决策与序贯决策的混合博弈
例：联想和方正两家计算机公司，彼此就新产品研发展开联想和方正两家计算机公司，两家计算机公司博弈竞争。博弈持续时间为一年。假设两家公司致力博弈竞争。博弈持续时间为一年。推出的新产品类型相同，并且双方都知道对方要这样推出的新产品类型相同，做，但他们没有向公众公开他们的研发预算。了解研但他们没有向公众公开他们的研发预算。发投入决策的唯一方法，是通过在产业年度交易展商发投入决策的唯一方法，观察其产品的性能来推断最终产品情况。在交易展上观察其产品的性能来推断最终产品情况。观察到对手的新产品后，双方对各自新产品进行定价。观察到对手的新产品后，双方对各自新产品进行定价。假定两家公司的研发决策有大投入和小投入两种，定假定两家公司的研发决策有大投入和小投入两种，价决策有高价和低价两种。价决策有高价和低价两种。
I.
始于单节信息集的决策节点n（不包括博弈的初始决策节点）；包含博一书中n之下所有的决策节点和末端节点（不在 n下的节点除外）；没有对任何信息集形成分割。
II.
III.
21
第三节展开型博弈的子博弈
1 D 2 B E A F C G 3 4 5 6 7 8

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

个人最优与社会最优的不一致意味着有帕累托改进的余地；核心是如何将外部性内部化：如果有办法使得个人在边际上承担全部的社会成本和获得全部的社会收益，问题就解决了；传统的理论：政府管制或对个人征收皮古税（或补贴）；在负外部性的情况，征税和补贴代表不同的产权安排。
皮古税或补贴如何解决问题？
试问：“空城计”中双方是否满足拥有“共同知识”的要求？
第一节
博弈论导论
司马知孔明“平生谨慎，不曾弄险”－退兵
孔明知<司马知孔明“平生谨慎，不曾弄险” >－空城计
司马不知“孔明知<司马知孔明“平生谨慎，不曾弄险” >”－退兵孔明知司马不知“孔明知<司马知孔明“平生谨慎，不曾弄险” >” －空城计
交易成本与次优选择
定义：交易成本包括所有与交易有关的成本，包括发现交易对象失（与帕累托最优相比）；交易成本存在的原因：
交易者的数量（人越多，达成本协议越难）信息不对称（信息越不对称，谈判越难，合同的执行也越难）
交易成本意味着：只有次优，没有最优；
外部性与科斯定理
个人收益与社会收益：一项活动的社会收益等于决策者个人得到的收益加社会其他成员得到的收益，如养花；个人成本与社会成本：社会成本等于决策者的个人承担的成本加社会其他成员承担的成本，如环境污染，交通堵塞；如果个人收益（/成本）不等于社会收益，我们说存在外部性。
个人最优决策与社会最优
社会最优产量
个人最优产量
产量
图示说明：社会收益大于个人收益养花为例
边际成本与边际收益边际个人成本（等于边际社会成本）
边际社会收益
边际个人收益
个人最优产量社会最优产量
产量
举例
环境污染；夜间施工；交通事故；垄断定价；国有企业的恶性竞争；教育；
政府管制、皮古税与科斯定理
边际成本与
边际社会成本
（加税后的边际个人成本）
边际税率=边际外部成本
边际收益
边际个人成本（无税情况）边际个人收益
（等于边际社会收益）
社会最优产量
个人最优产量
产量
科斯定理
Coase（1960）：只要产权界定是明晰的，如果交易成本为零，外部性可以通过当事人之间谈判解决，帕累托效率可以实现；并且，最终的资源配置与初始的产权安排无关。比如说：夜间唱歌
这两种情形有什么不同？为什么法律允许第二种情形而不允许第一种情形？
帕累托效率
定义：一种状态（资源配置、社会制度等）被称为帕累托最优状态，如果不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好。简单的说法是：对每个人来说，除非“损人”就不可能 “利己”，社会就达到了帕累托最优状态。不同帕累托状态之间不可以比较
第一节
博弈论导论
注意理解： 1.纳什均衡是如何产生的？ 2.囚徒困境反映的个人理性与集体理性的矛盾性。 3.现实中那些问题属于囚徒困境问题？
彩电业的价格联盟、人民公社制度的效率低下、
公海捕鱼（外部性与科斯定理）、军备竞赛、改革与搭便车等 4.纳什均衡的哲学思想：只有构成纳什均衡的协议，才没有人有积极性偏离协议规定，才能被参与人自动、自觉的实施。
所以，帕累托最优可能意味着收入分配的不公平；极端地，一个人得到所有收入，另一个人一无所有，也是一个帕累托最优
以两人社会为例
B 的收入
X 。
X和Y都是帕累托最优状态，但Z不是帕累托最优状态。 Y
Z 。
A的收入
帕累托改进与帕累托标准
定义：一种变革没有使任何人的处境变坏，至少有一个人的处境变好。如果一种状态不是帕累托最优，意味着存在帕累托改进的可能。如果社会已经处在帕累托最优状态，就不可能有帕累托改进的余地。状态X帕累托优于状态Y，如果在状态X下，至少有一个人的处境比状态Y下更好，而没有任何人的处境比在状态Y下坏。
第一节
博弈论导论
5.支付函数：是指在一个特定的战略组合下参与人获得的确定效用水平，或是参与人得到的期望效用水平，它是所有参与人战略或行动的函数，是每个参与人真正所关心的。
注：与信息有关的一个重要概念是共同知识，它指“所有参与人知道，所有参与人知道所有参与人知道，所有参与人知道所有参与人知道…”的知识。
第一节
博弈论导论
例：空城计与共同知识
懿果见孔明坐于城楼之上，笑容可掬，焚香操琴。城门内外，有十余百姓，低头洒扫，旁若无人。懿见毕大疑，急令军速退。次子司马昭曰：“莫非诸葛亮无军，故作此态？父亲何故退兵？”懿曰： “亮生平谨慎，不曾弄险。今城门大开，必有埋伏。宜速退”。见魏兵退去，众人无不骇然，乃问孔明曰：“司马乃魏之名将，今统十五万精兵到此，见了丞相，便速退去，何也？”孔明曰：“此人料吾生平谨慎，必不弄险；见此模样，疑有伏兵，所以退去。吾非行险，盖不得已而用之”……“吾若为司马懿，便不速退也”
第一节博弈论导论
例：囚徒困境
坦白
囚徒A 坦白抵赖
囚徒B
抵赖
-8,-8 -10,0
0,-10 -1,-1
均衡结果为：A、B都选择坦白，各判8年刑
第一节博弈论导论
“囚徒困境”的博弈树
A
坦白 B 坦白抵赖坦白抵赖 B 抵赖
（-8,-8） (0,-10)
(-10,0)
(-1,-1)
均衡结果为：A、B都选择坦白，各判8年刑
第一节
博弈论导论
1994年纳什（Nash）、泽尔腾(Selten)、海莎尼 (Harsanyi)被授予诺贝尔经济学奖。 2.国内国内学者对博弈论的发展没有开创性的贡献。 90年代初一批留学人员归国，引入“博弈论与信息经济学”，其中以北大教授张维迎的《博弈论与信息经济学》（1996年出版）一书最引人注目。
第一节博弈论导论
什么是博弈论（Game theory）研究决策主体的行为直接发生相互作用的时候，主体如何决策以及决策的结果（均衡）是什么。
博奕论前提假设：博弈的参与者都是理性人
所谓理性人是指有一个很好定义的偏好，在面临给定的约束下最大化自己的偏好。
理性人可能是利己主义者，也可能是利它主义者。
两人社会为例
B
的收入
H 。。 X 。 F Z 。
从Z到F、X是帕累托改进；从Z到H、G不是帕累托改进；从H、G到X、F、Z都不是帕累托改进
G 。
A的收入
卡尔多-希克斯（Kaldor-Hicks）标准
设想：状态X下，A的收入是100，B的收入也是 100；在状态Y下，A的收入是1000，B的收入是 99。依帕累托标准，这两个状态是不可比较的： A在状态Y下更好，B在状态X下更好。卡尔多-希克斯标准：如果一种变革使得受益者的所得足以弥补受损者的所失，这种变革就是一个卡尔多-希克斯改进。如果补偿实际发生，就是帕累托改进。因此，“卡尔多-希克斯标准”就是 “财富最大化”。
第一节
博弈论导论
博弈论的基本概念 1.参与人：博奕中选择行动以最大化自己效用的决策主体（个人、团体、国家、企业）。
2.行动：参与人的决策变量。用ai表示第i个参与人的一个特定行动，Ai={ai}表示可供i选择的所有行动的集合。 n人博奕中，n个参与人的行动的有序集 a=(a1…ai…an)称为行动组合。注：博奕论中，一般假定参与人的行动空间和行动顺序是所有参与人的共同知识。
博弈论的历史发展 1.国外
产生的标志：1944年冯· 诺伊曼和摩根斯坦恩合作《博弈论和经济行为》
50年代是博弈论巨人出现的年代：纳什（Nash）提出纳什均衡概念、塔克尔（ Tucker ）讨论了“囚徒困境”。
60年代泽尔腾(Selten)引入动态博弈分析，提出“精练纳什均衡”概念；海莎尼(Harsanyi)引入不完全信息博弈. 80年代克瑞普斯和威尔逊引入不完全信息重复博弈
作为激励机制的法律
法律通过责任的分配和赔偿/惩罚规则是实施，将个人行为的外部成本内部化，诱导个人选择社会最优的行动；如果个人之间签约的交易成本太高，法律可以节约交易成本；以交通事故为例：司机开车可能伤害他人，但要每个司机与所有可能的受害人签定合同是不可能的，有关交通的法律法规（侵权赔偿）替代了合同；但法律面临信息约束。
第一节
博弈论导论
博弈的四要素： 1.博奕的参加者，即博奕方或参与人。
2.各博奕方可选择的全部策略或行为的集合。 3.进行博奕的次序。 4.博奕方的得益。例：囚徒困境
坦白囚徒A 囚徒B 抵赖
坦白
抵赖
-8,-8 -10,0
0,-10 -1,-1
均衡结果为：A、B都选择坦白，各判8年刑
第一节
博弈论导论
问题：“一个两人世界构成的经济中，甲比乙做任何工作的产出都高，则对甲来说，交易是不必要的” 。这个判断对吗？
？
下图是张三和王二在东北野外原始森林中的生产信息。假设野人参和野灵芝生长在不同的两座高山上，一个人一天只能采摘其中一种。单位：一天
姓名
采摘野人参
采摘野灵芝
张三王二
3 4
2 6
科斯定理图示
农场主的边际净损失
牧羊的边际利润
S
O
社会最优量
P
牧养人放牧的数量
说明
如果产权归农场主，农场主可以禁止放牧（点0），小于社会最优量S；但此时，增加放牧给牧羊人带来的边际利润大于给农场主造成的损失，牧羊人将有积极性贿赂农场主，直到放牧量达到S为止；如果产权归牧羊人，牧羊人的利润最大点是P，大于社会最优量S；但此时，减少放牧量对牧羊人的边际利润损失小于给农场主节约的边际成本，所以，农场主将有积极性贿赂牧羊人，直到S；因此，无论初始产权如何安排，双方谈判可以实现帕累托最优。科斯定理意味着：如果没有交易成本，公司治理结构（包括股权结构）是无关紧要的

第五讲博弈论基础

合集下载

博弈论精品课件 (5)

博弈论完整版PPT课件

博弈论基础-A-xjh(共48张PPT)

博弈论入门(课堂PPT)

纳什均衡——博弈论的基础

博弈论知识点总结完整版

第五讲.博弈论

五讲博弈论基础共72页

《博弈论的基本概念》课件

博弈论基础5

文档推荐

最新文档

第五讲 博弈论基础

合集下载

博弈论精品课件 (5)

博弈论完整版PPT课件

博弈论基础-A-xjh(共48张PPT)

博弈论入门(课堂PPT)

纳什均衡——博弈论的基础

博弈论知识点总结完整版

第五讲.博弈论

五讲博弈论基础 共72页

《博弈论的基本概念》课件

博弈论基础5

文档推荐

最新文档

第五讲博弈论基础

五讲博弈论基础共72页