博弈论讲义3(1)
- 格式:ppt
- 大小:1.48 MB
- 文档页数:4
第八章博弈论前面章节对经济人最优决策的讨论,是于简单环境下进行的,没有考虑经济人之间决策相互影响的问题。
本章讨论这个问题,建立复杂环境下的决策理论。
开展这种研究的的理论叫做博弈论,也称为对策论(GameTheory)。
最近十几年来,博弈论于经济学中得到了广泛应用,于揭示经济行为相互制约性质方面取得了重大进展。
大部分经济行为均可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。
博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。
第一节博弈事例博弈是一种日常现象,例如棋手下棋,双方均要根据对方的行动来决定自己的行动,双方的目的均是要战胜对方,互不相容,互相影响,互相制约。
一般来讲,博弈现象的特征表现为两个或两个之上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益均取决于所有当事人的行动。
当所有当事人均拿定主意作出决策时,博弈的局势就暂时确定下来。
博弈论就是研究这种不相容现象的一种理论,且把当事人叫做局中人(player)。
博弈论推广了标准的一人决策理论。
于每个局中人的收益均依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人均必须考虑其他局中人面临的问题。
下面来举例说明。
例1.便士匹配(MatchingPennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人均有一块硬币,且且各自独立安排硬币是否正面朝上。
局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。
对于这个博弈,正面朝上和反面朝上,即甲和乙的策略集合均是{正面,反面}。
当甲和乙均作出选择时,博弈的局势就确定了。
显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。
博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里,一个博弈可以用两种不同的方式来表述:一种是战略式表述(strategic form representation ),另一种是扩展式表述(或译为“展开式表述”)(extensive form representation )。
从分析的角度看,战略式表述更适合于静态博弈,而扩展式表述更适合于讨论动态博弈。
1.1博弈的战略式表述战略式表述又称为标准式表述(normal form representation )。
在这种表述中,所参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。
战略式表述给出:1.博弈的参与人集合:(),1,2,,i n ∈ΓΓ=。
2.每个参与人的战略空间:,1,2,,i S i n =。
3.每个参与人的支付函数:12(,,,),1,2,,i n u s s s i n =。
我们用()11,,;,,n n G S S u u =代表战略式表述博弈。
例如在两个寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。
1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =,战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。
如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略,即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式,i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。
交通大学博弈论课程概要 (III)周林第四部分:不完全信息扩展式博弈1. 一般扩展式博弈的定义(F-T 3.3.1)一个一般扩展式博弈由(有向)博弈树表示。
博弈树由点和联结点的枝组成。
前点和后点。
起点无前点,终点无后点。
除起点外,每点有唯一的直接前访点。
除终点外的点代表决策点,每点x 只属于一个博弈者i (x ),从这点出发的枝代表i (x )在x 处的行动集A (x ) 。
博弈者i (x )在x 处拥有的信息由信息集h (x )表示。
h (x )包括了所有i (x )不能同x 区分开来的点。
对所有的h (x )中的点x ’,A (x ’) = A (x ) 。
因此我们可以将行动集记为A (h ) 。
对一个不完全信息的扩展式博弈来说,起点代表“自然”,从自然出发的枝代表外生随机事件,概率分布是给定的,不受博弈者选择的影响。
每一终点处给出所有博弈者的收益。
(当博弈进行无穷阶段时,所有博弈者的收益由博弈的历史决定。
)2. 一般扩展式博弈的策略式博弈表示(F-T3.4)每一个博弈者的一个策略罗列了他在他的每一信息集上的行动,是一个从信息集到行动的映射)()(,:i i i i h A h s A H s ∈→。
如果每一博弈者都选取一个特定的策略,我们可以用它们确定行动的历史,从而求出每人的收益。
这样我们就得到了一般扩展式博弈的策略式博弈表示。
3. 混合策略和行为策略。
混合策略在整个博弈尚未开始以前混合,行为策略在博弈开始后每一决策点处混合。
对具有完美记忆的博弈,混合策略和行为策略是等价的(Kuhn 定理)。
(F-T 3.4)4. 一般扩展式博弈的求解。
Nash 均衡和Nash 均衡的精细:逆向归纳法和子博弈完美。
(F-T 3.5)5. 重要例子:行动可观察无限重复博弈与无名氏定理:只要博弈者足够耐心,任何一个满足个人理性的可行的收益分配可以由一个无限重复博弈的Nash 均衡(或子博弈完美Nash 均衡)实现。
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。