博弈论的基本表达方式
- 格式:ppt
- 大小:122.50 KB
- 文档页数:9
第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。
本章讨论这个问题,建立复杂环境下的决策理论。
开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。
最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。
大部分经济行为都可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。
博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。
第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。
一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。
当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。
博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。
博弈论推广了标准的一人决策理论。
在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。
下面来举例说明。
例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。
局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。
对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。
当甲和乙都作出选择时,博弈的局势就确定了。
显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。
博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里,一个博弈可以用两种不同的方式来表述:一种是战略式表述(strategic form representation ),另一种是扩展式表述(或译为“展开式表述”)(extensive form representation )。
从分析的角度看,战略式表述更适合于静态博弈,而扩展式表述更适合于讨论动态博弈。
1.1博弈的战略式表述战略式表述又称为标准式表述(normal form representation )。
在这种表述中,所参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。
战略式表述给出:1.博弈的参与人集合:(),1,2,,i n ∈ΓΓ=。
2.每个参与人的战略空间:,1,2,,i S i n =。
3.每个参与人的支付函数:12(,,,),1,2,,i n u s s s i n =。
我们用()11,,;,,n n G S S u u =代表战略式表述博弈。
例如在两个寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。
1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =,战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。
如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略,即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式,i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。
博弈论公式大全
博弈论中的公式和定理有很多,以下是一些常见和重要的博弈论公式:
1. 纳什均衡公式:对于任意的策略组合s1,s2,如果对于所有的i,pi(s1, s2) >= pi(si(1), s2) 和 pi(s1, s2) >= pi(s1, si(2))都成立,则称(s1, s2)为纳什均衡。
2. 零和博弈公式:在零和博弈中,一方的收益等于另一方的损失,即总和为零。
常见的零和博弈有剪刀石头布游戏、赌博等。
3. 优势策略均衡公式:如果对于任意的对手策略s2,玩家i的策略s1都是最优的,则称(s1, s2)为优势策略均衡。
4. 纯策略与混合策略公式:在博弈论中,玩家的策略可以分为纯策略和混合策略。
纯策略是指玩家在每个信息集上选择固定的行动,而混合策略则允许玩家以一定的概率在多个行动中进行选择。
5. 贝叶斯均衡公式:在非完全信息博弈中,如果每个玩家都采用贝叶斯纳什均衡策略,那么这个策略组合就是贝叶斯均衡。
6. 最大最小值定理:对于完全二叉树博弈,如果每个节点都有正的权重,那么最大最小值就是所有叶子节点的权重的最大最小值。
7. 尼姆定理:在非零和博弈中,如果每个玩家都追求自己的最大收益,则至少有一个玩家会获得零收益。
8. 约翰逊定理:在完全信息博弈中,如果存在一个玩家有严格优势策略,那么这个玩家将获得所有收益。
9. 拉姆齐定理:在非完全信息博弈中,如果每个玩家都采用最优混合策略,那么这个策略组合就是拉姆齐最优。
以上是一些常见的博弈论公式,它们在博弈论的研究和应用中发挥着重要的作用。
stackelberg博弈的数学表达式Stackelberg博弈是博弈论中的一种重要形式,它是由德国经济学家海因茨·斯塔克尔贝格(Heinrich von Stackelberg)于1934年提出的,用于描述具有领导者和追随者的博弈情形。
在Stackelberg博弈中,领导者会先行选择策略,而追随者在知晓领导者选择的策略后再作出自己的决策。
这种不对称信息的情形使得领导者在选择策略时能够考虑到追随者的反应,从而获得更优的收益。
在实际生活中,Stackelberg博弈经常被用来分析企业之间的竞争策略、政府对市场的监管策略等方面。
在Stackelberg博弈中,参与者通常会通过数学模型来描述其决策过程。
对于一个简单的Stackelberg博弈,可以用以下的数学表达式来表示:1.定义参与者:在一个Stackelberg博弈中,通常会有两个参与者,分别是领导者和追随者。
2.定义策略集合:领导者和追随者分别有自己的策略集合,可以用S1和S2来表示。
其中,S1为领导者的策略集合,S2为追随者的策略集合。
3.定义效用函数:每个参与者在选择完策略后都会获得一个效用值,表示其收益情况。
通常会用u1和u2来表示领导者和追随者的效用函数。
4.定义约束条件:在实际情况下,参与者的选择可能会受到一些限制条件的约束。
这些约束条件通常会用c1和c2来表示。
通过上述的数学表达式,可以清晰地描述Stackelberg博弈中的参与者、策略、效用函数和约束条件,从而帮助分析者更好地理解其博弈模型。
接下来,我们将通过一个实例来说明Stackelberg博弈的具体应用。
假设有两家电信运营商A和B在同一个市场上竞争,A是市场领导者,B是追随者。
A可以选择提供高速网络服务或提供低价格服务两种策略之一,而B在A做出选择后可以选择跟随A提供相同的服务或采取不同的策略。
现在我们用数学模型来描述这个问题。
1.参与者:A是领导者,B是追随者。