扩展式博弈概述
- 格式:ppt
- 大小:640.50 KB
- 文档页数:35
博弈论策略的扩展式和战略式表述下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor.I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!博弈论策略的扩展式与战略式表述:深度解析博弈论,作为经济学、社会学、心理学等领域的核心理论工具,主要研究决策者在相互影响的环境下如何做出选择。
博弈扩展式表述转化为策略式表述有时为了理论研究,借助策略式表述博弈的结果分析扩展式博弈,需要将扩展式博弈转化为策略式表述博弈。
扩展式博弈的策略定义是:参与人在其每一个信息集上都要给出一个行动方案。
扩展式博弈分析的重要工作内容就是确定每个参与人在其每个信息集上如何进行行动选择。
策略一般地,若参与人i 的信息集集合为H i ,信息集i ∈H i 上的行动集为A i (i ),该行动集上的行动为a i (i )∈A i (i ),则参与人i 的策略则可表示为h i k i ∈ Hi {a i (i )}若参与人在每个信息集上的行动可以随机化,则称该策略为行为策略(behavioral strategy ),可记为h i k i ∈ Hi {i (i )},其中,i (i )∈(A i (i ))策略——一个例子请写出右图所示的博弈树双方各自的策略。
1有2个信息集,第一个信息集有三个行动,第二个信息集有2个行动。
因此共有六个策略。
可记参与人1的策略集为S 1={Aa ,Ab ,Ba ,Bb ,Ca ,Cb }。
这样表示的含义,以策略Bb 为例,表示的是参与人1在第一个信息集选行动B ,第二个信息集选行动b 。
同理,参与人2有两个信息集的策略集可以表示为S 2={lL ,lR ,rL ,rR }支付函数的确定确定了一个策略组合,就确定了相关路径。
通过对相关路径结果的分析,就可以确定参与人在该策略组合下的支付值。
以Aa VS lL 为例,这个策略组合确定的路径为所以在策略组合{Aa , lL }对应的支付向量为(4,1)参与人1的策略集为S 1={Aa ,Ab ,Ba ,Bb ,Ca ,Cb },参与人2的策略集为S 2={lL ,lR ,rL ,rR }支付函数的确定分析策略组合{Ca , lL }对应的博弈路径。
参与人在博弈开始首先选择行动C ,然后到达虚拟参与人结点Chance 。
在Chance 点,两条路径出现的概率分别为1/4和3/4,对应的支付向量分别为(0, 0)和(8, 8)。
博弈论拓展型表格通常被称为扩展式,是博弈论分析和解决多方参与复杂决策的重要工具。
下面我会为您简单介绍一下扩展式表格的结构和应用。
扩展式表格是一种用于博弈分析的结构化表示工具。
该表格由多个行为者(称为玩家)组成,每个玩家都有不同的可选策略,例如行动或不行动,而策略组合将会决定博弈结果的概率。
扩展式表格通常采用树状结构,每个分支都展示了一种策略的发展过程。
通常,扩展式表格可以由以下四个部分组成:
1. 玩家:参与博弈的玩家,每个玩家都有自己的策略集合。
2. 信息集:表明在某些必须在同一时间内作出决策的情况下,玩家可能无法判断对手所采取的策略,因此可以将这些相同的决策节点分到一个信息集中。
3. 行动:博弈中玩家可以选择的行动或策略。
4. 支付:在每个可能的情况下,如果某一方采取了一定策略,它将付出或获得多少报酬或利益。
在使用扩展式表格解决博弈问题时,通常会使用一些主要的博弈解决方法,如支配策略、纯策略,混合策略和子博弈平衡等,这些方法将有助于决策者分析博弈结果、推导出最优策略以及各玩家获得的报酬或利益。
总之,扩展式表格是一种博弈论分析工具,将博弈问题转化成了树状结构,有助于博弈分析和解决多方参与的复杂决策问题。
研究生《博弈论与信息经济学》第四讲 完全信息扩展式博弈:理论董志强 dongzhq@Spring,20061.什么是完全信息扩展式博弈?局中人的行动具有先后顺序。
完全信息:自然不首先行动,局中人的赢利是共同知识。
共同知识:令1K 2K 为参与人1和参与人2对状态集合Ω的知识函数。
一个事件E ⊆Ω是状态ω∈Ω中参与人1和2的共同知识(common knowledge between 1 and 2 in the state),如果ω是无穷序列121221(),(),(()),(()),K E K E K K E K K E ……中每个集合的一个元素。
通俗地说,如果存在这样一个状态,该状态下1和2都知道事件E ,并且1和2都知道“对方知道事件E ”,并且1和2都知道『对方知道“对方知道事件E ”』……如此循环,至于无穷。
那么,事件E 就可以说是这个状态下参与人1和2的共同知识。
完美信息:每个局中人在做决策时候都知道以前所发生的所有事件。
显然,若没有完全信息,就不可能有完美信息;但是反过来,若没有完美信息,则可能有或可能没有完全信息。
Definition :完美信息扩展博弈(extensive game with perfect information)有下列组成部分:• 一个参与人集合N ;• 一个序列集合H (有限或无限的)满足以下三个性质:空序列φ是H 的一个元素;如果1,,()k k K a H ∞=∈"(这里K 可以是无限的)且L K <,那么1,,()k k L a H ∞=∈";如果一个无限序列1,()k k a ="对每个正数L 满足1,,()k k L a H =∈",那么1,()k k a H =∈"。
H 的每个元素是一段历史(History );一段历史的每一组成部分都是一个参与人采取的行动。
如果k 是无限的,或者没有1K a +使1,,1()k k K a H ∞=+∈",那么历史1,,()k k K a H ∞=∈"就是终点(terminal )。
7.3扩展式博弈扩展式博弈定义7.13扩展式博弈一个扩展式博弈Γ由下列要素组成由下列要素组成::1、 有限的有限的参与人集合参与人集合N ;2、 行动集A ,它包括所有可能的行动它包括所有可能的行动,,不必是有限的不必是有限的3、 结或者或者历史的集合历史的集合X .(1) 初始结X ∈0x ,或空的历史或空的历史。
博弈从初始结开始开始。
(2) 对于一些有限多的行动A a i ∈,每个}{\0x x X ∈采取的形式为),...,,(21k a a a x =,这里a 1,a 2…表示第一步表示第一步、、第二步第二步。
的行动的行动。
(3) 如果对于一些K>1,K>1, }{\),...,,(021x X a a a k ∈,那么那么,,}{\),...,,(0121x X a a a k ∈−一个结或一段历史只是对在博弈中迄今已被采取的行动的一个完全的描述的行动的一个完全的描述。
}),({)(X a x A a x A ∈∈≡表示在历史}{\0x X x ∈之后轮到参与人行动时的该参与人可选择的行动集后轮到参与人行动时的该参与人可选择的行动集。
4、 一个行动集A x A ⊆)(0以及在A(x 0)上的一个概率分布π被用于描述博弈中自然的行被用于描述博弈中自然的行动动。
自然总是首先行动的首先行动的,,并且只行动一次并且只行动一次,,以概率π随机的在A(x 0)中选择一个行动。
因此,}{\),...,,(021x X a a a k ∈意味着对于i=1且只有i=1i=1,,)(0x A a i ∈。
5、 终点结集合A a X a x X x E ∈∉∈≡对于一切,),({},。
每个终点结描述了由开始至结束的博弈的一个特殊的完全演变特殊的完全演变。
6、 一个函数N x E X →}){(\:0U ι,表明在属于X 的每一个决策结上那个将轮到的采取行动的每一个决策结上那个将轮到的采取行动的参与参与人。