博弈论的基本概念

  • 格式:doc
  • 大小:57.50 KB
  • 文档页数:7

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论的基本概念

•博弈论是研究两人或多人谋略和决策的理论。

•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。

•参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。

参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。

•信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

•策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。

•收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。

•均衡:均衡是所有参与者的最优策略组合,记为s*。

几个经典的博弈实例

•例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

• 例二 海滩占位 甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格,相同的质量向均匀散布在海滩上的众多游客销售冷饮。既然是做生意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。

• 例三 智猪争食 猪圈里有一头打猪和一头小猪。里面有一个猪食槽,槽的对面装有控制开关。只要去拱开关,就会有一次6个单位的饲料流进槽里。如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可以吃到1个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4个单位的饲料,小猪也能吃到2个单位的饲料。假定每拱一次开-1,-1 -9,0 0,-9 -6,-6 坦白 沉默 坦白 沉默 囚徒一

关需要消耗0.5个单位的饲料能量。它们长期一起进食,上面所说的情况两只猪都知道。它们应该如何选择?

完全信息静态博弈

• 静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选择行动有先后的话,后行动者也不知道先行动者所采取的行动。

• 博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合i ∈ N ;

(2)每个参与者的策略空间S i ;(3)每个参与者的收益函数ui 。

• 定义:在一个有n 个参与者的博弈中,参与者的策略空间S 1,S 2,…,S n ,收益函数为u 1,u 2,…,u n ,称G={S 1,S 2,…,S n ;u 1,u 2,…,u n }为此博弈的一个标准表述。

• 定义:如果对任一s i ’ ∈ S i ,s i ’ ≠ s i *, 不等式u i (s 1,…,s i-1, s i *, s i+1,…,s n )> u i (s 1,…,s i-1, s i ’ ,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立,那么 si*称为参与者i 的严格占优策略。

• 定义:在博弈的标准表述中,如果对所有的参与者i ∈N , s i * 是i 的严格0,0

6,-0.5 0.5,5 3.5,1.5 拱 不拱 拱 不拱 大猪 小猪

占优策略,那么策略组合s*=(s 1*, …,s n *)称为严格占优策略均衡。

• 定义:在标准表述的博弈中,设s i ’和s i ’’是参与者i 的两个可选策略,若u i (s 1,…,s i-1, s i ’,s i+1,…,s n )

2,0 0,1 0,3 0,1 1,2 1,0 上 下 左 中 右 参与者1 参与者2 0,1 0,3 1,2 1,0 上 下 左 中 参与者1 1,2 1,0 上 下 左 中 参与者1

• 定义:在博弈G={S 1,S 2,…,S n ;u 1,u 2,…,u n },策略s*= (s 1*,…,s i-1*, s i *,s i+1*,…,s n *)满足条件:对每一个参与者i ,都有对所有的s i ∈ S i , u i (s 1*,…,s i-1*, s i ,s i+1*,…,s n *) ≤ u i (s 1*,…,s i-1*,

s i *,s i+1*,…,s n *) 成立, 则称s*为该博弈的一个纳什均衡。

• 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系:严格占优策略均衡是纳什均衡;逐步剔除严格劣策略均衡是纳什均衡;反之不然。

完全信息动态博弈

• 动态博弈:各参与者的行动有先后顺序,而且后行动者在自己行动之前能观测到先行动者的行动。

• 定义:完全信息扩展式博弈形式是一个三元组F=(N,H,P ):其中N 是参与者的集合。H 是A (行动的集合)中元素组成的序列的集合并且满足:

(1)空序列()∈H ;(2)如果一个h ∈H ,则h|k ∈H , h|k 表示h 的长度为k 的子序列;(3)如果一个无穷序列的所有有穷子序列都属于H ,那么h 也属于H 。P :H/Z ➞ N ,其中Z ⊆H 且h ∈Z 当且仅当任给h ’ ∈H ,若h ’|k =h 则h ’ =h 。

• 对于n 个参与者有限战略的扩展式表述有一种直观的图形方法,就是博弈2,4 2,3 1,4 1,1 0,2 4,0 1,2 4,1 3,3 上 中 左 中 右 参与者1 下

在上面的这个博弈中既不存在严格占优策略均衡,也不存在逐步剔除严格劣策略均衡,对这样的博弈引入纳什均衡的概念。