博弈类型及其表述形式
- 格式:docx
- 大小:40.18 KB
- 文档页数:3
博弈演进形态
博弈的演进形态是多种多样的,它随着时间、环境、参与者之间的互动关系以及各种不确定性因素的变化而变化。
从博弈论的角度来看,博弈的演进形态大致可以分为以下几种:静态博弈:这是一种参与者同时进行决策的博弈形态,也称为零和博弈。
在静态博弈中,每个参与者的最优策略都取决于对手的策略,参与者之间没有先后行动的选择。
因此,静态博弈是一种较为简单的博弈形态。
动态博弈:动态博弈是指参与者的决策有先后顺序,后行动者可以通过观察先行动者的行为来做出自己的最优决策。
在动态博弈中,参与者需要考虑到对手可能的反应,并据此制定自己的策略。
动态博弈通常比静态博弈更加复杂。
重复博弈:重复博弈是指一系列具有关联性的决策序列。
在重复博弈中,参与者需要在考虑长远利益的同时,也要考虑到短期内的利益。
参与者可能需要与对手建立长期关系,以避免短视的决策带来的负面影响。
不完全信息博弈:在不完全信息博弈中,参与者对对手的策略和偏好等信息并不完全了解。
这种博弈形态需要考虑对手可能的策略和反应,以及对手的偏好和目标。
不完全信息博弈通常比完全信息博弈更加复杂和不确定。
总的来说,博弈的演进形态是多种多样的,每种形态都有其特点和适用场景。
在现实生活中,许多决策问题都可以通过博弈论来描述和解决。
理解不同博弈形态的特点和适用场景,有助于更好地理解和应对各种决策问题。
博弈模型汇总如下:
1.合作博弈与非合作博弈:这是根据参与者之间是否可以达成具
有约束力的协议来划分的。
合作博弈强调团队合作和协作,目标是达成共赢;而非合作博弈则强调个人利益最大化,不考虑其他参与者的利益。
2.静态博弈与动态博弈:这是根据参与者做出决策的时间顺序来
划分的。
静态博弈是指所有参与者同时做出决策,或者决策顺序没有影响;动态博弈是指参与者的决策有先后顺序,后行动者可以观察到先行动者的决策。
3.完全信息博弈与不完全信息博弈:这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。
完全信息博弈是指所有参与者都拥有完全的信息,能够准确判断其他参与者的策略和支付函数;不完全信息博弈则是指参与者只拥有部分信息,无法准确判断其他参与者的策略和支付函数。
4.零和博弈与非零和博弈:这是根据所有参与者的总收益是否为
零来划分的。
零和博弈是指所有参与者的总收益为零,一方的收益等于另一方的损失;非零和博弈则是指所有参与者的总收益不为零,各方的收益和损失不一定相关。
5.竞争博弈与合作博弈:这是根据参与者之间是否存在竞争或合
作关系来划分的。
竞争博弈是指参与者之间存在竞争关系,目标是追求个人利益最大化;合作博弈则是指参与者之间存在合作关系,目标是追求共同利益最大化。
6.微分博弈与离散博弈:这是根据决策变量的连续性来划分的。
微分博弈是指决策变量是连续变化的,需要考虑时间、速度等因素;离散博弈则是指决策变量只有有限个可能的取值,通常只考虑状态的变化而不考虑时间、速度等因素。
博弈论之
博弈的策略式表述方法
博弈的策略式表述
三个要素:
1.博弈参与人(Players) N—参与人的集合
i—参与人i N
博弈的策略式表述
三个要素:
2.博弈参与人的策略集(Strategy sets)
S i—参与人的策略集
s i—参与人i策略集S i中的一个元素
所有参与人的策略放在一起,称之为博弈的策略
, s2, … s n)
组合,表示为s = (s
1
博弈的策略式表述
三个要素:
3.博弈参与人的支付函数
u i —参与人i 的支付函数i N
i (s 1, s 2, s 3,..., s ,..., s n )
u i
博弈的策略式表述
例:一家生产商和一家营销企业正在就某种商业合作进行谈判。
他们估计合作的总利润是100万美元。
如果企业的CEO自己谈判,则会同意平分合作利润,即每家得50万美元。
但现在,一家CEO雇佣了一位律师来帮助谈判,这会使该企业多获得利润10万美元,而对方会减少10万美元。
雇佣律师的成本是5万美元。
如果两家企业都雇佣律师,合作利润仍然平均分配。
博弈的策略式表述例:45,4555,4040,5550,50
生产企业
CEO 自己谈判自己谈判雇佣律师
雇佣律师营销企业CEO 参与人
参与人策略支付
= (s 1, s 2, s 3,...,s i-1,s i+1,..., s n )S -i 所有参与人的策略集组合为:S =(S i ,S -i )
博弈的策略式表述
三个要素:
1.博弈参与人
2.博弈参与人的策略集
3.博弈参与人的支付函数。
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
博弈论知识点总结博弈论是一门研究决策与策略的数学理论,主要涉及博弈参与者之间的冲突、竞争和合作,并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。
下面是博弈论的一些基本概念和重要知识点的总结。
1. 标准形博弈(Normal Form Game):标准形博弈是博弈论中最常见的形式,参与者同时选择策略,并根据选择产生相应的收益或损失。
标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。
2. 纳什均衡(Nash Equilibrium):纳什均衡是指在一个博弈中,参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。
纳什均衡是博弈论的核心概念,用来描述博弈中的稳定状态。
3. 零和博弈(Zero-sum Game):零和博弈是指当其中一个参与者获得了收益,另一个参与者就会产生相应的损失,总收益为零。
在零和博弈中,参与者之间的利益完全相反,他们的决策是对立的。
4. 混合策略(Mixed Strategy):混合策略是指在博弈中,参与者以一定概率选择不同的纯策略。
混合策略在博弈论中用来描述参与者的随机决策,可以通过计算期望收益来确定最优混合策略。
5. 博弈树(Game Tree):博弈树是用来表示博弈过程的树状结构,每个节点代表一个博弈的状态,边代表参与者的策略选择。
博弈树可以用来推导纳什均衡策略和分析博弈过程。
6. 合作博弈(Cooperative Game):合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。
在合作博弈中,参与者通过互相合作,在利益最大化和成本最小化之间进行协商和决策。
7. 非合作博弈(Non-cooperative Game):非合作博弈是指参与者之间独立地做决策,不进行合作和协商的博弈形式。
在非合作博弈中,参与者根据自身利益进行策略选择,涉及策略选择和对手的预测。
8. 进化博弈(Evolutionary Game):进化博弈是将生物进化的概念引入博弈论中的一种模型。
经济学博弈论
经济学中的博弈论是一个重要的分支领域,它研究的是在多个参与者之间互动决策的情境下,他们可能采取的不同策略以及相应的结果。
博弈论在经济学中有广泛的应用。
下面是一些博弈论的基本概念和常见的博弈类型:
1. 策略(Strategies):参与者在博弈中可选择的行动或决策。
2. 支配策略(Dominant Strategies):一种策略在所有情况下都会产生更好的结果,无论其他参与者选择什么策略。
3. 纳什均衡(Nash Equilibrium):在博弈中,当每个参与者都选择了对自己最有利的策略,并且没有动机单独改变策略时,达到的状态就是纳什均衡。
4. 合作与背叛(Cooperation and Betrayal):博弈中参与者可以选择合作或背叛其他参与者,涉及到合作博弈和非合作博弈的概念。
5. 零和博弈(Zero-sum Game):参与者的利益总和为零,一个人的收益增加意味着其他人的收益减少。
6. 非零和博弈(Non-zero-sum Game):参与者的利益总和不一定为零,可以存在合作使得所有参与者都获益的可能性。
7. 重复博弈(Repeated Games):博弈过程会重复进行多次,参与者的策略可能受到之前行动的影响。
这些只是博弈论的基本概念,实际应用中还有更多复杂的情况和模型。
博弈论在经济学中可以用来分析市场竞争、企业战略、拍卖、资源分配等众多领域。
它对于理解和预测人类行为决策的影响具有重要意义。
博弈(算法描述)转[]博弈知识汇总有⼀种很有意思的游戏,就是有物体若⼲堆,可以是⽕柴棍或是围棋⼦等等均可。
两个⼈轮流从堆中取物体若⼲,规定最后取光物体者取胜。
这是我国民间很古⽼的⼀个游戏,别看这游戏极其简单,却蕴含着深刻的数学原理。
下⾯我们来分析⼀下要如何才能够取胜。
(⼀)巴什博奕(Bash Game):只有⼀堆n个物品,两个⼈轮流从这堆物品中取物,规定每次⾄少取⼀个,最多取m个。
最后取光者得胜。
显然,如果n=m+1,那么由于⼀次最多只能取m个,所以,⽆论先取者拿⾛多少个,后取者都能够⼀次拿⾛剩余的物品,后者取胜。
因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意⾃然数,s≤m),那么先取者要拿⾛s个物品,如果后取者拿⾛k(≤m)个,那么先取者再拿⾛m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。
总之,要保持给对⼿留下(m+1)的倍数,就能最后获胜。
这个游戏还可以有⼀种变相的玩法:两个⼈轮流报数,每次⾄少报⼀个,最多报⼗个,谁能报到100者胜。
(⼆)威佐夫博奕(Wythoff Game):有两堆各若⼲个物品,两个⼈轮流从某⼀堆或同时从两堆中取同样多的物品,规定每次⾄少取⼀个,多者不限,最后取光者得胜。
这种情况下是颇为复杂的。
我们⽤(ak,bk)(ak ≤ bk ,k=0,1,2,…,n)表⽰两堆物品的数量并称其为局势,如果甲⾯对(0,0),那么甲已经输了,这种局势我们称为奇异局势。
前⼏个奇异局势是:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,15)、(11,18)、(12,20)。
可以看出,a0=b0=0,ak是未在前⾯出现过的最⼩⾃然数,⽽ bk= ak + k,奇异局势有如下三条性质:1。
任何⾃然数都包含在⼀个且仅有⼀个奇异局势中。
由于ak是未在前⾯出现过的最⼩⾃然数,所以有ak > ak-1 ,⽽ bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。
博弈的分类方法和主要类型以下是 7 条关于博弈的分类方法和主要类型的内容:1. 合作博弈和非合作博弈呀!合作博弈就好比一群小伙伴一起搭积木,大家商量着怎么搭才能最高最稳,每个人都为了共同的目标努力,例子就是公司同事们合作完成一个大项目。
而非合作博弈呢,就像两个人抢玩具,都想着自己怎么才能拿到手,比如在商业竞争中,各个企业为了自己的利益争夺市场份额。
2. 静态博弈和动态博弈哦!静态博弈就如同一场拔河比赛,双方站定了位置就开始较劲儿,谁也不能临时改变策略,下棋就是一个典型的例子。
而动态博弈呀,就好像是玩躲猫猫,一方行动了,另一方根据对方的行动再做出反应,然后情况不断变化,谈恋爱时双方的互动就有点像动态博弈呢!3. 完全信息博弈和不完全信息博弈呀。
完全信息博弈就像是玩明牌的扑克牌,你清楚地知道所有的情况,比如考试时知道所有的题目和答案。
不完全信息博弈呢,则像蒙着眼猜东西,你只能知道一部分,那可就刺激啦!像在商业谈判中,双方可能并不完全了解对方的底线。
4. 零和博弈和非零和博弈呢!零和博弈不就是那种“不是你死就是我活”的局面嘛,就像两个人分一个苹果,一个人多了另一个人就少了,赌博有时候就是这样。
而非零和博弈可有意思了,像一起做蛋糕,大家一起努力把蛋糕做大,每个人都能分到更多,合作伙伴共同开拓市场就是这样呀!5. 连续博弈和离散博弈哟!连续博弈就好像是跑马拉松,一直跑一直跑,过程很漫长,股市里的长期投资就像这样。
离散博弈呢,就像短跑比赛,一下子就结束了,比如一次抽奖活动。
6. 对称博弈和非对称博弈呀。
对称博弈好比大家起点都一样,条件都相同,就像两个人进行公平的掰手腕比赛。
但非对称博弈可就不一样啦,可能一方强一方弱,这不就像拳击比赛中重量级别不同的选手对决嘛!7. 策略博弈和随机博弈呢!策略博弈就是要精心谋划,想好每一步怎么走,下象棋就是这样的例子呀。
随机博弈呢,有时候运气成分很大,就像抽奖,全看运气咯!我觉得博弈真的很神奇,不同的分类展现出不同的特点和魅力,在生活中到处都能看到博弈的影子,难道不是吗?让我们多去观察、多去思考,感受博弈带来的乐趣和挑战吧!。
1博弈的分类
博弈模型一般分为合作博弈( cooperative game )和非合作博弈( non- cooperative
game),如图。
合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素( Martin and Ariel Rub in stein ,2000, P2),也
就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联
盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关
系,并因为这种关系影响到博弈的结局。
合作博弈强调的是团体理性( collective
rati on ality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果
可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。
20世纪50年代,合
作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐
步转向在非合作博弈领域。
有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认
为两者不相上下(Martin and Ariel Rubinstein ,2000,P2)。
合作博弈,有时也叫做联盟博弈( coalitional game ),一般根据有无转移支付而分为
两类:可转移支付联盟博弈( coalitio nal game with tran sferable payoff )和不可转移
支付联盟博弈(coalitional game with non-transferable payoff )。
可转移支付也叫有旁
支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联
盟博弈。
可转移支付合作博弈
合作博弈
不可转移支付合作博
、非合作博弈
非合作博弈的分类主要从两个角度进行划分。
一是参与者的行动顺序。
从这个角度博弈可以分为静态博弈(static game)和动态博弈(dynamic game)。
静态博弈是指参与者同时选择行动或虽非同时但后行动者并不知前行动者采取了何种行动;动态博弈是指参与者的行
动有先后顺序且后行动者能够观察到先行动者所选择的行动。
二是参与者掌握的信息水平。
从这个角度,
博弈可以分为完全信息博弈和不完全信息博弈。
完全信息( complete
in formati on )指的是每一个参与者对所有其他参与者的特征、战略空间及支付函数有准确的知识;否则就是不完全信息(in complete in formatio n )。
综合上述两种分类方法,可将非合作博弈分成四类。
这四类博弈及其对应的均衡概念,大致上反映了20世纪50年代以来非合作博弈理论的主要进展和1994年三位诺贝尔经济学
将得主的主要贡献,同时也大致表明了“纳什均衡”及其精炼在博弈论发展中的地位和影响
(如表)。
表非合作博弈的分类及对应的均衡概念、主要贡献者
2博弈的表述形式
现代博弈理论根据不同的博弈类型给出了博弈模型的三种基本表达形式:标准式
(normal form )表述、扩展式表述( extensive form representation )和特征函数型表述。
前两者主要用于非合作博弈,后者主要用于合作博弈。
标准式表述
标准式表述又称为战略式表述( strategic form )或矩阵式表述(matrix form )。
标
准式表述将战略局势抽象为三个基本要素:
(a)博弈的参与者集N {1,2, ,n};
(b)每个参与者的战略集S j, i N ;
(c)每个参与者的支付函数集%, i N。
表示静态博弈。
标准式博弈也叫做战略博弈。
扩展式表述
扩展式表述在标准式表述的基础上,扩展了描述博弈局势的要素,比如参与者的行动顺序以及外生事件的概率分布等,可以描述更复杂的博弈局势,极大地扩大了博弈理论所能描述的范围,一般用来表述动态博弈。
扩展式表述一般包含六个要素:
(a)博弈的参与者集N {1,2, ,n};
(b)参与者的行动顺序(the order of moves ):即什么参与者在什么时候行动;
( c )参与者的行动空间( action set ):在每次行动时,参与者有些什么行动可供选择;
(d)参与者的信息集(in formation set ):每次行动时,参
与者知道些什么;
(e)参与者的支付函数:在行动结束时,每个局中人得到什么;
( f )外生事件(即“自然”的选择)的概率分布。
特征函数型表述
特征函数型表述主要用来表述联盟博弈或合作博弈。
令参与者集合为N,则称N的任
意子集S为联盟(coalition ),所有联盟的全体记为(N)。
可转移支付联盟博弈包括两个
要素:
(a)有限的参与者集N {1,2, ,n};
(b)将N的每个非空子集S (即一联盟)与
某个实数v(S)相联系的一个特征函数v。
因此,可转移支付联盟博弈可记为( N, V)。
其中特征函数v是指定义在(N)上的一
个实函数,其中v(S表示联盟S通过协调其成员的策略所能保证得到的最大赢得。
不可转移支付联盟博弈包括四个要素:
(a)有限的参与者集N {1,2, ,n};
(b)结果集X;
(c )将N的每个非空子集S (即一联盟)赋一个集合V(S) X的特征函数V;
(d)对每个参与者i N有一个X上的支付函数R i(X), i N。
因此,不可转移支付联盟博弈可记为(N,V,X,{R i(X)}) 。
博弈的三种表述形式之差别,主要在于描述信息的多寡。
扩展型表述形式包括的信息最多,如果去掉其中参与者行动顺序和信息结构等信息,可以简化出标准型表述形式。
在标准型表述形式的基础上,如果引入有约束力的义务且可强制执行的假设,省略掉战略集,则可进一步简化为特征函数型表述形式。
三种表述形式的可转化性,表明非合作博弈与合作博弈之间是可转化的。