非对称进化博弈
- 格式:docx
- 大小:866.50 KB
- 文档页数:13
摘要本文以进化博弈理论的基本均衡概念----进化稳定策略的提出、发展及不断完善为主线,在指出原初概念缺陷的基础上,文章从非对称博弈、有限群体、随机因素及动态过程四个方面分别介绍了博弈论理论家们对该概念的拓展。
关键词:进化稳定策略;渐近稳定性;严格N群体ESS;随机稳定集;群体稳定集引言进化博弈理论来自于达尔文的生物进化论,至少自雷威丁(Lewontin 1960)用于解释生态现象②就已经产生了。
但直到1973年梅纳德?史密斯和普莱斯(Maynard Smith and Price)、梅纳德?史密斯(1974)提出了该理论的基本均衡概念----进化稳定策略[3](evolutionary stable strategy, ESS)及泰勒和乔克(Taylor and Jonker)提出该理论的基本动态概念---模拟者动态以后,进化博弈理论得到了理论界的普遍关注。
特别是1992年关于进化博弈理论发展的国际学术会议在康奈尔大学的召开,正式确定了进化博弈理论在经济学上的学术地位,此后,该理论在经济学便上获得了迅速的发展及广泛的应用。
越来越多的经济学家运用进化博弈理论来分析诸如社会制度变迁[阿克赛尔罗德和米尔顿(Axelrod and Hamilton 1981);阿克赛尔罗德(1984)]、行业发展趋势[波特Porter 1980)]、股市发展方向[康利斯克(Conlisk 1980);利奈尔和罗尔(Cornell and Roll 1981)]、消费者对品牌的选择[凯思和史培罗(Katz and Shapiro 1985)]、社会学习过程[弗登博格(Fudenberg 1995)]及社会习俗形成[彼特?杨,(H. Peyton Young 1993,1998)等领域的相关问题。
进化稳定策略是进化博弈理论最基本的均衡概念,它具有广泛的应用并在发展中得到了不断完善。
本文以进化稳定策略概念的发展为主线来介绍博弈论理论家们对它在不同条件下的拓展。
博弈的演化模型应用随着信息技术的发展,博弈理论在金融、管理、经济、和社会等多个领域发挥着越来越重要的作用。
博弈理论的基本思想是研究两个或多个博弈者对同一局面的策略选择,研究在该局面下达成最优博弈结果的方法。
其中,演化博弈模型是其中一种重要的研究方法,具有自适应和自我学习的特点,可以用来研究一系列博弈中的动态演化、策略竞争、协商合作等问题。
演化博弈模型的基本概念是基于非对称矩阵博弈的理论,模型由一系列变量来描述,例如策略池概念,即可以描述不同策略池中参与者的策略以及当前及潜在环境下策略收益的变化。
通过演化博弈模型,我们可以模拟和调查不同博弈者之间的策略演变,以及某种策略在不断演变中如何优化和改变自身以及其他参与者的结果。
另外,演化博弈模型可以与其他智能算法(如人工神经网络、监督式学习等)相结合,全面解决博弈问题,使博弈者可以有效地识别所处局面并针对当前局势进行合理的策略选择。
演化博弈模型在实际应用中表现出了广泛的用处。
一般来说,它的应用在于帮助博弈者在博弈中达到最佳结果。
比如,我们可以利用演化博弈模型研究在市场竞争中两个企业之间的战略决定;可以利用模型来研究全球货币政策中政府和商业银行之间的博弈等。
此外,演化博弈模型也可以用于研究国际关系,模拟不同国家之间的策略博弈环境、资源分配等问题。
在研究国际关系中,演化博弈模型可以用来模拟不同国家之间的战略选择,从而研究其策略的有效性,以及影响策略选择的各种因素,像财政政策、贸易政策、外交政策等。
最后,演化博弈模型对现实生活也有很多应用。
以金融博弈为例,演化博弈模型可以帮助金融机构进行精确的风险管理,预测金融行业的发展趋势,以及优化金融投资的收益等。
此外,演化博弈模型还可以应用于分析多边贸易环境中各国之间的策略博弈情况,以及解决国际商业纠纷等问题。
综上所述,演化博弈模型是一种强大而多用的博弈分析工具,它不仅可以应用于研究金融、管理、经济以及国际关系等,还可以用于解决实际应用中的各种问题。
两人非对称博弈的复制动态和进化稳定性1.人是完全理性的还是有限理性的?经济学通常假设人们有完全理性,有始终追求最大利益的完美意识、分析推理和准确行为能力。
现实是这样的吗?这种假设的现实性是有问题的。
事实上人们只是在分析处理简单问题时接近完全理性要求,在分析处理复杂问题时理性的局限性很明显。
不能满足完全理性要求的就是有限理性的。
以有限理性为基础的博弈称为有限理性博弈。
有限理性的博弈方往往不会一开始就找到最优策略,均衡通常是调整改进的结果,而且即使达到也可能再偏离。
2.有限理性博弈是怎样形成的?有限理性博弈的有效分析框架是借鉴生物进化博弈理论发展起来的进化博弈论,也称为“经济学中的进化博弈论”。
生物进化博弈理论是以达尔文的自然选择思想为基础的生物学理论,研究生物种群通过变异和增殖的共同作用,拥有增殖成功率较高形状的个体在种群中比例的变化、稳定及其对生物进化的影响。
有限理性博弈方的学习和策略调整与生物进化博弈研究的生物特征动态变化很相似,而有限理性博弈的均衡稳定性则与生物进化博弈中描述性状特征频数、比例稳定性的“进化稳定策略”概念相似,因此借鉴生物进化博弈的分析方法讨论有限理性博弈是最有效的分析框架。
有限理性博弈的核心不是博弈方的最优策略选择,而是群体成员采用特定策略比例的变化趋势和稳定性。
3.进化博弈论与传统完全理性博弈理论的联系一方面进化博弈论是以传统的完全理性博弈论为基础的,进化博弈论研究的许多博弈问题和模型都是完全理性博弈的经典模型,而且在进化博弈分析中仍需要用完全理性博弈分析方法分析博弈方的策略和得益。
另一方面进化博弈论中的两人非对称博弈的进化博弈分析对应的是两个(或多个)有差别的有限理性博弈方群体成员之间的随机配对博弈。
一、一般两人非对称博弈的复制动态和进化稳定策略。
1. 写出复制动态方程。
1>博弈方1的复制动态方程111111d ()(,)()()d x x t F x t u u t=-x y1α2α1β2β1y 2y 1x 2x 博弈方1博弈方2222121d ()(,)()()d x x t F x t u u t =-x y111111112111212112111112112 =(1,0) =(0,1)1 =(,)a b y u c d y a b y u c d y a b y u x x c d y αα⎧⎛⎫⎛⎫⎪ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪⎨ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪ ⎪⎪⎪⎝⎭⎝⎭⎩其中采用的人的期望得益采用的人的期望得益博弈方群体的平均得益 2>博弈方2的复制动态方程111212d ()(,)()()d y y t F y t u u t =-x y 222222d ()(,)()()d y y t F y t u u t =-x y2212112222222212222212122221 =(,)00 =(,)12 =(,)a b u x x c d a b u x x c d a b y u x x c d y ββ⎧⎛⎫⎛⎫⎪⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪⎨⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪ ⎪⎪⎪⎝⎭⎝⎭⎩其中采用的人的期望得益采用的人的期望得益博弈方群体的平均得益2.进化策略稳定性分析以博弈方1的复制动态方程为例,令1(,)0x F =x y ,求得稳定状态*x ,通过“稳定性定理”(在稳定状态处1(,)x F 'x y 必须小于0,也就是说,当干扰使得x 出现高于*x 时,1(,)x F x y 必须大于0,当干扰使得x 出现低于*x 时,1(,)x F x y 必须小于0)判断*x 是否为ESS 。
二、例子(一)市场阻入博弈的复制动态和进化稳定策略。
打击不打y 1-y x 1-x 博弈方1博弈方2xESS()F x x解:1.首先分析博弈方1。
1>博弈方1的复制动态方程[][]111d ()(,)()()=x()1()12()d x x t F x y x t u u t x t y t t=---其中1112102 =(1,0)=2-2111-02 =(0,1)1111-021 =(,1-)2(1)(1)111-y u y y y u y y u x x x y x y ⎧⎛⎫⎛⎫⎪⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=⎨ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=-+- ⎪⎪⎪⎝⎭⎝⎭⎩采用进入的人的期望得益采用不进入的人的期望得益博弈方群体的平均得益2>博弈方1的进化策略稳定性分析。
1)当12y =时,[][][]1122(,)|x()1()12()|()1()(11)0x y y F x y t x t y t x t x t ===--=--≡,即所有x 水平都是稳定状态。
2)当12y >时,令[][](,)x()1()12()0x F x y t x t y t =--=,得*0x =和*1x =两个稳定状态,又因为[][](,)=12()12()x F x y x t y t '--,故[](0,)=12()0x F y y t -<',[](1,)=-12()0x F y y t '->,所以*0x =是ESS 。
x(,)x F x yx(,)x F x yx3) 当12y <时,令(,)0x F x y =,得*0x =和*1x =两个稳定状态,同2)可得*1x =是ESS 。
2.对博弈方2进行进化博弈分析。
1>博弈方2的复制动态方程[][]212dy()(,)()()=()1()2()d y t F x y y t u u y t y t x t t=---其中21222021 =(,1)=5-5550020 =(,1)53551021 =(,1-)(1)(2)551-u x x xu x x xy u x x y y x y ⎧⎛⎫⎛⎫-⎪ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪-=-⎨ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=-- ⎪⎪⎪⎝⎭⎝⎭⎩采用进入的人的期望得益采用不进入的人的期望得益博弈方群体的平均得益 2>博弈方2的进化策略稳定性分析。
1)当0x =时,[]()0(,)|=()1()200y x F x y y t y t =--⨯≡,即所有y 水平都是稳定状态。
2)当0x ≠时,必然有0x >,令[][](,)=()1()2()0y F x y y t y t x t --=,得到*0y =和*1y =两个稳定状态,又因为[][][][][](,)=1()2()()2()12()2()y F x y y t x t y t x t y t x t '----=--,故[][](,0)1202()0y F x x t '=-⨯-<,[][](,1)1212()2()0y F x x t x t '=-⨯-=>,所以*0y =是ESS 。
y(,)y F x yxy(,)y F x y y3、结合对两博弈方的进化策略稳定性分析,以x 和y 为坐标的坐标平面如下由上图可以看出,博弈的进化稳定策略只有*1x =和*0y =一点,其他点都不是复制动态中收敛和具有抗扰动的稳定状态。
这意味着有限理性的博弈方通过长期反复博弈,学习和调整策略的结果是,潜在的进入者最终都会进入市场竞争,而先占领市场的阻入一方则会放弃采取不理智的报复措施。
这与完全理性条件下博弈的淄博一完美纳什均衡完全一致,说明在这个问题上有限理性的博弈方通过学习是能够掌握淄博一完美纳什均衡策略的。
(二)非对称鹰鸽博弈的进化博弈分析。
解:1、对博弈方1的进化博弈进行分析。
1>博弈方1的复制动态方程。
[][]111d ()(,)()()=()1()56()d x x t F x y x t u u x t x t y t t=---xy鹰(入侵) 鸽(不入侵)y 1-yx 1-x博弈方1博弈方2 鹰(抗击) 鸽(不抗击其中11121-110 =(1,0)=10-11051--110 =(0,1)5-5051--1101 =(,1-)5556051-y u y y y u yy y u x x x y xyy ⎧⎛⎫⎛⎫⎪ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=⎨ ⎪⎪⎝⎭⎝⎭⎪⎪⎛⎫⎛⎫⎪=+-- ⎪⎪⎪⎝⎭⎝⎭⎩采用鹰(抗击)的人的期望得益采用鹰(不抗击)的人的期望得益博弈方群体的平均得益 2>博弈方1的进化策略稳定性分析。
1)当56y =时,[][][]1526(,)|()1()56()|()1()(55)0x y y F x y x t x t y t x t x t ===--=--≡,即所有x 水平都是稳定状态。
2)当56y >时,令[][](,)()1()56()0x F x y x t x t y t =--=,得*0x =和*1x =两个稳定状态,又因[][](,)=12()56()x F x y x t y t '--,故[][](0,)=1056()0x F y y t '-<-,[](1,)=56()0x F y y t '-->,所以*0x =是ESS 。
3) 当56y <时,令[][](,)()1()56()0x F x y x t x t y t =--=,得*0x =和*1x =两个稳定状态,同2)可得*1x =是ESS 。
x(,)x F x yx(,)x F x yx x2、对博弈方2的进化博弈进行分析。
1>博弈方2的复制动态方程[][]212dy()(,)()()=()1()16()d y t F x y y t u u y t y t x t t=---其中21222501 =(,1)=2-7210500 =(,1)1211501 =(,1-)16211-u x x xu x x xy u x x x y xyy ⎧-⎛⎫⎛⎫-⎪ ⎪⎪⎝⎭⎝⎭⎪⎪-⎛⎫⎛⎫⎪-=-⎨ ⎪⎪⎝⎭⎝⎭⎪⎪-⎛⎫⎛⎫⎪=-+- ⎪⎪⎪⎝⎭⎝⎭⎩采用进入的人的期望得益采用不进入的人的期望得益博弈方群体的平均得益 2>博弈方2的进化策略稳定性分析。
1)当16x =时,[][][][]00(,)|=()1()16()|()1()110y x x F x y y t y t x t y t y t ==--=--≡,即所有y 水平都是稳定状态。
2)当16x >,令[][](,)=()1()16()0y F x y y t y t x t --=,得到*0y =和*1y =两个稳定状态,又因为[][](,)=12()16()y F x y y t x t '--,故[][](,0)1016()0y F x x t '=--<,[][](,1)1216()0y F x x t '=-->,所以*0y =是ESS 。