当前位置:文档之家› 博弈论习题集.doc

博弈论习题集.doc

博弈论习题集.doc
博弈论习题集.doc

博弈论习题集.doc

博弈论习题集

1.在下表所示的战略式博弈中,找出重复删除劣战略的占优均衡

2.(投票博弈)假定有三个参与人(1、2和3)要在三个项目(A、B和C)中选中一个。三人同时投票,不允许弃权,因此,每个参与人的战略空间Si={A,B,C}。得票最多的项目被选中,如果没有任何项目得到多数票,项目A被选中。参与人的支付函数如下:

U1(A)=U2(B)=U3(C)=2

U1(B)=U2(C)=U3(A)=1

U1(C)=U2(A)=U3(B)=0

求解以上博弈的所有纯战略纳什均衡。

3.求解以下战略式博弈的所有纳什均衡

4.考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

a.写出以上博弈的战略式描述

b.求出以上博弈的所有纳什均衡

5.(库诺特博弈)假定有n个库诺特寡头企业,每家企业生产成本函数为cq,市场逆需求函数是P=a-Q,其中P是价格,Q=Σqi是总供给,a是大于c的常数。企业i的战略是选择自身产量qi最大化自己的利润,即其他企业的产量q-i;选择自身产量最大化自己的利润。求解以上博弈的纳什均衡,以及均衡产量和价格如何随n的变化而变化。

6.(伯川德博弈)假定两个寡头企业之间进行价格竞争,两企业生产的产品是完全替代的,

果,假定贴现因子是1,则x 满足什么条件的情况下(4,4)可以作为第一阶段博弈的均衡结果。

13.如下的双寡头市场战略性投资模型:企业1和企业2目前的单位生产成本都c =

2。企业可以引进一项新技术使单位生产成本降至c =1,而该项技术需要的投资为f ,企业2可以观察到企业1的投资决策,在企业1做出是否投资的决策之后,两个企业同时选择产量。在以上两阶段博弈中市场逆需求为p =14-Q ,问f 取什么值时,企业1将投资引进新技术。

14.考虑一个政策采纳博弈,存在两个参与人,政策建议者与政策采纳者。政策建议者首先剔除政策建议s1,并且s1∈R 。政策采纳者观察到s1决定是否采用,如果采用则执行政策s1,否则执行s0。现在假定政策建议者效用函数是12u s =,而政策采纳者的效用函数是()2

22u s b =--,其中2s 为执行的政策,b 为外生参数,表示两者之间的利益冲突。问以上博弈的精练纳什均衡。

15.考虑一个承诺博弈,存在两个参与人。参与人2首先行动,选择行动2a ,2a 的取值范围是{}0,1。参与人1观察到参与人2的行动,决定向参与人2转移支付t ,但是参与人1也可以事先确定支付规则()2t a 。现在假定参与人2的效用函数为()22u t c a =-,参与

人1的效用函数为()21221u a t ??=--+??,其中()2c a 表示参与人采取行动的成本,且20a =时为0,21a =时为1/2。

(1)如果参与人1没有承诺能力,可以随意修改事先宣布的支付规则,则此时的子博弈精练纳什均衡。

(2)如果参与人1有承诺能力,只能按照事先确定的支付规则进行支付,则此时的子博弈精练纳什均衡。

16.两个厂商在市场进行价格竞争,厂商1首先确定价格水平,厂商2在观察厂商1的价格水平之后决定价格水平。厂商1和厂商2的产品是完全同质的,且市场逆需求函数是P=a-Q ,问以下条件下的精炼纳什均衡的价格:

(1).如果厂商1和厂商2的生产成本函数为cq (c

(2).如果厂商1和厂商2的生产成本函数为q 2/2

17.在霍特林价格竞争模型中,两个厂商的生产边际成本都是c ,运输成本参数为t 。博弈进行两期,在第一阶段两个厂商同时在线性城市上选择自己的位置;第二阶段在观察到两者位置后选择自己的价格。

(1).如果运输成本为线性函数,证明以上博弈不存在纯战略精炼纳什均衡

(2).如果运输成本为二次型函数(运输成本为tx 2),证明以上博弈的精炼纳什均衡的结果是两个厂于城市两端。

18.在三寡头的市场中,市场的逆需求函数为三家产量之和Q Q a p ,-=,每家企业的不变边际成本为c ,固定成本为0。如果企业1首先选择产量,企业2和企业3观察到企业1的产量后同时选择产量,则均衡时的市场价格。

19.考虑两个工人之间的锦标赛。每个工人的生产函数()1,2i i i y e i ε=+=,其中i y 表示产量,i e 表示努力水平,i ε表示随机干扰项。博弈时序如下:第一阶段,企业指定锦标赛中赢者工资h W 和输者l W ;第二阶段工人观察工资的规则后同时选择努力水平;第三阶段

产量得以实现,工资支付。企业为风险中性,工人的效用的函数()2

,2

e u W e W =-,工人的保留效用为0。i ε是服从均值为0,方差为2δ的正态分布,1ε和2ε独立。问在对称均衡时,h W 和l W 为多少。

20.有n 个完全相同且每个企业的生产函数为cq ,市场需求Q=a-p ,假定博弈重复无穷次,每次每个企业的定价和产量都能被下一阶段所有企业观察到,每个企业都使用“触发战略”。假定每个企业的贴现因子都相同,问在以下条件下,垄断价格作为子博弈精炼纳什均衡结果出现的最低贴现因子:

(1).如果每个阶段企业之间进行古诺博弈,则最低贴现因子。

(2).如果每个阶段企业之间进行伯川德博弈,则最低贴现因子。

21.考虑如下贝叶斯博弈:(1)自然决定支付矩阵(a )或(b ),概率分别为u 和1-u ;

(2)参与人1知道自然的选择,即知道自然选择支付矩阵(a )或(b ),但是参与人2不知道自然的选择;(3)参与人1和参与人2同时行动。给出这个博弈的扩展式表述并求纯战略贝叶斯均衡。

表21.1.a S 1

S 2 L R T

1,1 0,0 B 0,0

0,0

表21.1.b S 1

S 2 L R T

0,0 0,0 B

0,0 2,2

22.两个企业同时决定是否进入一个市场,企业i 的进入成本),0[∞∈i θ是私人信息,i θ是服从分布函数)(i F θ的随机变量以及分布密度)(i f θ严格大于零,并且1θ和2θ两者独立。如果只有一个企业进入,进入企业i 的利润函数;如果两个企业都进入,则企业i 的利润函数为i d θπ-;如果没有企业进入,利润为零。假定m π和d π是共同知识,且m π>d π>0,计算贝叶斯均衡并证明均衡是唯一的。

23.假设一个家长和他的孩子进行如下的博弈:第一,小孩选择一个行动A ,可以使孩子获得收入I c (A),并使得家长得到收入I p (A)(可以认为I c (A)为孩子减去因为A 发生的各

种成本后的净收益);第二,家长观察到收入I c (A)和 I p (A),然后选择给孩子的奖励或者

惩罚B 。孩子的收益为U(I c +B),,家长的收益为V(I p -B)+k(I c +B),其中k>0反映出家长关

心孩子的福利。假定行动是一个非负数字,A ≥0,收入函数I c (A)和 I p (A)为严格凹且分别

能够达到最大值;奖励或惩罚B 为正或为负的数字;且效用函数U 和V 递增并严格凹。证明:孩子选择可使全家收入I c (A)+ I p (A)最大化的行为(尽管在效用函数中,只有家长显

示出利他的特点)。

24.一个建筑公司每到有工程合同才雇用临时工人。考虑某项工程中公司与工人的劳动-工资博弈;工人受雇于该公司的机会成本是0;工人可以老实地干活,为公司创造利润y ,

但这需要付出劳动成本l ,y>l>0;工人也可以受雇后不干活,这不需任何劳动成本,同时创造的利润也是0。假设公司与工人在工程结束之前没有任何工资合同,它只是在雇用期满后才决定付给每个工人的工资额w 。

(a)如果该建筑公司在未来的10年内每年有一项相同的工程,证明:无论公司的利润贴现因子δ是多少,唯一的子博弈完美均衡是:在每一项工程中,无论工人是否干活,公司向工人付的工资额w 都是0;工人不干活。

(b)如果该建筑公司依次有无穷多个工程,而下一期工人又能看到以前的工资政策。证明:只要δ充分接近1,每一期工人都努力干活将是一个子博弈完美均衡战略。

25.考虑如下结构的古诺博弈。市场逆需求函数Q a p -=,两个企业成本函数i i cq c =;市场需求是不确定的,H a a =的概率为θ,L a a =的概率为θ-1;企业1知道a 的确切取值,企业2不知道,但是知道a 的概率分布。现在假定两个企业同时选择产量水平,c a a L H >>并且以上博弈结构是共同知识,求解以上博弈的贝叶斯纳什均衡。

26.考虑如下非对称信息的产品差异化的伯川德博弈:企业i 的市场需求j i i i p b p a q --=,两个企业生产成本都为零;b 1取值是b H 或b L 且b H >b L >0,且b 1=b H 的概率为θ,而L H b b b )1(2θθ-+=;b 1是企业1的私人信息,b 2是共同信息。现假定两个企业同

时选择价格,以上博弈结构是共同知识,求解以上博弈的贝叶斯纳什均衡。

27.考虑两个参与人的公共物品供给模型。参与人1和2同时决定是否提供某项公共物品,提供公共物品是0-1决策。如果一个参与人i 已经提供公共物品,则每个参与人j 都可以得到效用1。参与人i 提供公共物品成本ci 都是定义域在],[c c ,分布函数为F(.),而且提供成本是参与人私人信息。

(1).如果成本服从[0,2]均匀分布,求解其对称均衡。

28.在n 人参与的私人价值拍卖,参与人的类型V i 都服从[0,M ]上的均匀分布,参

与人的类型V i 是私人信息,V i 的分布是共同知识。

(1).如果实行一级价格拍卖,则求对称的贝叶斯纳什均衡。

(2).如果实行二级价格拍卖,则求其贝叶斯均衡。

(3).在以上两种类型拍卖中,证明拍卖人的期望收入相同。

29.考虑一个不完全信息两人博弈的消耗战模型。两个参与人同时出价i S ,并且i S 的取值范围为【0,∞)。每个参与人类型空间i θ是参与人的私人信息,取值范围为【0,∞),对应的分布函数为()i F θ,同时1θ和2θ两者是独立的。现在假定参与人的效用函数为i i u s =-如果i j s s <,反之则i i i u s θ=-。

(1)证明参与人最优出价战略是i θ的递增函数。

(2)如果()()1exp F θθ=--,证明以上博弈存在一个非对称均衡。

30.试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡

(8,1) (1,2) 1a 发送者 1a

2m 1t 1m

2a 5.0 2a

(2,7) (10,8)

接收者 自然N 接收者

(6,5) (4,1)

1a 5.0 1a

2m 发送者 1m

a t 2a

(7,3) (3,7)

31.考虑下列基本的委托-代理模型

)),0(~( 2σεεN ka y +=

这里,y 为代理人对委托人的产出,a 是代理人的努力程度,0>k 为参数(k 可代表委托人为代理人所创造的工作环境与技术装备,k 越高,则给定a 会产生更大的贡献)

又假定,委托人与代理人都是风险中性的。代理人努力的负效用(即代理人的努力成本)函数为)(a c 。

求解:

(1)假定委托人与代理人之间签订一个线性合同:by s w +=,代理人会采取什么行动?代理人的行动会如何随k 而发生变动?

(2)现在假定代理人的效用函数形式为

rx e x u --=)( 又假定代理人的努力的成本函数为22

1)(a a c = 证明:最优线性合约中的激励系数*b 必满足

222

σr k k b +=*

32.考虑三种不同类型的雇员3,2,1=t 。每一类型的雇员t 的支付函数为w-e/t ,这里w 表示工资,e 表示受教育水平。企业雇用类型为t 的雇员的支付为w t -。企业采用竞争性方式雇用雇员。

(1)求分离均衡;

(2)假设每一类型的雇员不可分辨,求解当类型2和类型3是混同的,类型1是分离时的均衡。

考察委托人和代理人之间的关系,其中只有两种产出结果,分别为50和25. 代理人必须在三种可能的努力e 1 、e 2、e 3中做出选择. 每种状态依存努力的结果的概率由下表给出

结 果 努 力 25 50

e 1 e 2 e 3

0.25 0.75

0.50 0.50

0.75 0.25 假设委托人是风险中性的,代理人是风险规避的,他们各自的效用函数由如下函数描

述: )(),(,),(e v w e w U w x w x B -=-=

其中,5)(,20)(,40)(321===e v e v e v ,代理人的保留效用水平120=U .

(a) 写出在对称信息下,对于每一努力水平和委托人在每一情况下获得利润的最优合同. 委托人应选择的努力水平是什么?

(b) 写出存在道德风险问题(即存在不对称信息)时的最优激励合同. 求出委托人选择的最优激励合同;和对称信息情形比较,道德风险问题在哪里得到体现?从市场效率及福利经济学角度可以得到什么结论?

博弈论基础作业及答案【最新资料】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

演化博弈论发展

演化博弈论发展 理论部分应用部分 解(均衡)概念适应机制经济学社会学…制度学生物学 ESS NSS … REE 无理性(自然选择)部分理性(学习) (在不同情形下定义及性质不同) 复制动态路径学习模仿信念学习 国外部分应用研究: [1]Basu(1995)研究了公民规范和演化之间的关系 [2]Friedman & Fung(1996)以日本和美国的企业组织模式为背景,用演化博弈论分 析了在无贸易和有贸易的情况下企业组织模式的演化 [3]Bester & Guth(1998)用演化博弈论研究了人类在经济活动中利他行为的存在性 及其演化稳定性 [4]Dufwenbery & Guth(1999)在双寡头垄断竞争的情形下比较了间接演化法和策略代 理方法 [5]Guttman(2000)用演化博弈论研究了互惠主体在有机会主义存在的群体中是否能 够存活的问题 [6]青木昌彦(2001)从认知的角度提出了一个关于演化博弈论的主观博弈模型 [7]Haruvy & Prasad (2001)运用演化博弈论研究了在具有网络外部性的条件下免费软 件的最优价格和质量 [8]Kosfeld(2002)建立了德国超市购物时间反常的演化博弈模型 [9]Nyborg & Rege (2003)用演化博弈理论研究了顾忌别人感受的吸烟行为的社会规范 的形成 [10]Jasmina & John (2004)研究了不同的学习规则在公共物品博弈中仿制人类行为时 谁表现的更好的问题

[11]Daniel,Arce & Todd(2005)研究了四种不同类型的囚徒困境博弈,指出要达成合作所需的演化和信息要求 [12]Josef Hofbauera & William H. Sandholmb(2007)讨论了具有随机扰动得益的演化博弈问题并将其应用于种群博弈问题的研究 国内相关研究曾涉及的问题: 土地制度变迁的演化博弈分析;电子商务中企业行为分析;企业会计信息披露博弈;金融体制改革风险研究;农民工权益维护分析;信息安全问题研究;营销合作系统中的竞争与合作;知识链组织间知识共享的研究;经济组织多样性研究;“以市场换技术”的演化博弈分析;新型农村资金合作体系的构建分析;零售业业态创新研究;区域经济协调发展研究(改革&保守);水污染控制系统;电力市场竞价分析;….. 博弈情形的具体分类: 有限群体/无限群体;连续时间/离散时间;同质/异质;双人/多人;对称/非对称;有限记忆/无限记忆;各种不同学习方式;各种噪音;… 部分演化博弈论研究者的主要贡献: 国外近五年来相关文献研究内容:

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

演化博弈论简介

演化博弈论简介 说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。讲完以后,叶航老师提出了很多宝贵的意见。我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。整理过程中还发现了了很多问题,请大家批评。 丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。正因为如此,这些新理论才显示出强大 的生命力,获得广泛运用。 我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。 先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。我这里用演化,避免用演进,可以减少误解。 演化理论中有两条最重要的机制。一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。严复说物竞天择,就是这个意思。 另一种机制叫突变机制(mutant),这保证了种群的变化。如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。突变同样是上帝的选择,微观个体无能为力。 接下来,我们就可以回顾演化经济学的思想史了。我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的“创新”思想。这带有明显的动态的特征,并影响了随后的尼尔森和温特。 安德森把熊彼特以后,尼尔森-温特以前这段时间(1930-1970)比作黑暗时代(当然这仅指演化经济学而言,对于新古典经济学无疑是黄金时代呢),这段时间很少有人关心动态的演化的经济学理论。(阿尔奇安也许是个例外) 从70年代初开始,尼尔森和温特提出了一系列演化经济学模型。同时,梅纳德.史密斯在1973年提出了著名的演化稳定策略,奠定了演化经济学的基础。从此,演化经济学可以算真正诞生了。 尼尔森自称是熊彼特的忠实信徒,而温特是达尔文进化论的信徒,他们的演化理论非常鲜明地具有这些特征。计算机能够很好地模拟生态学上物种数量的演化,因而也被广泛地用于经济模型的演化模拟。尼尔森-温特的多数模型都很容易被改编成计算机模型,用现实数据进

演化博弈论小结

演化博弈论和学习行为的小结 1.RD 模型 ()[()()]()s s x u x u x F s =-= 该模型的来源由Van Damme(1991)的基因复制动态过程的非代际交叠模型和Binmore(1992), Samue(1997)的基因复制动态过程的代际交叠模型分别得出。 2.ESS 的概念 定义:①(,(1))(,(1))u x x y u y x y εεεε-+>-+ ②(1)(,)(,)(1)(,)(,)u x x u x y u y x u y y εεεε-+>-+ ③(,)(,)u x x u x y >或者如果(,)(,)u x x u x y =那么有 EGT 其他引申出的均衡、定理等 ESS 概念 学习模型 模仿 信念学习 路径学习 RD 模型

(,)(,)u x y u y y > PS:NSS 就是在ESS 的定义中将大于号变为大于等于号。 3.其他引申出的一些均衡、均衡之间的关系以及一些定理 3.1 ①EE : 是演化动态过程的任一渐进稳定不动点。其判定方法可以如下: ()0F s =;()/0dF s ds <。 ②ES : (对称二人博弈中)如果x *是X 的子集,且满足条件: a 、x *中每个元素都是一个NSS b 、x X *∈,(,)(,)u x x u y x =且(,)(,)u x y u y y =,则有y X *∈。 ③REE 对称策略(x,x )是REE 充分必要条件是存在某个 ε∈(0,1),使如果x x '≠且 (0,)εε∈,有((1)x B R x x εε ''?+- ④EES x X '∈是EES 的充分必要条件是, 它是最小的非空子集使得:

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案 如果图片不显示,用打印预览就可以了。 P127 第一题:领悟精神就可以了,而且每本书上都有这些例题,不找了。 第二题: UMD 为参与人1的战略,LMR 为参与人2的战略。前面的数字代表参与人1的得益,后面的代表参与人2的得益。 参与人2的R 战略严格优于M 战略,剔除参与人2的M 战略,参与人1的U 战略优于M 战略,剔除参与人1的M 战略,参与人1的U 战略优于D 战略,剔除参与人1的D 战略,参与人2的L 战略优于R 战略,剔除参与人2的R 战略。最后均衡为U ,L (4,3)。这样可能看不清,按照步骤一步步画出图就好多了。 第三题:恩爱型 厌恶型 用划线法解出,恩爱的都活着或者都死,厌恶的或者受罪,死了对方另一个人开心的不得了。 第四题:没有人会选择比原来少的钱,战略空间为{原来的钱,比原来多的钱}。支付为{0,原来的钱,比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。 第五题:n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题:在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 第七题:设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2),π2=(P 2-C)(a-P 2+P 1)。一阶最优:a-2P 1+C+P 2=0,a-2P 2+C+P 1=0。 解得:P 1=P 2=a+C ,π1=π2=a 2。 第八题:不会! 到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。 第十题: 无纯战略纳什均衡,设参与人1为P 1~P 4,参与人2为Q 1~Q 4。 得到:-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3,推出:Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子,老虎,鸡,虫子中选择一个。

演化博弈论

演化博弈论 演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。 演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。但直到Smith and Price(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。 编辑本段主要应用领域 演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。其开山之作《股市真面目》颠覆了股市运行机理的传

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4,1 0,0 3,0 0,1 2,2 2,2 纯战略纳什均衡:( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡:( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡:( R, M ’ ) 子博弈精炼纳什均衡:( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2,2 2,2 3,0 0,1 0,1 3,0 六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。 求混合战略精炼贝叶斯均衡: 设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则: 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又 联立得 所以 L L M L L M L R L

4.3答案(见4.5) 4.4 表示方法 第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号; 第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a ) [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== (b ) [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案 (a ) [(,),(,),1/3,1/2]R R u d p q >= (b ) 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论基础作业及答案

博弈论基础作业及答案 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论与信息经济学答案

第一章 5. n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n=(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。 6.假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业i 的价格高于另一企业,则企业i 的需求量为0,反之,其它企业的需求量为0。因此,企业i 的需求函数由下式给出: i i i i i i i i p pi p p p p 0)/2Q(p ) Q(p q --->=c 那么每家企业的利润02 i i j i p c q ππ-== >,因此,企业i 只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至()()22 i i i i p c p c Q p Q p εε---->,()0ε→。同样, 其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是p i =p j =c 。此时,企业i 的需求函数为2 i a c q -= 。 在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 7.设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。

博弈论复习题及答案

名词解释(每题7 分,共 2 8 分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10 分,共40 分) 1、博弈的基本要素有哪些? 基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能 猎到所 需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代 理人行 动,造成信息不对称,从而出现代理人选择不利于委托人的行 为的一种现 象;解决道德风险的方法可以用签订合同、派人监督,以 及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 H B i 答:根据上方的矩阵图, 我们可得出其博弈中存在两种策略的纳 什均衡:分别是 H 选择F1和N 选择F2,以及H 选择B1和N 选择 B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和R ”的行动,其收益如下:当 A 选左,B 选L 时,A 的收益为2,B 的收益为3 ;当A 选左,B 选R 时,A 的收益为1 , B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1 ; 当A 选右,B 选R 时,A 的收益为0,B 的收益为2。请画出该博弈 的博弈树,并求出该博弈的均衡解。 四、论述题(16分) 1、请结合你的工作或生活,谈谈对行动的可信性的理解,有什么方 法可以建立可信的策略行动。 答:每一种策略性行动都面临着可信性的问题, 人们不一定相信 策略性行动的提出者会实施其行动。 因此提出者必须做一些辅助工作 F 2 B 2

博弈论练习2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

对策论课后习题题目

对策论作业 1对策论 注意:作业请发至谭老师邮箱和zhouyany js @https://www.doczj.com/doc/ac8867778.html, 1.今有甲、乙两厂生产同一种产品,它们都想通过内部改革挖潜,获得更多的市场份额已知两厂分别都有三个策略措施,据预测,当双方采取不同的策略措施后两厂的市场占有份额变动情况如表所示:Table 1:`````````````````````` 甲厂策略甲厂产品市场份额变动乙厂策略β1β2β3α1 10-13α2 1210-5α3685 2.某企业决定由职工代表大会选举行政负责人,经提名产生候选人甲和乙。他们根据企业的发展战略和群众关心的事业各自提出了企业改革的方案。甲提出了四种:α1,α2,α3,α4;乙提出了了三种:β1,β2,β 3.他们的参谋人员为使竞争对奔放有利,预先作了个民意抽样测验。因各方提供的不同策略对选票吸引力不同。测验选票经比较后差额如下表(单位:十张)所示: Table 2:H H H H H H H H H 甲a i j 乙β1β2 β3α1-40 -6α232 4α3161 -9α4-1 17

3.(猜花色游戏问题)设有两个小孩问扑克牌花色游戏,游戏规定:由小孩甲每次从4种花色的牌中拿出一张牌给小孩乙猜,如果猜对花色,则甲付给乙三个小石子;否则,即小孩乙猜不对,则乙付给甲一个石子,试求解这个对策问题,即这两个小孩各应该采取什么对。 4.(餐馆的经营问题)设有两个相邻的餐馆都能做甜早点和咸早点,如果它们做的早点是一样的,则可能卖不出去而各亏本100元,如果两个餐馆做的早点不同,则做咸早餐的餐馆可以赚到400元,而做甜早餐的餐馆可以赚到200元.如果他们不协商,试问这两个餐馆各自的最优策略为何? 5.(猜硬币问题)甲、乙两人玩猜硬币的游戏,要求二人各出一枚硬币,如果两个硬币都呈正面,或者反面,则甲得1分,同时乙付出1分;反之,甲付出1分,乙得1分。试问甲和乙各自的最优策略是什么? 6.(智猪争食问题)猪圈里有一大一小两头猪,猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈另一边的投食口就会落下少量的食物。如果有一头猪去踩踏板,另一头猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃一点残羹。在这种情况下,两头猪各会采取什么策略呢? 7.(扩军与裁军问题)敌对的两个国家都面临着两种选择:扩充军备或裁减军备。如果双方进行军备竞赛(扩军),都将为此付出3000亿美元的代价;如果双方都裁军,则可以省下这笔钱。但是倘若有一方裁军,另一方扩军,则扩军一方发动侵略战争,占领对方领土,从而可获益1万亿美元。裁军一方由于军事失败而又丧失国土则可以认为损失无限。试建立该问题的对策模型,并求该问题的纳什平衡解。 8.(足球问题)选手R踢罚球点球,选手C防守。R可以踢向球门左方也可以踢向右方;为了扑出点球,C可以扑向左方也可以扑向右方。我们以期望得分(期望进球机率或期望扑出机率)表示这些策略的收益: R|C左右 左0.50.8 右0.90.2 9.(两军的攻防问题)蓝军有两架飞机攻击红军的重要目标,红军有4个连的兵力防护通向该目标的4条路线.如果飞机沿一条线路进攻,则防护该条线路的连队必定击落一架飞机,但由于装弹时间较长,所以仅能击落一架飞机.如果有飞机突防进而摧毁目标,蓝军赢得为1,否则赢得为0.将蓝军和红军的攻防视为二人对

进化博弈论读书心得

进化博弈论读书报告 汪波 1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS ),随着1978年, Taylor 和Jonker 发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull 著作了《Evolutionary Game Theory 》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics 》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。 一、进化稳定策略最初的模型 进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。 最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略I 、J ,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为0w ,再假设整个群体中选择I 的概率为p ,()w I 、()w J 分别表示选择相应策略带来的适应度,而(,)E I J 表示个体选择策略I 而对手选择J 时的收益,其他(,)E I I 等表示类同的意义。 若每一个个体都参与到竞争当中,则有 0()=+(1-p)(,)(,)w I w E I I pE I J + (1-1) 0()=+(1-p)(,)(,)w J w E J I pE J J + (1-2) 稳定的策略具有下列性质:整个种群中几乎所有的个体都采取了这个策略,且这些个体的 适应度必将高于竞争对手或者可能出现的突变异种的适应度,否则竞争对手或者产生的突变 异种会侵害整个种群,以致种群的削弱或者毁灭等,这时此策略便不可能是稳定的策略。若 I 是进化稳定策略,则()()w I w J >,且1p =,所以当I J ≠,有 (,)(,)E I I E J I > (1-3) 当(,)(,)E I I E J I =时有 (,)(,)E I J E J J > (1-4) 满足上述条件(1-3)、(1-4)的策略就称为进化稳定策略,而上述的两个条件1-3、1-4也被认为是判别ESS 的标准条件。 上述的策略是在纯策略情形下考虑的,当策略I 是从一个可能策略集合中随机的选择而

演化博弈论(清华大学)

进化博弈 Evolutionary Games
第13章 Chapter 13
进化博弈 Evolutionary Games
目前为止我们学过了具有多种不同特征的博弈: We have so far studied games with many different features:
同时和序贯博弈 Simultaneous and sequential moves 零和与非零和博弈 Zero-sum and non-zero-sum payoffs 操纵未来博弈规则的策略性行动 Strategic moves to manipulate rules of games to come 一次性和重复博弈 One-shot and repeated play 许多人同时进行的集体博弈 Games of collective action in which a large number of people play simultaneously
Slide 2

进化博弈 Evolutionary Games
所有这些博弈中的参与者都是理性的:每个参 与者…… All the players in all these games are rational: each player……
……具有内在一致的价值体系 has an internally consistent value system ……能够计算其策略选择的后果 can calculate the consequences of her strategic choices ……作出最符合其利益的选择 makes choice that best favors her interests
Slide 3
进化博弈 Evolutionary Games
对理性可能的替代方法可以从生物学的进化和进化动 力学中找到,在那里…… One possible alternative to rationality can be found in the biological theory of evolution and evolutionary dynamics, where……
……好的策略可以得到更多的奖励 good strategies will be rewarded with higher payoffs ……参与者可以观察或模仿成功者并试验新的策略 players can observe or imitate success and experiment with new strategies ……随着参与者在参加博弈中获得经验,好的策略将会得到 更经常的使用,坏的策略得到更少的使用。 good strategies will be used more often and bad strategies less often, as players gain experience playing the game.
Slide 4

博弈论和信息经济学答案解析

第一章 5. n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n=(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。 6.假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业i 的价格高于另一企业,则企业i 的需求量为0,反之,其它企业的需求量为0。因此,企业i 的需求函数由下式给出: i i i i i i i i p pi p p p p 0)/2Q(p ) Q(p q --->=c 那么每家企业的利润02 i i j i p c q ππ-== >,因此,企业i 只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至()()22 i i i i p c p c Q p Q p εε---->,()0ε→。同样, 其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是p i =p j =c 。此时,企业i 的需求函数为2 i a c q -= 。 在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 7.设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2),π2=(P2-C)(a-P 2+P 1)。一阶最优:a-2P 1+C+P 2=0,a-2P 2+C+P 1=0。

相关主题
文本预览
相关文档 最新文档