序贯均衡定义
- 格式:docx
- 大小:10.62 KB
- 文档页数:1
医学论著中平衡序贯法的通俗理解平衡序贯法是一种常用于医学论著中的研究方法,它的主要目的是通过比较不同治疗方法的效果,为临床实践提供科学依据。
本文将以通俗易懂的方式解释平衡序贯法的原理和应用。
平衡序贯法是一种研究设计,常用于医学领域的临床试验中。
它的核心思想是通过在同一群体中对不同治疗方法进行比较,以消除个体差异对研究结果的影响,从而获得更可靠的结论。
平衡序贯法的步骤主要包括:选取研究对象、随机分组、治疗顺序安排、观察期和数据分析。
首先,研究者需要选择一组具有相似特征的研究对象,以确保研究结果的可比性。
然后,利用随机分组的方法将研究对象分为不同的治疗组,每个组接受不同的治疗方法。
接下来,根据治疗方法的不同,确定治疗的顺序安排,即哪种治疗方法先进行,哪种治疗方法后进行。
在治疗过程中,研究者需要对研究对象进行观察,并收集相关数据。
最后,通过对观察数据进行分析,比较不同治疗方法的效果,从而得出结论。
平衡序贯法的优势在于能够消除个体差异对研究结果的影响。
由于每个研究对象都接受了不同治疗方法,因此个体差异对研究结果的影响可以在一定程度上被消除。
这使得研究结果更加可靠,有助于指导临床实践。
平衡序贯法的应用范围广泛。
在临床医学中,平衡序贯法可以用于比较不同药物、手术或其他治疗方法的疗效。
通过比较不同治疗方法的效果,可以选择最佳的治疗方案,提高患者的治疗效果。
此外,平衡序贯法还可以用于评估医疗设备的效果,比如比较不同型号的医疗设备在治疗上的差异。
然而,平衡序贯法也有一些局限性。
首先,它需要较长的观察期来收集足够的数据,因此需要耐心等待研究结果。
其次,平衡序贯法对研究对象的要求较高,需要选择具有相似特征的研究对象,以确保研究结果的可比性。
此外,平衡序贯法的结果可能受到其他因素的干扰,如研究对象的遵从性和观察者的主观判断等。
平衡序贯法是一种用于医学论著中的研究方法,通过比较不同治疗方法的效果,为临床实践提供科学依据。
第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。
例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。
例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。
2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。
例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。
例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。
㊃国外经济学家评介㊃罗伯特㊃威尔逊对当代经济学的学术贡献∗张㊀苏内容提要:罗伯特㊃威尔逊是美国经济学联合会的杰出会员和美国国家科学院的经济学院士㊂他的最重要的贡献包括如下三个方面:有关非线性定价理论的贡献;有关序贯均衡思想的贡献;有关拍卖理论的贡献㊂本文重点评述了威尔逊提出的 二维非线性定价规则 的思想;提出的序贯均衡概念与泽尔腾的 完美均衡 概念的异同;以及他对 竞争性拍卖机制 ㊁ 双重拍卖机制 ㊁ 整体拍卖与分担拍卖机制 的卓越研究;同时还评述了他对于风险分担理论以及信息经济学突出的贡献㊂关键词:罗伯特㊃威尔逊非线性定价博弈论拍卖理论㊀㊀罗伯特㊃威尔逊(R o b e r tW i l s o n)1937年出生于美国,分别于1959年㊁1961年㊁1963年在哈佛大学获得学士(数学)㊁硕士㊁博士学位㊂此后一直在斯坦福大学商学院任教㊂其主要研究领域为:经济学一般理论㊁经济学数学方法㊁博弈论以及交易理论㊂他是美国经济学联合会的杰出会员和美国国家科学院的经济学院士㊂威尔逊试图利用博弈论作为基础来重构经济学理论,并利用博弈论将现实中经常发生的现象引入经济学理论,比如 战略性行为 (s t r a t e g i cb e h a v-i o u r)㊁ 信息差异 (i n f o r m a t i o n a l d i s p a r i t i e s)㊁行动动态调整,等等㊂其关注的核心问题是,在交易过程(比如讨价还价过程㊁拍卖㊁询价过程)㊁签订合同㊁形成企业的过程中,每一种力量对于 经济效率 的影响是什么㊂在威尔逊看来,现有的市场理论仅仅提供了大量的实践性知识,还没有建立起完美的理论;特别地,由于经济学家对于产品市场和要素市场(特别是劳动力市场)还没有深入的认识,真正意义的福利经济学还没有建立起来㊂所以威尔逊试图在这些领域做出贡献㊂总结起来,威尔逊的最重要的贡献包括如下三个方面:(1)有关非线性定价(n o n l i n e a r p r i c i n g)方面的贡献㊂其1993年出版的‘非线性定价“已经成为理论界和工商界重要的参考书㊂(2)序贯均衡(s e q u e n t i a l e q u i l i b r i u m)思想㊂他与克雷普斯一起(K r e p s&W i l s o n,1982)共同提出了序贯均衡思想,该思想对于博弈论产生了重大影响㊂他们指出,当信念和行为是自我强化(s e l f-r e i n f o r c i n g)时,一个博弈中会有多个均衡,而利用序贯均衡的思想可以从多个均衡中找到有意义的均衡㊂(3)有关拍卖理论方面的贡献㊂其有关竞争性拍卖机制㊁双重拍卖机制㊁整体拍卖机制㊁分担拍卖机制的研究非常深入,对经济学理论形成了深刻影响㊂威尔逊还与米尔格罗姆(P.M i l g r o m)以及麦卡菲(P.M c A f e e)等共同设计了美国联邦通讯频谱拍卖机制以及参与设计了美国电力市场定价机制㊂威尔逊的其他贡献包括:对于风险分担理论的贡献(R.W i l s o n,1968);对于信息经济学的贡献(R.W i l s o n,1975,1978a; K e n n a n&W i l s o n,1993);对于社会选择理论的贡献(R.W i l s o n,1969,1972)等等㊂关于风险分担理论,其发表的‘辛迪加理论“(1968)成为了金融和会计领域的重要参考文献;关于信息经济学理论,其发表的‘信息㊁效率与经济核“(1978a)成为理解不对称信息与效率问题的核心文献;关于社会选择理论,其发表的‘无需帕累托原则的社会选择理论“(1972)成为博弈论工具分析政治问题的基础文献㊂一㊁对非线性定价理论的贡献20世纪80年代,信息技术的广泛使用使得诸多产业出现了初始固定投资与提供服务时的变动成本的关系越来越复杂㊂初始投资引发的固定成本也称为 产能成本 (c a p a c i t y c o s t s)㊂企业需要将产能79‘经济学动态“2013年第2期∗张苏,中央财经大学经济学院,邮政编码:100081,电子邮箱:z h a n g s u@p k u.e d u.c n㊂成本直接分派给消费者,但如何进行分派?20世纪80年代盛行的最优定价政策(o p t i m a l p r i c i n gp o l i-c y)研究均没有涉及到这一点㊂威尔逊等人发表的经典论文‘产能定价“(O r e n,S m i t h&W i l s o n, 1985)弥补了这一理论空白㊂威尔逊等人的产能定价理论是对潘扎与西布莉(P a n z a r&S i b l e y,1978)的线性定价理论的扩展㊂在潘扎与西布莉的研究中,产能以及服务成本㊁价格都是线性的,而在威尔逊等人的模型中,分析了现实中更为常见的情形:产能以及服务成本㊁价格都是非线性的㊂威尔逊等人的工作也是对米尔曼和西布莉(M i r m a n&S i b l e y,1980)提出的非线性理论的扩展,使得 非线性 对于现实成本和价格的模拟更加逼真了㊂比如,在威尔逊等人的模型中,考虑了订单不同导致产能成本不同的可能性㊂产能定价理论中考虑的重要现象是:不同的消费者对于产品与服务的需求的 量 和 质 是不同的㊂ 量 即是指产品和服务的数量; 质 则是指厂商的 交货时间 或 提供服务的时长 ㊂消费者需求在 量 和 质 上的异质性使得厂商招致的 产能成本 与 变动成本 不同㊂比如,为了满足某一规模的服务量需求只需要价格较低的A类设备;而为了满足更大规模的服务量需求需要价格更高的B类设备;但B类设备提供服务的速度比A类设备慢㊂面对不同消费者,厂商必须选择不同的设备和技术㊂由此来看,厂商的成本依赖于消费者的需求;对于特定的消费者需求,将有对应的产能成本和变动成本㊂使问题变得更复杂的是,消费者了解到自己的消费需求会影响厂商的成本,便会在自己使用服务的 时间模式 上进行决策,并会特别分析自己的 高峰需求 对于产能成本的影响㊂反过来,消费者需求的 量 以及 需求的时间模式 将决定厂商应该安装何种设备,应该按照何种技术生产这些服务量并按照何种劳动力规模以及维持成本来提供这些服务㊂威尔逊等人(O r e n,S m i t h&W i l s o n,1985)对于这一复杂问题进行了非常好的归纳㊂他们提出了 产能要价 (c a p a c i t y c h a r g e s)以及 服务要价 的概念㊂ 产能要价 是由设备的最大产量决定的,而 服务要价 (弥补维持和运行成本的收入)是由设备的运行时间决定的;厂商在制定 最优价格方案 (o p-t i m a l p r i c e s c h e d u l e)时,在计算产能成本和服务使用成本的基础上利用消费者的偏好差异来获取更多的消费者剩余㊂在假设不存在收入效应(防止同一消费者在不同时点上寻求购买服务的折扣)以及转售市场(防止消费者自主实施消费者剩余在不同消费者之间的转移)的前提下,威尔逊等人得出了 产能要价 以及 服务要价 的 二维非线性定价规则 ㊂这一规则的核心思想是,对具有异质性的消费者进行价格歧视,从而实现垄断利润最大化㊂这里的 二维 即是指消费者在消费需求的 量 和 质 上的差异㊂这一定价原则带来的重要方便是,厂商并不需要去了解面对的每一个消费者的 偏好 如何;也就是不需要在讨价还价中得知特定的消费者的更多的 偏好特征 然后再确定价格㊂厂商所要做的只是,掌握整个市场上消费者的 偏好结构 (t h es t r u c-t u r e o f t h e i r p r e f e r e n c e s)是如何的(这比掌握每一消费者的偏好容易多了),利用消费者的 自我选择性质 (s e l f-s e l e c t i o n p r o p e r t i e s),使不同偏好的消费者自动在 最优价格方案 中对号入座㊂比如,对于 量 需求少的消费者,将支付更低的 产能要价 (弥补固定成本),相对更高的 服务要价 (弥补边际成本);而对于 量 需求大的消费者,将支付更高的 产能要价 ,相对更低的 服务要价 ㊂正是由于这一 最优价格方案 利用了消费者的偏好差异,从而为厂商带来了更多的消费者剩余㊂威尔逊等人(R. W i l s o n,1989;C h a o&W i l s o n,1987)关于 服务优先序配给 (p r i o r i t y s e r v i c er a t i o n i n g)的思路与此类似,也是利用消费者的偏好差异来为厂商获取更多的消费者剩余㊂考虑产能成本的 最优价格方案 将导致 消费者裁剪消费 (t r u n c a t i n gp u r c h a s e)的行为㊂消费者总是想最大化效用与成本之间的差额㊂在不考虑产能成本的定价方案中,消费者会在收入预算中选择 边际效用大于边际成本 的任何产量㊂比如,电1元1度,表示1度电的边际成本是1元㊂如果消费者使用第1度电的边际效用为2元(假设该消费者是炼钢厂,需要电,1度电的边际收益是2元),消费者将有动机消费第2度电,因为边际效用大于边际成本㊂假设使用8万度电时的边际效用递减为1,厂商会正好购买8万度电,此时电的边际成本等于边际效用㊂现在来看考虑产能成本的 最优价格方案 ㊂该方案中,如果购买7.5万度以下(含)的电,单价为1元;由于提供7.5万度以上电,线路上的功耗损失会更大,因而成本会更高,价目表中规定,如89果购买7.5万度以上的电,单价为1.2元㊂这时消费者的最优购买量就不是8万度,而是7.5万度㊂这时,消费者 裁剪 了自己的消费㊂消费者如果不裁剪这一额外的消费,将无法弥补电厂产能增加带来的 产能成本 增加㊂非线性最优价格方法促使消费者裁剪消费,提高了厂商的垄断利润㊂最优价格方案 是非线性的,是因为其背后的成本是非线性的㊂由于设备的生产效率(提供 量 和 质 的效率)随时间而变化;消费者需求的 量 和 质 也随时间而变化,因而, 特定时间 上, 特定的一单位产能 生产出的一单位服务的成本是不同的;为了使得这种非线性成本总和最小化,厂商必须寻找最优技术组合(o p t i m a l t e c h n o l o g y m i x)㊂这里的一般规则是: 低产能成本的技术 被用来满足 峰值需求 ; 低边际成本的技术 被用来满足 底部需求 ; 产能成本以及边际成本适中的技术 被用来满足 中部需求 ㊂实现最优技术组合的过程导致了成本的非线性㊂威尔逊等人(O r e n,S m i t h&W i l s o n,1982)还分析了消费者需求相互依赖导致非线性定价成为必要的情形㊂比如,在通讯市场㊁版权市场,人们的购买行为是有 需求外部性 (d e m a n de x t e r n a l i t i e s)的;当有更多的人使用通讯服务,有更多的人购买版权时,通讯设备的边际产能成本以及通讯服务的边际成本会降下来;版权的使用费也可能因为购买规模变大而下降㊂威尔逊等人的模型提出了存在需求外部性时的最优定价原则㊂这时,决定厂商利润的因素有如下三个:产能㊁使用量以及市场份额㊂而这三者是相互影响的㊂产能和使用量影响单位成本从而影响市场份额;市场份额影响技术选择从而影响产能和使用量㊂尽管问题非常复杂,威尔逊的模型使得这些关系变得清晰起来,并为人们制定 非线性价目表 提供了标准的步骤:(1)了解整个市场上消费者对于产品和服务的 偏好结构 ,确定每一类型的消费者的 需求量 的边界值;(2)结合消费者对于 质 的需求(比如交货时间的偏好),确定每一类型的消费者对于产能的选择原则,由此确定 边际产能要价 ㊁ 边际服务要价 ;(3)确定需要进行多大的市场渗透,由此决定最初的固定投入;(4)制定 非线性价目表 ,引导消费者自动依照自己的偏好对号入座㊂二㊁对博弈论的贡献:序贯理性威尔逊和克雷普斯(K r e p s&W i l s o n,1982)提出的序贯均衡(s e q u e n t i a l e q u i l i b r i u m)思想对于博弈论产生了重要影响㊂该项研究是基于泽尔腾(R. S e l t e n,1975)的开创性研究和豪尔绍尼(J.H a r s a-n y i,1975)的相关研究展开的㊂ 序贯均衡 概念是对泽尔腾(1975)提出的 完美均衡 (p e r f e c t e q u i l i b-r i a)概念的一个扩展㊂威尔逊和克雷普斯基于 序贯理性 (s e q u e n t i a l r a t i o n a l i t y)概念直接得到了 序贯均衡 的定义;而泽尔腾(1975)用间接的方式得出非常严格的 完美均衡 的定义,为定义的运用带来了难度㊂ 序贯均衡 是比 完美均衡 更宽广的一个定义, 序贯均衡 概念的提出为研究带来了方便㊂泽尔腾(1975)的研究中,对均衡路径的偏离被称之为 颤抖手 (t r e m b l i n g h a n d s),而威尔逊和克雷普斯提出的 序贯均衡 概念不需要对均衡路径的偏离提出额外的概念进行解释,只需要用含在 序贯理性 中的 信念 概念进行解释即可,使得理论更加简洁了㊂实现 序贯均衡 的标准是,每一个参与人的战略是 序贯理性 的:开始于每一个信息集的每一个战略是余下所有博弈中的最优战略㊂这就需要每一个参与人是有某种 信念 的:关于每一个信息集上博弈如何演进的信念,也包括在非均衡路径上博弈演进的信念㊂在不完全信息以及不完美信息博弈中,序贯理性要求满足萨维奇公理(S a v a g e,1954):每一个时点上任何一个参与人未来的战略具有如下性质,从对所有不确定事件的概率估计来看(包括其他参与人已经做出,但没有观察到的选择的概率估计),这一战略都是最优的;只有满足这样的性质,才实现了不确定性条件下选择的均衡㊂由此,威尔逊和克雷普斯提出,一个均衡不是一个简单的战略,还包括对如下两类概率的估计:一个参与人关于他处在博弈树上的哪个位置,该何时采取行动的信念(一种概率估计);该参与人采取某种战略后未来博弈将如何发展的信念(也是一种概率估计)㊂在每一个信息集上,参与人都会用这种信念以及贝叶斯法则来计算未来的信念(s u b s e q u e n tb e l i e f s)㊂特别地,这种信念的计算不排除偏离均衡路径上的信息集㊂由此,所谓序贯均衡就是,对于一系列信念和战略的连续理性估计㊂威尔逊和克雷普斯(1982)证明:对于99‘经济学动态“2013年第2期每一个扩展博弈,至少存在一个序贯均衡;每一个完美均衡是序贯均衡,但反过来不对㊂这正是威尔逊和克雷普斯的重要贡献㊂序贯均衡 概念覆盖了 完美均衡 概念㊂泽尔腾的完美均衡要求同时满足如下两点:(1)完美均衡 暗示 参与人必然会有对于偏离均衡路径上的信息集的某种信念;(2)要求参与人的战略在上述信念上是均衡的㊂在序贯均衡中,明确提出了参与人要有对于偏离均衡路径上的信息集的某种信念,但不需要上述第二点㊂所以,任何一个完美均衡都是序贯均衡,但任何一个序贯均衡不一定是完美均衡㊂不过,威尔逊和克雷普斯(1982)证明:只要泽尔腾的第一个条件成立,第二个条件很少不成立㊂因此, 几乎所有 博弈中, 完美均衡 与 序贯均衡 是重合的㊂唯一可能的例外是弱均衡(w e a ke q u i l i b r i a),这种情形下两者不重合㊂因而,在数学意义上,这两个概念几乎是一样的㊂为什么还需要新提出一个 序贯均衡 概念呢?主要基于两点:(1)实用主义的需要㊂这使得诸多分析变得简单起来(比如K r e p s&W i l s o n,1981;M i l-g r o m&R o b e r t s,1982)㊂因为,要证明一个均衡是序贯均衡比证明其是完美均衡要简单得多;(2)明确提出 信念 的思想带来了好处:关于偏离均衡路径上的信念构建(c o n s t r u c t i o no f b e l i e f so f f t h e e q u i-l i b r i u m p a t h)分析对于我们讨论哪些信念 可行 ,哪些 不可行 带来了方便㊂而在泽尔腾的暗含信念的分析框架下,这种讨论是不可能的㊂威尔逊等人(K r e p s&W i l s o n,1981)举例说明,按照序贯均衡的原则挑选出的均衡跟按照完美均衡原则挑选出的均衡是一样的,而且,这一均衡具有如下性质:存在唯一的均衡路径行为,同时,其信念是符合直觉的㊂正是由于明确引入了 信念 的思想(关于参与人在博弈树上哪一位置,该何时采取行动的信念以及未来博弈将如何发展的信念),序贯均衡成为了比完美均衡更易让非专业人士理解的概念㊂序贯均衡的提出加深了人们对于复杂的均衡现象的认识㊂博弈论中关于均衡最弱的标准是所谓的纳什均衡(J.N a s h,1951):如果每一个参与人的战略是其他所有人战略的最优反应,则该战略被称为纳什均衡㊂纳什均衡的重要意义在于,帮助人们认识到,如果所有参与人要形成 一致同意 的行为协议,这些行为必须构成纳什均衡;否则,会有人发现背叛这一协议将是有利可图的㊂泽尔腾(R.S e l t e n, 1965)发展了纳什均衡的概念,提出了更为严格的 一致同意 的行为协议:子博弈精炼纳什均衡㊂泽尔腾(R.S e l t e n,1975)进一步提出了更为复杂的 完美均衡 ㊂用μ表示 信念 ,用π表示 战略 ,一个参与人会有n个信念,在每一个信念上,会有一个战略,因而,一个参与人对于博弈的估计可以写成(μn,πn)㊂如果序贯{(μn,πn)}n=1,2 收敛的,也就是l i m nңɕ(μn,πn)=(μ,π),这被称为 完美均衡 ㊂战略πn与极限战略π的差异是:πn是应对其他参与人若有极小的概率犯错误或者发生 颤抖 时的最优战略㊂如果对方 颤抖 的概率极小,则有πn =π㊂极限战略π的意思是,在任何一个信息集上,哪怕是出现了对于估计的 背离 (d e f e c t i o n,对其发生的先验概率为0),还会继续使用极限战略π㊂也就是说,某一个初始的 背叛 不会使得第二个 背叛 更容易发生,因而参与人继续使用极限战略π㊂想象一个参与人i正在预测参与人j的行为㊂参与人i一定会想到,j在预测所有其他人的行为㊂那么,纳什标准要求,j的行为是对j所预测的其他所有人的行为的最优反应㊂显然,泽尔腾提出了更加严格的均衡标准:j的行为还必须是对其他参与人的不同信念下的战略πn(而且此战略收敛于极限战略π)的最优反应㊂当发生了 背离 情况时,j会将这种先验概率为0的事件解释为 犯了小差错引起的 ㊂在泽尔腾的框架内,i必须知道j的支付㊂而序贯均衡中并不需要i知道j的支付,允许i对于j 的支付存在不确定性㊂这样只需要j的战略是对于i的 不安的战略 (p e r t u r b e ds t r a t e g i e s)的最优反应,也就是得到最接近j的信念的支付㊂三、对拍卖理论的贡献威尔逊对于 竞争性拍卖机制 ㊁ 双重拍卖机制 ㊁ 整体拍卖与分担拍卖机制 进行了卓越的研究㊂威尔逊(1977)证明,通过竞争性拍卖形成的价格满足大数定理:对于一件具有确定货币价值但没有人确切知道的拍卖品,每一个参与人利用自己对于该商品价值的私人信息进行报价㊂参与人私人信息是关于商品价值的独立分布,参与人的私人信息是同分布的㊂在密封报价拍卖中,拍卖人将拍卖品出售给最高报价者㊂这个最高报价正好是该拍卖品001的真实价值㊂由此,虽然没有任何一个竞拍人知道该拍卖品的真实价值,但这种机制使得出售人获得的出售价格正好是其真实价值㊂威尔逊用非合作博弈模型描述了这一问题㊂假设竞标人有n个,n>2,第i个竞标人对于拍卖品的价值的信息为s i,该拍卖人根据这一样本信息来确定其报价b i㊂假设该商品的真实价值是v,那么,一个竞拍成功的人对于该拍卖品的效用将为u(s i,v),净收益为u(s i,v)-b i㊂威尔逊证明,竞争性拍卖将最终揭示出真实价值v㊂威尔逊表明,尽管支付函数关于报价是线性的假设排除了竞拍人可能是厌恶风险型的这种可能性,当有很多投标者时,即使有这种可能性,结果也不会有实质的不同㊂竞争性拍卖机制的最关键之处在于,没有任何人能观察到真实价值v,每一个竞标人对于拍卖品仅有私人信息s i,而且每一个人的标价b i仅仅依赖于s i和竞标人数n;尽管如此,随着竞标人数增加,这一不完全信息的非合作博弈将使得最终的出售价格收敛于 真实价值 ㊂其重要的理论含义是:(1)市场上的出售价格传递了市场上相关参与人的 所有 相关信息;(2)价格形成理论与价值理论是内在一致的㊂威尔逊(R.W i l s o n,1978b)将这一研究扩展到了对于竞争性市场结构的分析㊂在有关双重拍卖的研究中(R.W i l s o n,1985),威尔逊试图找出对于自己的偏好为私人信息的参与人之间进行交易的激励有效(i n c e n t i v ee f f i c i e n t)原则,分析这些参与人的纳什均衡战略的福利含义㊂激励有效的交易规则是指,在现有的交易规则下,再也不存在如下共同知识:还有另外的交易规则能提高某个参与人的预期收益而不会减损其他人的预期收益㊂这是对霍姆斯特姆等人(H o l m s t r o m&M y-e r s o n,1983)理论的一个应用和发展㊂该双重拍卖模型中,仅有参与人知道自己的 类型 ,这种类型影响他自己的偏好;但是,所有参与人的类型形成的分布是一个共同知识㊂什么是双重拍卖呢?具有如下交易规则的拍卖称为双重拍卖:假设第i个竞拍者的报价为r i;第j个出售者的报价为b j㊂如果在所有报价r i中,第k高的报价为r k=r i (k);所有出售者的报价b j中,第k低的报价为b k =b j(k),那么,达成的交易量为k=m a x{k|r kȡb k}㊂该拍卖机制的目标是最大化交易量㊂双重拍卖中包括三种行为:(1)竞拍者的行为㊂竞拍者的报价会均衡在报价的预期收益等于预期损失的水平上㊂预期收益受到报价策略的影响㊂威尔逊(R o b e r tW i l s o n,1985)假设竞拍者按照递减的价格进行报价,比如每次减价d p㊂如果减价成功,则预期收益正好为d p;预期损失为效用(最高保留价格)u与均衡价格p之差,也就是消费者剩余损失(u -p)㊂减价成功是指:他的新报价正好促使交易成功,均衡交易价格由于他的报价而下降了;此时,该竞拍者正好是 边际购买者 ㊂一方面,这一事件的概率取决于竞拍者影响均衡交易价格的程度㊂如果竞拍者的需求量总和为m,出售者的供给量总和为n,那么,竞拍者降低交易价格的相对力量大小为λ1 =m/(m+n),出售者降低交易价格的相对力量大小为λ2=n/(m+n)㊂威尔逊的模型中,竞拍者和出售者的博弈促使价格维持在一个上限(p m a x)和一个下限(p m i n)之间(集合(p m i n,p m a x),那么均衡价格p0可以写成:p0=λ1p m a x+λ2p m i n也就是说,如果竞拍者的总需求占总需求与总供给之和的比例λ1越大,价格更可能接近上限㊂其经济直觉是,如果需求大于供给,价格有被抬高倾向;相反,如果出售者的总供给占总需求与总供给之和的比例λ2越大,价格更可能接近下限㊂其经济直觉是,如果供给大于需求,价格有被压低倾向㊂另一方面,竞拍者的报价正好是均衡价格上限p m a x的概率㊂(2)出售者的行为㊂出售者的报价也会均衡在报价的预期收益等于预期损失的水平上㊂其分析与上类似㊂(3)竞拍者与出售者之间的博弈㊂威尔逊证明,只要竞拍者和出售者的数量足够大,双重拍卖机制下两者之间的博弈是 激励有效的 (i n c e n t i v ee f f i-c i e n t):这种机制下,人们的竞价和报价行为会自动地揭示出交易参与人所属类型的联合概率分布,以及每个参与人的依赖于其所属类型的保留价格的分布㊂也就是说,双重拍卖机制下交易者利用自己的私人信息形成的战略行为是符合经济效率的;再也不存在其他均衡价格,使得竞拍人和出售者中有任何人的预期收益会提高而不会减损其他人的预期收益㊂威尔逊(1979)还比较了整体拍卖("u n i t"a u c-t i o n)以及分担拍卖("s h a r e"a u c t i o n)这两种拍卖机制的差异㊂在整体拍卖中,一项商品或者服务作为整体出售给最高报价者;在分担拍卖中,一项商品或者服务被分割成若干部分,每一个竞拍者支付的价101‘经济学动态“2013年第2期。
效用函数与纳什均衡李保明(山东大学产权研究所,济南,250100)刘家壮(山东大学数学与系统科学院,济南,250100)摘 要 本文引入效用函数将博弈问题描述为收入形式和效用形式两种模型,使得纳什均衡与参与人效用函数联系起来,并得到结论:(1)效用函数的变化对纯策略纳什均衡不产生影响,却改变真混合策略纳什均衡;(2)效用函数严格拟凹时,真混合策略纳什均衡是稳定的;(3)效用函数严格拟凸时,真混合策略纳什均衡不存在.关键词 效用函数,博弈论,纳什均衡1.引言近二十年来,博弈论在经济学领域产生重大影响,并有从根本方法上改写经济学的趋势.博弈论在经济分析中的广泛适应性是因为它更好地描述了经济问题,并为决策者提供了一套可丢行的决策方法.其中的关键概念纳什均衡为相互影响的决策者提供了博弈可能结果的一致性预测,也是理性决策者最优决策的结果,从而为决策者指明了决策方向.但是博弈论本身的缺陷阻碍了经济理论的发展,其中之一就是纳什均衡的多重性,由纳什均衡不唯一性导致经济(或博弈)问题的一致性预测结果很多,决策者仍然面临不确定性问题.如何在众多的纳什均衡中选择更为合理的一个?目前仍然博弈论中的理论难点.泽尔腾的子博弈完美纳什均衡和颤抖的手完美均衡以及梅耶森的适度均衡都是精炼纳什均衡所作的努力.但是仍不能得到满意结果(即唯一的均衡),考尔伯格和默顿提出稳定均衡的概念(Stable equilibria ),并说明没有单一的策略组合能满足所有要求,因此均衡解应是某些策略组合的集合而不是单一的策略组合,这似乎给均衡精炼下了一个“不能达到唯的”结论,然而这对博弈论在经济学上的应用和解决经济问题产生巨大障碍.海萨尼、泽而滕(Harsanyi ,Selten ,1988)提出纳什均衡选择的收入占优和风险占优分析方法,但它引起许多争议,并与Cooper ,Dejong ,Forsythe ,和Ross (1990)等人的实验结果不相符.尽管如此,参与人的决策总是选择一个策略,而不是多个策略,在下面的讨论中,我们引入效用函数描述参与人的这种选择.在所有的博弈描述中,它都是由参与人、参与人策略和各种策略组合下的结果(参与人支付)所组成.根据博弈问题的不同,它还有不同的信息结构.对于完全信息的博弈,上述三要素是参与人的共同知晓的共同知识(Common knowledge ).但是,应该看到在博弈论描述的经济问题中,决策者(或称参与人)是根据其效用选择其策略的,参与人知道自己的效用函数却不能保证他知道其他参与人的效用函数,也就是说实际决策所需的效用函数不是参与人共知的共同知识;那么,作为共同知识的支付只能是各种策略组合下参与人的收入.在纳什(Nash ,第17卷第4期2000年12月 经 济 数 学MA THEMA TICS IN ECONOMICS Vo1117 No.4Dec.2000收稿日期:2000-05-231950)定义中,他没有明确指明支付是收入还是效用,然而在讨论问题时又把它们混在一起.在后面的讨论中,我们可以看到两者的区分是很有意义的.现有的博弈结构没有完全揭示经济问题,还有描述参与人特征(比如对风险的态度等)的效用函数没有表达出来.这一问题导致了博弈论的重大缺陷即纳什均衡选择方面的困难.本文首先将效用函数引入博弈结构得到博弈问题新的描述形式,进而讨论不同效用函数导致纳什均衡的不同性质,尤其是混合策略纳什均衡的特征.2.博弈问题的新描述描述经济问题的博弈论模型由参与人、策略和支付三要素组成,与原有的博弈论模型不同的是,我们根据支付是参与人的收入还是效用将博弈论描述分为博弈问题的收入形式模型和效用形式模型,收入形式模型是描述经济问题的中间模型,最终描述形式应是效用形式模型.211 博弈问题收入形式模型这种形式的博弈论模型和以前的描述没有区别,但为以后讨论问题方便,我们有必要严格表述一遍.收入形式博弈模型由参与人、策略和收入组成,我们考虑有限博弈问题,它由以下因素组成:(一)参与人集合N ={1,2,…,n},每一个参与人i ∈N 是博弈问题中的决策主体,其目的是其收入或期望收入最大化.(二)参与人策略和策略组合,参与人i 的纯策略集合记为S i ={s 1i ,…,s k i i },所有参与人的纯策略组成纯策略组合s =(s j i 1,…,s j n n ),其中j i =1,…,k i ,或简记为s ={s 1,…,s n },策略组合的全体为S =Πni =1S i .关于混合策略,参与人i 的混合策略是S i ={s 1i ,…,s k i i }上的概率分布即k i 维向量σi =(p 1i ,…,p k i 1),其中p j i i Ε0,∑k i j i =1p j i i =1,其全体为M i ={(p 1i ,…,p k i i )|∑k i j i =1p j i i =1},混合策略组合是由它们组成的m (m =k 1+k 2+…+k n )维向量σ=(σ1,…σn ),其全体为M ={(σ1,…,σn })|σi ∈M i ,i ∈N }=Πn i =1M i .当σi 的概率集中到一个纯策略s i 时,则它称为非真混合策略(improper mixed strategy )或称纯策略,记为σi =s i .否则,称为真混合策略(proper mixed strategy ).在混合策略中取概率为正的所有纯策略全体称为σi 的载体(carrier ),记为C (σi );若C (σi )=S i ,即在每一个纯策略的概率为正,则称σi 为完全混合策略(completely mixed strategy ).若所有的σi (i ∈N )均为纯策略,则它称为纯策略组合,并记为σ=s ;否则σ称为真混合策略组合(proper mixed 2strategy profile ).(三)收入(Payoff ),参与人i 的收入不仅取决于自己的策略而且与其他参与人的策略有关,它是策略组合的函数:对于纯策略组合s =(s j 11,…,s j n n ),其中j i =1,…,k i ,a i (s )=a i (s j 11,…,s j 22,…,s j n n )是确定的实数,所有参与人的收入记为A =(a i (s ))s ∈S ,i ∈N ,并称为收入矩阵.对于混合策略σ=(σ1,σ2,…,σn ),a i (σ)=a i (σ1,σ2,…,σn )是在{a i (s )|s ∈S }上取值的随机变量,其数学期望为Ea i (σ)=∑k 1j 1=1∑k 2j 2=1…∑k nj n =1a i (s j 11,s j 22,…,s j n n )p j 11p j 22…p j nn 对于完全信息的博弈问题,上述三项均为共同知识,记为G =(N ,(S i )i ∈N ,(a i )i ∈N ),—22— 经济数学 第17卷并称之为博弈问题的收入形式模型.我们在G 上定义纳什均衡,对任一i ∈N ,记σ=(σi ,…,σn )≡(σi ,σ-i ).定义1 策略组合σ3=(σ31,…,σ3n )是收入形式的纳什均衡,如果对任一i ∈N ,Ea i (σ31,σ3-i )ΕEa i (σi ,σ3-i ),Πσi ∈M i(1)成立.若σ3为纯策略组合,则称其为纯策略纳什均衡,否则称之为真混合策略纳什均衡.现有的结论都适用于收入形式的博弈问题,主要有以下几个方面的内容:(一)纳什均衡的存在性纳什于1950年最早给出博弈问题均衡的定义和其存在性的理论,从此开始纳什均衡的存在性就成了博弈论研究的一个主要方向,并取得了大量的研究成果.纳什均衡存在性定理1(Nash ,1950)每一个有限博弈至少存在一个纳什均衡.Debreu ,G licksberg 和Fan 等人研究了参与人的策略无限的情况,得到如下存在性定理.纳什均衡存在性定理Ⅱ(Debreu ,1952;G licksberg ,1952;Fan ,1952)在n 人博弈问题G 中,若每一个参与人的纯策略集合S i 是欧氏空间的非空紧致凸子集,且每一个收入函数a i (s )关于s 连续、关于s i 拟凹,则存在一个纯策略纳什均衡.G licksberg 放松拟凹性条件得到混合策略的存在性.纳什均衡存在性定理Ⅲ (G licksberg ,1952)在n 人博弈问题G 中,若每一个参与人的纯策略集合S i 是欧氏空间的非空紧致凸子集,且每一个收入函数a i (s )关于s 连续,则存在一个混合策略纳什均衡.放松收入函数连续的连续性条件,Dasguta 和Maskin 得到非连续博弈的纳什均衡的存在性.纳什均衡存在性定理Ⅳ (Dasguta ,Maskin ;1986)在n 人博弈问题中,若每一个参与人的纯策略集合S i 是有限维欧氏空间的非空紧致凸子集,每一个收入函数a i (s )关于s i 拟凹,关于s 上半连续,且具有连续最大值①,则存在一个纯策略纳什均衡.(二)纳什均衡稳定性根据纳什的定义,纯策略的严格纳什均衡是稳定的,即指在其他参与人采取纳什均衡的策略时,任一参与人的策略偏离均衡策略都有恢复到均衡策略的动力,但是真混合策略的均衡却是不稳定的.(三)纳什均衡的多重性纳什均衡概念的一个重要缺陷就是它的多重性,即许多博弈问题有多个纳什均衡,Wilson 研究了均衡的计算方法并提出著名的奇数定理.奇数定理(Silson ,1971)几乎每一个有限博弈问题具有奇数个纳什均衡.参与人和策略数量给定情况下,一个有限博弈问题由m Πn i =1k i 维向量(即收入矩阵)唯一确定,定理中的“几乎”是指除m Πn i =1k i 维欧氏空间中测度为零的集合外都成立.(四)纳什均衡的精炼与选择由于纳什均衡的多重性,剔除不合理的均衡或选择一个合理的均衡成了近年来博弈论发展的主要方向之一.这方面泽尔滕提出子博弈完美均衡(Selten ,1965)和颤抖的手完美均衡(Selten ,1975),以及克瑞普斯和威尔森的序贯均衡(Kreps ,Wilson ,1982)等概念进一步精炼了均衡概念.伯汉姆(Bernheim ,1984)和皮尔斯(Pearce ,1984)提出了剔除不合理策略的合理化过程和合理化策略.但是这些概念都有这样和那样的缺陷,不能保证其唯一性和存在性,它—32—第4期 李保明 刘家壮:效用函数与纳什均衡 ①a i (s )具有连续最大值是指a 3i (s -i )=max s i ∈S i a i (s i ,s -i )关于s -i 连续们不能替代纳什均衡解决多重性问题.海萨尼、泽尔滕(Harsanyi ,Selten ,1988)提出纳什均衡选择理论,然而它们却不被实验结果所证实.212 效用形式的博弈模型参与人作为决策主体,他们选择策略的目标是效用最大化.一般地,参与人i 的收入a i (σ)是取值于{a i (s )|s ∈S )}上随机变量,其全体记为 A ={a i (σ)|σ∈Μ,i ∈N },参与人在 A 中的选择可定义为偏好序“Λ”,并有如下公理:11自反性,任意σ∈M ,则a i (σ)Λa i (σ).21完备性,任意σ,σ′∈M ,则a i (σ)Λa i (σ′)或者a i (σ′)Λa i (σ).31传递性,任意σ,σ′,σ″∈M ,如果a i (σ)Λa i (σ′)和a i (σ′)Λa i (σ″)都成立,则a i (σ)Λa i (σ″).41连续性,对任一 σ∈M ,集合{σ∈M |a i ( σ)Λa i ( σ)}和{σ∈M |a i (( σ))Λa i (σ)}是M 上的闭集.51独立性,对任意σ,σ′,σ″∈M ,和α∈(0,1),如果a i (σ)Λa i (σ′),则a i (ασ+(1-α)σ″)Λa i (ασ′+(1-α)σ″).如果偏好序“Λ”满足公理124,根据德布鲁表示定理(Representation Theorem ),存在一个连续效用函数u i ,并记为u i (σ)≡u i (a i (σ)),使得a i (σ)Λa i (σ′)Ζu i (a i (σ))≥u i (a i (σ′))如果“Λ”还满足公理5,则u i 是一个预期效用函数,即u i (σ)==∑k 1j 1=1∑k 2j 2=1…∑k nj n =1u i (a i (s j 11,s j 22,…,s j n n ))p j 11p j 22…p j nn 定义了参与人的效用函数u i (i ∈N )后,一个经济博弈问题描述为:E =(N ,(S i )i ∈N ,(a i )i ∈N ,(u i )i ∈N ),它称为博弈问题的效用形式模型.在E 上定义纳什均衡:定义2 策略组合σ3=(σ31,…,σ3n )是效用形式E 的纳什均衡,如果对任一i ∈N ,有u i (a i (σ31,σ3-i ))Εu i (a i (σi ,σ3-i )),Πσi ∈M i(2)成立.若σ3为纯策略组合,则称其为纯策略纳什均衡,否则称之为混合策略纳什均衡.3.效用函数与纳什均衡的性质311 效用函数自从冯・诺依曼、摩根斯坦提出预期效用理论(Von Neumann ,Morganstein ,1944)以来,由于其公理表达简单而且规范,效用函数容量计算并且形式上较好地体现人们的风险行为类型(比如对风险的态度和程度可用效用函数的凸凹性及Arrow 2Pratt 测度来表示)等特征,不确定经济学的理论和应用研究一直是在此基本框架下进行的.现代博弈论也是在此基础上发展起来的.然而,预期效用理论中起关键作用的独立性公理假设并不总是成立,著名的Allais 悖论说明在某些情况下人们会系统地违反这一公理.目前寻找不含这一公理的效用函数正是数理经济学研究的热点课题,在这方面,Machina ,Quiggin 等人作了大量的工作.博弈问题中的参与人与其他决策人一样受独立性公理的影响.我们研究预期和非预期效用框架下纳什均衡的性质变化.对于非预期效用,沿用Machina (1982)的方法,我们假设参与人i 的非预期效用函数u i (a i (σ))(1)(Frechet )可微的,(2)关于收入a i (σ)是一阶随机占优偏爱的且关于确定的收入是严格递增的.假设(2)也即,对任意的混合策略σ,σ′∈M ,若a i (σ)一阶随机占优于a i (σ′),则u i (a i (σ))Εu i (a i (σ′));和对确定的a ,a ′Ε0,a >a ′,有u i (a )>u i (a ′).—42— 经济数学 第17卷312 纳什均衡的性质我们先引入风险价格的定义.定义3 对于效用函数u ,称R X 为随机收入(随机变量)X 的风险价格,如果有u (X )=u (EX -R X ).风险价格在经济和金融学中具有重要含义,它是人们为规避资产的风险所愿意付出的代价.随机变量a i (σ3i ,σ3-i )和a i (σi ,σ3-i )的风险价格分别为R i (σ3i ,σ3-i ),R i (σi ,σ3-i )使得u i (a i (σ3i ,σ3-i ))=φi (Ea i (σi ,σ3-i )-R i (σ3i ,σ3-i )),Πi ∈N.R i (σi ,σ3-i )使得u i (a i (σ31,σ3-i ))=φi (Ea i (σi ,σ3-i )-R i (σi ,σ3-i ),Πi ∈N其中,φi (x )=u i (x )(Πx ∈R ,Πi ∈N )是严格递增的,因此效用形式的纳什均衡等价于下面形式的不等式:Ea i (σ31,σ3-i )-R I (σ3i ,σ3-i )ΕEa i (σi ,σ3-i )-R I (σi ,σ3-i ),Πi ∈N.(3)不等式(3)将效用形式的纳什均衡和收入形式的纳什均衡联系起来,而且从形式上可以看到两者是不相同的,差别就在于风险价格.定理1 如果效用函数u i (Πi ∈N )满足假设条件(2),则收入形式博弈问题G 的纯策略纳什均衡必是效用形式博弈问题E 的纯策略纳什均衡;反之亦然.证明:假设σ3=(σ3i ,σ3-i )是收入形式博弈的纯策略纳什均衡,因此,对任意的纯策略s i ,有a i (σ3i ,σ3-i )Εa i (s i ,σ3-i )Πi ∈N(4)对于混合策略σi ,a i (σi ,σ3-i )是取值于{a i (s i ,σ3-i )|s i ∈S i }上的随机变量,所以,a i (σ3i ,σ3-i )一阶随机占优于a i (σi ,σ3-i ).根据假设(2),因此有u i (a i (σ3i ,σ3-i ))Εu i (a i (σi ,σ3-i )),Πσi ∈M i(5)即(σ3i ,σ3-i )是效用形式的纯策略纳什均衡.反过来,假设(σ3i ,σ3-i )是效用形式的纯策略纳什均衡,即(3)式成立,σi 为纯策略s i ,则R i (s i ,σ3-i )=0,同时R i (σ3i ,σ3-i )=0,因此由(3)式得到:a i (σ3i ,σ3-i )Εa i (s i ,σ3-i )Πi ∈N(6)如果σi 为混合策略,σi =(p 1i ,p 2i ,…,p k i i ),且∑k i j =1p j i =1,所以Ea i (σi ,σ3-i )=∑k i j =1p j i a i (s i ,σ3-i )Φa i (σ3i ,σ3-i )也即σ3=(σ3i ,σ3-i )是收入形式的纳什均衡.证毕此定理也说明纯策略的纳什均衡不随效用函数的变化而改变,甚至不管是预期效用函数还是非预期效用函数;也就是说,只要参与人的效用函数满足假设(2),不同参与人的博弈具有相同的纯策略纳什均衡.然而,混合策略的纳什均衡却不具有这一性质.首先考虑预期效用形式的博弈问题,参与人预期效用函数的变化将改变看混合策略的纳什均衡.例.考虑一个2人参加的博弈问题,其收入形式的描述为图1(a ).如果参与人的效用函数为u 1(x )=u 2(x )=x (即以收入作为效用,u ″1(x )=0说明参与人是风险中性的),则它有三个纯策略纳什均衡和四个真混合策略纳什均衡:((1,0,0),(1,0,0));((0,1,0),(0,1,0));—52—第4期 李保明 刘家壮:效用函数与纳什均衡 ((0,0,1),(0,0,1))和((0,01625,01375),(0,01444,01555));((01774,0,01225),(01757,0,01242));((01604,01277,01118),(01660,01106,01232));((01689,01310,0),(01800,01200,0)).收入形式模型:参与人2参与人1策略1策略2策略3策略11100,21001100,01201150,060策略20150,11003100,51002100,2100策略30120,11200150,11004100,6100图1(a )效用形式模型:参与人2参与人1策略1策略2策略3策略119100,3610019100,319627175,11160策略29175,1910051100,7510036100,36100策略33196,221569175,1910064100,84100图1(b )若参与人的效用函数变为u 1(x )=u 2(x )=20x -x 2(u ″1(x )<0,说明参与人是风险厌恶的),效用形式描述如图1(b ),它的纯策略纳什均衡不变,真混合策略纳什均衡变为:((0,01625,01375),(0,01404,01595));((01716,0,01283),(01706,0,01293));((01549,01322,01128)(01613,01104,01281))和((01636,01363,0),(01775,01224,0)),可见,两者是不相同的.这一例子说明,同样的博弈问题,不同的参与人会得不同的结果,这符合实际情况.许多经济学实验中同一博弈问题得到不同的博弈结果正是这种原因.这也说明,考虑纳什均衡选择问题时,混合策略的纳什均衡是至关重要的.由于纳什均衡的预期效用形式定义和收入形式的定义类似,所以预期效用函数对纳什均衡的性质影响不大,比如它不改变纳什均衡的存在性和混合策略纳什均衡的非稳定性.对于非预期效用形式的博弈问题,我们考虑严格拟凹和严格拟凸的两类用函数.它们将改变混合策略纳什均衡的非稳定性和存在性.Machina 考虑了大量的违反独立性公理的实验证据,并证明了几乎所有文献中出现的违反独立性公理的情形可用拟凹或拟凸的二次偏好函数来解释,Camerer (1989),Chew 和Waller (1986),以及Conlisk (1987)等人的实验也发现违反独立性公理的有力证据,并且其中的一半与拟凹的效用函数相符,另一半与拟凸的效用函数相符.在理论工作方面,Kreps 和Porteus (1979)等人曾提出证据表明效用函数的拟凸比拟凹更合理.考虑参与人效用函数u i (σi ,σ-i )关于他自己策略σi 的拟凹(凸)性.u i (σi ,σ-i )关于策略σi 的严格拟凹性是指:对任意的σi ,σ′i ∈M i ,σi ≠σ′i 和σ-i ∈Πj ≠iM i 有:u i (ασi +(1-α)σ′i ,σ-i )>min (u i (σi ,σ-i ),u i (σ′i ,σ-i ))—62— 经济数学 第17卷成立,其中α∈(0,1).若-u i 关于σi 严格拟凹,则称u i 严格拟凸.定理2 在博弈问题E 中,如果对任一参与人i ,其效用函数u i (σi ,σ-i )关于σi 是严格拟凹的,则博弈问题E 的真混合策略纳什均衡是稳定的.证明: 设σ3是博弈问题的一真混合策略纳什均衡,它的稳定性是:任一参与人i ,σ3=(σ3i ,σ3-i )和Πσi ∈M i ,σi ≠σ3i ,有u i (σi ,σ3-i )<u i (σ3i ,σ3-i ).现用反证法证明之.假设存在一个r 和σ′r ∈M r ,σ′r ≠σ3r 使得u r (σ′r ,σ3-r )=u r (σ3r ,σ3-r ).取σ∈(0,1),构造σ″r =ασ′r +(1-α)σ3r ∈M r ,根据u r 的严格拟凹性,有,u r (σ″r ,σ3-r )>min {u r (σ′r ,σ3-r ),u r (σ3r ,σ3-r )}=u r (σ3r ,σ3-r ).这与σ3=(σ3r ,σ3-r )是纳什均衡相矛盾.证毕定理3 在博弈问题E 中,(1)如果某一参与人i 的效用函数u i 是严格拟凸的,则博弈问题E 的任一纳什均衡σ3=(σ3i ,σ3-i )中,σ3i 必是纯策略;(2)如果每一参与人i 的效用函数u i (σi ,σ-i )关于σi 都是严格拟凸的,则博弈问题E 没有真混合策略的纳什均衡.证明:先证命题(1),用反证法,假设博弈问题E 的纳什均衡(σ3i ,σ3-i )中的策略σ3i 是真混合策略,则存在r (r Ε2)个大于零的数{p i 1i ,p i 2i ,…,p i r i }使得σ3i =∑r t =1s i t i p i t i ,且∑rt =1p i t i =1,根据效用函数u i (σi ,σ3-i )关于σi 的严格拟凸,则u i (σ3i ,σ3-i )<max (u i (s i 1i ,σ3-i ),u i (s i 2i ,σ3-i )…,u i (s i r i ,σ3-i )).这一不等式显然与(σ3i ,σ3-i )是纳什均衡相矛盾,命题得证.根据命题(1),命题(2)显然成立.证毕定理3导致一个重要结论,即博弈问题的收入形式模型不存在纯策略纳什均衡时,若参与人i 的效用函数u i (σi ,σ-i )关于σi 是严格拟凸的,则效用形式的模型E 不存在纳什均衡,这大大改变了纳什均衡存在性定理Ⅰ.4.结论通过上面的讨论,我们看到效用函数的变化对博弈问题的纯策略纳什均衡不产生影响,却改变真混合策略纳什均衡,甚至使其不存在.所以对只有一个纯策略纳什均衡的博弈问题来讲,无论参与人多么不同,他们有一个共同的纳什均衡,这一纳什均衡容易成为他们的一致性预期,这也是这类问题博弈结果容易达到纳什均衡的原因.因此,对于具有一个纯策略纳什均衡的博弈问题,我们不必要考虑参与人的效用特征.但是,对于收入形式含有多个纯策略纳什均衡或仅含有真混合策略纳什均衡的博弈问题(其实前者亦有真混合策略纳什均衡)来讲,参与人不同,博弈问题的真混合策略纳什均衡会发生变化,甚至会消失.这也是这类问题博弈的结果往往会得到不同的纳什均衡、甚至达到非均衡的原因.因此,要确定博弈问题的结果,必须考虑参与人的效用函数.参与人的效用函数的不同的会改变博弈问题的混合纳什均衡,进而影响博弈结果.所以研究纳什均衡的选择问题必须考虑参与人的偏好即效用函数.—72—第4期 李保明 刘家壮:效用函数与纳什均衡 参 考 文 献[1] Camerer ,C.,An experimental test of several generalized utility theories ,Journal of Risk and U ncertainty ,2(1989),61-104[2] Chew ,S.H.and Waller ,W.S.,Em pirical tests of weighted untility ,Journal of M athem atical Psychololgy ,30(1986),55-72.[3] Conlisk ,J.,Verifying the betweennes axiom with questionnaire edidence ,or not :take your pick ,EconomicL etter ,25(1987),319-322.[4] Cooper ,R.,DeJong ,D.,Forsythe ,R.And Ross ,T.,Selection criteria in coordination games :some experimen 2tal results ,A merica Economic Review ,80(1987),218-233.[5] Dasgupta ,P.And E.Maskin ,The existence of equilibrium in discontinuous economic games.1:Theory ,Pre 2view of Economic S tudies ,53(1986),1-26.[6] Debreu ,D.,A social equilibrium existence theorem ,Proceeding of the N ational Academy of Seience ,38(1952),886-893.[7] Fan ,K.,Fixed point and minmax theorems in locally convex topological linear spaces ,Proceeding of the N a 2tional Academy of Science ,38(1952),121-126.[8] G ilicksberg ,I.L.,A further generalization of the kakutani fixed point theorem with application to nash equi 2librium points ,Proceedings of the N ational Academy of Science ,38(1952),170-174.[9] Harsanyi ,J.and Selten ,R.,A General Theory of Equilibrium Selection in Games ,The MIT Press.1988.[10] Kreps.D.and Porteus ,E.,Tem poral Von Neumaun 2Morgensten and induced Pref erences ,Journal of Eco 2nomic Theory ,20(1970),81-109.[11] Machina ,M.J.,Expected utility analysis without the independent axiom ,Economet rica ,50(1982),227-323.[12] Nash ,J.,Equilibrium points in n 2person games ,Proceedings of the N ational Academy of Sciences ,36(1950),48-49.[13] Wilson ,R.,Computing equilibrium of N 2person games ,S IA M Journal of A pplied M athem atics ,21(1971),80-87.[14] Von Neumann ,J.and Morgenstern ,O.,Games and Economic Behavior Princeton University Press ,1944.UTIL ITY FUNCTION AN D NASH EQUIL IBRIUMLi Baoming(Institute of property ,S handong U niversity ,Jinan ,280100)Liu Jiazhuang(College of M athem atics ,S handong U niversity ,Jinan ,250100)Abstract In this paper ,using utility functions we describe game as income and utility models ,establish relations of Nash equilibria and utility functions of players ,and obtain the conclusions :(1)changes of utility functions don πt alter the equlibria of pure strategies ,but do alter those of proper mixed stategies ;(2)when utility functions of players are quasiconcave ,the equlibria of proper mixed stategies are stable ;(3)when utility functions of players are quasiconvex ,the equilibria of proper mixed stategies do not exist.K eyw ords Utility function ,game ,Nash equilibrium —82— 经济数学 第17卷。
Journal of Economic LiteratureVol. XXXVII (September 1999) pp. 1067–1082纳什均衡和经济理论史罗杰•B•梅耶森cluo译1、回顾一场思维的革命1999年11月16日是《国家学术学报》编辑部接受约翰•纳什第一篇关于非合作均衡论文的五十周年纪念日。
五十周年纪念日是我们反思这一重大事件再好不过的时机了,所幸我们仍然对它保存有鲜活的记忆,同时我们还拥有足够的距离来透视它的更为广阔的历史意义。
从上述角度看,现在应该把纳什的非合作博弈理论看作为二十世纪最为卓越的思维进步之一。
纳什均衡的系统陈述给经济学和社会科学带来的广泛而且根本性的震撼正如DNA双螺旋结构的发现给生物学带来的震撼。
但是即使到现在,仍然有不少流行的经济思想史书甚至没有用一页的篇幅来介绍纳什的工作(参见Jurg Niehans 1990),而且许多杰出的学者可能还在致力于寻找一种“共同的”社会科学统一基础,根本无视非合作博弈论提供的坚实的统一基础(参见Edward Wilson 1998)。
因此,我们现在应该有必要在更加广阔的历史背景中来重新审视纳什的工作,以便看出一个年轻数学家的几篇短文是如何成为社会科学历史中的一个伟大的分水岭式突破。
E•罗伊•温邱布(1992)给早期的博弈论历史提供一个很好的综述,他尤其把注意力集中在约翰•冯•诺伊曼和奥斯卡•摩根斯坦的工作上(参见摩根斯坦1976)。
自从1994年诺贝尔经济学奖被授予约翰•纳什、约翰•海萨尼和莱因哈德•泽尔腾,才陆续有一些文章开始赞赏纳什的工作;读者可以参考罗伯特•伦纳德(1994),哈罗德•库恩(1994),约翰•麦洛(1995),艾里尔•鲁宾斯坦(1995),艾里克•范•丹米和乔根•威布尔(1995)以及梅耶森(1996),还有肯•宾莫尔为纳什的博弈论论文集写的序言(1996)。
西尔维亚•赖莎(1998)是一本详细的有关纳什的自传。
《博弈论前沿专题》Word版教案一、课程简介1.1 课程背景博弈论是现代经济学的重要分支,应用于经济学、管理学、心理学、政治学等多个领域。
随着我国社会主义市场经济体制的建立和完善,博弈论在分析和解决实际问题中发挥着越来越重要的作用。
本课程旨在帮助学生了解博弈论的基本概念、方法及其在各个领域的应用,掌握博弈论的前沿动态和发展趋势。
1.2 课程目标通过本课程的学习,使学生能够:(1)理解博弈论的基本概念和基本类型;(2)掌握博弈论的基本分析方法和思维方式;(3)了解博弈论在各个领域的应用及其前沿动态;(4)培养学生的逻辑思维能力和创新意识。
二、教学内容2.1 博弈论的基本概念(1)博弈的定义与特征(2)参与者与策略(3)支付函数与结果2.2 博弈论的基本类型(1)静态博弈与动态博弈(2)完全信息博弈与不完全信息博弈(3)合作博弈与非合作博弈2.3 博弈论的基本分析方法(1)序贯均衡分析法(2)贝叶斯纳什均衡分析法(3)重复博弈分析法2.4 博弈论在各个领域的应用(1)经济学领域(2)管理学领域(3)心理学领域(4)政治学领域2.5 博弈论的前沿动态与发展趋势(1)演化博弈论(2)机制设计理论(3)博弈论与实验经济学(4)博弈论在交叉学科中的应用三、教学方法3.1 授课方式采用课堂讲授、案例分析、讨论与思考相结合的方式进行教学。
3.2 教学工具利用多媒体教学,辅助以相关课件和教学素材。
3.3 实践环节安排课后作业、小组讨论、课堂展示等实践环节,巩固所学知识。
四、课程考核4.1 考核方式课程考核分为期末考试和课堂表现两部分,其中期末考试占80%,课堂表现占20%。
4.2 期末考试期末考试为闭卷考试,试题类型包括选择题、填空题、简答题和案例分析题。
4.3 课堂表现包括出勤、提问、讨论、作业和课堂展示等方面。
五、教学进度安排5.1 授课时间共计32课时,每课时45分钟。
5.2 授课安排(1)第1-8课时,讲解博弈论的基本概念和基本类型;(2)第9-16课时,讲解博弈论的基本分析方法;(3)第17-24课时,讲解博弈论在各个领域的应用;(4)第25-32课时,讲解博弈论的前沿动态与发展趋势。
序贯均衡定义
序贯均衡是指参与人在选择策略时,根据给定的信念,在每个决策点上选择的策略都是最优的。
具体来说,在博弈中,每个参与人都有自己的信念,即对其他参与人可能采取的策略的预期。
基于这些信念,参与人在每个决策点上都会选择他认为最优的策略。
这种选择过程是序贯的,即每个参与人都是在其他参与人选择策略之后,再根据这些策略选择自己的最优策略。
因此,在序贯均衡中,每个参与人在每个决策点上选择的策略都是最优的,从而形成了一种均衡。
序贯均衡是一种博弈论中的概念,用于描述动态博弈中的均衡状态。
与静态博弈不同,动态博弈中参与人的行动是有先后顺序的,每个参与人在做出决策时都需要考虑其他参与人的行动。
序贯均衡强调的是在动态博弈中,参与人的策略选择应该是一致的,即每个参与人在选择策略时都应该考虑其他参与人的行动,并选择最优的策略。
在实际应用中,序贯均衡可以用于分析各种动态博弈问题,如国际关系、市场竞争、团队合作等。
通过序贯均衡的分析,可以了解参与人在动态博弈中的行为特征和策略选择,从而为实际问题的解决提供理论支持和实践指导。