博弈论导论
- 格式:doc
- 大小:543.00 KB
- 文档页数:16
第一部分理性决策制定1 单人决策问题晨起穿衣,你准备享用早餐。
天生也幸,你生活在一个提供丰富自助餐的大学生宿舍,桌上食物种类繁多,可以左挑右拣。
也可能你是一位不那么走运的研究生,工作间的壁橱里只有两盒半空的荞麦食品,所选乏味之极。
但无论是哪种情况,你都面临着同样一个问题:你该如何享用你的早餐?这类情况正是随处可见的决策问题的一个例子。
不管是作为个人还是群体(如企业和其他组织),我们每天都要面对各种各样的决策问题。
此种例子不胜枚举:企业经理需要就是否开展一项新的研发计划做出决策;国会议员需要决定是否投票赞成某项法案;本科生需要选择自己的主修科目;棒球投手想要掷出何种类型的球;再如迷路的驴友们困惑于该朝哪个方向走。
这种情况的列表可以无穷无尽。
有些决策微不足道,比如你如何选择早餐。
举个例子,如果Apple Jacks和Bran Flakes是你的壁橱里仅有的两种荞麦食品,而且如果你不喜欢Bran Flakes(它们属于你的室友),那么你的选择显然会是吃Apple Jacks。
与此相比,一名经理是否选择启动一项有风险的研发项目,或者一个立法者对法案的抉择则是一些更加复杂的决策问题。
本章将介绍一种分析语言,它可以给出严格的基础以支持博弈中潜在的策略互动这一思想。
这种分析语言是比较形式化的,它可以表达各类问题中的决策主体,为我们思考决策问题在结构方式方面提供一套工具。
这种分析上的正式性帮助我们澄清思想,磨砺思维。
当然,在保持问题更为现实层面的能力和意愿上,这种形式化的努力不能在分析的内核上对之有所冲淡。
引入这种形式语言,我们必须就决策者或者参与人的行为给出一套假设。
有时候,这些假设似乎接受起来不会遇到什么质疑。
不过在另外一些时候,这些假设却不大能为我们所接受,因为它们可能会构成对我们信念的重大挑战。
尽管如此,正如我们的分析所将展示的那样,我们还是会由衷的赞叹由这些假设出发而得到的结论其洞察力是何等的敏锐。
和任何理论框架一样,我们从中所得到的结论的价值,最多只能和我们在假设上的洞察力一样好。
在计算机科学中有一句名言——“垃圾进,垃圾出!”——意思是说,如果进入计算系统的数据有问题,那么最终结果也会有问题。
尽管这句话开始只是被用在计算机上,但是它在更一般性的问题上也同样适用,比如对于这里接受的决策理论就是如此。
因此,我们时常会以事实挑战我们的假设,质疑我们分析上的有效性。
虽然如此,我们还是认为应该肯定这里所给出的理论是一个有用的分析基准(benchmark)。
1.1行动、结果和偏好我们来看前面给出的例子:选择早餐、启动一项研究计划或投票给一项法案。
这些问题都有一个共同的结构:一个个体,或参与人,面对一个他需要从多个备选项中进行选择这样的情境。
每个选择都会产生某个结果,该结果的后果将由参与人自己赋予(有时候也由其他参与人赋予)。
对参与人来说,要以一种明智的方式解决这一问题,他必须要认识到该问题的三个基本特征:他可能的选择是什么?这些选择的结局如何?1每个结局如何影响他的福利?理解了问题的这三个方面有助于帮助参与人选择对他而言最优的行动。
这一简单的观察所得给我们提供了第一个在任何决策问题中总可适用的定义:决策问题一个决策问题由以下三个特征构成:1.行动(actions):是参与人所能选择的所有备选项。
2.结果(outcomes):是由任一行动得到的可能后果。
3.偏好(preferences):描述了该参与人对可能的结果集从最可欲到最不可欲进行的排序。
偏好关系描述了该参与人的偏好,意即“x至少与y一样好”。
为便于说明,我们就从选择Apple Jacks和Bran Flakes两种食物这一司空见惯的决策问题开始。
我们将行动集定义为,其中a表示对Apple Jacks 的选择,b表示对Bran Flakes的选择。
2在这个简单的例子里,我们这里的行动实际上和结果是同义的,不过为了使这种区分更加清楚,我们用表示1这里我们把outcome翻译成“结果”,consequence翻译成“后果”,result翻译成“结局”,但是也不一定,有时候可能有变化,读者诸君请将其中中文的任何感情色彩祛除来看这些术语。
——译者注2关于集合的概念和适当的标示可以在19.1节数学附录中找到。
结果,这里x表示吃Apple Jacks(选择Apple Jacks的结果),y表示吃Bran Flakes。
11.1 偏好关系现在来看大家还不是那么熟悉的概念:偏好关系,假设你喜欢吃Apple Jacks 甚于吃Bran Flakes。
那么我们可以写成,这应被读作“x至少与y一样好”。
如果反过来你更喜欢Bran Flakes,那么我们可以写成,这应被读作“y至少与x一样好”。
这样我们的偏好关系就可以以一种便捷的方式来表达参与人对所有可能结果的排序。
我们遵从经济学和决策理论中的共同传统,将偏好表达为一个“弱”序。
也就是说,表述“x至少与y一样”和“x优于y或x与y同样好”是一致的。
为了在这两种表述间做出区分,我们使用严格偏好关系,,表示“x严格优于y”和无差异关系,,表示“x与y一样好”。
很多决策问题并不必然像选择早餐吃什么这个问题那样,行动与结果是等同的。
举个例子,你和一个朋友一起在酒吧喝酒,结果他喝得烂醉。
你的行动可以是让他独自开车回家,抑或帮他打一辆出租车。
让朋友独自开车回家其结果肯定是一场事故的发生(他确实是烂醉),而为他打一辆出租车的结果则是安全到家。
因而对于这个决策问题你的行动和结果就不再是相同的。
在这些例子中,行动集是一个有限集,但是在有些情况下我们可能会有无穷多的行动可供选择。
进一步而言,所选择的行动又可能会产生无穷多的结果。
举一个简单的例子:我拿给你一桶两加仑的水来解决你的口渴问题。
你选择自己要喝多少,并将剩下的水还给我。
在这种情况下,你的行动集可以描述为一个区间:你可以选择行动a只要它属于这个区间,我们可以用两种方式来写,即或者。
3如果我们在这个例子中将行动等同于结果,那么结果也是。
最后,更多即更好也不必然成立。
如果你很口渴,那么喝一品脱水可能比什么都没喝要好。
但是,要是喝上一加仑水就可能让你胃痛,因此你会更喜欢一品脱胜过一加仑水。
3表示符号意思是“属于”。
因此“”意即“元素x和y属于集合X”。
如果你不熟悉有关集合的知识和这一类的描述方式,可以参考19.1节数学附录。
在继续以一种有利的方式来表示定义在不同结果上的参与人偏好之前,值得着重强调的是,我们对参与人思考决策问题的能力要给出两个重要的假设。
4首先,我们要求参与人能够对结果集里的任何两个结果进行排序。
把这一表述表达的更正式,即:完备性公理偏好关系是完备的:任意两个结果都可以由该偏好关系进行排序,所以要么,要么。
在某种程度上完备性公理几乎毫无争议。
如果给你两种食物,你应该能够根据你喜欢它们的程度而进行排序(如果你认为它们同样可口而且富有营养,可以无差异的选择二者)。
如果给你两辆车,你应该也能够根据你喜欢驾驶它们的程度和其安全性能等等之类的标准来对它们进行排序。
如果给你提供两种投资组合,你也应该能够根据你平衡风险和支付的意愿来对它们进行排序。
换言之,完备性公理不会让你在任何两种结果面前无所适从。
5我们所做的第二个假设可以保证一个参与人能够对所有结果进行排序。
为此,我们需要引入可传递性这个更为严格的一致性条件:可传递性公理偏好关系是可传递的:对于任意三个结果都可以由该偏好关系排序,如果且,那么。
面对几个结果,完备性可以保证任何两个都能被排序,而可传递性则保证这种排序不会出现矛盾,也即不会产生无法决策下去的循环这种情况。
为了看一下违反传递性公理的情况,我们考虑一个严格偏好Apple Jacks甚于Bran Flakes的参与人,,Bran Flakes严格偏好于Cheerios,,而Cheerios又严格偏好于Apple Jacks,。
当面对任何两盒不同的荞麦食品,比如说,4这些假设也被称之为“公理”,这是为了遵奉冯·诺依曼和摩根斯坦恩(1944)的原创著作的用语,该书为决策理论和博弈论都打下了多方面的基础。
5换言之,这个公理通即解决了常所说的“布里丹的驴子”这类问题。
其中一个故事版本是这样的,一个驴子被置于两堆完全无差别的干草之间,并假设这头驴子总是选择就近的干草。
然而,由于两堆干草与这头驴子是等距离的,所以它无法在二者之间进行选择,最终只能饿死。
该参与人在选择他更偏爱的a盒上毫无问题。
然而,当呈现给他所有三个选项——即——时,发生了什么呢?这个可怜的家伙将无法判断三个之中应该选择哪一个,因为对于其中任一个荞麦食品盒,总是有另外一个他更为偏好。
因此,通过要求参与人具有完备性和传递性偏好,我们基本上可以保证在任何结果集上,他总是可以至少选择一个最优结果,它在这个结果集里与任何别的结果相比更优或至少一样好。
为了预示何为决策制定的前提,我们把满足完备性和传递性的偏好关系称之为理性偏好关系。
我们将仅关注具有这种理性偏好的参与人,因为没有这样的偏好我们既不能提供预测也无法对其行为进行解释。
评论正如1785年马奎斯·德·孔多塞所提到的,一个由理性个体参与人组成的群体——把这些理性个体参与人聚在一起作为一个群体制定决策时——可能会成为一个“非理性”的群体。
举一个例子,设想有三个室友,称为参与人1、2、3,他们必须从其公寓厨房里选出一个荞麦食品盒子。
参与人1的偏好是:,参与人2的偏好是:,参与人3的偏好是:。
假设我们这三位参与人以一种民主方式进行选择,运用多数投票原则来达成决策。
这个群体的最终偏好是什么呢?当面对a和c这对选项时,参与人1和3会投票给Apple Jacks,因此有。
当面对c和b这对选项时,参与人1和2会投票给Cheerios,因此。
当面对a和b这对选项时,参与人2和3会投票给Bran Flakes,因此。
结果,我们这三位理性参与人却无法运用得自多数投票原则下的群体偏好以达成一个最终的决策!这类源自多数投票原则的群体决策不畅,常被称之为“孔多塞悖论”。
因为我们不会去分析群体决策,所以这还不是我们要面对的问题,但是在脑海中记住这样的现象是有益无害的,它提醒我们个体理性并不意味着“群体理性”。
1.1.2 支付函数(payoff functions)当我们把注意力集中在具有理性偏好的参与人身上时,我们不仅可以得到一个以一种具有一致性和说服力的方式行事的参与人,而且基于更大的便利我们还可以以一种更加友好、更加具有操作性的工具来取代偏好关系。
我们来看下面这个简单的例子。
假设你在你家附近的街角开了一家柠檬汽水店。
你有三种可能的行动:选择低质量的柠檬水(),将花去10美元,卖掉后得到15美元收入;选择中等质量的柠檬水(),将花去15美元,卖掉后得到25美元收入;选择高质量的柠檬水(),将花去28美元,卖掉后得到35美元收入。