当前位置:文档之家› 博弈论

博弈论

CENTRAL SOUTH UNIVERSITY 硕士学位论文

分类号VDC 密级

硕士学位论文

基于信任博弈的委托代理关系

实验与模型研究

Experimental and Modeling Study on Principal-agent Relationship Based on Trust Game

作者姓名:孙世哲

学科专业:经济学、金融学

学院(系、所):商学院

指导教师:饶育蕾教授

论文答辩日期答辩委员会主席

中南大学

二OO七年十一月

原创性声明

本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。

作者签名:日期:年月日

关于学位论文使用授权说明

本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文;学校可根据国家或湖南省有关部门规定送交学位论文。

作者签名:导师签名日期:年月日

摘 要

传统的经济学原理植根于Neumann与Morgenstern于1944年奠定的期望效用最大化原理,认为经济行为是由外在激励决定的。委托代理问题也产生于这一框架之下,由于资本市场信息不流通所导致的信息不对称,委托代理双方的理性会导致现有的公司治理结构无法实现价值最大化的目标。传统的委托代理理论认为委托人必须订立与代理人自身利益相关的全面激励合同,否则会加大代理成本。但契约的不完全性是现实经济生活中的普遍规律,全面激励合同是不存在的。

近代实验经济学的研究发现,人们在自利偏好之外还存在着强烈的利他偏好,最大化自己物质收益的同时,也存在着信任互惠、利他惩罚、公平偏好等有限理性的行为。基于这些前人的研究成果,本文修改了委托代理关系中的理性假定,采用行为博弈的方法考察委托方与代理方之间的策略互动。本文按照现实公司架构中的委托代理关系,设计了三个递进式的博弈实验,研究股东与经理之间是否存在“信任互惠”以及不完全契约情况下决策与收益之间的关系。本文还通过引入随机扰动项,构造了一个多阶段的信任博弈模型,并使用实验数据进行了检验。

本文的研究发现存在道德风险的情况下,委托方与代理方之间没有出现传统博弈论预计的最差结果,而是他们都相信对方,并愿意为此承担一定的风险,而且博弈双方也乐意对对方的信任进行回报。本文还发现委托代理关系中的信任会受到实际支付的强烈影响,博弈参与者愿为信任对方而承担的可能损失是有限的,一旦超过界限,也就是说当相信对方所面临的成本很大时,他们之间的信任就非常微弱了,此时,他们又变为传统经济学所定义的自利主义者。委托方与代理方之间的博弈次数也会影响信任的强弱,可以合作的次数越多,越多的人愿意相信对手。另外博弈长度的增加会使参与者对自身收益的增长变化愈加重视。

研究委托代理关系中的“信任互惠”,扩大了委托代理问题的边界范畴,可以为委托代理问题中激励机制的设计提出新的可行方案,对公司治理结构的研究也有所帮助。本文在研究委托代理问题时采用了行为博弈论的思想进行实验设计以及模型构建,为博弈论的未来发展和实际应用也提供了一个新的角度。

关键词委托代理问题,信任,互惠,不完全契约

ABSTRACT

The traditional economic theory was based on the prospective utility maximum which proposed by Neumann and Morgenstern in 1944, it considers that the economic behavior is up to the extrinsic motivation. The Principal-agent Problem also is under this framework, because of the information asymmetry led by the capital market information uncalculated, the rational of both the principal and the agent will result in the value maximize goal in the corporate governance structure failure. The traditional principal-agent theory considers that the principal and the agent must make the full-inspiriting contract related with the agent’s interest, otherwise, the agent cost increases. However, the incompletely contract is the general rule in the real economic life, so that the full-inspiriting contract is inexistence.

A great deal of experimental evidences in experimental economics suggests that many people are strongly motivated by other-regarding preferences, the preferences of fairness, reciprocity, punishment, trust are also impact the people’s decision. Based on these research achievements, this paper modifies the self-interest hypothesis in the principal-agent relationship, and reviews the strategy interaction between the principal and the agent by the behavioral game theory. This paper designs three game experiments according to the principal-agent relationship in the real corporation government, and researches whether the trust reciprocity exists or not between the shareholder and the manager and the relationship between the strategy and the payoff under the incompletely contract. This paper establishes a multi-stage trust game model through introducing a random perturbed variable, and then tests it by the experimental data.

This paper finds that the result under the moral hazard game isn’t the worst result predicted by the traditional game theory. In the experiment, the principal and the agent both trust their opponent, and are willing to take on the risk, and the players are would like to return the opponent’s trust. This paper finds that the real payoff can strongly impact the degree of the trust, the player can sacrifice to trust their opponent in a extension, but if the payoff is larger than this extension, that is to say their trust will

be feebleness while the cost is large, the players become the traditional self-interest. The game length between the principal and the agent also affects the trust degree, the more persistent the cooperation relationship continues, the stronger interpretative capability of the trust is. In addition, if the game length increases, the players will pay more attention to the difference of the own payoff.

Researching the trust reciprocity in the principal-agent relationship, can extant the category of the principal-agent problem, and proposer new feasible project for the encouragement mechanism design, and give assistant to the corporation government structure study. This paper adopts the behavioral game theory concept, so that give a new perspective to the game theory development and practically application.

Key Words Principle-agent Problem, Trust, Reciprocity, Incomplete contract

目 录

第1章 导 论 (1)

1.1选题背景和意义 (1)

1.1.1选题背景 (1)

1.1.2选题意义 (3)

1.2委托代理问题的国内外研究现状 (3)

1.3行为博弈的国内外研究现状 (5)

1.4研究思路和结构框架 (6)

第2章 委托代理关系与不完全契约 (9)

2.1信息不对称与委托代理关系 (9)

2.2委托代理问题的类型 (10)

2.2.1道德风险 (10)

2.2.2逆向选择 (11)

2.2.3相机续约 (11)

2.3委托代理问题与不完全契约 (12)

2.4市场上的契约与行为 (13)

第3章 委托代理关系中的信任互惠机理分析 (16)

3.1信任博弈及其扩展 (16)

3.1.1信任博弈的形成及意义 (16)

3.1.2信任博弈的扩展 (18)

3.1.3多阶段信任博弈 (19)

3.2基于信任互惠的委托代理关系 (21)

3.2.1委托代理关系中的信任 (21)

3.2.2不完全契约下委托代理关系中的信任 (22)

3.2.3委托代理关系中的多阶段信任博弈 (23)

3.2.4 委托代理关系中的(类)蜈蚣博弈 (24)

第4章 基于信任博弈的委托代理关系实验设计与实施 (26)

4.1实验目的与实验思路 (26)

4.1.1实验目的 (26)

4.1.2实验思路 (26)

4.2实验设计 (27)

4.2.1基本的信任博弈实验:实验1 (27)

4.2.2多阶段信任博弈实验:实验2 (29)

4.2.3增加博弈回合的多阶段信任博弈实验:实验3 (31)

4.3实验详细程序 (33)

4.3.1实验准备 (33)

4.3.2实验过程 (34)

4.3.3实验结果 (36)

4.4分析与讨论 (38)

第5章 基于信任博弈的委托代理关系模型构建及检验 (40)

5.1模型的基本假设 (40)

5.2多阶段信任博弈模型 (41)

5.2.1基本模型 (41)

5.2.2拓展模型 (43)

5.3模型结果 (44)

5.3.1基本模型计算结果 (44)

5.3.2拓展模型计算结果 (47)

5.4模型检验及简要评述 (48)

第6章 结论与展望 (51)

6.1论文主要结论 (51)

6.2论文创新之处 (51)

6.3研究局限及下一步工作 (52)

参考文献 (54)

附 录 (58)

附录1:实验部分程序原代码 (58)

附录2:实验说明 (60)

附录3:实验结果 (62)

附录4:计算过程 (66)

致 谢 (68)

攻读硕士学位期间主要研究成果 (69)

第1章 导 论

1.1选题背景和意义

传统的经济学原理植根于Neumann与Morgenstern于1944年奠定的期望效用最大化原理,认为经济行为是由外在激励决定的。因此,许多传统经济学的研究基础是建立在人是完全理性的,会做出最大化自身利益的选择的基础上的,此假设排除了人的心理、情绪会对个人行为产生影响的可能性。而心理学却认为,感知、内在动机、态度以及过去的经验都会显著地影响决策的制定,内在的因素同样决定着人类的行为。2002年,一直致力于将心理学应用于经济学研究的Kahneman获得了诺贝尔经济学奖,在传统的经济学研究中考虑心理因素的影响也逐步成为国内外的一个研究热点。

公司金融理论认为,资本市场资源配置的有效性体现为“支配公司资源的管理者以股东价值最大化为准则理性配置资本,也就是说投资于净现值大于零的项目”。这种基于价值的管理假设建立在三个条件之上:人的行为是理性的;资产定价模型(CAPM);市场是有效的。Hersh Shefrin(2001)认为,心理方面的因素极大的影响了以上假设的成立,并进一步分析指出,公司的投资者和管理者会因为情感偏好而影响决策。随着行为金融以及决策科学的发展,“行为公司金融理论”(Behavioral Corporate Finance)逐渐形成,其修改了传统理论的理性人假设,研究当决策人非理性时的决策情况。该理论下的“行为公司治理”分支(Behavioral Corporate Gavernance)的研究重点是部门结构、资本市场治理、赔偿与激励、债务成本与代理成本、管理与协调劳动力市场、欺诈、控诉、所有权结构以及规则等,公司内部架构中的委托代理关系也包括在该分支之下。

需要指出的是,前人在公司金融理论的研究中考虑到了价值最大化目标的阻碍,如委托代理问题和信息不对称,但仍然是基于投资者和管理者理性的基础上进行分析的。委托代理问题的产生是由于现代公司所有权和经营权相分离,信息不对称则是由于资本市场信息的不流通所导致,都没有涉及投资者和管理者的非理性问题。

1.1.1选题背景

许多著名的经济学家如Adam Simon (1959)、Gary Becker(1974)、Kenneth

Arrow(1981)、Paul Samuelson(1993)以及Amartya Sen(1995)等都认为:现实中人们不是完全理性、完全自利的,而是有限理性的,他们也常常关心他人的利益,关心自己行为为其他人的物质利益分配带来的影响。但从1944年至今,主流经济学仍然限定在自利假设里,是什么让经济学家难以放弃这个假设呢?一个重要原因就是自利假设在一些经济领域做出了成功的预测,例如竞争市场上商品的标准。可是,在真实生活中很大一部分的经济行为发生在完全竞争市场以外,比如市场中商人的数量是很少的、市场中存在着信息障碍,以及公司和组织中不完全强制契约的情况。

不愿意放弃自利假设的第二个原因是方法上的。不通过改变偏好上的假设来解释令人困惑的经济现象,是经济学上一个由来已久的惯例。改变偏好意味着打开了“潘多拉”的盒子,因为如果可以改变偏好,那么每件事物都可以通过“正确”的偏好假定来进行解释了。在经济学家们还没有找到成熟的工具以一种严格的科学方式来检验偏好的特性之前,这个惯例是有意义的。但是,随着实验技术在经济学领域内的发展,这个惯例将不再起作用。

2O世纪8O年代以来,一些经济学家、心理学家、人类学家设计了一系列的实验对自利假设进行了考察。通过最后通牒博弈(Ultimatum Game)实验、礼物交换博弈(Gift Exchange Game)实验、信任博弈(Trust Game)实验、独裁者博弈(Dictator Game)实验和公共品博弈(Public Product Game)实验等发现,人们在自利偏好之外还存在着强烈的利他偏好,最大化自己物质收益的同时,实验者也存在着信任互惠、利他惩罚、公平偏好等有限理性行为。而信任博弈实验的结果说明,即使在不完全契约情况下,由于纯粹的信任,人们也可以克服因非对称信息导致的道德风险,完成一些经济交换行为。Fehr和Schmidt(2001)对不完美契约下公平互惠激励作用的研究结果表明,公平互惠在提供最优激励上起着非常重要的作用,当所有人都为自利者时,激励契约是最优的,但若存在某些人也关注公平时,激励契约的作用就大为降低了。

现有的委托代理模型大多是对存在委托人或者代理人道德风险情况下的激励机制研究。在委托人不能无成本地观察到代理人行为的情况下,委托人通过与代理人签订合约,约定按照某些双方都可观察到的指标体系来向代理人支付报酬(或进行奖惩)的办法对代理人进行激励。这类模型没有考虑当委托人或代理人不再满足理性假定的情况,仍然建立在委托人和代理人满足理性假定的情况下,因此信任互惠、公平偏好的作用并没有被放入到委托代理关系的研究当中。本文试图修正委托代理关系中的理性假定,研究“信任互惠”是否存在于经济生活中,以及在不完美契约的情况下,人们的决策与收益之间有着什么样的关系。

1.1.2选题意义

委托代理关系是现代公司治理研究中的一个重要部分,由于现代公司所有权与经营权的分离,股东与经理人之间的策略选择会在很大程度上决定公司未来的走向。现有的委托代理关系研究都是建立在自利假设的基础上的,由于委托代理双方的完全理性从而导致公司的价值最大化目标无法实现,前人的研究结果建议订立与代理人自身利益相关的契约以避免委托代理问题的出现,契约越完全,委托代理问题出现的可能性越小。但是制定完全契约在现实中是不可行的,即使可行也将付出极高的成本,大大降低双方的收益。但若考虑委托方和代理方的非理性,则会因为而人们之间信任的廉价而降低契约的执行成本,增大交易双方的获利值。经济学家也认为信任是减少交易成本的一种方法,是经济的“润滑剂”(Arrow 1974)。但信任也极易遭到破坏,因此,研究委托代理关系中的信任互惠以及如何保持彼此间的信任对于降低代理成本、节省监督成本、提高经济活动效率具有很大意义。

在信任博弈实验里,代理人值得信任的程度与他的自利相悖,研究的是人们是否愿意牺牲自身的利益来满足一定的道德责任。这个道德责任可以理解为委托代理问题中的道德风险。传统的委托代理理论认为由于信息的不对称,委托人的激励合同必须与代理人自身利益相关,否则代理成本加大。而引入了“信任互惠”的委托代理关系,代理人的选择就不仅仅只取决于自身的收益了,他会考虑回报投资人对自己的信任,又由于存在代理人回报自己信任的可能,投资人也可能会选择相信代理人。这样一来,在引入了“信任互惠”的委托代理关系中,即使在不完全契约情况下,代理成本也不一定会增加,甚至由于信任的低成本,双方收益还有增加的可能。这一结果也符合现代生活中的许多事实。

研究加入了“信任互惠”的委托代理关系,扩大了委托代理问题的边界范畴,也增加了委托代理理论的解释力度,同时也为行为公司金融的研究提供了帮助。由于委托代理理论来自于博弈论的一个应用分支——信息经济学,因此在加入了“信任互惠”因素,采用行为博弈(Behavioral Game Theory)的思想进行分析后,从方法论上可以给传统博弈论带来一些启示,提供一个新的角度来解释博弈论中现有的一些“困境”,如逆推归纳法的有效性。

1.2委托代理问题的国内外研究现状

委托代理的概念最初是由产权经济学家Jensen. M. C和Heckling. W. H于1976年提出的。他们指出,委托代理关系(the Principal-Agent Relationships)是一种契约,在这种契约下,一个人或一些人(委托人)授权另一个人或一些人(代

理人)为他们的利益从事某项活动,并相应授予此人某项决策权;代理人通过其代理行为获取一定的报酬。同一时期,剑桥大学教授James Mirrlees、哥伦比亚大学经济学教授Joseph Stiglitz,麻省理工大学斯隆管理学院教授S. Ross等人共同开创了委托代理理论(the principal-agent theory)的研究,三人因此在不同时期分别获得了诺贝尔经济学奖。Ross在其《The Arbitrage Theory of Capital Asset Pricing》中系统地提出了委托代理理论。Mirrlees于1975年发表的《The Optimal Structure of Authority and Incentive within an Organization》一文奠定了委托代理的基本模型框架,建立了沿用至今的委托代理模型化方法。Joseph Stiglitz则发展了Mirrlees的理论,发表了《Moral Hazard and Observability》和《Moral Hazard in teams》两篇文章,被称为莫里斯一霍姆斯特姆模型方法(Mirrlees-Holmstrom Approach),该方法的一个重要贡献就是,证明了什么样的观察变量应该进入激励合同。他们的研究发现:委托人想使代理人按照委托人的利益行动,但委托人不能直接观测到代理人选择了什么行动,所能观察到的只是另一些由代理人行为和其他因素共同决定的变量。由于这种情况的存在,代理人可能出现因追求自身利益而与委托人利益相冲突的“败德行为”。

Joseph Stiglitz在激励方面提出,在有限的劳动力市场中,只靠罚款约束代理人是不可行的,如果不想赋予激励奖励,则只有监督代理行为一个办法。随后,各国学者将委托代理的研究结合到了实践中,如Katerina Sherstyuk,研究了代理合同中代理人的行为标准以及经济形式的激励。Jeff Worsham,Jay Gatrell发展了委托代理理论,将研究范围进一步扩大到多委托人的情况。Tim Baldenius,Nahumd Melumad,Amir Ziv将监督代理行为作为主要研究对象,拓宽了研究领域。Hans Gersbach是委托代理理论应用的典型,将该理论应用于企业组织,来解释企业运作过程中股东与经理所面临的问题。

20世纪80年代以来,委托代理理论在几方面有了重要发展,主要是先后建立和发展了重复博弈的委托代理模型、委托人道德风险和多代理人模型、多任务委托代理模型、多个委托人模型、最优委托权安排模型等等。其中,Bruno S. Frey,Reto Jegen在团队激励理论上作了较多的研究,该研究成为委托代理理论的分支理论。2005年,Richard Windram对风险收益激励方面的委托代理理论做了较详细的文献综述。

国内学者更多的是以委托代理理论为基础,分别对我国不同类型的企业,尤其是国有企业进行针对性的分析,如倪得兵、唐小我、李仕明将研究注重于委托代理理论在股份制企业中的应用,研究企业内部董事会与经理间的博弈与激励,对企业中经理的行为与经理的业绩作了相关考察。张维迎在其著作《博弈论与信

息经济学》中也发展了委托代理理论,分析研究了最优委托权安排模型,并以此来解释团队最优委托权安排的决定因素。这里值得一提的是,重庆大学的蒲勇建先后发表了两篇文章,从一个新的非理性的角度开始审视委托代理关系,他将Rabin(1993)提出的“公平博弈”植入了企业的委托代理关系中,重点研究了“公平互惠”在委托代理模型以及激励机制中的作用。

1.3行为博弈的国内外研究现状

从上世纪80年代开始,博弈论逐渐成为经济学的一种标准语言,对委托代理关系的研究也是建立在博弈论的基础上的。传统博弈论最基本的假设是博弈参与人具有完美理性、完美记忆力、以及完美预见力。而著名的“最后通牒博弈”实验(Guth,1982)证明了人并不是一般所理解的完全利己的,从而对博弈论中的“最大化”假定形成了冲击。自此,传统博弈论也开始受到来自心理学研究成果的影响,形成了行为博弈理论这一分支。行为博弈论通过一系列实验1证明了人们的行为中包含有利他、公平、信任等因素,并不完全是由利益驱动的。根据这些大量的博弈实验,行为博弈论对三大假设提出了置疑,建立了以有限理性、有限记忆力和有限预见力为核心的研究体系。

“利他互惠”最先被经济学家们提出用来解释这些有限理性行为。很早之前,“利他”(Altruism)就被用来解释人们对公共物品的提供了。因为当参与者提供公共物品时,他将付出一定成本(捐赠物资),而且没有收益,这样的行为明显是不符合自利假设的。Becker(1974)就用利他主义来解释慈善捐助和公共物品的自愿供给,他解释了这种行为对其他参与者的正面意义, Olson(1966)则在《集体行动的逻辑》一书中对利他行为的原因给出了一个解释,他认为个体对公共物品的提供是一种选择性激励(selective incentive ),一个人在组织中所获的权力和荣誉就有可能成为促使其为组织多做贡献的选择性激励机制。如果一个人能够独立为某组织取得某一公共物品提供一笔关键的资金并从中获取荣誉,那么这个人就有可能独自为某一事业做出贡献。对于提供公共物品的个人,可以获得声望、尊敬、友谊或其他社会和心理目标,因此社会激励是个人利他行为(自愿提供公共物品)的动因。

也有学者从公平的角度来分析人类的有限理性行为。Falk和 Schmidt (1999)以及Charness 和Rabin(2002)就分别提出了各自的公平模型。他们认为如果别人提供了公共物品,从对其他人公平的角度出发,自己也应该提供。公共物品博弈

1包括“最后通牒博弈” (ultimatum game)实验(最早由Guth,schmittberger 和schwarze(1982)提出,后由Camerer和Thaler(1995)、Roth(1995)进行了多次重复)、独裁者博弈(dictator game,Forsythe (1994)等)实验、礼物交换博弈(gift exchange game,Fehr(1993)等)实验、信任博弈(trust game,Berg和Dickhaut(1995))实验,公共物品博弈(public good game,ledyard(1995))等。

实验(Falk,Fehr 和Fischbacher(2005);Carpenter和Matthews(2005))中也可以看出:如果其他参与者提供较多公共物品,则自己也会增加对公共物品的提供,反之,就减少或不提供。

也有人们用报复主义来解释博弈过程中的行动,如最后通牒博弈(Ho,Camerer和Weigelt(1998))中响应者对提议者较低出价的拒绝就是对提议者的提议进行报复,虽然这样做需要付出成本(拒绝使双方本可以得到的收益都没有了),但却可能使以后与提议者博弈的响应者得到更多的收益。因为这种行为将迫使提议者在以后的博弈过程中向响应者提供一个较高的出价,从而使后面的响应者得到更多的收益,因此这种行为也被称作利他惩罚。利它惩罚还可以用来解释公共物品博弈中人们对不提供公共物品者的惩罚行为,这种惩罚同样是需要付出成本的。

Fehr和Gachter(2002,2003)、Fehr 和 Rockenbach (2004)则解释了博弈过程中素不相识的陌生人合作行为。这些陌生人来自于不同群体,而且他们以后可能永远也没有机会再见面,因此他们的声誉很难获取,或者就是根本没有声誉可言。这些合作不能用进化理论中与血缘选择相关的偏袒动机来解释,也不能用信号理论和利他互惠理论中的自私动机来解释。Fehr和Gachter通过实验显示:对背叛者的利他惩罚是解释合作的一个主要动机。Dominique 等(2004)从人体本质分析了产生利他惩罚的内在因素:活跃的脊背纹状体使参与主体更愿意惩罚背叛者。他们通过象征性利他惩罚和有效性利他惩罚对参与者内在大脑神经的活动来探讨产生利他惩罚的神经偏差。

国内也有一些学者研究利他行为,汪丁丁(2005)给出了利他行为的经济学描述,叶航等则探讨了利他行为的经济意义并以此构建了广义效用函数(叶航(2005);叶航 ,汪丁丁,罗卫东(2005);齐良书(2006))。郭菁(2005)从人学的角度分析了利他行为在德育建设、在我国和谐社会主义建设中的重要作用,利他行为可以协调人与人之间的利益关系,可以化解个人利益与集体利益之间的矛盾。夏纪军(2004)、张来武、雷明(2003)在前人的模型基础上引入了新的公平概念,解决了模型中的缺陷,确保了互利均衡的存在性,他们还将利他因素引入到信任模型,为信任模型中“自己人”和“他人”两分现象提供很好的解释。

1.4研究思路和结构框架

由于行为博弈论的发展,越来越多的证据显示自利假设并不完全正确,利他、公平、信任等偏好都会影响人们的决策。而委托代理问题是在自利假设的基础下使用传统博弈论推导出的,现有的委托代理关系模型均没有考虑参与者的有限理

性因素,而这一点会在很大程度上影响博弈的最后均衡结果,如有限理性参与人之间的策略互动是无法用传统博弈论中广泛使用的逆推归纳法得到的。因此本文在委托代理关系的研究中加入信任、公平等情感因素的情况,方法上从行为博弈的角度入手,设计实验来探讨委托人和代理人有限理性的情况下,委托代理关系中的信任互惠偏好,以及该偏好对委托人和代理人决策的影响,并以此推导出委托人与代理人在基于信任博弈的委托代理关系策略选择模型。

本文首先研究行为博弈论中的基本信任博弈,分析其在委托代理关系上的意义,然后由基本信任博弈模型拓展为多阶段信任博弈,研究重复博弈对信任互惠的影响,并以一个多阶段信任博弈——蜈蚣博弈(the centipede game)为例构造模型。最后,基于各种分析结果,设计了三个递进式的委托代理关系实验。将实验结果进行比对,观察信任互惠在博弈过程中对委托人和代理人决策选择的影响程度,并以此构造基于信任博弈的委托代理关系模型以及验证。

本文的结构如下:

第一章 导论:包括选题背景、选题意义以及本文的研究思路与结构框架。

第二章 委托代理关系与不完全契约:对现有委托代理问题的研究类型作了详细的介绍,并讨论不完全契约情况下,有无利他偏好(altruism preference)对均衡结果的影响,以及探讨利他偏好与契约结构相互作用的方式。

第三章 委托代理关系中的信任互惠机理分析:详细介绍行为博弈理论中信任博弈的有关实验和模型,并将其结果应用在委托代理关系中,分别讨论信任互惠在单期信任博弈、多阶段信任博弈和一个特殊的多阶段信任博弈——蜈蚣博弈中的作用。

第四章 基于信任博弈的委托代理关系实验设计与实施:设计了三个结构相同、递进式的实验来研究信任互惠在实际经济生活的委托代理关系中如何作用,再通过比对,寻找信任互惠与博弈结构之间可能存在的关系,对存在信任互惠的委托代理关系做出假设。

第五章 基于信任博弈的委托代理关系模型的构建及检验:分别从自身收益和收益差距两个角度考虑,引入代表信任互惠的参数,构造两个多阶段动态信任博弈模型,并使用实验结果验证多阶段信任博弈模型的实用价值。

第六章 结论与展望:对论文的研究成果进行总结,并有针对性的对委托代理关系提出一些建议,对今后进一步的研究进行预计和展望。

图1-1 本文研究框架

第2章 委托代理关系与不完全契约

从20世纪60年代末70年代初开始,很多经济学家开始研究企业内部的信息不对称和激励问题,由此开创了委托代理理论(Wilson 1969,Ross 1973,Mirrlees 1974)。现有委托代理理论模型主要来自信息经济学的直接应用,即不对称信息博弈论在经济学上的应用。

无法通过事前的契约预见所有的不确定性状态是不完全契约的显著特征,而这样的不确定性正是导致委托代理问题产生的重要原因之一。不完全契约是现实经济生活的普遍现象,因此讨论不完全契约下的委托代理关系就变得异常重要了。

2.1信息不对称与委托代理关系

信息不对称所描述的博弈中,交换的各当事人知道的信息不同,可以做到的事情也不同。人们知道些什么、可以采取什么行动通常由他们在交易过程中的结构位置决定。例如,一个雇员知道上一个小时他付出的努力程度,或者他到底工作了没有,而雇主则可能不知道这些。相比之下,雇主能够通过承诺一个“要么接受要么拉倒”的工资提议来推进他的目标,而雇员则无法在给定工资下做出一个关于自己劳务数量的“要么接受要么拉倒”提议来使自己获益。

这些不对称性产生的原因在于,雇主有着先动优势,而雇员有着私人信息2。前者是策略性不对称:雇主的行动集合包括不雇用雇员这一行动。后者就是信息不对称的一个例子了。很明显,雇主将行使策略性不对称,以试图克服来自信息不对称的劳动纪律问题。

当交易中的一方有着对方没有的信息,我们就说这个信息是不对称的。在信息经济学文献中,常常将博弈中拥有私人信息的参与人称为“代理人”(agent),不拥有私人信息的参与人称为“委托人”(principal)。如果相关信息在交往中至少一方当事人选择行动之后才被揭示,那么信息就是不确定的。若在交易开始时某些相关信息至少不为一个当事人所知,就产生了信息不完全。

“委托人”和“代理人”这两个概念源自法律。在法律上,当A授权B代表A从事某种活动时,委托代理关系就发生了,A称为委托人(principal),B称为代理人(agent)。但经济学上的委托代理关系泛指任何一种涉及不对称信息的交易,交易中有信息优势的一方称为代理人,另一方称为委托人。简单的说,

2即指知道一些别人不知道而能够带来潜在收益的消息。

知情者(informed player)是代理人,不知情者(uninformed player)是委托人。当然,这样的定义背后隐含的假定是,知情者的私人信息(行动或知识)影响不知情者的利益,或者说,不知情者不得不为知情者的行为承担风险。借款人和贷款人或者雇主与雇员之间的交易,都属于委托代理关系的范畴,当代理人的行动或者属性关乎委托人的净收益,但是委托人却不知道或无法证实时,就产生了委托代理问题。

2.2委托代理问题的类型

信息的不对称性可以从两个角度划分:一是不对称发生的时间,二是不对称信息的内容。由于信息不对称性的不同,委托代理问题也可以分为不同的几种类型。

从不对称发生的时间看,不对称可能发生在当事人签约之前,也可能发生在签约之后,分别成为事前(ex ante)不对称和事后(ex post)不对称。研究事前不对称信息博弈的模型称为逆向选择(adverse selection)模型,研究事后不对称信息的模型称为道德风险(moral hazard)模型。从不对称信息的内容看,不对称信息可能是指某些参与人的行动,也可能是指某些参与人的知识。研究不可观测行动的模型称为隐藏行动(hidden action)模型,研究不可观测知识的模型称为隐藏知识(hidden knowledge)模型或隐藏信息(hidden information)模型。

2.2.1道德风险

隐藏行动的道德风险模型(moral hazard with hidden action model):签约时信息是对称的(因而是完全信息);签约后,代理人选择行动,“自然”选择“状态”(the state of the world);代理人的行动和自然状态一起决定某些可观测的结果;委托人只能观测到结果,而不能直接观测到代理人的行动本身和自然状态本身(因而是不完美信息)。一个简单的例子是雇主与雇员的关系:雇主不能观测到雇员是否努力工作,但可以观测到雇员任务完成的进度。

隐藏信息的道德风险模型(moral hazard with hidden information model):签约时信息是对称的(因而是完全信息);签约后,“自然”选择“状态”;代理人观测到自然的选择,然后选择行动;委托人观测到代理人的行动,但不能观测到自然的选择(因而是不完美信息)。一个简单的例子是企业经理与销售人员的关系:销售人员(代理人)知道顾客的特征,而企业经理(委托人)不知道。表2-1是隐藏道德风险的委托代理关系应用举例。

表2-1 存在道德风险的委托代理关系举例

模型委托人代理人行动、类型

隐藏行动道德风险

地主佃农耕作努力

股东经理工作努力

经理员工工作努力

员工经理经营决策

债权人债务人项目风险

住户房东房屋修缮

房东住户房屋维护

公民政府官员廉洁奉公或贪污腐化

隐藏信息道德风险

股东经理市场需求/投资决策

债权人债务人项目风险/投资决策

企业经理销售人员市场需求/销售策略

雇主雇员任务的难易/工作努力

根据张维迎:《博弈论与信息经济学》(1996)、Samuel Bowles:《微观经济学:行为、制度和演化》(2006)整理

2.2.2逆向选择

逆向选择模型:自然选择代理人的类型;代理人知道自己的类型,委托人不知道(因而信息是不完全的);委托人和代理人签订合同。一个简单的例子就是卖者和买者的关系:卖者对产品的质量比买者有更多的信息。表2-2是存在逆向选择的委托代理关系应用举例。

表2-2 存在逆向选择的委托代理关系举例

模型委托人代理人行动、类型

逆向选择

保险公司投保人健康状况

雇主雇员工作技能

买者卖者产品质量

债权人债务人项目风险

根据张维迎:《博弈论与信息经济学》(1996)、Samuel Bowles:《微观经济学:行为、制度和演化》(2006)整理

2.2.3相机续约

委托人给代理人一项比他的次优选择更有价值的业务,然后监督代理人的行

动,许诺根据监督到的水平,决定在下一期是续约还是终止关系。这就是所谓的相机续约(contingent renewed)。这种方法是有效的,因为代理人得到了一份等于代理人参与这项交易的价值和他的下一个最优选择之差的执行租金(enforcement rent)。于是,代理人愿意考虑委托人关于行动水平的目标,知道不这样做将导致失去这一租金,也就是,是否续约取决于代理人的表现。表2-3是相机续约的委托代理关系应用举例。

相机续约中很重要的一点是,代理人同样面对了信息的不对称。因为,一旦代理人的行动满足了委托人的要求,是否真正执行续约这一行动只有委托人自己知道,此时代理人处于了先动的位置上。例如:雇主观测到雇员的任务完成得如何,并给予雇员根据观测到的程度决定是否继续雇用的承诺。若雇员决定努力工作,任务完成状况良好,则雇主应继续雇用,而实际上,雇主是否会兑现诺言,与雇员续约却并不为雇员所知。因此,相机续约的雇用关系中就暗藏了博弈双方都面对道德风险的委托代理问题。

表2-3 相机续约的委托代理关系举例 模型

委托人 代理人 行动、类型 雇主

雇员 工作努力 所有者

管理者 最大化所有者的利润 相机续约 房东

公民 房客 政府官员 爱护相关设施 选择与实施

根据张维迎:《博弈论与信息经济学》(1996)、Samuel Bowles :《微观经济学:行为、制度和演化》(2006)整理

2.3委托代理问题与不完全契约

当一个当事人P 从另一个当事人A 的行动(a)中获益,采取这个行动对于A 是有成本的,并且不受制于一个可以无成本执行的契约时,我们称P 为委托人,A 为代理人,这就是一个经典的道德风险问题。这一定义的一个关键结论是,P 是A 的行动的某些不可契约化结果的剩余索取者,这意味着在P 的所有契约义务得到履行之后,A 的行为影响着P 的福利。受代理人的行动影响的结果q 是可观察到的:

()q a αμ=+

其中μ是一个均值为零、关于q 的随机影响因子,且μ是不可观察的。对于P,a 是不可观察的,或是观察成本太高,以至于在合同中无法对a 做出规定。又因为μ是不可观察的,委托人通过观察q 和了解()α也无法推断出a。P 和A 的目标函数分别是((),...)q a π和(,...)u a ,'q q π和a u 异号。因此对于a 的水平,P

制度公正与博弈均衡——一种关于法律制度的博弈论分析

制度公正与博弈均衡——一种关于法律制度的博弈论分析; ;内容提要:从博弈论的角度看,公正是社会多元利益关系多次复杂博弈的相对均衡,法律制度的形成与实施实际上就是对这种博弈均衡的确认与保障,同时也只有法律的制定与实施体现社会主体的利益博弈的相对均衡才能形成公正和良好的法律制度。 关键词:法律制度公正博弈均衡 Justice of Legal Institutions and Equilibrium of Games Abstract: From the point of Game Theory, justice is the comparative equilibrium of the complicated games of interests in the society, and the forming and enforcing of legal institutions conform and ensure the interests game equilibrium. On the other hand, legal institutions should embody the comparative equilibrium of the games of interests. Key Words: Legal Institution; Justice; Game Equilibrium 从汉语语义来看,公正至少应该包含公平、正义两个含义,而公正与公平、正义在多数情况下所表达的意思基本相同,相当于英文中的“Justice”。1 作为法律的基本价值之一的公正,固然是一个很抽象的范畴,但同时公正又是一个表达社会行为主体利益关系复杂博弈,进而形成的均衡的实实在在的概念。 博弈论2按学科分类属于数学的一个分支,其核心内容在于运用数学方法构造人类行为的理论。博弈论发展至今,尤其是社会学界提出的结构博弈3的思想无疑对法学研究具有重要的方法论意义。对社

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者:————————————————————————————————日期:

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

关于博弈论在国际贸易中的应用研究文献综述

博弈论在国际贸易中的应用研究文献综述 张伟征(109987) 摘要:随着博弈论的盛行和应用领域的不断拓展,博弈论在国际贸易中的应用的研究 也越越多,研究方向也有所不同。本文将国来内关于博弈论在国际贸易中的应用的研究 大致分为四类:在国际贸易标准制定中的应用、在外贸谈判中的应用、在出口贸易中的 应用、在贸易保护主义抬头环境下的应用。 关键词:国际贸易;博弈论;应用研究;文献综述 通俗地讲,博弈论是一种“游戏理论”。其准确的定义是:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。随着博弈论的盛行和应用领域的不断拓展,国内关于博弈论在国际贸易中的应用的研究也越来越多,研究方向也有所不同。 一、博弈论在国际贸易标准制定中的应用 董琴(2007)通过论述在国际贸易标准制定中的博弈现象、以及贸易各方在标准制定过程中如何进行博弈、其中重点分析了在贸易标准制定中存在的先行者优势现象,首次利用西方经济学的先行者优势观点来分析在贸易标准制定中谁先制定谁获益的现象。最后得出结论,技术标准竞争成为国际贸易竞争中越来越重要的手段之一,只有当我们正确认识技术标准,认清在现行经济条件下技术标准的发展趋势和它的特点,即先行者优势,并掌握在技术标准制定过程中如何进行博弈,立足国情,面向国际市场,创新和建设我们自己的具有较高技术水平的标准体系,我们才能在国际市场上处于有利地位,才有力量和发达国家一较高低,才能从根本上解决在标准领域中我们被动挨打的境地,国家才有可持续发展的动力。 二、博弈论在外贸谈判中的应用 毅冰(2012)通过论述3个供应商在外贸中的报价博弈的案例,结果出现了另一个“囚徒困境”,即很多时候明明大家面前都有一个好的方案,但由于处于博弈中,往往就只能做出相对坏的结果。他建议供应商在懂得和理解博弈论的基础上,学会如何跳出这个囚笼,以求在谈判和竞争中寻求新的突破口和增长点,可以运用“附加值”的方式,努力体现和发挥自己的长处,做差异化,弥补短板,

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

关于法律制度博弈论分析

关于法律制度博弈论分析 内容提要:从博弈论的角度看,公正是社会多元利益关系多次复杂博弈的相对 均衡,法律制度的形成与实施实际上就是对这种博弈均衡的确认与保障,同时也只有法律的制定与实施体现社会主体的利益博弈 的相对均衡才能形成公正和良好的法律制度。 关键词:法律制度公正博弈均衡 从汉语语义来看,公正至少应该包含公平、正义两个含义,而公正与公平、正义在多数情况下所表达的意思基本相同,相当于英文中的“Justice”。1 作为法律的基本 价值之一的公正,固然是一个很抽象的范畴,但同时公正又是一个表达社会行为主体利 益关系复杂博弈,进而形成的均衡的实实在在的概念。 博弈论2按学科分类属于数学的一个分支,其核心内容在于运用数学方法构造人类行为的理论。博弈论发展至今,尤其是社会

学界提出的结构博弈3的思想无疑对法学研究具有重要的方法论意义。对社会中各种行为、各种利益关系进行博弈论的分析,在此基础上研究法律制度的形成与实施,无疑具有重要意义。 一、制度公正与利益博弈 公正是一种社会观念形态,是建立在一定经济基础之上的,经过多元利益主体多次反复博弈而形成的社会意识形态。正如马克思所讲,生产当事人之间进行交易的正义性在于:这种交易是从生产关系中作为自然结果生产出来的。交易的法律形式——契约,其内容只要与生产方式相适应,相一致,就是正义的;只要与生产方式相矛盾,就是非正义的。在资本主义生产方式的基础上,奴隶制是非正义的;在商品质量上弄虚作假也是非正义的。4就是说,公正观念始终是一定生产方式的观念形态。 法律制度的公正总是相对的,变化发展的,没有永恒的公正,公正“具有一张普洛透斯似的脸,变幻无穷,随时可呈不同形状,并具有极不相同的面貌。”5之所以说公正

博弈论在管理中的应用

管理中的博弈论 在博弈中,你必须考虑对方的选择来确定你的最优选择,而对方也必须考虑你的选择来确定他的最优选择,你从博弈中得到的赢利——或者说是利益,不仅取决于你自己的行动,也取决于对方的行动,而对对方来说也是如此,你们当中的每一方都试图尽可能的使自己的利益最大化。总之,你们的行动既互相影响又相互依赖,这正是博弈最本质的特征。 在一场博弈中,每个人的目标都是其利益的最大化。在博弈理论中,有一个基本的假设,就是人们不会有道德,良心和情感上的考虑,所有的一切都只以是否符合自身利益作为选择标准。不过我们有时候也会从心理上、情感上对这一假设进行修正。不过,这种假设在绝大多数情况下是成立的。虽然我们研究的是对抗性行为,但是我们不要寄希望于博弈论可以使你所向无敌,不过博弈论确实可以增强你对某些局势的洞察力,因为它有自己独特而又保持逻辑内在一致性的思考方法。 我们来看一个现实的例子。 一个经理,为了提高工作效率而让手下有两个主管进行比赛,获胜者将得到一笔奖金。如果这两个员工都拼命工作,那么每人都有1/2的概率得到奖金,但是每个人也都会承受艰苦工作而带来的负效用,而经理自然可以得到好处。但是这两个员工实际上也可以合谋而皆不努力,这时他们两个得到奖金的概率仍然是1/2,但是谁也不需要承担艰苦劳动所带来的负效用,这使得每个员工都从合谋中得到了好处。不过,经理遭殃了,因为预期的工作效率下降了。假如你是这个经理,你会怎么做? 有什么办法来防范合谋呢?大家可能会想到监督。监督的确可以防范合谋,但是进行有效的监督是很困难的,一是监督者也有可能与被监督者合谋,二是对于隐性的默契合谋,监督对此无能为力。那么有什么办法来防范合谋呢?一个办法就是对员工进行歧视。比如,两名员工是一男一女,那么这个歧视的方案是男员工在比赛中胜出将获得100元,而女员工则只能获得50元。这个方案会导致女员工不努力,而男员工为了胜出将努力而不与女员工合谋。实际上,组织正是通过打击某些员工而拉拢另一些员工来瓦解员工之间的合谋行为的。 不过,这个方案有个问题,她会使被歧视员工不再努力,另外由于法律的相关因素,这样的显性歧视方案不会被广泛采用。我们可以借鉴的是隐形歧视理论。比如在组织中两个员工为了争夺一个更高的职位而竞争。显然,两个员工也可以合谋而不努力,让老天来决定谁来得到这个岗位,并且约定,不管是谁得到这个岗位都需要对对方进行补偿。这个问题仍然

管理博弈论

管理博弈论 管理博弈论(Game Theory of Management) [编辑] 什么是管理博弈论[1] 管理博弈论也称管理激励与约束机制设计理论,是指管理博弈论是对近年来的管理激励与约束机制设计中不同模型、不同方法研究成果的概括和提炼。所以可以说管理博弈论就是围绕管理激励与约束机制设计的一系列理论与方法,是博弈论在管理学领域的运用与发展。 [编辑] 管理博弈论的产生[1] 现代管理的核心职能是激发人最大限度地发挥主观能动性,创造性地开展工作,这其中自然包含了管理者和被管理者之间的博弈。但由于管理对象是有限理性的社会人,不是理性的经济人;由于管理环境是复杂多变而组织目标是相对稳定的,因而管理活动更具多阶段特性;由于被管理者的需求是多方面的,因而管理激励与约束是多因素的;还由于管理活动通常具有多目标、多层次的特点,使博弈论方法在管理学中的应用远比在其他领域的应用更为复杂、多样。由于引入了管理激励与约束机制设计的概念,使得管理和博弈有了结合部,博突论在管理学的应用有了切入点。之所以说管理激励与约束机制是管理博弈论产生和发展的载体,是由于它既切合管理实践发展需要,又能将个人理性与非理性、优化结果的定量与定性描述、需求的单因素与多因素、管理的单目标与多目标、单阶段与多阶段、单一管理层次与多管理层次有机地结合起来,从而为博弈论在管理学中的应用与发展开辟了道路。 [编辑] 管理博弈论的基本内容 管理博弈论的基本内容包括:需要激励,目标激励,榜样激励,压力约束,纠偏约束。 [编辑] 管理博弈论管理的核心[2]

管理博弈论管理的核心是如何最大限度地发挥主观能动性创造性地开展工作,这其中就包含了管理者与被管理者之间的博弈。现代管理是以人为中心的管理,一个组织内部的效率取决于全体员工的努力水平。因此,激励与约束就成了管理的核心职能。在企业中如何提高员工的素质,如何创造出使员工感到上下级平等的环境,如何达成组织目标和个人目标的统一,这都是一个组织在进行管理的时候考虑如何运用管理激励与约束手段的问题。从社会现实来看,假冒伪劣产品的出现,污染问题,体育比赛中的黑哨问题,运动员的违规问题等等都是管理激励与约束措施不当造成的。建立有效的管理与约束机制已经成为现代管理实践的迫切需要。管理博弈论就是一门关于激励与约束机制体系设计的新学科,它是博弈论在管理应用中的一个重要的、新的分支,管理博弈论进行定量化.模型化研究的基本数学基础就是博弈论。 [编辑] 管理博弈论的学科特点[1] 管理博弈论作为一门以管理激励与约束机制设计为研究对象的新兴学科,有自己产生的时代背景,有自己明确的研究对象与范围,有自己的理论基础,是应管理实践需要而生的。具体而言这门新学科具有如下一些特点: (1)管理博弈论是一门新兴综合性交叉学科。管理博弈论研究的对象是管理激励与约束机制设计,管理激励与约束机制问题往往非常复杂。由于管理者与被管理者之间一般信息是不对称的,他们既可能是合作关系,也可能是非合作的关系,管理激励与约束机制设计中需要综合运用合作博弈、非合作博弈、非对称信息博弈的理论与方法,还可能用到各种现代数学最优化理论,还要以管理学激励与约束理论为指导。因此,管理博突论是由众多学科理论交叉形成的,以特定的管理激励与约束机制设计为研究对象的综合性新学科。 (2)管理博弈论是一门应用性管理类新学科。管理博弈论是根据管理实践的需求而产生发展的,它的问题来源于管理实践,它的研究服务在于管理实践,故而它是一门理论与实践紧密结合的应用性管理类新学科。 (3)博弈模型的机制式表述。博弈论中博弈模型的基本表述形式有战略式表述、扩展式表述;非对称信息博弈论中博弈模型的基本表述形式为特征函数式表述。这些博弈模型的表述形式都是管理博弈论中博弈模型可采用的表述形式,但是,由于对复杂的多目标、多样因素、多阶段博弈难以表述,故其应用具有很大的局限性。为此,管理博弈论提出了适应于解决多目标、多因素、多阶段复杂的管理激励与约束机制模型的基本表述形式——机制式表述。 (4)定性要素研究与定量要素研究相结合。博弈论与非对称信息博弈论中博弈模型不仅可容纳的要素较少,而且要求要素只能是定量的。管理问题中涉及的资源要素不仅多,而且定性要素占的比重很大。不能反映定性要素作用的模型,显然不足以反映问题的全貌,设计出的模型必然是有缺陷的。管理博弈论强调定性要素研究与定量要素研究相结合,在其机制式表述中,通过定性因素定量化,将定性因素纳入模型,研究其作用与影响,力图达到充分全面反映问题的目的。

博弈论与社会科学方法论(潘天群)

通识课 课程中文名称:博弈论与社会科学方法论 课程英文名称:Game Theory and Methodology of Social Sciences 课程代号:开课学期:第一学期(秋学期) 主讲教师:潘天群职称:教授、博导 研究专长:博弈论、逻辑学、科学方法论 所在院系:哲学联系电邮:tqpan@https://www.doczj.com/doc/2211014824.html, 授课对象:全校二、三年级本科生(不限专业) 一、主讲教师简介: 潘天群,哲学博士,现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才(2006)。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。 主要研究领域为:逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部:《行动科学方法论》,《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》,自2002年出版以来深受读者欢迎,为畅销书与长销书,已出版第三版。 主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”(2009)。 二、课程简介 由于“他人”与“我”是既合作又竞争的关系,研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来,对社会现象表现出强大的解释力,已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖,许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学(如生物学、人工智能)之中。 本课程突破数理博弈论的框架,结合主讲教师十年来的研究工作,构建适合

法律博弈论及其核心构造

法律博弈论及其核心构造* 金梦 内容提要法律博弈论把博弈理论运用到法经济学研究的全新视域中,研究法律策略主体在行为直接发生相互作用时的策略选择以及这种策略选择所产生的均衡问题。法律博弈论的核心是法律均衡,法律均衡是通过法律博弈最终实现“法律的帕累托最优”。公平正义法律价值的实现,是“法律的帕累托最优”状态的展现,也是法律博弈的终极目标和价值追求。 关键词博弈论法律博弈论法律均衡 法律博弈论从法经济学作为独立学科之日起就已经贯穿其研究的始终。博弈论①为研究法律问题提供了新的方法和视域。如果说科斯定理的提出是法经济学作为一门独立学科的标志,那么从理论上说,自从有了科斯定理,法经济学就成了法律博弈论。②而且博弈理论在经济学领域的充分运用和对经济学的完善与改造引起了诸多法学学者的关注。艾尔斯在评论埃里克·拉斯穆森的《博弈与信息》一书时,提及了博弈论在法律中的应用及其趋势,着重论述了法律规则的策略选择问题。③布里梅耶运用博弈论分析法律冲突问题。④拜尔、格纳特和皮克在合著的《法律的博弈分析》一书中指出,现代博弈理论为人们理解法律规则如何影响人的行为提供了非常深刻的洞察力。此书是第一本全面系统运用博弈论分析法律问题的著作,它的出版开启了法律博弈论研究的新篇章。⑤ 时至今日,作为法经济学的主导分析范式,法律博弈论在一定程度上具有法学方法论的意义。博弈论在法学研究和法律实践中被游刃有余、“无孔不入”地运用,使得法学这门古老又常新的社会学科更加年轻化、精量化和现实化。为了更好地使用博弈论分析和解决法律问题,亟需解释法律博弈论的涵义到底是什么?法律博弈论的运作机理是怎样的?作为一种纯理论⑥,法律博弈论在 法律冲突、法律价值选择和司法实践中如何具体操作适用?以上是本文关注的重点问题。 何谓“法律博弈论” (一)法律博弈论的涵义 “博弈论”,英文的表达是Game Theory或者Theory of Games;“法律博弈论”,英文的表达一般是Law and Game Theory或者Legal Game Theory,很多学者也使用Game Theory and Law,翻译成中文是“法律的博弈分析”抑或“博弈论与法律”。“法律博弈论”在国内外还没有学者作出专门系统且深入的研究,更没有一个确定的涵义和深厚的理论基础。使用“法律博弈论”一词通常是在运用博弈论分析具体法律问题时,所以在通常意义上讲,学者所做的研究叫做“法律的博弈分析”,而不是“法律博弈论”。“法律博弈论”的使用和表达方式首先是把它看做一种独立成家的理论,而不仅仅是博弈方法在法学中的运用。既然是一种理论,就必须明确其定义,厘清其组成要素和适用方法,同时还需要深入考察其是否具有体系化的特征。 在给“法律博弈论”下定义之前,需要先明确“博弈论”的定义。通说认为,博弈论是研究公式化了的激励结构(游戏或者博弈)间的相互作用以及具有斗争或竞争性 822*本文系国家社科基金重大项目“完善以宪法为核心的中国特色社会主义法律体系研究”(项目号:14ZDC008)的阶段性成果。

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

博弈论在管理中的应用

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

“要在现代社会做一个有文化的人,你必须对博弈论有大致的了解。” ——萨缪尔森 在博弈中,你必须考虑对方的选择来确定你的最优选择,而对方也必须考虑你的选择来确定他的最优选择,你从博弈中得到的赢利——或者说是利益,不仅取决于你自己的行动,也取决于对方的行动,而对对方来说也是如此,你们当中的每一方都试图尽可能的使自己的利益最大化。总之,你们的行动既互相影响又相互依赖,这正是博弈最本质的特征。 在一场博弈中,每个人的目标都是其利益的最大化。在博弈理论中,有一个基本的假设,就是人们不会有道德,良心和情感上的考虑,所有的一切都只以是否符合自身利益作为选择标准。不过我们又是也会从心理上,情感上对这一假设进行修正。不过,这种假设在绝大多数情况下是成立的。虽然我们研究的是对抗性行为,但是大家不要寄希望于博弈论可以使你所向无敌,不过博弈论确实可以增强你对某些局势的洞察力,因为他有自己独特而又保持逻辑内在一致性的思考方法。 我们来看一个现实的例子。 一个经理,为了提高工作效率而让手下有两个主管进行比赛,获胜者将得到一笔奖金。如果这两个员工都拼命工作,那么每人都有1/2的概率得到奖金,但是每个人也都会承受艰苦工作而带来的负效用,而经理自然可以得到好处。但是这两个员工实际上也可以合谋而皆不努力,这时他们两个得到奖金的概率仍然是1/2,但是谁也不需要承担艰苦劳动所带来的负效用,这使得每个员工都从合谋中得到了好处。不过,经理遭殃了,因

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征 博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征: 1. 研究对象的普遍性和应用范围的广泛性 人们的行为之间存在相互作用与相互依赖,不同的行为主体及其不同的行为方式所形成的利益冲突与合作,已成为一种普遍现象,这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。 现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实,使博弈论的研究内容和应用范围十分广泛,涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域,在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性 一是运用数学模型来描述所研究的问题,使博弈论的分析更为精确。 二是研究方法具有抽象化的特征,由于博弈论分析大量使用了现代数学,使它所描述和分析的过程及所揭示的结论都带 有抽象、一般化的特点。 三是博弈论分析方法所体现的模式化特征,博弈论为人们提供了一个统一的分析框架或基本范式,从而使博弈论能够分 析和处理其它数学工具难以处理的复杂行为,成为对行为主 体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中,不仅要应用现代数学的大量知识,还涉及到经济学、管理学、 心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性 博弈论中的最佳策略是经济学意义上的最优化,它只回答是什么导致博弈均衡,均衡的结果是什么,所遵循的基本原则是科学结论的客观性和普遍性。从实践上看,博弈论突破了传统的完全竞争、完全信息假定,更加强调决策者的个人理性,强调不完全信息、不完全竞争条件下的经济分析,强调决策个体之间的相互影响和相互作用等外部性,强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致,等等。作为一门方法论科学,除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外,还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说,博弈论方法具有实证的特征,使研究结果更具有真实性。

博弈论

课程名称:博弈论 题目:博弈论在华科校园生活中的应用老师:罗云峰先生 院系:xxxx 班级:xxxx 姓名:xxxxx 学号:xxxxxx 日期:2012 年11 月 3 日

一、引言 美国诺贝尔经济学奖第一人保罗·萨缪尔森曾这么说过:“博弈让人们懂得如何对应这个纷繁多变的世界。要想在现代社会中做一个有文化的人,你必须对博弈有一个大致了解”。在百度百科中对博弈论有着这样的解释:博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。百度百科中有关博弈论的说明足以说明博弈论这门独特知识在今天的重要地位。 就如每个人品读三国得到的是每个人心中独特的三国风云一样,相信不同的人对博弈论的理解也各有不同,而在我眼里的博弈论即是个体对个人利益的追求以及保障的方法,譬如生活中的赌博、局细、围棋等。我们人作为一个活体,生活在群体之中,处于人与人的利益纠葛之中,因此无时无刻不在与他人进行着利益的博弈,这点恐怕我们自己自身都没意识到。 作为大学生,我们算是正在接受高等教育的知识分子,日常生活中的博弈可能表现的更加明显,在博弈中所表现出来的策略性也更加突出,因此此次针对罗老师所提出的论文作业我选择了把自己的目光焦点置于咱们华科学生的日常生活中,试图寻找一些博弈论的影子。 二、华科大学食堂中的博弈 华科坐拥七千余亩良地,北临喻家山,地盘大面积大,可是人也多,众多学生自然容易造成一定的拥挤,尤其是每天放学食堂用餐的时候,一眼望去可谓是人山人海,因此食堂便衍生出了很多问题,最典型便是食堂买菜打饭时的排队问题以及用餐占座问题了,恐怕每个华科学子对此应深有体会。 (一)食堂打饭排队问题 每次用餐时我们都要排队购买自己的食物,为了保证良好的就餐秩序因此要求大家进行排队,但是并不是每个人都能自觉做到排队买菜,常有人会为了一己之便而插队,对此本人是深恶痛绝。 为了简化问题便于分析,我们先考虑只有两个同学要买菜,对于这个排队买菜打饭问题我们可以进行如下的概括:现在有两个同学要在同一个窗口前要买菜打饭,对于他们每个人都有两个选择,一个是老老实实排队,一个是选择插队,因为两人共同的想法都是为了尽可能的节省时间,因此我们假设单个人老老实实排队最终时间为-2分钟,一人插队时最终耗时-1分钟,而当两个人均要进行插队时便爆发冲突,因此结果是-10分钟后两人才能吃上饭。在此次博弈的局中人中,就每个学生个体而言,他们是决策者,而就学生相互之间而言,彼此的关系便是对抗者,彼此为了自己而博弈。显然对于每个个体而言,他不知道另一个个体所将要作出怎么样的选择,且在这个问题中我们假设局中人是同时进行决策的,所以这个博弈可以归类为静态博弈,用博弈论中的报酬矩阵可以将此次过程刻画如下:

相关主题
文本预览
相关文档 最新文档