当前位置:文档之家› 博弈论04 动态博弈4

博弈论04 动态博弈4

博弈论04 动态博弈4
博弈论04 动态博弈4

尹伯成《西方经济学简明教程》(第9版)题库-博弈论和信息经济学【圣才出品】

第7章博弈论和信息经济学 一、名词解释 1.代理人 答:代理人指一个为委托人完成某种行为的人。这里的“人”,可以是自然人或法人。在现实经济生活中,代理人的种类很多,如销售代理商、企业代理商、专利代理人、广告代理人、保险代理人、税务代理人等。在现代微观经济学中,企业的管理者可以被看成是所有者的代理人。随着分工和专业化的发展,交易和契约活动中的委托-代理关系成为现代经济中的重要问题。在公司制度中,由于所有权和控制权、经营权的分离,导致了所有者和管理者之间潜在的利益矛盾。特别是在一些大型股份公司里,如果股权极其分散,对管理者的控制和影响就更弱了。管理者是为了自己的利益最大化而工作,而不是为了股东利益最大化。而委托-代理问题的重要之处在于,由于代理人的某些信息或某些行动是不可观察的,或者虽然可观察但不可确证,委托人难以通过一个直接的强制性契约来实现自己的利益最大化,而只能通过一个间接的激励方案,使代理人在追求自我利益的最大化实现的同时,也使委托人的利益尽可能地得到实现。 2.委托-代理问题 答:委托-代理问题是指所有者(委托人)与经营者(代理人)的预期目标不一致,从而导致两者的行为准则、价值取向不和谐甚至相互冲突的问题。由于信息的不完全性,委托人往往不知道代理人要采取什么行动或者即使知道代理人采取某种行动,也不能观察和测度代理人从事这一行动时的努力程度,同时两者之间存在的利益分割关系,通常会使得代理人不完全按照委托人的意图行事。 解决委托-代理问题最有效的办法是实施一种最优合约,即委托人花费最低限度的成本

而使得代理人采取有效率的行动实现委托人目标的合约。 3.贝叶斯均衡 答:贝叶斯均衡是一种不完全信息静态博弈的均衡,由海萨尼于1967~1968年提出。贝叶斯均衡表示这样一种策略组合,给定自己的类型和其他参与人类型的概率分布的情况下,每个参与人的期望效用度达到了最大化,这时,没有人有积极性去选择其他策略。贝叶斯均衡是纳什均衡在不完全信息对策中的自然扩展。 4.囚徒困境 答:囚徒困境指两个被捕获的囚徒之间的一种特殊“博弈”,说明为什么在合作对双方都有利时,保持合作也是困难的。具体情况如下:两囚徒被指控是同案犯。他们被分关在不同的牢房里且无法互通信息,各囚徒都被要求坦白罪行。如果两囚徒都坦白,则各将被判入狱5年;如果两人都不坦白,则各将被判入狱2年;如果一方坦白另一方不坦白,则坦白方入狱1年,另一方入狱10年。下面的支付矩阵列明了两囚徒选择的结果。 如果囚徒A不坦白,他就冒着被囚徒B利用的危险,因为不管囚徒A怎么选择,坦白总是囚徒B的最优方案。同样,坦白也总是囚徒A的最优方案。总之,从上面可以看出,对囚徒个人而言,选择坦白总比不坦白收益高,但从两人的支付总和来看,双方都不坦白的收益是最高的。因此,囚徒困境揭示了社会和经济生活中的一种普遍情况,即“个人理性”与“集体理性”之间的矛盾。它意味着个人理性并不是实现集体理性的充分条件。 二、简答题

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论(课一)

课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章)

博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。

推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!)

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

耶鲁大学博弈论_精简版

第一讲导论-五个入门结论 1.通过成绩博弈模型可以知道,不选择严格劣势策略,因为每次博弈会得到更好的收益。 2.通过囚徒的困境博弈模型可以知道,理性选择导致次优的结果(协商难以达成目的的原因不是因为缺少沟通,而是没有强制力)。 3.通过愤怒天使博弈模型可以知道,汝欲得之,必先知之;永远选择优势策略,选择非劣势策略,损失小,如果对手有优势策略则应以此作为选择策略的指导。 4.如果想要赢,就应该站在别人的立场去分析他们会怎么做。 第二讲学会换位思考 1.构成博弈要素包括,参与人,参与人的策略以及收益。 2.所谓严格优势策略,就是指不论对方采取什么策略,采取的这个策略总比采取其他任何策略都好的策略。 3.在博弈中剔出某些选择时需要站在别人的角度去思考结果,因为对手不会选择劣势策略;同时要考虑到对手也是一个理性的参与人。 4.在博弈中剔除某些选择是一种直接思考,同时也是作为一个理性参与人的选择。 第三讲迭代剔除和中位选民定理 1.在选民投票博弈模型中,通过不断地迭代以及剔除来决定策略,由此,我们得到了一种新的选择策略的方法:迭代剔除法。 2.选民投票博弈模型的结果与现实存在偏差,主要是因为:①现实中选民并不是均匀分布的;②选民通常根据候选人的性格而非政治立场来进行投票,而政治立场只是单一维度;③只适用于只有两个候选人的情况;④同时存在弃权票;⑤选民未必相信候选人所声明的立场。 3.建立模型,是为了更好的描述事实以激发灵感,模型是有重要的事是抽象而来,逐步增加约束条件完善模型观察结果,比较分析结果的变化。 第四节足球比赛与商业合作之最佳对策 1.点球博弈模型告诉我们,不要选择一个在任何情况或信念下都不是最佳对策的策略。 2.最佳对策:①参与人针对对手策略的定义:参与人i的策略s^i(简写成BR)是对手策略S-i的最佳对策,如果参与人i在对手的策略S-i下选S^i的收益弱优于其它对策Si`,这对参与人i的所有Si`都适用,则策略S^i是其它参与人策略S-i的最佳对策。S^i最大化了对手选S-i时我的收益;②最佳对策广义定义:参与人i的策略S^i是最佳策略(你对其他参与人可能采取的策略持信念P时的最佳策略),在参与人i仍持信念P的情况下选S^i 的获得预期收益比在同样的信念P下选其它的策略获得的预期收益都要高(对于所有可选的Si`均成立)即Eu(S^i,P)≥Eu(Si`,P) Si` in Si 我从Si选择可选策略时S^i而非S-i最大化了我的预期收益。 第五讲坏风气与银行挤兑 1.纳什均衡,即对任意一个此博弈内的参与者A,他所选择的策略是其他参与人所选策略的最佳策略。

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

生活中的博弈论感悟(优.选)

《生活中的博弈论》学习感悟 第一讲初试博弈论 生活中的资源是有限和稀缺的,于是就产生了竞争,这种竞争就需要一种形式把大家聚在一起,这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用,其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧,还体现在我们生活中的种种小事中,如双方互拨打电话,放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上,通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素,博弈者做出对自己最有利最保险的决策和行动,从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手,但人的决策又具有有限理性,因此博弈论也不是万能的。 第二讲纳什均衡 在某一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。

囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析,可以发现合作是可以实现双赢的。如:两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加广告开支,设法提升广告的质量,压倒对方。(背叛)若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 第四讲斗鸡博弈 所谓“斗鸡博弈”就是两只公鸡面对面斗争,继续斗下去,两败俱伤;一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、被谁一站的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。学习了知识,就要善于联想,善于联系生活。在很多的时候我们都可能是在不知不觉中就使用了或者是接触到了博弈论,就像是平常我们和其他人之间的争执问题,每次都可能弄得脸红脖子粗的,双方都不服气,最终的结果是有一个人妥协,然后彼此达成一致;冷战期间的美苏两大军事集团的争斗也是一种“斗鸡博弈”。

复旦大学经济学基础科目经典教材书单

复旦大学经济学基础科目经典教材书单 入门阶段: 中文版名称:《经济学原理》曼昆 英文版名称:principle of economics by Mankiw, N.G. 基础阶段: 《微观经济学》周惠中 《微观经济学:现代观点》哈尔.R.范里安(Hal R. Varian) 《宏观经济学》多恩布什(Rudiger Dornbusch / Stanley Fischer / Richard Startz) 《全球视角的宏观经济学》萨克斯(Jeffrey D. Sachs) 《国际经济学》克鲁格曼(Paul R. Krugman) 《国际金融与开放经济的宏观经济学》(Giancarlo Gandolfo) 《金融学》博迪/莫顿(Zvi Bodie / Robert C.Merton ) 《货币金融学》米什金(Frederic S.Mishkin) 《货币理论与政策》Carl E. Walsh 《数理经济学的基本方法》蒋中一(Alpha C. Chiang) 《经济学中的分析方法》高山晟(Akira Takayama) 《金融经济学原理》LeRoy / Werner 提高阶段: ①计量经济学: ⑴中文名:《计量经济学》林文夫 英文名:Econometrics by Fumio Hayashi ⑵中文名:《计量经济学分析》格林 英文名:Econometric Analysis by Greene ⑶中文名:《横截面与面板数据的经济计量分析》伍德里奇 英文名:Econometric Analysis of Cross Section and Panel Data by Wooldridge ②微观经济学: ⑴中文名:《高级微观经济理论》杰里/ 瑞尼(JR) 英文名:Advanced Microeconomic Theory by Geoffrey A. Jehle / Philip J. Reny 简称(JR) ⑵中文名:《微观经济学高级教程》范里安 英文名:Microeconomics Analysis by Hal R. Varian ⑶中文名:《微观经济学》安德鲁.马斯-科莱尔等(MWG) 英文名:Microeconomic Theory by Andreu Mas-Colell / Michael D. Whinston / Jerry R.Green 简称(MWG) ③宏观经济学: ⑴中文名:《高级宏观经济学》戴维.罗默 英文名:Advanced Macroeconomics by David Romer

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明 教授/主任 清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录 第一讲:导论 一、博弈论的研究对象 第二讲:占优战略与社会两难第三 讲:纳什均衡和双人博弈第四讲:三 人博弈与n人博弈第五讲:纯战略和 混合战略第六讲:博弈的合作解第 七讲:序贯博弈与子博弈完美均衡第 八讲:重复博弈第九讲:企业经营决 策的博弈分析第十讲:企业内部组织 分析第十一讲:政府行为分析 第一讲 导论 博弈论是研究理性的决策主体在其行为发生直 接的相互作用时的策略选择及策略均衡的理论。 博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大 收益的策略)。 二、博弈论的产生和发展 博弈又称博戏,是一门古老的游戏。 1. 博弈在中国《学弈》(《孟子 ?告 子》):弈秋,通国 之善弈也。使弈秋侮 二人 弈,其一人专心致志,惟 弈秋之为听;一人虽 听之,一心以为有鸿 鹄将至,思援弓缴而射 之。虽与之俱学,弗若 之矣。为是其智弗若 与?吾曰:非然也。 《世本》说,“乌曹作博”,乌曹乃是 夏代著名之能工巧匠。千百年来,博 弈更是与人们的生活紧紧相连,从博 棋到牌戏,从斗戏到彩票,中华民族 的历史长河中就这样形成了别具风情 的博弈文化 从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战

1

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

博弈论复习大纲下

博弈论第六讲--第九讲复习大纲 第六讲声誉和对称信息重复博弈 1、重复博弈(Repeated Game):是动态博弈的一种特殊情况。在重复博弈里,完全相同的环境一次次重复出现,参与人在重复出现的相同环境中做出决策。重复博弈是一类很重要的动态博弈。 2、有限次重复博弈例子:连锁店悖论:现象---博弈的重复进行对进入威慑博弈和囚徒困境的结果基本上没有影响;结论---在位者在包括第1个市场的所有市场上都将选择合谋。这个结论称为连锁店悖论。 通过对连锁店悖论的分析,得出结论:如果当事人完全理性,有限次重复博弈的均衡解和一次博弈没有区别。把这个结论推广到囚徒困境博弈中,就是说,尽管两个人都选择不坦白是集体最优的,但如果同样的博弈重复有限次,这个重复博弈的均衡仍然是(坦白,坦白)。 重复博弈比不重复进行的一次性博弈要复杂得多。在现实中,如果当事人不那么理性,或者看起来不那么理性,那么有限次重复博弈的结果有可能和一次博弈不同。那么在有限次博弈的囚徒困境中,就有可能实现(抵赖、抵赖)的结果。 3、无名氏定理:重复博弈中最重要也是最有名的结果是“无名氏定理”,该定理认为,只要局中人有足够的耐心,那么任何理性的可行盈利都可以在均衡中得以实施。换句话说,只要局中人的耐心足够地大,一次博弈中可行的理性结局总是可以与重复博弈中某均衡结局相一致。 无名氏定理告诉我们:在无限次重复博弈中声称完美均衡导致了某一特定的行为是没有意义的。 4、声誉:在重复进行的囚徒困境博弈里,只有博弈将重复进行无限次时,参与人才会选择合作。这是声誉的一个大问题。因为每个人都知道一个参与人将在最后一期选择坦白,那么为什么他们还要假设这个参与人会在目前建立起自己的声誉呢? 声誉应用: 5、折现率的概念以及无限次重复博弈中合作条件的推导,以产量卡特尔为例。 6、价格竞争对制造商的影响 7、进化与囚徒困境,鸽鹰博弈

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

生活中的博弈论例子

生活中的博弈论有那些例子 那讲工作上的事假如你做的策划被上司偷了那你是要向更高级的领导告状还是忍受这也算一个博弈论问题你要是告状,也许能够伸冤,但也会若到上司他可能会给你下绊子但不上诉他也许会再偷,你的工作就白废了 还有物价方面假如几个店铺联合起来自然能够把东西卖的比较贵但只要其中一个降价其他店的客人就会全跑到那家去那另外几家也会被迫降价店铺联合本来是最好的赚钱方法但店铺间一般是敌对关系为防备有人订低价,引走客人所有的店铺都会尽可能低价其实我们学校门口的网吧刚上演了一出这个好戏真是有感触啊!!!!! 弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。 1.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解”或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略怎样才是“合理” 应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运

金融经济学经典教材

推荐几本优秀的数学基础课教材吧,而且基本都有中文版了 1、微积分教程——计算机代数方法I. Anshel D.Goldfeld 这是哥伦比亚大学的数学基础课改革试点教材,写的很好,它从一开始就把微积分思想同整个数学和使用计算机的数学软件结合起来,非常好的微积分入门基础教材,如果你自己有台电脑,学点Mathematica或者Matlab这个常用数学软件的话,就可以很好的自学这本教材了。这本教材的特点是,用计算机实验来很好的表达微积分的数学思想。而且它的优秀就在于,不仅介绍古典的微积分思想,更帮助读者引入到现代多维空间的代数几何思想,通俗易懂,非常好的高等数学入门教材。如果想学数学,就从这本开始。 2、数学分析原理Walter Rudin 在数学基础课领域,Rudin的教材一直是备受美国各著名大学比如MIT、耶鲁等所推崇的,写的非常好,他自己是搞分析领域的,所以分析路线里你都可以找他写的教材看,思路清晰,语言平易,很好的阐述了数学思想的精髓;而且这本数分教材开始引入简单的拓扑思想和基础知识了,为以后学习更深的数学奠定了很好的基础。 3、高等微积分Lynn H. Loomis / Shlomo Sternberg 这是哈佛的数学教材,供高年级本科生和低年级研究生使用,这本教材基本代表了当今微积分领域的最先进的思想,它几乎就是用现代数学的思想来完全重新改写了整个古典微积分,你必须要有非常好的数学基础,才能看得懂这本教材。我刚打开这本教材时,简直就感觉我从来没有学过高等数学,从来没有学过微积分,呵呵。这本教材的中文版翻译工作也是由中科院院士王元亲自来做的,这本教材也是哈佛教授、Fields奖获得者***鼎力推荐的数学基础课教材; 4、实分析与复分析Walter Rudin 5、泛函分析Walter Rudin 这两本不说了,Rudin的教材一定顶,呵呵 6、分析学Elliott H. Lieb / Michael Loss 这是一本非常优秀的实分析教材,普林斯顿的教材,还有什么可讲的; 7、线性代数及其应用David C. Lay 这是一本很不错的线性代数入门教材,也是美国国家科学基金支持线性代数教学改革的一本教材,也是全面引入现代数学理念,结合计算机数学软件来讲授线性代数,配有光盘,里面有大量的编好Matlab、Mathematica的程序,来帮助读者学习; 8、高等代数丘维声 这是北大比较经典的高等代数教材,特点是内容比较全面,尽管教材编写本身没有什么创新之处,数学思想应用也很普通(国内数学教材普遍如此),但总体来说内容比较**全面,错误也很少,也算是国内难得的几本比较经典的数学教材了。这个级别内容的国外教材翻译的不多,而且还是苏联的那套比较多,所以这本用用也挺好的。 9、概率论基础教程Sheldon M. Ross 这是本不错的概率论入门教材,概率论国内很弱,基本没有什么好教材的,所以还是用国外教材好。Ross是概率路线的大牛,他写过很多概率统计方面的教材,都很受欢迎,包括金融数学、随机模拟等 10、概率论及其应用威廉?费勒 作者是概率路线的世界级权威,这本书是相当全面优秀的概率论教材,有一定难度,对于像深入学习经济学博弈论的朋友来说,是很好的基础教材; 11、基础偏微分方程David Bleecker / George Csordas 既然是基础教程,当然起点不会太高,有些微积分和高等代数基础的就可以用这本了,这本内容还是比较丰富的。

博弈论66个经典例子之六

博弈论经典例子 一、囚徒困境 故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各

判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。 二、旅行者困境 两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了,于是他们向航空公

司索赔。航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。可是不,甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到101元。何乐而不为?所以他准备写99元。可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。在花瓶索赔的例子中,如果两个人都“彻

相关主题
文本预览
相关文档 最新文档