当前位置:文档之家› 博弈与社会第三次作业参考答案

博弈与社会第三次作业参考答案

博弈与社会第三次作业参考答案
博弈与社会第三次作业参考答案

经济学专业的读书报告

酷玩经济学 图书馆里关于经济学的书籍满目琳琅,书架上的经济学丛书甚至多不可耐,翻开一看难免都属于文字生硬类型的,要不就是公式文字或专业术语让人头脑晕厥。但是从中我发现了一本封面设计比较特别的讲解微观经济学的书,叫《酷玩经济学》。这本书的封面就是有几张诙谐的小人图,比如两个海盗剑拔弩张为争夺一箱宝物的图片。这样吸引了对这本书的兴趣,让我感觉到了它的不同之处。完整阅读本书,要说它最大的特点是什么,我想那应该就是“通俗易懂、诙谐风趣”吧。 本书的作者是放眼全球唯一一个用脱口秀讲经济学的美国经济学家,尤伦·鲍曼(Yoram Bauman),他最大的愿望是通过脱口秀表演向全世界展示最有趣的经济学,所以本书的内容、引喻都是十分有趣而且贴近生活的,让我们在一边学习到经济学的知识的同时一边笑呵呵地联用到身边的生活当中去。本书一直紧扣微观经济学的重要问题进行论述:在什么样的情况下,个体最优化为整体带来好的结果呢?虽说这个问题在微观经济里是一个十分宏大的问题,甚至没有最明确的答案,但是作者为我们分析了个人的追求,还有群体之间的互动,最后就是分析市场的互动,层层加深,既不落窠臼又能创新求精。本书分为三个部分共16章,第一部分,追求最优化的个体;第二部分,策略性互动;第三部分,市场互动。 在正文开篇之前前言之前,有一个“挑战曼昆,鲍曼VS曼尼(经济大师)”部分。十大曼昆原理: 原理一:人们面临权衡; 原理二:某事的成本,就是你为得到它而放弃的东西; 原理三:理性人会从边际的角度思考; 原理四:面对刺激,人们做出响应; 原理五:交易能让所有人更好过; 原理六:大多数时候,市场是组织经济活动的好办法; 原理七:政府有时可以改善市场结果; 原理八:一个国家的生活水平取决于其生产商品和服务的能力 原理九:政府印的钱太多,价格就上涨; 原理十:短期而言,社会要在通货膨胀和失业率之间进行权衡。 这些话都是有专业水准的总结吧,这样的文句需要理解记忆甚至背诵,但是身为第一脱口秀经济达

博弈论作业汇总

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

进化博弈论读书心得

进化博弈论读书报告 汪波 1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS ),随着1978年, Taylor 和Jonker 发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull 著作了《Evolutionary Game Theory 》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics 》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。 一、进化稳定策略最初的模型 进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。 最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略I 、J ,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为0w ,再假设整个群体中选择I 的概率为p ,()w I 、()w J 分别表示选择相应策略带来的适应度,而(,)E I J 表示个体选择策略I 而对手选择J 时的收益,其他(,)E I I 等表示类同的意义。 若每一个个体都参与到竞争当中,则有 0()=+(1-p )(,)(,)w I w E I I p E I J + (1-1) 0 ()=+(1-p )(,)(,)w J w E J I p E J J + (1-2) 稳定的策略具有下列性质:整个种群中几乎所有的个体都采取了这个策略,且这些个体的 适应度必将高于竞争对手或者可能出现的突变异种的适应度,否则竞争对手或者产生的突变 异种会侵害整个种群,以致种群的削弱或者毁灭等,这时此策略便不可能是稳定的策略。若 I 是进化稳定策略,则()()w I w J >,且1p ,所以当I J ≠,有 (,)(,)E I I E J I > (1-3) 当(,)(,)E I I E J I =时有 (,)(,)E I J E J J > (1-4) 满足上述条件(1-3)、(1-4)的策略就称为进化稳定策略,而上述的两个条件1-3、1-4也被认为是判别E SS 的标准条件。 上述的策略是在纯策略情形下考虑的,当策略I 是从一个可能策略集合中随机的选择而

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论作业

关于中国城市交通拥堵的博弈论分析 随着现代化发展和人民生活水平提高,城市马路上车流量越来越大,人们出行时感觉拥堵。公共交通优先发展是城市交通问题获得解决的有效举措,也是城市交通实现可持续发展的内在要求。目前我国很多城市相继出台和实施了多元化的优惠公交政策,鼓励公交优先发展。 博弈论是研究互动环境下具有竞争或对抗性质的博弈行为的理论和方法。博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到了广泛的应用。博弈论研究的问题是,给定信息结构下,决策主体的决策如何使自己的效用最大化,并可以在其他决策主体中取得均衡。一个基本博弈由博弈三要素构成,即决策主体,策略集及效用。其中,决策主体是指参与人或局中人;策略集,即信息结构,是决策主体可以选择策略及行动的范围;效用,即偏好或支付函数,是指可以被量化的决策主体的利益。 在城市交通中,车辆与车辆之间、车辆与行人之间以及行人与警察之间,每天不间断地发生着竞争、互动和选择。可以说,在城市交通过程中,无时无刻不存在着博弈。用博弈论来分析城市交通问题,可使我们对身边的交通现象有更深的感悟和理解。 在城市交通博弈过程中,所对应的基本要素可理解如下: 局中人:各种交通参与者,包括机动车、非机动车、行人。 策略:出行时,采用什么出行方式是其策略,步行、骑自行车、乘公交车、自驾车等;交通过程中,遵守或不遵守交通法规也是其策略。局中人在不同的博弈中会有不同的策略。 得失:不同的出行方式,会有不同的成本和收益,出行者一般只会考虑到自己在选择某种交通方式时将要付出的成本,而不会考虑到自己的出行会给其他人带来什么影响;交通过程中,遵守或不遵守交通法规也会有不同的得失。 最后得出博弈的结果——不同的博弈会有不同的结果。 我们可以试着以博弈论的视角分析拥堵问题: 囚徒困境模型分析。囚徒困境是指两个被捕的囚徒之间的一种博弈,解释了为什么合作对双方都有利时,保持合作也是困难的,具体内容如下。警方逮捕了甲、乙两名嫌疑犯,但没有足够的证据证明二人有罪。于是警方分开囚禁两名嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证指证对方犯罪(即背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(即双方合作),则二人同样判监1年。若二人都互相背叛,则二人分别判监8年 从上图的四种行动选择组合中,我们可以看出(沉默、沉默)是帕累托最优的,“背叛”是任一犯罪嫌疑人的占优战略,而(背叛、背叛)是一个占优战略均衡。 囚徒困境模型属于博弈论中的非零和博弈,表明个人最佳选择并非团体最佳选择。城市交通拥堵问题的本质是“公共地悲剧”。在共享公有物的社会中,每个人,也就是所有人都追求各自的最大利益,这就是悲剧的所在。因为对公共资源的无限制和过度使用,必然会给所有人带来毁灭。在城市交通领域,由于私人小汽车无限制的发展,造成了整个城市,特别是

《经济学原理》读书报告

《经济学原理—微观经济学分册》读书报告 张行 08信管一班 2011-7-31 一、书名:《经济学原理—微观经济学》第五版 二、著者:N·格里高利·曼尼(N·Gregory·Mankiw)(梁小民梁 砾翻译) 三、出版社:北京大学出版社 四、页数:540 五、内容大意: 这本书共分为七篇,二十二章。书本还有下册,只是在图书馆没有借到,索性只能观摩这一本书了。 第一篇:【导言】,可以说是全书的精髓所在。该篇包含了三章,第一章:【经济学的十大原理】;第二章:【像经济学家一样思考】;第三章:【相互相关性与贸易的好处】。其中第一章的十大原理几乎是后边经济学理论的基石。其次是要了解到经济学家是怎么样看待问题的。 第二篇:【市场如何运行】。该片包含有三章,第四章:【供给与需求的市场力量】;第五章:【弹性及其应用】;第六章【供给、需求与政府政策】。这篇也可以说是一个基础了,这里充分的介绍了市场中“看不见的手”以及需求,供给的弹性和政府政策的关系。 第三篇;【市场和福利】。该篇包含有三章,第七章:【消费者、生产者与市场效率】;第八章:【应用:赋税的代价】;第九章:【应用国际贸易】。这篇介绍了基础知识消费者剩余,生产者剩余,以及市场效率。接着就介绍了知识方向的纵向延伸及其应用。 第四篇:【公共部门经济学】。第十章:【外部性】;第十一章:公共物品和公共资源;第十二章,【税率的设计】。这一部分,可以从中看到一些可以改变经济的一些因素。比如说税收,还有外部的因素,污染以及环境。其中还有介绍到公共物品与公共资源的介绍。“搭便车问题”这里挺好看的。

第五篇:【企业行为与产业组织】。第十三章:【生产成本】;第十四章:【竞争市场上的企业】;第十五章:【垄断】;第十六章:【垄断竞争】;第十七章;【寡头】。这一篇告诉了我们经济学家看到成本与会计看到的成本有明显的不同,经济学家研究的更为细致,把成本看出两部分有显性和隐性之分。其次还对竞争和垄断做了介绍。其中博弈论在寡头中知识很是有用。他可以解决很多的问题。 第六篇:【劳动市场经济学】。第十八章:【生产要素】;第十九章:【收入与歧视】;第二十章:【收入不平等与贫困】。这篇介绍到了与我们息息相关的东西,收入。这里可以解释现实社会中那些不平等与贫困的原因,值得有看几遍。 第七篇:【深入研究的论题】。第二十一章:【消费者选择理论】;第二十二章:【微观经济学前沿】。这一篇和我们专业课《信息经济学》很相似,它介绍了逆向选择,道德风险,以及各种定理。这一篇感觉挺精妙的。 六、读后心得感想: 在图书馆无意看到这本书,开始只是随便看看,只是没想到看着觉得这本 书说挺吸引人的,首先是作者给我们地位就是一个入门级的经济学者。开始会觉得这里我都懂,而且作者举了很多身边有趣的例子,让我感觉到经济学就在我的身边一样。花了一个多月终于把它给看完了,虽然其中有很多的地方自己没有认认真真的其花时间去学习,只能说比较深入而且很专业的知识我是没有去深入的学习了。作者通过浅显易懂的案例,让经济学学习起来更加的得心应手,真正的生活中的经济学。 这本《经济学原理》第一章的十大经济学理论,这里有必要摘录出来:一、人们如何做决策。1:人们面临权衡取舍;2:某种东西的成本是为了得到它所放弃的东西;3:理性人考虑边际;4:人们会对激励做出反应;二、人们如何相互交易:5:贸易可以使每个人的状况都变得跟好;6市场通常是组织经济学活动的一种好方法;7:政府有时可以改善市场结果;三、整体经济如何运行,8:一国的生活水平取决于它所生产物品与劳务的能力,9:当政府发行了过多的货币时,物价将会上升;10:社会面临通货膨胀与失业之间的短期权衡取舍。

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论试题3答案

SPE 315 Game Theory Problem Set 3 Solutions Professor Derek Liu 1.a) The normal form of the game is: The game is zero-sum. b) The extensive form version of the simultaneous move game is: (the green dashed line indicates the information set) c) The unique NE is in mixed strategy, i.e. the mutual best response is to randomize the strategy choices. Prisoner plays Climb Wall with probability .5 and Dig Tunnel with probability .5; Warden plays Guards at Wall with probability .5 and Regular inspections with probability .5. d) The extensive form version of the sequential move game where the warden is the first mover is

The backward induction solution is that if Warden chooses to guard the wall, Prisoner chooses Dig Tunnel and if Warden chooses regular inspections, Prisoner chooses Climb Wall. The solution will be different, as the Prisoner can perfectly condition on the Warden’s behavior and so the Prisoner can always win the game. 2.This game is a Prisoner’s Dilemma. a) Here is one possible parameterization of the game: b) Both players have a dominant strategy: offer rewards card. c) In equilibrium, Rita’s cool card will also offer 1 free ice cream for every 10 purchased. If it offered a better deal, Bruster’s would have to match it and if it offered a worse deal, it would lose business to Bruster’s. 3.Marienbad a) Obvious: player 1 takes a match from 1 of the two piles. Since the last player to pick up a match loses the game, and each player must pick up a number of matches from one of the two piles, player 2 will lose. b) If m=n>1, let us write the initial configuration of matches in the two piles as (m,m). Suppose after player 1’s first move the configuration is (k,m), where k is a number between 0 and m-1 (players must remove a least one stick from one pile). If k=0, player 2 can then remove m-1 matches from the second pile, so that when it is player 1’s move, the configuration of the two piles is (0,1); in this case player 2 wins the game. If k>0, then player 2 moves the game to (k, k) (mimics the choice of player 1 and equalizes the two piles). Now it is player 1’s turn again; suppose he moves the game to (j,k). If j=0, player 2 removes k-1 matches from the second pile and wins the game. If j>0 player 2 moves the game to (j,j). In this fashion, after no more than m-1 moves by player 1, the game must arrive at a configuration such as (1,p), where p>1 and it is player 2’s move. Player 2 then removes the p sticks from the second pile and wins the game. (Note: for simplicity I assumed that player 1 always removes from the first pile, but this assumption is not crucial since every time player 1 makes a move --unless he has eliminated all the sticks from one of the piles--the two piles have equal numbers of sticks due to the strategy of player 2).

电大 《经济学与生活》第2次平时作业答案

电大《经济学与生活》第2次平时作业答案 一、配伍题(将名词解释的标号填在名词前的括号里。每小题1分,共10分) (B)1.总效用 (C)2.边际效用 (A)3.收入效应 (D)4.替代效应 (H)5.二级价格歧视 (F)6.纳什均衡 (E)7.博弈论 (I)8.三级价格歧视 (G)9.边际效用递减规律 (J)10.巿场失灵 A.由于商品价格变动而引起的消费者实际收入的变动对需求数量产生的影响。 B.消费者在一定时间内消费一定数量商品或服务所带来的满足程度的总和。 C.在一定时间内消费者增加一个单位商品或服务所带来的新增效用。 D.指商品价格的变动而引起的相对产品价格变化对商品需求数量产生的影响。 E.研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。 F.所有参与人最优策略组成的策略组合 G.一个人连续消费某种物品时,随着所消费的该物品的数量增加,其总效用虽然相应增加,但物品的边际效用有递减的趋势。 H.即垄断厂商了解消费者的需求曲线,把这种需求曲线分为不同段,根据不同购买量,确定不同价格,垄断者获得一部分而不是全部买主的消费剩余。

I.垄断厂商对不同市场的不同消费者实行不同的价格,在实行高价格的市场上获得超额利润。 J.指巿场无法有效率地分配商品和劳务的情况。 1.消费者从物品与劳务的消费中得到的满足程度称为(B)。 A.欲望B.效用 C.边际效用 D.偏好2.某人愿意用20元买第一件衬衫,愿意用35元买头二件衬衫。第二件衬衫的边际效用是(C)。 A.55 B.35 C.15 D.27.5 3.同一条无差异曲线上的不同点表示(B)。 A.效用水平相同,所消费的两种商品组合比例也相同 B.效用水平相同,所消费的两种商品组合比例不同 C.效用水平不同,所消费的两种商品组合比例也不同 D.效用水平不同,所消费的两种商品组合比例也相同 4.在消费者收入与商品价格既定条件下,消费者所能购买到的两种商品数量的最大组合的线叫做(B)。 A.无差异曲线B.消费者预算约束线 C.等产量线 D.企业预算线 5.消费者剩余是消费者的(B)。 A.实际所得B.主观感觉

(整理)合作竞争读书笔记.

《合作竞争》读书笔记 Yhq5115 在美国,包括我们在内的许多人都把研究《孙子》作为学习战略的必经之路。 比别人做得更好或更省钱是创造和获取价值的一个重要手段,但也不尽然。就拿微软公司来说,它之所以取得巨大的成功就是由于英特尔公司的存在及它们产品之间的互补性。 你不需要熄灭别人的灯光以使自己的明亮。 博弈论直指所有问题的关键:找到正确的战略并做出正确的决策。博弈论是在变化的商业环境中求生的思想方法。 我们认为博弈论通过以下五个要素来描述任何竞争:参加者、附加值、规则、战术和范围。简称PARTS。 真正的成功来自于主动地改变你参与的游戏:按照你的意愿改变游戏,而不是参与你发现的游戏。 如果商业是一种游戏,那么谁是参与者?答案是:顾客、供应商、竞争者还有互补者。 互补者的定义:如果顾客在同时拥有你和其他参与者的产品时获得的价值,要高于单独拥有你的产品时的价值,那么这个参与者就是你的互补者。 价值链:顾客 竞争者——公司——互补者 供应商 竞争者的定义:和互补者正好相反。 价值链的对称性,顾客和供应商扮演了对称的角色,竞争者和互补者扮演了镜像的角色。 从纸牌游戏到商业游戏,甚至是人生游戏,弄清在每个游戏中谁拥有主动权的关键就是附加值。你的附加值=你参与游戏时市场的大小—你不参与游戏时的市场的大小 如果我加入游戏,我会是游戏增加什么?不要只考虑自己所能接受的最低价,一定要考虑其他人为了让你参加游戏会付给你多少。 一份关于改变的清单 为了帮助你更加有效地改变游戏,我们列出了一份进行自我诊断的问题清单。这些根据PARTS模式排列的自我检查清单 PARTS模式列出的问题是很经典的。 关于参与者的问题 你是否已经为自己的机构画出了价值链图?并注意使这份参与者名单尽可能完整。 1、在你和你的客户、供应商、竞争者及互补者的关系中,合作与竞争的机会各是什么? 2、你是否愿意改变参与者的阵容?特别是,你希望在游戏中引入哪些新的参与者? 3、如果你成为一个游戏的参与者,谁应该是赢家,谁应该是输家? 关于附加值的问题: 1、你的附加值是什么? 2、如何提高你的附加值?特别是,你能创造忠实的客户和供应商吗? 3、游戏中其他参与者的附加值是什么?你是否愿意去限制他们的附加值? 关于规则的问题:

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论第2次作业

第2次作业 1.在三寡头的市场中,市场的逆需求函数为三家产量之和Q Q a p ,-=,每家企业的不变边际成本为c ,固定成本为0。如果企业1首先选择产量,企业2和企业3观察到企业1的产量后同时选择产量,则均衡时的市场价格。 给定企业1的产量q1,企业2和企业3的最优化问题分别为 ()23210m ax 2q c q q q a q ----≥, ()33210m ax 3q c q q q a q ----≥从而得到企业2和企 业3的最优反应函数为q 2=231q q c a ---,q 3=2 21q q c a ---,联立得纳什均衡为:q N 2=31q c a --,q N 3=3 1q c a --.给定企业2和企业3的最优反应,企业1的最优化问题为:()13210m ax 1q c q q q a N N q ----≥,由此得企业1的最优产量为 2 c a -,q 2=q 3=6 c a - 2、两个寡头企业进行价格竞争博弈,企业1的利润函数是q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1的价格,q 是企业2的价格。 求: (1)两个企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡; (4)是否存在参数c b a ,,的特定值或范围,使两个企业都希望自己先决策?

(1):(a b-c ,b ) (2):(a b-c ,b ) (3):(a 2/2+ab-c ,a/2+b ) (4):a<0,b>-a/2,c

博弈论读书报告

《妙趣横生博弈论》读书报告 ——山东企业三期:孙雯学校安排读了这么多的书,本以为《妙趣横生博弈论》会很容易懂,但看来看去还是一知半解,仅能就书中一些自己比较认可的观点跟大家分享一下了。 一、博弈论给我们最重要的教训就是必须理解对方的想法。 人们在本性上一般倾向于以自我为中心,只关注自己的理解和自身的需要。但如果想提高到“策略的艺术”的层次,那就不能囿于自我中心,而是必须要理解他人的立场、他人的观念以及他们看重什么,并运用这种对对手的理解来指导自己的行动。在这种理解的基础上,怎样很好地把竞争和合作结合起来,就是一种艺术。 博弈论本来就是科学的理论和行为的艺术。它不应该是沉闷的,而应该是生动的;它不应该只是乏味公式,而应该拥有丰富的情感;它不应该只局限于竞争,更应着眼于通过竞争展开合作。 博弈论不应该被理解为阴谋诡计,不应该被理解为小聪明,不应该被理解为厚黑学,不应该被理解为你死我活的权谋术。博弈论应该是展开有效竞争与合作的理论,应该是大智慧,应该是个人理性融入社会的艺术。对于那些试图探求真实世界现象之因缘的人们来说,博弈论也是理解高度互动的人类社会的一种思想方法和分析工具。 二、博弈的“术”与“道” 如果只想着把博弈论用于人际斗争,那只能算是博弈之术;只有理性地融入社会,才是博弈之道。“术”的博弈只是嵌入在“道”的博弈中的一个小博弈,如果只关注于“术”而忘却于“道”,无异于只见树木、不见森林,或可一时得利,却可能对个人的长期利益和更大的成功产生至为糟糕的影响。正如两位作者在书中屡屡提到:人生中总是存在更大的博弈,因此个人的决策不应该只着眼于一个小博弈的胜负。能够看到多大、多远的博弈,取决于个人的胸襟和眼光。从某种意义而言,他们所谓的小博弈与更大的博弈之分,正是博弈的“术”与“道”之分。 不得民心的暴君不可能长期控制一个数目庞大的人群,一个暴徒出现,就足以让整个校园陷入恐慌,但是如果整个校园的人归于理性,团结一致对抗暴徒,就一定不会引起恐慌。 这两个例子表明只要大多数人同时采取行动,其实是很容易取得成功的。 不过,统一行动少不了沟通与合作,偏偏沟通与合作在这个时候变得非常困难;而且压迫者深知群众的力量有多大,所以还会采取特殊的措施,阻止他们的沟通与合作。因为每个人如果都按照自己的利益来行动,结果对集体来说可能是灾难性的。囚徒困境可能是博弈论

博弈论作业

课程名称:信息经济学与博弈论课程编号:SX0071F23 课程类型:非学位课考核方式:考查 学科专业:管理科学与工程年级:2014 级姓名:学号:10076140185 河北工程大学2014 ~ 2015学年第2学期研究生课程论文报告 基于GA一RL的进化博弈求解主从博弈结构的供应链协调问题摘要:供应链协调问题多数基于主从博弈结构建模,但如果研究对象是相对复杂的供应链结构,理论求解主从博弈问题就变得困难。因此从求解一对一的供应链协调问题开始,针对主从博弈问题的特点,利用个体学习的进化博弈仿真手段,设计了经销商利用经验分布的预期随机需求的信念更新模式与最优反应的决策模式,为生产商分别设计了基于强化学习的信念更新模式与基于遗传算法搜索策略空间的决策模式,并将两者有机结合,取得了博弈问题的均衡解并且验证该解与理论求解结果一致,为进一步求解复杂问题提供了新的途径。 关键词:供应链协调;进化博弈论;强化学习(RL);遗传算法(GA) Coordinating supply chain of Stackelberg game model based on evolutionary game with GA一RL Abstract: Problems of coordinating supply chain are based on Stackelberg game model, but if research object is complex supply chain, it is difficult to find equilibrium of Stackelberg game ,so evolutionary Game theory was introduced. According to characteristics of leaders and followers in Stackelberg game model, learning Meehan is designed for each Player respectively. An algorithm of reinforcement learning combined with genetic searching is proposed for leaders, and a learning model of best一reply is designed for followers(retailers). Keywords: supply chain coordination; evolutionary game theory; reinforcement learning(RL);genetic algorithm(GA) 1引言 供应链协调问题是研究如何订立协调机制使分散控制的供应链中个体与整体之间的目标一致,解决供应链中企业个体自身的优化目标与供应链整体的最优解相冲突的状况。目前关于不同协调机制研究可以分为以下几类,一类是根据数量给予价格折扣,如根据经销商的销售量给予目标折扣(Sale re-bate)的问题[1],根据订货量给予线性折扣(Quantity discount)的问题[2];第二类是根据

博弈论的书心得体会

博弈论的书心得体会 篇一:阅读博弈论类书籍的心得体会 阅读博弈论类书籍的心得体会 图书情报宋静思 最近阅读的书目主要围绕在博弈论领域,由浅入深的从博弈论平话类书籍到博弈论的理论应用类书籍都有一些涉猎。近一个月来我所阅读的书目主要有王则柯的《新编博弈论平话》、高志明的《生存博弈》、黄涛的《博弈论教程—理论、应用》以及张维迎的《博弈论与信息经济学》。由于个人能力与知识储备的限制,对以上书目的认识理解和心得也是有限的,下面我仅对上述书目中能够引起我思考的一些理论和案例展开分析并阐述我的一点见解,以及提出我所认为的这些博弈理论可以分析的社会现象。 一、对博弈论平话类书籍的心得 首先从王则柯教授的《新编博弈论平话》和高志明教授的《生存博弈》这两本书使我我深刻的认识到博弈论作为一种科学的思维方法对我们在日常生活中科学的做出决策有重大的意义。它们都是以比较浅显的例子和故事普及博弈论的一些知识和方法,阐发博弈论的一些思想和观念。从囚徒困境、情侣博弈、诺曼底登陆模拟和慕尼黑谈判模拟等能够引起读者兴趣的故事入手,介绍静态博弈、动态博弈、纳

什均衡、零和博弈、双赢对局、帕累托优势、子博弈精炼纳什均衡等博弈论的基本概念,以及劣势策略消去法、相对优势策略下划线法、确定混合策略纳什均衡的反应函数法、动态博弈的倒推法等博弈论基本方法,在以上两本书的论述中很少使用到高等数学的知识,这两本书是使我对博弈论产生兴趣的启蒙老师,帮助我了解博弈论的若干初步知识。 从最初对这两本书的阅读我真正理解了什么是博弈决策,就拿我们生活中报考什么学校、从事什么职业、选择何种方式度过周末闲暇时光等这些例子来说,之所以称之为博弈决策,是因为在这些例子当中,我的身边往往存在和我情形相似的决策者,我们的思维和行动相互之间产生着很微妙的互动影响。博弈论研究的目的,就是要清晰地揭示蕴涵于这种互动影响中的基本概念和原理,从而帮助我们建立策略思维的意识。 看过囚徒困境后,我明白了为什么寡头企业不选择在市场上结盟而是竞相采取低价策略企图抢占更多的市场份额;又为什么多数情形是非合作博弈。虽然通过囚徒困境的博弈分析我可以理解上述现象产生的原因,然而究其根本原因,是什么导致了囚徒困境呢?这不禁引发了我的思考。设想如果两个罪犯充分相信同伙遵守最初的约定死咬着抵赖会有最后的困境出现么?如果联盟内部成员相信彼此遵守约定

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

相关主题
文本预览
相关文档 最新文档