微经课程小论文-从囚徒困境看纳什均衡和帕累托最优
- 格式:docx
- 大小:15.80 KB
- 文档页数:2
(一)囚徒困境理论在学习和生活中,我们会遇到诸多面临决策,进退两难的问题,那么如何决策呢?不同的策略带来不同的损益,有时当博弈双方都以自己的最大利益为策略博弈时,结果相反,时双方都陷入自己所要逃避的困境,这便是囚徒困境!囚徒困境经典案例①:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。
若二人都互相检Array举(相关术语称互相“背叛”),则二人同样判监8年。
嫌疑人甲、乙双方均不知对方的策略,且都是自私利己之人。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年。
(二)生活中的囚徒困境博弈在现实生活中不出不在。
博弈双方大到国际贸易国与国之间的竞争,小到个人与个人之间的经济交易;动物之间同样也存在博弈,甚至植物在阳关下吸收养分也存在博弈。
有竞争就有博弈,有交易就有博弈,博弈渗透到生活中的每个角落。
参与博弈的双方或多方如何采取策略,保障自己最大的利益和最小的损失;往往利益最大的也是风险最大的,一旦失败,损失也是最大的,如何决策,这便使得博弈人陷入“囚徒困境”。
博弈的囚徒困境覆盖面极广,涉及军事决策,政治手段,企业经营,市场策略,生活理财等诸多方面。
囚徒困境和纳什均衡当对手知道了你的决定之后,就能做出对自己最有利的决定------普林斯顿大学数学家约翰·纳什囚徒困境著名的“囚徒困境”,是纳什均衡理论的经典案例。
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供一下相同的选择:若有一人认罪并作证检控对方(背叛对方)而对方保持沉默,此人将立即获释,沉默者将判监禁十年。
若两人都保持沉默(互相合作)则两人同时被判监禁半年。
若两人都互相检举(互相背叛)则两人同时监禁两年。
如同博弈论的其他论证,囚徒困境假设每个囚徒都是利己的,激斗寻求自己的最大利益。
囚徒到底应该选择哪一项策略,才能将自己的刑期缩至最短?两名囚徒由于相互隔离监禁,并不知道对方的选择。
试想困境中两名理性的囚徒会如何选择:若对方沉默,背叛会让我获释,所以对方会选择背叛。
若对方背叛我,我也要指控对方才能得到较低的刑期,所以也是这样会选择背叛。
二人面对的情况一样,所以二人的理想思考会得到相同的答案----选择背叛。
背叛是两种策略之间的支配性策略。
因此这场博弈中唯一可能达到的纳什均衡就是两人选择同时背叛对方,结果两人同时服刑两年。
这场博弈的纳什均衡,显然不是最优的解决方案。
如果两人都选择沉默,两人都只会被判刑半年。
但根据以上假设,两人均为理性的个人,均衡状况回事两个囚徒都选择背叛。
这就是“困境”所在。
寻找“纳什均衡点”在现实生活中,纳什均衡理论影响着人们的行为。
比如,在有些国家,报亭既无管理人员也不上锁,买报纸的人在自行放下前后拿走报纸。
当然某些人可能取走报纸却不付钱(背叛)但由于大家意识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。
在商业活动中,也会出现各种各样的囚徒困境的例子。
两个公司相互竞争,他们的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。
但若二者同时期发出质量类似的广告,收入增加很少但成本增加。
走出“囚徒困境”囚徒困境作为博弈论中的一个经典范例,其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视,辩证的看待这一研究现象,是促进人们深入研究相关社会现象的一种特殊的思维路劲和方法。
一、囚徒困境经典案例分析囚徒困境的内容是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判2年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。
“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
但是这样的分析是基于单次博弈的基础之上,而在重复的囚徒困境中,博弈会被反复的进行,因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
二、类似囚徒困境的经典案例分析在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。
帕累托最优状态名词解释微观经济学示例文章篇一:嘿,同学们!今天咱们来聊聊一个听起来有点神秘的词儿——帕累托最优状态。
这可是微观经济学里的重要概念哟!你们想啊,咱们的生活就像一个大大的拼图,每个人、每件事都是拼图里的一块。
帕累托最优状态呢,就像是把这个拼图拼得完美无缺的时候!比如说,有一个果园,果农伯伯们在里面种水果。
如果能让每种水果都长得又大又好,果农伯伯能赚好多钱,同时买水果的人也能买到又新鲜又便宜的水果,这是不是很棒?这就是一种帕累托最优状态呀!再打个比方,就像咱们在操场上做游戏。
如果每个同学都能玩得开开心心,没有人觉得不公平或者不开心,这难道不就是一种特别好的状态吗?这跟帕累托最优状态也有点像哟!那到底怎么才能达到这个神奇的帕累托最优状态呢?这可不是一件容易的事儿。
就好像要让一群调皮的小猴子乖乖排好队一样难!有时候,资源分配不合理,有人得到的多,有人得到的少,这就没法达到帕累托最优状态啦。
比如说,有一家工厂,老板只给少数工人多发工资,其他人却很少,那大家工作能有积极性吗?肯定不能呀!还有啊,如果市场上的竞争不公平,有的商家靠不正当手段赚钱,那其他诚实经营的商家不就亏了吗?这也不是帕累托最优状态呀!咱们想想,如果咱们的班级里,老师只表扬几个同学,忽略了其他努力的同学,大家心里会舒服吗?肯定不会呀!这就不是帕累托最优的班级状态。
所以说,帕累托最优状态就是要让大家都能在一个公平、合理的环境里,各得其所,各尽其能。
总之,帕累托最优状态虽然有点复杂,但咱们明白了它,就能更好地理解这个世界的经济运行啦!它就像是一把神奇的钥匙,能帮我们打开经济学的神秘大门哟!示例文章篇二:小朋友可能不太懂这么复杂的经济学名词呢,不过让我来试着给您讲讲吧!您知道吗?在微观经济学的世界里,有一个叫“帕累托最优状态”的神奇东西。
这就好像一场超级有趣的游戏,只不过这个游戏不是我们在操场上跑来跑去的那种,而是在经济的大棋盘上进行的。
博弈论-纳什均衡与帕累托最优今天我要开始讲博弈论。
至于为什么要讲博弈论呢,我的思路是这样的:因为现在的生意环境已经不是通过信息的不对称来获取利益了。
现今的市场环境越来越扁平化,所有的格局都是非常明朗的。
之前的那种生意“套路”已经越来越走不通了。
那有没有能指导现在市场环境的方法论呢?当然有,这个方法论就是博弈论!博弈论讲的是大家在规则清晰,大家都是聪明人,每个人都是希望自己利益最大化的基础下,如何理性的在社会中做出决策的理论。
理性的决策有时候有点不得已,明朗规则之下,还要考虑对手的反应,基本上并没有太多的选项。
博弈论通过明朗规则下的有限选项将会导出一个似乎是必然的有限结局,在大家都为了现有局面而维持的博弈策略组合,就是纳什均衡。
举个例子我们发现,商家都喜欢扎堆,从而导致同质化竞争的局面,比方说肯德基和麦当劳,他们基本都是在核心地段相隔不远的地方开设店面。
扎堆的现象就是一个纳什均衡,如果一个现象在社会长期稳定的存在,那它对参与各方来说都一定是一个纳什均衡的局面。
纳什均衡的关键点不在于市场格局下竞争各方的最优化,而在于每个参与者都不愿意单方面改变,这是整体的不理性,却是每个参与方的理性。
那么我们如果要对现有的市场进行优化就需要其他的介入,毕竟像商家扎堆的现象对于商家和消费者似乎都不是最好的局面。
最好的局面如何改进呢?帕累托是一个意大利的经济学家。
帕累托以不会影响每一个参与者的利益,但是其他各方更有利的方向通过某种方法,调试成为对于市场环境、竞争各方、消费者都是更优的局面就是帕累托改进。
如果帕累托改进到了无法增加各方及总体利益的余地,那此时的局面我们称之为帕累托最优。
但是这是一个反常规的状态,因为市场的参与者的准入还有消费者的分布是不能控制的,也就是总会有人通过违反规则而破坏帕累托最优,这对市场及消费者还有其他参与者的利益都不利,但是这对违反规则的参与者有利,所以这将会是不稳定的局面。
所以我们有时候理解长期存在的“不合理”局面恰恰是各方的一个纳什均衡,比方说大家都向往和平与安定却长期存在黑手党或者军队这样的暴力机构,现存的种种“不合理”局面就是长期博弈与社会演化的某种必然,现在的社会体就是一个巨大但是稳定的纳什均衡体系。
请论述帕累托最优标准的不足首先,帕累托最优只是帕累托提出的一种伦理学的个人观点,它是人类无数价值观中的一种。
某些更重视财富平等分配的哲人将不会认同帕累托原则,而是可能提出以下替代性的
标准:1.一定要一切人的情况都以相同的比例得到改善。
2.一定要一切人的情况都得到改善,而且穷人获得的幅度必须大于富人。
3.一方的状况改善而另一方的情况至少没有恶化的原则虽然可行,但获得改善的一方必须是穷人,维持原状的是富人。
在规范意义上森教授因此批评帕累托的主张在伦理学内涵上只是相当“朴素的”而已。
罗尔
斯也明言:“单靠(帕累托的)效率原则不能作为对正义的诠释。
因此,它必须以某种方式被补充。
如今,在自然的自由之体系中,效率的原则受到某些背景制度的约束,一旦这些约束被满足,任何由此产生的有效率的分配都被接受为是正义的。
”所以,帕累托最优意义上的配置效率因为其规范功能上的缺陷不可能在法律价值体系中取得排他性的地位。
其次,帕累托最优意义上的配置效率能否在某个法规如反垄断法的价值体系中取得排他性地位呢?如波斯纳等认为的即使公平等其他价值应该受到关注,那也主要是体现在财富分配等领域,不能在反托拉斯法的原则与程序框架下实现这一目标。
但这样的断言也是过于一厢情愿了,无论从谢尔
曼反托拉斯法发生时的价值考量还是从罗宾逊•帕特曼法的立法目的看,都是将实质公平作为立法需要考量的首要因素确立下来,而不是配置效率。
说到底,立法有其自身的规律,从来不会为学者所支持、呼吁的某个价值主张而左右。
纳什均衡及帕累托改进一、引言纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益①,则此策略组合被称为纳什均衡。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态,就是一个例子。
在纳什均衡下,我们能进行帕累托改进②,即在没有使任何人境况变坏的情况下,使得至少一个人变得更好。
二、消防安全博弈(一)消防安全博弈简述企业的消防安全投入是企业固定生产成本的组成部分,它意味着在为企业和社会带来效益的同时所花费的代价。
作为追求利润最大化的企业,如何确定自身的最优消防投入,也是很值得研究的。
首先从竞争企业消防安全投入决策来进行分析。
假设市场上仅有甲乙两家竞争企业,两个企业的雇主和雇员均乐于建立安全的工作环境,两个企业同样面临两种选择:安全或不安全。
即使企业和职工双方均希望有安全的生产环境,会进行消防安全投入,但是由于市场竞争更为紧迫时,企业鉴于担心经营失败或由于利润的诱惑,则会出现不同的情况。
以下为两企业消防安全投入的支付①即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的。
②是指在某种经济境况下如果可以通过适当的制度安排或交换,至少能提高一部分人的福利或满足程度而不会降低所有其他人的福利或满足程度,即一种制度的改变中没有输家而至少能有一部分人赢。
矩阵:从支付矩阵中看,如果企业1选择投入,其支付为0,此时企业2选择不投入时的支付为1,高于选择投入时的支付;企业1不投入时,企业2也不投入,此时它们支付相当。
所以不论企业1如何选择,不投入是企业2 的占优战略,同样企业1的占优战略也是不投入,此时达到纳什均衡的特殊情况——占优战略均衡,占优战略组合为(不投入,不投入)。
如果两公司独立决策(非合作),则消防安全投入将减少。
因为这会减少生产成本,降低产品价格,提高企业竞争力。
火灾事故发生的不确定性和事故结果的外部性,进一步增加了企业不进行消防投入的可能性。
“囚徒困境”问题探讨现实世界的资源是有限的,而人的需求和欲望却是无限的。
为了实现社会的福利最大化,就需要有效地配置各种经济资源。
然而,在传统“理性人”的假设下,自利人为了自身利益而展开争夺,最终形成的纳什均衡结果,往往陷入“囚徒困境”的无效率境地,造成资源的无效配置和浪费。
为此,试从合作博弈和交易费用的视角探讨帕累托改进的路径,寻找“囚徒困境”的破解方法,以图实现帕累托最优结果。
标签:囚徒困境;帕累托最优;合作博弈;交易费用1 引言传统经济学中,“理性人”假设是一切经济分析的基础,每个人都是聪明绝顶且自私自利,为实现自身效用最大而努力。
然而,最终的纳什均衡解却往往是无效率的,不仅没有实现自己的效用最大,也造成社会福利的损失,出现个体理性和集体理性之间冲突局面,既不是帕累托最优,甚至也不是希克斯-卡尔多有效的。
根据达尔文《物种起源》中的论点,可以假设:所有的生命个体在面临选择时,都是自私自利的,完全忽视其他个体的利益,没有悲悯之情。
但是,即便是这样的起点,也会有类似于兄弟姐妹的伙伴关系的出现,并且实现个体利益和集体利益的协调。
“囚徒困境”并非是不可破除的魔咒,只要找到合适的能够影响参与者收益和行为的有效机制,就能走出困境的阴霾,实现帕累托最优。
同时,应该认识到:囚徒困境中的参与者并非是“真正的理性人”,“囚徒困境”只是两个自私自利的人“聪明反被聪明误”的结局,不是真正的“聪明绝顶”的人所应该做出的决策。
如果是真正的“理性人”,他们就应该掌握博弈论的基本知识,能预计到自己的处境,最后两个囚徒都会毫无顾忌的选择抵赖,从而实现另一个均衡(并不坦白,不坦白)。
此外,如果博弈的参与者是利他人或为己利他,也可以有效突破困境。
2 “囚徒困境”模型“囚徒困境”是博弈论研究中虚构的一个经典案例,最早是在20世纪50年代,由美国Rand公司的Dresher和Flood采用。
在之后,鉴于“囚徒困境”模型在社会科学研究方面的作用,普林斯顿大学的教授Albert Tucker逐渐将它推广开来。
微观经济学作业
-从囚徒困境看纳什均衡和帕累托最优纳什均衡又称为非合作赛局平衡,是博弈论的一个重要概念。
根据帕金的《经济学》一书对于纳什均衡的定义为:参与者A在给定B行为的条件下采取最好的行为,B也在给定A行为的条件下采取最好的行为。
纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。
帕累托最优,也称为帕累托效率,是指资源分配的一种理想状态,即假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,也不可能再使某些人的处境变好。
换句话说,就是不可能再改善某些人的境况,而不使任何其他人受损。
需要指出的是,帕累托最优只是各种理想态标准中的“最低标准”。
也就是说,一种状态如果尚未达到帕累托最优,那么它一定是不理想的,因为还存在改进的余地,可以在不损害任何人的前提下使某一些人的福利得到提高。
但是一种达到了帕累托最优的状态并不一定真的很“理想”。
比如说,假设一个社会里只有一个百万富翁和一个快饿死的乞丐,如果这个百万富翁拿出自己财富的万分之一,就可以使后者免于死亡。
但是因为这样无偿的财富转移损害了富翁的福利(假设这个乞丐没有什么可以用于回报富翁的资源或服务),所以进行这种财富转移并不是帕累托改进,而这个只有一个百万富翁和一个饿死乞丐的社会可以被认为是帕累托最优的。
这里可以与古典功利主义的标准做一比较。
按功利主义的标准,理想的状态是使人们的福利的总和最大化的状态。
如果一个富翁损失很少的福利,却能够极大地增加乞丐的福利,使其免于死亡,那么社会的福利总和就增加了,所以从功利主义的角度看,这样的财富转移是一种改善,而最初的极端不平等状态则是不理想的,因为它的福利总和较低。
可以看到,帕累托改进要求在提高某些人福利的时候不能减少任何一个人的福利,而功利主义则允许为了提高福利总和而减少一些人的福利。
囚徒困境的大意是囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判一年,而对方将被判刑十年;如果两人均招供,将均被判刑三年。
如果两人均不招供,将最有利,只被判刑二年。
于是,两人同时陷入招供还是不招供的两难处境。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳许均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
在上述囚徒困境模型中,如果甲相信乙招供,那么他的最佳策略是招供,而如果乙相信甲招供,那么他的最佳策略仍是招供。
这就是一个纳什均衡,它是“自确定”的。
但是,这个纳什均衡不是帕累托最优。
根据帕累托最优的定义,显然,在上述囚徒困境模型当中,甲乙两个人都从理性的角度出发,追求自身效用的最大,结果是双方不合作,都认罪了。
也就是说,实现了纳什均衡。
但是,如果甲与乙合作,产生的结果要比双方不合作好得多。
也就是说,如果双方合作,就存在帕累托改进那么,为什么两人不敢合作呢?甲会这样推理:“假如乙不招供,我只要一招供,只要坐牢一年,而不招供却要坐牢2年,显然招供比不招供好;假如乙招供了,我若不招供,则要坐牢10年,招供了只坐3年牢,显然还是招供的好。
可见,无论乙招供与不招供,我的最佳选择都是招供。
”同理,乙也会如此推理。
于是,谁也不敢选择合作。
所以,在囚徒困境这个模型当中,从个人的理性出发,推导不出帕累托最优。
由此可见,纳什均衡只是一种平衡,而不是一种帕累托最优,不是一种完美的结局。
根据帕累托最优,也许两个都选择不招供会是一个更好的选择。
关于纳什均衡有着很大的局限性,它的研究是针对两三个节点的小规模博弈论。
这个假设的不完善处,可能比假设大家都是合作的更严重。
因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。
既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。
因此即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题
而帕累托最优,如同上面指出的,一个帕累托最优的经济系统只是在“最低”的意义上是“理想”的,并不能保证其中没有贫困或严重的贫富差距。