微经课程小论文-从囚徒困境看纳什均衡和帕累托最优
- 格式:docx
- 大小:15.80 KB
- 文档页数:2
(一)囚徒困境理论在学习和生活中,我们会遇到诸多面临决策,进退两难的问题,那么如何决策呢?不同的策略带来不同的损益,有时当博弈双方都以自己的最大利益为策略博弈时,结果相反,时双方都陷入自己所要逃避的困境,这便是囚徒困境!囚徒困境经典案例①:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。
若二人都互相检Array举(相关术语称互相“背叛”),则二人同样判监8年。
嫌疑人甲、乙双方均不知对方的策略,且都是自私利己之人。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年。
(二)生活中的囚徒困境博弈在现实生活中不出不在。
博弈双方大到国际贸易国与国之间的竞争,小到个人与个人之间的经济交易;动物之间同样也存在博弈,甚至植物在阳关下吸收养分也存在博弈。
有竞争就有博弈,有交易就有博弈,博弈渗透到生活中的每个角落。
参与博弈的双方或多方如何采取策略,保障自己最大的利益和最小的损失;往往利益最大的也是风险最大的,一旦失败,损失也是最大的,如何决策,这便使得博弈人陷入“囚徒困境”。
博弈的囚徒困境覆盖面极广,涉及军事决策,政治手段,企业经营,市场策略,生活理财等诸多方面。
囚徒困境和纳什均衡当对手知道了你的决定之后,就能做出对自己最有利的决定------普林斯顿大学数学家约翰·纳什囚徒困境著名的“囚徒困境”,是纳什均衡理论的经典案例。
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供一下相同的选择:若有一人认罪并作证检控对方(背叛对方)而对方保持沉默,此人将立即获释,沉默者将判监禁十年。
若两人都保持沉默(互相合作)则两人同时被判监禁半年。
若两人都互相检举(互相背叛)则两人同时监禁两年。
如同博弈论的其他论证,囚徒困境假设每个囚徒都是利己的,激斗寻求自己的最大利益。
囚徒到底应该选择哪一项策略,才能将自己的刑期缩至最短?两名囚徒由于相互隔离监禁,并不知道对方的选择。
试想困境中两名理性的囚徒会如何选择:若对方沉默,背叛会让我获释,所以对方会选择背叛。
若对方背叛我,我也要指控对方才能得到较低的刑期,所以也是这样会选择背叛。
二人面对的情况一样,所以二人的理想思考会得到相同的答案----选择背叛。
背叛是两种策略之间的支配性策略。
因此这场博弈中唯一可能达到的纳什均衡就是两人选择同时背叛对方,结果两人同时服刑两年。
这场博弈的纳什均衡,显然不是最优的解决方案。
如果两人都选择沉默,两人都只会被判刑半年。
但根据以上假设,两人均为理性的个人,均衡状况回事两个囚徒都选择背叛。
这就是“困境”所在。
寻找“纳什均衡点”在现实生活中,纳什均衡理论影响着人们的行为。
比如,在有些国家,报亭既无管理人员也不上锁,买报纸的人在自行放下前后拿走报纸。
当然某些人可能取走报纸却不付钱(背叛)但由于大家意识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。
在商业活动中,也会出现各种各样的囚徒困境的例子。
两个公司相互竞争,他们的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。
但若二者同时期发出质量类似的广告,收入增加很少但成本增加。
走出“囚徒困境”囚徒困境作为博弈论中的一个经典范例,其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视,辩证的看待这一研究现象,是促进人们深入研究相关社会现象的一种特殊的思维路劲和方法。
一、囚徒困境经典案例分析囚徒困境的内容是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判2年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。
“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
但是这样的分析是基于单次博弈的基础之上,而在重复的囚徒困境中,博弈会被反复的进行,因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
二、类似囚徒困境的经典案例分析在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。
帕累托最优状态名词解释微观经济学示例文章篇一:嘿,同学们!今天咱们来聊聊一个听起来有点神秘的词儿——帕累托最优状态。
这可是微观经济学里的重要概念哟!你们想啊,咱们的生活就像一个大大的拼图,每个人、每件事都是拼图里的一块。
帕累托最优状态呢,就像是把这个拼图拼得完美无缺的时候!比如说,有一个果园,果农伯伯们在里面种水果。
如果能让每种水果都长得又大又好,果农伯伯能赚好多钱,同时买水果的人也能买到又新鲜又便宜的水果,这是不是很棒?这就是一种帕累托最优状态呀!再打个比方,就像咱们在操场上做游戏。
如果每个同学都能玩得开开心心,没有人觉得不公平或者不开心,这难道不就是一种特别好的状态吗?这跟帕累托最优状态也有点像哟!那到底怎么才能达到这个神奇的帕累托最优状态呢?这可不是一件容易的事儿。
就好像要让一群调皮的小猴子乖乖排好队一样难!有时候,资源分配不合理,有人得到的多,有人得到的少,这就没法达到帕累托最优状态啦。
比如说,有一家工厂,老板只给少数工人多发工资,其他人却很少,那大家工作能有积极性吗?肯定不能呀!还有啊,如果市场上的竞争不公平,有的商家靠不正当手段赚钱,那其他诚实经营的商家不就亏了吗?这也不是帕累托最优状态呀!咱们想想,如果咱们的班级里,老师只表扬几个同学,忽略了其他努力的同学,大家心里会舒服吗?肯定不会呀!这就不是帕累托最优的班级状态。
所以说,帕累托最优状态就是要让大家都能在一个公平、合理的环境里,各得其所,各尽其能。
总之,帕累托最优状态虽然有点复杂,但咱们明白了它,就能更好地理解这个世界的经济运行啦!它就像是一把神奇的钥匙,能帮我们打开经济学的神秘大门哟!示例文章篇二:小朋友可能不太懂这么复杂的经济学名词呢,不过让我来试着给您讲讲吧!您知道吗?在微观经济学的世界里,有一个叫“帕累托最优状态”的神奇东西。
这就好像一场超级有趣的游戏,只不过这个游戏不是我们在操场上跑来跑去的那种,而是在经济的大棋盘上进行的。
博弈论-纳什均衡与帕累托最优今天我要开始讲博弈论。
至于为什么要讲博弈论呢,我的思路是这样的:因为现在的生意环境已经不是通过信息的不对称来获取利益了。
现今的市场环境越来越扁平化,所有的格局都是非常明朗的。
之前的那种生意“套路”已经越来越走不通了。
那有没有能指导现在市场环境的方法论呢?当然有,这个方法论就是博弈论!博弈论讲的是大家在规则清晰,大家都是聪明人,每个人都是希望自己利益最大化的基础下,如何理性的在社会中做出决策的理论。
理性的决策有时候有点不得已,明朗规则之下,还要考虑对手的反应,基本上并没有太多的选项。
博弈论通过明朗规则下的有限选项将会导出一个似乎是必然的有限结局,在大家都为了现有局面而维持的博弈策略组合,就是纳什均衡。
举个例子我们发现,商家都喜欢扎堆,从而导致同质化竞争的局面,比方说肯德基和麦当劳,他们基本都是在核心地段相隔不远的地方开设店面。
扎堆的现象就是一个纳什均衡,如果一个现象在社会长期稳定的存在,那它对参与各方来说都一定是一个纳什均衡的局面。
纳什均衡的关键点不在于市场格局下竞争各方的最优化,而在于每个参与者都不愿意单方面改变,这是整体的不理性,却是每个参与方的理性。
那么我们如果要对现有的市场进行优化就需要其他的介入,毕竟像商家扎堆的现象对于商家和消费者似乎都不是最好的局面。
最好的局面如何改进呢?帕累托是一个意大利的经济学家。
帕累托以不会影响每一个参与者的利益,但是其他各方更有利的方向通过某种方法,调试成为对于市场环境、竞争各方、消费者都是更优的局面就是帕累托改进。
如果帕累托改进到了无法增加各方及总体利益的余地,那此时的局面我们称之为帕累托最优。
但是这是一个反常规的状态,因为市场的参与者的准入还有消费者的分布是不能控制的,也就是总会有人通过违反规则而破坏帕累托最优,这对市场及消费者还有其他参与者的利益都不利,但是这对违反规则的参与者有利,所以这将会是不稳定的局面。
所以我们有时候理解长期存在的“不合理”局面恰恰是各方的一个纳什均衡,比方说大家都向往和平与安定却长期存在黑手党或者军队这样的暴力机构,现存的种种“不合理”局面就是长期博弈与社会演化的某种必然,现在的社会体就是一个巨大但是稳定的纳什均衡体系。
请论述帕累托最优标准的不足首先,帕累托最优只是帕累托提出的一种伦理学的个人观点,它是人类无数价值观中的一种。
某些更重视财富平等分配的哲人将不会认同帕累托原则,而是可能提出以下替代性的
标准:1.一定要一切人的情况都以相同的比例得到改善。
2.一定要一切人的情况都得到改善,而且穷人获得的幅度必须大于富人。
3.一方的状况改善而另一方的情况至少没有恶化的原则虽然可行,但获得改善的一方必须是穷人,维持原状的是富人。
在规范意义上森教授因此批评帕累托的主张在伦理学内涵上只是相当“朴素的”而已。
罗尔
斯也明言:“单靠(帕累托的)效率原则不能作为对正义的诠释。
因此,它必须以某种方式被补充。
如今,在自然的自由之体系中,效率的原则受到某些背景制度的约束,一旦这些约束被满足,任何由此产生的有效率的分配都被接受为是正义的。
”所以,帕累托最优意义上的配置效率因为其规范功能上的缺陷不可能在法律价值体系中取得排他性的地位。
其次,帕累托最优意义上的配置效率能否在某个法规如反垄断法的价值体系中取得排他性地位呢?如波斯纳等认为的即使公平等其他价值应该受到关注,那也主要是体现在财富分配等领域,不能在反托拉斯法的原则与程序框架下实现这一目标。
但这样的断言也是过于一厢情愿了,无论从谢尔
曼反托拉斯法发生时的价值考量还是从罗宾逊•帕特曼法的立法目的看,都是将实质公平作为立法需要考量的首要因素确立下来,而不是配置效率。
说到底,立法有其自身的规律,从来不会为学者所支持、呼吁的某个价值主张而左右。
纳什均衡及帕累托改进一、引言纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益①,则此策略组合被称为纳什均衡。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态,就是一个例子。
在纳什均衡下,我们能进行帕累托改进②,即在没有使任何人境况变坏的情况下,使得至少一个人变得更好。
二、消防安全博弈(一)消防安全博弈简述企业的消防安全投入是企业固定生产成本的组成部分,它意味着在为企业和社会带来效益的同时所花费的代价。
作为追求利润最大化的企业,如何确定自身的最优消防投入,也是很值得研究的。
首先从竞争企业消防安全投入决策来进行分析。
假设市场上仅有甲乙两家竞争企业,两个企业的雇主和雇员均乐于建立安全的工作环境,两个企业同样面临两种选择:安全或不安全。
即使企业和职工双方均希望有安全的生产环境,会进行消防安全投入,但是由于市场竞争更为紧迫时,企业鉴于担心经营失败或由于利润的诱惑,则会出现不同的情况。
以下为两企业消防安全投入的支付①即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的。
②是指在某种经济境况下如果可以通过适当的制度安排或交换,至少能提高一部分人的福利或满足程度而不会降低所有其他人的福利或满足程度,即一种制度的改变中没有输家而至少能有一部分人赢。
矩阵:从支付矩阵中看,如果企业1选择投入,其支付为0,此时企业2选择不投入时的支付为1,高于选择投入时的支付;企业1不投入时,企业2也不投入,此时它们支付相当。
所以不论企业1如何选择,不投入是企业2 的占优战略,同样企业1的占优战略也是不投入,此时达到纳什均衡的特殊情况——占优战略均衡,占优战略组合为(不投入,不投入)。
如果两公司独立决策(非合作),则消防安全投入将减少。
因为这会减少生产成本,降低产品价格,提高企业竞争力。
火灾事故发生的不确定性和事故结果的外部性,进一步增加了企业不进行消防投入的可能性。
“囚徒困境”问题探讨现实世界的资源是有限的,而人的需求和欲望却是无限的。
为了实现社会的福利最大化,就需要有效地配置各种经济资源。
然而,在传统“理性人”的假设下,自利人为了自身利益而展开争夺,最终形成的纳什均衡结果,往往陷入“囚徒困境”的无效率境地,造成资源的无效配置和浪费。
为此,试从合作博弈和交易费用的视角探讨帕累托改进的路径,寻找“囚徒困境”的破解方法,以图实现帕累托最优结果。
标签:囚徒困境;帕累托最优;合作博弈;交易费用1 引言传统经济学中,“理性人”假设是一切经济分析的基础,每个人都是聪明绝顶且自私自利,为实现自身效用最大而努力。
然而,最终的纳什均衡解却往往是无效率的,不仅没有实现自己的效用最大,也造成社会福利的损失,出现个体理性和集体理性之间冲突局面,既不是帕累托最优,甚至也不是希克斯-卡尔多有效的。
根据达尔文《物种起源》中的论点,可以假设:所有的生命个体在面临选择时,都是自私自利的,完全忽视其他个体的利益,没有悲悯之情。
但是,即便是这样的起点,也会有类似于兄弟姐妹的伙伴关系的出现,并且实现个体利益和集体利益的协调。
“囚徒困境”并非是不可破除的魔咒,只要找到合适的能够影响参与者收益和行为的有效机制,就能走出困境的阴霾,实现帕累托最优。
同时,应该认识到:囚徒困境中的参与者并非是“真正的理性人”,“囚徒困境”只是两个自私自利的人“聪明反被聪明误”的结局,不是真正的“聪明绝顶”的人所应该做出的决策。
如果是真正的“理性人”,他们就应该掌握博弈论的基本知识,能预计到自己的处境,最后两个囚徒都会毫无顾忌的选择抵赖,从而实现另一个均衡(并不坦白,不坦白)。
此外,如果博弈的参与者是利他人或为己利他,也可以有效突破困境。
2 “囚徒困境”模型“囚徒困境”是博弈论研究中虚构的一个经典案例,最早是在20世纪50年代,由美国Rand公司的Dresher和Flood采用。
在之后,鉴于“囚徒困境”模型在社会科学研究方面的作用,普林斯顿大学的教授Albert Tucker逐渐将它推广开来。
囚徒困境和纳什均衡当对手知道了你的决定之后,就能做出对自己最有利的决定------普林斯顿大学数学家约翰·纳什囚徒困境著名的“囚徒困境”,是纳什均衡理论的经典案例。
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供一下相同的选择:若有一人认罪并作证检控对方(背叛对方)而对方保持沉默,此人将立即获释,沉默者将判监禁十年。
若两人都保持沉默(互相合作)则两人同时被判监禁半年。
若两人都互相检举(互相背叛)则两人同时监禁两年。
如同博弈论的其他论证,囚徒困境假设每个囚徒都是利己的,激斗寻求自己的最大利益。
囚徒到底应该选择哪一项策略,才能将自己的刑期缩至最短?两名囚徒由于相互隔离监禁,并不知道对方的选择。
试想困境中两名理性的囚徒会如何选择:若对方沉默,背叛会让我获释,所以对方会选择背叛。
若对方背叛我,我也要指控对方才能得到较低的刑期,所以也是这样会选择背叛。
二人面对的情况一样,所以二人的理想思考会得到相同的答案----选择背叛。
背叛是两种策略之间的支配性策略。
因此这场博弈中唯一可能达到的纳什均衡就是两人选择同时背叛对方,结果两人同时服刑两年。
这场博弈的纳什均衡,显然不是最优的解决方案。
如果两人都选择沉默,两人都只会被判刑半年。
但根据以上假设,两人均为理性的个人,均衡状况回事两个囚徒都选择背叛。
这就是“困境”所在。
寻找“纳什均衡点”在现实生活中,纳什均衡理论影响着人们的行为。
比如,在有些国家,报亭既无管理人员也不上锁,买报纸的人在自行放下前后拿走报纸。
当然某些人可能取走报纸却不付钱(背叛)但由于大家意识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。
在商业活动中,也会出现各种各样的囚徒困境的例子。
两个公司相互竞争,他们的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。
但若二者同时期发出质量类似的广告,收入增加很少但成本增加。
浅析囚徒困境欧阳学文囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。
囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。
囚徒困境在生活中最常见的表现就是挤公共汽车。
从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。
学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。
但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。
可见“减负令”难以见效,中小学生课业负担不减反增。
又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。
可是,我错了吗?没有。
当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。
人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。
可是,我对了吗?没有。
”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。
含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。
再看中国的法治之路。
虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。
绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。
不过,任何事物都有两面性,“理性”过了头也就成了非理性。
这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。
我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。
但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。
论纳什均衡与“囚徒困境”的解决方式摘要本文对于“囚徒困境”与纳什平均进行了简要分析,提出了静态博弈中要找出自己的优势策略以及动态博弈中合作重要性的观点。
关键词:“囚徒困境”优势策略合作一、“囚徒困境”博弈及其纳什均衡“囚徒困境”博弈是图克(Tucker)1950年提出的一个著名的博弈模型,是完全信息静态博弈的典型例子。
囚徒困境博弈的基本情况如下:警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯的罪行。
如果其中至少有一人供认犯罪,就能确认罪名成立。
为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择机会;如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者从轻认罪,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁如果分别用-1、-5和-8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则两囚徒的得益矩阵如下:囚徒2囚徒1在上图中,“囚徒1”、“囚徒2”分别代表本博弈中的两个博弈方,也就是两个罪犯;他们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
其中矩阵中第一个数字代表决策结果后囚徒1的得益,第二个数字代表决策结果后囚徒2的得益。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判5年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境。
二、寻找自己的优势策略从“极小极大原理”到“纳什理论”,都是希望揭示博弈中的策略选择和博弈结果之间的关系,使博弈论研究可以在一个博弈结构里寻找比较稳定的结果,并为策略的选择提供依据。
这是经济学的一个问题.建议你看看经济学的书籍.帕累托最优(Pareto Optimality),也称为帕累托效率、帕累托改善,是博弈论中的重要概念,并且在经济学,工程学和社会科学中有着广泛的应用。
帕累托最优是指资源分配的一种理想状态,假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好,这就是帕累托改进或帕累托最优化。
帕累托最优的状态就是不可能在有更过的帕累托改进的余地;换句话说,帕累托改进是达到帕累托最优的路径和方法。
帕累托最优是公平与效率的“理想王国”。
帕累托改进是指一种变化,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。
一方面,帕累托最优是指没有进行帕累托改进的余地的状态;另一方面,帕累托改进是达到帕累托最优的路径和方法。
一般来说,达到帕累托最优时,会同时满足以下3个条件:交换最优:即使再交易,个人也不能从中得到更大的利益。
此时对任意两个消费者,任意两种商品的边际替代率是相同的,且两个消费者的效用同时得到最大化。
生产最优:这个经济体必须在自己的生产可能性边界上。
此时对任意两个生产不同产品的生产者,需要投入的两种生产要素的边际技术替代率是相同的,且两个消费者的产量同时得到最大化。
产品混合最优:经济体产出产品的组合必须反映消费者的偏好。
此时任意两种商品之间的边际替代率必须与任何生产者在这两种商品之间的边际产品转换率相同。
帕累托最优是以提出这个概念的意大利经济学家维弗雷多·帕雷托的名字命名的,维弗雷多·帕雷托在他关于经济效率和收入分配的研究中使用了这个概念。
如果一个经济体不是帕累托最优,则存在一些人可以在不使其他人的境况变坏的情况下使自己的境况变好的情形。
普遍认为这样低效的产出的情况是需要避免的,因此帕累托最优是评价一个经济体和政治方针的非常重要的标准。
另外,著名的帕累托法则(或80/20法则),则是由约瑟夫·朱兰(Joseph M. Juran)根据维弗雷多·帕雷托本人当年对意大利20%的人口拥有80%的财产的观察而得推论出来的。
博弈论帕累托最优纳什均衡博弈论其实挺有意思的,虽然它听起来高深莫测,但我们平时生活中就能遇到不少例子,完全不陌生。
你想啊,你跟朋友一起去吃饭,点菜的时候谁都想点自己喜欢的,结果呢,点到可能就变成了“互相为难”——你想吃麻辣烫,他喜欢烧烤。
都想得到自己想要的,但你们都不想让对方觉得自己吃亏,这就是一个典型的博弈。
可如果你们达成了一致,大家都很开心,点了最合适的菜,吃得饱,吃得尽兴,心里那种满足感就是“帕累托最优”了。
简单来说,帕累托最优,就是大家都得到了一定程度的好处,谁都不吃亏,谁也没有再获得额外的好处。
说到博弈论中的“纳什均衡”,可能很多人会有些困惑,觉得它就像是一个复杂的数学公式。
其实呢,纳什均衡就很像我们小时候玩过的那种博弈游戏——大家都知道最好的选择是什么,但是如果你选择了最优解,别人也会选择最优解。
这样一来,你的选择就变得十分“巧妙”了。
简单来说,纳什均衡就是一个“互不干扰、各自为战”的状态,大家都做出最符合自己利益的决定,却又不会影响到别人,最终达到一个平衡点。
听起来是不是很抽象?别着急,我们再来聊聊具体的例子。
比如说有两个朋友想一起去旅行,但是各自的目的地完全不同,一个想去海边,一个想去山区。
现在的问题是,海边能玩水,山区能爬山,选择了一个就意味着放弃另一个。
那么怎么做才算是“纳什均衡”呢?如果两个人都坚持自己的选择,结果很可能是各自孤单地去旅行,彼此都没有得到最大程度的享受。
可如果大家能坐下来好好聊聊,发现其实两人都能从对方的选择中获得快乐。
一个人去海边,另一个人去山区,旅行结束后再找个地方一起聚一下,反倒可能成了“最优选择”,大家都心满意足。
这就是纳什均衡的妙处,它让每个人都找到一种既不会损害自己利益,又能最大化满足对方的方式。
好啦,别以为博弈论只出现在大公司、高管或者政治博弈中。
我们生活中的点滴,都能看到它的影子。
比如,亲朋聚会时谁来买单,这也能算是博弈哦。
你看啊,一旦大家心照不宣,谁都不想抢着付账,结果就可能导致最后那一刻的“尴尬”。
帕累托原理- 论文关键字:问题产品销售原理福利资源改进个人(一)帕累托原理帕累托(Paret)是十九世纪意大利的社会学家,他利用图表显示:国家财富的80%掌握在20%的人的手中,这种80%~20%的关系,即是帕累托原理。
我们可以从生活中的许多事件得到印证,举例来说:公司80%的收入是由其全部产品中的20%所赚得的。
生产线上80%的故障,发生在20%的机器上80%的员工问题,是由20%的员工所引起的。
事实上,你的问题有80%是由少数几件重要的事情所引起的。
利用帕累托原理,你就可以将优先顺序排出来。
在维护计划中,哪一部机器应特别注意?哪此产品要特别重视?你的时间应如何投资才最恰当?什么样的投资可以使你的时间与金钱得到最大的回报?哪些部属应该多花点时间和他们讨论等等。
(二)帕累托改进帕累托改进(Paret Iprveent):是以意大利经济、社会学家帕累托(Vilfred Paret)命名,基于帕累托最优(Pare-Teffiieny)理论之基础。
1897年,意大利人Vilfred Paret在研究资源配置时,提出了一个最优状态标准。
人们简称之为帕累托标准/帕累托最优。
意思是说:在某种既定的资源配置状态,任何改变都不可能使至少一个人的状况变好,而又不使任何人的状况变坏。
帕累托最优:是指在不减少一方福利的情况下,就不可能增加另外一方的福利;反之,为帕累托无效率。
帕累托改进:是指在不减少一方的福利时,通过改变现有的资源配置而提高另一方的福利。
“帕累托改进”可以在资源闲置或市场失效的情况下实现。
在资源闲置的情况下,一些人可以生产更多并且从中受益,但又不会损害另外一些人的利益。
在市场失效的情况下,一项正确的措施可以消减福利损失而使整个社会受益。
“帕累托最优”和“帕累托改进”是微观经济学,特别是福利经济学常用的概念。
福利经济学的一个基本定理就是所有的市场均衡都是具有帕累托最优的。
但在现实生活中,通常的情况是有人有所得就有人有所失,于是经济学家们又提出了;补偿准则;,即如果一个人的境况由于变革而变好,因而他能够补偿另一个人的损失而且还有剩余,那么整体的效益就改进了。
微观经济学作业
-从囚徒困境看纳什均衡和帕累托最优纳什均衡又称为非合作赛局平衡,是博弈论的一个重要概念。
根据帕金的《经济学》一书对于纳什均衡的定义为:参与者A在给定B行为的条件下采取最好的行为,B也在给定A行为的条件下采取最好的行为。
纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。
帕累托最优,也称为帕累托效率,是指资源分配的一种理想状态,即假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,也不可能再使某些人的处境变好。
换句话说,就是不可能再改善某些人的境况,而不使任何其他人受损。
需要指出的是,帕累托最优只是各种理想态标准中的“最低标准”。
也就是说,一种状态如果尚未达到帕累托最优,那么它一定是不理想的,因为还存在改进的余地,可以在不损害任何人的前提下使某一些人的福利得到提高。
但是一种达到了帕累托最优的状态并不一定真的很“理想”。
比如说,假设一个社会里只有一个百万富翁和一个快饿死的乞丐,如果这个百万富翁拿出自己财富的万分之一,就可以使后者免于死亡。
但是因为这样无偿的财富转移损害了富翁的福利(假设这个乞丐没有什么可以用于回报富翁的资源或服务),所以进行这种财富转移并不是帕累托改进,而这个只有一个百万富翁和一个饿死乞丐的社会可以被认为是帕累托最优的。
这里可以与古典功利主义的标准做一比较。
按功利主义的标准,理想的状态是使人们的福利的总和最大化的状态。
如果一个富翁损失很少的福利,却能够极大地增加乞丐的福利,使其免于死亡,那么社会的福利总和就增加了,所以从功利主义的角度看,这样的财富转移是一种改善,而最初的极端不平等状态则是不理想的,因为它的福利总和较低。
可以看到,帕累托改进要求在提高某些人福利的时候不能减少任何一个人的福利,而功利主义则允许为了提高福利总和而减少一些人的福利。
囚徒困境的大意是囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判一年,而对方将被判刑十年;如果两人均招供,将均被判刑三年。
如果两人均不招供,将最有利,只被判刑二年。
于是,两人同时陷入招供还是不招供的两难处境。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳许均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
在上述囚徒困境模型中,如果甲相信乙招供,那么他的最佳策略是招供,而如果乙相信甲招供,那么他的最佳策略仍是招供。
这就是一个纳什均衡,它是“自确定”的。
但是,这个纳什均衡不是帕累托最优。
根据帕累托最优的定义,显然,在上述囚徒困境模型当中,甲乙两个人都从理性的角度出发,追求自身效用的最大,结果是双方不合作,都认罪了。
也就是说,实现了纳什均衡。
但是,如果甲与乙合作,产生的结果要比双方不合作好得多。
也就是说,如果双方合作,就存在帕累托改进那么,为什么两人不敢合作呢?甲会这样推理:“假如乙不招供,我只要一招供,只要坐牢一年,而不招供却要坐牢2年,显然招供比不招供好;假如乙招供了,我若不招供,则要坐牢10年,招供了只坐3年牢,显然还是招供的好。
可见,无论乙招供与不招供,我的最佳选择都是招供。
”同理,乙也会如此推理。
于是,谁也不敢选择合作。
所以,在囚徒困境这个模型当中,从个人的理性出发,推导不出帕累托最优。
由此可见,纳什均衡只是一种平衡,而不是一种帕累托最优,不是一种完美的结局。
根据帕累托最优,也许两个都选择不招供会是一个更好的选择。
关于纳什均衡有着很大的局限性,它的研究是针对两三个节点的小规模博弈论。
这个假设的不完善处,可能比假设大家都是合作的更严重。
因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。
既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。
因此即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题
而帕累托最优,如同上面指出的,一个帕累托最优的经济系统只是在“最低”的意义上是“理想”的,并不能保证其中没有贫困或严重的贫富差距。