MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡
- 格式:ppt
- 大小:856.00 KB
- 文档页数:80
博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
博弈论中的纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。
只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
浅析囚徒困境欧阳学文囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。
囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。
囚徒困境在生活中最常见的表现就是挤公共汽车。
从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。
学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。
但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。
可见“减负令”难以见效,中小学生课业负担不减反增。
又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。
可是,我错了吗?没有。
当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。
人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。
可是,我对了吗?没有。
”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。
含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。
再看中国的法治之路。
虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。
绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。
不过,任何事物都有两面性,“理性”过了头也就成了非理性。
这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。
我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。
但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。
纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名,是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
纳什均衡(Nash equilibrium),无一参与者可以通过独自行动而增加收益的策略组合。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡可以分成两类:"纯战略纳什均衡"和"混合战略纳什均衡"。
纯战略是提供给玩家要如何进行赛局的一个完整的定义。
特别地是,纯战略决定在任何一种情况下要做的移动。
战略集合是由玩家能够施行的纯战略所组成的集合。
混合战略是对每个纯战略分配一个机率而形成的战略。
混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。
因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
案例:智猪博弈、囚徒困境、普通范式博弈(公司合作背叛)、饿狮博弈、硬币正反。
这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。
既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。
还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。
努⼒⼯作游⼿好闲努⼒⼯作2,23,0游⼿好闲0,31,1《博弈⼊门》第⼆章:纳什均衡:理论1 策略型博弈策略型博弈是决策者之间相互作⽤的模型。
正是因为相互作⽤,我们称决策者为局中⼈。
每个局中⼈有⼀个可选⾏动的集合。
模型中的每个局中⼈受到所有局中⼈⾏动的影响,⽽不仅是受到她⾃⼰⾏动的影响,从⽽获得局中⼈之间的相互作⽤。
尤其是,每个局中⼈对于⾏动剖⾯⼀-所有局中⼈⾏动的列表(参见17.4节中关于剖⾯的讨论)---都有⾃⼰的偏好。
定义2.1(具有序数偏好的策略型博弈)(具有序数偏好的)策略型博弈由如下要素组成:局中⼈集合对于每个局中⼈,有⼀个⾏动集合对于每⼀个局中⼈,有关于⾏动剖⾯集合的偏好2.2 囚徒困境2.2.1 合作项⽬你和朋友合作-⼀个项⽬。
你们每个⼈可以要么努⼒⼯作要么游⼿好闲。
如果你的朋友努⼒⼯作,⽽你乐意游⼿好闲(如果你也努⼒⼯作的话,项⽬的结局将会好--些,可是其价值的增量对你来讲不值得付出额外的努⼒)。
你喜欢你们俩都努⼒⼯作的结局甚于你们俩都游⼿好闲(在这种情况下,什么都没有完成),对于你,最差的结局是你⼯作很努⼒⽽你的朋友却游⼿好闲(你痛恨被“剥削")。
如果你的朋友有相同的偏好,那么模拟你所⾯对情形的博弈将在图2.2中给出,如你所看到,这个博弈与“囚徒困境”的不同仅在于⾏动的名称。
我们并没有断⾔,两个⼈从事⼀个合作项⽬的情况必定具有“囚徒困境”的结构,只有当局中⼈的偏好与“囚徒困境”中⼀样时才是!例如,如果在其他⼈努⼒⼯作时每个⼈都喜欢努⼒⼯作甚于游⼿好闲,那么“囚徒困境”就不模拟这种情况:局中⼈的偏好与图2.2中给出的偏好不同。
2.2.2 双寡头垄断左图的博弈与“囚徒困境”的不同之处不仅在于局中⼈⾏动的名称,还在于其中两个局中⼈的偏好上有所不同。
右图的博弈与“囚徒困境”的不同之处仅在于局中⼈⾏动的名称。
随机坚持随机1/2(H+L),1/2(H+L)L,H坚持H,L S,SS>L2.4例证:匹配硬币(⽆冲突博弈)我们研究的求解理论有两个部分。
纳什均衡囚徒困境帕雷托最优-最通俗的解答在知乎的纳什均衡回答里看到这么一个观点:1. 三个火枪手中那句名言:All for one,one for all (人人为我,我为人人),我的理解是,贵族武士之间,通过自利和利他的行为实现共同目的2. 亚当斯密提出invisible hand理论时候的基本前提:当市场中每个人都进行自利行为的时候,在客观上说,市场(或社会)整体的福利会被提升而纳什均衡恰好否定了前面的观点,我认为这也是这一理论如此著名的原因:当市场中每个人都进行自利行为的时候,在客观上说,市场(或社会)整体的福利是无法达到最优的。
纳什均衡(Nash equilibrium),无一参与者可以通过独自行动而增加收益的策略组合。
其经典的例子就是囚徒困境(Prisoner's Dilemma)。
囚徒困境是一个非零和博弈,反映个人最佳选择并非团体最佳选择。
或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。
如果两人均不招供,将最有利,只被判刑半年。
于是,两人同时陷入招供还是不招供的两难处境。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯的博弈矩阵囚犯甲招供不招供囚犯乙招供各判刑两年甲判刑十年,乙立即释放不招供甲立即释放,乙判刑十年各判刑半年基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
《经济博弈论》课程教学大纲一、课程基本信息课程代码:16046305课程名称:经济博弈论英文名称:Economy Game课程类型:专业基础课总学时:32学分:2适用对象:经管类专业大二、大三年级学生先修课程:微观经济学、微积分。
二、课程简介中文简介:本课程是经济学的标准分析工具之一,着重研究个体之间的相互依存性,是日常生活中一种极重要的思维方式,在经济学课程建设中占有核心地位。
产业组织理论中的新产业组织学派,信息经济学中的海萨尼转化,宏观经济学中的博弈方法,区域经济学中的空间博弈问题,制度变迁理论中的演化博弈分析、公共经济学中的委托代理问题和公共选择问题等都与本课程有关。
英文简介:This course is one of the standard analysis tools of economics. It focuses on the interdependence of individuals. It is an extremely important way of thinking in daily life and occupies a core position in the construction of economics courses. The new industrial organization school in the theory of industrial organization, the Hesanian transfo rmation in information economics, the game method in macroeconomics, the spatial game problem in regional economics, the evolutionary game analysis in the theory of institutional change, and the public economics The principal-agent issues and public choice issues are all related to this course.三、课程性质与目的在掌握微、宏观经济学的基础上,同学通过本课程的学习,掌握经济博弈论的主要理论知识,培养学生正确分析问题做出决策的能力,并能从博弈的角度理解消费者、企业、政府以及各个行为主体的决策,以及相应的社会福利结果。
《管理经济学》(二)-囚徒困境与纳什均衡的含义与应用(2)南开大学现代远程教育学院考试卷2020年度春季学期期末(2019.9) 《管理经济学》(二)主讲教师:卿志琼一、请同学们在下列(20)题目中任选一题,写成期末论文。
1、完全竞争市场、垄断竞争市场、寡头垄断市场和完全垄断市场特点比较分析2、完全竞争市场的特点与评价3、完全竞争市场厂商短期关门点决策4、完全竞争市场厂商长期均衡的利润状况分析5、完全垄断市场的特点分析6、完全垄断市场厂商的长期均衡条件分析7、论价格歧视及其条件8、论一级差别定价、二级差别定价和三级差别定价的含义与适用条件9、论垄断竞争市场的条件与企业决策10、垄断竞争市场厂商的价格竞争与非价格竞争11、寡头市场结构的特点分析12、比较完全竞争、完全垄断和垄断竞争市场结构的长期均衡条件与效率分析13、卡特尔定价与价格领导的含义与应用14、论博弈论对企业决策的启示15、运用某一市场结构分析企业的定价与产量决策16、成本加成定价法的含义及其应用17、企业不同的定价实践与应用18、市场进入障碍与市场结构——以某市场为例19、长期投资决策原则与应用20、囚徒困境与纳什均衡的含义与应用二、论文写作要求1、论文题目应为授课教师指定题目,论文要层次清晰、论点清楚、论据准确;2、论文写作要理论联系实际,同学们应结合课堂讲授内容,广泛收集与论文有关资料,含有一定案例,参考一定文献资料。
3、第13题——20题,可以加副标题。
如第20题,囚徒困境与纳什均衡的含义与应用——以可口可乐与百事可乐广告战为例三、论文写作格式要求:论文题目要求为宋体三号字,加粗居中;正文部分要求为宋体小四号字,标题加粗,行间距为1.5倍行距;论文字数要控制在2000-2500字;论文标题书写顺序依次为一、(一)1. ……四、论文提交注意事项:1、论文一律以此文件为封面,写明学习中心、专业、姓名、学号等信息。
论文保存为word文件,以“课程名+学号+姓名”命名。