MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡
- 格式:ppt
- 大小:856.00 KB
- 文档页数:80
博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
博弈论中的纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。
只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
浅析囚徒困境欧阳学文囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。
囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。
囚徒困境在生活中最常见的表现就是挤公共汽车。
从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。
学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。
但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。
可见“减负令”难以见效,中小学生课业负担不减反增。
又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。
可是,我错了吗?没有。
当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。
人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。
可是,我对了吗?没有。
”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。
含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。
再看中国的法治之路。
虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。
绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。
不过,任何事物都有两面性,“理性”过了头也就成了非理性。
这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。
我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。
但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。
纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名,是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
纳什均衡(Nash equilibrium),无一参与者可以通过独自行动而增加收益的策略组合。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡可以分成两类:"纯战略纳什均衡"和"混合战略纳什均衡"。
纯战略是提供给玩家要如何进行赛局的一个完整的定义。
特别地是,纯战略决定在任何一种情况下要做的移动。
战略集合是由玩家能够施行的纯战略所组成的集合。
混合战略是对每个纯战略分配一个机率而形成的战略。
混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。
因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
案例:智猪博弈、囚徒困境、普通范式博弈(公司合作背叛)、饿狮博弈、硬币正反。
这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。
既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。
还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。
努⼒⼯作游⼿好闲努⼒⼯作2,23,0游⼿好闲0,31,1《博弈⼊门》第⼆章:纳什均衡:理论1 策略型博弈策略型博弈是决策者之间相互作⽤的模型。
正是因为相互作⽤,我们称决策者为局中⼈。
每个局中⼈有⼀个可选⾏动的集合。
模型中的每个局中⼈受到所有局中⼈⾏动的影响,⽽不仅是受到她⾃⼰⾏动的影响,从⽽获得局中⼈之间的相互作⽤。
尤其是,每个局中⼈对于⾏动剖⾯⼀-所有局中⼈⾏动的列表(参见17.4节中关于剖⾯的讨论)---都有⾃⼰的偏好。
定义2.1(具有序数偏好的策略型博弈)(具有序数偏好的)策略型博弈由如下要素组成:局中⼈集合对于每个局中⼈,有⼀个⾏动集合对于每⼀个局中⼈,有关于⾏动剖⾯集合的偏好2.2 囚徒困境2.2.1 合作项⽬你和朋友合作-⼀个项⽬。
你们每个⼈可以要么努⼒⼯作要么游⼿好闲。
如果你的朋友努⼒⼯作,⽽你乐意游⼿好闲(如果你也努⼒⼯作的话,项⽬的结局将会好--些,可是其价值的增量对你来讲不值得付出额外的努⼒)。
你喜欢你们俩都努⼒⼯作的结局甚于你们俩都游⼿好闲(在这种情况下,什么都没有完成),对于你,最差的结局是你⼯作很努⼒⽽你的朋友却游⼿好闲(你痛恨被“剥削")。
如果你的朋友有相同的偏好,那么模拟你所⾯对情形的博弈将在图2.2中给出,如你所看到,这个博弈与“囚徒困境”的不同仅在于⾏动的名称。
我们并没有断⾔,两个⼈从事⼀个合作项⽬的情况必定具有“囚徒困境”的结构,只有当局中⼈的偏好与“囚徒困境”中⼀样时才是!例如,如果在其他⼈努⼒⼯作时每个⼈都喜欢努⼒⼯作甚于游⼿好闲,那么“囚徒困境”就不模拟这种情况:局中⼈的偏好与图2.2中给出的偏好不同。
2.2.2 双寡头垄断左图的博弈与“囚徒困境”的不同之处不仅在于局中⼈⾏动的名称,还在于其中两个局中⼈的偏好上有所不同。
右图的博弈与“囚徒困境”的不同之处仅在于局中⼈⾏动的名称。
随机坚持随机1/2(H+L),1/2(H+L)L,H坚持H,L S,SS>L2.4例证:匹配硬币(⽆冲突博弈)我们研究的求解理论有两个部分。