第二讲纳什均衡
- 格式:ppt
- 大小:430.50 KB
- 文档页数:51
博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
《博弈论:原理、模型与教程》第一部分完全信息静态博弈第2章Nash均衡「 -------------------------------------第2.1节占优行为第2.2节重复剔除劣战略行为第2.3节Nash均衡2.3 Nash 均衡(已精细订正!)1、定义2-5I2、一定理,及其证明I3、简单博弈问题Nash均衡的求解:划线法;箭头法I _________________________________________________________前面两小节分析了理性参与人在博弈中的战略选择行为一行为与剔占优除劣战略行为。
但是,在大多数博弈问题中,参与人的占优战略是不存在的,而且所有参与人同时存在占优战略的情形更是少见;剔除劣战略虽然可以在一定程度上简化博弈问题的求解,但在相当多的博弈中是无法使用重复剔除劣战略的方法求解博弈问题的(如图2-4和图2-6所示的战略式博弈)。
为了完全解决完全信息博弈的求解问题,需要选找新的方法和定义新的博弈解。
探寻博弈问题的解,必须明确:博弈分析是在博弈问题的结构和参与人完全理性为共同知识的假设下进行的,而在该假设下,人们(或博弈论专家)对博弈问题的求解就等同于完全理性的参与人对博弈问题的求解。
因此,可以采用内省式思维分析博弈问题的解。
考察战略式博弈的解。
假设参与人i (i =1,2r ,n)在博弈开始之前对博弈的结果进行预测,并且预测战略组合(s「,sj将成为博弈的结果。
现在的问题是:参与人i的这种预测是否一定就是博弈的真正结果?或者说参与人的预测在什么情况下才是正确的? 参与人i的预测战略组合(s「,s丄)将成为博弈结果,也就意味着参与人i 预测其他参与人的选择为S丄。
在预测其他参与人的选择为S」情况下,参与人i自己的选择S*怎样才是合理的呢?或者说参与人i选择S*应该满足什么样的条件呢?显然,对于理性的参与人i来讲,其选择S*必须满足这样的条件:在其他参与人的选择为S;的情况下,选择S出的所得必须不小于选择其他任何战略的所得,或者说S「必须是使自己的所得最大化的选择。
信息经济学理论之二:纳什均衡纳什由于引进了合作博弈与非合作博弈的区分, 并为非合作博弈创立了一种均衡概念. 这种均衡概念现在被命名为纳什均衡.纳什均衡理论经典解释:一农户在杀鸡前的晚上喂鸡,不经意地说:快吃吧,这是你最后一顿!第二日,见鸡已躺倒并留遗书:爷已吃老鼠药,你们别想吃爷了,爷他妈也不是好惹的。
当你知道了别人的决定之后,就能做出对自己最有利的决定。
——诺贝尔经济学奖经典理论选编1994年诺贝尔经济学奖的获得者是美国普林斯顿大学的约翰·纳什。
纳什获得诺贝尔经济学奖的原因是他在博奕沦领域的贡献,他提出了“纳什均衡”理论、关于博奕论,流传最广的是一个叫做“囚徒困境”的故事:话说有一天,一个富翁在家中被杀,财物被盗;警方在此案的侦破过程中,抓到两个犯罪嫌疑人张三和李四,并从他们的住处搜出被害人家中丢失的财物。
但是,他们矢口否认曾杀过人,辩称他们只是顺手牵羊偷了点儿东西。
于是警方将两人隔离,分别关在不同的房间进行审讯。
警察分别对张三和李四说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。
但是,我可以和你做个交易。
如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。
如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。
但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。
”张三和李四怎么办呢?他们面临着两难的选择——坦白或抵赖。
显然最好的策略是双方都抵赖,结果是大家都只被判一年。
但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。
这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐3个月,而他会坐10年牢,也是招了划算。
综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。
---------------------------------------------------------------最新资料推荐------------------------------------------------------第二讲多重纳什均衡友军博弈英国支持巴顿支持蒙帅支持巴顿美国支持蒙帅友军博弈特征两个(多个)纳什均衡问题:博弈的最终结果?第三章混合策略纳什均衡第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准一、帕累托优势标准:得益更大(一)案例:战争与和平 C 国鹰战略鸽战略鹰战略 A 国鸽战略第三节多重纳什均衡的选择标准一、帕累托优势标准:得益更大(二)纳什均衡的选择标准帕累托优势标准按照支付大小筛选纳什均衡第三节多重纳什均衡的选择标准二、风险优势标准:风险更小?(一)案例:串通作弊博弈学生乙作弊不作弊作弊学生甲不作弊第三节多重纳什均衡的选择标准二、风险优势标准:风险更小(二)分析:偏离损失比较法 1. 甲:单独偏离均衡的损失(1)偏离作弊:9-8=1 (2)偏离不作弊:7-0=7 第三节多重纳什均衡的选择标准二、风险优势标准:风险更小(二)分析:1 / 5偏离损失比较法 2. 乙:单独偏离均衡的损失(1)偏离作弊:9-8=1 (2)偏离不作弊:7-0=7 第三节多重纳什均衡的选择标准二、风险优势标准:风险更小(二)分析:偏离损失比较法3. 偏离损失比较方法:偏离作弊的损失 VS 偏离不作弊的损失 11 <77 第三节多重纳什均衡的选择标准二、风险优势标准:风险更小(二)分析:偏离损失比较法 4. 结论(1)偏离(不作弊,不作弊)的损失更大:49 (2)不偏离(不作弊,不作弊)第三节多重纳什均衡的选择标准二、风险优势标准:风险更小(三)纳什均衡的选择标准:风险优势标准比较不同纳什均衡之间的风险状况,风险小的纳什均衡优先第三节多重纳什均衡的选择标准三、聚点均衡(一)案例:城市分组博弈参与人:甲乙策略:把上海、长春、南京、哈尔滨四个城市分成两组,每组 2 个城市支付:甲乙分法相同――奖励 100 元;甲乙分法不同――奖励 0 元---------------------------------------------------------------最新资料推荐------------------------------------------------------第三节多重纳什均衡的选择标准三、聚点均衡(二)聚点均衡 1. 标准使用社会文化习惯、博弈历史等信息达到均衡 1 、 10 、 66 、888 2. 实质规律性第三节多重纳什均衡的选择标准四、相关均衡(一)案例:地域连坐下的产品质量博弈企业乙好产品差产品好产品企业甲差产品第三节多重纳什均衡的选择标准四、相关均衡(二)相关均衡参与人主动设计某种形式的选择机制,形成制度安排,从而确定最终均衡三鹿事件出现后,河北省其他食品企业以后如何做?第三节多重纳什均衡的选择标准五、抗共谋均衡(一)案例:抽象的选择乙左右上甲下乙左右上甲下第三节多重纳什均衡的选择标准五、抗共谋均衡(二)共谋偏离(集体偏离)均衡的激励 1. 如果集体偏离(上,左, A)(1)起因:甲、乙集体偏离,选(下,右, A)(2)结果:甲的支付 01 ,乙的支付 01 (3)结论:甲、乙有集体偏离的动机,(上,左, A)非抗共谋均衡第三节多重纳什均衡的选择标准五、抗共谋均衡(二)共谋偏离(集体偏离)均衡的激励 2. 如果集体偏离(下,右, B)(1)若甲、乙集体偏离,选(上,左, B) -1-2 , -1-2 (2)若甲、丙集体偏离,选(上,右, A) -1-5 , 50 (3)若乙、丙集体偏离,选(下,左, A) -1-5 , 50 (4)结论:缺乏集体偏离的激励,(下,右, B)为抗共谋均衡猎鹿博弈:3 / 5何为抗共谋均衡?乙猎鹿打兔猎鹿甲打兔金无足赤,人无完人人总是要犯错误的,所以要对别人宽容经得起考验的纳什均衡在其他参与人选择了错误策略的情况下,某参与人仍能实现纳什均衡第三节多重纳什均衡的选择标准六、颤抖手精炼均衡Trembling-hand perfect equilibrium (一)颤抖手某一参与人的非蓄意错误博弈偏离均衡路径的原因第三节多重纳什均衡的选择标准六、颤抖手精炼均衡(二)颤抖手均衡 1. 基本思想给定所有参与人均可能犯错误的情况下,如果某一策略组合仍是每一个参与人的最优策略组合,则实现颤抖手均衡第三节多重纳什均衡的选择标准六、颤抖手精炼均衡(二)颤抖手均衡 2. 定义: m――mistake n 人博弈中,对于每一个博弈方 i,存在严格混合策略序列,使下列条件得到满足:(1)尽管每一个博弈方可能犯错误,但错误收敛于零――总有一天能成功穿针引线――功夫不负有心人将一条线穿入针眼,手在不停颤抖,不大可能一下子穿进去但如果试的次数足够大,总是能够成功第三节多重纳什均衡的选择标准六、颤抖手精炼均衡(二)颤抖手均衡 2. 定义:m――mistake n 人博弈中,对于每一个博弈方 i,存在严格混合策略序列,使下列条件得到满足:(2)对于任何可选择的混合策略穿针引线― ― a name=baidusnap0/aB style=‘ color: black; background-color: #ffff66’ 学会宽容/B纳什均衡:---------------------------------------------------------------最新资料推荐------------------------------------------------------ 每一个人都把线穿入针眼宽容:某参与人不能因为其他参与人可能暂时无法把线穿进针眼而故意不把线穿进针眼本章作业 P143-146 1 、 7、 11 、 19 、 20 、21 、 22 、 24 、25 *博弈论第三章第二讲多重纳什均衡 3, 4 1,1 2, 2 4, 3 10 ,10 -10 , 8 8, -10 -5 , -5 10 , 10 -10 ,8 8, -10 -5 , -5 7, 7 8, 0 0, 8 9, 9 帕累托优势? 7, 7 8, 0 0, 8 9, 9 7, 7 8, 0 0, 8 9, 9 7, 7 8, 0 0, 8 9,9 7, 7 8, 0 0, 8 9, 9 7,7 8, 0 0, 8 9, 9 -2 , -2 -2 ,-8 -8 , -2 4, 4 -2 , -2 -2 ,-8 -8 , -2 4, 4 1, 1, -5 -5 , -5 , 0 -5 , -5 , 0 0, 0,10 丙:A -1 , -1 , 5 -5 , -5 , 0 -5 , -5 , 0 -2 , -2 ,0 丙:B 4, 4 4, 0 0, 4 10 , 10 他人不犯错误,你能实现最优;他人犯错误,你仍能实现最优一个人用手抓东西时,手一颤抖,就可能抓不住他想抓的东西:非蓄意错误如何理解?宽容是一种美德 * 博弈论第三章第二讲多重纳什均衡* *div id=loadingADdiv class=ad_boxdiv class=waitingstrong文档加载中. . . /strong 广告还剩em id=adtime/em秒5 / 5。
努⼒⼯作游⼿好闲努⼒⼯作2,23,0游⼿好闲0,31,1《博弈⼊门》第⼆章:纳什均衡:理论1 策略型博弈策略型博弈是决策者之间相互作⽤的模型。
正是因为相互作⽤,我们称决策者为局中⼈。
每个局中⼈有⼀个可选⾏动的集合。
模型中的每个局中⼈受到所有局中⼈⾏动的影响,⽽不仅是受到她⾃⼰⾏动的影响,从⽽获得局中⼈之间的相互作⽤。
尤其是,每个局中⼈对于⾏动剖⾯⼀-所有局中⼈⾏动的列表(参见17.4节中关于剖⾯的讨论)---都有⾃⼰的偏好。
定义2.1(具有序数偏好的策略型博弈)(具有序数偏好的)策略型博弈由如下要素组成:局中⼈集合对于每个局中⼈,有⼀个⾏动集合对于每⼀个局中⼈,有关于⾏动剖⾯集合的偏好2.2 囚徒困境2.2.1 合作项⽬你和朋友合作-⼀个项⽬。
你们每个⼈可以要么努⼒⼯作要么游⼿好闲。
如果你的朋友努⼒⼯作,⽽你乐意游⼿好闲(如果你也努⼒⼯作的话,项⽬的结局将会好--些,可是其价值的增量对你来讲不值得付出额外的努⼒)。
你喜欢你们俩都努⼒⼯作的结局甚于你们俩都游⼿好闲(在这种情况下,什么都没有完成),对于你,最差的结局是你⼯作很努⼒⽽你的朋友却游⼿好闲(你痛恨被“剥削")。
如果你的朋友有相同的偏好,那么模拟你所⾯对情形的博弈将在图2.2中给出,如你所看到,这个博弈与“囚徒困境”的不同仅在于⾏动的名称。
我们并没有断⾔,两个⼈从事⼀个合作项⽬的情况必定具有“囚徒困境”的结构,只有当局中⼈的偏好与“囚徒困境”中⼀样时才是!例如,如果在其他⼈努⼒⼯作时每个⼈都喜欢努⼒⼯作甚于游⼿好闲,那么“囚徒困境”就不模拟这种情况:局中⼈的偏好与图2.2中给出的偏好不同。
2.2.2 双寡头垄断左图的博弈与“囚徒困境”的不同之处不仅在于局中⼈⾏动的名称,还在于其中两个局中⼈的偏好上有所不同。
右图的博弈与“囚徒困境”的不同之处仅在于局中⼈⾏动的名称。
随机坚持随机1/2(H+L),1/2(H+L)L,H坚持H,L S,SS>L2.4例证:匹配硬币(⽆冲突博弈)我们研究的求解理论有两个部分。