博弈论与策略行为
- 格式:doc
- 大小:5.39 MB
- 文档页数:54
博弈论与策略行为博弈论是对策略行为的一种研究方法,它研究的是决策者根据自己的利益和其他参与者的行为来选择自己的决策策略。
博弈论中的博弈是一个有限的决策过程,每个参与者在其中有多个可供选择的决策策略,并且不同参与者的决策策略可能相互影响。
在博弈论中,决策者的收益和成本往往是决策结果的主要考虑因素。
每个参与者都希望通过选择最佳的决策策略来最大化自己的收益或最大限度地减少自己的成本。
因此,博弈论研究的重点是如何通过合理的策略选择来达到自己的目标。
策略行为是博弈论的核心概念之一、策略是指决策者在博弈中选择的一组行动方案。
根据决策者的目标和参与者的行为,决策者可以选择不同的策略来应对不同的情况。
策略行为考虑的是决策者如何制定自己的策略以最大化或最小化自己的利益。
在博弈论中,具体的策略行为包括纳什均衡、支配策略等。
纳什均衡是指在一个博弈中,每个参与者都采取了最佳的策略,而没有任何一个参与者有激励改变自己的策略。
纳什均衡是博弈中的稳定状态,它保证了每个参与者都按照自己最佳的利益行动,而不会受到其他参与者的影响。
支配策略是指一个策略在任何情况下都比其他策略更好。
当一个策略支配其他策略时,决策者应该选择支配策略来达到最优的决策结果。
支配策略是在博弈中的一种重要的策略行为,它可以帮助决策者在复杂的决策情况下做出最优的选择。
博弈论与策略行为的研究可以应用于许多领域,如经济学、管理学、政治学等。
在经济学领域,博弈论与策略行为可以用于分析市场竞争、价格战略、合作与竞争关系等经济现象。
在管理学领域,博弈论与策略行为可以用于分析企业的决策行为、战略规划等问题。
在政治学领域,博弈论与策略行为可以用于分析政治选举、国际关系等问题。
总之,博弈论与策略行为是经济学中一个重要的研究领域,它探讨的是在多个参与者之间进行决策的情况下如何选择策略来达到自己的目标。
策略行为是博弈论的核心概念之一,它考虑的是决策者如何选择最优的策略来最大化或最小化自己的利益。
博弈论和策略行为博弈论和策略行为概念解释博弈论是一门研究决策者如何在相互影响的环境中进行选择的学科。
它研究的是一系列决策者在面对互动决策时所采取的策略及其结果。
在博弈论中,每个决策者会根据对其他决策者可能的选择和可能的结果进行分析和权衡,从而做出自己的决策。
策略行为是指在特定环境下,决策者通过制定与其他决策者互动的规则或方案,以达到自己的目标。
这些规则或方案可以包括行动顺序、动作选择以及对结果的评估。
策略行为的目标是通过选择最优策略,以最大化自身的利益。
博弈论与经济学的关系博弈论在经济学中扮演着重要的角色。
经济学研究个体或组织在资源分配和决策过程中的行为,而博弈论则关注个体或组织之间的互动决策。
经济学的核心问题是资源的分配和效率,而博弈论则研究在不确定环境下如何进行理性的决策。
博弈论的基本概念在博弈论中,有几个基本概念是必须要了解的。
首先是博弈的参与者。
参与者可以是个体、团队、公司甚至国家。
其次是策略的选择。
在博弈中,每个参与者都有一组可能的策略可以选择。
第三是参与者的收益。
在博弈中,每个参与者的收益取决于自己的策略选择和其他参与者的策略选择。
最后是博弈的结果。
博弈的结果可能是一种收益分配,或者是一个解决方案。
博弈的分类博弈可以根据不同的分类标准进行归类。
一种常见的分类是根据博弈的信息结构。
完全信息博弈指的是所有参与者对游戏的信息都完全了解。
而不完全信息博弈则是指参与者之间存在信息不对称的情况,即某一方对某些信息了解得更多。
另一种分类是根据博弈的合作性质。
合作博弈是指参与者之间可以合作以达到共同的利益,而非合作博弈则是每个参与者都追求自身利益的最大化。
策略行为的决策过程策略行为的决策过程包括两个主要步骤:信息获取和决策制定。
在信息获取阶段,决策者会通过观察和调查获取必要的信息。
这包括了对其他参与者的行为和动向进行分析,以及对可能结果的评估。
在决策制定阶段,决策者会根据信息的分析和评估选择最优的策略。
博弈论与策略行为G a m e T h e o r y a n dS t r a t e g y B e h a v i o r蔡继明 教授/主任清华大学政治经济学研究中心Center for Political Economy at Tsinghua UniversityCPET目录第一讲:导论一、博弈论的研究对象第二讲:占优战略与社会两难第三讲:纳什均衡和双人博弈第四讲:三人博弈与n人博弈第五讲:纯战略和混合战略第六讲:博弈的合作解第七讲:序贯博弈与子博弈完美均衡第八讲:重复博弈第九讲:企业经营决策的博弈分析第十讲:企业内部组织分析第十一讲:政府行为分析第一讲导论博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略(给自己带来最大收益的策略)。
二、博弈论的产生和发展博弈又称博戏,是一门古老的游戏。
1. 博弈在中国《学弈》(《孟子•告子》):弈秋,通国之善弈也。
使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。
虽与之俱学,弗若之矣。
为是其智弗若与?吾曰:非然也。
《世本》说,“乌曹作博”,乌曹乃是夏代著名之能工巧匠。
千百年来,博弈更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文化从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战12. 博弈论的开山之作1943 年,冯 · 诺依曼和摩 根斯顿发表《博弈论和经 济行为》的一书,标志着博弈论作为一门独立科学的开始,也标志着新古典经济学进入了一个新的发展阶段。
3. 1994年三位获诺奖的博弈论学者John NashJohn HarsanyLeihaden Selten4. 1996年诺贝尔经 济学奖得 主 : 詹 姆 斯·莫里 斯:主要贡 献:不对 称 信 息 条 件下的激励理论6. 2005年二位获诺奖的博弈论学者5. 2001 年 诺贝尔经济学奖得主: 迈克 尔 · 斯 宾塞:在不对称信息市 场分析方面所做出开创性研究。
Robert AumannThomas Shelling2美丽心灵三、基本概念1.局中人或参与者(Players)2.规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。
3.策略(Strategy):一整套的行动方案,规定了各种情况下的行动。
比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。
4. 相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。
如:人不犯我,我不犯人;人若犯我,我必犯人。
5. 行动:局中人在特定条件下的行为6. 支付( Pay-off ):博弈结束时,各方得到的收益。
7. 策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。
8.纳什均衡如果a*代表选手A在选手B选择b*时的最佳行动,而b*代表选手B在选手A选择a*时的最佳行动,那么,策略组合(a*, b*)就是2-人博弈的均衡解。
9.不完全信息博弈在一些博弈中,经常出现其中的一方或双方都具有私人信息(即一方知道而对方不知道的信息)。
比如,消费者在购物时,知道物品对自己的效用大小,而商家不知道;但商家知道商品的质量如何,而消费者未必清楚。
我们采用类型(type)的概念来描述局中人掌握的私人信息。
一般来说,对于不同的类型,局中人的最优策略也不一样,这样,对手的最优策略也不同。
10.类型显示对于没有私人信息的一方来说,希望能采用某种行动使得局中人的类型能够显示出来。
比如,甲为了知道乙的类型,让乙在白酒和啤酒之间选择。
如果乙喝白酒,则更可能是强硬的,如果喝啤酒,则更可能是软弱的。
甲的这种行动被称为是类型显示(reveal tape)行动。
311.信号传递对于具有私人信息的一方来说,有时希望自己能采用某种行动来主动向对方揭示自己的类型。
比如,强壮的乙可能击毁一块砖头来显示自己的类型。
这类行动被称为信号传递(signal)。
四、博弈的表述形式1. 标准式:博弈过程以数字矩阵(支付矩阵)来表示,矩阵两侧为参与者的不同策略选择。
标准式博弈突出了博弈以及与博弈类似的互动行为所具有的一个重要特征:即每个参与者的收益不仅取决于自己的策略,而且受其他参与者所选策略的影响。
2.扩展式(博弈树):博弈过程以树形图来表示,其中每一树枝节点代表了一种策略选择。
价格战-5,2五、博弈的分类1. 合作博弈与非合作博弈:不管是通过协议还是其他形式的强制手段,只要参与者们都能够履行协调后的策略,他们所选的策2.常数和博弈与非常数和博弈(零和博弈与非零和博弈);3.双人博弈与n-人博弈;进入1不进入2共享3,5略及其收益就是一个博弈的合作解;在没有可能达成有约束力的协议以协调不同参与者的策略时,参与者们所选的策略及其收益就是一个博弈的非合作解。
4.静态博弈与动态博弈;5.一次性博弈和重复博弈;6.完全信息和不完全信息博弈4损人利己?史密斯倾倒雇卡车琼斯倾倒4000,40005000,3500雇卡车3500,50004500,4500第二讲占优策略与社会两难一、占优与被占优策略所谓占优策略(dominant strategy)是指无论对方采取什么策略,对当事人来说都是最优反应的策略;如果无论对手选择哪种策略,一个策略的收益总是高于另一个策略,第二个策略被第一个策略占优,称为劣策略(dominated strategy)。
若前者称为上策,后者则称为下策。
如果每个参与者都有占优策略,并且也实施其占优策略,则该博弈可实现占优策略均衡。
三、垃圾处理博弈四、类似的其他例子④广告大战囚徒困境的启示“囚徒的两难选择”有着广泛而深刻的意义。
④价格大战④军备竞赛④环境污染④公共卫生……个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。
只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。
5欧姆尼投入留一手微型设备投入5,52,3留一手3,21,1张教授400页600页800页李教授400页45,4515,5010,40600页50,1540,4015,45800页40,1045,1535,35“纳什均衡”对亚当·斯密的“看不见的手”的原理提出挑战。
按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。
《国富论》中有这样一句名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。
从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
两个囚徒的命运就是如此。
从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。
因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。
但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。
也就是中国人说的“己所不欲勿施于人”。
但前提是人所不欲勿施于我。
五、社会两难与博弈的合作解④社会两难是一种存在占优策略均衡的博弈,参与者采用这种均衡的收益比采用非均衡策略要差。
④占优策略的存在以及它与合作解相悖的事实是导致社会两难的根本原因。
④合约为解决社会两难问题提供了一个出路。
垃圾处理博弈的合作解(雇卡车,雇卡车)六、合作产品开发七、教科书博弈八、结论④占优策略均衡是一个非合作均衡,其中每个参与者都独立行动,而不是一起协商其策略选择。
如果博弈中的参与者都能够保证自己履行协商后的策略,那么,他们选择的策略就被称为合作均衡。
④合作均衡与占优策略均衡可能一样,也可能不一样。
④并非所有博弈都存在占优策略或占优策略均衡。
6厂商I采可取的策略厂商II可采取的策略行最小值123A300200400200B100150300100列最大值300200400第三讲纳什均衡和双人博弈一、纳什均衡纳什均衡是全部参与者所选策略的一个组合,其中每个人的策略都是针对其他人策略的最优反应。
如果有两个策略(或者更一般地,有多个策略,每个策略对应一个参与者),并且每个策略都是另一策略(或其他参与者的策略)的最优反应,我们就称这一策略组合为纳什均衡策略。
如果一个博弈存在纳什均衡策略,参与者也选择了这组策略,我们就得到了这个博弈的一个纳什均衡。
三、最大最小化或最小最大化启示两利相权取其重前行两害相权取其轻7七、金发女郎约翰追求金发女郎追求其他女士雷哈德追求金发女郎0,02,1追求其他女士1,21,1五、选择电台节目谢林点:人们把以线索为基础选择的均衡摇滚乐乡村音乐谈话摇滚乐35,3540,5010,80乡村音乐50,4020,2010,40谈话80,1040,105,5称为谢林点(Schelling point)或焦点。
托马斯·谢林(Thomas C. Schelling,1921-),博弈理论家。
③(推,推)均衡是收益(payoff)占优均衡;③(不推,不推)被称为风险(risk)占优纳什均衡③推与不推博弈是一个纯协调博弈。
八、性别战男子的选择2,10,0女子的选择0,01,28九、胆小鬼博弈不转向转向不转向转向-10,-10-5,55,-50,0改变方案一:减量方案投食仅原来的一半分量。
结果是小猪大猪都不去踩踏板了。
小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。
谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案投食为原来的一倍分量。
结果是小猪、大猪都会去踩踏板。
谁想吃,谁就会去踩踏板。
反正对方不会一次把食物吃完。
小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案投食仅原来的一半分量,但同时将投食口移到踏板附近。
结果呢,小猪和大猪都在拼命地抢着踩踏板。
等待者不得食,而多劳者多得。
每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。
成本不高,但收获最大。
9其他例子富人和穷人,谁修路大股东和小股东,谁来监督经营者大企业和小企业,谁主动投资R&D智猪博弈的启示原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。
但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。