- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
沃尔马是山姆·华尔顿于1969年创立的一 家很庞大的也是很成功的折扣零售连锁店公 司。上世纪70—80年代,其类似的公司纷纷 倒闭时,沃尔马却保持快速增长,从1976年 的153家分店发展到1986年的1009家,且盈利 性更强。到1985年末,山姆·华尔顿已是美 国最富有的人之一。
沃尔马成功的关键在于其市场进入与市 场扩张策略。在60年代,人们通常都认为折扣 店只能在10万或以上人口的城市中才能成功经 营,但山姆·华尔顿不同意这种看法并决定在 美国西南部的小镇上开店,到1970年已经有30 家沃尔马店开设在阿肯色、密苏里和俄克拉荷 马的小镇上。一个10万人口以下的小镇所具有 的市场容量并不太大,但却足够容纳下一个大 型折扣店,并能让它获得一定的利润。
显然,两人合作猎鹿的好处比各自打兔的好 处要大得多,但是这要求两个猎人的能力和 贡献相等。如果一个猎人的能力强、贡献大, 他就会要求得到较大的一份,这可能会让另 一个猎人觉得利益受损而不愿合作。“合则 双赢”的道理大家都懂,在实际中却很难合 作的原因就在于此。合作要求博弈双方学会 与对手共赢,充分照顾到合作者的利益。
B 借 A 分 不分 不借
(2,0)
(3,3)
(0,6)
B 借 A 分 不分 B 打 不打 不借
(2,0)
(3,3)
(2,0)
(0,6)
B 借 A 分 不分 B 炸 不炸 不借
(2,0)
(3,3)
(-10,-10)ຫໍສະໝຸດ (0,6)
虽然有时候一些博弈方声称将采取什么什么样 特定的行动,以影响和制约其它博弈方的行为, 但如果这些行动缺乏以经济利益为基础的可信 性,那么这些想法或声明最终就是不可信的, 不会有真正的效力。因此,可信性问题是动态 博弈分析的一个中心问题,需要对它十分重视。
A 仿冒 B 制止 不制止 A 仿冒 B 制止 不制止 不仿冒 不仿冒
二、动态博弈的主要特点 在动态博弈中,各个博弈方的选择和行 为不仅有先后之分,而且一个博弈方的选择 很可能不只一次,而是有几次甚至多次,并 且在不同阶段的多次行为之间有内在联系, 是不能分割的整体。因此在动态博弈中,研 究某个博弈方某个阶段的行为,或者将各个 阶段的行为割裂开来研究是没有意义的。 动态博弈中博弈方决策的内容,不是博 弈方在单个阶段的行为,而是各博弈方在整 个博弈中轮到选择时的每个阶段,针对前面 阶段的各种情况而作出相应策略或行为选择 安排,以及由不同博弈方的这种行动安排所 构成的策略组合。
到70年代中期,当其它连锁店的经营者 意识到这一点时,沃尔马已经大量占领了这样 的市场。对于小镇来说,开出一家折扣连锁店 可以盈利。如果开出两家来,有限的市场容量 会使两家都亏损。沃尔马的策略就是先发制人, 力图抢先一步,在其他小镇开设分店。到1986 年,它每年赚取4.5亿美元利润。到1993年, 它已有1800多家分店并赚取15亿美元的年利润。
作为不可信性问题的一个例子,我们考虑 以下一个所谓的“手雷博弈” 博弈问题。 某投资人A投资一价值6万元的商店时缺2 万元资金,而B此时有2万元资金可以投资。A 希望B将2万元资金借给自己,并答应在年终赚 到钱和B对半分成,B是否该将钱借给A呢?假 设开办商店肯定可以赢利,则B最担心的就是A 赚钱后是否会真的与自己平分利润,因为如果 A赚钱后不仅不和B平分,而且还卷款潜逃,B 就会连自己的本钱都收不回来。我们用图中的 扩展形表示这个博弈问题。
乙方 追求 甲方 追求 -3,-3 不追求 2,-1
不追求
-1,
2
0,0
要是甲首先宣布开始追求那个女孩,那乙同学 的最优选择就是放弃,这样的话就可以避免和好朋 友闹翻,这正是他最不愿意看到的;同样,要是乙 同学首先宣布开始追求那女孩,那甲同学的最优选 择也同样是放弃,道理是一样的。这时候就出现了 两个纳什均衡:一个是甲同学追求、乙同学不追求; 另一个就是甲同学不追求、乙同学追求。到底哪个 均衡会出现了,这要由生活中其他的偶然因素决定, 有时是甲同学碰巧先宣布,有时是乙同学碰巧先宣 布。
斗鸡博弈
同一宿舍的两个男同学关系相当不错,在他们的 生活中出现一位女生,他们两人都对这个女生很有 好感。现在假如两个人同时公开宣布喜欢这个女生 并准备去追求,则他们都觉得很尴尬,而且他们的 关系也会出现僵化,这是他们不愿意得到的结果 (在这里假定没有哪个同学特别喜欢这个女生,可 以不顾一切,也假定这个女生不是特别偏向哪个男 生)。下面是他们的支付矩阵:
1、三阶段谈判博弈 首先讨论一个三回合谈判博弈。假设有两个人 就如何分享K万元现金进行谈判,并且已经定 下了这样的谈判规则;首先由甲提出一个分割 比例,乙可以接受也可以拒绝;如果乙拒绝则 他自己应提出另一个方案,让甲选择接受或拒 绝。如此一直进行下去。一个条件一旦被拒绝, 它就不再有约束力,并和博弈下面的进行不再 相关。在上述循环过程中,只要任何一方接受 对方的方案,博弈就告结束。再设每一次一方 提出一个方案和另一方选择是否接受为一个回 合,由于谈判费用和利息损失等,双方的利益 都要打一个折扣,我们称为“贴现因子”。
完全且完美信息动态博弈
静态博弈只是博弈问题中的一种 , 现实中的许多决策活动往往是依次选择 行为而不是同时选择行为,而且后选择 行为者能够看到先选择行为者的选择内 容。
博弈中的博弈方相继行动,由于后行动者 能够看到先行动者的决策行为,所以后面博弈 方的决策要受到以前博弈方决策行为的影响, 每一个博弈方都要根据在决策时所掌握的全部 信息来作出自己的最优策略,即每个博弈方的 策略是决策者在决策时所掌握全部信息的函数。 换句话讲,博弈方在某一个阶段做出的决策, 要受到前边一系列决策信息的影响,是前边一 系列决策信息的函数。典型的例子就是对弈, 我走一步,你走一步,你来我往, 楚汉相争, 不亦乐乎。双方相继行动, 每个人在每一时刻 的决策都是前边一系列决策所掌握信息的函数, 这种决策问题构成的博弈与静态博弈有很大的 不同,我们称它们为“动态博弈”(Dynamic Game)
逆向归纳法的一般方法是这样的:从动态 博弈的最后一个阶段开始分析,每一次确定出 所分析阶段博弈方的选择和路径,然后再确定 前一个阶段的博弈方选择和路径。逆推归纳到 某个阶段,那么这个阶段及以后的博弈结果就 可以肯定下来,该阶段的选择节点等于一个结 束终端。
例
轮流出价博弈
讨价还价(Bargaining)在博弈论 中是典型的序贯博弈,是一个不断的 “ 出 价 ” ( offer ) 和 “ 还 价 ” (counteroffer)过程,因而是一类典型 的动态博弈问题,也是博弈论最早研究 的一种博弈问题。下面我们对鲁宾斯泰 英(Rubinstein)的轮流出价博弈问题进 行分析。
2、逆向归纳法 在博弈论中,经常用“可置信”和“不 可置信”来区分博弈者选择的策略。在对动 态博弈的分析中, 我们会分析什么样的策略 是可置信的,什么样的策略是不可置信的, 而分析“威胁”或“承诺”是可置信的还是 不可置信的方法就是“逆向归纳法”。
逆向归纳法的特征是:博弈行为是顺序发 生的。先行动的理性的博弈方,在前面阶段选 择行为时必然会先考虑后行动博弈方在后面阶 段中将会怎样选择行为,只有在博弈的最后一 个阶段选择的,不再有后续阶段牵制的博弈方, 才能直接作出明确选择;后面的行动者在进行 行为选择前,所有以前的博弈方的行为都可以 被观察到,而当后面阶段博弈方的选择确定以 后,前一阶段博弈方的行为也就容易确定了。
逆向归纳法
一、动态博弈中的可信性(Credibility)问题
“破釜沉舟” 秦朝末年,秦国大将章邯率领数10万人攻打赵国 的都城巨鹿。赵国向楚国求援,楚王派项羽率兵救赵。 项羽带领人马渡过漳河后,马上命令弄沉渡船,每人 只带三天的粮食。将士们知道后退的路没有了,个个 奋勇杀敌,终于解了赵国之危。 “背水一战” 汉将韩信带兵去攻赵军,出了井陉口,布置了一 万人背水列阵,与赵军作战。汉军前临大敌,后无退 路,都拼死作战,结果大败赵军。
动态博弈的核心问题之一是可信性问题。 我们知道动态博弈中博弈方的策略是他们自 己预先设定的、在各个博弈阶段针对各种情 况的相应行为选择的计划,这些策略实际上 并没有强制力,而且实施起来有一个过程, 因此只要符合博弈方自己的利益,他们完全 可以在博弈过程中改变计划。这种情况叫做 动态博弈中的“相机选择”(Contingent Play)问题。
相机选择的存在使得博弈方的策略中,所 设定的各个阶段、各种情况下可能会采取的行 动或策略的“可信任”(Credibility)有了疑 问。也就是说,各个博弈方是否会真正、始终 按照自己的策略所设定的方案行为,还是可能 临时改变自己的行动方案呢?这使得动态博弈 分析的静态博弈分析要复杂得多
首先行动优势
1.在动态博弈中,首先作出策略选择 和采取行动的博弈方可以占据有利地位, 获得较多利益。 2.首先行动优势的原因在于它造成了 一种既成事实,为使利润最大化,另一 方必须根据首先行动一方的策略来选择 自己的策略.而且该模型表明信息较多的 博弈方不一定能获得较多的得益。
案例 沃尔马连锁店的市场扩张
动态博弈的扩展式表示法
一 、 动 态 博 弈 的 扩 展 形 表 示 ( Extensive Form )
“扩展形”也称其为“博弈树。动态博弈 各个博弈方的选择行为有先后次序,每个博弈 方的选择行为会形成依次相连的时间阶段,因 此动态博弈中一个博弈方的一次选择行为常称 为一个“阶段”(Stage)。动态博弈中也可 能存在几个博弈方同时选择的情况,这时这些 博弈方的同时选择构成一个阶段。一个动态博 弈至少有两个阶段,因此动态博弈有时也称为 “多阶段博弈”(Multistage Games)。
猎鹿博弈(Stag Hunt Game)
“猎鹿博弈”源自启蒙思想家卢梭的著作《论人 类不平等的起源和基础》中的一个故事。 古代的一个村庄有两个猎人。当地的猎物主 要有两种:鹿和兔子。如果一个猎人单兵作战, 一天最多只能打到4只兔子。只有两个猎人一起去 才能猎获一只鹿。从填饱肚子的角度来说,4只兔 子能保证一个人4天不挨饿,而1只鹿却能使两个 人吃上10天。这样,两个人的行为决策就可以形 成两个博弈结局:分别打兔子,每人得4;合作, 每人得10。
逆向归纳法(Backwards Induction Method)
1、纳什均衡的问题 在上述例子中,我们发现动态博弈中的博 弈过程是一个相机行事的过程。即在动态博弈 中,各博弈方是在“等到”博弈到达自己的策 略空间后再决定如何行动。这种相机选择引出 了动态博弈中的一个中心问题,即可信性问题。 而可信性问题最重要的意义,在于它对纳什均 衡在动态分析博弈中的有效性提出了质疑。
在静态博弈中,纳什均衡具有良好的稳定性, 即各博弈方都没有动力去改变这一策略组合。 由于纳什均衡具有稳定性,各博弈方能够一致 预测到该均衡的最终形式,即各博弈方似乎是 在博弈开始之前就制定出一个完全的行动选择 计划。 但在动态博弈中,由于相机行为的存在,并进 而导致不可信问题、这样就使得静态博弈下的 纳什均衡可能会失去稳定性。
此外, 由于动态博弈中各个博弈方的 选择行为有先后次序,且后行为者能观察 到此前先选择行为博弈方的选择行为,因 此动态博弈中各博弈方的地位是不对称的。 这一点与所有博弈方一次性同时选择的静 态博弈也明显不同。
一般来说,由于后选择的博弈方有更多的 信息帮助自己选择行为,可减少他们决策的盲 目性,有针对性地作出选择,因此处于较有利 的地位。不过,后行为和具有较多信息未必一 定较先行为和具有较少信息的博弈方有利。对 单人博弈,也即个人最优化决策问题来讲,占 有信息越多对决策者越有利,但对两人以上的 博弈问题来说,信息较多的博弈方有可能受损。 事实上,也正是由于博弈论能够揭示诸如“信 息多反而得益少”等表面上不合常规现象的存 在及其根源,才使得博弈论成为一种得到广泛 传播并为人们所喜欢的理论。