当前位置:文档之家› 不完全信息静态博弈例子

不完全信息静态博弈例子

不完全信息静态博弈例子

博弈论是研究决策者在相互影响下进行决策的数学模型。在博弈论中,不完全信息静态博弈是一种常见的博弈形式。在这种博弈中,每个决策者只能获得有限的信息,无法完全了解其他决策者的策略和利益。本文将通过一个例子来说明不完全信息静态博弈的特点和解决方法。

假设有两个商人A和B,他们同时决定是否进入一个新的市场。进入市场的成本是固定的,但市场的利润是不确定的。商人A可以选择进入市场或不进入市场,商人B也可以做出相同的选择。然而,商人们只能获得有限的信息,无法准确了解对方的决策和市场利润。

商人A和B的利益是相互关联的。如果两个商人都选择进入市场,他们将面临更大的竞争和风险,但如果市场利润高,他们也有机会获得更大的回报。如果一个商人选择进入市场而另一个商人选择不进入市场,前者将面临更大的风险,但如果市场利润高,他将独享这一利润。

在这个例子中,商人A和B都面临着不完全信息的情况。他们无法准确了解对方的决策和市场利润,只能根据自己的信息做出决策。这种情况下,他们需要通过分析对方的可能策略和利益来做出最优的决策。

为了解决这个问题,我们可以使用博弈论中的概念和方法。首先,我们可以建立一个博弈矩阵来描述商人A和B的策略和利益。矩阵的

行表示商人A的策略,列表示商人B的策略,每个单元格表示两个商

人在不同策略下的利益。

然后,我们可以使用博弈论中的解概念来找到最优策略。例如,纳

什均衡是指在博弈中,每个决策者都选择了最优策略,而且没有动机

改变自己的策略。通过分析博弈矩阵,我们可以找到纳什均衡点,即

商人A和B都选择了最优策略。

在这个例子中,纳什均衡点可能是商人A和B都选择进入市场,或者都选择不进入市场。这取决于市场利润的不确定性和商人们的风险

偏好。如果市场利润高,商人们可能更倾向于进入市场以获取更大的

回报;如果市场利润低,商人们可能更倾向于不进入市场以避免风险。

然而,由于不完全信息的限制,商人A和B可能无法准确预测市场利润。在这种情况下,他们可以采取一些策略来减少不确定性的影响。例如,他们可以进行市场调研,收集更多的信息来预测市场利润;他

们也可以与其他商人进行合作,共享信息和风险。

总之,不完全信息静态博弈是博弈论中的一种常见形式。通过分析

博弈矩阵和应用博弈论的解概念,我们可以找到最优策略。然而,由

于不完全信息的限制,决策者可能需要采取其他策略来减少不确定性

的影响。博弈论为我们提供了一种理论框架,帮助我们理解和解决这

类问题。

不完全信息静态博弈

不完全信息静态博弈 博弈论 1.二手车市场为什么难以建立? 在发达国家,二手车(旧车)的价格往往比新车差一大截,即使旧车 本身没有什么质量问题,一旦旧车进入二手车市场,其价格就会与新车相 比差得老远。在我国许多城市,二手车市场甚至难以建立起来,原因是进 入市场的买车人太少。这是为什么呢?二手车市场的博弈理论为我们解答 了这个谜语。 在二手车市场上,卖车人比买车人更多地知道车的质量情况,但卖车 人不会将旧车的质量问题老老实实地告诉买车人。买车人也知道这种情形,因此,买车人在开出价格时会考虑到车的质量问题。假定没有问题的好车 价值20万元,有问题的坏车只值10万元,并且设买车人认为市场上出现 好车和坏车的可能性各占一半。这时,买车人开出的价格不会高于1/2某20+1/2某10=15万元。这样,如果卖车人的车果真是好车,他就不会出售,好车退出市场,但当卖车人的车是坏车时,他会十分积极地将只值 10万元的车按15万元卖给他。 但买车人知道愿意按15万元卖的车一定是坏车,从而认定市场上全 是坏车。所以,除非他愿意买一辆坏车,否则他会退出市场。当他愿买坏 车时,他只开出10万元的价。于是,旧车市场或者建立不起来,没有买主,或者充斥着坏车,真正的好车退出市场,而坏车在不断成交,但价格 很低。

类似现象广泛存在如人才市场、信贷市场等。如一个公司往往流走的是能力强的人,因为公司不能正确评价一个能力强的员工的能力,给予的薪水低于其市场价值。 2.维克里拍卖法 如果有一件古董需要拍卖,有许多人参加竞争性拍卖。这件古董在每个买主心中有一个价值评价。但是,卖主不知道买主的评价,买主也不会老实将其对古董的评价告诉卖主。不同买主之间也不知道其他人的价值评价。 如果采用“英式拍卖法”,买主们轮流出价,直到开出最高价的买主拿走古董并支付所开出的最高价格。按这种拍卖方法,古董并不能按买主心中的最高评价价值卖出。壁如,当买主中的最高评价为100万元,第二高评价为90万元时,当评价最高的买主开出91万元时,就可买走其评价为100万元的古董但只支付了91万元。由于这是公开竞价,会出现围标问题,即买主们合谋压价。 另一种方法是:“一级密封价格拍卖法”。买主每人将其开出的价格写入一个信封,密封后交给卖主。卖主拆开所有信封,将古董卖给信封中出价最高的买主,并要求支付最高的价格。这种方法可避免围标,但不能将古董按买主中最高的评价价值卖出。因为买主不会按心中的评价老老实实地将价格写为其价值评价。如果该买主认为古董值100万元,他不会写出价格为100万元,因为当他开出比100万更低一些的价格时,有可能赢得古董但净赚一个价值与价格的差额。如当他开出90万元时,有可能成交并净赚10万元。相反,当他开出100万元时,即使成交也无赚头。所以,大家都不会老老实实报出心中的价值。

博弈论与经济分析(不完全信息静态)

博弈论与经济分析(不完全信息静态) 第四章 不完全信息静态博弈 不完全信息意味着至少有一个参与者不能确定另一个参与者的收益函数,或者说类型。 我们用一个例子来引入要讨论的问题: 例:信息不对称条件下的古诺模型 市场:P(Q)=a-Q ,Q=q1+q2 企业1:C1(q1)=cq1 企业2:以θ的概率为高成本,即222()H C q c q =;以1θ-的概率为低成本,即 222()L C q c q =。当然,H L c c >。 信息不对称:企业2知道自己的成本,也知道企业1的成本;企业1知道自己的成本,但是只知道企业2成本状况的概率分布。 以上都是公共信息,即企业1知道企业2享有信息优势,企业2知道企业1知道,企业1也知道企业2知道企业1知道……如此等等。 解题: 企业1会预测企业2在不同情况下的最优选择: 当企业2为高成本时2 122max[()]H q a q q c q * --- 当企业2为低成本时2 122max[()]L q a q q c q * --- 既然企业只知道企业2成本情况的概率分布,则企业1只能根据上述预测最大化自己的期望收益:1 121121max [(())](1)[(())]H L q a q q c c q a q q c c q θθ* * ---+---- 以上三个优化问题的一阶条件为: 12 ()2 H H a q c q c **--= 12 ()2 L L a q c q c **--= 221 [()](1)[()] 2 H L a q c c a q c c q θθ** *--+---= 联立求解: 221()()36 H H H L a c c q c c c θ * -+-= +-

不完全信息下的静态博弈习题

非完全信息静态博弈习题 1、考虑下面的Cournot 双头垄断模型。市场的反需求函数为Q a Q p -=)(,其中21q q Q +=为市场总产量,两个企业的总成本都为()i i i cq q c =,但需求却不确定:分别以θ的概率为高(H a a =),以θ-1的概率为低(L a a =),此外,信息也是非对称的:企业1知道需求是高还是低,但企业2不知道,所有这些都是共同知识,两企业同时进行决策。 要求:假定H a 、L a 、θ和c 的取值范围使得所有均衡产出都是正数,试问此博弈的贝叶斯纳什均衡是什么 解: 在市场需求为高时,企业1的最优战略为: ()H H H q c q q a Max 121?--- 由一阶条件可以推出2 21c q a q H H --= (1) 在市场需求为低时,企业1的最优战略为: ()L L L q c q q a Max 121?--- 《 由一阶条件可以推出2 21c q a q L L --= (2) 企业2的最优战略为 ()()(){}2212211q c q q a q c q q a Max L L H H ----+---θθ 由一阶条件可得: ()()()211*2c q a q a q L L H H ---+=-θθ (3) 方程(1)、(2)和(3)联立可得: ()()()()6 21311*1c q a q a q L L H H H ------=θθ ()6 22*1c a a q H L L --+=θθ ()31*2c a a q H L -+-=θθ

由此可知,企业1的战略()*1*1,L H q q 和企业2的战略*2q 构成贝叶斯纳什均衡。 ; 2、在下面的静态贝叶斯博弈中,求出所有的纯战略贝叶斯纳什均衡: (1)自然决定收益情况由博弈1给出还是由博弈2给出,选择每一博弈的概率相等; (2)参与者1了解到自然是选择了博弈1还是博弈2,但参与者2不知道; (3)参与者1以相同概率选择T 或B ,同时参与者2选择L 或R; (4)根据自然选择的博弈,两参与者都得到了相应的收益。 L R T B L R ) T B 解: (1) (B ,L ) (2) 参与者1在上边博弈时选T ,下边博弈时选B ; % 如果参与者推断自然选择上边博弈的概率>2/3,参与者2选L 如果参与者推断自然选择上边博弈的概率=2/3,参与者2选L 和选R 无差异 如果参与者推断自然选择上边博弈的概率<2/3,参与者2选R (3) 参与者1以相同的概率选T 或选B ; 如果参与者推断自然选择上边博弈的概率>2/3,参与者2选L 如果参与者推断自然选择上边博弈的概率=2/3,参与者2选L 和选R 无差异 如果参与者推断自然选择上边博弈的概率<2/3,参与者2选R (4) 自然选择上边博弈时,参与者1选T ,参与者2 选L ; 自然选择下边博弈时,参与者1选B ,参与者2 选R ;

博弈论——不完全信息静态博弈

3 不完全信息静态博弈 3.1 简介 博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。 不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。如在拍卖商品或工程招投标中。 信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。 但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。 在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。 3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡 在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。

Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。 N 首先行动,决定每个局中人的特征。每个局中人知道自己的特征,但不知道其他局中人特征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。 局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。 不完全信息静态博弈中,局中人的类型存在多种可能,因而与局中人相关的各种概念都随其类型的不同而不同。局中人的行动空间i A 将随类型i θ而变化,即)(i i i A A θ=。支付函数也是类型依存的,可将其记为:),,,,,(1i n i i i a a a u u θ = n i ,,1 =。 该式给出的是在其他局中人已选定行动j a ,n j ,,1 =,i j ≠时,局中人选行动)(i i i A a θ∈获得的支付。显然给定j a 时最大化i u 的i a 与i θ有关,即)(**i i i a a θ=,其中*i a 是给定j a 时最大化i u 的i a 。 用“类型依存”来描述包括最优战略在内的相关概念与类型的对应关系。

不完全信息博弈

不完全信息博弈 博弈论在20世纪70年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出一种特别的魅力。我们主要介绍不完全信息静态博弈与不完全信息动态博弈的一些基本知识,目的是给读者对不完全信息博弈理论及其应有一个初步的了解。 在不完全信息博弈里,参与人并不完全清楚有关博弈的一些信息。大多数纸牌游戏是不完全信息博弈。在桥牌里,你并不知道你伙伴手中的牌,也并不知道坐在左右两位对手手里的牌。你在作决策时,必须对其他三位手中的牌作一个估计,而没有确切的信息。 在拍卖商品或工程招投标中,参加拍卖的潜在买主愿意为拍卖品所支付的最高价格或参加工程招投标的投标者愿意为工程开出的最低价格只能是各个潜在买主或投标者心中的秘密,其他人是不清楚的,即使潜在买主或投标者告诉其他人他们愿支付的最高价格或最低价格,其他人也不会相信他们说的是真的。当你与一个陌生人打交道时,你并不知道他的特征,如喜欢什么,不喜欢什么。事实上,即使与你长期共事的人,也很难说你对他有完全的了解;当你想买一件古董或名画时,你并不知道卖主愿意脱手的最低价格是多少,或买主愿意出的最高价格是多少;当一个企业想进入某个市场时,它并不清楚已在市场上的企业的成本函数。如此等等,这样的例子举不胜举。类似上述这些不满足完全信息假设的博弈称为不完全信息博弈。 当然,如果对博弈对手一无所知,那么,也就无从博弈。现实生活中,大多数情况下,虽然对于对手的一些特征不完全了解,但总不至于一无所知。例如,打牌时,虽然不知道对手具体拿什么牌,但根据自己的牌,还是可以对手的牌有一个估计的,而且,随着牌局的展开,人们会不断改变这些估计。这些估计,可以用数学上的“概率分布”来表示。 在博弈论中,贝叶斯博弈所指的是:博弈参与者对于对手的收益函数没有完全信息(incomplete information);因此贝叶斯博弈也被称为不完全信息博弈。在约翰·海萨尼的研究框架下,我们可以将自然(Nature)作为一个参与者引入到贝叶斯博弈中。自然将一个随机变量赋予每个参与者。这个随机变量决定了该参与者的类型(type),并且决定了各个类型出现的概率、或是概率密度函数。在博弈进行过程中,根据每个参与者的类型空间所赋的概率分布,自然替每个参与者随机地选取一种类型。海萨尼的这一方法将贝叶斯博弈从不完全信息转化为不完美信息(此时,有的参与者不知道该博弈的历史)。参与者的类型决定了该参与者的收益函数。在贝叶斯博弈中,不完全信息所指的是,至少存在一个参与者,他(她)不能确定其他某个参与者的类型,从而也不能确定其收益函数。 不完全信息静态博弈中的归纳推理

贝叶斯博弈

不完全信息的市场进入博弈 参与人:企业1,企业2 行动空间:企业1选择建厂或不建厂,企业2 选择进入或不进入 行动顺序和信息结构:自然先以概率对(p,1 p)选择企业1 的成本类型(高,低),企业1 观察到自然的选择而企业2 不能观察到自然的选择;然后企业1 和企业2 同时采取其可选的行动。 赢利状况:如下表 对于例子的不完全信息博弈,将不完全信息博弈转化为标准形式贝叶斯博弈。这一方法是Harsanyi(1967-1968)创造的。 企业1选择DB, 企业2选择IN,构成贝叶斯纳什均衡;意思是,企业1当高成本类型时,选择“不建厂”,而当低成本类型时企业1选择“建厂”,企业2选择“进入”与企业1展开竞争。贝叶斯纳什均衡的结果为:(2.3,0.4),即双方获得的均衡利润。

不完全信息动态博弈(贝叶斯博弈) 我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样的不足。回顾前面讲过的,如果参与者的策略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。如果参与者的策略要成为博弈的一个完美贝叶斯均衡,它们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构成每一个后续博弈的子博弈完美纳什均衡。完美贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想在不完全信息博弈中的推广,它本身是纳什均衡。 为引进完美贝叶斯均衡概念,考虑如下不完全信息动态博弈。 [例1]首先,参与者1在3个行动中进行选择——L、M及R,如果参与者1选择R,则博弈结束(不等参与者2行动);如果参与者1选择了L或M,则参与者2就会知道1没有选择R (但不清楚1是选择了L还是M),并在或L'或R'两个行动中进行选择,博弈随之结束。收益情况由图10-1的扩展式博弈给出。

第六章 不完全信息静态博弈与动态博弈的基本理论教材

第六章不完全信息静态博弈与动态博弈的基本理论 第一节不完全信息静态博弈的基本理论 一.不完全信息博弈 1.回顾:本课2-4章介绍的均为完全信息博弈。如何区分完全信息与不完全信息?如何区分完美信息与不完美信息? 2.不完全信息博弈又称之为贝叶斯博弈(B ayesian game),在这里,博弈参与人的支付函数不再是博弈的公共知识,至少有一个参与人对另一个参与人的支付函数的了解是不确定的,即该参与人不了解另一个参与人究竟属于何种类型的参与人。例举生活中不完全信息博弈的情形。 不完全信息博弈包括两种类型:不完全信息静态博弈(又称静态贝叶斯博弈,static B ayesian game)与不完全信息动态博弈(又称动态贝叶斯博弈,dynamic B ayesian game)。激励机制设计中大量地涉及不完全信息博弈,通过巧妙的机制设计让私人信息拥有者报告自己的真实信息是机制设计的核心任务之一。 二.不完全信息静态博弈的刻画 1.例子 例一:不完全信息饮酒博弈 一个南方人和一个北方大汉在宴会相遇,这个北方大汉酒量大是众所周知的,而这个南方人是否酒量大,只有南方人自己清楚;北方大汉只知道这个南方人有p的概率酒量大,1-p的概率酒量小,这一点也是博弈的公共知识。具体情形如下: 图1:南方人酒量大 南方人 喝不喝 北方人喝 不喝 图2:南方人酒量小 南方人 喝不喝 北方人喝 不喝 问题:(1)南方人是否喝?(2)北方大汉是否喝? 如果北方人喝,期望支付为多少?北方人不喝,期望支付是多少?

例二:不完全信息古诺竞争模型 (1)假设该市场上只有两家生产同一产品的企业1和2;市场均衡价格由下式决定: ()P Q a Q =-,其中12Q q q =+,1q 、2q 分别代表企业1和2提供的产量;企业1的生产成本为:111()C q cq =,这一点是博弈双方的公共知识;企业1对企业2的成本函数是不确定的,即企业2的成本函数是企业2的私人信息,企业1只知道企业2的成本函数有θ的概率为:222()h C q c q =,有1-θ的概率为222()l C q c q =,其中h l c c >,这一点也是博弈的公共知识。两家企业同时选择自己的产量以最大化自己的利润。问题:请问两家企业应该如何确定自己的利润最大化产量。 (2)模型分析 A .求解企业2的产量选择 显然,不同成本类型的企业会选择不同的产量水平,即企业的产量选择是与成本挂钩的,于是企业2的产量选择有两种情形:2()h q c 与2()l q c 。 当企业2属于h c 类型时,2*212max ()q h q a q q c π=--- 当企业2属于l c 类型时,2*212max ()q l q a q q c π=--- 由上述两个规划问题的一阶条件,有: * 2 ()h q c =*12h a q c --;*2()l q c =*12l a q c -- B .求解企业1的产量选择 1*121max (())q h a q q c q θ--+(1-θ)*1211(())l a q q c q cq ---(思考:为什么这么写?) 由上式的一阶条件,有: *** 221(())(1)(())2h l a q c c a q c c q θθ--+---= C .联立三个一阶条件生成的方程组,可以得 *221()()36 h h h l a c c q c c c θ-+-= +-; *22()()36 l l h l a c c q c c c θ-+=-- *12(1)3h l a c c c q θθ-++-= (3)将上述结果与完全信息条件下的结果进行比较,h c 与l c 型企业在哪一种情形生产得更多?为什么?(导致这一局面的根本原因不仅在于企业的产量要受自己成本水平的影响,

博弈论第六章不完全信息静态博弈题库

博弈论第六章不完全信息静态博弈题库 【原创实用版】 目录 一、引言:介绍博弈论及其在经济学中的应用 二、不完全信息静态博弈的定义和特点 三、博弈论第六章不完全信息静态博弈的主要内容 四、如何解决不完全信息静态博弈问题 五、结论:总结博弈论在经济学中的重要性 正文 一、引言 博弈论作为经济学的一个重要分支,主要研究多个理性决策者在特定规则下的决策行为及其结果。在经济学中,博弈论的应用已经渗透到许多领域,如市场竞争、价格博弈、合作与信任等。通过研究博弈论,我们可以更好地理解经济现象及其背后的决策过程。 二、不完全信息静态博弈的定义和特点 不完全信息静态博弈是指在博弈过程中,参与者拥有不完全的信息。在这种情况下,参与者需要根据已知的部分信息和其他人的可能策略来选择最佳行动。不完全信息静态博弈的特点包括: 1.参与者拥有不完全的信息,无法了解其他参与者的准确策略和支付函数。 2.参与者的决策是静态的,即他们在一个特定的时间点上做出决策,不考虑未来可能的变化。 三、博弈论第六章不完全信息静态博弈的主要内容 博弈论第六章主要讨论了不完全信息静态博弈的解决方法,包括:

1.贝叶斯纳什讨价还价解:通过贝叶斯定理,参与者可以根据已知的部分信息和其他人的可能策略来推测其他人的支付函数,从而找到一个纳什讨价还价解。 2.声誉模型:在不完全信息静态博弈中,参与者可以通过建立声誉来影响其他参与者的决策。声誉好的参与者更容易达成合作,从而获得更好的支付。 3.信号博弈:信号博弈是一种通过发送信号来传递信息的博弈。参与者可以通过观察其他参与者的信号来推测其策略和支付函数,从而找到一个合适的行动。 四、如何解决不完全信息静态博弈问题 在不完全信息静态博弈中,参与者需要根据已知的部分信息和其他人的可能策略来选择最佳行动。以下是一些解决不完全信息静态博弈问题的方法: 1.充分沟通:参与者之间可以通过充分沟通来传递信息,从而减少不确定性,提高决策效率。 2.建立信任:在博弈过程中,参与者可以通过建立信任关系来降低其他参与者的背叛风险,从而更容易达成合作。 3.提高信息透明度:通过提高信息透明度,参与者可以获得更准确的信息,从而更容易找到合适的策略。 五、结论 博弈论在经济学中的应用为我们提供了一种理解和分析经济现象的有效方法。在不完全信息静态博弈中,参与者需要根据已知的部分信息和其他人的可能策略来选择最佳行动。

不完全信息静态博弈案例 扶老人 林志涵

让道德与理性同行 ——不完全信息静态博弈案例分析 2012333501054 林志涵 12经济学1班 摘要:通过简单的博弈论分析方法对日常生活中具有现实意义的社会现象进行分析,从而在理性人假设的前提下,在各种因素的影响下,在个人取得利益最大化的同时,通过政策或法律的有效实施来使得道德能得到发扬提倡。 关键词:不完全信息静态博弈社会现象道德与理性 不完全信息静态博弈 在不完全信息静态博弈里,参与人并不完全清楚有关博弈的一些信息,所有参与人在共同决策环境中同时选择行动策略,每个参与人只选择一次。 纳什均衡,在给定的其他参与人选择的前提下,参与人根据自身收益选择的最优战略。 1.背景: “除非有人证物证,否则我不会再去扶跌倒的老人!”广东肇庆的阿华在扶起倒地的70多岁阿婆却遭诬陷后表示。事发7月15日早上,阿华开摩托车上行人道准备买早餐,看到路边有位老太太跌倒在求救,阿华立刻停下来,扶起老奶奶,殊不知却遭到阿婆的诬陷,随后和阿婆的女婿发生争执。阿婆被送到医院住院观察。为调查真相,交警暂扣了阿华的摩托车。事发后几天,阿华说没睡过一次好觉,还向单位请了几天假,天天在附近找证人,就是为了证实自己清白。 这一案件的真想不言而喻,老婆婆家人蛮不讲理地要求赔偿和阿华地好心搀扶倒地老婆婆形成了鲜明的对比,好心被当驴肝肺的事情就这么真真实实的发生在了我们的身边,社会风气遇到了极大的挑战,这引发了社会各界针对这一事件的激烈讨论。到底该不该扶?本文将在经济人假设的前提下,通过不完全信息静态博弈的思想进行分析阐述,并探讨我们如何通过一系列客观因素的影响,来使得利益与道德同行。 2.博弈的假设与建模: 假设: ①参与博弈的双方是理性人,都会选择个人利益最大化的行动。 ②假设阿婆在未有人搀扶时便决定是否坑钱,而路人并不知道阿婆是否会坑钱,即参与人在决策时不知道对方的策略同时也并不知道对方能够的收益函数。 ③假定当事人双方最终解决方法由交警决定,当事人将面临交警正确处理和错误处理两种。 参与人:阿婆、路人 行动选择:路人——帮忙扶起、不帮忙扶起 阿婆——被扶起后坑钱、不坑钱 3.支付收益: 1)在不考虑交警是否正确判断因素下,阿婆倒地没人扶会有-10的身体伤 害,在阿婆不坑钱的情况下仍然没有人扶会多产生负收益-10的心灵损 失(路人不知道阿婆是否坑钱);路人选择帮忙且阿婆不坑钱会产生10

博弈论四种博弈类型

华为在阿根廷电信设备市场上的竞争博弈 华为技术冇限公司是一家总部位于中国广东省除圳市的生产销售电信设备的员工持股 的民营科技公司,经过数十年的发展,成为全球最人的电信网络解决方案提供商,全球第二 人电信基站设备供应商,同时也是全球第六人手机厂商,其海外市场的利润占到其总利润的 75%:在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场山岌鼻信、阿尔卡特- 朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下來,我们将分析其不同条件下 的博弈结果: 1、完全信息情况下的静态轉弈 A 、纳什均衡:我们将上述三家公司统称为原有垄断者•,华为称为虎视眈眈的潜在进入 者,原冇垄断者想要保住自己现冇的垄断地位,就会想要阻止潜在进入者进入,在这个博弈 中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同 竞争,具体的支付矩阵结果表示如下: 不斗争 斗争 根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的瑕 好的一组策略。当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获彳'J 70单位 的利润;同样的,原有垄断者选择不斗争的情况2潜在进入者的最优选择是进入,获得 20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个 纳什均衡(不进入,斗争)。 B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许町证,在严格管制 情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各 自均有止的利润)在这两种情况卜考虎两者是否进行价格战的情况,具体支付矩阵如卜•所示: 原有垄断者 对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进 行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润, 在原有垄断者定高价时,潜在进入者定低价町以获得额外的10单位利润,从而确定华为必 将进行价格战,在完全信息情况卜,原何垄断者会将自己豐于潜在进入者的位豐进行决策, 从而决定自己也要进行价格战,否则会失去更多的利润。 A 情况与实际情况相同,因为根据相关资料显示•华为的研发费用、人力成本等对电信 设备价格影响审人的成本仅约为其他竞争者的八分之一,其他竞争者没有能力进行价格战从 而阻止华为进入阿根廷电信市场。 B 怙况与实际不相符,按照华为在发展中国家的竟炉策略, 其战略重心并不在于短期的利润,而在于抢夺市场份额,排挤竞争对手,而其竞爭对于•往往 无力在削价竞争中与华为竞争,价格仍然较高。 2、完全信息情况下动态博弈 A 、威胁与承诺:动态聘弈指的是参与若的行动有先后,且后行动者町以观测到先行动 者的行为,那么完全信息静态博弈A 中支付矩阵需要表示为陣弈树形式: 原有垄断者 /不斗争 20,70 进入< 潜在进入 低价 者 高价 低价 高价

不完全信息静态博弈例子

不完全信息静态博弈例子 博弈论是研究决策者在相互影响下进行决策的数学模型。在博弈论中,不完全信息静态博弈是一种常见的博弈形式。在这种博弈中,每个决策者只能获得有限的信息,无法完全了解其他决策者的策略和利益。本文将通过一个例子来说明不完全信息静态博弈的特点和解决方法。 假设有两个商人A和B,他们同时决定是否进入一个新的市场。进入市场的成本是固定的,但市场的利润是不确定的。商人A可以选择进入市场或不进入市场,商人B也可以做出相同的选择。然而,商人们只能获得有限的信息,无法准确了解对方的决策和市场利润。 商人A和B的利益是相互关联的。如果两个商人都选择进入市场,他们将面临更大的竞争和风险,但如果市场利润高,他们也有机会获得更大的回报。如果一个商人选择进入市场而另一个商人选择不进入市场,前者将面临更大的风险,但如果市场利润高,他将独享这一利润。 在这个例子中,商人A和B都面临着不完全信息的情况。他们无法准确了解对方的决策和市场利润,只能根据自己的信息做出决策。这种情况下,他们需要通过分析对方的可能策略和利益来做出最优的决策。 为了解决这个问题,我们可以使用博弈论中的概念和方法。首先,我们可以建立一个博弈矩阵来描述商人A和B的策略和利益。矩阵的

行表示商人A的策略,列表示商人B的策略,每个单元格表示两个商 人在不同策略下的利益。 然后,我们可以使用博弈论中的解概念来找到最优策略。例如,纳 什均衡是指在博弈中,每个决策者都选择了最优策略,而且没有动机 改变自己的策略。通过分析博弈矩阵,我们可以找到纳什均衡点,即 商人A和B都选择了最优策略。 在这个例子中,纳什均衡点可能是商人A和B都选择进入市场,或者都选择不进入市场。这取决于市场利润的不确定性和商人们的风险 偏好。如果市场利润高,商人们可能更倾向于进入市场以获取更大的 回报;如果市场利润低,商人们可能更倾向于不进入市场以避免风险。 然而,由于不完全信息的限制,商人A和B可能无法准确预测市场利润。在这种情况下,他们可以采取一些策略来减少不确定性的影响。例如,他们可以进行市场调研,收集更多的信息来预测市场利润;他 们也可以与其他商人进行合作,共享信息和风险。 总之,不完全信息静态博弈是博弈论中的一种常见形式。通过分析 博弈矩阵和应用博弈论的解概念,我们可以找到最优策略。然而,由 于不完全信息的限制,决策者可能需要采取其他策略来减少不确定性 的影响。博弈论为我们提供了一种理论框架,帮助我们理解和解决这 类问题。

完全信息和不完全信息-博弈论相关

3、完全信息和不完全信息: 完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数. 在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数. 温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。显然不完全信息意味着不完美信息,但逆命题不成立。 12、完美和不完美信息: 不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。 完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然")的行动选择有准确了解的情况,即每一个信息集只包含一个值。 2、贝叶斯均衡: 是纳什均衡在不完全信息博弈中的自然扩展。在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择.给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型.这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用 14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。 贝叶斯纳什均衡:P147 4、有限次重复博弈: 16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。 7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。 激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。显然,只有代理人选择委托人所希望的行动是得到的期望效用不小于他选择其他行动是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。满足激励相容约束的机制称为可实施机制。 8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H是PAI发生的概率的比率,它告诉观测者观测到的PAI在多大程度上来自分布f l而不是来自于f h。较高的似然率意味着PAI 有较大的可能性来

几个博弈案例

几个博弈案例 1.囚徒困境 警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境与面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(坦白还是抵赖)? 2.智猪博弈(占优战略均衡) 猪圈里有一头大猪,一头小猪。猪圈的边缘有个踏板,每踩一下,远离踏板的投食口就会落下少量食物。如果是小猪踩踏板,大猪会在小猪跑到食槽之前吃光所有食物;若是大猪踩踏板,则小猪还有机会吃到一点残羹冷炙,因为小猪食量小嘛。那么,两头猪会采取什么策略呢?答案是:小猪将安安心心地等在食槽边,而大猪则不知疲倦地奔忙于踏板与食槽之间。办公室里也会出现这样的场景:有人做“小猪”,舒舒服服地躲起来偷懒;有人做“大猪”,疲于奔命,吃力不讨好。但不管怎么样,“小猪”笃定一件事:大家是一个团队,就是有责罚,也是落在团队身上,所以总会有“大猪”悲壮地跳出来完成任务。想一想,你在办公室里扮演的角色,是“大猪”,还是“小猪”?(其实小猪的决策是明智的,想想同一个公司,小股东与大股东的行为。) 3.性别之争(多重纳什均衡) “有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢看肥皂剧节目,但是家里只有一台电视,于是就产生了争夺频道的矛盾。假设双方都同意看足球赛,则丈夫可得到2单位效用,妻子得到一单位效用;如果都同意看肥皂剧,则丈夫可得到1单位效用,妻子得到2单位效用;如果双方意见不一致,结果只好大家都不看,各自只能得到0单位效用。这个博弈的策略式表达如下:

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡 问题。博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时 点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。不完全信息: 参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与 人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工 具是无差异曲线。可表示为:maxU(P,l),其中P为市场价格,丨为消费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效 用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依 赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦 称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合r={1,2,...,n} 2、每位参与人非空的战略集S i 3、每位参与人定义在战略组合H s=(SSS)上的效用函数Ui(s1,s2,...,sn). i1in 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、r={1,2,...,n}参与人集合 2、参与人的行动顺序,即每个参与人在何时行动; 3、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所 了解的信息; 4、参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。

8.1静态贝叶斯博弈和贝叶斯纳什均衡

第八章 不完全信息静态博弈 这一章里我们讨论不完全信息静态博弈,也称为贝叶斯博弈(Bayes)。不完全信息博弈中,至少有一个参与者不能确定另一参与者的收益函数。非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction):每一报价方知道自己对所售商品的估价,但不知道任何其他报价方对商品的估价;各方的报价放在密封的信封里上交,从而参与者的行动可以被看作是同时的。静态贝叶斯博弈问题的主要来源也是现实经济活动,许多静态博弈关系都有不完全信息的特征,研究贝叶斯博弈不仅是完善博弈理论的需要,也是解决实际问题的需要。 8.1 静态贝叶斯博弈和贝叶斯纳什均衡 为了更好的说明不完全信息与完全信息之间的差异,我们用一个典型静态贝叶斯博弈作为例子,自然的引进静态贝叶斯博弈概念。 8.1.1不完全信息古诺模型 考虑如下两寡头进行同时决策的产量竞争模型。其中市场反需求函数由Q a Q P -=)(给出,这里21q q Q +=为市场中的总产量。企业1的成本函数为1111)(q c q C =,不过企业2的成本函数以θ的概率为222)(q c q C H =,以θ-1的概率为222)(q c q C L =,这里H L c c <。并且信息是不对称的:企业2知道自己的成本函数和企业1的成本函数,企业1知道自己的成本函数,但却只知道企业2边际成本为高的概率是θ,边际成本为低的概率是θ-1(企业2可能是新进入这一行业的企业,也可能刚刚发明一项新的生产技术)。上述一切都是共同知识:企业1知道企业2享有信息优势,企业2知道企业1知道自己的信息优势,如此等等。 现在我们来分析这个静态贝叶斯博弈。一般情况下,企业2的边际成本较高时选择较低的产量,边际成本较低时,选择较高的产量。企业1从自己的角度,会预测到企业2根据 其成本情况将选择不同的产量。设企业1的最佳产量选择为*1q ,企业2 边际成本为H c 时 的最佳产量选择为)(*2H c q ,企业2 边际成本为L c 时的最佳产量选择为)(*2L c q ,如果企业2的成本较高,它会选择)(* 2H c q 满足: 22*1])[(max 2q c q q a H q --- 类似地,如果企业2的成本较低,)(*2L c q 应满足: 22*1])[(max 2q c q q a L q --- 从而,企业l 为了使利润最大化,选择*1q 应满足: }])()[(1(])([(max{11*2111*212q c c q q a q c c q q a L H q ----+---θθ 三个最优化问题的一阶条件为: 2)( ,2)(*1*2*1* 2L L H H c q a c q c q a c q --=--=

[恋爱婚姻中的信息不对称与博弈]信息不对称下的动态博弈

[恋爱婚姻中的信息不对称与博弈]信息不对称下的动态 博弈 关键词恋爱信息博弈 一、恋爱市场中的信息不对称与博弈 供给与需求的存在是市场出现和存在的必然前提。恋爱市场的供求双 方自然就是男人和女人。而且,由于男性在恋爱中通常更为主动和大胆一些,女性在恋爱中往往更为被动和羞涩一些,于是,这里假定男人为恋爱 市场中的需求方,而女人则是供给方。恋爱市场是一个信息严重不对称和 不充分的市场,因为谈恋爱的男人和女人之间不可能完全了解对方,自己 也总是比对方更了解自己。但随着恋爱时间的增加,双方对对方信息的掌 握会越来越多,双方之间的相互了解会越来越深刻。 正如劳动力市场总是存在失业者一样,恋爱市场总是存在“失恋者”。这里把“失恋者”定义为:想谈恋爱而找不到合适恋爱对象的男人或女人,与我们日常生活中所说的“失恋者”的定义是不太一样的。劳动力市场中 存在失业的原因有经济不景气、自己的劳动技能不足、学历太低等,而恋 爱市场中存在失恋的原因则更为复杂。我们可以看到许多各个方面都非常 优秀的男孩子或者女孩子找不到理想的对象,而有一些各个方面都很平常 的人却总是不缺男(女)朋友。这一方面说明恋爱的成功率与一个人素质 的高低没有太大的关系,另一方面说明“主动”对谈恋爱有着很大的作用,因为一个人在恋爱中所表现的“主动”程度一般是与自身素质高低成反比的,自身条件越优越的人往往恋爱趋向于等待和被动。用失恋者的总人数 除以恋爱市场中的总人数,我们就得到了“失恋率”。“失恋率”也是随 时代的变化而变化的,在封建社会和计划经济时代,一方面男女之间的恋 爱常常是父母之命、媒妁之言或者同学、同事、战友之间的革命情谊,男

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境” 摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信 息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。 关键词:博弈论囚徒困境经济 一、完全信息静态“囚徒困境”博弈 完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。 它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。 用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) : 囚徒2 囚 徒 1 (表1) 假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。容易看出,由于对

于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。 二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈 研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。 下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。博弈重复进行所耗时间会比较长,支付的时间价值必须考虑,记r为折现因子。在有限博弈的情况下,可简化在r = l 的情况下讨论,并采用动态博弈的逆向归纳法进行研究: 先分析t = T阶段两博弈方的选择,这仍然是一个基本的囚徒困境博弈,此时前一阶段的结果已成为事实,又无后续阶段,因此不难得出结论,这一阶段的结果是(坦白,坦白),双方得益( -3 ,-3)。现在回到t = T -1阶段,理性的博弈方对于后一阶段的结局非常清楚,其结果必然是(坦白,坦白),因此不管现阶段的博弈结果是什么,双方在本阶段以后的最终得益都是在本阶段得益的基础上各加上-3,此时的得益矩阵是: 囚徒2 囚 徒 1 (表2) 容易看出,坦白仍是两博弈方的严格优超策略,即(坦白,坦白) 是T - 1阶段的唯一的纯Nash均衡。以此往上类推,每阶段“囚徒困境”博弈的结果都是博弈双方采用坦白,所以T次重复博弈的子博弈精炼Nash均衡是每个博弈阶段双方都采用坦白。 再考虑“囚徒困境”博弈重复无数次。因为无限博弈没有最终阶段,所以不能运用逆向归纳法求解。考虑博弈双方都采用“冷酷战略”:( 1 ) 开始阶段选择抵赖;( 2 )选择抵赖直到有一方选择了坦白,为了报复对手的背叛,以后都选择坦白。假定囚徒j 严格执行上述冷酷战略,考察囚徒i 的最优策略是否为冷酷战略:如果i 在博弈的某个阶段首先选择了坦白,他在该阶段得到0,而不是-1,但他的这次背叛会遭到囚徒j的永远惩罚,因此i 在随后每个阶段的支付都是-3 。如果下列条件满足,给定j没有选择坦白,i将不会选择坦白: 22 0+r(-3)+r(3)-1+r(-1)+r(-1) -+≤+ ……,即: 31 11 r r r -≤- -- 解上述不等式得:r≥1/3 (这个条件容易满足)。就是说,如果r ≥1/3,给定j 坚持冷酷战略并且j没有首先坦白,i不会选择首先坦白。进一步假定j首先选择坦白,那么i 是否有积极性坚持冷酷战略以惩罚j的不合作行为?如果i 坚持冷酷战略,他随后每个阶段的支付是-3,但如果他选择其他战略,他在任何单一阶段的支付都不会大于-3,因此,无论r是多大,i都有积极性坚持冷酷战略。在博弈重复无数次的情况下,只要r>1/3,子博

相关主题
文本预览
相关文档 最新文档