纳什讨价还价问题 (翻译)
- 格式:docx
- 大小:36.74 KB
- 文档页数:4
纳什均衡1.在下表所示的战略式博弈中,找出重复删除劣战略的占优均衡表1.1首先,找出S2的劣战略。
对于S2,M策略严格劣于R策略,所以M为严格劣策略。
删除后M再找出S1的劣战略,显然对于S1而言,M策略和D策略严格劣于U策略,所以M和D为严格劣策略。
删除M与D后找占优均衡为(U,L)即,(4,3)。
2.求解下表所示的战略博弈式的所有的纯战略纳什均衡表1.2首先看S1选择X策略。
如果S2同样选择X策略,那么S3一定选择Y策略;同样,如果S3选择Y策略,S2也一定会选择X策略,因此(X,X,Y)是一个纳什均衡;如果S2选择Y策略,那么S3一定选择X策略;同样,如果S3选择X策略,S2也一定会选择Y策略,因此,(X,Y,X)是一个纳什均衡。
其次看S1选择Y策略。
如果S2选择X策略,S3一定选择X策略;同样,如果S3选择X策略,S2也一定会选择X策略,因此(Y,X,X)是一个纳什么均衡。
如果S2选择Y策略,S3选择Y策略是理性的,如果S3选择X,S2将选择X,这样(Y,Y,X)将不是一个纳什均衡;同样,如果S3选择Y策略,S2也一定会选择Y策略,因此(Y,Y,Y)是一个纳什均衡。
所以该博弈式的纯战略纳什均衡有4个:(X,X,Y)(X,Y,X)(Y,X,X)(Y,Y,Y)。
3.(投票博弈)假定有三个参与人(1、2和3)要在三个项目(A、B和C)中选中一个。
三人同时投票,不允许弃权,因此,每个参与人的战略空间Si={A,B,C}。
得票最多的项目被选中,如果没有任何项目得到多数票,项目A被选中。
参与人的支付函数如下:U1(A)=U2(B)=U3(C)=2U1(B)=U2(C)=U3(A)=1U1(C)=U2(A)=U3(B)=0求解以上博弈的所有纯战略纳什均衡。
由上,ABC策略是无差异的,但均衡策略只能是参与人3选择A 策略,因此(A ,A ,A )是一个纳什均衡。
如果参与人2选择B 策略,参与人3选择AB 策略是差异的,但均衡策略只能是其选择A ,因此(A ,B ,A )是一个纳什均衡。
纳什讨价还价博弈模型与实例在经济学中,博弈论是研究决策制定和策略选择的重要理论工具。
纳什讨价还价博弈模型是博弈论中的一种典型模型,用于分析参与者在讨价还价过程中的策略选择和效用最大化问题。
本文将介绍纳什讨价还价博弈模型的基本概念和数学表达,并结合实际案例进行解析。
一、纳什讨价还价博弈模型的基本概念纳什讨价还价博弈模型是由约翰·纳什提出的,用于分析多方参与者在讨价还价过程中的策略选择和达成协议的问题。
在博弈模型中,每个参与者都会追求自己的最大化利益,通过制定合适的策略来达到目标。
在讨价还价过程中,参与者可以选择不同的策略,例如提出高价、低价或中等价位,以实现自己的利益最大化。
而其他参与者也会根据自身利益制定策略,双方需要在博弈中找到最优解,即双方都无法通过改变策略来获得更好的结果。
二、纳什讨价还价博弈模型的数学表达纳什讨价还价博弈模型可以用数学符号来表示。
假设有两个参与者,分别记作P1和P2,他们的讨价还价策略分别为x和y。
参与者的效用函数分别为U1(x,y)和U2(x,y)。
在纳什讨价还价博弈模型中,每个参与者的目标是最大化自己的效用函数。
P1的效用函数可以用如下形式表示:U1(x,y) = p1(x) - c(x,y)其中,p1(x)表示P1根据策略x所能获得的收益,c(x,y)表示为了达成协议而付出的代价。
同样地,P2的效用函数可以表示为:U2(x,y) = p2(y) - c(x,y)参与者P2的收益p2(y)和代价c(x,y)的定义与参与者P1类似。
参与者P1和P2的决策是相互影响的,通过博弈求得双方最优解,即纳什均衡。
三、纳什讨价还价博弈模型的实例为了更好地理解纳什讨价还价博弈模型,我们可以通过一个实际案例来进行分析。
假设有两个公司A和B在进行价格谈判,他们希望通过讨价还价策略来确定最终的交易价格。
公司A可以选择提出高价、低价或中等价位,记作x1、x2和x3。
公司B也可以做出相应的选择,记作y1、y2和y3。
搏弈论阿维纳什•迪克斯特&巴里•内尔巴夫1搏弈是有关策略的科学。
它试图以数学和逻辑的方法来帮助搏弈者作出决策,在一系列纷繁复杂的搏弈中应采取何种策略来保证自己获得最大利益。
搏弈论研究的搏弈的范围包括了从下棋到抚育儿童,从网球竞技到公司转手。
但是所有的博弈都具有一个共同的特征:相互作用。
也就是说,每一个博弈者的博弈结果取决于所有博弈参与者的策略选择。
在零和搏弈中,搏弈者的利益之间是完全冲突的,因此一方的得利必然导致另一方的损失。
更多具有代表性的例子还有会导致共同得利(正和)搏弈和共同损失(负和)搏弈,同样的情况还会发生在另外一些冲突中。
2搏弈论研究的先驱者是普林斯顿数学家约翰•冯•诺依曼。
在早先的一段时间里,研究的重点被放在了完全冲突(零和)搏弈(非合作搏弈)上,其他的搏弈当时被认为是以合作形式出现。
也就是说,搏弈要求参与者共同地选择和实施他们的行为.最近的研究则把重点放在了那些既不属于零和搏弈也不属于绝对合作搏弈的情况上,在这些搏弈中,搏弈者自主地选择搏弈行为,但他们之间的相互关系中充满了合作与竞争。
3搏弈行为与我们在中性环境中所作的各种决定有着根本性的不同。
要说明这一点,我们可以思考一下伐木工人和军队将军所作决定之间的不同。
当伐木工人决定要如何砍树时,他不会考虑树木本身会有什么反抗,他所处的环境为中性。
而当将军决定要消灭敌军时,他必须提前预料到并消除敌军的反抗。
与这一例子中的将军相类似,一个搏弈者必须认识到他与其他机智且怀有争胜之心的竞争者之间的相互作用,他自己所作的决定也必须能够同时应对可能出现的合作或冲突。
‖4搏弈的实质是搏弈者采取策略之间的相互依赖性。
这种策略性的相互依赖表现为两个不同的类别:连续策略之间的相互作用以及联立策略之间的相互作用。
就前者而言,搏弈者依次采取行动,每个人都会注意其他搏弈者先前的行为。
就后者而言,搏弈者同时采取行动,每个人都会忽略其他搏弈者当前的行为。
5对连续策略博弈中的某一博弈这来说,一个普遍的原则就是放眼前方,及时反思和总结。
讨价还价理论-详解讨价还价理论(Bargaining Theory)目录• 1 讨价还价理论的概述• 2 讨价还价理论的产生• 3 讨价还价理论的分类• 4 约翰·纳什的讨价还价理论• 5 相关条目链接讨价还价理论的概述讨价还价理论是博弈论经济学中的重要理论,在经济学研究的诸多场合皆有应用。
而许多现实的交易和协调问题也可通过讨价还价理论来模拟。
作为博弈论的一个分支,讨价还价理论是随着博弈论的不断完善而发展起来的。
讨价还价(Bargaining)也称为议价或谈判,主要是指参与人(也称为局中人)双方通过协商方式解决利益的分配问题,称讨价还价时主要强调其动作或过程,称谈判时则强调其状态或结果。
讨价还价理论的产生讨价还价理论是托马斯·谢林早期的主要贡献所在,他的一篇名为《讨价还价漫话》(Anessayonbargaining)的论文首先发表在1956年的《美国经济评论》上,之后又收编入《冲突的战略》的第二章。
他所说的讨价还价是广义的,即除了明确协商之外的所有活动。
比如在两个国家或买卖双方之间的谈判活动,甚至当两辆装满炸药的卡车在一条并不宽敞的公路上相遇时也存在着“讨价还价”。
从博弈论的角度来看,讨价还价是一个非零和博弈。
通过对讨价还价现象进行分析,谢林得出一个惊人的结论:“在讨价还价的过程中,势弱的一方通常会成为强者。
”对此也可以这样理解,即将自己固定在特殊的谈判地位是有利的,当任何一方认为对方不会作出进一步的让步时,协议就达成了。
一方之所以会让步,是因为他知道对方不会让步了。
因此可以认为,谈判的实力就在于让对方相信你不会再让步了。
讨价还价理论的分类按照理论分析框架的不同,讨价还价理论可以分为合作博弈的讨价还价理论和非合作博弈的讨价还价理论,也可以按照信息结构的不同,分为完全信息讨价还价理论和非完全信息讨价还价理论。
约翰·纳什的讨价还价理论关于对博弈论的重构,纳什第一个伟大贡献是他的两人讨价还价理论。
纳什讨价还价问题约翰·福布斯·纳什在经济问题中出现了一种新的处理方式。
它可以以很多形式出现,例如讨价还价,双边垄断等等。
它也可以被看作是一种非零和博弈。
在这种处理方式中,一般的假设是,在特定的经济环境中关于单个的个人的和一个两个人的群体的行为。
从这些假设出发,我们可以得到这个经典问题的解。
这篇文章对博弈论来说也是有价值的。
引言一个两人博弈讨价还价的解涉及到两个个人,他们为了双方共同的利益都有合作的机会,而且合作还不止一种方式。
在更简单的情况下,正如本文所考虑的,在没有另一个人同意情况下,一个人不能采取任何行动来影响另一个人的福利。
卖方垄断与买方垄断的经济情况,两国之间的国际贸易,还有雇主和劳动联盟之间的谈判都可以被看成是讨价还价问题。
本文的目的是为这些问题提供一个理论上的探讨,并且获得一个确定的“解”——当然,为此我们做了一些理想化的的假设。
这里的“解”的意思是:每一个个人期望从这种情况中获得的满意的数量的决定。
或者,甚至是,对于每一个个人来说,拥有讨价还价的机会应该价值多少的决定。
这就是经典的交换问题,更确切地说,古诺等人所说的双边垄断。
冯·诺依曼和摩根斯坦在《博弈论和经济行为》一书中介绍了另一种方法。
书中用两人非零和博弈来证明这种经典交换情形。
总的来说,通过设定一些假设,我们将讨价还价问题理想化了。
这些假设包括:两个个体都是高度理性的;每一个人都能精确地将他自己的意愿和不同的东西相比较;他们在讨价还价的能力上是相等的;并且每一个人都完全了解对方品位和偏好。
为了给出讨价还价情形的理论解释,我们提取出这种情形来建立一个明确的数学模型。
在寻找讨价还价解的过程中,我们采用基数效用来表示讨价还价中个人的偏好或者品位。
通过这个方法,我们将个人的意愿加入到数学模型中,以此来最大化他在讨价还价中的收益。
我们将简略地回顾一下这篇论文中所用的专业术语的理论。
个人的效用理论预期这个概念在这个理论中是很重要的。
我们将会部分地解释一下这个概念。
假设斯密思先生知道他明天将会获得一辆新的别克汽车。
我们就说他有一个别克汽车的预期。
同样地,他也可能有凯德拉克汽车的预期。
假如他知道明天用掷硬币的方式来决定他到底是拥有别克汽车还是凯迪拉克汽车,我们就说,他有二分之一的别克汽车和二分之一的凯迪拉克汽车的预期。
因此,个人的预期是一种期待的状态。
这种期待也许涉及到一些可能事件的必然性,或者是其他可能事件的不同概率。
另一个例子,斯密思先生可能知道他明天将会得到一辆别克汽车并且认为他也有二分之一的概率获得一辆凯迪拉克汽车。
上文提到的二分之一的别克汽车和二分之一的凯迪拉克汽车的预期阐释了下面预期的重要性质:假如0≤p≤1,A和B代表两个不同的预期,这就会有一个预期pA+(1-p)B。
它是由概率为A和概率为B的两个预期的概率组合而成。
通过做出如下假设,我们能够建立个人的效用理论:1.一个提供两种可能的预期的个人能够决定哪一个是更好的,或者至少它们是一样好的;2.因此而产生的顺序是可传递的。
假如A比B更好,B比C更好,则A比C更好;3.任何相同意愿的状态的概率的组合,彼此之间是令人满意的;4.假如A,B,C符合假设2,那么,存在一个A,C的概率组合使得它和C一样好。
这意味着假设的连续性;5.假如0≤p≤1,A,B一样好,那么pA+(1-p)C和pB+(1-p)C一样好。
假如A,B一样好,那么当B满足任何的意愿顺序关系时,A可以替代B。
这些假设条件足够说明存在符合要求的效用函数。
将每一个个人的预期都赋予一个实数。
这个效用函数并不是唯一的,这是因为,假如u是这样一个效用函数,那么au+b也会是一个效用函数(a>0)。
令大写字母代表预期,小写字母代表实数。
这样的效用函数将会满足一下性质:1.u(A)> u(B)等价于A比B更好,等等;2.假如0≤p≤1,那么u [pA+(1-p)B]=p u(A)+(1-p)u(B)。
这就是效用函数重要的线性性质。
两人理论在《博弈论和经济行为》一书中,作者提出了n个人博弈的理论。
它将两人讨价还价问题作为其特殊的情形。
但是,那里所发展的理论没有试图找出给定的n个人博弈的价值,也就是,对于每一个参与人来说,决定有机会参与到博弈中来有什么价值。
这种决定只有在两人零和博弈情况下才能达到。
我们的观点是:这些n个人博弈应该是有价值的。
那就是,应该有一组数字,它连续地取决于一组数量,而这组数量由博弈的数学描述构成。
并且,这组数字表示每一个有机会参与到博弈中的个人的效用。
我们将一个两人预期定义为两个一人预期的组合。
这样,我们就有两个个人,每一个个人都有一个关于他自己未来环境的确定的预期。
我们把一人效用函数看成是可应用到两人预期的。
假如一人预期(两人预期的一个组成部分)被应用到相应的两人预期中,那么每一个一人预期都给出了它将要给出的预期。
两个两人预期的概率组合的定义为给它们的成分制定相应的组合。
因此,假如[A,B]是一个两人预期,并且0≤p≤1,则有p[A,B]+(1-p)[C,D]将被定义为[pA+(1-p)C,pB+(1-p)D]显然,一人效用函数和一人情况一样拥有相同的线性特征。
从这一点来看,当使用“预期”这一名词时,它表示的意思是两人预期。
在一个讨价还价情形中,一个预期是很容易辨别的。
这是一种在讨价还价者之间的非合作的预期。
因此,对两个个体使用效用函数很自然的。
这两个个体赋予预期的数字为0.这依然使得每一个个体的效用函数由只和正的实数相乘来决定。
从此以后,任何效用函数的使用都一定要被理解成这样被选择。
我们制作一个图标来表示面对如下两种情形:给它们选择效用函数以及在平面图形上构建所有可用的预期的效用。
介绍关于获得的点集的性质的假设是有必要的。
我们希望假设从数学的意义上来说,这个点集是紧的凸的。
它也应该是凸的,因为通过描绘成两点的两个预期的适当的概率组合,在点集中的两点构成的线段上,总是能够找到描绘成任意点的预期。
紧的条件暗示了一件事:点集一定是有界的。
这就是说,它们能够被包围在一个足够大的平面空间。
紧还暗示着任何连续的效用函数在集合中的某些点具有最大值。
我们应该把与具有相同效用的任何效用函数相对应的两个个体的预期看成是等价的。
因此,这个图形变成了这种情形的重要特征的完全描述。
当然,图形仅仅由比例的改变所决定,因为效用函数并没有完全决定。
现在,因为我们的解应该包含两个讨价还价者获得的理性预期,所以这些预期应该在这两个人之间适当的契约是可实现的。
因此,应该存在一个可利用的预期,这个预期给每个人他所期望获得的满足的数量。
有理由假设:两个人是理性的将会很容易符合那种预期,或者是一个等价的预期。
因此,我们把图形中的集合的某一点看做是代表“解”。
并且它也代表所有的作为公平讨价还价的两个人会同意预期。
通过给定在这个解点和集合之间应该成立的条件,以及从这些演绎出一个简单的决定解点的条件,我们扩展了这个理论。
我们应该只考虑那些存在一个双方都能从这种情形中获利的例子。
(这并没有排除那些最后只有一个人获益的例子,因为“公平的交易”可能包含一个契约用以使用某种概率的方法来决定最后谁获得收益。
任何可利用的预期的概率的组合都是可以利用的预期)令u1和u2表示两个人的效用函数。
令c(S)表示集合S的解点。
S是紧的凸的,还包括原点。
我们假设:6.假如α是S中的点,在S中存在另一点β,若u1(β)> u1(α),u2(β)> u2(α),则α≠c(S)。
7.假如集合T包含集合S,并且c(T)在集合S中,那么c(T)= c(S)。
我们说一个集合S是对称的假如存在效用算符u1和u2以致于当(a,b)包含于集合S 时,(b,a)也包含于集合S。
这就是说,图形关于直线u1=u2对称。
8.假如S是对称的,并且u1和u2显示出这样的性质,那么c(S)是一个形式为(a,a)的点。
这就是,在直线u1=u2上的一点。
上文第一个假设表达的意思是:每一个个人希望在最终的交易中最大化他自己的效用。
第三个假设表达讨价还价技巧的质量。
第二个假设有点复杂。
以下的描述或许有利于揭示这条假设的性质:假如两个理性的个人同意c(T)是一个公平的交易,假如T是可能的交易的集合,那么他们应该愿意签订一个限制更少的契约,并且如果S包含c(T),没有试图到达任何集合S以外的点的交易。
假如S包含于T,这将会减少有S的概率集合的情形。
因此c(T)= c(S)。
现在,我们展示这些条件要求解在点集的u1和u2 取最小值的第一象限。
我们知道一些这样的点存在于紧空间。
凸性使它独特。
现在让我们选择效用函数,这样以上提到的点就转换成点(1,1)。
因为这涉及到效用乘以常数,点(1,1)现在将是u1,u2最佳的点。
集合中没有哪一点使得u1+u2>2,现在,因为假如集合中存在一点使得u1+u2>2,这一点位于点(1,1)和该点的线段上。
那么存在一个u1,u2 的值大于1(见表1)。
我们在区域u1+u2≤2建立一个空间:它关于直线u1=u2对称;有一边位于直线u1+u2=2;完全包含选择集。
把这个空间当做是选择集而他不是原先的那个集合,很清晰的是点(1,1)是唯一满足假设(8)的点。
现在使用假设(7),我们可以总结道当我们原始的集合是选择集时,点(1,1)也是解点。
这证明了这个断言。
我们现在给出以下这个理论的应用的例子。
假设两个聪明人比尔和杰克,他们以物作为交换却没有钱来促进交换。
进一步讲,让我们假设每一个人涉及到的物品总数目的某一部分的效用是他那一部分物品的效用的总和。
如下的表格表示每一个个人所拥有的物品的效用。
当然,每个个人的效用函数都是任意的。
讨价还价情形的图表包含在图2的详细解释之中。
它的结果是一个凸的多边形,获得产品效用最大的点是顶点且在多边形内,并且只有一个相应的预期。
那就是:Bill给Jack:书、奶油甜点、球、球拍;Jack给Bill笔、玩具、小刀。
当交易者有一个共同的交换媒介时,问题将会变得非常的简单。
在很多情况下,与货币相等的某一物品可以用作满意的大概的效用函数(货币相等的意思是与我们所关心的个人的物品一样好的货币的数量)。
当货币的某一数量的效用大概等于一个线性数量函数(在这种情形考虑的数量范围之内)时,这是会发生的。
当我们将共同的交换媒介使用到每一个人的效用函数上时,图中点集是图中那一部分在第一象限形成了一个等腰直角三角形。
因此,解是每一个人都获得相同的货币收益(见图3)。
普林斯顿大学。