当前位置:文档之家› 博弈论的数学模型

博弈论的数学模型

博弈论的数学模型
博弈论的数学模型

博弈论的数学模型

作者:竺可桢学院01混合班

王大方何霈邹铭

摘要

博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。

(一)基本博弈模型的建立

一, 博弈行为的表述

博弈的标准式包括:

1.1.博弈的参与者。

2.2.每一个参与者可供选择的战略集。

3.3.针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者i的可以选择战略空间,其中任意一个特定的纯战略为s i,其中任意特定的纯战略为s i,s i∈Si,

n元函数u i(s1,s2,……s n), 当n个博弈者的决策为s1,s2,……s n时,表示第I各参与者的收益函数。

二, 博弈的解

当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的

最优反应,在此状态下没有人愿意单独背离当前的局势。这个局势叫纳什均衡:在n个参与者标准式博弈,G={ S1,S2,……S n;u1,u2,……u n}中,若战略组合{s1*,s2*,……s n*}满足对每一个参与者i,s i*是针对{ s1*,s2*,……s i-1*,s i+1*……s n*}的最优反应战略,,目标战略组合{s1*,s2*,……s n*}为该博弈的纳什均衡。即:u i { s1*,s2*,……s i-1*,s i*,s i+1*……s n*}≥u i { s1*,s2*,……s i-1*,s i,s i+1*……s n*},对一切s i∈Si均成立。

纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。

在一般情况中,纳什证明保证了我们的均衡分析有意义。

三, 博弈实例:单阶段博弈古诺竞争

在古诺竞争中,少数厂商通过改变产量来控制价格,以使他们的收益最大化。

我们作如下假设:

1.1.厂商生产的商品是相同的,消费者没有对某家厂商的偏好。

2.2.市场上价格与供给量的函数为p=a-bQ,且供给增加不会导致过剩,而仅仅使价格降低,即厂商可以将生产的产品全部售出。

3.3.厂商都是理性的,即面对既定的情况都做出决策使自己利益最大化。

4.4.信息是完全的,每个厂商都知道其他厂商时理性的,且每个厂商知道别人是理性的这一事实为所有参与者的共识。

(二)博弈模型的求解与讨论

为了简单起见,我们从一家企业的情况做起:

只有一家企业时,目标收益函数u=Q(a-bQ)

针对max u 的解为Q0=a/2b,u0=a2/4b

当有两家企业时,设产量分别为Q1,Q2,则

p=a-b(Q1+Q2)

u1(Q1,Q2)=p*Q1=Q[a-b(Q1+Q2)]

u 2(Q 1,Q 2)=p*Q 2=Q[a-b (Q 1+Q 2)]

纳什均衡点Q 1*,Q 2*为方程组

/ =0 (1)

/=0 (2) 的解。 整理,得到

2bQ 1+bQ 2=a (3)

bQ 1+2bQ 2=a (4)

解得 Q 1*=Q 2*=a/3b ,对应的u 1=u 2=a 2/9b

纳什均衡点是一个极值点,一旦达到该点时双方都没有率先改变的动机。

下面我们讨论纳什均衡点的孤立性,即在对方初始决策不在纳什均衡时,双方能否通过理性的利益最大化策略使博弈形势变化至纳什均衡点。

(1)式表示厂商1的最优函数,在给定对方产量Q 时它根据(1)来使自己收益最大, 由

(3)式, 厂商最优函数为Q 1=(a-bQ 2)/2b 同样(2)时表示厂商(2)的最优函数,由(4)式,厂商2的最优函数为Q 2=(a-bQ 1)/2b

这是两条直线,如图,交点E 为纳什均衡点。

AB 为厂商1的最优函数,CD 为厂商2的最优函数,

当双方的初始选择点为A ,即Q 1=0,Q 2=a/b ,A 在厂商1最优函数上,故厂商1不会改变,但厂商2针对Q 1=0的最有点为C ,于是双方的决策点转移到C ,在C 点厂商1会调整自己的产量时双方决策点到F ,然厂商2又会调整策略到CD 上,以此类推,最后将到达E 点,在第一象限的任何初始选择点,按以上分析双方都能经过一系列调整到达E 点。

在完全信息的假设下,上面这一系列的调整过程在任何一方决策之前就能被预测到,任何一个厂商都回绝的任何一个异于E 点的决策都不是在给定条件下最好的选择,于是双方会不约而同的按E 点做出产量决策。但是当

Q 1=Q 2=1/2 * a/2b (5) 时双方才能获得最大收益。

Q 1=Q 2=1/2 * a 2/4b (6)

这一方面说明纳什均衡点并不是一个最好的决策点,另一方面也说明与独家垄断比起来两家厂商的竞争提高了社会效应,社会总产量从a/2b 增加到了2/3 * a/b=2a/3b 。

当厂商数增加至n 家时,模型变为

p=a-b*∑n i=1Q i (7)

u i =p*Q i ,i=1,2,……n (8) 1u ?1Q ?2u ?2Q

?

/ =0 I=1,2……n (9) 由归纳法可证明(9)可化为方程组(以矩阵形式表示) = a/b * (1)

由线性代数分析可知,该方程组有唯一非零解

Q 1*=Q 2*=…Q n *=a/(n+1)b,

u i *=a 2/(n+1)2b

社会总产量为na/(n+1)b 。

这说明h 厂商垄断竞争也必有纳什均衡点,同样方法可证明纳什均衡点不是孤立的,于是理智的各方均会按均衡点做产量决策。

另外n 越大,竞争越彻底,社会总产量越高。当n 很大时,总产量趋于a/b ,此时价格p 为0,这时价格p 为0,此时这个模型不适用。因为在n 较小,(一般小于5)时垄断厂商才有能力通过自己的产量来控制价格。

厂商们的整体最好选择是Q 1*=Q 2*=……Q n *==a/2nb, 分别能获得收益,a 2/4nb 。显然n 越大,厂商们理性博弈的结果和他们的最好选择点间的差距越大。

(三)多阶段博弈与共谋

以上可以看出,作为博弈者的厂商很有必要共谋限制产量,但最好的选择点是不稳定的,率先违约的一方都能获取额外利润,因此需要一些条件来约束双方的行为。另外共谋只有在长期过程中才有效益,双方需要不断检查是否已经违约,并决定自己是否要违约,每次这样的过程就是上文的单阶段博弈。

这里的信息条件为每企业在n 阶段可以观察的前n-1阶段博弈结果。规则为一旦对方违约,自己就违约,且永不守约,这为双方所共识。

我们新引入一个时间贴现因子v ,0

a 2(1+v+v 2+……)/8b=a 2/[8(1-v )b] (10)

对先违约的一方,根据对方a 2/4b 的产量,由(3)和(4),它的最优产量为3a/8b ,该阶段收益为

[a-b (3/8+1/4)a/b]*3/8*a/b=9a 2/64b (11)

此后双方都明白共谋破裂,均按a/3b 的均衡产量生产。设一方在N 阶段违约,则收益为a 2(1+v+v 2+……v N-1)/8b+9v N /64*a 2/b+v N+1*a 2/[(1-v )ab] (12)

(12)-(10),得 [v N /64-v N+1/72(1-v )]*a 2/b

解得 当v<0.529时,先违约方有利,且违约越早, 额外利润最高。此时共谋很难达成。

(四)共谋与监督问题的深入

长期博弈中,人们需要一套更为复杂的机制来维持一种非纳什均衡,以维持利益的最大化。和之前的那个模型不同,在每一次作单阶段博弈时,人们不仅仅通过前一次的结果,而是通过一种长期的经验来对对手做出判断。这里涉及一个信誉问题,他是一个标证不确定因素的概率,这样的模型使得我们可以根据对手不同的策略作出最有利于自己的决断。合作的结果一般出现在离博弈结束较远的阶段,而在最后几个阶段的博弈中博弈者往往只注重当前的利益。

我们提出的维护声誉的策略是“投桃报李”,即下一次作的决策与对手上一次的决策相同,i u ?i Q

?21 (111)

2....11112....1:

::::11....12?? ? ? ? ? ? ???12::n Q Q Q ?? ? ? ? ? ? ???11::1?? ? ? ? ? ? ???

将上文中的垄断竞争模型修改如下:

1.1.理性博弈者B知道博弈者A有P的概率选择投桃报李的策略,有(1-P)的概率选择其他策略(此时A即成为一个理性的人)。A也知道B时理性的。

2.2.在每个阶段N, 双方都同时作决策,都知道前N-1次彼此的决策结果。一旦A未使用“投桃报李”的原则而理性地做出利益最大化决策,则B就把A当作理性的,这一点也成为AB双方的共识。此后的博弈退化到上文讨论的一般完全信息理性博弈,得到的解为纳什均衡点。

单阶段博弈

对于单阶段博弈,由上文中(5)式的讨论,合作意味着厂商生产a/4b的产量,否则厂商将按利润最大化原则生产。首先违约的厂商将生产3a/8b,获利9a2/64b,而后所有厂商均会按a/3b生产,获利a2/9b。(为了描述方便,这里将常系数a2/b略去,下同)双方面对的策略-收益矩阵为

A \

B 合作不合作

合作(1/8,1/8)(5/48,5/36)

不合作(5/36,5/48)(1/9,1/9)

两阶段博弈

在两阶段博弈中,理性的B在第二阶段将选择不合作。在第一阶段开始时他要推测A 的情况,A有P的概率为投桃报李类型的,于是,若B在第一阶段选择合作,则B对第一阶段预期收益为P*1/8+(1-P)*5/48 (12)

B对第二阶段的预期收益为P*5/36+(1-P)*1/9 (13)

(因为若A不是投桃报李型的,在第一阶段结束时B就会知道这一事实,双方在第二回合便选择纳什均衡点。)

若B在第一阶段选择不合作,则B生产a/3b,(这里不合作并非生产3a/8b,因为此时B不知道A是否为理性的博弈者,经验算我们发现a/3b的产量决策比3a/8b的决策有更高的期望受益)。于是B对第一阶段的期望收益为5P/36+(1-P)/9 ; (14)B对第二阶段的期望收益为1/9 ;(15)(此事无论A是否理性,双方都不会合作)。

当P≥52%时,讨论式(12)+(13)―[(14)+(15)] ≥0

所以在两阶段博弈中,只要估计A会有52%的可能投桃报李,B就会选择合作。

考虑模型中信息假设,A也完全明白B以上的想法,于是A也至少有装扮“投桃报李”的动机。

三阶段博弈

现在扩展成三阶段的情况,只要B在第一阶段合作,后来的两个阶段又退化至两阶段博弈的结果。由上文的分析, B对三个阶段的期望收益为

u1= P/8+5/48(1-P)

u2=P/8+(1-P)/9

u3=5P/36+(1-P)/9

总期望收益u1+ u2+ u3= 47/144 + P/16 (16)

如果B在第一阶段不合作,则无论A是否为投桃报李型的在第二阶段都不会合作。而理性的B在第三阶段肯定会不合作。

如果此时B在第二阶段继续选择不合作,则B从这种背离中获得的各阶段期望收益为u1=5P/36+(1-P)/9 u2=1/9 u3=1/9

总期望收益u1+ u2+ u3= 1/3+P/36 (17)

比较(16),(17),得,当P≥20%时,式(17)> 式 (16) , B就没有动机在第一阶段背离。

如果B在第一阶段不合作,在第二阶段合作,第三阶段不合作,则他的各阶段期望收益为

u1= 5P/36+(1-P)/9 u2=5/48 u3=5P/36+(1-P)/9

总期望收益为P/18+47/144 恒小于(16)式,此时B也没有动机在第一阶段背离。

综上,只要A有20%的可能为投桃报李型的,B在前两阶段就没有背离合作的动机。

对于A,一旦他在第一阶段就背离合作,那么自第二阶段起A为理性的就成为博弈双方的共识,此时他的期望收益为5/36+1/9+1/9=13/36

而A如果始终合作,其均衡收益为1/8+1/8+1/9=13/36

所以在三阶段时A是否要背离合作无所谓,不过这只是由于本问题数据特殊性的巧合。

多阶段的扩展

从上面的三个阶段扩展就可以看出,随着阶段数的增多,每个博弈者更多的会考虑长久的收益情况,而非眼前。这意味着之需要一个很小的信誉概率P,就有可能约束对方不发生背叛的行为。

当共有T阶段博弈时,我们可以用归纳法证明理性的双方在从1到T-2阶段选择合作,而在T-1和T阶段按照上文讨论的两回合博弈行动。假设任何t(t

如果A在t

而A的均衡收益为从1到T-2阶段每一阶段均为1/8,T-1的收益为5/36,最后一期为1/9。显然提前违约的收益小于均衡收益。

对于B, 由两阶段博弈可知, B没有在前T-2阶段合作,T-1阶段不合作的动机,B只可能再t≤T-3的阶段背离合作。一旦B在t阶段背离合作, 则无论投桃报李的还是理性的A 都将在t+1阶段不合作, 于是在前t+1阶段B无法确认A是否为理性,从t+2阶段起双方的博弈等同于一个T-(t+1)阶段的博弈。

由归纳假设,这后一部分博弈中双方会合作到T-2阶段,然后按照上文的两阶段博弈进行。B的总收益为

u= 1/8 * (t-1) + 5/36 + 5/48+[T-2-(t+2)+1]*1/8 + [P/8 +(1-P)*5/48 +5P/36 + (1-P)/9]

这小于B从1到T的均衡收益(T-2)/8+ [P/8+ 5(1-P)/48 + 5P/48 + (1-P)/9]

所以B也没有只背离一次的动机。

更为一般的情况是在前(T-3)次博弈中B有多次的背离与合作,则按以上方法多次使用归纳法,可以发现获得的期望收益更少。其根本原因是率先背约者无法判断对方的真正类型,所以无法保证自己的利益能够最大化,而一旦约定破裂后修复的成本很高,使得背信弃义的额外收益比双方合作来的少。(5/36+5/48)<2*1/8 ) 这样的模型就使得共谋更有约束力。

小结与进一步的研究

本文主要为静态博弈问题建立了数学模型,并用他分析了一个实例:垄断市场上的古诺竞争和共谋。在静态博弈中,数学上的极大值就是博弈的均衡解。理性决策迫使人们的行为向利益极大值点移动,而信息问题是理性决策最重要的前提条件,可以说不同的信息条件可以推导出不同的理性决策。本文讨论的是最完美的信息假设:完全信息。它不仅指双方彼此了解对方的情况,而且彼此知道对方了解自己情况这一事实,以此类推,等等,最后形成了一个无穷的递归链。最后讨论的投桃报李模型不是完全信息的,但是它也有一套为双方所共知的评判标准来约束双方的决策。总之,本文讨论的模型是双方都知道规则的情况下进行的博弈,这是一个对实际博弈相当理想化的简化。在这样的简化下,如何妥善的处理无穷信息递归链,是个有待进一步研究的问题。而就垄断这个经济问题本身而言,本模型最大的理想化就是价格与供给量成一次函数关系,进一步可将这个函数关系拟合得更符合实际,由此还可推导出不同的收益函数和多个纳什均衡点,做出进一步分析。

参考文献

罗伯特.吉本斯: 《博弈论基础, A PRIMER IN GAME THEORY》

约瑟夫. 斯蒂格利茨: 《经济学》

张涛方城等, 基于累积期望差异评价策略的重复博弈仿真研究《系统工程.》2002,20(3).-87-91

霍沛军双寡头的经济捕鱼策略《数学的实践与认识》2002,32(2).-201-205

薛伟贤, 冯宗宪, 陈爱娟寡头市场的博弈分析《系统工程理论与实践》, 2002 V ol.22 No.11

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

关于定价的博弈论模型

CH13 关于定价的博弈论模型 分析寡头市场的最大困难在于策略问题。在此情形下,市场上仅有几家企业,每一家企业在做决策时,都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。 一、基本概念 在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的选择,这种情况就可以看成是一个博弈。 1.博弈的三要素 任何一个博弈都必须具备三个要素: (1)博弈的参与者 参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。 (2)策略 策略是博弈参与者的行动规则。 在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。 (3)支付(payoffs ) 支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面,既包括显性的货币报酬,也包括隐性的参与者关于结果的心理感受。 2. 符号 两个参与者(A 和B )之间的博弈G 用下式表示 [,,(,),(,A B A B G S S U a b U a b 其中,A S 和B S 分别表示参与者A 和参与者B 的可选策略,(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时,各自所得到的支付(,A B a S b S ∈∈)。 二、Nash 均衡 市场均衡:在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。

Nash 均衡:对于策略组合(**,a b ),如果给定其它参与者的策略,没有一个参与者会选择单方面偏离,那么这个策略组合就构成一个Nash 均衡。也就是说 ** * (,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ** * (,)(,)B B U a b U a b '≥ 对于所有B b S '∈ 对纳什均衡的理解 设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。否则,它就不是一个纳什均衡。 三、一个例子 两个厂商(A 和B )决定自己花多少钱用于做广告。每个厂商可以选择较高的预算(H )或较低的预算(L )。 1.博弈的扩展式表述 图13.1 2.博弈的策略式(规范式)表述 表13.1 3.占优策略和Nash 均衡 从表13.1可以看出,低预算(L )是厂商B 的占优策略,即不管厂商A 选择哪一种策略,L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识,厂商A 也知道L 是厂商B 的占优策略,所以厂商A 将选择L 。因此,该博弈的均衡是(L ,L )。 请验证(L ,L )构成一个Nash 均衡,而其它三个策略组合都不是Nash 均衡。

(数学建模教材)7第七章对策论

第七章 对策论 §1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来 解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对 策论起源于 1944 年 J.,V on Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。 对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展 的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常 生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。 在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对 抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目 标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并 力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否 存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。 §2 对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的 努力而是各方所采取的策略的综合结果。 先考察一个实际例子。 例 1(囚徒的困境) 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大 量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个 人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双 方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从 宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列 于表 1。 表 1 表 1 中每对数字表示嫌疑犯 A 、B 被判刑的年数。如果两名疑犯均担心对方供认并希 望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i )局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局 中人。通常用 I 表示局中人的集合.如果有 n 个局中人,则 I = {1,2,L , n }。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A 、B 两名疑犯。 (ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参 加对策的每一局中人 i , i ∈ I ,都有自己的策略集 S i 。一般,每一局中人的策略集中 至少应包括两个策略。 -154- 嫌疑犯 B 供认 不供认 嫌疑犯 A 供认 不供认 (3,3) (0,7) (7,0) (1.5,1.5)

博弈论与经济模型第10章

第10章机制设计与拍卖 10.1 导论 在本章和下一章里,我们将介绍博弈论中用来处理机制和市场设计的主要工具。存在着许多这样一些类型的例子。政府可能会去规制(regulate)垄断企业,使其行为符合特定的所期望的准则;艺术品收藏家要在出售其手中的画作中获得尽可能高的收益;社会计划者要保证开支在使用者之间有效地分配;学校管理系统要按照某种准则把它的空间在学生之间进行配置,等等。在本章里,我们主要关心销售机制的设计问题;在下一章中,我们将处理两组个体之间的匹配问题。 10.2 拍卖 10.2.1 历史概述 在一个“拍卖”中,物品被卖给出价最高的人。广义的“拍卖”是指对重要的经济资源进行配置,从艺术品到短期政府公债到近海油气田开发权再到无线电频率使用权等等。它采用多种不同的形式。例如,可以用轮流报价的方法(如艺术品拍卖)或密封式提交报价等。支付的成交价可以是最高报价,或某些其它价格;如果拍卖的物品不止一种,则既可以采用所有物品打包式的同时报价,也可用每种物品陆续报价的方式。博弈论分析有助于我们理解各类报价设计的结果;例如,它建议出可以最有效配置资源且带来最高收入的拍卖机制设计。在这一节里,我们来讨论这样的拍卖,其中每个买者知道他自己以及每个其他买者对于物品的估价。在后面的章节里,我们还要发展出允许我们假定买者之间互相不知道别人对物品的估价的情况下,对拍卖进行研究的工具来。 拍卖的现实背景:从巴比伦到网上购物拍卖有着相当长的历史。Herodotus,公元前1500年的古希腊作家,曾与Thucydies一起创立了历史学,曾对巴比伦的拍卖加以了描述。他写道,巴比伦人“最引人注目”的传统就是每个村庄里一年一度的拍卖,这种拍卖是对到了结婚年龄的女子进行的拍卖。对男人最具吸引力的女人首先被出;他们要求一个正的价格,而最不具吸引力的女人则倒过来向娶她的男子支付价格。在每次拍卖中,报价是轮流出价的,出价最高的男子胜出,并支付他报出的价格。 拍卖也出现于公元前1500年和400年的雅典,是出售征税权,对没收的财产的处置权,以及出租土地与矿山等。关于这些拍卖的实质内容的证据很少,但有一些有趣的东西留了下来。例如,雅典政治家Andocides(C.440—391B.C.)曾对一个征税权拍卖中的串谋提出了一个报告。 在古罗马经常开展一些拍卖的活动,且在罗马帝国之后的中世纪欧洲还继续着这种活动(例如,在中世纪和早期现代低地国家中的城镇里,每年都要对征税权进行拍卖)。最早出现英语单

基于博弈论的恋爱模型

《数学建模》 课程考核论文 姓名:王湘衡齐久坤张程勇 学号:08100225 08100217 08100232 班级:08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型 摘要 本文用数学建模的方法研究博弈论中的问题,从不完全信息静态博弈建立模型建立模型,并利用纳什均衡原理程序来确定纳什均衡点,对不同均衡点进行分析,从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈,来模拟现实社会中的恋爱,再利用恋爱者不同类型的分布概率,求出恋爱者的期望,最终来决策恋爱者自己下一步的策略。 关键词:恋爱模型博弈论贝叶斯纳什均衡

1、问题重述 随着社会的进步和发展,现在恋爱问题越来越成为生们关注的热门话题,那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人,成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人,这其中将恋爱双方都理想化,这样将给我们研究恋爱问题和建立数学模型带来方便,使我们能将恋爱模型数学化,从而确定恋爱者的进一步决定。 2.模型假设及符号说明 模型假设: 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人,并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略 符号说明: 3. 问题分析与模型建立 3.1 问题分析 谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看,谈恋爱的男女双方,各有不同类型,我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象,寻求的是一般解释。有了这样的分类便有了不同的组合,有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美,却不会让他得逞,原因是理性经济人的假设。有人说这一点说不通,我不这样认为,经济学说所有人都是理性的并不影响不理性家伙们的存在,能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。 简单的博弈理论己深入人心,显然上面的问题是不完全信息博弈,无论是男追女还是女追男,信息的不完全或是不对称是显而易见的,用博弈论的话说是对对方的了解不够精确。因此,我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡,动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型 所谓静态是指所有参与生都同时行动,不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例,一个男生追求一个女生,在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人,虽然自己可以从各种渠道了解男生,但知生知面不知心,风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题,因为女生不仅不知道男生的类型(A还是B),而且还不知道不同类型的分布概率,但她对自己所属的类型是清楚的,这是她的私人信息。同理男生也是这样。 下面来设定支付函数的权值,以便求出纳什均衡点,设男A类追求者,只要他追求A类女生就得到10,他不追求A类女生就得到-10,A类女生接受得到10,拒绝得到-10;男B类追求者,他追求A类女生得到10,不追求得到-10,A类女生接受得到-10,拒绝得到10;男A类追求者,他追求B类女生得到-10,不追求得到10,B类女生接受得到10,拒绝得到-10;男B类追求者,他追求B类女生得到10,不追求得到0,B类女生接受得到10,拒绝得到0;他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明:

博弈论习题及解答

※第一章绪论 §1.2 1. 什么是博弈论?博弈有哪 些基本表示方法?各种表示法 的基本要素是什么?(见教材) 2. 分别用规范式和扩展式表 示下面的博弈。 两个相互竞争的企业考虑同 时推出一种相似的产品。如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。 3. 什么是特征函数? (见教材) 4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子? 原因:个体理性与集体理性的矛盾。 例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡 1. 什么是纳什均衡? (见教材) 2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。 先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。 3. 求出下面博弈的纳什均衡。 由划线法易知,该矩阵博弈没有纯策略Nash均衡。 由表达式(2.3.13)~(2.3.16)可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。 解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)} 令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x) 作出三条直线,如下图,图中粗的折线,就是F(x)的图象

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

一、名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响

6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析 摘要 随着市场经济的发展,人们对事物认知态度的变化,经济学的应用范围进一步扩大,人们的行事原则越来越趋向于经济学上的“理性”。就现状而言,经济学的分析不仅局限于某些领域,只要存在人类的社会活动,就存在经济,就存在资源合理配置问题,也就有经济分析的必要。谈恋爱是校园中的一个普遍现象,本文从经济学的视野中透视,爱情中的微观经济学问题,包括从预算线角度分析择偶以及爱情中的博弈关系,并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。 关键词:微观经济学;爱情;预算线;博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

浅谈博弈论在数学和经济中的应用

浅谈博弈论在数学和经济学中的应用 彭秋迪 (经济学院金融工程专业0911747) 摘要:现代经济学与数学有着千丝万缕的关系,博弈论作为应用数学的一个分支更是对现代 经济学发展有着深刻影响。本文简要探讨了博弈论中体现的数学思想以及博弈论在数学与经 济学中的应用。 关键词:博弈论;数学;经济学 在现代经济学的发展中,数学与经济学结下了不解之缘。作为经济学的研究对象,人的 行为变化莫测,具有很大的不确定性;由人的行为所产生的经济关系变化错综复杂,极大地 增加了经济研究的难度。因此,经济学家不得不借助数学方法分析人的行为的本质特征,揭 示经济系统运行的内在规律。数学方法在经济学中的应用渗透到了几乎所有经济学的分支学 科领域,尤其是经济学的研究方法中,而博弈论是对现代经济学的发展产生意义深远影响的 一种重要方法。 博弈论又名“对策论”,“赛局理论”,是一种以数学为基础、研究对抗冲突中最有解 决问题的方法。对于博弈论的研究,开始于策墨洛(Zermelo,1913),波雷尔(Borel,1921) 及冯·诺伊曼(von Neumann, 1928),后来由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)首次对其系统化和形式化(参照Myerson, 1991)。随后约翰·福 布斯·纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证明了均衡点的存在,为 博弈论的一般化奠定了坚实的基础。由于在经济学中的广泛应用,经济学家们吧博弈论视为 经济分析的最合适的工具之一。到20世纪90年代,博弈论已融入主流经济学,用博弈论方 法分析问题成为一种时髦。1994年,诺贝尔经济学奖授予三位博弈论专家:纳什、泽尔腾 和海萨尼,表明了博弈论在主流经济学中的地位及其对现代经济学的影响和贡献。 应用举例 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设 有两个小偷A和B联合犯事、私闯民宅被警察抓住。警方将两人分别置于不同的两个房间内 进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,

经济博弈论论文

博弈论及其在现代经济生活中的应用 工造3班 魏XX [摘要]:本文从“囚徒困境模型”和“智猪博弈模型”两个方面来阐述博弈论及其 在现代经济生活中的运用。 [关键词]:博弈论囚徒困境模型智猪博弈模型应用 [正文]: 有一个典型的案例:甲乙两人合伙作案,结果被警察抓了起来,分别被隔离 审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提 下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背 叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。这样会出现以 下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑! 年;如果 一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判!" 年;如果两人都招供,则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢? 是选择合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这 样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对 方可能采取的选择。问题就这样开始了,两个人都十分精明,而且只关心减少自 己的刑期,并不会在乎对方被判多少年。每个人都会这样推理:假如对方不招, 我只要一招供,马上可以获得自由,而不招却要坐牢! 年,显然招比不招好;假 如对方招了,我若不招,则要坐牢!" 年。招了只要坐牢!# 年,显然还是招更好 些。可见,对方无论招或者不招,我的最佳选择都是招认。两个人都会基于同样 的想法作出招供的选择,这对他们个人来说都是最佳策略,但对整体而言却是一 个最差的结果。 这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和 策略的理论,博弈论其实就在我们身边,它研究的许多例子来自于日常生活和经 济活动中的游戏和事物。 博弈的英文即,中文译为“博弈”是非常传神和贴切的,因为中国古代称下棋 为“弈”,“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点:即策 略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制, 人人争赢,布每一个棋子时,都必须考虑到对手的策略选择,从而选择自己的最 佳策略。这也就是博弈的核心问题:决策主体的一方行动后,参与博弈的其他人 将会采取什么行动?参与人为取得最佳效果应采取怎样的对策?我们可以将博 弈论定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的 规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的 行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈 论是(# 世纪四五十年代发展起来的。美国经济学家冯?诺依曼与奥斯卡?摩根斯特 恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。 博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理 性;而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最 大,强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身 的最大利益为惟一目标,除非是为了实现自身利益的需要,否则不会考虑其他的 个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何

博弈论的数学模型

博弈论的数学模型 作者:竺可桢学院01混合班 王大方何霈邹铭 摘要 博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。 (一)基本博弈模型的建立 一, 博弈行为的表述 博弈的标准式包括: 1.1.博弈的参与者。 2.2.每一个参与者可供选择的战略集。 3.3.针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者i的可以选择战略空间,其中任意一个特定的纯战略为s i,其中任意特定的纯战略为s i,s i∈Si, n元函数u i(s1,s2,……s n), 当n个博弈者的决策为s1,s2,……s n时,表示第I各参与者的收益函数。 二, 博弈的解 当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的 最优反应,在此状态下没有人愿意单独背离当前的局势。这个局势叫纳什均衡:在n个参与者标准式博弈,G={ S1,S2,……S n;u1,u2,……u n}中,若战略组合{s1*,s2*,……s n*}满足对每一个参与者i,s i*是针对{ s1*,s2*,……s i-1*,s i+1*……s n*}的最优反应战略,,目标战略组合{s1*,s2*,……s n*}为该博弈的纳什均衡。即:u i { s1*,s2*,……s i-1*,s i*,s i+1*……s n*}≥u i { s1*,s2*,……s i-1*,s i,s i+1*……s n*},对一切s i∈Si均成立。 纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。 在一般情况中,纳什证明保证了我们的均衡分析有意义。 三, 博弈实例:单阶段博弈古诺竞争 在古诺竞争中,少数厂商通过改变产量来控制价格,以使他们的收益最大化。 我们作如下假设: 1.1.厂商生产的商品是相同的,消费者没有对某家厂商的偏好。 2.2.市场上价格与供给量的函数为p=a-bQ,且供给增加不会导致过剩,而仅仅使价格降低,即厂商可以将生产的产品全部售出。 3.3.厂商都是理性的,即面对既定的情况都做出决策使自己利益最大化。 4.4.信息是完全的,每个厂商都知道其他厂商时理性的,且每个厂商知道别人是理性的这一事实为所有参与者的共识。 (二)博弈模型的求解与讨论 为了简单起见,我们从一家企业的情况做起: 只有一家企业时,目标收益函数u=Q(a-bQ) 针对max u 的解为Q0=a/2b,u0=a2/4b 当有两家企业时,设产量分别为Q1,Q2,则 p=a-b(Q1+Q2) u1(Q1,Q2)=p*Q1=Q[a-b(Q1+Q2)]

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征 博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征: 1. 研究对象的普遍性和应用范围的广泛性 人们的行为之间存在相互作用与相互依赖,不同的行为主体及其不同的行为方式所形成的利益冲突与合作,已成为一种普遍现象,这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。 现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实,使博弈论的研究内容和应用范围十分广泛,涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域,在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性 一是运用数学模型来描述所研究的问题,使博弈论的分析更为精确。 二是研究方法具有抽象化的特征,由于博弈论分析大量使用了现代数学,使它所描述和分析的过程及所揭示的结论都带 有抽象、一般化的特点。 三是博弈论分析方法所体现的模式化特征,博弈论为人们提供了一个统一的分析框架或基本范式,从而使博弈论能够分 析和处理其它数学工具难以处理的复杂行为,成为对行为主 体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中,不仅要应用现代数学的大量知识,还涉及到经济学、管理学、 心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性 博弈论中的最佳策略是经济学意义上的最优化,它只回答是什么导致博弈均衡,均衡的结果是什么,所遵循的基本原则是科学结论的客观性和普遍性。从实践上看,博弈论突破了传统的完全竞争、完全信息假定,更加强调决策者的个人理性,强调不完全信息、不完全竞争条件下的经济分析,强调决策个体之间的相互影响和相互作用等外部性,强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致,等等。作为一门方法论科学,除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外,还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说,博弈论方法具有实证的特征,使研究结果更具有真实性。

博弈论模型

1. 囚徒困境 这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发 现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情 形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他 们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这 两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就 可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪 来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会 得到奖赏。 那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看, 他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。 但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔 丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也 意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一 理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保 持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个 逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。 企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打 交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互 之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对 方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪, 就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着 控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是 9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1

从博弈论角度看古诺模型

博弈论的观点看古诺模型 罗思蕴 (华中师范大学数学与应用数学系,武汉430079) 摘要:运用博弈论的研究方法,对古诺模型的几种变式进行分析,给出模型解法的代数表达式,并对结果进行适当的对比分析,最后总结出不同模型对结论的改变情况。 关键词:古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈 古诺模型(Cournot model)是博弈论中最具有代表性的模型之一,也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年,足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度,它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。 在古诺生活的时代,大多数市场都只有少数的厂商经营,所以这个模型在当时是极具现实意义的。随着时间的推移,古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析,有四种情况极具代表性:完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型 古诺模型最初的形态是来自于经济学的。在经济学中,寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一,假定一个产业只有两个寡头,每个寡头生产同质产品,并追求利润最大化。二,两个寡头之间进行的是产量的竞争而不是价格竞争,且产品的价格依赖于两者生产的产品总量。三,寡头之间无勾结行为。四,每个生产者都把对方的产出水平视为定值。五,边际成本为常数。 在经典的古诺模型中,每个企业具有相同的不变单位成本: (),1,2 == C q cq i i i i

浅谈博弈论在电力市场中应用(一)

浅谈博弈论在电力市场中应用(一) 1、博弈论概述 博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。 博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合着的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。 2.博弈论的基本原理和方法 文献1]2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献3]4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述 G={P,A,S,I,U} P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。 A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。 S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。 I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。 U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。 还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。 3、博弈论与电力市场 博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也

博弈论(整理过名词解释和简答)

一、名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

相关主题
文本预览
相关文档 最新文档