当前位置:文档之家› 纳什均衡哈佛第六讲

纳什均衡哈佛第六讲

纳什均衡哈佛第六讲
纳什均衡哈佛第六讲

Lecture VI:Existence of Nash equilibrium

Markus M.M¨o bius

February26,2008

?Osborne,chapter4

?Gibbons,sections1.3.B

1Nash’s Existence Theorem

When we introduced the notion of Nash equilibrium the idea was to come up with a solution concept which is stronger than IDSDS.Today we show that NE is not too strong in the sense that it guarantees the existence of at least one mixed Nash equilibrium in most games(for sure in all?nite games). This is reassuring because it tells that there is at least one way to play most games.1

Let’s start by stating the main theorem we will prove:

Theorem1(Nash Existence)Every?nite strategic-form game has a mixed-strategy Nash equilibrium.

Many game theorists therefore regard the set of NE for this reason as the lower bound for the set of reasonably solution concept.A lot of research has gone into re?ning the notion of NE in order to retain the existence result but get more precise predictions in games with multiple equilibria(such as coordination games).

However,we have already discussed games which are solvable by IDSDS and hence have a unique Nash equilibrium as well(for example,the two thirds of the average game),but subjects in an experiment will not follow those equilibrium prescription.Therefore,if we want to describe and predict 1Note,that a pure Nash equilibrium is a(degenerate)mixed equilibrium,too.

1

the behavior of real-world people rather than come up with an explanation of how they should play a game,then the notion of NE and even even IDSDS can be too restricting.

Behavioral game theory has tried to weaken the joint assumptions of rationality and common knowledge in order to come up with better theories of how real people play real games.Anyone interested should take David Laibson’s course next year.

Despite these reservation about Nash equilibrium it is still a very useful benchmark and a starting point for any game analysis.

In the following we will go through three proofs of the Existence Theorem using various levels of mathematical sophistication:

?existence in2×2games using elementary techniques

?existence in2×2games using a?xed point approach

?general existence theorem in?nite games

You are only required to understand the simplest approach.The rest is for the intellectually curious.

2Nash Existence in2×2Games

Let us consider the simple2×2game which we discussed in the previous

equilibria:

lecture on mixed Nash

2

Let’s ?nd the best-response of player 2to player 1playing strategy α:

u 2(L,αU +(1?α)D )=2?α

u 2(R,αU +(1?α)D )=1+3α(1)

Therefore,player 2will strictly prefer strategy L i?2?α>1+3αwhich implies α<14.The best-response correspondence of player 2is therefore:BR 2(α)=???1if α<14[0,1]if α=140if α>14

(2)We can similarly ?nd the best-response correspondence of player 1:

BR 1(β)=???0if β<23[0,1]if β=231if β>23(3)

We draw both best-response correspondences in a single graph (the graph is in color -so looking at it on the computer screen might help you):

We immediately see,that both correspondences intersect in the single point α=14and β=23which is therefore the unique (mixed)Nash equilibrium of the game.

3

What’s useful about this approach is that it generalizes to a proof that any two by two game has at least one Nash equilibriu,i.e.its two best response correspondences have to intersect in at least one point.

An informal argument runs as follows:

1.The best response correspondence for player2maps eachαinto at

least oneβ.The graph of the correspondence connects the left and right side of the square[0,1]×[0,1].This connection is continuous -the only discontinuity could happen when player2’s best response switches from L to R or vice versa at someα?.But at this switching point player2has to be exactly indi?erent between both strategies-hence the graph has the value BR2(α?)=[0,1]at this point and there cannot be a discontinuity.Note,that this is precisely why we need mixed strategies-with pure strategies the BR graph would generally be discontinuous at some point.

2.By an analogous argument the BR graph of player1connects the upper

and lower side of the square[0,1]×[0,1].

3.Two lines which connect the left/right side and the upper/lower side

of the square respectively have to intersect in at least one point.Hence each2by2game has a mixed Nash equilibrium.

3Nash Existence in2×2Games using Fixed Point Argument

There is a di?erent way to prove existence of NE on2×2games.The advantage of this new approach is that it generalizes easily to general?nite games.

Consider any strategy pro?le(αU+(1?α)D,βL+(1?β)R)represented by the point(α,β)inside the square[0,1]×[0,1].Now imagine the following: player1assumes that player2follows strategyβand player2assumes that player1follows strategyα.What should they do?They should play their BR to their beliefs-i.e.player1should play BR1(β)and player2should play BR2(α).So we can imagine that the strategy pro?le(α,β)is mapped onto(BR1(β),BR2(α)).This would describe the actual play of both players if their beliefs would be summarizes by(α,β).We can therefore de?ne a

4

giant correspondence BR:[0,1]×[0,1]→[0,1]×[0,1]in the following way:

BR(α,β)=BR1(β)×BR2(α)(4) The following?gure illustrates the properties of the combined best-response map BR:

The neat fact about BR is that the Nash equilibriaσ?are precisely the ?xed points of BR,i.e.σ?∈BR(σ?).In other words,if players have beliefs σ?thenσ?should also be a best response by them.The next lemma follows

directly from the de?nition of mixed Nash equilibrium:

Lemma1A mixed strategy pro?leσ?is a Nash equilibrium if and only if it is a?xed point of the BR correspondence,i.e.σ?∈BR(σ?).

We therefore look precisely for the?xed points of the correspondence BR which maps the square[0,1]×[0,1]onto itself.There is well developed mathematical theory for these types of maps which we utilize to prove Nash existence(i.e.that BR has at least one?xed point).

3.1Kakutani’s Fixed Point Theorem

The key result we need is Kakutani’s?xed point theorem.You might have used Brower’s?xed point theorem in some mathematics class.This is not

5

su?cient for proving the existence of nash equilibria because it only applies to functions but not to correspondences.

Theorem2Kakutani A correspondence r:X→X has a?xed point x∈X such that x∈r(x)if

1.X is a compact,convex and non-empty subset of n.

2.r(x)is non-empty for all x.

3.r(x)is convex for all x.

4.r has a closed graph.

There are a few concepts in this de?nition which have to be de?ned: Convex Set:A set A? n is convex if for any two points x,y∈A the straight line connecting these two points lies inside the set as well.Formally,λx+(1?λ)y∈A for allλ∈[0,1].

Closed Set:A set A? n is closed if for any converging sequence {x n}∞n=1with x n→x?as n→∞we have x?∈A.Closed intervals such as[0,1]are closed sets but open or half-open intervals are not.For example

(0,1]cannot be closed because the sequence1

n converges to0which is not in

the set.

Compact Set:A set A? n is compact if it is both closed and bounded.

For example,the set[0,1]is compact but the set[0,∞)is only closed but unbounded,and hence not compact.

Graph:The graph of a correspondence r:X→Y is the set{(x,y)|y∈r(x)}. If r is a real function the graph is simply the plot of the function.

Closed Graph:A correspondence has a closed graph if the graph of the correspondence is a closed set.Formally,this implies that for a sequence of point on the graph{(x n,y n)}∞n=1such that x n→x?and y n→y?as n→∞

we have y?∈r(x?).2

It is useful to understand exactly why we need each of the conditions in Kakutani’s?xed point theorem to be ful?lled.We discuss the conditions by looking correspondences on the real line,i.e.r: → .In this case,a?xed point simply lies on the intersection between the graph of the correspondence

and the diagonal y=x.Hence Kakutani’s?xed point theorem tells us that 2If the correspondence is a function then the closed graph requirement is equivalent to assuming that the function is continuous.It’s easy to see that a continuous function has

a closed graph.For the reverse,you’ll need Baire’s category theorem.

6

a correspondence r:[0,1]→[0,1]which ful?lls the conditions above always intersects with the diagonal.

3.1.1Kakutani Condition I:X is compact,convex and non-empty. Assume X is not compact because it is not closed-for example X=(0,1). Now consider the correspondence r(x)=x2which maps X into X.However, it has no?xed point.Now consider X non-compact because it is unbounded such as X=[0,∞)and consider the correspondence r(x)=1+x which maps X into X but has again no?xed point.

If X is empty there is clearly no?xed point.For convexity of X look at

the example X=[0,1

3]∪[2

3

,1]which is not convex because the set has a hole.

Now consider the following correspondence(see?gure below):

r(x)=

3

4

if x∈[0,1

3

]

1

4

if x∈[2

3

,1](5)

This correspondence maps X into X but has no?xed point again.

From now on we focus on correspondences r:[0,1]→[0,1]-note that[0,1] is closed and bounded and hence compact,and is also convex.

7

3.1.2Kakutani Condition II:r (x )is non-empty.

If r (x )could be empty we could de?ne a correspondence r :[0,1]→[0,1]

such as the following:r (x )=???34if x ∈[0,13]?if x ∈[13,23]

14if x ∈[23,1](6)

As before,this correspondence has no ?xed point because of the hole in the middle.

3.1.3Kakutani Condition III:r (x )is convex.

If r (x )is not convex,then the graph does not have to have a ?xed point as the following example of a correspondence r :[0,1]→[0,1]shows:r (x )=???1if x <12 0,13 ∪ 23,1 if x =120if x >12

(7)

The graph is non-convex because r (12)is not convex.It also does not have a ?xed point.

8

3.1.4Kakutani Condition IV:r(x)has a closed graph.

This condition ensures that the graph cannot have holes.Consider the follow-ing correspondence r:[0,1]→[0,1]which ful?lls all conditions of Kakutani

except(4):

r(x)=?

?

?

1

2

if x<1

2

1

4

,1

2

if x=1

2

1

4

if x>1

2

(8)

Note,that r(1

2)is the convex set

1

4

,1

2

but that this set is not closed.Hence

the graph is not closed.For example,consider the sequence x n=1

2and

y n=1

2?1

n+2

for n≥1.Clearly,we have y n∈r(x n).However,x n→x?=12

and y n→y?=12but y?/∈r(x?).Hence the graph is not closed.

3.2Applying Kakutani

We now apply Kakutani to prove that2×2games have a Nash equilibrium, i.e.the giant best-response correspondence BR has a?xed point.We denote the strategies of player1with U and D and the strategies of player2with L and R.

9

We have to check(a)that BR is a map from some compact and convex set X into itself,and(b)conditions(1)to(4)of Kakutani.

?First note,that BR:[0,1]×[0,1]→[0,1]×[0,1].The square X= [0,1]×[0,1]is convex and compact because it is bounded and closed.

?Now check condition(2)of Kakutani-BR(σ)is non-empty.This is true if BR1(σ2)and BR2(σ1)are non-empty.Let’s prove it for BR1-the proof for BR2is analogous.Player1will get the following payo?u1,β(α)from playing strategyαif the other player playsβ:

u1,β(α)=αβu1(U,L)+α(1?β)u1(U,R)+

+(1?α)βu1(D,L)+(1?α)(1?β)u1(D,R)(9) The function u1,βis continuous inα.We also know thatα∈[0,1]which is a closed interval.Therefore,we know that the continuous function u1,βreaches its maximum over that interval(standard min-max result from real analysis-continuous functions reach their minimum and max-imum over closed intervals).Hence there is at least one best response α?which maximizes player1’s payo?.

?Condition(3)requires that if player1has tow best responsesα?1U+ (1?α?1)D andα?2U+(1?α?2)D to player2playingβL+(1?β)R then the strategy where player1chooses U with probabilityλα?1+(1?λ)α?2 for some0<λ<1is also a best response(i.e.BR1(β)is convex).

But since both theα1and theα2strategy are best responses of player 1to the sameβstrategy of player2they also have to provide the same payo?s to player1.But this implies that if player1plays strategyα1 with probabilityλandα2with probability1?λshe will get exactly the same payo?as well.Hence the strategy where she plays U with probabilityλα?1+(1?λ)α?2is also a best response and her best response set BR1(β)is convex.

?The?nal condition(4)requires that BR has a closed graph.To show this consider a sequenceσn=(αn,βn)of(mixed)strategy pro?les and ?σn=(?αn,?βn)∈BR(σn).Both sequences are assumed to converge to σ?=(α?,β?)and?σ?=(?α?,?β?),respectively.We now want to show that?σ∈BR(σ)to prove that BR has a closed graph.

We know that for player1,for example,we have

u1(?αn,βn)≥u1(α ,βn)

10

for anyα ∈[0,1].Note,that the utility function is continuous in both arguments because it is linear inαandβ.Therefore,we can take the limit on both sides while preserving the inequality sign:

u1(?α?,β?)≥u2(α ,β)

for allα ∈[0,1].This shows that?α?∈BR1(β)and therefore?σ?∈BR(σ?).Hence the graph of the BR correspondence is closed.

Therefore,all four Kakutani conditions apply and the giant best-response correspondence BR has a?xed point,and each2×2game has a Nash equilibrium.

4Nash Existence Proof for General Finite Case

Using the?xed point method it is now relatively easy to extend the proof for the2×2case to general?nite games.The biggest di?erence is that we cannot represent a mixed strategy any longer with a single number such asα. If player1has three pure strategies A1,A2and A3,for example,then his set of mixed strategies is represented by two probabilities-for example,(α1,α2) which are the probabilities that A1and A2are chosen.The set of admissible α1andα2is described by:

Σ1={(α1,α2)|0≤α1,α2≤1andα1+α2≤1}(10) The de?nition of the set of mixed strategies can be straightforwardly ex-tended to games where player1has a strategy set consisting of n pure strategies A1,..,A n.Then we need n?1probabilitiesα1,..,αn?1such that:Σ1={(α1,..,αn?1)|0≤α1,..,αn?1≤1andα1+..+αn?1≤1}(11) So instead of representing strategies on the unit interval[0,1]we have to represent as elements of the simplexΣ1.

Lemma2The setΣ1is compact and convex.

Proof:It is clearly convex-if you mix between two mixed strategies you get another mixed strategy.The set is also compact because it is bounded (all|αi|≤1)and closed.To see closedness take a sequence(αi1,..,αi n?1)

of elements ofΣ1which converges to(α?1,..).Then we haveα?i≥0and n?1

α?i≤1because the limit preserves weak inequalities.QED i=1

11

We can now check that all conditions of Kakutani are ful?lled in the gen-eral?nite case.Checking them is almost1-1identical to checking Kakutani’s condition for2×2games.

Condition1:The individual mixed strategy setsΣi are clearly non-empty because every player has at least one strategy.SinceΣi is compact Σ=Σ1×...×ΣI is also compact.Hence the BR correspondence BR:Σ→Σacts on a compact and convex non-empty set.

Condition2:For each player i we can calculate his utiltiy u i,σ

?i (σi)for

σi∈Σi.SinceΣi is compact and u i,σ

?i is continuous the set of payo?s is also

compact and hence has a maximum.Therefore,BR i(Σi)is non-empty.

Condition3:Assume thatσ1i andσ2i are both BR of player i toσ?i. Both strategies have to give player i equal payo?s then and any linear com-bination of these two strategies has to be a BR for player i,too.

Condition4:Assume thatσn is a sequence of strategy pro?les and ?σn∈BR(σn).Both sequences converge toσ?and?σ?,respectively.We know that for each player i we have

u i

?σn i,σn?i

≥u i

σ i,σn?i

for allσ i∈Σi.Note,that the utility function is continuous in both arguments because it is linear.3Therefore,we can take the limit on both sides while preserving the inequality sign:

u i

?σ?i,σ??i

≥u i

σ i,σ??i

for allσ i∈Σi.This shows that?σ?i∈BR i

σ??i

and therefore?σ?∈BR(σ?).

Hence the graph of the BR correspondence is closed.

So Kakutani’s theorem applies and the giant best-response map BR has a?xed point.

3It is crucial here that the set of pure strategies is?nite.

12

博弈论与社会选择中的理性

博弈论与社会选择中的理性 第一讲个体理性决策与博弈论 经济学的两个基本观念:理性(rationality)与折中权衡(trade-off) 什么意义上,我们可以运用理性选择理论,实现什么目的?描述或解释人类行为,进行机制设计的基础 行为者(决策者、博弈者)对所处场景的主观认知:物我两分;形式系统及其解释 有界理性: 理论性概念与经验性概念:Craig定理 社会物理学:个体理性决策、博弈论与社会选择,机制设计 社会科学的两大基石:博弈论与社会选择 博弈论的两个互补观念:协调性与稳定性(稳健性) 作为描述性理论的as if解释:图灵实验 描述性与规范性之间的不协调 个体理性决策

阿罗:“方法论个人主义的当代形式是博弈论”,“所有解释都必须以个人之间的行动和对行动的回应的方式进行”(Arrow, 1994, p5, p1)。 “我们研究的模型假设每个决策者在如下意义上是理性的,他知道他的可选择对象,形成关于任何未知事物的预期,具备清晰的偏好,在某些优化过程后深思熟虑地选择他的行为”(Osborne & Rubinstein, 1994, p4)。 选择、偏好、效用 选择:一致性(consistency),弱显示偏好公理 偏好: 完全性:不能不选择 传递性: R A x M∈ ? A = ∈ A , y } : { , (xRy ) x R A G? = A ∈ ? ∈ { y , } ) : A (yPx , Rational Fool :tie-breaking 布里丹的驴子 “全局理性”:How to decide … how to decide to how decide rationally Herbert Simon:“bounded rationality”;满意原则(秘书问题),是一种进化出来的能力而非计算的结果 选择规则 如果假设一个决策者对所有备选方案都是无差异的,那么任何行为都可以被理性化。但是,理论的强度越弱,预见性也越差。 满足连续性的偏好可以被一个效用函数所表示。 偏好和效用反映了行为主体的主观性判断。利己主义、利他主义与妒忌型人格可以被区分开。 不确定环境(行动与结果之间的对应关系)下的决策 个体知识的划分(partition)刻画:非幻觉性;如果你知道某事,那么你知道你知道某事;如果你不知道某事,那么你知道自己不知道某事 风险、不确定性、无知 两类模型,决策者在两类模型中都是在彩票中进行选择。概率(probability)模型定义的彩票是彩金的概率分布,适用于描述客观未知(objective unknowns)情形,即奈特所谓的风险(risk)和(Anscombe & Aumann ,1963)中的轮盘(roulette)彩票;状态变量

纳什均衡不动点

纳什均衡的存在性与多重性 对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。所以,倘若某个概念所对应的事物并不存在。那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。 有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。 博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。 纳什在1950年代证明了纳什均衡的存在性定理,为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题,而且还为其后的博弈论研究提供了一整套方法论工具,即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析,这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题,博弈论专家已经做出了许多贡献,如聚点均衡、相关均衡,子博弈精炼纳什均衡,颤抖手均衡,序贯均衡等概念的提出。但不幸的是,这类努力还未使得多重均衡问题完全得到解决,许多博弈论专家正在这一领域进行着不懈的工作。 本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡 出自MyKnowledgeBase < 博弈论教学 Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡 目录 ■1 复习 ■2 混合策略(Mixed strategy) ■2.1 举例/Example ■2.2 概念 ■2.3 纯策略和混合策略 ■2.4 混合策略的争议 ■3 混合策略的纳什均衡 ■3.1 基本概念 ■3.2 混合策略纳什均衡的存在性/纳什定理 ■3.3 学术争议与批评 ■4 混合策略纳什均衡举例 ■4.1 社会福利博弈Social Welfare Game ■4.1.1 博弈分析(方法1:收益无差异) ■4.1.2 博弈分析(方法2:图形分析法) ■4.1.3 博弈分析(方法3:导数(Derivative)极值法) ■4.2 普通例子 ■4.3 审计博弈(Tax Game) ■4.4 激励的悖论[5] ■4.5 求解纳什均衡的一般方法 ■5 多重纳什均衡 ■5.1 多重纳什均衡举例 ■5.1.1 夫妻之争 ■5.1.2 制式问题 ■5.1.3 市场机会博弈 ■5.2 多重纳什均衡分析 ■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.1 帕累托最优Pareto optimality ■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.3 举例分析 ■5.2.2 风险上策均衡(Risk-dominant Equilibrium) ■5.2.3 聚点均衡(Focal Points Equilibrium) ■5.2.4 相关均衡 ■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义 ■7 作业 ■8 参考文献

生活中的博弈论感悟

生活中的博弈论感悟集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

《生活中的博弈论》学习感悟 第一讲初试博弈论 生活中的资源是有限和稀缺的,于是就产生了竞争,这种竞争就需要一种形式把大家聚在一起,这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用,其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧,还体现在我们生活中的种种小事中,如双方互拨打电话,放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上,通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素,博弈者做出对自己最有利最保险的决策和行动,从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手,但人的决策又具有有限理性,因此博弈论也不是万能的。 第二讲纳什均衡 在某一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。 第三讲囚徒困境 囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析,可以发现合作是可以实现双赢的。如:两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

一:子博弈精炼纳什均衡 在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。 譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。 在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。 定义3.1:子博弈精炼纳什均衡(SPNE): 扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。 如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。这也意味着原博弈的Nash均衡并不一定是子博弈精炼Nash均衡,除非它还对所有子博弈构成Nash均衡。例如前文的煤电博弈,(提价,接受)和(不提价,接受)均为纳什均衡,但后者并未满足在整个动态博弈及它的所有子博弈中都构成纳什均衡这一要件,因而理性的煤炭企业一定会选择提价。 博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。

博弈论 蒋文华 浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!

行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉

如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。

----汉代刘向,《围棋赋》二、西方的理解 game(规则) 费厄泼赖(fairplay) 第三节学习博弈论的收益一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展

《管理经济学(二)》论纳什均衡及其启示

装订处 论纳什均衡及其启示 摘要:纳什对博弈论的贡献有两个方面,一是合作博弈理论中的讨价还价模型,称为纳什讨价还价解;二是非合作博弈理论方面,这是他的主要贡献所在。纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样,他便奠定了非合作博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它己成为经济学中的专用术语。 关键词:纳什均衡;启示 博弈论可以划分为合作博弈和非合作博弈。合作博弈与非合作博弈是根据博弈者之间是否能够通过某种契约的约束采取合作的策略而区分的。合作的博弈是指在这种博弈中,博弈者能够通过谈判达成一个有约束的契约以限制博弈者行为,使之相互采取以一种合作的策略。如果博弈者无法通过谈判达成一个有约束的契约以限制博弈者的行为,则该种博弈为非合作博弈。 合作博弈强调的是团体理性,强调的是效率、公正、公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。目前,非合作博弈的理论相对成熟。在以下的分析中,由于分析对象大都是强调个体理性,并且,博弈的参与人之间没有一个具有约束力的契约来限制博弈者的行为,只是强调个人的理性。 在非合作博弈论中,又可以从两个角度对博弈进行分类:一是参与人行动的顺序。从这个角度,可以将博弈划分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指的是博弈中,参与人同时选择行动,或者是参与人虽然不是同时行动,但是后行动者不能知道先行动者所采取的行动;动态博弈指的是参与人的行动有先有后,且后行动者能够通过一定的手段知道先行动者的具体行动是什么;二是对其他参与人的特征、战略空间和支付函数的知识。从这

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论 1单选(10分) 博弈论的基本要素以下内容,除了()。 A.策略与策略集 B.均衡 C.支付与支付函数 D.局中人 正确答案:B你选对了 2单选(10分) 博弈论的基本假设是强调()。 A.均衡状态 B.利益最大化 C.个人理性 D.集体理性 正确答案:C你选对了 3单选(10分) 哪种表述模型更适合表示二人博弈()。 A.特征函数式 B.标准式 C.扩展式 D.以上都不适合 正确答案:B你选对了 4单选(10分) 根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。 A.静态博弈与动态博弈 B.常和博弈与非常和博弈 C.完全信息博弈与不完全信息博弈

D.合作博弈与非合作博弈 正确答案:D你选对了 5单选(10分) “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。 A.1994年诺贝尔经济学奖获得者John·Nash B.2012年诺贝尔经济学奖获得者Lloyd S. Shapley C.2005年诺贝尔经济学奖获得者Robert·Aumann D.1970年诺贝尔经济学奖获得者Paul A. Samuelson 正确答案:D你选对了 6多选(15分) 博弈论的研究特点包括()。 A.博弈论存在信息的对称性 B.博弈论涉及的决策者至少为两人 C.博弈论存在信息的不对称性 D.博弈论需要考虑其他决策者的决策对自身利益的影响 正确答案:B、C、D你选对了 7多选(15分) “囚徒困境”反映了()。 A.“看不见的手”是有力的,但不是万能的 B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的 C.个体理性与集体理性的冲突 D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益 正确答案:A、B、C、D你选对了 8判断(5分) 博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。正确答案:√你选对了 9判断(5分) 博弈论是单向的理性决策。 正确答案:×你选对了 10判断(5分) 理性选择是个人有意地使某个目标函数极小化的行为。

第四章 纳什均衡的存在性与多重性

第四章纳什均衡的存在性与多重性 对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。所以,倘若某个概念所对应的事物并不存在。那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。 有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。 博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。 纳什在1950年代证明了纳什均衡的存在性定理,为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题,而且还为其后的博弈论研究提供了一整套方法论工具,即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析,这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题,博弈论专家已经做出了许多贡献,如聚点均衡、相关均衡,子博弈精炼纳什均衡,颤抖手均衡,序贯均衡等概念的提出。但不幸的是,这类努力还未使得多重均衡问题完全得到解决,许多博弈论专家正在这一领域进行着不懈的工作。 本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

第讲第二讲(下):占优策略与智猪博弈

智能控制 第二讲(下):占优策略与智猪博弈第讲(下)占优策略与智猪博弈 吴建设

一个例子: 两家公司, A和B,在考虑是否通过广告促销。它们的 利润额将依赖于那家公司做广告, 或者两家公司利润额将依赖于那一家公司做广告或者两家公司 都做广告, 或者两家公司都不做广告。这些可能性 和相应的利润额被总结在旁边的矩阵里。

占优策略(Dominant Strategy)á在参与人各自的策略集中,如果存在一个与其他竞争对手可能采取的策略无关的最优选择,则称竞争对手可能采取的策略无关的最优选择则称 其为占优策略(gy),与之相对的其其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。占优策略是博弈论(game theory)中的专业术语,所谓的占优策略就是指无论博弈对手如何行动都属于本企业最佳选择的竞争策略

占优策略(Dominant Strategy) 对论怎么做做广告都是最优的所做á对A,无论B怎么做,做广告都是最优的。所以做广告是A的占优策略。 á对B:无论A怎么做,做广告也都是最优的。所以做广告也是B的占优策略。 á结论: 两家厂商都应该做广告

智猪博弈 在博弈论()中“智猪博弈”是á在博弈论(Game Theory)中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大 猪头小猪猪圈的头有猪食槽另头安猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的猪食进槽但是谁按按钮就会首先付出个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;的收益比是同时到槽边收益比是 小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提最终结果是小猪选择等待 都有智慧的前提下,最终结果是小猪选择等待

四种纳什均衡的联系和区别

四种纳什均衡的联系和区别 联系:纳什均衡、子博弈完美纳什均衡、贝叶斯纳什均衡、完美贝叶斯纳什均衡之间是密切相关的,他们都描述了在博弈中,所有参与者的战略组合,每个参与者的战略都是针对其他参与者的最优反应,在这种战略组合下没有参与者愿意背弃他选定的战略。 因此四种博弈都是纳什均衡,只不过在应用于更复杂的博弈时,我们引入更严格的限制条件来强化原来的均衡概念,每一个新的均衡概念的相继引入正是为了剔除依据原有概念可能得出的不合理的博弈结果,四种均衡概念的关系可以用下面的图表示: 区别: 1、四种均衡概念所适用的博弈类型不同: 即完全信息静态博弈对应纳什均衡,完全信息动态博弈对应子博弈完美纳什均衡,不完全信息静态博弈对应贝叶斯纳什均衡,不完全信息动态博弈对应完美贝叶斯纳什均衡。同时,适用于复杂博弈的纳什均衡适用于简单博弈,但适用于简单博弈的纳什均衡未必适用于复杂博弈。 2、四种均衡对应的策略选择不同,这与不同博弈中策略的不同定义相关: 在完全信息静态博弈中,参与者的战略与其行动一致;在完全信息动态博弈中,后行动者的均衡战略是对应于先行动者的各种战略的最优反应,因此这种情况下后行动者的战略和行动概念就不一样了;在不完全信息静态博弈中,由于参与者不能完全了解对方的效用函数,因此引入了type的概念,相应的均衡策略要求对于每一可能出现的type,均需要给出相应的最优行动,即最优行动为type的函数;在不完全信息动态博弈中,引入了belief的概念,因此最终的纳什均衡不仅包括参与者的战略,还包括了参与者对信息集节点的belief。 3、四种博弈的限制条件不同,复杂博弈的限制条件更强 在完全信息动态博弈,原来定义的纳什均衡未必合理,因为可能某些纳什均衡存在不可信的威胁或者承诺,所以在定义了子博弈完美纳什均衡后,将包含不可信威胁的纳什均衡给排除了;在不完全信息静态博弈中,由于我们引入了type的概念,因此为了得到针对其他参与者战略的最优反应,参与者的战略必须对应于自己的所有type;而在不完全信息动态博弈中,又强化了完全信息动态博弈子博弈的概念,将开始于单节信息集的子博弈扩展与可以开始于任何完全信息集,进而引入了belief的概念,不仅要求最优战略从给定的belief得出,belief也要符合贝叶斯规则,因此完美贝叶斯纳什均衡是限制条件最强的纳什均衡。

混合策略纳什均衡多重均衡

1 引论:博弈三要素 2 同时决策博弈 3 混合策略纳什均衡

囚徒困境与纳什均衡的应用
? 例如,2000年我国几家生产彩电的大厂商 合谋将彩电价格维持高位,他们搞了一个 “彩电厂家价格自律联盟”,并在深圳举 行了由多家彩电厂商首脑参加的“彩电厂 商自律联盟高峰会议”。
? 寡头厂商在光天化日之下进行价格合谋, 并且还通过媒体大肆炒作,这在发达国家 是不可思议的。

? “彩电厂商自律联盟”只不过是一种
“囚徒困境”,彩电价格不会上涨。在
高峰会议之后不到二周,国内彩电价格
不是上涨而是一路下跌。这是因为厂商
们都有这样一种心态:无论其他厂商是
否降价,我自己降价是有利于自己的市
场份额扩大的。
长虹
低价
高价
3
1
康佳 低价 3
6
6
5
高价 1
5

商家价格战与零利润定理
出售同类产品的商家之间本来可以通过共同将价格维持在高位 而获利,但实际上却是相互杀价,结果都赚不到钱。
当一些商家共谋将价格抬高,消费者实际上不用着急,因为商 家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩 溃【如果对方高价,我低价可以卖得更多而占便宜;如果对方低价, 我不出低价就会让对方卖得更多而占便宜】,价格就会掉下来。
长期来看,在一个竞争行业中,任何企业的经济利润都会趋于 零。 注意:区分经济利润和会计利润,经济利润不是简单的账面盈余, 经济利润不但要减去企业自身的会计成本,还要减去社会平均的正 常利润(所用资本的机会收益),而社会平均的正常利润非常微薄。

纳什均衡定义

纳什均衡定义: 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。 囚徒困境(prisoner's dilemma ):两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。来源囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。主旨囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。“囚徒困境”定义是1950年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢半年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑两年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。 2)纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。 假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1]),则此策略组合被称为纳什均衡 纳什均衡所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,经济学定义所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

一:子博弈精炼纳什均衡 在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。 子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。 譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a子博弈和图3.6b子博弈。 在静态博弈分析时,我们所说的战略是指

参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。 定义3.1:子博弈精炼纳什均衡(SPNE):

效用函数与纳什均衡

效用函数与纳什均衡李保明 (山东大学产权研究所,济南,250100) 刘家壮 (山东大学数学与系统科学院,济南,250100) 摘 要 本文引入效用函数将博弈问题描述为收入形式和效用形式两种模型,使得纳什均衡与参与人效用函数联系起来,并得到结论:(1)效用函数的变化对纯策略纳什均衡不产生影响,却改变真混合策略纳什均衡;(2)效用函数严格拟凹时,真混合策略纳什均衡是稳定的;(3)效用函数严格拟凸时,真混合策略纳什均衡不存在. 关键词 效用函数,博弈论,纳什均衡 1.引言 近二十年来,博弈论在经济学领域产生重大影响,并有从根本方法上改写经济学的趋势.博弈论在经济分析中的广泛适应性是因为它更好地描述了经济问题,并为决策者提供了一套可丢行的决策方法.其中的关键概念纳什均衡为相互影响的决策者提供了博弈可能结果的一致性预测,也是理性决策者最优决策的结果,从而为决策者指明了决策方向.但是博弈论本身的缺陷阻碍了经济理论的发展,其中之一就是纳什均衡的多重性,由纳什均衡不唯一性导致经济(或博弈)问题的一致性预测结果很多,决策者仍然面临不确定性问题.如何在众多的纳什均衡中选择更为合理的一个?目前仍然博弈论中的理论难点.泽尔腾的子博弈完美纳什均衡和颤抖的手完美均衡以及梅耶森的适度均衡都是精炼纳什均衡所作的努力.但是仍不能得到满意结果(即唯一的均衡),考尔伯格和默顿提出稳定均衡的概念(Stable equilibria ),并说明没有单一的策略组合能满足所有要求,因此均衡解应是某些策略组合的集合而不是单一的策略组合,这似乎给均衡精炼下了一个“不能达到唯的”结论,然而这对博弈论在经济学上的应用和解决经济问题产生巨大障碍.海萨尼、泽而滕(Harsanyi ,Selten ,1988)提出纳什均衡选择的收入占优和风险占优分析方法,但它引起许多争议,并与Cooper ,Dejong ,Forsythe ,和Ross (1990)等人的实验结果不相符.尽管如此,参与人的决策总是选择一个策略,而不是多个策略,在下面的讨论中,我们引入效用函数描述参与人的这种选择. 在所有的博弈描述中,它都是由参与人、参与人策略和各种策略组合下的结果(参与人支付)所组成.根据博弈问题的不同,它还有不同的信息结构.对于完全信息的博弈,上述三要素是参与人的共同知晓的共同知识(Common knowledge ).但是,应该看到在博弈论描述的经济问题中,决策者(或称参与人)是根据其效用选择其策略的,参与人知道自己的效用函数却不能保证他知道其他参与人的效用函数,也就是说实际决策所需的效用函数不是参与人共知的共同知识;那么,作为共同知识的支付只能是各种策略组合下参与人的收入.在纳什(Nash , 第17卷第4期2000年12月 经 济 数 学MA THEMA TICS IN ECONOMICS Vo1117 No.4Dec.2000 收稿日期:2000-05-23

12第十二章贝叶斯纳什均衡及其精炼

第十二章贝叶斯纳什均衡及其精炼 前两章讨论的是完全信息条件下的博弈,给出了博弈的基本分析框架。 本章将讨论不完全信息下的博弈行为,包括不完全信息静态博弈和不完全信息动态博弈。 12.1不完全信息博弈与贝叶斯纳什均衡 一、不完全信息博弈 完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(common knowledge)的博弈。 反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。 二、海萨尼(Harsanyi)转换 在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。 至于“类型”概念,以两个企业博弈的例子说明。 假设参与人1为在位者企业,参与人2为进入者企业。

进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。但是进入者不知道在位者的成本是高还是低。 因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。 海萨尼提出通过引入“自然”概念解决这个问题。 即由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。 在本例中,通过自然选择在位者的成本类型,进入者再针对高成本或低成本进行是否进入的博弈决策。 应当指出,通过自然选择类型的划分,不仅是针对支付函数而言的,其包括参与人所拥有的所有个人信息,如战略空间和信息集等等。 通过上述分析可知道,不完全信息意味着,至少有一个参与人拥有多种类型,否则就成为完全信息博弈。 用表示参与人的一个特定类型,表示参i θi i Θ与人所有可能类型的集合,,并假定 i i i Θ∈θ取自某个客观的分布函数。 n i i 1}{=θ),,(1n P θθL

高级西方经济学补充习题

第二讲偏好、效用、消费者基本问题及其扩展 1、设直接效用函数u(x 1,x 2 v(p,y),请计算政府分别征收0.5元的所得税或0.5元的商品税对消费者的间接效用有什么影响。 解:设效用函数为 Max s.t. p1x1+p2x2≤y ? L=λ[ y- p1x1- p2x2] 1L X ??=1 2X1-1/2X21/2-P1λ=0 2L X ??=1 2X2-1/2X11/2-P2λ=0 L λ??= y- p1x1- p2x2=0 得:x2*/x1*=p1/p2 即x2*= x1p1/p2 因此,x1*=12y p x2*=22y p 代入 u(x1,x2)=得间接效用函数v(p1,p2,y)=(12y p )0.5(22y p )0.5 如果p1=0.25,p2=1,y=2时,v(p1,p2,y)=(12y p )0.5(22y p )0.5=2 如果征0.5的所得税,则消费者的间接效用等于1.5 如果p1=0.5,p2=1,y=2时,v(p1,p2,y)=(12y p )0.5(22y p )0.5=1.41

2、设需要满足的效用水平是u ,效用函数u(x 1,x 2 解:构建一拉格朗日函数为: L=p1x1+p2x2+λ[u -x11/2x21/2] 1L x ??= p1-1 2λ x1-0.5 x20.5=0 2L x ??= p2-1 2λ x2-0.5 x10.5=0 L λ??=u - x11/2x21/2=0 有:12p p =12* *x x ? p1x1*= p2x2* 代入支出函数的表达式,有e= p1x1*+ p2x2*=2 p1x1* 从而,x1*=12e p x2*=22e p 因此,可得u =(12e p )0.5(22e p )0.5 ∴支出函数为:e(p1, p2,u )=2 u 3、已知一个消费者对牛奶的需求函数为p y x 1010+ =,这里x 为一周内牛奶的 消费量,y=120元为收入,p=3元/桶,现在假定牛奶的价格从3元/桶降为p=2元/桶。问: (1)该价格变化对该消费者的需求总效应是多少?(即其牛奶消费会变化多少?) (2)请计算价格变化的斯勒茨基替代效应和收入效应。 解:(1)p=3元/桶时,x(p,m)=10+310120?=14, p=2元/桶时,x(p,m)=10+210120?=16,

管理经济学的基本定义

治理经济学(MBA全景教程之二) 内容提要 第一讲 1.经济学的差不多命题 2.治理者的差不多任务 3.治理经济学的分析方法 4.企业与市场概述(一) 第二讲 1.企业与市场概述(二) 2.机会成本概述 3.市场需求曲线与需求函数 4.市场供给曲线与供给函数

第三讲 1.均衡价格概述 2.需求的价格弹性 3.需求的收入弹性 4.需求的交叉弹性 第四讲 1.生产函数 2.投入要素的最佳组合(一) 第五讲 1.投入要素的最佳组合(二) 2.生产扩大线路

3.规模酬劳 4.成本性质 5.成本函数(一) 第六讲 1.成本函数(二) 2.盈亏平衡分析 第七讲 1.市场构成概念 2.阻碍市场结构的因素 3.市场结构类型——完全竞争结构第八讲

1.市场结构类型―完全垄断结构 2.市场结构类型―垄断竞争结构 3.市场结构类型―少数垄断结构 第九讲 1.企业之间博弈的差不多知识 2.企业博弈的类型——纳什均衡 3.进入障碍和退出行为的选择 第十讲 1.产品定价新方法和实施条件 2.技术变革和创新的基础知识 3.技术变革和市场结构的关系

第一讲治理经济学概述与基础概念(一) 【本讲重点】 经济学的差不多命题 治理者的差不多任务 治理经济学的性质 治理经济学的要紧理论 治理经济学常用的分析方法 市场与企业(一) 治理经济学概述 治理经济学是微观经济学在治理实践中的应用,它为企业决策和治理提供分析工具和方法,其理论要紧是围绕需求、生产、成

本、市场等几个因素提出的,常用的分析方法有三种:均衡分析方法、边际分析方法和数学模型分析方法。 经济学的差不多命题 1.经济学的差不多命题:有效配置稀缺性的经济资源 治理经济学是经济学的一个分支。在学习治理经济学之前,我们必须先了解经济学的产生机制。经济学的差不多命题是现实经济中产生的一对矛盾:经济资源的稀缺性与人类需求的无限性之间的矛盾。 在那个世界上,所有的经济资源差不多上有限的,而人们的生产和生活的需求则是无限的。任何社会或个人都无法得到所想要的一切东西。如何样使有限的经济资源最大限度地满足人们的生产和生活需求?这确实是经济学这一门学科产生的前提。

子博弈精炼纳什均衡

子博弈精炼纳什均衡 ●将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。 ●由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。 与纳什均衡的区别 ●在纳什均衡中,参与人在选择自己战略时,把其他参与人策略当作给定的,不考虑自己的选择将如何影响对手的策略。 ●实际上,当一个人行动在前,另一个人行动在后时,后者自然会根据前者的选择而调整自己的选择,前者在作选择时自然会理性地考虑这一点,所以不可能不考虑自己的选择对其对手选择的影响。 博弈表达的标准型与扩展型 ●博弈的标准型表达有三个要素:参与人,可选择策略及支付函数。 ?两人有限策略博弈的标准型可用一个矩阵表来表示。 ●扩展型表达包括五个要素: ?(1)参与人;(2)每个参与人选择行动的时点;(3)每个参与人在每次行动时可供选择的行动集合;(4)每个参与人在每次行动时有关对手过去行动选择的信息;(5)支付函数。 市场进入阻挠博弈 ●假设一个企业A是市场上的唯一供给者,面临企业B可能的竞争威胁。企业A有两种可选策略,即斗争与默许。斗争表现为采用降低价格使B的收益为0,默许意味着维持高价格。企业B也有两种策略:进入或者不进入。假定进入之前垄断利润为300,进入之后寡头利润共为100(各得50),进入成本是10。各种策略组合下的支付矩阵如下表: 举例分析 ●该博弈显然有两个纳什均衡,即(进入,高价),(不进入,低价)。 ●静态分析方法,得到两个纳什均衡。 分析 ●给定企业B进入的话,企业A选择高价时得50利润,选择低价时得不到利润,所以最优战略是高价(默许)。同理,给定企业A高价时,进入策略成为企业B最优选择。尽管在企业B 选择不进入时,企业A采取任何一种策略都是一样得,但只有当企业A选择低价时,不进入才是企业B的最优选择,所以(不进入,低价)也是一个纳什均衡,而(不进入,高价)不是纳什均衡。 子博弈与精炼纳什均衡 ●用动态博弈理论来讨论实际究竟发生哪个纳什均衡。 ●给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为“子博弈”。 ●只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 举例的进一步分析 ●在市场进入博弈中,在给定企业B已经进入的情况下,在位者的“斗争”,“高价”策略已不再是最优的,这种“斗争”是不可置信的威胁,因为斗争的结果是没有利润;而合作会带来50单位利润。所以,(进入,高价)不是一个精炼纳什均衡。 ●剔除这个均衡,可以证明,(进入,高价)是唯一的子博弈精炼纳什均衡。 说明 ●只有那些不包含不可置信威胁的纳什均衡才是精炼的纳什均衡。 ●有些纳什均衡之所以不是精炼均衡,是因为它们包含不可置信的威胁;然而,如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数,使不可信的威胁变得可信,博弈的精炼均衡就会相应改变。

相关主题
文本预览
相关文档 最新文档