- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
max min (i, j) 为对局的下对策值; iS1 jS2
min max (i, j) 为对局的上对策值。 jS2 iS1
定理 10.1 对两人零和对策,下对策值 上对策值。
证明 令 A(i)= min (i, j), B(j)= max(i, j),
j
i
__
_
令 i , j,使 A( i )= max A(i)= max min(i, j),
(i* , j* ) min (i* , j) max min (i, j)
jijFra bibliotek(10.4)
右端是下对策值。
(10.3)(10.4)的左端是相同的,结合两式的不等式,得:
下对策值=max min (i, j) min max(i, j)=上对策值。
i
j
j
i
由定理10.1,可知,下对策值=上对策值。
60~70年代,由Harsanyi和Selton等人分别发展了 动态对策与不完全信息对策论等现代对策论,并为 对策论在经济理论中的应用开拓了发展的前景。
80年代后很多教科书由于对策论的广泛应用,它 的理论、思想、方法已经渗透到经济研究的各种分 支,而被重新改写。
1994年, Nash-Harsangi-Selton 三人同时获得 诺贝尔经济学奖。
对划线法,我们还可举例: 例10.4 1 2 3
1 1 , 0 1 , 3 0 , 1 2 0 , 4 0 , 2 2 , 0
或
1(i , j) 2 (i , j)=0 , 故称为零和对策。
对I:“从坏处着想”
I1:min{1(1,j) j=1,2,3}= 5 I2:min{1(2,j) j=1,2,3}= -10
“争取最好的结果”
max{5, -10}=max 1i2
min
1 j 3
(1 i
,
j )=
5
对II:“从坏处着想”
若存在i、j( i S1,j S2)使:
1(i,j ) 1(i, j), 2 (i, j ) 2 (i, j),
i S1 jS2
则称i, j为一对Nash均衡策略。
定理10.2 在非合作两人零和对策中,存在Nash 均衡策略的充分必要条件是下对策值等于上对策值。
证明 必要性,设i,j为对策的Nash均衡策略。则
对策论
10.1 纯对策问题
对策论(博弈论)最早源于本世纪40年代,主要由 Van Neumann和Morgenstein奠基于1944年合著的 一本书“对策论与经济行为”。
从50年代到60年代,对策论发展了很多重要的 新概念,如 Nash创立了Nash均衡概念,并证明了 n个有限策略Nash均衡的存在性定理。
i
i
j
_
B( j )= min B(j)= min max (i, j),
j
j
i
max min (i, j) =A(i)=min (i, j) (i, j)
i
j
max (i, j) =B(j)= min max (i, j)
i
j
i
定义 在非合作的两人对策中(零和或非零和的),
设对局为 ={S1 , S2 , 1 , 2 },其中 S1 , S2分别为I, II 的策略集。1 ,2分别为I、II的利益矩阵。
坦白 0 , 8 5 , 5
用划线法来求Nash均衡策略如下: : 对付的抗拒策略,他会选择坦白策略,在 0下划线;
对付的坦白策略,他会选择坦白策略,在-5下划线; : 对付的抗拒策略,他会选择坦白策略,在 0下划线;
对付的坦白策略,他会选择坦白策略,在-5下划线; 所以双方的“坦白”策略为Nash均衡策略。
乙
甲
正
反
上对策值为 1
正 -1 1
所以,不存在Nash均衡策略。 反 1 -1
两人常和对策: 即 1(i, j) 2 (i, j)=常数,如
1
1 7, 3 2 4, 6
2 3
2, 8 4, 6 3, 7 5, 5
常和10, 各方减
1
2 3
10/2得
1 2, -2 3, 3 1, 1 2 1, 1 2, 2 0, 0
实际上就变成零和对策了。所以,常和对策 实质上就是零和对策的一种变形。然而在经济学 中最常用的还是变和对策,即局中人各有自己的 利益函数,且
1 (i, j) 2 (i, j) 常数。
例10.3 一个著名的例子为“囚犯困境”:他们
在非合作的情况下,对局如下:
抗拒
坦白
抗拒 1 , 1 8 , 0
例10.1 (非合作)两人零和对策。
对策人(局中人):I ,II 策略集:S1 :{I1 , I2 }
1 2 3
S2 :{II1 , II2,II3 } 1 8, -8 20, -20 5, -5
利益矩阵:如右图。
2 15, -15 10, 10 8, 8
注意:1(i , j) 2 (i , j),
(i* , j* ) (i, j* ),
i S1
(i* , j* ) max (i, j* ) min max (i, j)
i
j
i
右端是上对策值。
(10.3)
另一方面, (i* , j* ) (i* , j)
j S2
即
(i* , j* ) (i* , j),
j S2
充分性: 设 上对策值=下对策值,则两者有共同
的策略 i, j 。则
A(i)=(i, j)=B(j)
(i, j)=B(j)=max(i, j) (i, j) i S1 i
(i, j)=A(i)=min(i, j) (i, j) j S2 j (即 -(i, j) (i, j), j S2 )
这说明 i, j 就是一对Nash均衡策略。
(10.1)
II1:max{1(i, 1) i=1,2 }=15 II2:max{1(i, 2) i=1,2 }=20 II3:max{1(i, 3) i=1,2 }=15
“争取最好的结果”
min{15,
20,
5}=
min
1 j 3
max
1i2
1
(
i,
j)
5
(10.2)
定义 若I的策略集为S1,II的策略集为S2,则称
我们当然希望能找到Nash均衡策略。然而不是 每个纯对策问题都存在Nash均衡策略的。
例10.2 猜硬币对策
甲、乙两人,甲拿硬币设置正、反面后用手盖住, 要乙去猜。 如 乙猜中, 乙赢(甲输);
如 乙猜不中,甲赢(乙输)。
因此他们的对局和利益矩阵为右图。
(即甲的利益矩阵)。 容易看出, 下对策值为 -1