当前位置:文档之家› 35博弈论-第四章

35博弈论-第四章

35博弈论-第四章
35博弈论-第四章

第四章完全信息动态博

更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。而这一章,我们将围绕这子博弈完美均衡来展开。

第一节完美信息与完全但不完美信

完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。我们不妨用两个例子来加以说明。

例4.1 动态囚徒困境

囚徒1

图4-1 动态囚徒困境

例4.2 取消管制

政府

图4-2 取消管制

与图4-2完全等价的表示方法见图4-3。

政府

图4-3 取消管制

定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博弈。

显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。

第二节动态博弈的扩展式我们把博弈中所有从开始到结束的行动序列称为全历史(Terminal history),而用参与者函数来表示在每一个全历史上,在博弈进行到某个阶段时谁来行动。因而要完整地描述一个动态博弈,必须具备四个要素:

(1)参与者集合;

(2)全历史集合;

(3)参与者函数;

(4)偏好。

如果我们把全历史表示成一个行动序列(a1, a2,…, a K)(K为自然数,当K→∞时,就表示无穷动态博弈),那么(a1, a2, …, a m),其中m K

≤,就称为全历史(a1, a2, …, a K)的子历史(Subhistory)。当m < K时,(a1,

a2, …, a m)就是全历史(a1, a2, …, a K)的真子历史(Proper subhistory)。显然,在博弈开始前的历史是一个空历史(Empty history),因而空历史是所有全历史的真子历史。今后我们将用?来表示空历史,用h来表示子历史,而用H来表示全历史的集合,而P则表示参与者函数。

定义4.2 完全信息动态博弈的扩展式为{,,,}

Γ=,其中N为参

N H P u

与者集合,H为博弈的全历史集合,即H={(a1, a2, …, a K)},其中K为博弈从开始到结束依次发生的行动次数,行动序列中的每一个a都为向量。P为参与者函数,即P(h)={i: i∈N},h H

∈。u为收益函数,表示博弈参与者的偏好。

与博弈的基本式相比,扩展式没有直接给出博弈参与者的行动集合,原因在于扩展式已经隐含地定义了各参与者在行动时有些什么样的行动可供选择,根据全历史和参与者函数,能很容易地得到各参与

者的行动集合。在历史h之后,参与者P(h)所有可能的行动集合定义为

A P(h)(h)={a P(h): (h, a)是一个子历史,a P(h)是行动向量a的第P(h)个元素}

例如,在取消管制博弈中,根据全历史集合H和参与者函数P(?) =政府,P(取消)={1, 2},可知A(?)={维持,取消},即政府有两个行动——维持和取消;A1(取消)={进,退}和A2 (取消)={进,退},即两个企业各有两个行动——进和退。

需要注意的是,在完美信息下,扩展式有三个地方与完全但不完美信息不同。首先,历史h由行动向量序列变为行动序列,例如,在取消管制中,历史(取消,[进,进])是一个向量序列,因为企业1和企业2是同时行动的,如果改成企业2后行动,那么就变成(取消,

进,进),也就是由一个向量序列便成了单值序列,意思也完全不一样了。其次,参与者函数P(h)都是单点映射,对应着唯一一位参与者。最后,就是行动集合A可以省略下标,因为A(h)={a: (h, a)是一个子历史}。

现在我们将例4.1和例4.2的扩展式表达如下:

例4.1 动态囚徒困境的扩展式为{,,,}

Γ=,其中

N H P u

(1)参与者集合:囚徒1和囚徒2,N={1,2}。

(2)全历史集合:招供为C,沉默为S,H={(C, C), (C, S), (S, C), (S, S)}。

(3)参与者函数:P(?) = 1,P(C) = P(S) = 2。

(4)偏好:对于囚徒1而言,最好的历史是(C, S),其次为(C, C),然后为(S, S),最倒霉的历史为(S, C)。对囚徒2而言,最好的历史是(S,

C),其次为(C, C),第三为(S, S),最差为(C, S)。

例4.2取消管制的扩展式为{,,,}

Γ=,其中

N H P u

(1)参与者集合:政府,企业1和企业2,N={1, 2, 3}。

(2)全历史集合:维持为C,取消为D,进入为E,退出为Q,那么全历史集合H={(C), (D, [E, E]), (D, [E, Q]), (D, [Q, E]), (D, [Q, Q])。

(3)参与者函数:P(?) = 1,P(D) = {2, 3}。

(4)偏好:对于政府而言,根据五个历史对应的社会福利进行排序,对于企业1和企业2而言,则为五个历史对应的利润排序。

例4.3 进入博弈

在一个垄断行业,已经存在一个垄断企业,我们将其称为在位者,现在有一个新的企业决定是否进入该行业,我们将其称为挑战者。挑

战者首先行动,决定进入(E)或是退出(Q),如果挑战者进入,那么在位者将决定是与挑战者和平共处(A)还是战斗(F)。其博弈的扩展式Γ=如下:

{,,,}

N H P u

(1)参与者集合:挑战者和在位者,N={1,2}。

(2)全历史集合:H={(Q), (E, A), (E, F)}。

(3)参与者函数:P(?) = 1,P(E) = 2。

(4)偏好:如果挑战者退出,那么挑战者得到0的利润,而在位者得到3的利润;如果挑战者进入,那么如在位者选择战斗,有可能两败俱伤,挑战者的利润为-1,在位者的利润为0,如果在位者选择和平共处,那么挑战者得2的利润,而在位者得1的利润。因而,挑战者偏好历史(E, A)>(Q)>(E, F),而在位者偏好历史(Q)>(E, A)>(E, F)。其扩展式也可用博弈树来加以描述,如图4-4所示。

例4.4 蜈蚣博弈

该博弈有两位参与者。当参与者1行动时,他将决定是结束博弈还是继续,如果结束博弈,那么参与者1得2,参与者2得0;如果继续博弈,那么轮到参与者2决定是结束博弈还是继续,如果结束博弈,那么参与者1得3,参与者2得1;如果继续博弈,那么轮到参与者

1(-1,0)

图4-4 进入博弈 (2,1)

行动,如果他选择左(L),那么参与者1得1,参与者2得2,如果他选择右(R),那么两人都得0。

该博弈的扩展式其博弈的扩展式{,,,}

N H P u

Γ=如下:

(1)参与者集合:N={1,2}。

(2)全历史集合:继续为C,结束为D,H={(D), (C,D), (C,C,L), (C,C,R)}。

(3)参与者函数:P(?) = 1,P(C) = 2,P(C, C) = 1。

(4)偏好:如果全历史为(D),那么参与者1得2,而参与者2得0;如果全历史为(C, D),那么参与者1得3,参与者2得1;如果全历史为(C, C, L),那么参与者1得1,参与者2得2;如果全历史为(C, C, R),那么两人都得0。参与者1最偏好历史(C, D),而参与者2最偏好历史(C, C, L)。该扩展式如图4-5所示。

(1, 2) (0, 0)

图4-5 蜈蚣博弈

第三节策略和结果

策略是“万全之策”,而不再是单纯的行动,如何理解这句话呢?

1、动态囚徒困境中囚徒2的策略

表4-1 囚徒2的四个策略

2、蜈蚣博弈中参与者1的策略

关键是理解DL,DR也是策略。

所以说,策略是一个“万全之策”。

定义4.3 对于博弈{,,,}

Γ=,参与者P(h)的一个策略s P(h)(h)就

N H P u

是一个函数,它将每一个可能的历史h映射成行动空间A P(h)(h)中的一个行动a p(h)。

上述策略的定义实际上就是指当历史进行到某个阶段时,当轮到参与者i行动时,规定了他如何行动。例如,在蜈蚣博弈中,对于参与者1而言,一个策略就是当历史为空历史时,规定了参与者1如何行动,当历史为(C, C)时,规定了参与者1又如何行动,因而DL和DR就是参与者1的策略,至于历史(C, C)会不会发生那是另外一个问题,策略所要求的就是一旦出现了某个历史我应该如何做,而不能出现不知所措的情况。

通过上面的说明我们看到,有什么样的策略组合就会有什么样的

历史,但历史并不等于策略。为此,我们引入结果函数,即对于任意

∈,使得O(s) = h。参与者的收益函数u就是定义在∈,存在某个h H

s S

结果上的函数。

例如,在蜈蚣博弈中,可知参与者1有四个策略CL、CR、DL和DR,参与者2有两个策略C和D,因而策略组合有8个,其相应的结果函数为

O(CL, C)=(CCL) →u1(O(CL, C)) = 1和u2(O(CL, C)) = 2;

O(CR, C)=(CCR) →u1(O(CR, C)) = 0和u2(O(CR, C)) = 0;

O(C x, D)=(CD) →u1(O(C x, D)) = 3和u2(O(C x, D)) = 1;

O(D x, x)=(D) →u1(O(D x, x)) = 2和u2(O(D x, x)) = 0。

其中x代表任意行动。上面的结果函数给了我们两点启示:一是,要得到全历史实际上只需行动计划就可以了,不一定需要去考察所谓

的“完全之策”,例如,O(D, x)=D=O(D x, x)是一样的,这样做的好处是能够简化分析,但在观念上,我们必须牢记策略是“万全之策”。二是,图4-5的蜈蚣博弈实际上与图4-6中的博弈完全等价,这就更为直观地指出了策略DL和DR的性质。实际上,汤普森(Thompson, 1952)论证了对于任意两个等价的扩展式博弈,至少存在4种转换方式,通过转换,可以把复杂的扩展式博弈变成最简单的形式去分析。

(2, 0)

(1, 2) (0, 0) (2, 0)

图4-6 与蜈蚣博弈等价的博弈

第四节 纳什均衡与子博弈完美均衡

一、纳什均衡

纳什均衡概念的核心就在于,每一个参与者的策略都是给定其他参与者策略下的最优反应,并且对任意参与者成立。即便博弈是动态的,这一点也不会改变。那么,将静态博弈中的纳什均衡概念运用到动态博弈中应该是一个不错的思路,尽管这样做可能存在问题。 定义 4.4 扩展式博弈{,,,}N H P u Γ=的纳什均衡是一个策略组合*s S ∈,

使得对任一参与者i N ∈,i i s S ?∈,不等式((*,*))((,*))i i i i i i u O s s u O s s --≥成立。

由于有什么样的策略就会有什么样的结果,因而收益函数又可直接看作是策略的函数,这样动态博弈{,,,}N H P u Γ=就有了与之等价的策

略式博弈。

定义4.5 G={N , S , u }称为完全信息动态博弈{,,,}N H P u Γ=的策略式(或基本式),其中S 就是动态博弈{,,,}N H P u Γ=定义的策略空间,并且u (s )=u (O (s ))。

图4-7所示的完美动态博弈的策略式是什么呢?

其策略式G={N , S , u }如下:

(2,1) (4,2) (5,2)

(3,3) c 图4-7 完美动态博弈

博弈论结课论文——大学生活中的困境与突围

是课上所说的“存在优势策略”。 (2)绝色美女困境: 受很多影视作品和网络文学的影响,人们心目中恋爱组合的影像应是“帅哥+美女”,但是在校园里我们常常会看到“美女+野兽”、“帅哥+恐龙”的恋人组合,为什么? 在现实生活中,绝色美女被冷落并非特例,她们的条件比别人好,却没人追求。这种现象的发生根源于信息的不对称,对绝色美女有好感的优秀男生会想:这么美的女孩一定有很高的门槛,自己与其受人家的拒绝后没人要,不如在自己喜欢的女孩中去选择。而野兽们自己没人追求,也就没有受到拒绝后损失的成本机会,他会一心一意、锲而不舍的放手去追那朵“鲜花”,如果追到则其收益无穷大;而如果失败了,也没什么损失。所以“美女+野兽”的组合也就合情合理了,而“帅哥+恐龙”的原因也是如此。 解决“绝色美女困境”的方法就是:假如很多人都对一个特定环境里德绝色美女展开攻势,你放弃是一种优势策略。但当别人都群体冷落这位美女的时候,你就应该勇敢地去追求。当然,这需要很好的观察力和判断力。 二:博弈论在高校考试中的应用——混合策略博弈与完全静态博弈研究对象:学校,学生群体(区分为优秀生与差等生)——分析舞弊者与他们之间的博弈关系,监考老师;其中学生与学校的博弈为混合策略博弈,而学生与学生群体之间的博弈为完全静态博弈。 相互关系:大学生与高校的博弈

A、大学生与高校的博弈分析: 1、事实说明:学生参加考试,其作弊行为发生与否,与高校的考试制度息息相关,而考试制度的直接表现者为监考老师,所以本博弈分析,将高校具体为监考老师,即考察学生与老师的博弈分析,而且该博弈用到的信息均为深大目前的考试制度信息。 2、学生与监考老师的博弈分析模型(此博弈为混合策略博弈)。 假设:老师和学生都是理性人,二者在决策的过程中不会考虑道德成本,而且只要老师监考尽职,学生舞弊行为一定被发现。 (1)支付矩阵的构建。假设以下参数: ①监考老师认真监考的成本 B1;认真监考的收益 A1 ②不认真监考的成本 C2,监考老师不认真监考的收益 R2 ③学生诚信考试的收益 C1。 ④学生舞弊考试的收益 G2;学生舞弊的成本 M (3)均衡意义:①由于学生的作弊概率与老师认真监考的成本B1 和不认真监考的收益 R2 成正比,与老师认真监考的收益A1 和不认真监考的成本 C2 成反比,而在现实学校生活中,老师认真监考的

基于博弈论的夫妻冲突分析

一个女人能有多美,通常是由与她相伴的男人来决定;一个男人能走多远,往往是由与他相随的女人来决定。夫妻之间的物质生活水平,通常是由收入较高的一方来决定;夫妇之间的精神生活水平,往往是由素质较低的一方来决定。 囚徒困境 在囚徒困境这个例子中,两个囚犯的上策都是坦白,因此最容易出现的结局也就是两人都被判5年。这个结局构成了一种博弈均衡状态,当对局者选择的都是上策的时候,这种均衡叫做上策均衡。在博弈论中,所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有对局者都不想再改变他们所选择的策略。二.情侣冷战对峙 现将囚徒困境的报酬矩阵分析引入到一对情侣的冷战对峙中,见下图: H表示主动的一方感觉自己付出更多从而受到伤害,生出不平衡感;E代表不主动的一方有种优越成就感谈过恋爱的人都会对此有深刻的体会吧。闹矛盾有别扭之后,有时也可能两人都想主动了,但谁也不先迈出这一步,在不知道对方策略和想法的情况下,一权衡一算计就总害怕自己亏了,又或者碍于情面拉不下面子,不肯服个软。于是乎,秋水望穿了,花瓣也掰完了,最后是怎样呢?在这个矩阵中我们需要考虑的是,或者说我们的假设前提是,双方都是完全理性的,是完全以利己目的和最大化利益为原则行事的人。上策均衡显然并非最好的结局,但却是博弈双方经过反复权衡后所采取的认为对自己最有利的选择。但我们知道,所谓的爱情是没有理性可言的,它是一种激情,一旦斤斤计较反复权衡利弊得失,那就不叫爱。所以非常有意思的是,这个矩阵中出现的上策均衡(O,O——OVER),即双方都不主动从而导致感情破裂爱情失败的结局,正说明了爱情只要一权衡一算计,俩人都矜持和自私的话,那么最终铁定玩完。 三、夫妻关系的博弈分析 感情,爱情,亲情夫妻关系尴尬的了现实的活动中,夫妻关系既有和谐、融洽的一面,也存在冲突、矛盾的一面。每5对佳侣新婚燕尔之时,就有一对夫妻分道扬镳。 无论是丈夫还是妻子,双方都有自己的利益追求和价值取向,而家庭生活成为他们博弈的载体和工具。

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

自己写的博弈论结课论文

自己写的博弈论结课论文 博弈论论文 博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。 页 1

基于博弈论的恋爱模型

《数学建模》 课程考核论文 姓名:王湘衡齐久坤张程勇 学号:08100225 08100217 08100232 班级:08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型 摘要 本文用数学建模的方法研究博弈论中的问题,从不完全信息静态博弈建立模型建立模型,并利用纳什均衡原理程序来确定纳什均衡点,对不同均衡点进行分析,从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈,来模拟现实社会中的恋爱,再利用恋爱者不同类型的分布概率,求出恋爱者的期望,最终来决策恋爱者自己下一步的策略。 关键词:恋爱模型博弈论贝叶斯纳什均衡

1、问题重述 随着社会的进步和发展,现在恋爱问题越来越成为生们关注的热门话题,那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人,成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人,这其中将恋爱双方都理想化,这样将给我们研究恋爱问题和建立数学模型带来方便,使我们能将恋爱模型数学化,从而确定恋爱者的进一步决定。 2.模型假设及符号说明 模型假设: 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人,并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略 符号说明: 3. 问题分析与模型建立 3.1 问题分析 谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看,谈恋爱的男女双方,各有不同类型,我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象,寻求的是一般解释。有了这样的分类便有了不同的组合,有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美,却不会让他得逞,原因是理性经济人的假设。有人说这一点说不通,我不这样认为,经济学说所有人都是理性的并不影响不理性家伙们的存在,能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。 简单的博弈理论己深入人心,显然上面的问题是不完全信息博弈,无论是男追女还是女追男,信息的不完全或是不对称是显而易见的,用博弈论的话说是对对方的了解不够精确。因此,我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡,动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型 所谓静态是指所有参与生都同时行动,不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例,一个男生追求一个女生,在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人,虽然自己可以从各种渠道了解男生,但知生知面不知心,风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题,因为女生不仅不知道男生的类型(A还是B),而且还不知道不同类型的分布概率,但她对自己所属的类型是清楚的,这是她的私人信息。同理男生也是这样。 下面来设定支付函数的权值,以便求出纳什均衡点,设男A类追求者,只要他追求A类女生就得到10,他不追求A类女生就得到-10,A类女生接受得到10,拒绝得到-10;男B类追求者,他追求A类女生得到10,不追求得到-10,A类女生接受得到-10,拒绝得到10;男A类追求者,他追求B类女生得到-10,不追求得到10,B类女生接受得到10,拒绝得到-10;男B类追求者,他追求B类女生得到10,不追求得到0,B类女生接受得到10,拒绝得到0;他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明:

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。 (5)“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。 答:错误。“鼓励—响应”机制也就是说真话的直接机制,实际上只保证博弈方揭示,也就是说出自己的真实类型。 博弈方不直接选择行为,也不保证根据真实类型行为,更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的,并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。 二、双寡头古诺模型,倒转的需求函数为 ()P Q a Q =-, 其中12Q q q =+为市场总需求,但a 有h a 和l a 两种可能的情况,并且厂商1知道a 究竟是h a 还是l a , 而厂商2只知道h a a =的概率是θ, l a a =的概率是1θ-,这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量,问双方的策略空间是什么?本博弈的贝叶斯纳什均衡是什么? 解:设厂商1已知h a a =时的产量为11()h q a q =,已知l a a =时的产量是11()l q a q =;再假设厂商2的产量是 2q ,这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

自己写的博弈论结课论文

博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。

反而会使自己的利益也受到损害,得不偿失。由此可以看出,生活在集体中就不能只以自己为中心,要多为他人着想,多为集体着想,多一些理性的交流和沟通,互相学习、团结互助、彼此尊重、取长补短,营造出和谐温馨的氛围对于个人的身心发展都大有好处,同时会使每个人的收益大幅增加达成共赢,获得更好的结局。

(数学建模教材)7第七章对策论

第七章 对策论 §1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来 解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对 策论起源于 1944 年 J.,V on Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。 对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展 的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常 生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。 在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对 抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目 标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并 力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否 存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。 §2 对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的 努力而是各方所采取的策略的综合结果。 先考察一个实际例子。 例 1(囚徒的困境) 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大 量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个 人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双 方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从 宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列 于表 1。 表 1 表 1 中每对数字表示嫌疑犯 A 、B 被判刑的年数。如果两名疑犯均担心对方供认并希 望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i )局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局 中人。通常用 I 表示局中人的集合.如果有 n 个局中人,则 I = {1,2,L , n }。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A 、B 两名疑犯。 (ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参 加对策的每一局中人 i , i ∈ I ,都有自己的策略集 S i 。一般,每一局中人的策略集中 至少应包括两个策略。 -154- 嫌疑犯 B 供认 不供认 嫌疑犯 A 供认 不供认 (3,3) (0,7) (7,0) (1.5,1.5)

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析 摘要 随着市场经济的发展,人们对事物认知态度的变化,经济学的应用范围进一步扩大,人们的行事原则越来越趋向于经济学上的“理性”。就现状而言,经济学的分析不仅局限于某些领域,只要存在人类的社会活动,就存在经济,就存在资源合理配置问题,也就有经济分析的必要。谈恋爱是校园中的一个普遍现象,本文从经济学的视野中透视,爱情中的微观经济学问题,包括从预算线角度分析择偶以及爱情中的博弈关系,并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。 关键词:微观经济学;爱情;预算线;博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者:————————————————————————————————日期: 2

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。 如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论结课论文

博弈论基础 结课论文 课程名称:博弈论基础授课教师: 专业班级: 学生姓名:学号 成绩:

博弈随笔 以前,只是听说博羿——认为是那些?谍战片?似的斗心机,拼命得到所谓的胜利,让我想到?左右互搏术?。今天,挺欢喜的,值得一听,更加值得一想。 老师与学生第一节课,以(身边)故事开场,吸引了在玩、在谈、在写、在愣神的学友的耳朵和眼球,学友们——也学到了些东西,或者与博羿之思想能碰撞闪现出火花,有利益关系吗?一个,望学术或教育水平得到提高或责任的心。另一个,得点学分或找点乐子或陪伴人或还真有少许的是学的。俗话说的好?愿打,也得愿挨?呀!要么,人数成?抛物线?一样变化,要么是?倒梯形?,这也许就是学生,大学生的规律!而师,或呆板地照本宣科或妙趣横生或平平淡淡。显然,我们比较幸运点! 注:学点东西——还是比较好的。如何提高教学质量与学习效果?一个人,当TA面对TA喜欢或感兴趣的,才会花时间去听(无意评价教育体系),这可能占到大部分吧(希望),少部分随意的点的(暂评),因此,怎么才能延长其喜欢的持续时间:才是关键(除一些真学的)。 总之,?少壮不努力,老大徒伤悲?! 效率——单位个体在单位时间内获得的成果。现在,自己,的确是在玩时间战术,耗得起吗?也许只有在有效时间内完成自己的任务,努力加信心 (说偏了)。没话了,挂住了。 记于二零一二年三月一号晚二十三点五十六分(写了将近四十分

钟) 今天晚上,上课,感觉到了无聊与无奈,选修与专业,浅与深。主要讲了一些博弈的基础知识(概念类),自己也记了一些笔记(各人有各自的学习方法)。而我是靠时间磨靠笔磨的!偏了,,回归正传。她(老师)讲了一些故事——这的确挺吸引人眼球与耳朵的。但下面因为玩,其他的继续。同志们,半推半就的去 STUDY! 3月中旬的一次课,忘了忘了! 今天——2012年3月22日,博弈论的第三次课了(好像学生上课,都是这样似的)。 她,老师讲了纳什均衡的运用实例——一些经典例子:双垄断的博弈——也推倒出了于今下有实际意义的结论!但,我好像没有像第一次上课那样——认认真真的听:边看着鲁迅的小说边听着老师的?絮叨?,其实——自己挺喜欢数学的:可由初中的喜爱得出,只是随着时间的推移与知识的无奈——?膨胀?,自己也被自己慢慢的舍弃了! 难道自己没有想过吗?答案,不言而喻! 一个人,可悲的不是知道,而是无知与明明知道而又偏偏无知! 莫伤,也伤不起!三月的最后一节,老师讲了一些?概率性?的纳什均衡。第一小节,师已讲了个例子,同时也演算了一个例子,当下课布臵了一个小问题,在课间做,却无人问津。上课时?自然?鸦雀无声。

博弈论的读书笔记

博弈论的读书笔记 【篇一:博弈论读书笔记】 博弈论读书笔 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行 为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗 争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优 化策略。 博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈 的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数 学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑 没有学过高等数学,但是这并不影响他通过运行策略来帮助田忌赢 得赛马。 博弈时时存在,它就在你的身边。本书就是试图通过日常生活中常 见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来 指导生活决策的方法。 在李凌、王翔的《论博弈论中的策略思维》中,作者从博弈论的起 源谈起,回顾了博弈论在诺贝尔经济学奖上所取得的成就,把博弈 论中的经典案例同生活中的实际例子联系起来进行分析,从合作、 模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是 如何影响人们的行为的, 又是如何使得博弈达到均衡的。最后,围 绕演进博弈论的基础理论与实例案例来分析对传统博弈论的冲击, 及其使博弈论的发展上升到了一个新的阶段和深度。

! 以下是对这篇文章中的囚徒困境、智猪博弈和演进博弈论的简述和分析: 一、囚徒困境—合作还是不合作 在这个模型中,合作还是不合作问题得到了很好的解释,纳什均衡解就是都选择坦白,也就是跟对方囚徒不合作,但这个解对两个囚徒来说并不是帕累托最优解,囚徒困境反映了集体理性和个人理性的矛盾。联系到实际生活中的例子政府提供公共物品,如果让使用资源者自愿承担费用,则会由于搭便车现象的出现,而无法实现共同提供公共物品的目标,所以需要政府通过纳税的方式来提供,以实现帕累托最优,达到资源的有效配置。囚徒困境有限次重复博弈中,当一次性违约的收益大于失信所必须付出的代价时, 企业就存在偏离合同规 定行事的激励,这种内生的激励表明,“损人利己”也是行为人的理性选择。在无限次重复博弈中,如果企业之间致力于长期合作, 就应当设法改变合作机制, 降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是提高失信成本。然而在实际生活中的局中人可能受各种外部环境因素或者市场地位的影响,并非是完全理性的,所以在合作方面还存在着一定的风险,这就需要订立合作契约,将这种风险最小化,从现实经济利益的角度提高失信成本,使失约威胁实现真正的可置信。 二、智猪博弈—创新还是模仿 在智猪博弈中,在理性人的假设下,大猪和小猪的支付矩阵决定了大猪选择按,小猪选择等待。类似的,在股票市场中,大户是大猪, 他们进行技术分析, 收集信息、预测股价走势, 所付出的成本高,而相应得到的收益也比较高,而大量散户就是小猪, 他们几乎不花成本去进行技术分析, 而是跟着大户的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象。在股份公司中, 大股东是大猪, 他们收集信息、监督经理, 拥有决定经理任免的投票权,

耶鲁大学公开课博弈论笔记 博弈论 讲

博弈论作业(博弈论24讲)数应专业 一、 1、理性人:指代这一类人,他们只关心自己的利益。 2、如果选择a的结果严格优于b,那么就说a相对于b来说是一个严格优势策略。结论: 不要选择严格略施策略。 3、理性人的理性选择造成了次优的结果 4、举例:囚徒困境、宿舍卫生打扫问题、企业打价格战等 5、协和谬误收益很重要,“如欲得之,必先知之” 6、要学会换位思考,站在别人的立场上看别人会怎么做,在考虑自己受益的同时,要注 意别人会怎么选择 二、 1、打渔问题、全球气候变暖与碳排放问题 2、博弈的要素:参与人、策略集合、收益 3、如果策略a严格劣于策略b,那么不管他人怎么选择,b总是更好的选择 4、军队的入侵与防卫问题 5、所有人都从1到100中选个数字,最接近所有人选的数字的均值的2/3者为胜,这个数 字是多少呢?作为理性人,每个人都会选择67(100*2/3)以下的数,进一步假设你的对手也是理性的,你会选择45(100*4/9)以下的数……依据哲学观点,如果大家都是理性程度相当的,那么最后数字将为1,然而结果却是9,这说明博弈的复杂性 6、共同知识与相互知识的区别 三、 1、利用迭代剔除法领悟中间选民问题 2、迭代剔除法就是严格下策反复消去法,不断地把劣势策略剔除出去,最后只剩下相对 优势的策略 3、中间选民问题就是,在两党制中,政党表述施政纲领要吸引位于中间位置的选民,他 们认为在选举中处于中间标度可以吸引左右两边的选民,并以此获得胜利。 4、中间选民问题理论成立的条件是有两个参与人;政治立场能使选民相信。 5、由此延伸出来的还有加油站选址问题,两家加油站不是在不同的路口选址,而是在不 确定哪个位置较佳的时候会选在同一处,这也是“中间选民定理”的凸显 6、在迭代剔除法不能运用时,比如说该博弈中博弈方1和2均没有严格下策,可以用二 维坐标系画出选择策略之后的收益分布

博弈论谢识予第四五章参考答案

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。 6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论课后习题

第一章导论 1、什么是博弈?博弈论的主要研究内容是什么? 2、设定一个博弈模型必须确定哪几个方面? 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型? 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么? 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2、为什么说纳什均衡是博弈分析中最重要的概念? 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响? 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10 000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会要求什么数额,为什么? 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么?当n趋向于无穷大时博弈分析是否仍然有效? 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci <a/2,问纳什均衡产量各为多少?如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少? 10、甲乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有什么好的办法? 11、设一个地区选民的观点标准分布于【0,1】上,竞选一个公职的每个候选人同时宣布他们的竞选立场,即选择0到1之间的一个点。选民将观察候选人们的立场,然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人,宣布的立场分别为x1=和x2=,那么观点在x=左边的所有选民都会投候选人1的票,而观点在x=右边的选民都会投候选人2的票,候选人1将以60%的选票获胜。再设如果又候选人的立场相同,那么立场相同的候选人将平分该立场所获得的选票,得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选(即不考虑自己对观点的真正偏好),如果又两个候选人,问纯策略纳什均衡是什么?如果又三个候选人,也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

博弈论与行为经济学结课论文道德问题的博弈

深圳大学考试答题纸 (以论文、报告等形式考核专用) 二○一三~二○一四学年度第二学期 课程编号8001510001 课程名称博弈论与行为经济学主讲教师章平评分 学号2013800 281 姓名袁进成专业年级信息工程学院大一 题目:对于道德的问题博弈讨论 关键词:道德利益冲突扶不扶完善法律 摘要:在很多时候,遵循道德的选择还是利益的选择对于人们来说是一个两难的话题, 道德的选择是社会需要的而利益的选择是人们自己所想的。本文通过对扶不扶老人的博弈问题对道德博弈这个最经很火的话题做了一个浅显的探讨。 正文: 《三体》的第二部中曾经描绘了这么一个情节:五艘航向宇宙边际的飞船在一个编队之中,由于他们的燃料稀缺的原因,如果不将燃料集中到一艘飞船上,结果是5艘飞船一起由于失去动力在太空之中死去。他们唯一的选择就是攻击另外四艘飞船杀死4000多人夺取别人的燃料,这样可以有一艘飞船活下去。所以摆在他们面前只有两个选择,一个是五艘飞船互不攻击,遵循基本道德,最后一起死去。二是一艘飞船攻击其他四艘,违反基本的道德,但是可以活下去。同时在这个序贯博弈之中,拥有先动优势,先动手的人可以活下去,而后动手的人会被杀死。所以按照传统进行博弈的利益至上的理论,显而易见会选择杀死其他人抛弃道德活下去的选项。但是现实情况缺要复杂的多,在小说中几名舰长面对这种抉择甚至选择了自杀,所以我们看到即便面对如此巨大的利益差距,对于人而言做出违反道德的博弈抉择仍然是十分困难的。在现实生活中的很多情况并没有这么极端,得到的利益没有生存死亡这么大,利益的选择也不是杀人这么残酷的显示,所以我们对现实中的一些道德面对博弈情况进行一些讨论。 我对社会上比较火热的扶不扶的问题做一个讨论。现在在十字路口有一个年轻人看到了一个老年人摔倒了。则他有2个选项,一个是扶起老人,二是不扶起老人。如果选择一的话则没有后续,他的生活照旧,他不会有任何的损失也不会有任何的获利。如果选择二的话则老人就有两个选项,一是感谢年轻人,二是讹诈。如果老人选择一的话,老人和年轻人会获得双赢,老人可以被送到医院,而年轻人会收获心灵上的满足,这是符合纳什均衡的选项。如果老人选择二的话,可以获得很大利益的赔偿,并且同样会被送到医院,而年轻人即会受到心灵上的打击又会蒙受经济上的损失。所以如果年轻人选了走掉,老人是没有选项的,年轻人选了扶起,如果按照利益至上的理论,老人显然一定会选择讹诈,因为老人具有后动优势,而后动中的两个选项收益差距对他来说非常明显,所以按照传统博弈的选择,年轻人显然应该选择走掉。但是在这里却是违反道德的。 一个调查问卷显示

相关主题
文本预览
相关文档 最新文档