博弈论教材2013-2
- 格式:doc
- 大小:300.50 KB
- 文档页数:11
《博弈论》入车。
太专业需要数学功底,大师作品,参考书级。
经济学必读。
《博弈论》是2015年中国人民大学出版社出版的一本图书,作者是朱·弗登博格、让·梯若尔。
作品名称博弈论作者朱·弗登博格、让·梯若尔创作年代当代类别经济学图书购买更多购买博弈论朱·弗登博格,黄涛著中国人民大学出版社【正版旧书,下单咨询在线客服】¥17.14¥30.75服务由当当网提供去购买博弈论朱弗登博格,黄涛著¥21服务由京东提供去购买博弈论朱·弗登博格、黄涛【稀缺旧书】¥23.74¥191.38服务由当当网提供去购买快速导航作品目录版本信息作者简介内容简介《博弈论》是博弈领域的两位领军人物——包括2014年新科诺贝尔经济学奖获得者让梯若尔教授——的集大成之作,囊括了迄今为止除演化博弈之外的所有博弈论的理论和方法、代表了博弈论发展的最高水平。
它不仅涵盖了博弈论的方方面面。
而且几乎对每一个论题都给出了严密的数学推导和证明。
《博弈论》具有以下几个特点:第一,覆盖面广,几乎涵盖了博弈论的各个领域。
第二,有丰富的实例、精心构思的习题以及广泛的可扩展性。
第三,深入浅出,既可以满足一般读者对博弈论的了解,也可以满足爱好技术性证明的读者对于博弈论精髓的把握。
《博弈论》是经济学研究生和高年级本科生学习博弈论的最好教材,也是其他对博弈论有兴趣的读者的必备参考书[1]。
作品目录第1篇完全信息的静态博弈第1章策略式博弈和纳什均衡1.1 策略式博弈和重复严格优势的介绍1.2 纳什均衡1.3 纳什均衡的存在性和性质(技术性)参考文献第2章重复严格优势、可理性化和相关均衡2.1 重复严格优势和可理性化2.2 相关均衡2.3 可理性化和主观相关均衡参考文献第2篇完全信息的动态博弈第3章扩展式博弈3.1 引言3.2 多阶段可观察行为博弈中的承诺和精炼3.3 扩展式3.4 扩展式博弈中的策略及均衡3.5 逆向递归法与子博弈完美3.6 对逆向递归法和子博弈完美均衡的批评参考文献第4章多阶段可观察行动博弈的应用4.1 引言4.2 优化条件和子博弈完美性4.3 重复博弈初步4.4 鲁宾斯坦恩斯塔尔议价模型4.5 简单终止博弈4.6 重复剔除条件优势与鲁宾斯坦恩斯塔尔议价博弈4.7 开环和闭环均衡4.8 有限期和无限期均衡(技术性)参考文献第5章重复博弈5.1 可观察行动的重复博弈5.2 有限重复博弈5.3 和不同的对手重复博弈5.4 帕累托完美和重复博弈中的抗重新谈判5.5 具有不完美公共信息的重复博弈5.6 含有不完美公共信息的无名氏定理5.7 通过改变时期来改变信息结构参考文献第3篇不完全信息的静态博弈第6章贝叶斯博弈与贝叶斯均衡6.1 不完全信息6.2 例6.1:不完全信息下的公共产品供给博弈6.3 策略和类型6.4 贝叶斯均衡6.5 贝叶斯均衡:另一个例子6.6 剔除严格优势策略6.7 用贝叶斯均衡来解释混合均衡6.8 分布方法(技术类)参考文献第7章贝叶斯博弈与机制设计7.1 机制设计的两个例子7.2 机制设计和显示原理7.3 单个代理人的机制设计7.4 具有多个代理人的机制设计:可行配置、预算平衡、效率7.5 多代理人的机制设计:优化问题7.6 机制设计的其他问题附录[2]。
博弈与策略培训教材引言博弈论是一门研究决策和战略互动的学科,它涉及到多个领域,如经济学、社会学和政治学等。
博弈论的核心是研究个体或集体在不完全信息和相互依赖的情况下做出决策的策略选择问题。
本教材旨在介绍博弈论的基本概念,并提供实际案例和练习,帮助读者更好地理解博弈论的原理,并掌握博弈策略的分析和决策方法。
本教材适用于经济学、管理学、金融学等相关专业的学生,也适用于希望了解博弈论的自学者。
第一章博弈论的基本概念1.1 博弈论的定义与起源博弈论是一门研究决策和战略互动的学科,它起源于20世纪40年代,由约翰·冯·诺伊曼和奥斯卡·摩根斯特恩共同发展和建立。
博弈论的研究对象是玩家、策略和支付。
1.2 博弈论的应用领域博弈论有广泛的应用领域,包括经济学、社会学、政治学、生物学等。
在经济学中,博弈论可以用来分析市场竞争、合作与冲突等问题。
1.3 博弈论的基本概念博弈论的基本概念包括玩家、策略、支付和均衡解等。
玩家是博弈的参与者,策略是玩家的决策方案,支付是玩家根据策略选择所获得的利益或损失。
均衡解是一组策略,当玩家选择这组策略时,没有玩家有动机改变自己的策略。
2.1 零和博弈零和博弈是一种非合作博弈形式,即参与者的收益之和为零。
本节将介绍零和博弈的基本概念、标准形式、最优策略等。
2.2 囚徒困境囚徒困境是一个经典的非合作博弈问题,用来解释为什么有时候人们在互利的选择上会陷入不合作的情况。
本节将介绍囚徒困境的定义、解决方法以及囚徒困境在现实生活中的应用。
2.3 博弈树博弈树是用来表示非合作博弈过程的图形工具。
本节将介绍博弈树的定义、表示方法以及如何通过博弈树分析并确定最优策略。
3.1 特征函数博弈特征函数博弈是一种合作博弈形式,参与者通过合作来分配生成的收益。
本节将介绍特征函数博弈的定义、核心解、稳定策略等。
3.2 谈判博弈谈判博弈是一种合作博弈形式,参与者通过协商来达成最终决策。
第三章 纳什均衡及其应用3.1 混合策略纳什均衡1 鹰鸽博弈我们知道老鹰具有攻击性,而鸽子爱好和平。
在原始社会里有两个部落,可以做出两个行动:一是进攻一是和平,分别用鹰和鸽表示。
表1 鹰鸽博弈乙甲鹰 鸽该博弈的那是均衡为(鹰,鸽),(鸽,鹰)。
一些学者研究发现,在同一个地域内,“鹰”和“鸽”的比例为0.36:0.64。
事实上,设鹰鸽比为:1z z -,可以得出如下结果:()2514(1)1439E e z z z =-+-=-; ()95(1)514E d z z z =-+-=-90.3625z == 聪明的做法是:当鹰鸽比小雨0.36时,选择鹰策略;否则选择鸽策略。
使用混合策略方法分析:第一步:混合策略型表示:乙 鹰 鸽甲鹰 p 鸽 1-p第二步:计算期望效用:(925)514(259)514E p q q E q p p=-+-=++-甲乙第三步:作出最优反应函数91 259[0,1] 2590 25q p q q ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩若若若, 90 259[0,1] 259 1 25p q p p ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩如果如果如果第四步:作出反应函数的图像第五步:根据交点,找出纳什均衡:其中(99,2525)是混合策略纳什均衡。
2 斗鸡博弈我的老家地处安徽最北部,苏鲁豫皖四省交界之处,东北处有条小河。
河边的棉花地里,经常有鹌鹑栖息在其间。
秋末冬初的农闲时节,小鹌鹑刚好长成。
村民结网捕鹌鹑把玩、斗鸟儿为乐。
每天早晨4点多钟出发,大约7点钟回来,雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑,真正熟练了,才拿出来和别人的相斗。
设想两只鹌鹑要在场子里一决雌雄。
每只鹌鹑都有两个策略:攻击或逃跑。
由于两只鹌鹑实力相当,若同时选择进攻会两败俱伤;若一只进攻,一只逃跑,进攻者胜利。
逃跑的鹌鹑算是玩完了,以后再也没胆量进场子,主人也不回在把玩它,会用一块黑布把它的笼子蒙起来,培养成“叫子”,以后后捕鹌鹑的时候拎出去吸引同伴。
若同时逃跑不会败掉,以后还能斗,但是都会挨饿一天。
1pq表2-10 斗鸡博弈猛英雄攻击逃跑大将军攻击逃跑3 猜币博弈(matching pennies)甲、乙两个人各持有一枚硬币,同时决定显示正面(数字)朝上还是反面(国徽或花纹)朝上,若两人朝上的一面相同甲输给乙10元钱,若不同,则乙输给甲10元钱。
表2-1 猜币博弈乙正反甲正反我们观察表2-1可以发现,甲与乙效用之和为零,这种博弈称为零和博弈,是你死我活的博弈,双方有着激烈的冲突,不存在合作的可能。
4 足球比赛中的点球大战同学们,请你找出这个博弈的纳什均衡。
是不是发现没有纯策略纳什均衡呢?如果确定性策略无法奏效,就要果断引入不确定性。
它将使两难问题不再是难题:5 流浪汉问题在社会保障体系比较完善的国家,总会或多或少的存在流浪汉的问题。
这些依靠政府的失业救济过活的无业游民,虽然可以成为某些正科口中标榜的民主生活的佐证。
但是他毕竟是高度发达的经济社会无法根治的一块牛皮癣。
参与人是政府和一个流浪汉,流浪汉有两个选择:寻找工作和终日游荡,政府在对流浪汉的管理上也有两个策略:救济和不救济。
政府想帮助流浪汉摆脱这种难堪的生活,但前提是后者必须试图寻找工作,否则帮助失效。
但是,流浪汉可不认为这种生活难堪,除非没有办法生存,他们不会去寻找工作的。
流浪汉找工作 q流浪 1-q 政府 救济p不救济1-p请你使用混合策略纳什均衡的求法,找出该博弈的纳什均衡。
6 有限博弈的纳什均衡存在定理与奇数定理定理1 一个有限博弈至少存在一个纳什均衡,一般而言,纳什均衡的个数是奇数个。
定理2 在n 人策略式博弈中,若参与人的纯策略空间i S 是欧式空间上的一个非空闭集,且是有界的凸集,支付函数是连续的,对i S 是拟凹的,那么存在一个纯策略纳什均衡。
定理3在n 人策略式博弈中,若参与人的纯策略空间i S 在欧式空间上世连续的,则存在一个混合策略纳什均衡。
3.2 反应函数法学一点数学 极大值与极小值 1 库诺特寡头竞争理论库诺特(Cournot,1838)寡头竞争模型可以说是纳什均衡的最早版本,它比纳什(Nash,1950)本人的定义早了100多年。
在库诺特模型里有两个参与人,分别称为企业1,企业2;每个企业的策略是选择产量。
效用是利润,它是两个企业产量的函数。
我们用[0,]i q ∈∞表示第i 个企业的产量。
()i i c q 代表成本函数,12()p p q q =+代表逆需求函数。
第i 个企业的利润函数为1212(,)()(),1,2i i i i q q q p q q c q i π=+-=。
**12(,)q q 是纳什均衡产量意味着:***111211211argmax (,)()()q q q q p q q c q π∈=+-, ***221221222argmax (,)()()q q q q p q q c q π∈=+-。
求解上述关系式找出纳什均衡的一个步骤是对每一个企业的利润函数求一阶导数并令其等于零,即112112111()()()0p q q q p q q c q q π∂''=+++-=∂ 212212222()()()0p q q q p q q c q q π∂''=+++-=∂ 上述两个一阶条件分别定义了两个反应函数,解之可得:**112221(),()q R q q R q ==。
若两条曲线仅有唯一交点,则该点处取纳什均衡图2-3反应函数交点图【例2】 考虑库诺特模型的简单情况,假定两个企业具有相同的不变单位成本,即111222(),()c q q c c q q c ==。
逆需求函数取如下的线性形式:12()p a q q =-+。
解:最优化的一阶条件为:11211()0a q q q c q π∂=-+--=∂反应函数为:**21112221(),()22a q c a q cq R q q R q ----====。
解之得:**123a c q q -==。
每个企业的利润为****21122121(,)(,)()9q q q q a c ππ==-。
下面将之与垄断情况作比较,垄断企业的问题是:max ()qq a q c π=--。
容易得出21222()0a q q q c q π∂=-+--=∂*2()23a c q a c -=<-;2212()()49m a c a c π=->-。
2 豪泰林模型假定有一个长度为1的线性城市,消费者均匀地分布在[0,1]区间内,分布密度为1。
假定有两个商店,分别位于城市两端,商店1在0x =,商店2在1x =,出售物质性能相同的产品。
每个商店提供单位产品的成本为c 。
消费者购买商品的交通成本与距商店的距离成比例,单位距离的成本为t 。
这样,住在x 的消费者如果在商店1采购,需花费tx 的交通成本,如果在商店2采购需要花费(1)t x -的成本。
假定消费者得到的消费者剩余为s ,且s 相对于产品成本和交通成本足够大,从而每个消费者消费者都购买1个单位的产品。
令i p 为商店i 的价格,12(,)i D p p 为需求函数,1,2i =。
如果住在x 的消费者在两个商店之间买商品无差异,那么住在x 左边的都在商店1购买,住在x 右边的都在2x 购买。
需求分别为12,1D x D x ==-。
这里,x 满足12(1)p tx p t x +=+-,综合需求函数的定义可得:211122,212p p tD x tp p tD x t -+==-+=-=利润函数为:112111211(,)()()()2p p p c D p c p p t t π=-=--+ 212222121(,)()()()2p p p c D p c p p t tπ=-=--+商店i 选择自己的价格i p ,通过求驻点最大化利润i π:12111(2)02p p c t q tπ∂=-++=∂21221(2)02p p c t q tπ∂=-++=∂ **12p p c t ==+ **122tππ==3 公共地悲剧设某村庄有n 个农户,该村有一块大家都可以自由放牧羊群的草地。
这片草地只能让不超过一定数量的羊吃饱。
超过这个限度,则每只羊都无法吃饱,从而降低了每只羊的产出,草地也遭到破坏。
假设这些农户决定养羊数是同时决策的,而且农户知道这片草地的最大养羊数及不同养羊数下每只羊的产出。
这就构成了n 个农户的一个完全信息静态博弈问题。
此博弈的参与人有n 个农户,其策略空间是各自养羊数, 1,2,...,i q i n =。
养羊总数12...n Q q q q =+++。
每只羊的产出()V Q 是减函数。
假设购买和照料每只羊的成本相同,设为c 。
则农户i 养i q 只羊的效用函数为()i i i u qV Q q c =-。
为方便起见,设3n =,()100V Q Q =-,4c =。
则111231(100)4u q q q q q =---- 221232(100)4u q q q q q =---- 331233(100)4u q q q q q =----尽管羊的数量是整数,我们仍然可以将之视为连续函数,根据极值的条件得到最优解之后圆整。
反应函数为:1123231(,)48()2q R q q q q ==-+2213131(,)48()2q R q q q q ==-+3312121(,)48()2q R q q q q ==-+三个反应函数的交点为:(24,24,24),相应的效用为(576,576,576)。
但是,如果12316q q q ===,则效用组合为(768,768,768)。
因此纳什均衡可能是低效率的,一般而言,公共性质的物品,都有类似的结论,达到的稳定结果效率较低,称之为公共地悲剧。
3 重复博弈3.4 应用1 社会福利博弈在这个博弈里,参与人是政府和一个流浪汉,流浪汉有两个选择:寻找工作和终日游荡,政府在对流浪汉的管理上也有两个策略:救济和不救济。
政府想帮助流浪汉摆脱这种难堪的生活,但前提是后者必须试图寻找工作,否则帮助失效。
但是,流浪汉可不认为这种生活难堪,除非没有办法生存,他们不会去寻找工作的。
表4 社会福利博弈流浪汉政 府救济 不救济2 努力困境张三和李四一起做一份工作,他们可以选择勤奋和偷懒,如果两人都勤奋工作,会得到一份奖金,每人的效用为2单位。
如果张三勤奋,李四偷懒,张三的效用为0单位,李四的效用为3单位,反之亦然。
如果两人都偷懒,只能得到一份很低的报酬,效用为0.5单位。
于是有下面的支付矩阵:表4努力困境李四张 三勤奋 偷懒3 军备竞赛模型在1950s ,美国和前苏联展开了疯狂的军备竞赛,最终拖垮了苏联的经济。