博弈论专题
- 格式:pdf
- 大小:158.15 KB
- 文档页数:39
A.逻辑推理2、请把一盒蛋糕切成8 份,分给8个人,但蛋糕盒里还必须留有一份。
3、小明一家过一座桥,过桥时是黑夜,所以必须有灯。
现在小明过桥要 1 秒,小明的弟弟要3 秒,小明的爸爸要6 秒,小明的妈妈要8 秒,小明的爷爷要12 秒。
每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30 秒就会熄灭。
问:小明一家如何过桥?4、一群人开舞会,每人头上都戴着一顶帽子。
帽子只有黑白两种,黑的至少有一顶。
每个人都能看到其他人帽子的颜色,却看不到自己的。
主持人先让大家看看别人头上戴的是什么帽子,然后关灯,如果有人认为自己戴的是黑帽子,就打自己一个耳光。
第一次关灯,没有声音。
于是再开灯,大家再看一遍,关灯时仍然鸦雀无声。
一直到第三次关灯,才有劈劈啪啪打耳光的声音响起。
问有多少人戴着黑帽子?5、请估算一下CN TOWER电视塔的质量。
7、U2 合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。
次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。
手电筒是不能用丢的方式来传递的。
四个人的步行速度各不同,若两人同行则以较慢者的速度为准。
Bono需花1分钟过桥,Edge需花2 分钟过桥,Adam 需花5 分钟过桥,Larry 需花10 分钟过桥。
他们要如何在17 分钟内过桥呢?11、有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90 克各一份?13、你有两个罐子,50个红色弹球,50 个蓝色弹球,随机选出一个罐子,随机选取出一个弹球放入罐子,怎么给红色弹球最大的选中机会?在你的计划中,得到红球的准确几率是多少?14、想象你在镜子前,请问,为什么镜子中的影像可以颠倒左右,却不能颠倒上下?16、如果你有无穷多的水,一个3 夸脱的和一个5 夸脱的提桶,你如何准确称出4 夸脱的水?21、假设一张圆盘像唱机上的唱盘那样转动。
博弈论经典题目
1. 背包问题:
背包问题是贪婪算法求解的一个经典例子,也是动态规划常出现的一个经典最优化算法问题。
背包问题描述是这样的:有一个背包,背包容量限制为V,现有n种物品,每种物品的体积分别是w1, w2, w3, ... wn,而价值分别是v1, v2, v3, ... vn,问如何挑选物品装入背包以使物品价值总和最大。
2. 钓鱼游戏:
钓鱼游戏是由John Von Neumann及Oskar Morgenstern于1944年出版的游戏理论研究的经典题目,它用简单的游戏表示了一个有价值的决策问题:一对捕鱼人去钓鱼,他们的成功机会各不相同,而他们的收入有几乎相同的可能性。
游戏设定两个捕鱼者就一道鱼池进行渔获,鱼库只能容纳两种鱼,一种种鱼可以产生相同价值,不过每个捕鱼者只能抓一种鱼。
他们可以在淘到鱼前决定他们抓取的鱼种以及机率。
3. 亚当斯密矩阵博弈:
亚当斯密矩阵博弈也称为亚当斯博弈,是一种两边博弈,也就是说每一方都可以改变策略,古腾堡武器竞赛中使用的最佳策略最终也确定了该博弈结果。
它是一种形式上可以实时解决的游戏,每一种游戏具有一组有限的可能性。
游戏中,双方都拥有一种完全不同的收益,这些收益对两者来说都是实际易变涉及各自的利益、代价及限制,最终
目的是达到一个最佳方案,也就是哪一方收益最大。
4. 棋盘问题:
棋盘问题是建模和强化学习算法的经典问题,是一种几何回溯问题,主要指一个棋盘下怎样移动国王,使其最终能够到达标记点,而不经过被标记的地方,并且时间费用最少。
棋盘中任何一个标记点在边框联想能表示出一种折线状的运动方式,这样的运动方式通常分为八个半径块,而国王的最终目的地则被标记在其中的任何一个格子上。
博弈论试题及答案【正文】博弈论试题及答案一、选择题1.博弈论是研究:A. 地理分布B. 人类视力C. 决策制定D. 古典文学答案:C2.下列哪个不是博弈论中常见的概念?A. 纳什均衡B. 优势策略C. 输家效应D. 零和博弈答案:C3.描述纳什均衡的最佳方式是:A. 所有参与者都达到最佳策略B. 至少有一个参与者达到最佳策略C. 所有参与者都达到次优策略D. 至少有一个参与者达到次优策略答案:A4.下列哪个案例体现了零和博弈的情况?A. 两国签订贸易协定B. 赌徒在赌博中争夺赌注C. 两家公司合作推出新产品D. 好友一起玩棋盘游戏答案:B5.下列哪个不是博弈论的应用之一?A. 经济决策B. 政治博弈C. 生物进化D. 音乐创作答案:D二、填空题1.博弈论最早由_____________等人于20世纪40年代提出。
答案:冯·诺依曼(John von Neumann)2.博弈论是研究参与者间的_____________和_____________的学科。
答案:互动行为;决策制定3.零和博弈是指参与者的利益总和恒为_____________。
答案:零4.博弈论中的最佳策略指的是在其他参与者采取某个策略时,使某一参与者的_____________最大化的策略。
答案:利益5.斯坦福大学的_____________教授以其对博弈论的突出贡献而获得2005年诺贝尔经济学奖。
答案:约翰·纳什(John Nash)三、简答题1.简要解释博弈论中的纳什均衡。
答:纳什均衡是博弈论中的一个重要概念,指的是在参与者选择自己最佳策略的情况下,不存在任何一个参与者可以通过单独改变自己的策略来获得更好收益的状态。
简言之,纳什均衡是一种理性选择下的稳定状态。
2.举例说明博弈论在实际生活中的应用。
答:博弈论在经济学、政治学、生物学等领域中都有广泛应用。
例如,在贸易谈判中,两个国家之间的博弈就是典型的博弈论应用。
博弈论经典例子
1. 囚徒困境知道不?就好比两个小偷被抓了,警察分别审问他们。
要是都不坦白,那可能都判轻一点;但要是其中一个坦白了,另一个不坦白,那坦白的那个就立功减刑,不坦白的就倒霉啦!这可真是个纠结的选择啊!
2. 再来想想拍卖,大家都抢着出价,那场面紧张刺激得很!每个人都想着自己能拍到,但又担心出价太高亏了,这不就是一场精彩的博弈嘛!
3. 再说说那个商家竞争,就像肯德基和麦当劳,都拼命想办法吸引顾客,这可不是你争我夺的博弈嘛!
4. 还有股市啊,大家不都在那分析来分析去,想着怎么买卖股票能赚钱,这就是投资者之间的博弈呀!
5. 谈恋爱其实也有博弈的成分呢,你对我好,我对你咋样,不是得衡量衡量嘛,哈哈!
6. 像是两家公司研发新产品,谁先推出,谁就能抢占市场份额,这中间的算计可不少哩!
7. 选举不也是嘛,候选人们为了拉选票各显神通,这就是政治上的博弈呢!
8. 石头剪刀布也算哦,你出啥我出啥,都在猜对方的心思,可别小瞧这小游戏,也是一种博弈呢!
总之,生活中博弈无处不在,我们每天都在参与各种博弈呢!。
《博弈论前沿专题》Word版教案第一章:博弈论概述1.1 教学目标让学生了解博弈论的基本概念及其应用领域。
使学生理解博弈论在经济学、政治学、心理学等学科中的重要性。
培养学生运用博弈论分析问题的能力。
1.2 教学内容博弈论的定义与分类博弈论的基本概念(如参与者、策略、支付矩阵等)博弈论的应用领域及发展历程1.3 教学方法采用讲授法,系统介绍博弈论的基本概念和理论体系。
案例分析法,通过具体案例使学生了解博弈论在实际问题中的应用。
1.4 教学活动引入博弈论的基本概念,引导学生思考现实生活中的博弈现象。
讲解博弈论的分类及特点,让学生了解不同类型的博弈。
分析具体案例,如囚徒困境、智猪博弈等,让学生体验博弈论在实际问题中的应用。
1.5 作业与练习课后阅读材料:博弈论相关论文或书籍。
完成课后练习题,巩固所学内容。
第二章:完全信息静态博弈让学生掌握完全信息静态博弈的基本概念和理论。
培养学生运用完全信息静态博弈分析问题的能力。
2.2 教学内容完全信息静态博弈的定义和特点支付矩阵与纳什均衡完全信息静态博弈的求解方法(如逆向归纳法)2.3 教学方法采用讲授法,系统介绍完全信息静态博弈的基本理论和方法。
案例分析法,通过具体案例使学生了解完全信息静态博弈在实际问题中的应用。
2.4 教学活动引入完全信息静态博弈的基本概念,引导学生思考现实生活中的博弈现象。
讲解支付矩阵和纳什均衡的概念,让学生了解完全信息静态博弈的解。
分析具体案例,如石头剪刀布、拍卖等,让学生体验完全信息静态博弈在实际问题中的应用。
2.5 作业与练习课后阅读材料:完全信息静态博弈相关论文或书籍。
完成课后练习题,巩固所学内容。
第三章:完全信息动态博弈3.1 教学目标让学生掌握完全信息动态博弈的基本概念和理论。
培养学生运用完全信息动态博弈分析问题的能力。
完全信息动态博弈的定义和特点博弈树与子博弈完美均衡完全信息动态博弈的求解方法(如倒推法、动态规划法等)3.3 教学方法采用讲授法,系统介绍完全信息动态博弈的基本理论和方法。
博弈论复习题及答案1. 博弈论中,非合作博弈与合作博弈的主要区别是什么?答案:非合作博弈是指参与者之间没有约束性协议的博弈,每个参与者都独立地选择自己的策略以最大化自己的利益。
而合作博弈则允许参与者之间形成具有约束力的协议,共同合作以达到共同的目标。
2. 什么是纳什均衡?答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,并且考虑到其他参与者的策略后,没有参与者有动机单方面改变自己的策略。
3. 零和博弈与非零和博弈有何不同?答案:零和博弈是指博弈中所有参与者的收益总和为零,即一个参与者的收益必然导致另一个参与者的损失。
非零和博弈则是指参与者的收益总和不为零,参与者之间可能存在合作共赢的情况。
4. 如何判断一个博弈是否存在纯策略纳什均衡?答案:可以通过构建博弈的收益矩阵,然后寻找每个参与者在其他参与者策略给定的情况下的最佳响应策略。
如果存在一组策略,使得每个参与者在其他参与者策略不变的情况下,都没有动机改变自己的策略,那么这个策略组合就是一个纯策略纳什均衡。
5. 混合策略纳什均衡与纯策略纳什均衡有何不同?答案:纯策略纳什均衡是指参与者在均衡状态下选择的策略是确定的,而混合策略纳什均衡则是指参与者在均衡状态下选择的策略是随机的,每个策略都有一定的概率被选择。
6. 什么是支配策略?答案:支配策略是指在博弈中,无论其他参与者选择什么策略,某个参与者选择该策略都能获得比其他策略更好的结果。
7. 博弈论中的“囚徒困境”说明了什么?答案:“囚徒困境”说明了即使合作对所有参与者都有利,但由于缺乏信任和沟通,参与者可能会选择对自身最有利的策略,导致集体结果不是最优的。
8. 什么是博弈论中的“倒后归纳法”?答案:“倒后归纳法”是一种解决动态博弈的方法,通过从博弈的最后阶段开始,逆向分析每个阶段的最优策略,直到博弈的初始阶段。
9. 博弈论在经济学中的应用有哪些?答案:博弈论在经济学中的应用非常广泛,包括但不限于市场结构分析、拍卖理论、合同理论、产业组织、宏观经济政策分析等。
练习题一.判断题。
1.合作博弈就是博弈方采取相互合作态度的博弈。
2.如果一个博弈有两个纯策略纳什均衡,则一定还存在一个混合策略纳什均衡。
3.在动态博弈中,因为后行为的博弈方可以先观察到对方行为后再选择行动,因此总是有利的。
4.逆向归纳法并不能够排除所有不可置信的威胁。
5.有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。
6.有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。
7.无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。
8.完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。
9.教育程度在劳动力市场招聘员工时受到重视的理由是,经济学已经证明教育对于提高劳动力素质有不可替代的作用。
10.子博弈是从一个单节点信息集开始的。
1.战略是行动的规则,它必须是完备的。
它要给出参与人在每一种可想象到的情况下的行动选择。
2.占优战略均衡和重复剔除占优均衡只要求每个参与人是理性的,并不要求每个参与人知道其他参与人是理性的(即不要求“理性”是共同知识)3.触发策略所构成的均衡都是子博弈完美纳什均衡。
4.逆向归纳法因为并不能够排除所有不可置信的威胁,从而导致了类似蜈蚣博弈的问题。
5.有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。
6.信号传递和信息甄别可以看作是解决逆向选择问题的两种不同的(但相似)方法。
7.海萨尼指出完全信息情况下的混合战略均衡可以等同于不完全信息情况下纯战略均衡。
8.不完全信息古诺特模型中,低成本企业的产量比完全信息情况下低,而高成本企业的产量会比完全信息情况下高。
9.在Spence的劳动力市场模型中考虑到雇员选择教育程度,是因为经济学已经证明教育对于提高劳动力素质有不可替代的作用。
10.后续博弈一定是从一个单节点信息集开始的。
二.填空题(1.同一交易可能涉及多个委托代理模型的讨论,如雇主和雇员的关系中,如果雇主知道雇员的能力但不知道其努力水平,是()问题;如果雇主和雇员本人签约时都不知道雇员的能力,而雇员在工作中发现了自己的能力(而雇主仍不知道),是()问题;如果雇员一开始就知道自己的能力而雇主不知道,是()问题;如果雇员一开始就知道自己的能力而雇主不知道,并且,如果雇员在签约之前就获得教育证书,是()问题;相反,如果雇员在签约后根据工资合同要求去接受教育,是()问题。
博弈论专题
一、基本概念
1、参与人;2、行动;3、信息;4、战略;5、支付函数6、结果;7、均衡;
二、分类
1、静态博弈:参与人同时参与选择行动。
2、动态博弈:参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
3、完全信息:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识。
4、不完全信息:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数没有准确的知识。
(3)、概念:一个纳什均衡称为精炼纳什均衡,当且只当参与人的战略在每一个子博弈中都构成纳什均衡,即组成精炼纳什均衡的战略必须在每一个博弈中都是最优的。
因此,(进入,斗争)不是一个精炼纳什均衡,而(进入,合作)是惟一的子博弈精炼纳什均衡。
* “不可置信——承诺行动”的例子:
谈恋爱;
破釜沉舟;
红军、白军抢占小岛,炸桥断后路;
(三)不完全信息静态博弈:贝叶斯纳什均衡
市场进入的例子——进入者知道在位者的偏好、战略空间及各种战略组合下的利润水平。
如果进入者实际上并不完全了解在位者的生产函数、成本函数及偏好,这就是不完全信息博弈。
设想在位者成本函数有两种可能的情况,对应于这两种情况的支付矩阵分别如表一和表二:
解释:
在给定进入者选择进入的情况下,高成本在位者的最优战略是默许,而低成本在位者的最有战略是斗争。
低成本情况下斗争之所以比默许优,可能是由于在位者的生产成本是如此低,从而他在非常低的价格下获得的垄断利润也高于相对高的价格下分享到的寡头利润;也可能在位者有一种好斗的天性,他更乐于与进入者斗争而不是合作。
在1967年以前,遇到这种不知对手的选择情况,自己的战略自然无法选择,因此相应的问题无法解决。
海萨尼的贡献在于引进了一个虚拟的参与人—“自然”,使得上述情况可以分析。
自然首先行动——选择参与人的类型,被选择的参与人知道自己的真是类型,而其他参与人并不清楚这个被选择的参与人的真是类型,仅知道各种可能类型的概率分布。
另外,被选择的参与人也知道其他参与人心目中的这个分布函数,即分布函数是一种共同知识(common knowledge)。
•在市场进入的这个例子中,“自然”首先选择在位者的类型——高成本还是低成本;在位者本人知道自己究竟是高成本还是低成本,而进入者仅知道在位者或者高成本,或者是低成本,并且,知道高成本和低成本的可能性各为多少。
•海萨尼把“不完全信息博弈”转换成“完全但不完美信息博弈”。
•贝叶斯是一位概率统计学家,贝叶斯均衡是纳什均衡在不完全信息博弈中的自然扩展。
(四)不完全信息动态博弈:精炼贝叶斯均衡
精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的“信念”(主观概率),并由此来选择自己的行动。
精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足如下条件:(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。
1、张三与你
(恃强欺弱、早餐——辣椒)
2、黔驴技穷
(五)纯策略、混合策略及混合策略的均衡
纯策略:每个行为人只作出一个选择并始终坚持这个选择,这种策略叫做纯策略;
混合策略:允许行为人使他们的策略随机化——对每项选择都制定一个概率,按照这些概率作出他们的选择;
混合策略的均衡:每个行为人都选定了最优频率,并在另一个行为人的频率选择给定的情况下按照这个最优频率采取他的策略;
计算题
两寡头古诺模型,,P为市场出清价格,两个厂商的边际成本不同,分别为。
如果,问纳什均衡产量各为多少?如果,则纳什均衡产量又各为多少?
Q a Q P -=)(21,c c 2/0a c i <<122,0c a c a c i +><<
思考题:
比较分析完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,
并举例说明?
计算题:两个寡头企业进行价格竞争博弈,企业1的利润函数是:q c aq p ++--=21)(π,企业2的利润函数是:
p
b q +--=22)(π其中p 是企业1的价格,q 是企业2的价格,求
(1)两个企业同时决策的纯策略纳什均衡?
(2)企业1先决策的子博弈完美纳什均衡?
(3)企业2先决策的子博弈完美纳什均衡?。