博弈论课程概要(I)
- 格式:doc
- 大小:71.50 KB
- 文档页数:3
博弈论概要1.研究背景及意义在现实生活中,人们的利益冲突与一致具有普遍性,因此,几乎所有的决策问题都可以认为是博弈。
博弈论在政治学、经济学等许多领域都有着广泛的应用。
在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域,每一领域的最新进展都应用了博弈论,博弈论已经成为主流经济学的一部分,对经济学理论与方法正产生越来越重要的影响。
虽然博弈论是数学的一个分支,但其应用范围十分广泛,在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈论的案例。
早在1994年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教授就共同分享了当年的诺贝尔经济学奖和93万美元的奖金。
2005年,瑞典皇家科学院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们在博弈论领域作出的贡献。
纳什的贡献是在1944年与奥斯卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步形成。
而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用到了博弈学理论。
奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践来展示博弈论在社会各个领域的实际意义。
他们两位利用博弈论对商业谈判、种族隔离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理等方面。
2.博弈论相关概念与发展史综述2.1博弈论的概念2.1.1博弈论的定义博弈论(Game Theory,又称对策论)研究决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。
博弈论是研究理性的决策者之间冲突与合作的理论。
在博弈论分析中,一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事,他考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。
博弈论与企业决策博弈论与企业决策第一章概述第二章博弈论的非技术描述第三章完全信息静态博弈第四章完全信息动态博弈第五章不完全信息静态博弈第六章不完全信息动态博弈第一章概述第一节博弈论与企业决策第二节博弈论的基本概念第三节博弈的分类第四节博弈论的发展简史第五节本课程基本内容第一节博弈论与企业决策一、市场结构与企业决策1、完全竞争市场1.市场特点:厂商假设产品假设信息假设要素假设2.厂商关系:相互独立影响极小3.厂商决策:MP=P P市场均衡价格4.市场性质:理论标尺第一节博弈论与企业决策2、完全垄断市场1.市场特点:一个厂商无相近替代品市场不可进入2.厂商关系:完全独立3.厂商决策:MR=P P由市场需求曲线决定4.市场性质:理论标尺注意:1.竞争和垄断的两重含义:市场状态和行为2.垄断厂商的需求曲线弹性不是无穷大的,而是有一定的弹性,弹性越小越可能垄断。
第一节博弈论与企业决策 3、垄断竞争市场1.市场特点:厂商众多产品差异自由进退2.厂商关系:相互影响,不易觉察3.厂商决策:MR=P P受厂商相互行为影响4.市场性质:现实市场第一节博弈论与企业决策4、寡头垄断市场1.市场特点:厂商数量不多产品同质或差异需求曲线不确定2.厂商行为:相互依赖,相互依存3.厂商决策:MR=P P可能是决策变量4.市场性质:现实市场第一节博弈论与企业决策二、企业决策特点1、现实市场是垄断竞争和寡头垄断市场2、现实市场上企业之间的决策是相互依赖,相互影响的3、传统的自我决策是不行的,企业之间的决策是策略性决策举例:二食堂一楼的盖饭(垄断竞争)一般两荤一素6.5元,有一家涨到10元,结果冷冷清清汽车制造企业的决策(寡头垄断)见:《中国企业企业广告行为》第一节博弈论与企业决策三、博弈论与企业决策1、博弈论就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
2、现实中企业就是相互依赖、相互影响的关系。
3、因此,企业决策必须有博弈论的思想和方法。
博弈论(课一)课程内容和时光支配第一讲:概述(第一、二章)其次讲:术语解读和基本假设(第三、四章)第三讲:囚犯逆境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章)第五讲:懦夫博弈和性别战(第十、十一章)博弈学-----博览全局对弈棋局课一博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。
西方国家的理解--Game fair play。
(中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的愉快。
)博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。
知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。
推举书刊1、蒋文华:《用博弈的思维看世界》,浙江高校出版社,2022年。
2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。
3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2022年。
4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民高校出版社,2022年。
5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2022年。
博弈指在一定的嬉戏规章约束下,基于直接互相作用的环境条件,各参加人依据所把握的信息,挑选各自的策略(行动),以实现利益最大化的过程。
故事1,两人同行打猎,忽遇一猛狮。
一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作!)嬉戏1,每位学生写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出全部数字的平均数,假如你所写的数字最临近该平均数的二分之一,那么你将在嬉戏中胜出。
(博弈,必需学会换位思量!)博弈只需率先一步,高人一筹!大智若愚假如由于对方眼中的你的傻,而让对方更情愿和你合作,何乐而不为呢?嬉戏2,每位学生写5个大于0的自然数,假如你所写的5个数字中有一个是全部学生中所写的数字中最小的(在没有重合的状况下),那么你将在该嬉戏中胜出。
交通大学博弈论课程概要 (I)
周林
二零零四年十二月
主要教材:博弈论(Fudenberg & Tirole )
引言: 博弈论与决策论的差别. 例子:田忌赛马,换钱.
第一部分:完全信息策略式博弈 — 静态博弈
1. 策略式博弈的基本三要素:博弈者,策略空间,收益函数
2. 策略式博弈的基本三解法:
a. 占优策略. 例子: 囚徒困境,二价拍卖(Ebay , 易趣网)
b. 重复剔除劣策略. 例子:双寡头Cournot 竞争(线性需求)
c. Nash 均衡 (最重要的概念)
三种解法的合理性依次减低,而三种解法的适用范围(存在性)依次增加.
3. Nash 均衡存在性定理:如果策略空间是凸紧集,收益函数连续和自拟凹,至少存在一个Nash 均衡.
证明基本思路:最佳反应映射是从策略空间到策略空间的(上半)连续映 射(Berge 定理), 最佳反应映射的不动点就是Nash 均衡. 利用(Kakutani 不动点定理)Brouwer 不动点定理找出不动 点.(注意:这里的最佳反应映射不是一个压缩映射, 因 此不能用迭代法逼近不动点.)
推论:任何有限策略博弈至少有一个混合策略Nash 均衡.
4. Nash 均衡一般非唯一,非Pareto 最优. 可以通过外在信号机制改善收益. 相关均衡:公共信号仅将不同的Nash 均衡混合,私人信号更为有效.
作业:1.1,1.2, 1.5, 1.7, 1.10, 1.12, 2.2 (F&T ). 以及下面的题目:
A . 证明任何一个满足Nash 均衡存在性定理的对称博弈(首先给出一个合
理的定义)一定存在一个对称的Nash 均衡.
B . 画出下列博弈中所有的相关均衡生成的收益向量:
博弈者 2
博弈者 1 T W
第二部分:完全信息扩展式博弈 — 动态博弈
1. 例子:斯塔克伯格模型
2. 多阶段可观察行为博弈
0阶段: 每一个博弈者可以独立选择一个行动 i i A a ∈0.
1阶段: 在本阶段前的历史),,(00101n a a a h == 决定了本阶段每一个博
弈者可以选择的行动的范围)(1h A i . 每一个博弈者再独立选择 一个行动)(11h A a i i ∈.
…………
k 阶段: 在本阶段前的历史),,,(110-=k k a a a h 决定了本阶段每一个博弈者可以选择的行动的范围)(k i h A . 每一个博弈者再独立选择一个行动)(k i k i h A a ∈.
…………
博弈在K 阶段后中止.(我们允许K 为无穷,此时博弈可能进行无限阶段.)每一个博弈者获得的收益取决于博弈的全部历史
),,,(101K K a a a h =+: )(1+=K i i h u u .
(不一定每一个博弈者在任何一个阶段k 和历史k h 时都要做选择. 此时我们只要让1)(=k i h A 即可.)
3. 多阶段可观察行为博弈的策略式博弈表示
策略空间: 每一个博弈者的策略是一个完整的计划,包括了在所有 的阶段k 和所 有可能发生的历史k h 时会采取怎样的相应行动(想象一 本理想化的棋谱).
收益函数: 对于任何一个所有博弈者的策略的组合,我们可以逐阶段 的找出相应博弈者行动的历史,从而决定每一个博弈者获得的收益.
4. 多阶段可观察行为博弈的求解
对任何一个多阶段可观察行为博弈,我们首先可以找出它的策略式博 弈的Nash 均衡. 但是其中可能含有不合理的解,我们需要对Nash 均 衡进行挑选(精炼).
逆向归纳法: 仅适用于具有完美信息的有限阶段的博弈.
子博弈完美: 可以用于所有的多阶段可观察行为博弈.
一个多阶段可观察行为博弈G 在任何一个历史k h 后的延续本身 也是一个博弈. 我们称其为原博弈G 的一个子博弈, 记为)(k h G . 如果G 的一个Nash 均衡在它所有的子博弈上的限制也是子博弈 的一个Nash 均衡,我们称之为一个子博弈完美的Nash 均衡.
5. 子博弈完美Nash 均衡的判断条件:单阶段偏离原则*
6. 子博弈完美Nash 均衡的应用:囚徒困境的重复博弈, 有限和无限情况
7. 子博弈完美Nash 均衡的应用:Rubinstein 议价模型
作业:3.3,3.5, 3.7, 3.8, 4.5(a)(b), 4.8 . 以及下面的题目:
A . 证明:在囚徒困境的有限重复博弈中,任何一个Nash 均衡(不管是否
子博弈完美)的途径一定是每阶段 (不合作, 不合作).
B . G 是一个静态双人策略式博弈. 每个博弈者有两个选择变量:博弈者
一选择1x 和1y ,博弈者二选择2x 和2y . 假设()),(),,(*2*2*1*1y x y x 是G 的
Nash 均衡. 现在我们将G 变化为一个双人两阶段博弈G ~. 在阶段0时人博弈者一 选择1x ,博弈者二选择2x . 在阶段1时,当双方都观测到1x 和2x 之 后,博弈者一再选择1y ,博弈者二再选择2y . G ~的子博弈完美Nash 均衡同G 的Nash 均衡是否一样?请仔细解释.。