当前位置:文档之家› 博弈论课程概要(I)

博弈论课程概要(I)

博弈论课程概要(I)
博弈论课程概要(I)

交通大学博弈论课程概要 (I)

周林

二零零四年十二月

主要教材:博弈论(Fudenberg & Tirole )

引言: 博弈论与决策论的差别. 例子:田忌赛马,换钱.

第一部分:完全信息策略式博弈 — 静态博弈

1. 策略式博弈的基本三要素:博弈者,策略空间,收益函数

2. 策略式博弈的基本三解法:

a. 占优策略. 例子: 囚徒困境,二价拍卖(Ebay , 易趣网)

b. 重复剔除劣策略. 例子:双寡头Cournot 竞争(线性需求)

c. Nash 均衡 (最重要的概念)

三种解法的合理性依次减低,而三种解法的适用范围(存在性)依次增加.

3. Nash 均衡存在性定理:如果策略空间是凸紧集,收益函数连续和自拟凹,至少存在一个Nash 均衡.

证明基本思路:最佳反应映射是从策略空间到策略空间的(上半)连续映 射(Berge 定理), 最佳反应映射的不动点就是Nash 均衡. 利用(Kakutani 不动点定理)Brouwer 不动点定理找出不动 点.(注意:这里的最佳反应映射不是一个压缩映射, 因 此不能用迭代法逼近不动点.)

推论:任何有限策略博弈至少有一个混合策略Nash 均衡.

4. Nash 均衡一般非唯一,非Pareto 最优. 可以通过外在信号机制改善收益. 相关均衡:公共信号仅将不同的Nash 均衡混合,私人信号更为有效.

作业:1.1,1.2, 1.5, 1.7, 1.10, 1.12, 2.2 (F&T ). 以及下面的题目:

A . 证明任何一个满足Nash 均衡存在性定理的对称博弈(首先给出一个合

理的定义)一定存在一个对称的Nash 均衡.

B . 画出下列博弈中所有的相关均衡生成的收益向量:

博弈者 2

博弈者 1 T W

第二部分:完全信息扩展式博弈 — 动态博弈

1. 例子:斯塔克伯格模型

2. 多阶段可观察行为博弈

0阶段: 每一个博弈者可以独立选择一个行动 i i A a ∈0.

1阶段: 在本阶段前的历史),,(00101n a a a h == 决定了本阶段每一个博

弈者可以选择的行动的范围)(1h A i . 每一个博弈者再独立选择 一个行动)(11h A a i i ∈.

…………

k 阶段: 在本阶段前的历史),,,(110-=k k a a a h 决定了本阶段每一个博弈者可以选择的行动的范围)(k i h A . 每一个博弈者再独立选择一个行动)(k i k i h A a ∈.

…………

博弈在K 阶段后中止.(我们允许K 为无穷,此时博弈可能进行无限阶段.)每一个博弈者获得的收益取决于博弈的全部历史

),,,(101K K a a a h =+: )(1+=K i i h u u .

(不一定每一个博弈者在任何一个阶段k 和历史k h 时都要做选择. 此时我们只要让1)(=k i h A 即可.)

3. 多阶段可观察行为博弈的策略式博弈表示

策略空间: 每一个博弈者的策略是一个完整的计划,包括了在所有 的阶段k 和所 有可能发生的历史k h 时会采取怎样的相应行动(想象一 本理想化的棋谱).

收益函数: 对于任何一个所有博弈者的策略的组合,我们可以逐阶段 的找出相应博弈者行动的历史,从而决定每一个博弈者获得的收益.

4. 多阶段可观察行为博弈的求解

对任何一个多阶段可观察行为博弈,我们首先可以找出它的策略式博 弈的Nash 均衡. 但是其中可能含有不合理的解,我们需要对Nash 均 衡进行挑选(精炼).

逆向归纳法: 仅适用于具有完美信息的有限阶段的博弈.

子博弈完美: 可以用于所有的多阶段可观察行为博弈.

一个多阶段可观察行为博弈G 在任何一个历史k h 后的延续本身 也是一个博弈. 我们称其为原博弈G 的一个子博弈, 记为)(k h G . 如果G 的一个Nash 均衡在它所有的子博弈上的限制也是子博弈 的一个Nash 均衡,我们称之为一个子博弈完美的Nash 均衡.

5. 子博弈完美Nash 均衡的判断条件:单阶段偏离原则*

6. 子博弈完美Nash 均衡的应用:囚徒困境的重复博弈, 有限和无限情况

7. 子博弈完美Nash 均衡的应用:Rubinstein 议价模型

作业:3.3,3.5, 3.7, 3.8, 4.5(a)(b), 4.8 . 以及下面的题目:

A . 证明:在囚徒困境的有限重复博弈中,任何一个Nash 均衡(不管是否

子博弈完美)的途径一定是每阶段 (不合作, 不合作).

B . G 是一个静态双人策略式博弈. 每个博弈者有两个选择变量:博弈者

一选择1x 和1y ,博弈者二选择2x 和2y . 假设()),(),,(*2*2*1*1y x y x 是G 的

Nash 均衡. 现在我们将G 变化为一个双人两阶段博弈G ~. 在阶段0时人博弈者一 选择1x ,博弈者二选择2x . 在阶段1时,当双方都观测到1x 和2x 之 后,博弈者一再选择1y ,博弈者二再选择2y . G ~的子博弈完美Nash 均衡同G 的Nash 均衡是否一样?请仔细解释.

博弈论(课一)

课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章)

博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。

推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!)

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

耶鲁大学公开课:博弈论全集下载

导论-五个入门结论 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/Q/2/S7KDBTEQ2.flv 2: 学会换位思考 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/Q/L/S7KDC64QL.flv 3: 迭代剔除和中位选民定理 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/J/Q/S7KDBUDJQ.flv 4: 足球比赛与商业合作之最佳对策 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/6/0/S7KDC7960.flv 5: 纳什均衡之坏风气与银行挤兑 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/6/R/S7KDCAC6R.flv 6: 纳什均衡之约会游戏与古诺模型 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/5/E/S7KDB145E.flv 7: 纳什均衡伯川德模型与选民投票 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/4/1/S7KDCB541.flv 8: 立场选择种族隔离与策略随机化 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/D/D/S7KDBQ6DD.flv 9: 混合策略及其在网球比赛中的应用

https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/E/7/S7KDBUFE7.flv 10: 混合战略棒球,约会和支付您的税 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/F/0/S7KDC3GF0.flv 11: 合作,突变,与平衡 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/B/E/S7KDEBLBE.flv 12: 社会公约,侵略,和周期 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/2/J/S7KDE8L2J.flv 13: 道德风险,奖励和饥饿的狮子 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/1/P/S7KDED31P.flv 14: 承诺,间谍,和先行者优势 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/L/T/S7KDEAKLT.flv 15: 国际象棋,战略和可信的威胁 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/T/4/S7KDEENT4.flv 16: 声誉和决斗 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/6/F/S7KDEFS6F.flv 17: 最后通牒和讨价还价 https://www.doczj.com/doc/4b5942807.html,/movie/2011/12/A/T/S7KDEK0A T.flv 18:

博弈论课件 1

1 Lecture 1 Introduction to Game Theory,Extensive &Normal Form,Mixed Strategies and Beliefs 2

2 Readings ?Watson: Strategy_ An introduction to game theory –Ch 1‐5:1rd ed p.1-40; 3rd ed p.1‐46. ?Introduction;The Extensive Form;Strategies &the Normal Form;Beliefs,Mixed Strategies and Expecte d Payoffs;General Assumptions and Methodology.?Appendix A:Review of Mathematics p.409‐420.3

2 Outline ?Introduction. ?Extensive form representation. ?Strategies. ?Examples. ?Normal form representation.?Mixed strategies. ?Beliefs. ?Expected payoffs. ?General assumptions. 4

2 Game Theory ?Mathematical models of strategic situations : –Each agent’s behavior affects the well-being of other agents.?Perfect competition and monopoly are not strategic situations. –In perfect competition no agent considers the specific action of any other individual agent. –In monopoly the monopolist doesn’t worry about specific consumer’s actions.(Chooses price/quantity based on overall demand.)?Duopoly (2firms producing)is strategic. –Each firm considers the other’s action when deciding on its own. 5

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论 教案

《两种常见的博弈论模型》一课教案 审签: 2010 年 4 月 13日 班 级 课程名称 经济学基础 教 师 授课 时间 课 型 授课地点 课 题 项 目 认识完全信息静态博弈、完全信息动态博弈 课 时 任 务 通过学习完全信息静态、动态博弈,认识价格战及搭便车现象。 任务分解 1、知识准备:明确博弈论常见的5种分类及类型。 2、案例举例:囚徒困境、智猪博弈 3、模拟测试:分小组,应用所学独立解决智猪博弈问题。 教学 目标 专业能力 通过学习,能够运用博弈论知识分析解决“双寡头价格战问题”及生活中的搭便车现象。 知识目标 1.掌握博弈论的分类; 2.掌握完全信息静态及完全信息动态博弈论模型; 3.学会运用博弈论知识分析、解决分析价格战、搭便车的问题。 方法能力 1、培养学生的独立思考的能力; 2、培养学生学习博弈论的兴趣及爱好; 2、培养学生的团队合作及逻辑思维能力。 重 点 掌握完全信息静态博弈及其扩展运用。 难 点 运用博弈论知识解决分析价格战等恶性竞争问题及搭便车现象。 课堂练习 小组合作完成完全信息动态博案例—“卖鞭炮的选择” 课后作业 完成课后思考题 教学策略与方法 启发 讲解 任务驱动 多媒体演示 自主 描述 案例 分析 小组 讨论 归纳总结 实践 操作 √ √ √ √ √ √ √ √ 课后回顾 本次课程的优点: 存在的问题: 改进设想:

项目名称:博弈论与决策策略 任务:能够自主分析博弈论的模型并分析解决问题 一教学组织活动总过程设计:1、师生问好2、班长报告人数 老师活动:1、问好2、环顾学生 学生活动:1起立问好2、坐姿端正3、班长清 点人数,向老师报告。 活动达到的目标时间分配 创设情境,使学生注 意力集中,进入学习 状态 1分钟 二课程导入情境导入: 复习旧课,导入新课 以《囚徒困境》博弈论案例视频引入 老师活动: (1)老师引导学生回忆上节 课所学的内容,复习博弈论的五种 基本分类方式及类型。(2)播放关 于囚徒困境的视频,点出其中的重 点,并向学生提问。 学生活动: 跟着老师的思路回 忆上节课所学的内容。 认真观看视频并思考老 师所提问题。 活动达到的 目标: 复习旧课内 容为新课做 铺垫,视频 引入抓住学 生焦点。 时间分 配: 5分钟 三教学过程认识完全信息静态博弈 活动项目一:囚徒困境(11分钟) 1、首先,老师给出囚徒困境的博弈论模型。“囚徒困境模型”:该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑6年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑3年,而坦白者有功被减刑6年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。 提问:对于囚犯A而言,他会选择什么样的策略,囚犯B如何呢?(给2分钟时间让学生思考并分析此问题,并让他们尝试通过表格表达出囚犯A及B可能选择的策略及面临的后果) 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑6年。(老师讲解,板书,学生对照自己所写跟老师是否一致) 提问:那么囚徒困境在我们生活中的哪些地方同样存在呢? 补充介绍“囚犯困境”的扩展:双寡头企业价格战、军备竞赛等。 归纳总结完全信息静态博弈的3点特性:(1)同时做出选择;(2)明确对方的选择与游戏规则(共同知识);(3)不管是否沟通过,无法做出有约束力的承诺(非合作)(最好由学生归纳出)

博弈论教学大纲

【博弈论】课程教学大纲 【课程代码】0410955 【学分】2 【参考学时】32 【讲授学时】32 【实验学时】0 【实习学时】0 【课程性质】专业选修【参考教材】《经济博弈论》(复旦大学出版社) 【课程基础】 具备一定的高等数学基础,包括微积分、线性代数与概率统计。具备微观经济学与宏观经济学的学生将会发现本门课程分析问题的崭新角度,因而特别推荐经济学专业的学生选修此门课程。 【适应对象】 尽管本门课程的大多数例子是经济学的,但也不乏其他学科的,如法律、政治学、社会学等。这样不仅可以使经济类专业的学生开阔视野,同时也可以为其他学科有兴趣的同学提供接触经济学,了解经济学的机会,但这里强烈建议那些非经济类预选本门课程的同学,先掌握一些基本的经济学常识及一定的数学基础。 【教学目的】 著名经济学家Jean Tirole说过“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远地改变了经济学家的思维方式”。现实情况也确实如此,新古典经济学的前提假设与现实相距甚远,非完全竞争市场和不完全信息时的价格制度常常不是实现合作和解决冲突的最有效安排。而非价格制度的最显著特征是参与人之间行为的相互作用,此种情况下发展起来的通用方法便是博弈论。通过本科的学习使学生能够基本了解博弈论的基本思想与方法,具备一定的运用博弈论分析现实经济与社会问题的能力。 【内容提要】 博弈论是近年来现代经济学中发展最迅速的分支学科。博弈论研究多人决策问题,在社会经济的各个层面都有许多可用博弈论分析或解决的决策问题,因此博弈论在经济学理论和应用学科有着广泛的应用,是掌握现代经济学的关键。 第一章导论 一、什么是博弈论

博弈论课程心得体会

《博弈论与信息经济学》课程心得体会 作为一名会计专业硕士,我选修这门课程是为了了解和学习一种思想方法,这种方法我很早就感兴趣,电影《美丽的心灵》中纳什的故事让博弈论在我心中显得非常神秘和高大上。第一堂课吕老师谈到博弈论已经成为一种主流方法时,学习的欲望变得更为强烈。经过九周的学习,尽管由于有些地方因为数学能力有限,不得尽懂,但我觉得自己起码已经揭开了这种方法的入门和核心的面纱。 我认为,会计专业硕士是为了培养立足于会计的高级管理人才而设置的,除了扎实的专业知识和理论功底,我觉得掌握思想方法是尤为重要的能力。面对会计行业的变革,作为一名研究生,财务管理能力和管理会计能力是我的核心竞争力。这两种能力需要缜密的思维,科学的方法。如果说缜密的思维更需要在学习和实践中不断历练,科学的方法就需要不断地去接触和了解,不断地去主动学习。博弈论就是一种科学的方法。我觉得博弈论是一种寻求均衡的科学,也是一种创造规则的科学。它让我了解面对不同利益相关者时怎么去寻求均衡、博弈,甚至创造有益的规则。同时,它让我有了一种更加科学、简洁的视角看待事物,非常实用有效而且简单漂亮。 博弈论的核心应该是纳什均衡,这是一个理性的策略组合,每个参与者在对方的选择一定情况下会做出纳什均衡策略组合中的策略。这种选择将是每个理性参与人最终的选择。这个道理很明了,也正是明了让这个理论非常有力。吕老师带着我们解决一个又一个案例中的问题时,我感觉到这种方法的神奇和独特。我印象里最深的是吕老师对法律的看法:法律让不可置信的承诺变成可置信的承诺,好的法律是看似严苛,但很少有人触犯它。以前在学习经济法时,我对“法律是一种合同”这种观点不是很在意,吕老师的说法让我有了新的认识。让不可置信承诺变成可置信的承诺,使得最有益的策略组合成为纳什均衡,在这一点上合同和法律的目的和性质是一样的。我还记得吕老师说《反国家分裂法》是一部非常好的法律,在以前我因为它几乎很少被使用而感觉不到这部法律的重量,但从博弈论的角度来看,这部法律使得针对台湾,宣布独立就会被制裁成为一种可置信的承诺,吕老师的解释让我非常赞同。我真的觉得自己看某些问题的视角发生了变化,更加地深刻和科学。 我觉得正是这种视角是我学习这门课程最大的收获。我知道,短短九周的学习远远不足以掌握博弈论,我甚至或许不能完整地计算出一道例题,但是我对它有了一个基本的认识,理解它的理论基础,最重要的在看一些问题时我可以尝试着用博弈论的角度去试试看。最可怕的不是不会用博弈论的技术和方法,可怕的是在能够使用它时我不知道以它的角度去看待问题,知道可以使用这门科学的技术和方法。经过这两个多月的课程,相信将来如果用的着这种方法时,我知道从哪里着手去学习。

博弈论第三章习题

问题1:如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定,即下图中a 、b 数值不确定。试讨论本博弈有哪几种可能的结果。如果本博弈中的“威胁”和“承诺”是可信的,a 或b 应满足什么条件? ①0a <,不借—不分—不打; ②01a <<,且2b >,借—不分—打; ③1a >,且2b >,借—不分—打(,)a b ; ④0a >,且2b <,借—分—(2,2) 问题2:三寡头市场需求函数Q P -=100,其中Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2同时决定产量,厂商3根据厂商1和厂商2的产量决策,问它们各自的产量和利润是多少? 1123111231(100)2(98)q q q q q q q q q π=----=--- 2123221232(100)2(98)q q q q q q q q q π=----=--- 3123331233(100)2(98)q q q q q q q q q π=----=--- 33123 0,(98)/2q q q q π?=?=--? (a ,b ) (0,4)

代入,11212122(98)/2,(98)/2q q q q q q ππ=--=-- 1212 0,0q q ππ??==??,得***12398/3,49/3q q q === ***1234802/9,2401/9πππ===。 问题3:设两个博弈方之间的三阶段动态博弈如下图所示。 (1)若a 和b 分别等于100和150,该博弈的子博弈完美纳什均衡是什么? (2)T N L --是否可能成为该博弈的子博弈完美纳什均衡路径,为什么? (3)在什么情况下博弈方2会获得300单位或更高的得益? (1)博弈方1在第一阶段选择R ,在第三阶段选择S ,博弈方2在第二阶段选择M 。 (2)不可能。T N L --带来的利益50明显小于博弈方1在第一阶段R 的得益300;无论a 和b 是什么数值,该路径都不能构成Nash 均衡,不能成为子博弈完美Nash 均衡。 (a ,b ) 50,300

《博弈与信息—博弈论概论》odd12

ODD Answers to Odd-Numbered Problems,4th Edition of Games and Information, Rasmusen PROBLEMS FOR CHAPTER12:Bargaining .26March2005.11November2005.Erasmuse@https://www.doczj.com/doc/4b5942807.html,.https://www.doczj.com/doc/4b5942807.html,. This appendix contains answers to the odd-numbered problems in the fourth edition of Games and Information by Eric Rasmusen,which I am working on now and perhaps will come out in2006.The answers to the even-numbered problems are available to instructors or self-studiers on request to me at Erasmuse@https://www.doczj.com/doc/4b5942807.html,. Other books which contain exercises with answers include Bierman&Fernandez (1993),Binmore(1992),Fudenberg&Tirole(1991a),J.Hirshleifer&Riley(1992),Moulin (1986),and Gintis(2000).I must ask pardon of any authors from whom I have borrowed without attribution in the problems below;these are the descendants of problems that I wrote for teaching without careful attention to my sources.

博弈论 蒋文华 浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!

行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉

如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。

----汉代刘向,《围棋赋》二、西方的理解 game(规则) 费厄泼赖(fairplay) 第三节学习博弈论的收益一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

博弈论课后习题

第一章导论 1、什么是博弈?博弈论的主要研究内容是什么? 2、设定一个博弈模型必须确定哪几个方面? 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型? 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么? 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2、为什么说纳什均衡是博弈分析中最重要的概念? 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响? 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10 000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会要求什么数额,为什么? 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么?当n趋向于无穷大时博弈分析是否仍然有效? 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci <a/2,问纳什均衡产量各为多少?如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少? 10、甲乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有什么好的办法? 11、设一个地区选民的观点标准分布于【0,1】上,竞选一个公职的每个候选人同时宣布他们的竞选立场,即选择0到1之间的一个点。选民将观察候选人们的立场,然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人,宣布的立场分别为x1=和x2=,那么观点在x=左边的所有选民都会投候选人1的票,而观点在x=右边的选民都会投候选人2的票,候选人1将以60%的选票获胜。再设如果又候选人的立场相同,那么立场相同的候选人将平分该立场所获得的选票,得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选(即不考虑自己对观点的真正偏好),如果又两个候选人,问纯策略纳什均衡是什么?如果又三个候选人,也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

博弈论课程概要 (IV)

交通大学博弈论课程概要 (IV) 周林 第五部分:Nash 均衡的精细 1. 扩展式博弈:序贯均衡 (F-T 8.3) 对一个一般扩展式博弈进行求解,我们不仅应当知道每一个博弈者在每一信息集的策略,我们也应当知道他在每一信息集上对于他自己在哪一点的估计。我们称两者的组合为一个评估:),(μσ。 (S) 序贯理性:如果每一个博弈者在每一信息集h 上和后的行动对于其他人的策略i -σ和他自己在信息集h 上的概率估计)(h μ是最优的: ))(,|),(())(,|),(()()()()()()(h h s u h h u h i h i h i h i h i h i μσμσσ--≥ 我们则称),(μσ是序贯理性的。 一般我们还要求μ尽可能由σ导出。只要0)(Pr ≠h ob ,μ应由σ靠Bayes 法则导出。对于0)(Pr =h ob 的信息集h 点,我们也要求一种一致性。让0∑表示所有完全混合行为策略,因此对任何信息集h ,0)(Pr ≠h ob 。这样一来,所有的)(h μ都可以唯一的决定。我们用0ψ表示这样的评估的全体。 (C) 一致性:如果存在一个0ψ中的序列),(n n μσ使得 ),(lim ),(n n μσμσ= , 我们就称),(μσ为一致的。 任何一个满足序贯理性和一致性的一个评估),(μσ就叫做序贯均衡。在一个序贯均衡中,策略σ和概率估计μ相互依存: σ对μ最优,μ由σ导出。 例子:用一致性精细均衡。

2.策略式博弈:“颤抖的手”完美均衡(F-T 8.4) 完全混合策略和犯错误的可能:对于原博弈的扰动。 “颤抖的手”完美均衡的三种定义,三种定义的等价性。弱劣策略的排除。 一个扩展式博弈G的策略式表示的“颤抖的手”完美均衡不一定是子博弈完美均衡。为获得子博弈完美均衡,我们考虑G的“代理人”策略式表示:每一个不同的信息集都有一位不同的“代理人”。这个博弈的“颤抖的手”完美均衡不仅是子博弈完美,而且还是一个序贯均衡。 (Selton, Kreps-Wilson) 3.前向归纳法。“烧钱” (F-T 11.3)

(完整word版)博弈论给我的心得

博弈论给我的心里体会 潘慧明 201202034049 12金融数学 我是大学第二学期开始选修学习《博弈论》的,并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过这个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是:博弈论有两个比较enlightening的观点,一是more information can hurt you(掌握更多的信息可能是一件坏事),二是more options can hurt you(拥有更多的选择可能是一件坏事).虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。 而且经过这段时间的学习,我现在对《博弈论》有了些比较肤浅的认识。诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用,要会灵活的去使用这门学科。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。这些双赢的事例,在商务上经常可以看到的。如:商务上的谈判,完完全全的运用到了《博弈论》的知识与原理来分析问题,并且从而找到最佳的均衡点,也就是最好的解决方法。 在所有的对抗和较量中,其胜负成败常常取决于三个基本的因素:机会或者说运气、体能和智能。头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每

耶鲁大学公开课博弈论课习题

耶鲁大学公开课:博弈论 习题集1(第1-3讲内容) Ben Polak, Econ 159a/MGT522a. 由人人影视博弈论制作组Darrencui翻译 1.严格劣势策略与弱劣势策略:严格劣势策略的定义是什么?弱劣势策略的定义是什么?请用 一个包含两个参与人的博弈矩阵来举例说明,要求其中一个参与人有三个策略且三者之一为严格 劣势策略;另一个参与人有三个策略但三者之一为弱劣势策略。请指出你所举例子中的劣势策略。 2.迭代剔除(弱)劣势策略:请看下面的博弈 2 (a). 这个博弈中是否存在严格劣势策略和弱劣势策略?如果存在,请指出并说明。 (b). 剔除掉严格劣势策略和弱劣势策略之后,在简化的博弈中是否还有劣势策略呢?如果是,请指出并说明。最后哪些策略不会被剔除呢? (c). 回顾你第一次剔除劣势策略时哪些策略是劣势策略并给出解释。把它与第二次剔除的劣势策略作比较。从中你能得出关于迭代剔除劣势策略的何种结论? 3. 霍特林的选址博弈(也称霍特林模型):回顾一下课堂中所讲的选票博弈。其中有两个参与人,每个参与人都从集合* +中选出自己的立场。这十个立场均分全部的选票。选民把选票投给与自己立场最接近的候选人。如果两个候选人站在同一个立场上,那么持该立场选民 的选票平均分给每个候选人。候选人想要最大化自己的得票率。举例来说,()。而 () [提示:回答这道题时不必画出整个矩阵] (a).课堂中我们指出立场2严格优于立场1,而实际上还有其它的立场也是严格优于立场1的,请找出所有优于立场1的立场并作出解释。 (b).假设现在有三名候选人。举例来说,()而()。此时立场2是否严格优于立场1?立场3呢?请作出解释。另外,假设我们剔除了立场1和10,但是该立场的选票依然存在。在简化的博弈中,立场2是否严格劣于或弱劣于其它(纯)策略?请作出解释。

博弈论课程概要(I)

交通大学博弈论课程概要 (I) 周林 二零零四年十二月 主要教材:博弈论(Fudenberg & Tirole ) 引言: 博弈论与决策论的差别. 例子:田忌赛马,换钱. 第一部分:完全信息策略式博弈 — 静态博弈 1. 策略式博弈的基本三要素:博弈者,策略空间,收益函数 2. 策略式博弈的基本三解法: a. 占优策略. 例子: 囚徒困境,二价拍卖(Ebay , 易趣网) b. 重复剔除劣策略. 例子:双寡头Cournot 竞争(线性需求) c. Nash 均衡 (最重要的概念) 三种解法的合理性依次减低,而三种解法的适用范围(存在性)依次增加. 3. Nash 均衡存在性定理:如果策略空间是凸紧集,收益函数连续和自拟凹,至少存在一个Nash 均衡. 证明基本思路:最佳反应映射是从策略空间到策略空间的(上半)连续映 射(Berge 定理), 最佳反应映射的不动点就是Nash 均衡. 利用(Kakutani 不动点定理)Brouwer 不动点定理找出不动 点.(注意:这里的最佳反应映射不是一个压缩映射, 因 此不能用迭代法逼近不动点.) 推论:任何有限策略博弈至少有一个混合策略Nash 均衡. 4. Nash 均衡一般非唯一,非Pareto 最优. 可以通过外在信号机制改善收益. 相关均衡:公共信号仅将不同的Nash 均衡混合,私人信号更为有效. 作业:1.1,1.2, 1.5, 1.7, 1.10, 1.12, 2.2 (F&T ). 以及下面的题目: A . 证明任何一个满足Nash 均衡存在性定理的对称博弈(首先给出一个合 理的定义)一定存在一个对称的Nash 均衡. B . 画出下列博弈中所有的相关均衡生成的收益向量: 博弈者 2 博弈者 1 T W

博弈论(哈佛大学原版教程)

Lecture X:Extensive Form Games Markus M.M¨o bius March17,2004 ?Gibbons,chapter2 ?Osborne,sections5.1,5.2and chapter6 1Introduction While models presented so far are fairly general in some ways it should be noted that they have one main limitation as far as accuracy of modeling goes -in each game each player moves once and moves simultaneously. This misses common features both of many classic games(bridge,chess) and of many economic models.1A few examples are: ?auctions(sealed bid versus oral) ?executive compensation(contract signed;then executive works) ?patent race(?rms continually update resources based on where oppo-nent are) ?price competition:?rms repeatedly charge prices ?monetary authority and?rms(continually observe and learn actions) Topic today is how to represent and analyze such games. 1Gibbons is a good reference for economic applications of extensive form games. 1

相关主题
文本预览
相关文档 最新文档