博弈论第一章

格式：pdf
大小：108.85 KB
文档页数：13

下载文档原格式

第一章博弈论概述PPT课件

博弈论与信息经济学
Game Theory and Information Economics 天津大学管理与经济学部
授课：XXX
1
第一章博弈论概述（Game Theory）
授课：XXX
2
一、博弈论的定义
又称对策论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
➢ 博弈分析的基本假设（1）个人理性假设当事人在决策时能够充分考虑他所面临的局势，并能做出合乎理性的选择。
（2）最大化自己的收益假设当事人在决策时通常选择使自己收益最
大化的策略。
授课：XXX
12
坦白抵赖
➢ 博弈问题的基本要素
坦白
（1）局中人（Players）
抵赖
参与对抗的各方；不一定指自然人
若二人均不坦白，则只能因藏有枪支而被判刑1年；若有一人坦白而另一个不坦白，则坦白者无罪释放，
不坦白者被判刑10年；若二人都坦白了，则同判8年。此二人确系抢劫犯，请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8，-8 -10，0
抵赖 0，-10 -1，-1
授课：XXX
均衡解：二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》，该影片获得了2002年奥斯卡金像奖的四项大奖
授课：XXX
7
2002年北京国际数学家大会（ICM）
授课：XXX
8
• 主演
罗素·克劳，Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课：XXX
9
1. 囚犯困境（Prisoners’ dilemma

博弈论蒋文华浙江大学

第一讲、博弈论概述献给诸位知人者智，自知者明；胜人者力，自胜者强；小胜者术，大胜者德。

第一章何为“博弈”博：博览全局弈：对弈棋局→谋定而动是指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。

第一节从一个简单的故事说起博弈时要搞清楚对手是谁！博弈时要搞清楚和别人比什么！行为选择既跟对手的情况有关，又跟所遇到的外部环境的变化有关。

特别提示：博弈既可以是竞争，也可以是合作！特别提示：博弈，必须学会换位思考！特别提示：博弈，只需领先一步，高人一筹！博弈就是你中有我，我中有你。

由于直接相互作用（互动），每个博弈参与者的得益不仅取决于自己的策略（行动），还取决于其他参与者的策略（行动）。

博弈的核心在于整体思维基础上的理性换位思考，用他人的得益去推测他人的策略（行动），从而选择最有利于自己的策略（行动）。

特别提示：站在别人的立场上想一想，就是为自己未来的遭遇着想。

——米兰·昆德拉特别提示：如果因为对方眼中的你的傻，而让对方更愿意和你合作，何乐而不为呢？（大智若愚）特别提示：请不要在一个充分竞争的市场去追求成功！特别提示：选对市场（对手）比选对策略更重要！特别提示：在博弈之前，博弈就已经开始了！第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋，法于用兵，怯者无功，贪者先亡。

----汉代刘向，《围棋赋》二、西方的理解game(规则)费厄泼赖（fair play）第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则（制度）的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量，是一个产量竞争模型。

二、伯川德模型该模型与古诺模型的不同之处在于，企业把其产品的价格而不是产量作为竞争手段和决策变量，通过制定一个最优的销售价格来实现利润最大化。

博弈论-第一章

二、博弈的基本式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来（科学）描述一个博弈，就称为博弈表达的基本式。
三、博弈的扩展式
博弈的扩展式就是非常详细地描绘出一个博弈的参与者、策略、行动顺序以及行动时拥有的信息、可能的结果和收益等细节就称为博弈的扩展式。
四、信息和顺序
完全信息和非完全信息，完全和非完全判断的标准就是如果有些信息只有一部分参与者知道，并不是所有的信息都是公共信息，那么博弈就是非完全信息博弈。
静态博弈和动态博弈，静态和动态的区别并不在于时间上是否同时，而是在信息上的一种同时行动。
公共知识与一般信息的区别。
定义1.2 博弈论是专门研究博弈如何出现均衡的规律的学科。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
第二节博弈论的经济学渊源
博弈论与经济学存在着不解之缘，主要是由于下面几个方面：（1）博弈论的核心问题是经济学最早提出并加以系统研究的。（2）博弈论理论发展主要是经济学的需要推动的，也主要是由经济学家加以发展。（3）博弈论中的主要问题基本上都涉及到经济利益冲突问题。
定义1.1 博弈是指利益存在冲突的决策主体（个人，企业，集团，政党，国家等等）在相互对抗（或合作）中，对抗双方（或多方）相互依存的一系列策略和行动的过程集合。
在定义1.1中，我们最需要注意的就是策略的相互依存性。对于策略的相互依存性，传统的经济学不是不想研究，而是缺乏有效的工具。从这个意义上而言，博弈论正是为了解决这一问题而产生的。也是从这个意义上讲，我们有了博弈论的定义。
• • • •

1博弈论第一章

i 1
n n
n
厂商i的收益：
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关，还与其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
哲理：相生相克，以柔克刚
猜硬币方正面反面 1， -1 -1， 1 参与人 1 石头剪子布石头 0， 0 -1， 1 1， -1 参与人2 剪子 1， -1 0， 0 -1， 1 布 -1， 1 1， -1 0， 0
盖硬币方
正面反面
-1， 1 1， -1
1.2.3 产量决策Cournot模型
4
2015/12/5
1.3.1 博弈中的参与人
参与人：独立决策、独立承担博弈结果的个人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果，不管一个组织有多大，甚至大到一个国家或多国，都可以作为一个参与人。囚徒困境中的警察、田忌赛马中的孙膑都不是参与人。

一、单人博弈——只有一个参与人的博弈
严格地讲，单人博弈由于不存在其他参与人的反应和反作用，因此不属于博弈论的研究对象。但是讨论单人博弈会使理论更完整，为多人博弈提供基础和启示。例一：单人迷宫扩展型
入口右 A B 0 出口(奖金M) 右 M
A,1
左 B,1

博弈规则面前参与人之间平等，不因参与人之间权利、地位的差异而改变参与人数量对博弈结果和分析有影响。根
两个囚徒的收益矩阵

北京大学博弈论课件第1章-博弈论概述

POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
二、博弈的分类
❖ 根据博弈参与者能否达成相互合作的和约束性协议
合作博弈（Cooperative Games）非合作博弈（Non-Cooperative Games）
完全信息静态博弈（Static Game with Complete Information）
完全信息动态博弈（ Dynamic Game with Complete Information）
第一节：博弈的定义和实例
❖ 博弈论（Game Theory）又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用，任何一方的决策策略（Strategy）都不能完全独立于其他各方策略时，各方的决策过程及均衡问题。
20 世纪 70 年代，约翰 ·海萨尼（John Harsanyi）和莱因哈德 ·泽尔腾（Reinhard Selten）等将不完全信息理论融入到博弈论的研究中。
20 世纪 90 年代之后，博弈论作为一种方法被普遍运用到经济学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
如果甲、乙都坦白，则甲、乙均得到 5 年徒刑如果甲、乙都不坦白，则甲、乙均得到 2 年徒刑如果甲坦白、乙不坦白，则甲得到 1 年、乙得到 10 年有期徒刑如果甲不坦白、乙坦白，则甲得到 10 年、乙得到 1年有期徒刑

博弈论第一章

1 完全信息静态博弈1.0 对策论研究的内容与基本形式对策论研究的内容对策论研究多个行为主体的决策问题。

对策论研究的形式博弈(game)，由多个行为主体构成的系统。

例Stackelberg modelCournot model博弈的类型参与者行动的时间与顺序同时行动——静态博弈；先后行动——动态博弈。

参与者的信息多少信息相同——完全信息；信息不同——不完全信息。

1.1 基本理论: 博弈的标准式和纳什均衡例1 儿童游戏：“石头、剪刀、布”。

博弈的标准式表示(normal-form representation)(1) 参与人( player).n 个参与人：1, 2, …, i, …, n.(2) 战略(strategy).一个参与人的战略是他采取的一个行动。

参与人i 的战略：s i.参与人i 的战略空间: S i.战略的一个组合: s ={s1，s2, …, s n}.简化表示：s-i ={ s1，…, s i -1，s i+1, …, s n }.(3) 收益(payoff).参与人i 的收益：u i= u i(s1，s2, …, s n)n个参与人博弈的标准形式表示:G = {S1, S2, …, S n；u1, u2, … , u n}完全信息(complete information)：每个参与人知道其他人的战略空间和收益。

静态博弈(static game)：所有的参与人同时行动。

每个人行动时，不知道其他人的行动。

例1（续）：博弈{石头、剪刀、布} 的描述：参与人：1，2。

战略空间：S1 = S2 = {石头、剪刀、布}收益：两人出手的函数u1 (石头，石头) = 0，u1 (石头，剪刀) = 1，u1 (石头，布) = -1 …u2 (石头，石头) = 0，u2 (石头，剪刀) = -1，u2 (石头，布) = 1 ……收益表：两个参与人，有限个战略的博弈的表示方法。

P2石头剪刀布石头0 ，0 1 ，-1 -1 ，1P1剪刀-1 ，1 0 ，0 1 ，-1布 1 ，-1 -1 ，1 0 ，0博弈的问题：能否知道每个参与人选择的战略？例2: 囚徒困境(The Prisoner’s Dilemma)囚徒 2沉默招认沉默-1 ，-1 -9 ，0囚徒 1招认0 ，-9 -6 ，-6囚徒1的考虑：无论对方选沉默还是招认，自己选“招认”好于“沉默”。

博弈论第一章ppt课件

qj ( j k) 必须使(3)式极大化.于是,令
j 0 , j1,2,,n.
qj
n
于是有 a2bqj b qkc0
(4)
kj1
n
即 bjq acb qk, j1,2,,n (5)
k1 .
n
n
将这 n个式子相加得 b qj n(ac)nb qj
j1
j1
行业的总产量为
n j1
qj
n(ac) b(n1)
设市场需求为
n
pab(qj) a0,b0 j1
（2）
当然a >c（否则会有问题，后面可以看到）,由
(1)与(2)两式易知企业 j 的利润为
.
n
j(q1,q2,qn)(ab qj)qjcqj （3） j1
所谓古诺均衡,便是存在一个产量：
q(q1 ,q2 ,,qn )使得每个企业的利润都达到
最大.即当所有别的企业的产量 qk 时q，k
.
1·2 应用举例古诺(1838年)提出了纳什所定义的均衡(但只是在特定的双头垄断模型中),但是他并没有从理论上系统的定义均衡的意义.古诺的研究被认为是最早的博弈论的经典文献之一. 此模型告诉我们；（1）如何对一个问题的非正式描述转化为一
个博弈的标准式表述；（2）如何通过计算解出博弈的纳什均衡；（3）重复剔除严格劣战略的步骤.
所选战略的函数,假定企业的i 收益就是其利润
ui(si,sj)i(qi,qj)qi[a(qiqj)c]
i1 ,j2(i2,j1 )
.
一对战略 (s1, s如2)是纳什均衡,则对每个参与
者
i，s
i
应满足:
ui(si,sj)ui(si,sj) （NE）

北京大学博弈论课件第1章博弈论概述

博弈参与者可能是单个的个人，也可能是组织或集体
企业、社会团体、国家
博弈参与者可能多于两方，三方或多方博弈参与者
二、博弈策略（Strategy）
博弈策略指博弈参与者可以采取的行动在“锤头、剪刀、布”博弈中，博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中，博弈参与者所能采取的博弈策
博弈参与者：两个人博弈过程：
两人在校门口集合，一起逛博物馆
博弈策略和结果
两人都去南门，成功碰面两人都去北门，成功碰面同学甲去南门，同学乙去北门，两人错过同学甲去北门，同学乙去南门，两人错过
博弈双方策略相互依赖，不独立。
其他博弈实例
棋类比赛：象棋、围棋等。古人“对弈”。寡头市场：
遇、不能够相遇两种可能的结果。在“囚徒困境”博弈中，博弈参与者得到的收益是
如果甲、乙都坦白，则甲、乙均得到 5 年徒刑如果甲、乙都不坦白，则甲、乙均得到 2 年徒刑如果甲坦白、乙不坦白，则甲得到 1 年、乙得到 10 年有期徒刑如果甲不坦白、乙坦白，则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中，博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益（Payoff）
博弈收益指不同博弈策略给博弈参与者带来的利益在“锤头、剪刀、布”博弈中，博弈参与者得到的收益是：赢、平局、
输三种可能的结果。两名同学去相约去博物馆博弈中，博弈参与者得到的收益是：能够相
2．非合作博弈（Non-cooperative games），纳什就读于普林斯顿大学数学系的博士毕业论文，1950年。

第1篇博弈论

囚徒A 囚徒A
坦白抵赖
不管B 不管B坦白不坦白，坦白，我坦白总是会少坐一些牢
每一个人的结局不仅取决于自身的选择, 每一个人的结局不仅取决于自身的选择,同时也取决于对手的选择
School of Mathematics and Computer Science
1.1.1 代表性博弈模型
虽然从两名囚犯共同利益看，最好的选择是合作，即同时选择保持沉默，然而，由于猜忌，试图获得更大好处等竞争性动机阻碍了它们达到更好的互利选择。启示：启示：个人理性决策常导致集体非理性结果（个人理性与集体理性之间的矛盾）。囚徒困境在双寡头垄断、公共产品的供给、军备竞赛等许多经济学问题中有着广泛的应用。个人理性与集体理性的矛盾说明了为什么社会中一些大家公认为好的改革却不能实现，关键在于一项好的制度安排应符合纳什均衡。
小猪按等待按 5,1 9,-1 等待 4,4 0,0
School of Mathematics and Computer Science
大猪
1.1.1 代表性博弈模型
市场中大企业与小企业：他们的关系就类似于市场中大企业与小企业：智猪博弈，大企业进行研究开发，为新产品做广告，智猪博弈，大企业进行研究开发，为新产品做广告，而对小企业来说，这些工作可能得不偿失，因此，而对小企业来说，这些工作可能得不偿失，因此，小企业就将精力放在模仿上，小企业就将精力放在模仿上，或等大企业用广告打开市场以后再出售廉价产品。开市场以后再出售廉价产品。股票市场中大户与散户：“散户跟大户” 股票市场中大户与散户：散户跟大户” 股份公司中大股东与小股东：大股东投票，股份公司中大股东与小股东：大股东投票，小股东不投票的制度安排是一个均衡结果

博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论，流传最广的是一个叫做“囚徒困境 ” 的故事。这个博弈是 1950 年图克（Tucker）提出的，这个博弈模型提出后曾引发了大量的相关研究，也有许多关于“囚徒困境”的版本。“囚徒困境”对博弈论的发展起到了巨大的推动作用。可以说凡是讲博弈论，都会说到这个经典的博弈模型。
在过去二三十年中，博弈论已成为社会科学研究的一个重要方法。有人说，如果未来社会科学还有纯理论的话，那就是博弈论。无论是合作博弈还是非合作博弈都给我们提供了一种系统的分析方法，使人们在其命运取决于他人的行为时制定出相应的战略。特别是当许多相互依赖的因素共存，没有任何决策能独立于其它许多决策之外时，博弈论更是价值巨大。
最近十几年来，博弈论在经济学尤其是微观经济学中得到了广泛的运用, 博弈论在许多方面改写了微观经济学的基础,经济学家们已经把研究策略相互作用的博弈论当作最合适的分析工具来分析各类经济问题，诸如公共经济、国际贸易、自然资源、企业管理等。在现代经济学里，博弈论已经成为十分标准的分析工具。除经济学以外, 博弈论目前在生物学、管理学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。现在已经有愈来愈多的人开始关注、了解并学习博弈理论。
博弈论(Game Theory)是一种关于游戏的理论, 又叫做对策论, 是一门以数学为基础的、研究对抗冲突中最优解问题的学科。事实上，博弈论也正是衍生于古老的游戏，如象棋、围棋、扑克等。
博弈论作为一门学科，是在20世纪50～60 年代发展起来的，当非零和博弈理论、特别是不完全信息博弈理论获得充分发展时，才成为现实。到20世纪70年代，博弈论正式成为主流经济学研究的主要方法之一。1994年诺贝尔经济学奖同时授予了纳什、泽尔腾、海萨尼三位博弈论专家。2005年诺贝尔经济学奖又授予了美国经济学家托马斯．谢林（Thomas Schelling）和以色列经济学家罗伯特．奥曼（Robert Aumann），以表彰他们在合作博弈方面的巨大贡献。

博弈论第一章引言

第一章引言一、博弈的定义二、博弈的要素三、博弈的结构与分类四、博弈的发展历程五、主要应用领域一、博弈的定义博弈就是策略对抗，或策略起关键作用的游戏←博弈Game，博弈论Game Theory，Game即游戏、竞技←游戏和竞技等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦一、博弈的定义一个非技术性定义定义：博弈就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。

一、博弈的定义1、博弈论是研究决策主体的行为相互作用时的策略以及这种策略均衡问题的理论——张维迎《博弈论与信息经济学》2、博弈论可以定义为对理性决策者之间冲突与合作的数学模型的研究——R.B.Myerson(2007年诺奖得主）《博弈论——矛盾冲突分析》1991年开篇第一句话四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs）←1、博弈方和局中人：博弈中的决策主体，通过选择行动(或策略）以最大化自己的支付（效用、收益）。

可以是自然人，也可以是团体，比如企业、国家等←2、虚拟参与人（pseudo-player）：又称“自然”（nature)指决定外生随机变量的概率分布机制。

比如，市场需求的大小，就业率的高低等等。

←3、策略（战略）：相机行动方案（支配参与者在什么时候选择什么行动）。

注：a 战略是行动规则，而不是行动自身；b 静态博弈中，战略等同于行动；c 战略必须是完备的，它要给出参与人在每一种可想象到的情况下的行动选择，即使参与人并不预期这些情况会发生。

←4、支付（收益）：参与者策略选择并实施后的结果，是参与人从博弈中获得多少的体现，与策略组合相对应。

博弈论第一章

招认囚徒１沉默
囚徒２招认沉默 –5, -5 0, -8 -8, 0 -1 , -1
囚徒的困境
策略“沉默”严格劣于策略“招认”
博弈分析的目的：预测博弈的均衡结果，即给定每个参与人都是理性的是共同知识，什么是每个参与人的最优策略？什么是所有参与人的最优策略组合？
*肯定性（sure-thing）或替代性（substitution）公理：一个决策者在事件Ａ发生的偏好选项１胜于选项２，并且在事件Ａ不发生时也偏好选项１胜于选项２，那么就有，他在知道事件Ａ无论是发生还是不发生之前都应该偏好选项１胜于选项２。
Chapter 1 完全信息静态博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move) games,we restrict attention to games of complete information. That
招认
囚徒２招认沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒１
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game; (2)the strategies available to each player; (3)the payoff received by each player for each combination of strategies that could be chosen by the players.

博弈论-第1章

4任何纳什均衡策略组合必须仅仅在没有严格劣势策略上或更一般地在重复剔除严格劣势策略后遗留下来的策略上赋予权重原因是参与人总是可以通过将劣势策略替代为优于它的策略而增加他的收益
博弈论
主讲人:燕志雄
第1章策略式博弈和纳什均衡
• • • • • 1、卢梭博弈参与人：猎人策略:猎兔与猎鹿; 收益：猎鹿（2）或猎兔（1）结果:合作与非合作;
C C D 1，1 2，-1
D -1，2 0，0
图1-7
例1.2 二级价格拍卖
• • • • • • • • 1、博弈的构成要素 ——参与人；策略；效用；公共知识。 2、策略选择 ——对于每个参与人来说，以他的估价进行投标的策略弱优于所有其他策略，令ri=maxj≠i sj。 ——设si>vi，如果ri≥si，0，不会更好；如果ri ≤ si，vi- ri ， vi- ri，不会更好；如果vi< ri<si，vi- ri<0，更差。 ——设si<vi，类似地。 ——在二级价格拍卖中，投标者以估价投标是一种优势策略。投标者I赢标，效用为他与I-1两者的估价之差。 ——投标者是否具有彼此估价的信息并不重要。即使投标者知道他们自己但不知道其他投标者的估价，每个投标者以估价出价仍然是一种优势策略。
注意事项
• ——对劣势纯策略赋予正概率的混合策略是劣势的； • ——即便它仅对非劣势的纯策略赋予正概率，一个混合策略也有可能是严格劣势的，如图13。 σ1=(1/2,1/2,0)<D。
L U M D 1,3 -2,0 0,1
R -2,0 1,3 0,1
图1-3
“稳健性”检验
• ——在某些极端情况下，通过重复严格优势获得的唯一策略组合(U,L)与现实中的结果(D,L)并不吻合，如图1-4。 • ——这个例子说明了，收益、策略空间与理性是共同知识的假设是有作用的。图1-4 说明了参与人的行为对于不确定性是非常敏感的。

博弈论1 (2)全篇

6．据得益特征：零和博弈；常和博弈；变和博弈
6
四、古典博弈论的三个基本假设：参与人是理性的；他们有这些理性的共同知识；他们知道博弈规则。
理性的三个基本内涵：理性的局中人具有关于博弈的完全知识；可以确切知道整个状态空间；具有相对无限的逻辑能力。
五、博弈的典型例子
1 ．囚徒困境坦白
坦白
不坦白
-6，-6 -1，-8
3
2、博弈与一般决策的区别
二、博弈模型要素
1、参与人：博弈中的决策主体。他的目的是通过选择策略以最大化自己的支付（效用）水平。
虚拟参与人（自然）：指决定外生的随机变量的概率分布的机制。自然作为虚拟参与人没有自己的支付与目标函数，即所有的结果对它都是无差异的。
2、策略：参与人在给定信息集（信息集包含了一个参与人有关其他参与人之前行动的知识，可理解为参与人在特定时刻有关变量值的知识。一个参与人无法准确知道的变量全体属于一个信息集）的情况下的行动规则。它规定参与人在什么时候选择什么行动。[策略是可供局中人选择对付其它局中人的完整行动方案。]
21
例某个地方的居民均匀地环绕一个圆形湖居住。两小贩来此地推销商品。1）若居民都选择离自己较近的小贩购买商品，问小贩选择推销地点博弈的NE是什么？2）若有三个小贩同时到此地推销商品，则推销地点博弈的NE又是什么？3）若圆形湖的周长是1（千米），居民的购买量是Q=1-D，D为居民与小贩推销点距离，则两个和三个小贩博弈的NE各是什么？
14
例6 设 s1 [10,0] s2 [3,0]
u1 (s) 10s1 7s1s2 s12
u2 s 15s2 5s1s2 s22
求NE。
15
例7 设 s1 [10,0] s2 [3,0]

博弈论第一章

ui表第个与的付效水）示 i 参人支（用平 u = u， 2，， i，， n 为个的付合（ 1 u L u L u） n 人支组 ui是有与战选的数所参人略择函： ui =ui {s , s2,L si ,L sn} , , 1
• 博弈的基本特征是一个参与人的支付不仅取决于自己的战略选择，己的战略选择，而且取决于所有其他参与人的战略选择
• 第二节博弈论与经济学的关系 • 1、从研究对象看：对手的反应、从研究对象看： • 2、利益最大化下的合作与冲突、 • 3、完全竞争与完全信息假定、 • • • • • • • 第三节经济博弈论的形成与发展古诺、古诺、伯特兰诺依曼、冯.诺依曼、摩根斯特恩：《博弈论与经济行为》诺依曼摩根斯特恩：博弈论与经济行为》纳什：经济均衡－博弈均衡纳什：经济均衡－泽尔腾：动态博弈：泽尔腾：动态博弈：子博弈均衡豪尔绍尼：不完全信息博弈：贝叶斯－豪尔绍尼：不完全信息博弈：贝叶斯－纳什均衡维克里、莫里斯：维克里、莫里斯：不对称信息下的激励问题
• 第四节博弈的分类 • 1、合作博弈（cooperative game）和非、合作博弈（）合作博弈（合作博弈（non- cooperative game ）： • 人们的行为相互作用时，人们的行为相互作用时，当事人能不能达成一个具有约束力的协议，如果有，能达成一个具有约束力的协议，如果有，就是合作博弈；反之，则是非合作博弈。就是合作博弈；反之，则是非合作博弈。 • 现在经济学家谈到博弈论，现在经济学家谈到博弈论，一般指的是非合作博弈，很少指合作博弈。是非合作博弈，很少指合作博弈。
• • • •
猜谜游戏两个儿童各拿一枚硬币，若同时正面朝上或朝下，A给B 1分钱，若只有一面朝上，B给A 1分钱。

博弈论第一章

1.1.2一个非技本性的定义规定或定义一个博弈需要以下几个方面： 1．参与人(Player)(局中人）指博弈中的决策主体，他的目的是通过选择行动（或策略）以最大化自己的支付（效用）水平，参与人可以是自然人、团体、自然（“上帝”作为虚拟的参与人）。 2．各个参与人各自可选择行动集(action set),Ai={ai}, 是其可以采用的全部行动的集合。一个行动组合(action proile)是一个由博弈中的n个参与人每个选取一个行动所组成的有序集a=(a1,a2,…an)。
1.3.2 博弈中的策略博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。博弈中各博弈方的决策内容称为“策略“，但应注意到并不是每个博弈方都有相同的可选策略。如果在一个博弈中每个博弈方的策略数都是有限的，则称该博弈为有限博弈；否则就称为无限博弈。 1.3.3 博弈中的得益(支付,payoff) 得益指在一个特定的策略组合下参与人得到效用水平, 即各个博弈方从博弈中所获得的利益.
如果一个决策者在追逐其目标时能其前后一致地做决策，我们就称他是理性的(rational) 如果局中人知道我们付此博弈所知道的一切，并能做出我们对此局势所做的一切推断，我们就称此博弈的局中人是智能的。
1.2 几类经典的博弈模型
1.2.1 囚徒的困境(prisoners’ dilemma)
囚徒B
坦白坦白不坦白
囚徒A
－8,－8
－10,0
0,－10
－1,－1
不坦白
这个例子本身就部分奠定了非合作博弈论的基础。
1.2.2 智猪博弈猪圈里有两头猪:大猪和小猪,猪圈的一头有一个猪食槽,另－头装有－个按纽,控制着猪食的供应,按一下就会有10单位的猪食进槽,但谁按谁就要付出相当于2单位猪食的成本;当猪食进槽时,若下猪先到,大猪可吃到9单位;小猪先到, 则小猪可吃到4单位,大猪吃6单位;若两者同时到,叫大猪可吃7单位,小猪吃3单位。

博弈论第一章总结

博弈论第一章总结那咱就开始唠唠博弈论第一章的那些事儿哈。

博弈论啊，这可是个超级有趣的东西呢。

第一章就像是打开博弈论大门的一把小钥匙，虽然小，但可重要啦。

这第一章啊，主要就是给咱介绍啥是博弈论的基本概念。

就好比是你要去一个新地方，先得知道这个地方是干啥的，大概啥样对吧。

博弈论呢，简单来说就是研究在不同的决策情况下，人们或者各方之间是怎么互相影响的。

比如说啊，下象棋的时候，你走一步，对方走一步，你每一步的决策都要考虑到对方可能会干啥，对方也是一样，这就是一种博弈呀。

这里面有个很重要的点就是参与者。

这些参与者就像一场大戏里的演员，每个参与者都有自己的目标，就像演员都有自己的角色任务一样。

比如说在商业竞争里，那些公司就是参与者，每个公司都想赚更多的钱，扩大自己的市场份额，这就是他们的目标啦。

而且这些参与者的决策可不是瞎做的哦，都是为了达到自己的目标去想办法的。

再说说策略这个事儿。

策略就像是每个参与者手里的武器或者魔法棒。

不同的参与者有不同的策略可以选择。

还拿商业竞争举例哈，如果一家公司想要增加市场份额，它可以选择降低价格，提高产品质量，或者做很多广告这些策略。

而且每个策略都会对其他参与者产生影响呢。

比如说你降价了，别的公司可能就会受到影响，也跟着降价或者想出其他办法来应对。

信息也是博弈论第一章里不能少的部分。

信息就像是在黑暗里的灯光，有多少信息就决定了你能多清楚地看清局势。

要是你知道很多关于其他参与者的信息，比如他们的策略啦，他们的目标啦，那你做决策的时候就更有把握。

但是要是你啥都不知道，就像在黑夜里瞎摸，那可就危险啦。

比如说在谈判的时候，如果一方知道另一方的底线，那这一方就有更大的优势，能更好地争取自己的利益。

这第一章的博弈论啊，其实就是把这些基本的东西一股脑儿地摆在我们面前，让我们对博弈论有个初步的认识。

它告诉我们在各种情况下，人与人、公司与公司、国家与国家之间的互动都是有规律可循的。

就像我们解开一个谜题一样，每一个概念都是一块小拼图，当我们把这些小拼图都搞清楚了，就能慢慢看到整个博弈论这个大拼图的全貌啦。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Kousha Etessami AGTA:Lecture1
Kousha Etessami AGTA:Lecture1
Kousha Etessami AGTA:Lecture1
Kousha Etessami AGTA:Lecture1
is a pair(n-tuple)of strategies for the2players(n players)such that no player can beneﬁt by unilaterally
(i.e.,randomized)Nash equilibrium.•Example1:The pair of dominant strategies (Defect,Defect)is a pure
solution to this zero-sum game.The“minimax value”is0, as it must be because the game is“symmetric”.)•Question:How do we compute a Nash Equilibrium for a given game?
”(also called“normal form
.
What if,as is often the case,the game is played by a sequence of moves over time?(Think,e.g.,Chess.) Consider the following2-person game tree:
•How do we analyze and compute“solutions”to extensive form
Kousha Etessami AGTA:Lecture1
(probabilistic)nodes, controlled by neither player.(Poker,Backgammon.) Also,a player may not be able to distinguish between several of its“positions”or“nodes”,because not all information is available to it.(Think Poker,with opponent’s cards hidden.)Whatever move a player employs at a node must be employed at all nodes in the same“information set
.
Theorem Aﬁnite n-person extensive game of perfect information has an“equilibrium in pure strategies”. Again,how do we compute solutions to such games?
Kousha Etessami AGTA:Lecture1
(think EBay)Think of an auction as a multiplayer game between several bidders.If you are the auctioneer,how could you design the auction rules so that,for every bidder, bidding the maximum that an item is worth to them will be a“dominant strategy”?
One answer:Vickery auctions
Kousha Etessami AGTA:Lecture1
modeling“rational agents”and their interactions.(Similar to Econ.view.)
•Games in Modeling and analysis of reactive systems:
: e.g.,Byzantine agreement.
•Games in Algorithms
:Many computational complexity classes are deﬁnable
in terms of games:Alternation,Arthur-Merlin
:GT characterizations of logics,including modal and temporal logics,
and logics that capture computational complexity
classes(Ehrenfeucht-Fraisse games).
•Games in Semantics
:An extremely active research area at the intersection of CS and
Economics.
Basic idea:“The internet is a HUGE experiment
in interaction between agents(both human and
automated)”.
How do we set up the rules of this game to harness
“socially optimal”results?
I hope you are convinced:knowledge of the principles and algorithms of game theory will be useful to you for carrying on future work in many CS diciplines.
Γ,with n players, consists of:
1.A set N={1,...,n}of players.
2.For each i∈N,a set S i of(pure)strategies.
Let S=S1×S2×...×S n be the set of possible combinations of(pure)strategies.
3.For each i∈N,a payoﬀ(utility)function
u i:S→R,describes the payoﬀu i(s1,...,s n)to player i under each combination of strategies. (Each player prefers to maximize its own payoﬀ.)
Deﬁnition A zero-sum
Kousha Etessami AGTA:Lecture1
guess of all players wins a payoﬀof1.All other players get a payoﬀof0.(If there are ties for who is closest,all who are closest get payoﬀ1.)
Question:What would your strategy be in such a game?
Question:What is a“Nash Equilibrium”of such a game?。

博弈论第一章

合集下载

第一章博弈论概述PPT课件

博弈论蒋文华浙江大学

博弈论-第一章

1博弈论第一章

北京大学博弈论课件第1章-博弈论概述

博弈论第一章

博弈论第一章ppt课件

北京大学博弈论课件第1章博弈论概述

第1篇博弈论

博弈论全套课件

博弈论第一章引言

博弈论第一章

博弈论-第1章

博弈论1 (2)全篇

博弈论第一章

博弈论第一章

博弈论第一章总结

文档推荐

最新文档

博弈论第一章

合集下载

第一章 博弈论概述PPT课件

博弈论 蒋文华 浙江大学

博弈论-第一章

1博弈论第一章

北京大学博弈论课件第1章-博弈论概述

博弈论 第一章

博弈论第一章ppt课件

北京大学博弈论课件第1章博弈论概述

第1篇 博弈论

博弈论全套课件

博弈论第一章 引言

博弈论第一章

博弈论-第1章

博弈论1 (2)全篇

博弈论 第一章

博弈论第一章

博弈论第一章总结

文档推荐

最新文档

第一章博弈论概述PPT课件

博弈论蒋文华浙江大学

博弈论第一章

第1篇博弈论

博弈论第一章引言

博弈论第一章