博弈论的几个经典模型

格式：ppt
大小：1.27 MB
文档页数：81

下载文档原格式

/ 81

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要：“囚徒困境”模型是博弈论中的经典范例，它是1950年Tucker提出的，其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握，成为解释生活现象的有力工具。

其实“囚徒困境”模型随着博弈论的深入发展，具有各种不同的形式，通常分为：完全信息的静态博弈，完全信息的动态博弈，不完全信息的静态博弈及不完全信息的动态博弈四种形式。

本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词：博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是：警察抓住了两个合伙犯罪的罪犯，由于缺乏足够的证据指证他们的罪行，所以希望这两人中至少有一人供认犯罪，就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供，并告诉他们警方的政策是“坦白从宽，抗拒从严”：如果两人中只有一人坦白认罪，则坦白者立即释放，而另一人则将重判5年徒刑；如果两个同时坦白认罪，则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪，则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益，第二个数字是囚徒2的得益) ：囚徒2囚徒1（表1）假定两个罪犯熟悉彼此，这便是一个同时行动的完全信息静态博弈。

容易看出，由于对于每个囚徒而言，无论对方选择什么策略，坦白都是自己的最优策略，所以(坦白，坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行，比如犯罪团伙会被警方多次审讯，日常生活中买卖会重复进行，国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加，比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈，以T记基本博弈的重复次数。

博弈论的定义

博弈论的定义1. 博弈论的基本概念博弈论，是现代数学的一个分支学科，研究在多人决策环境中人们的策略选择以及可能产生的结果。

从经济学、管理学、政治学、心理学等方面来分析和解决问题时，博弈论可以为人们提供决策的基础。

因此，博弈论不仅在学术上很有价值，在实践中也具有很高的应用价值。

2. 博弈论的应用范围博弈论的应用范围广泛，如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。

另外，也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。

3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。

“参与者”是指在某一决策环境中的所有相关人员，如消费者、企业、政府或其他组织和个人等。

“策略”是参与者在决策过程中选择的行动方案，也是促进参与者在决策中优化收益的关键。

“收益”或“效用”是参与者最终得到的结果，通常在博弈论中用数字来表示，这些数字可以是财务收入、数字权益等。

“信息”也是参与者在决策中极为重要的因素。

它可以分为完全信息和不完全信息两种，完全信息是指参与者对决策过程中的所有信息都有充分了解，而不完全信息是指参与者对决策过程中的某些信息存在不确定性。

因此，在不完全信息博弈中，有时决策者需要采取一些策略来“模糊化”自己的策略，以避免让其他人知道他们实际上所做的决策。

4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一，是指参与者的利益总和为零。

在这种情况下，一个人赢得的收益等于另一个人失去的收益，如象棋、扑克等所有参与者的输赢情况总是相互抵消的。

- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。

在这种情况下，一方的收益可以与另一方的收益同时增加，如合作博弈中的合作关系。

- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。

在此类博弈中，参与者通常需要通过协商和合作达成共识。

- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。

9博弈论方法及其模型

小猪
稳定的结果: 大猪按,小猪不按
大பைடு நூலகம் 按不按
按
不按
(5,1) (9,1)
(4,4) (0,0)
江西财经大学信息学院 2007-2008
5
经济数学模型与计算机仿真
静态博弈、动态博弈和重复博弈博弈的次序也是博弈很重要的因素,有些博弈中的所有参与人是同时选择战略的,但更多博弈中的参与人是先后选择战略的,也有的博弈是反复或重复进行的. 静态博弈是指在博弈中所有的参与人同时选择战略,或者虽然不是同时选择战略,但是后选择的参与人不知道先选择的参与人的战略的博弈. 动态博弈是指在博弈中各参与人是按某种规则分先后行动,并且后行动者知道先行动者的战略的博弈.
江西财经大学信息学院 2007-2008
1
经济数学模型与计算机仿真
最重要的成果是塞尔腾(R.Selten)在1965年提出了“空头威胁” (Empty Threats)的问题,并提出“子博弈精炼纳什均衡” (Subgame Perfect Nash Equilibrium) 对纳什均衡作完美化精炼的思想.更在1975年提出了“颤抖手均衡”(Trembling Hand Perfect Equilibrium)概念。海萨尼(J.Harsanyi)在1967--1968年发表构造了不完全信息 (Incomplete Information) 博弈理论的系列论文,提出了分析不完全信息博弈问题的标准方法,以及“贝叶斯纳什均衡”(Bayesian Nash Equilibrium)的概念,在1973年提出了关于“混合策略”的不完全信息解释以及“严格纳什均衡”(Strict Nash Equilibrium)的概念.
江西财经大学信息学院 2007-2008

博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i，对于所有的 σi∈Mi，都有ui﹙σ*﹚≥ui﹙σi，σ-i*﹚，则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中解：设猜方猜正方的概率为p，猜反方的概率则为1－
无名氏（大众）定理
无名氏定理：在无穷次重复的由n个游戏者参与的博弈里，如果在每一次重复中博弈的行动集是有限的，则在满足下列三个条件时，在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果：
条件1：贴现因子接近于1；条件2：在每一次重复中，博弈结束的概率或等于0，或为非常小的一个正值；条件3：严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。
博弈方
博弈方：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略
策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可
游戏和经济等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用
游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊朗、以色列和巴勒斯坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) （或称支付，或得益）

博弈论之豪泰林模型

而住在x右边的将在商店2购买，需求分别为D1=x，D2=1-x，这里x满足
p1+tx=p2+t(1-x)
解上式得需求函数分别为：
D1(p1，p2)=x=(p2-p1+t)/2t D2(p1，p2)=1-x=(p1-p2+t)/2t 利润函数分别为：
Π１(p1，p2)= (p1－c) D1(p1，p2) = (p1－c)(p2-p1+t)/2t
p1=p2=c ， Π１=Π２=0
更为一般地，我们可以讨论商店位于任何位置的情况。假定商店1位于a≧0，商店2位于1-b(b ≧0)。为不失一般性，假定
1-a-b ≧0(即商店1位于商店2的左边)。如果旅行成本为二次式，即旅行成本为td2 , 这里d是消费者到商店的距离，那么，需求函数分别为：
问题2
1 1
0
x
(x+y)/2 y
1
Cont….
I1( x,
y)
[1 (1 2
x)]x
[1
(1
y 2
x 2
)](
2
x
2
y
x)
1 8
(4
x
4y
5x2
y2
2 xy )
I2 ( x,
y)
[1 (1
y
ቤተ መጻሕፍቲ ባይዱ
x
2
y )](
y
2
x
2
y)
(1
y)(1 2
y)
1 8
(4
y
4x
5
y2
x2
2 xy
4)
他们感兴趣的唯一变量。还存在产品差异的情况下，均衡价格不会等于边际成本。

第1章博弈论基本模型

为什么学习？
从学习中获得心灵的提高，获得心灵的享受。
学习，其实就为自己创造一个美丽的心灵世界的过程。
有人说，我也没什么追求，就学一点实用知识就行，但问题是，你没有那些“无用”的知识，你怎么驾驭哪些实用的知识呢？ “世人只知有用之用，而不知无用只用”。
很多人30岁后就不再读书，到60岁还是30年前的思维；很多人感慨“现在一读书就头痛”；农村现在不要为生存而挣扎了，那做什么呢？“我不打牌又做什么呢？”
齐田忌策略：
上马 ∨
中马 ∨
下马 ∨
田
上马
中马
下马
结果：
田忌将军每次输掉三千金
谋士孙膑策略：
结果：
齐
上马
中马
下马
∨
∧
∧
田
下马
上马
中马
田忌将军胜二负一赢一千金
博弈论的创立与发展
2、博弈论的发展阶段第一阶段：萌芽期(20世纪40年代前)。利益冲突的研究是分散和初
步的、带有很大程度的随意性。孙子兵法：古诺(Cournot,1883)—古诺的“双寡头垄断”模型；艾
专业学习：谋职、谋生（身无长物、何以生存）。事理学习：明白事理、懂得分析生活中的很多问题。（崔琦：
明白这个世界是一个什么样子，这很重要）。一个人，其实只要懂得了加减乘除四则运算，就可以挣到钱买房买车，在物质世界中生活的很好。但这只是像一个盲人一样在生活，“春天来了，但我却看不到” 。（明明德）人生学习：充实人生、提高人生的境界、把学习融入人的生活中。人不是做事和挣钱的工具，而是宇宙中的有血有肉的生灵，需要提高生活的趣味，享受趣味化的人生，这就需要学习。一个人，不会欣赏《二泉映月》，不会感受过禅宗的静谧，从来也不思考什么是天行健，好像也是在生活。看看很多人下班后在做什么？打牌、或者歌厅洗脚房等，当衣食住行解决了之后，就不知怎么过了，只有赌博和玩乐，却找不到真正的趣味。（身体在成长、心灵也在成长吗？）（新民）仰望星空

博弈论九宫格模型

博弈论九宫格模型博弈论是现代数学中的一门分支学科，该学科主要研究决策者在竞争关系中所做出的各种策略，并利用数学方法对策略的结果进行分析。

而九宫格模型是博弈论中的一种常见模型，其目标是通过博弈来决定一个问题的解法。

九宫格模型的基本形式为一个$3\times 3$的矩阵，在每个位置上填上战略的代号。

在此模型中，每个玩家都选择一种战略，然后根据所选的战略和九宫格中的规则，来进行决策并得出相应的收益。

在九宫格模型中，通常会存在两个玩家，我们把他们分别称为玩家A 和玩家B。

如果每个玩家都有三种不同的战略可以选择，那么九宫格中的每个格子就代表了一种不同的决策组合。

比如，假设玩家A选择左上角的战略a1，而玩家B选择右下角的战略b3，那么这个决策组合就对应了九宫格中的左下角方格。

对于每个决策组合，都会有一个相应的收益。

这些收益可以填写在九宫格的每个方格中，用红色表示玩家A的收益，用蓝色表示玩家B的收益。

在进行博弈时，每个玩家的目标是选择一种战略，从而使自己的收益最大化。

举个例子来说明，在经典的“囚徒困境”问题中，两个犯人都可以选择是配合警察合作，还是背叛对方。

如果两个犯人都合作，那么他们能够共同获得3年的徒刑，如果两个人都背叛，那么他们能够共同获得5年的徒刑。

如果其中一个人背叛而另一个人合作，那么背叛者能够获得1年的刑期，而合作者将被判处10年的徒刑。

在这个问题中，犯人的选择会相互影响，他们的决策和下一步需要付出的代价是互相乘的。

在这个问题中，如果两个人都背叛，那么他们能够共同获得5年的徒刑，这个结果对双方来说都是最不利的。

但是如果他们两个人都能够牵制住自己，并且进行合作，那么他们都只需要背负3年的徒刑这个最优解。

因此，九宫格模型是一种非常实用的工具，能够帮助人们解决各种决策问题。

它可以用于研究各种博弈策略、方案和策略中的错误。

在决策过程中，决策者的选择会相互影响，一方的决策会受到对手的决策的影响，因此需要有一种工具来指导决策者进行思考。

博弈论模型总结

博弈论模型总结博弈论五⼤模型Bash博弈模型有⼀堆数量为n的⽯头，双⽅轮流每次从堆中取⾄少1个⽯头最多m个⽯头，谁先取完谁赢。

设存在整数k和r使⽅程n=k*(m+1)+r成⽴,当r==0时先⼿必败，否则先⼿必赢。

结论：n%(m+1) == 0, 先⼿必败Wythoff博弈模型有两堆数量分别为x、y(x <= y)的⽯头，每次可以从⼀堆中取⾄少⼀个⽯头或者从两堆中取同等数量的⽯头，谁先取完谁赢。

结论：x == floor( (sqrt(5)+1)/2 )*(y-x), 满⾜等式时先⼿必败Nim博弈模型有任意m堆、数量任意的⽯头，每次只能从⼀堆中获取⾄少1个⽯头，谁先取完谁赢设⽯头堆Di，Di的异或和k = D1D2...^Di，当且仅当k == 0时先⼿必败，否则先⼿必赢结论：D1D2...^Di == 0, 先⼿必败Fibonacci博弈模型有⼀堆数量为n的⽯头，双⽅轮流从⽯头堆⾥取k[i]个⽯头(1≤k[i]≤2*k[i-1])，先取完的⼈获胜当且仅当n不是斐波那契数时，先⼿必胜，否则先⼿必败结论：Fib(n) == false, 先⼿必胜SG函数定义： P点：必败点，换⽽⾔之，就是谁处于此位置，则在双⽅操作正确的情况下必败。

______ N点：必胜点，处于此情况下，双⽅操作均正确的情况下必胜。

定义：设mex{S}为集合S中第⼀个不存在的正整数定义：设sg(x)为x状态的sg值，sg(x)=mex{S}，其中S为x的后继状态的sg值的集合当sg(x) == 0时，没有获胜局⾯，此时处于P点性质：1、所有终结点的sg值都为0，即sg(0) == 0______2、⽆论在N点如何操作，都⾄少存在⼀种情况进⼊P点______3、⽆论如何，P节点的后继节点⼀定是N节点______4、⽆论如何只能进⼊N点的点⼀定是P点题解：假设只有⼀堆数量为n的⽯⼦定义sg(x)函数为当前⽯⼦数量的sg函数，每次只能取Fib[]数列的数sg[0] = 0, Fib[] = {1,2,3,5...}当x == 1时，可以取Fib[1]个⽯⼦，剩余0个⽯⼦，sg[1] = mex{sg[0]} = mex{0} = 1;当x == 2时，可以取Fib[2]、Fib[1]个⽯⼦，剩余1、0个⽯⼦sg[2] = mex{sg[1],sg[0]} = mex{0,1} = 2;当x == 3时，可以取Fib[3]、Fib[2]、Fib[1]个⽯⼦，剩余2、1、0个⽯⼦，sg[3] = mex{sg[2],sg[1],sg[0]} = mex{2,1,0} = 3;当x == 4时，可以取Fib[3]、Fib[2]、Fib[1]个⽯⼦，剩余3、2、1个⽯⼦，sg[4] = mex{sg[3],sg[2],sg[1]} = mex{3,2,1} = 0;......当x == n时，若sg[n] != 0，先⼿必胜对于多堆⽯⼦，类⽐Nim游戏：sg[n]sg[m]sg[k] == 0, 先⼿必败#include<iostream>#include<vector>#include<map>#include<set>#include<algorithm>#include<cmath>#include<string>#include<string.h>#include<queue>using namespace std;#define fi first#define se second#define mp make_pair#define pb push_back#define rep(i, a, b) for(int i=(a); i<(b); i++)#define sz(a) (int)a.size()#define de(a) cout<<#a<<" = "<<a<<endl #define dd(a) cout<<#a<<" = "<<a<<" "#define be begin#define en endtypedef long long ll;typedef pair<int, int> pii;typedef vector<int> vi;const int N = 1005;vi f;void fib(){f.pb(1), f.pb(1);for(int i = 1;f[i] < N;i++){f.pb(f[i]+f[i-1]);}f.erase(f.begin());}int sg[N];void SG(){vi::iterator it;sg[0] = 0;for(int i = 1;i < N;i++){set<int> q;for(it = f.begin();it != f.end() && *it <= i;it++){ q.insert( sg[i-(*it)] );}set<int>::iterator sit = q.begin();int t = 0;for(;sit != q.end();sit++){if(t < *sit) {break;}elset = *sit+1;}sg[i] = t;}}int main(){std::ios::sync_with_stdio(false);std::cin.tie(0);fib();SG();int m,n,p;while(cin >> m >> n >> p){if(m == 0) break;if((sg[m]^sg[n]^sg[p]) == 0) cout << "Nacci" << endl; else cout << "Fibo" << endl;}return 0;}。

博弈论斯塔克伯格模型

博弈论斯塔克伯格模型博弈论，作为现代数学的一个分支，具有深厚的理论内涵和实践价值。

其中，斯塔克伯格模型作为一种典型的非合作博弈模型，在经济学、管理学等领域得到了广泛应用。

今天，我们就来聊一聊这个模型背后的故事。

在一个遥远的小镇上，住着两位智慧而精明的商人，他们分别是赵老板和王老板。

这一天，两人相约来到一家茶馆，商议如何经营各自的店铺。

赵老板先开口：“王老板，我觉得咱们得换个思路，现在市场竞争这么激烈，咱们得联手才能在这场博弈中脱颖而出。

”王老板笑着回应：“赵老板，你说得对，可联手也不是那么容易的事。

咱们各自有各自的优势和劣势，要想真正合作，还得好好研究研究。

”于是，两人决定借助斯塔克伯格模型来分析他们的竞争策略。

首先，赵老板提出了一个备选方案：“我打算降低店铺租金，吸引更多顾客。

”王老板听后，沉思片刻，缓缓说道：“如果我只提高商品价格，会吸引那些对价格不敏感的顾客。

”赵老板微微一笑：“那如果我先降低租金，再提高价格，是不是能吸引更多顾客呢？”王老板沉默片刻，突然瞪大了眼睛：“赵老板，你这是要玩‘先发制人’的套路啊！”赵老板点点头：“是的，我先发制人，让你措手不及。

这样一来，咱们就能在这场博弈中占据主动。

”王老板听后，眉头紧锁，仿佛陷入了沉思。

他缓缓开口：“赵老板，那我该怎么办？”赵老板笑着说道：“王老板，其实你完全可以模仿我的策略，先提高商品价格，再降低租金。

这样一来，咱们就能在竞争中保持平衡。

”两人你一言我一语，不知不觉地聊了几个小时。

在他们看来，这场博弈就像一场智慧的较量，充满了乐趣。

最终，赵老板和王老板达成共识，决定携手合作，共同面对市场竞争。

而他们所应用的斯塔克伯格模型，也成了他们成功合作的重要基石。

在这场博弈中，赵老板和王老板充分展示了博弈论的魅力。

他们巧妙地运用模型，分析各自的优势和劣势，最终实现了共赢。

这也让我们看到了，在现实生活中，博弈论不仅是一门学科，更是一种智慧，一种生活方式。

博弈论66个经典例子

博弈论66个经典例子篇一:《博弈论三大经典案例》经典的囚徒困境1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。

经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

若二人都互相检举（互相“背叛”），则二人同样判监2年。

用表格概述如下：甲沉默（合作）乙沉默（合作）二人同服刑半年甲认罪（背叛）甲即时获释；乙服刑10年乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。

参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。

另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。

就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。

若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。

背叛是两种策略之中的支配性策略。

因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

模型二、囚徒困境/非合作博弈
囚徒困境可以用来说明许多现象。
寡头定价拍卖出价推销员的努力政治上的讨价还价军备竞赛等（冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境）
*（纯策略）纳什均衡
问题与思考
• 什么是博弈论？试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨会”，与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢？
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略（strategy）选择的可能，博弈论用策略空间来表示参与者可以选择的策略。
参与者在不同策略组合下会得到一定的支付（payoff）。
对于博弈参与者来说，存在着一博弈结果。
对于游戏设计者，这是一个最好的
模型二、囚徒困境/非合作博弈
在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境” （prisoners’dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博假设：有两个小偷A弈和B联合犯事、私入
第四章博弈论的几个经典模型
讲授人谭建国
引言
博弈论又被称为对策论（ Game Theory)，按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann 教授的说法，博弈论就是研究互动决策的理论。所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动，如果小猪去按，大猪最好选择等待；如果小猪不去按,则最佳选择是大猪亲自去按。
也就是说，在智猪博弈中，大猪没有占优策略,而小猪有占优策略，它的最佳选择就是耐心等待大猪去按钮，才能获得最佳结果。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标
不完全信息意味着博弈各方中至少有一个参与人有多个类型。
模型三、独立私人价值下的一级密封拍卖/不完全信息静
态博弈
通过海萨尼转换，博弈开始时，所有参与人有关“自然”的行动有一致的信念，即都知道所有参与人类型的概率分布函数，此即“海萨尼公理”。
失火了，你往哪个门跑——这就是博弈论
一天晚上，你参加一个派对，屋里有很多人，你玩得很开心。这时候，屋里突然失火，火势很大，无法扑灭。此时你想逃生。你的面前有两个门，左门和右门，你必须在它们之间选择。但问题是，其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的，那么你将因人多拥挤、冲不出去而烧死；相反，如果你选择的是较少人选择的，那么你将逃生。这里我们不考虑道德因素，你将如何选择？
引言
博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
引言
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法，标准的博弈论分析出发点是理性的，而不是心理的或社会的角度。不过，近 30年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory ) 也日益兴起。
博弈的类型
博弈又可分静态博弈和动态博弈。
• 静态博弈：指参与者同时采取行动，或者尽管参与者行动的采取有先后顺序，但后行动的人不知道先采取行动的人采取的是什么行动。
• 动态博弈：指参与者的行动有先后顺序，并且后采取行动的人可以知道先采取行动的人所采取的行动。
博弈的类型
从知识的拥有程度来看，博弈分为完全信息博弈和不完全信息博弈。信息是博弈论中重要的内容。
引言
博弈论的出现只有60多年的历史。博弈论的开创者为诺意曼与摩根斯坦，他们 1944 年出版了《博弈论与经济行为》。博弈论天才纳什（John Nash）的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。
模型二、囚徒困境/非合作博
弈
乙甲
坦白
抵赖
坦白
(-8，-8)
(0，-10)
抵赖
(-10，0)
(-1，-1)
不难看出，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。
模型二、囚徒困境/非合作博弈
对于两个犯罪嫌疑人总体而言，他们设想的最好的策略可能是都不交代。但任何一个犯罪嫌疑人在选择不交代的策略时，都要冒很大的风险，一旦自己不交代而另一犯罪嫌疑人交代了，自己就将可能处于非常不利的境地。对于A 而言,不管B采取何种策略，他的最佳策略都是交代。对于B而言也是如此。最后两人都会选择交代。
模型三、独立私人价值下的一级密封拍卖/不完全信息静海萨尼转换的具态体博方法弈
一个虚拟的参与人“自然”,自然首先决定
参与人的类型，赋予各参与人的类型向t 量，
其t中 (t1,t2 , ,tn ) ；自然告知参与者自己的类型，却不告诉其他参参与与者者同的时类选型择；行动,每一参与i者从可行A集i 中各选方择得行到动收方益A案i (a1；, a2, , ai ,ti ) 。
民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖,则警方因证据不足不能
当大会结束之后，有两个学者，麦息克和路特提议大家玩一个游戏。
他们将一个大信封拿出来，请在场的４３位专家拿出金钱装到这个信封里。如果到最后这信封里的钱超过２５０元，麦息克和路特将自己掏腰包，退还每人１０元。不过，如果最后信封内的钱不足２５０元，就统统没收，大家拿不到半毛钱。
仔细想一想，如果你也在场，你会奉献多少钱呢？
博弈论对于社会科学有着重要的意义，它正成为社会科学研究范式中的一种核心工具，以至于我们可称博弈论是
引言
1994年经济学诺贝尔奖颁发给三位博弈论专家：纳什、塞尔屯(R.Selten)、海萨尼（John C.Harsanyi），而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1995年获得诺贝尔奖的理性主义学派的领袖卢卡斯（Lukas），其理论与博弈论都有着较深的联系。现在博弈论正渗透到各门社会科学，更重要的是它正深刻地改变着人们的思维。
模型一、智猪博弈/完全信息静态博弈
如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗？试试看。
改变方案一：减量方案。
改变方案二：增量方案。
改变方案三：减量加移位方案。
投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
参考书 • 汪贤裕、肖玉明编著，博弈论及其应
用，科学出版社，2008年2月 • 潘天群著，博弈生存（第二版），中
央编译出版社，2004年10月 • 王春永编著，博弈论的诡计，中国发
展出版社，2007年1月
基本术语
• 博弈论研究的对象：是理性的行动者或参与者如何选择策略或如何作出行动的决定。理性的人是对现实的人的基本假定，即假定参与者努力用自己的推理能力使自己的目标最大化。“理性的”与 “道德的”不是一回事,理性的与道德的有时会发生冲突，但是理性的人不一定是不道德的。
例：猪圈里有两只猪，一只比较大，一只比较小。猪圈狭长，猪食槽在一头，猪食按钮在另一头，按一下会有10个单位的猪食落进槽里。由于按钮和食槽距离较位大远的猪，食按物小猪按。钮的体按力耗费相当不按于(等2个待单)
按
ቤተ መጻሕፍቲ ባይዱ
(5，1)
(5，3)
不按(等待)
(9，-1)
(0，0)
大猪和小猪分别该如何选择。
模型一、智猪博弈/完全信息静态博弈
引言
你的选择必须考虑其他人的选择，而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付，不仅取决于你的行动选择——博弈论称之为策略选择，同时取决于他人的策略选择。你和这群人构成一个博弈（game）。
上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型，被称之为少数者博弈或少数派博弈（Minority Game）。
• 完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有“完全的了解”,否则是不完全信息博弈。严格地讲，完全信息博弈是指参与者的策略空间及策略组合下的支付,是博弈中所有参与者的“公共知识”的博弈。
• 不完全信息博弈：参与者所做的是努力使自己的期望支付或期望效用最大化。
模型一、智猪博弈/完全信息静态博弈
生活中博弈的案例很多，你会见到很多例子。只要涉及到人群的互动，就
引言
什么叫博弈？
博弈的英文为game，我们一般将它翻译成“游戏”。而在西方，game的意义不同于汉语中的游戏。在英语中，game即是人们遵循一定规则下的活动，进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中， game有竞赛的意思，进行game的人是很认真的，不同于汉语中游戏的概念。在汉语中，游戏有儿戏的味道。因此将关于game的理论，即game theory翻译成博