博弈论的几个经典模型
- 格式:ppt
- 大小:1.27 MB
- 文档页数:81
博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。
其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。
本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。
关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。
它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。
为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。
当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。
用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。
容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。
二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。
而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。
下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。
首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。
博弈论的定义1. 博弈论的基本概念博弈论,是现代数学的一个分支学科,研究在多人决策环境中人们的策略选择以及可能产生的结果。
从经济学、管理学、政治学、心理学等方面来分析和解决问题时,博弈论可以为人们提供决策的基础。
因此,博弈论不仅在学术上很有价值,在实践中也具有很高的应用价值。
2. 博弈论的应用范围博弈论的应用范围广泛,如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。
另外,也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。
3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。
“参与者”是指在某一决策环境中的所有相关人员,如消费者、企业、政府或其他组织和个人等。
“策略”是参与者在决策过程中选择的行动方案,也是促进参与者在决策中优化收益的关键。
“收益”或“效用”是参与者最终得到的结果,通常在博弈论中用数字来表示,这些数字可以是财务收入、数字权益等。
“信息”也是参与者在决策中极为重要的因素。
它可以分为完全信息和不完全信息两种,完全信息是指参与者对决策过程中的所有信息都有充分了解,而不完全信息是指参与者对决策过程中的某些信息存在不确定性。
因此,在不完全信息博弈中,有时决策者需要采取一些策略来“模糊化”自己的策略,以避免让其他人知道他们实际上所做的决策。
4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一,是指参与者的利益总和为零。
在这种情况下,一个人赢得的收益等于另一个人失去的收益,如象棋、扑克等所有参与者的输赢情况总是相互抵消的。
- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。
在这种情况下,一方的收益可以与另一方的收益同时增加,如合作博弈中的合作关系。
- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。
在此类博弈中,参与者通常需要通过协商和合作达成共识。
- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。
博弈论九宫格模型博弈论是现代数学中的一门分支学科,该学科主要研究决策者在竞争关系中所做出的各种策略,并利用数学方法对策略的结果进行分析。
而九宫格模型是博弈论中的一种常见模型,其目标是通过博弈来决定一个问题的解法。
九宫格模型的基本形式为一个$3\times 3$的矩阵,在每个位置上填上战略的代号。
在此模型中,每个玩家都选择一种战略,然后根据所选的战略和九宫格中的规则,来进行决策并得出相应的收益。
在九宫格模型中,通常会存在两个玩家,我们把他们分别称为玩家A 和玩家B。
如果每个玩家都有三种不同的战略可以选择,那么九宫格中的每个格子就代表了一种不同的决策组合。
比如,假设玩家A选择左上角的战略a1,而玩家B选择右下角的战略b3,那么这个决策组合就对应了九宫格中的左下角方格。
对于每个决策组合,都会有一个相应的收益。
这些收益可以填写在九宫格的每个方格中,用红色表示玩家A的收益,用蓝色表示玩家B的收益。
在进行博弈时,每个玩家的目标是选择一种战略,从而使自己的收益最大化。
举个例子来说明,在经典的“囚徒困境”问题中,两个犯人都可以选择是配合警察合作,还是背叛对方。
如果两个犯人都合作,那么他们能够共同获得3年的徒刑,如果两个人都背叛,那么他们能够共同获得5年的徒刑。
如果其中一个人背叛而另一个人合作,那么背叛者能够获得1年的刑期,而合作者将被判处10年的徒刑。
在这个问题中,犯人的选择会相互影响,他们的决策和下一步需要付出的代价是互相乘的。
在这个问题中,如果两个人都背叛,那么他们能够共同获得5年的徒刑,这个结果对双方来说都是最不利的。
但是如果他们两个人都能够牵制住自己,并且进行合作,那么他们都只需要背负3年的徒刑这个最优解。
因此,九宫格模型是一种非常实用的工具,能够帮助人们解决各种决策问题。
它可以用于研究各种博弈策略、方案和策略中的错误。
在决策过程中,决策者的选择会相互影响,一方的决策会受到对手的决策的影响,因此需要有一种工具来指导决策者进行思考。
博弈论模型总结博弈论五⼤模型Bash博弈模型有⼀堆数量为n的⽯头,双⽅轮流每次从堆中取⾄少1个⽯头最多m个⽯头,谁先取完谁赢。
设存在整数k和r使⽅程n=k*(m+1)+r成⽴,当r==0时先⼿必败,否则先⼿必赢。
结论:n%(m+1) == 0, 先⼿必败Wythoff博弈模型有两堆数量分别为x、y(x <= y)的⽯头,每次可以从⼀堆中取⾄少⼀个⽯头或者从两堆中取同等数量的⽯头,谁先取完谁赢。
结论:x == floor( (sqrt(5)+1)/2 )*(y-x), 满⾜等式时先⼿必败Nim博弈模型有任意m堆、数量任意的⽯头,每次只能从⼀堆中获取⾄少1个⽯头,谁先取完谁赢设⽯头堆Di,Di的异或和k = D1D2...^Di,当且仅当k == 0时先⼿必败,否则先⼿必赢结论:D1D2...^Di == 0, 先⼿必败Fibonacci博弈模型有⼀堆数量为n的⽯头,双⽅轮流从⽯头堆⾥取k[i]个⽯头(1≤k[i]≤2*k[i-1]),先取完的⼈获胜当且仅当n不是斐波那契数时,先⼿必胜,否则先⼿必败结论:Fib(n) == false, 先⼿必胜SG函数定义: P点:必败点,换⽽⾔之,就是谁处于此位置,则在双⽅操作正确的情况下必败。
______ N点:必胜点,处于此情况下,双⽅操作均正确的情况下必胜。
定义:设mex{S}为集合S中第⼀个不存在的正整数定义:设sg(x)为x状态的sg值,sg(x)=mex{S},其中S为x的后继状态的sg值的集合当sg(x) == 0时,没有获胜局⾯,此时处于P点性质:1、所有终结点的sg值都为0,即sg(0) == 0______2、⽆论在N点如何操作,都⾄少存在⼀种情况进⼊P点______3、⽆论如何,P节点的后继节点⼀定是N节点______4、⽆论如何只能进⼊N点的点⼀定是P点题解:假设只有⼀堆数量为n的⽯⼦定义sg(x)函数为当前⽯⼦数量的sg函数,每次只能取Fib[]数列的数sg[0] = 0, Fib[] = {1,2,3,5...}当x == 1时,可以取Fib[1]个⽯⼦,剩余0个⽯⼦,sg[1] = mex{sg[0]} = mex{0} = 1;当x == 2时,可以取Fib[2]、Fib[1]个⽯⼦,剩余1、0个⽯⼦sg[2] = mex{sg[1],sg[0]} = mex{0,1} = 2;当x == 3时,可以取Fib[3]、Fib[2]、Fib[1]个⽯⼦,剩余2、1、0个⽯⼦,sg[3] = mex{sg[2],sg[1],sg[0]} = mex{2,1,0} = 3;当x == 4时,可以取Fib[3]、Fib[2]、Fib[1]个⽯⼦,剩余3、2、1个⽯⼦,sg[4] = mex{sg[3],sg[2],sg[1]} = mex{3,2,1} = 0;......当x == n时,若sg[n] != 0,先⼿必胜对于多堆⽯⼦,类⽐Nim游戏:sg[n]sg[m]sg[k] == 0, 先⼿必败#include<iostream>#include<vector>#include<map>#include<set>#include<algorithm>#include<cmath>#include<string>#include<string.h>#include<queue>using namespace std;#define fi first#define se second#define mp make_pair#define pb push_back#define rep(i, a, b) for(int i=(a); i<(b); i++)#define sz(a) (int)a.size()#define de(a) cout<<#a<<" = "<<a<<endl #define dd(a) cout<<#a<<" = "<<a<<" "#define be begin#define en endtypedef long long ll;typedef pair<int, int> pii;typedef vector<int> vi;const int N = 1005;vi f;void fib(){f.pb(1), f.pb(1);for(int i = 1;f[i] < N;i++){f.pb(f[i]+f[i-1]);}f.erase(f.begin());}int sg[N];void SG(){vi::iterator it;sg[0] = 0;for(int i = 1;i < N;i++){set<int> q;for(it = f.begin();it != f.end() && *it <= i;it++){ q.insert( sg[i-(*it)] );}set<int>::iterator sit = q.begin();int t = 0;for(;sit != q.end();sit++){if(t < *sit) {break;}elset = *sit+1;}sg[i] = t;}}int main(){std::ios::sync_with_stdio(false);std::cin.tie(0);fib();SG();int m,n,p;while(cin >> m >> n >> p){if(m == 0) break;if((sg[m]^sg[n]^sg[p]) == 0) cout << "Nacci" << endl; else cout << "Fibo" << endl;}return 0;}。
博弈论斯塔克伯格模型博弈论,作为现代数学的一个分支,具有深厚的理论内涵和实践价值。
其中,斯塔克伯格模型作为一种典型的非合作博弈模型,在经济学、管理学等领域得到了广泛应用。
今天,我们就来聊一聊这个模型背后的故事。
在一个遥远的小镇上,住着两位智慧而精明的商人,他们分别是赵老板和王老板。
这一天,两人相约来到一家茶馆,商议如何经营各自的店铺。
赵老板先开口:“王老板,我觉得咱们得换个思路,现在市场竞争这么激烈,咱们得联手才能在这场博弈中脱颖而出。
”王老板笑着回应:“赵老板,你说得对,可联手也不是那么容易的事。
咱们各自有各自的优势和劣势,要想真正合作,还得好好研究研究。
”于是,两人决定借助斯塔克伯格模型来分析他们的竞争策略。
首先,赵老板提出了一个备选方案:“我打算降低店铺租金,吸引更多顾客。
”王老板听后,沉思片刻,缓缓说道:“如果我只提高商品价格,会吸引那些对价格不敏感的顾客。
”赵老板微微一笑:“那如果我先降低租金,再提高价格,是不是能吸引更多顾客呢?”王老板沉默片刻,突然瞪大了眼睛:“赵老板,你这是要玩‘先发制人’的套路啊!”赵老板点点头:“是的,我先发制人,让你措手不及。
这样一来,咱们就能在这场博弈中占据主动。
”王老板听后,眉头紧锁,仿佛陷入了沉思。
他缓缓开口:“赵老板,那我该怎么办?”赵老板笑着说道:“王老板,其实你完全可以模仿我的策略,先提高商品价格,再降低租金。
这样一来,咱们就能在竞争中保持平衡。
”两人你一言我一语,不知不觉地聊了几个小时。
在他们看来,这场博弈就像一场智慧的较量,充满了乐趣。
最终,赵老板和王老板达成共识,决定携手合作,共同面对市场竞争。
而他们所应用的斯塔克伯格模型,也成了他们成功合作的重要基石。
在这场博弈中,赵老板和王老板充分展示了博弈论的魅力。
他们巧妙地运用模型,分析各自的优势和劣势,最终实现了共赢。
这也让我们看到了,在现实生活中,博弈论不仅是一门学科,更是一种智慧,一种生活方式。
博弈论66个经典例子篇一:《博弈论三大经典案例》经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:甲沉默(合作)乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑10年乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。