综合I类与II类理性人的博弈策略doc17(3)
- 格式:doc
- 大小:31.50 KB
- 文档页数:13
博弈论模型解析决策者理性选择与策略博弈论是一种研究决策者在相互依赖环境下进行决策的数学模型。
决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。
本文将介绍博弈论的基本概念,并解析决策者的理性选择和策略。
首先,我们来了解博弈论中的一些重要概念。
博弈论主要研究的是决策者的互动关系,其中包括决策者、策略和支付。
决策者是参与博弈的个体,可以是个人、组织或国家等。
策略是决策者进行决策的行动或方案。
支付是决策者从策略中获得的效益或成本。
决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。
决策者在选择策略时通常会考虑以下几个因素:自己的利益、对手的选择、对手的动机以及对手有关信息的了解程度。
理性决策者会选择能够最大化自己效益的策略。
决策者的理性选择基于博弈论中的均衡概念。
博弈论中的均衡是指决策者在相互依赖环境下做出的稳定决策。
常见的均衡概念包括纳什均衡、次序均衡和完全均衡等。
纳什均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者无法通过改变自己的策略来获得更大的效益。
次序均衡是指在博弈中,决策者的行动顺序是合理的,每个决策者的策略是对先前决策者行动的响应。
完全均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者对这些最优选择的预期与实际情况相符。
博弈论的最经典模型是囚徒困境。
囚徒困境是指两个犯罪嫌疑人之间的博弈,他们可以选择合作或背叛。
如果两人都选择合作,则会得到较轻的刑期;如果两人都选择背叛,则会得到较重的刑期;如果其中一人选择合作而另一人选择背叛,则背叛者会得到零刑期,而合作者会得到较重的刑期。
在囚徒困境中,每个囚徒都会选择背叛,因为他们认为对方也会选择背叛,这样才能避免得到较重的刑期。
然而,如果两人能够相互合作,他们将会得到较轻的刑期。
除了囚徒困境,博弈论还可以应用于许多其他领域。
例如,企业之间的价格竞争、国家之间的军备竞赛以及拍卖等都可以通过博弈论模型进行分析。
高等经济学讲义蒲勇健重庆大学教材:2013年陪同2012年诺贝尔奖得主A.Roth访问中国第一章博弈模型的策略式表述第一节 策略式表述的博弈策略式的博弈也称为静态博弈。
抽象的表达就是:定义1.1:一个策略式博弈,(),()i iG N A u =由下列要素构成: ·博弈参与人集合:{1,...,}N n =;·每个参与人i 有一个包含其所有可选择行动的行动集A i ,i ∈N ;·每个参与人i 有一个支付函数:i u A R →,其中j N j A A ∈=⨯。
参与人(players ):每个博弈都有参与者人。
记i 为博弈的一个参与人(1,2,,i n =),则N ={1,...,n }为所有参与人构成的集合。
象棋比赛有两人参与,因此{1,2}N =;麻将有四个人参与,因此{1,2,3,4}N =。
参与人可以是作为自然人的个人,也可以是企业、组织甚至国家等等。
博弈论假定参与人是追求效用最大化的理性人,即他们会根据自己的信念,选择他们觉得最好的行动。
行动空间(action space ):每个参与人i N ∈都有行动集A i 。
该行动集包含可供其选择的所有行动,因此被称为行动空间。
记i A 中的一个元素为i i A a ∈;又记1(,...,,...,)i n a a a a =为一个行动组合。
行动组合告诉我们每个参与人的行动。
又记j j NA A ∈=⨯为行动组合空间。
有时我们也称行动为“策略”(在引入“扩展式博弈之前”是如此的),行动空间为“策略空间”,行动组合为“策略组合”,行动组合空间为“策略组合空间”。
支付函数(payoff function ):指参与人从博弈中获得的效用水平(或利润水平等其他的目标)。
根据前面给出的说明,无论什么样的支付函数,一般都是以效用函数作为基础的。
如果所有参与人的行动构成行动组合a ,则i 的支付为(),i i u u a i N =∈。
综合类理性人的博弈策略在博弈论中,理性人的博弈策略是指在一定的博弈环境下,参与者为理性人,根据自身的利益最大化来选择合适的行为策略。
综合类理性人指的是在博弈环境中具有多种不同利益考量的参与者,他们会综合考虑各种因素来做出最佳的决策。
本文将从博弈论的角度出发,探讨综合类理性人在博弈中的策略选择。
博弈论基础概念在博弈论中,博弈是指两个或多个决策者在特定情况下做出决策的过程。
博弈过程中每个决策者都会考虑其他决策者的行为对自己可能产生的影响,然后选择最有利于自己的策略。
博弈论主要研究参与者之间的互动关系和最优策略的选择。
综合类理性人的特点综合类理性人在博弈中的特点是具有多种不同的利益考量,他们不单独追求某一方面的利益最大化,而是需要综合考虑多种因素来做出决策。
这种综合性的考量往往使得他们的决策更加复杂,需要综合考虑各种因素的权衡。
策略选择的依据综合类理性人在博弈中选择策略的依据主要包括以下几个方面:1.利益最大化:在博弈中,参与者的最终目的是追求自身的利益最大化,所以在选择策略时需要考虑如何能够最大化自己的利益。
2.对手的策略:综合类理性人需要考虑其他参与者可能采取的策略,以便更好地应对对手的举动。
3.博弈环境:博弈的环境包括参与者的数量、信息的透明度、博弈的次数等,这些都会对策略选择产生影响。
4.风险偏好:不同的人在面对风险时的偏好程度不同,综合类理性人需要考虑自己的风险偏好程度来选择最合适的策略。
综合类理性人的博弈策略在博弈中,综合类理性人可以采取多种策略来最大化自己的利益。
下面将介绍几种常见的博弈策略:1.合作与背叛:合作是指参与者之间相互合作,共同达成最优解;背叛是指参与者之间不合作,各自追求自身最大利益。
综合类理性人需要在合作与背叛之间做出权衡取舍,根据博弈的环境和对手的策略来选择合适的策略。
2.微笑与冷漠:微笑是指友好和善意的态度,冷漠是指不置可否的态度。
综合类理性人可以通过微笑和冷漠来传递信息,影响对手的行为。
博弈的分类方法和主要类型以下是 7 条关于博弈的分类方法和主要类型的内容:1. 合作博弈和非合作博弈呀!合作博弈就好比一群小伙伴一起搭积木,大家商量着怎么搭才能最高最稳,每个人都为了共同的目标努力,例子就是公司同事们合作完成一个大项目。
而非合作博弈呢,就像两个人抢玩具,都想着自己怎么才能拿到手,比如在商业竞争中,各个企业为了自己的利益争夺市场份额。
2. 静态博弈和动态博弈哦!静态博弈就如同一场拔河比赛,双方站定了位置就开始较劲儿,谁也不能临时改变策略,下棋就是一个典型的例子。
而动态博弈呀,就好像是玩躲猫猫,一方行动了,另一方根据对方的行动再做出反应,然后情况不断变化,谈恋爱时双方的互动就有点像动态博弈呢!3. 完全信息博弈和不完全信息博弈呀。
完全信息博弈就像是玩明牌的扑克牌,你清楚地知道所有的情况,比如考试时知道所有的题目和答案。
不完全信息博弈呢,则像蒙着眼猜东西,你只能知道一部分,那可就刺激啦!像在商业谈判中,双方可能并不完全了解对方的底线。
4. 零和博弈和非零和博弈呢!零和博弈不就是那种“不是你死就是我活”的局面嘛,就像两个人分一个苹果,一个人多了另一个人就少了,赌博有时候就是这样。
而非零和博弈可有意思了,像一起做蛋糕,大家一起努力把蛋糕做大,每个人都能分到更多,合作伙伴共同开拓市场就是这样呀!5. 连续博弈和离散博弈哟!连续博弈就好像是跑马拉松,一直跑一直跑,过程很漫长,股市里的长期投资就像这样。
离散博弈呢,就像短跑比赛,一下子就结束了,比如一次抽奖活动。
6. 对称博弈和非对称博弈呀。
对称博弈好比大家起点都一样,条件都相同,就像两个人进行公平的掰手腕比赛。
但非对称博弈可就不一样啦,可能一方强一方弱,这不就像拳击比赛中重量级别不同的选手对决嘛!7. 策略博弈和随机博弈呢!策略博弈就是要精心谋划,想好每一步怎么走,下象棋就是这样的例子呀。
随机博弈呢,有时候运气成分很大,就像抽奖,全看运气咯!我觉得博弈真的很神奇,不同的分类展现出不同的特点和魅力,在生活中到处都能看到博弈的影子,难道不是吗?让我们多去观察、多去思考,感受博弈带来的乐趣和挑战吧!。
8个生活中常见、常用的博弈策略1、最大最小收益策略。
即从最坏的可能性做准备,不放弃好的可能性。
从悲观的角度出发,从最小收益里取大。
仔细想想,生活、国际上的很多事情,都是这个策略所导致的现象。
2、最小最大收益策略使对方的最大收益最小化,这个策略也是广泛使用的。
尤其在国际上,1)比如印巴分治,破坏掉——自己撤退后、对方能取得的最大收益。
2)比如日本失落的30年,就是这个策略的现象。
3)比如中等收入陷阱,也是这个策略的现象。
4)南非的衰弱,也是这个策略的现象。
3、“人不犯我,我不犯人”的“以牙还牙”策略这是重复囚徒困境的最佳策略。
4、监督博弈(做老板必看)这是监督博弈的现象、用来减少监督成本,获取全局、个体最优。
比如1)三大件策略。
2)差一点点就够得着策略。
使用这个监督博弈模型,可以量化制定工资、收入策略。
也就是工资=用这个公式,就可以制定收入政策、管理政策,获得均衡,并取得全局收益最大。
所以,CEO的工资高,就好理解了吧,CEO有可能产生负贡献,但仍然要保证他的高工资,因为对他的监督难度超级大。
5、非升即走的策略这个策略也很有意思,在大学里经常使用。
在有些类型的企业里,也经常能遇到。
6、双寡头策略在生活里经常看到各个领域的双寡头,一家独大是危险的,此时应该培育对手,形成双寡头竞争的市场格局,才是最有利的。
7、重复博弈在重复博弈中,每次博弈的条件、规则和内容都是相同的, 但由于有一个长期利益的存在, 因此各博弈方在当前阶段的博弈中,适当通过让步达成合作。
这样就可以开发一个技巧,给对方营造出后续还有合作的判断,就能在这次合作中,让对方让步,使自己在本次合作中收益增大。
8、夏普里值假定,有一个三人财产分配问题:假定财产为1000万元,这1000万在三人之间进行分配。
A拥有45%的决定权,B拥有35%的决定权,C拥有20%的决定权。
规定,当超过50%的同意时,才能获得整个财产,否则三人将一无所获。
像这样的场景是很多,以这个夏普里值的计算方法,就可以知道各方的折衷点,并以此预测妥协达成的可能和所需要付出的代价、或者能争取的额外收益。
综合I类与II类理性人的博弈策略两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。
本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。
但本文没有对此进行严格的数学证明。
ﻫﻫ
在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征,即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。
在计算收益的时候,使用的是个人所得。
这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。
我们不妨把以追求相对所得最大化的行为人称为II 类理性人,并从博弈论的角度对他们的行为模式进行研究。
ﻫﻫ具有II类理性特征的现象在很多方面都有存在。
比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会
吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。
在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。
如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。
这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。
有研究表明,国际关系中这样的II类理性的例子更不少见。
这些虽然是比较极端的例子,现实生活中,更多的可能是,每个人或组织都会考虑自己的所得,并期望自己的所得比别人的大。
关键是对两种所得在考虑时的权数是随情况不同而变化的。
如果否定在策略选择中的II类理性因素,可能会对一些现象无法解释。
尽管从道德角度讲不值得提倡,而且从价值评判上总是受到谴责, 但作为一种存在的现象,仍然有必要加以研究。
但本文从II类理性个体的博弈战略开始,并过渡到一个综合了I类和II类理性行为的博弈模型,对例中设计的参与人的战略选择,只进行经济学分析而不做道义上的衡量。
ﻫ
当博弈参与者是II类理性人时, 此时收益矩阵的取值有一定的规律。
假设两个参与人甲和乙都是II类理性人时,对比在I类理性的得益矩阵(图1)ﻫﻫ
乙。