综合I类与II类理性人的博弈策略分析
- 格式:doc
- 大小:47.00 KB
- 文档页数:16
博弈论模型解析决策者理性选择与策略博弈论是一种研究决策者在相互依赖环境下进行决策的数学模型。
决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。
本文将介绍博弈论的基本概念,并解析决策者的理性选择和策略。
首先,我们来了解博弈论中的一些重要概念。
博弈论主要研究的是决策者的互动关系,其中包括决策者、策略和支付。
决策者是参与博弈的个体,可以是个人、组织或国家等。
策略是决策者进行决策的行动或方案。
支付是决策者从策略中获得的效益或成本。
决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。
决策者在选择策略时通常会考虑以下几个因素:自己的利益、对手的选择、对手的动机以及对手有关信息的了解程度。
理性决策者会选择能够最大化自己效益的策略。
决策者的理性选择基于博弈论中的均衡概念。
博弈论中的均衡是指决策者在相互依赖环境下做出的稳定决策。
常见的均衡概念包括纳什均衡、次序均衡和完全均衡等。
纳什均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者无法通过改变自己的策略来获得更大的效益。
次序均衡是指在博弈中,决策者的行动顺序是合理的,每个决策者的策略是对先前决策者行动的响应。
完全均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者对这些最优选择的预期与实际情况相符。
博弈论的最经典模型是囚徒困境。
囚徒困境是指两个犯罪嫌疑人之间的博弈,他们可以选择合作或背叛。
如果两人都选择合作,则会得到较轻的刑期;如果两人都选择背叛,则会得到较重的刑期;如果其中一人选择合作而另一人选择背叛,则背叛者会得到零刑期,而合作者会得到较重的刑期。
在囚徒困境中,每个囚徒都会选择背叛,因为他们认为对方也会选择背叛,这样才能避免得到较重的刑期。
然而,如果两人能够相互合作,他们将会得到较轻的刑期。
除了囚徒困境,博弈论还可以应用于许多其他领域。
例如,企业之间的价格竞争、国家之间的军备竞赛以及拍卖等都可以通过博弈论模型进行分析。
博弈论博弈论第⼀章完全信息⾮合作静态博弈例⼀囚徒困境本例⼦对奠定⾮合作博弈理论基础起着重⼤作⽤。
假定有两个嫌疑犯A 和B 作案后被抓住,关在不同审讯室审讯,他们部知道,如果两⼈都坦⽩各判刑8年,若两⼈都抵赖各判1年,若⼀⼈坦⽩另⼀⼈抵赖坦⽩者释放抵赖者判⼗年,下图给出本例的完整数学描述:囚徒B坦⽩抵赖坦⽩囚徒A抵赖(囚徒A ,囚徒B )基本假定:1) 两囚徒都是理性的;2) 两囚徒都了解对⽅是理性的;3) 两囚徒都了解在各种情况下审判后果的信息;4) 两囚徒都了解对⽅了解在各种情况下审判后果的信息。
研究问题:预测最终结果。
结论:从上表看出A 与B 同样是:不管对⽅采取什么⾏动,坦⽩都是最优的,因⽽两囚徒若满⾜上述条件他们所采取的⾏动都是坦⽩。
(坦⽩,坦⽩)称为本博弈的均衡解。
从上述模型中看出,如果两⼈都选择抵赖,对两⼈都是最好的,但结果-8,-8 0,-10-10,0-1,-1他们只能选择较差的结果,都坦⽩,不论他们事先如何订⽴攻守同盟都⽆效,原因出在上述四点假设上。
囚徒困境表现为个⼈理性压倒集体理性。
例⼆智猪博弈猪圈有两头理性的智猪,⼀头⼤猪,⼀头⼩猪。
猪圈⼀头放着⾷,另⼀头有⼀按钮,供智猪⾷供应。
按⼀下按钮会有10单位猪⾷进糟,但谁按谁就要付出2单位代价。
若⼤猪先到、⼤猪吃到9单位,⼩猪吃到1单位,若同时到⼤猪吃到7单位,⼩猪吃到3单位,若⼩猪先到,⼤猪吃到6单位,⼩猪吃到4单位。
本问题可⽤下形式表⽰:⼩猪按等待按⼤猪等待(⼤猪,⼩猪)基本假设:与囚徒困境相同,即理性⼈假设和完全对称信息假设。
问题分析:很显然⼩猪的最优策略是等待,⼤猪很清楚⼩猪最优策略是等待,⽽且必然采取等待⾏动,那么⼤猪的策略是按,于是其结果必然是⼤猪按⼩猪等待。
(⼤猪按,⼩猪等待)为本博弈均衡解。
5,1 4,4 9,-1 0,0智猪问题本质:在合作共事中谁享受成果多谁多出⼒。
三、基本概念包括:参与⼈、⾏动、信息、战略、⽀付(效⽤)、结果、均衡。
综合I类/II类理性人的博弈策略[摘要]两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。
本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。
但本文没有对此进行严格的数学证明。
[关键词]I类理性,II类理性,混合战略,战略选择,不确定性在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征, 即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。
在计算收益的时候,使用的是个人所得。
这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。
我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对他们的行为模式进行研究。
具有II类理性特征的现象在很多方面都有存在。
比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。
在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。
如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。
这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。
有研究表明,国际关系中这样的II类理性的例子更不少见。
1、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
综合类理性人的博弈策略在博弈论中,理性人的博弈策略是指在一定的博弈环境下,参与者为理性人,根据自身的利益最大化来选择合适的行为策略。
综合类理性人指的是在博弈环境中具有多种不同利益考量的参与者,他们会综合考虑各种因素来做出最佳的决策。
本文将从博弈论的角度出发,探讨综合类理性人在博弈中的策略选择。
博弈论基础概念在博弈论中,博弈是指两个或多个决策者在特定情况下做出决策的过程。
博弈过程中每个决策者都会考虑其他决策者的行为对自己可能产生的影响,然后选择最有利于自己的策略。
博弈论主要研究参与者之间的互动关系和最优策略的选择。
综合类理性人的特点综合类理性人在博弈中的特点是具有多种不同的利益考量,他们不单独追求某一方面的利益最大化,而是需要综合考虑多种因素来做出决策。
这种综合性的考量往往使得他们的决策更加复杂,需要综合考虑各种因素的权衡。
策略选择的依据综合类理性人在博弈中选择策略的依据主要包括以下几个方面:1.利益最大化:在博弈中,参与者的最终目的是追求自身的利益最大化,所以在选择策略时需要考虑如何能够最大化自己的利益。
2.对手的策略:综合类理性人需要考虑其他参与者可能采取的策略,以便更好地应对对手的举动。
3.博弈环境:博弈的环境包括参与者的数量、信息的透明度、博弈的次数等,这些都会对策略选择产生影响。
4.风险偏好:不同的人在面对风险时的偏好程度不同,综合类理性人需要考虑自己的风险偏好程度来选择最合适的策略。
综合类理性人的博弈策略在博弈中,综合类理性人可以采取多种策略来最大化自己的利益。
下面将介绍几种常见的博弈策略:1.合作与背叛:合作是指参与者之间相互合作,共同达成最优解;背叛是指参与者之间不合作,各自追求自身最大利益。
综合类理性人需要在合作与背叛之间做出权衡取舍,根据博弈的环境和对手的策略来选择合适的策略。
2.微笑与冷漠:微笑是指友好和善意的态度,冷漠是指不置可否的态度。
综合类理性人可以通过微笑和冷漠来传递信息,影响对手的行为。
博弈论知识总结博弈论概述:1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。
2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。
2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
博弈的分类方法和主要类型以下是 7 条关于博弈的分类方法和主要类型的内容:1. 合作博弈和非合作博弈呀!合作博弈就好比一群小伙伴一起搭积木,大家商量着怎么搭才能最高最稳,每个人都为了共同的目标努力,例子就是公司同事们合作完成一个大项目。
而非合作博弈呢,就像两个人抢玩具,都想着自己怎么才能拿到手,比如在商业竞争中,各个企业为了自己的利益争夺市场份额。
2. 静态博弈和动态博弈哦!静态博弈就如同一场拔河比赛,双方站定了位置就开始较劲儿,谁也不能临时改变策略,下棋就是一个典型的例子。
而动态博弈呀,就好像是玩躲猫猫,一方行动了,另一方根据对方的行动再做出反应,然后情况不断变化,谈恋爱时双方的互动就有点像动态博弈呢!3. 完全信息博弈和不完全信息博弈呀。
完全信息博弈就像是玩明牌的扑克牌,你清楚地知道所有的情况,比如考试时知道所有的题目和答案。
不完全信息博弈呢,则像蒙着眼猜东西,你只能知道一部分,那可就刺激啦!像在商业谈判中,双方可能并不完全了解对方的底线。
4. 零和博弈和非零和博弈呢!零和博弈不就是那种“不是你死就是我活”的局面嘛,就像两个人分一个苹果,一个人多了另一个人就少了,赌博有时候就是这样。
而非零和博弈可有意思了,像一起做蛋糕,大家一起努力把蛋糕做大,每个人都能分到更多,合作伙伴共同开拓市场就是这样呀!5. 连续博弈和离散博弈哟!连续博弈就好像是跑马拉松,一直跑一直跑,过程很漫长,股市里的长期投资就像这样。
离散博弈呢,就像短跑比赛,一下子就结束了,比如一次抽奖活动。
6. 对称博弈和非对称博弈呀。
对称博弈好比大家起点都一样,条件都相同,就像两个人进行公平的掰手腕比赛。
但非对称博弈可就不一样啦,可能一方强一方弱,这不就像拳击比赛中重量级别不同的选手对决嘛!7. 策略博弈和随机博弈呢!策略博弈就是要精心谋划,想好每一步怎么走,下象棋就是这样的例子呀。
随机博弈呢,有时候运气成分很大,就像抽奖,全看运气咯!我觉得博弈真的很神奇,不同的分类展现出不同的特点和魅力,在生活中到处都能看到博弈的影子,难道不是吗?让我们多去观察、多去思考,感受博弈带来的乐趣和挑战吧!。
博弈是一些个体,面对一定的环境,在一定的规章制度下,同时或先后,一次或多次在其允许的策略集中选择其行为并加以实施,最终获得一定结果的过程博弈论从衡量利弊得失的角度出发,分析形势得出相应的对策,在决策的过程中考虑到参与的其他人的行为会相互影响的决策者,需要博弈论,决策中不考虑他人的行为的决策者不需要博弈论。
博弈论通常记为G或Γ,局中人的集合通常为N,为局中人n,局中人的策略集记为S,则某一策略记为αi,局中人i的策略组合为(αi,α-i),其中α-i表示局中人i以外所有人的策略组合。
局中人的收益U是α的函数,则博弈也记为G(N,S,U),若考虑信息则是G(N,S,U,I)上策均衡:每个人都有上策,博弈时必取上策,形成的均衡为上策均衡。
囚徒困境:对每一行在第二个分量中划线,即甲策略不变时乙的策略。
反之亦然两人都有上策均衡,亦为纳什均衡智猪博弈:有一开关,大猪小猪都按,则大猪得7单位,小猪得3单位;大猪按,小猪不按,大猪得6单位,小猪得4单位;小猪按,大猪不按,大猪得9单位,小猪得1单位;但是按一下会消耗2单位(此处隐含条件,两者都不按则无收益与支出)。
此时小猪有上策[不按],但是大猪无上策——小猪选择不同,大猪选择也相应不同。
此时(大猪,小猪)的纳什均衡为(按,不按)此情境可推广至投资机构与散户的投资行为。
机构研究市场动向,之后散户跟风。
娱乐博弈:甲爱象棋,乙爱围棋,甲乙一起下象棋,甲得5,乙得2;甲乙一起下围棋,甲得2,乙得5;但是两人选择不同则游戏无法开始。
两人均无上策,(甲,乙)的纳什均衡为(象,象)或(围,围)便士博弈:甲乙同时放一枚硬币,如同面则乙给甲1块钱,如异面则甲给乙1块钱此题不存在纯策略静态博弈的纳什均衡,但有混策略均衡。
混策略的原则是做出某种概率,使对方的收益无差异。
设甲取正概率为p,可写出乙的期望收益,欲使乙无差异,则p=0.5;同样,对乙的选择亦如此。
定理:任意有限博弈必定存在一纳什均衡。
个体与群体的博弈论分析在社会生活中,个体与群体的博弈论关系一直存在,尤其在当今社会,随着经济竞争的加剧和科技进步的不断推进,这种关系变得更加复杂。
本文从博弈论的角度出发,对个体与群体的博弈论进行分析。
一、博弈论的基本理论博弈论是研究人类博弈活动的数学理论,它关注的是每个参与者的利益与策略选择,以及这些选择对博弈结果的影响。
在博弈论中,每个参与者的决策都会受到其他参与者决策的影响,因此需要考虑对手的策略。
博弈论研究问题的一般步骤可以概括为:确定参与者、确定参与者可用的策略,制定一个规则,然后通过计算可以得到博弈的结果。
二、个体对群体的影响在现代社会中,个体对群体的影响非常巨大。
一个人的选择往往影响到整个群体的生活。
例如,一个人在城市中选择不开车,而是乘坐公共交通工具,可以降低城市的交通拥堵和空气污染;逆之,如果一群人动辄开车而不乘坐公共交通工具,那么城市可能面临交通困境和空气污染问题。
在这种情况下,由于群体中每个人的选择都会影响到整个群体,在选择时个体必须考虑到自己的影响力,以及自己的选择是否符合群体的利益。
因此,个体需要了解群体中其他人的行为,并协调自己的行为,以达到最优的结果。
三、合作与竞争在群体中,合作和竞争是个体之间最常见的相互作用。
在合作中,各个个体共同行动以实现一个共同目标。
在竞争中,个体之间有不同的目标和利益,并且为了实现这些目标和利益而相互对抗。
在博弈论中,合作和竞争被视为不同类型的游戏。
在合作游戏中,个体必须协调行动,以达到合作目标,例如团队合作和合作式学习。
在竞争游戏中,个体必须尽可能地占据优势,以实现自己的目标,例如市场竞争和选举竞争。
合作和竞争之间的差异使个体必须选择不同的策略,并考虑到其他个体的策略。
四、博弈论在个体与群体关系中的应用在个体与群体关系中,博弈论可以用于分析各种不同的问题。
例如,在团队合作中,博弈论可以用于分析如何协调团队成员的行为,以实现团队目标。
在市场竞争中,博弈论可以用于分析如何与竞争对手博弈,以实现市场份额的最大化。
博弈论信息结构分类博弈中的每一个参与人都是工具理性“每一个参与人都是工具理性”是每一个人的共识每一个参与人都充分了解博弈的规则理性人假设:理性人有一个明确的偏好(任意两件事物都可以进行比较,比较过程中偏好保持一致性);在约束条件下,理性人总是追求偏好最大化;理性人假设中,个体是具有完全理性的,即具有完美的认知和决策能力,不会犯错偏好具有连续性,物品所能带来的满足程度是连续的,不会跳跃的,所以可以用一个连续的效用函数进行衡量(Remark:价值理性与工具理性:价值理性指有正确的价值观,动机一定会纯正,同时也会采用正确的手段来实现自己想要的目标,无论结果如何;而工具理性指为达目的不择手段,参与者的行为从自身效用最大化的角度出发,漠视人的情感和精神价值)参与人:博弈中的决策主体,参与人记为,参与人的集合记为,若共有n个参与人,则,参与人参与决策是为了让自身效用最大化(另:虚拟参与人:“自然”、“上帝”——不以参与人的意志为转移的外生事件,虚拟参与人的选择体现为外生事件的各种可能现象,并用概率分布来描述“自然”的选择机理)为方便讨论,把参与人之外的其他参与人记为,虚拟参与人\自然记为。
单人博弈已经退化为了最优化问题进行处理,对单人博弈而言掌握的信息越多,所能获得的收益越大。
双人博弈并不总是对抗的,双人博弈也包括合作的情况,与单人博弈不同,双人及以上博弈中,参与者掌握的而信息越多并不能保证所得到去的收益越多;个人理性并不一定能导致集体条理性(囚徒困境);多人博弈(大于等于3)中可能出现破坏者——做损人不利己之事。
行动:行动是参与人在决策时可供选择的动作,一般用表示第个参与人的特定行动,表示可供参与者选择的行动集合,行动可以是连续的也可以是离散的。
个参与人的行动的有序集合称为行动组合。
行动是具有顺序的:同时行动或先后行动,行动的顺序对行动结果至关重要。
静态博弈指参与人同时选择行动的博弈动态博弈指参与人先后选择行动的博弈(Remark:"同时"指的是信息概念,如果参与者在决策过程中不知道对方的选择,那么不管是否是同一时间进行的决策都是静态决策)信息:信息是指在博弈当中,参与人有关该博弈的知识:自然的选择,其他参与人的策略集合、支付函数、行动时间等。
理性与感性的博弈与结合人类思维的两个主要驱动力是理性和感性,在日常生活中它们常常发生角力。
理性是一种基于逻辑和事实的思维方式,它使我们能够分析问题、做出决策和解决难题。
感性则是情感和直觉的表达,它使我们能够体验和表达内心的情感和欲望。
然而,理性与感性之间的关系并不是简单的对立,而是一种相互影响、相互补充的关系。
在本文中,我将探讨理性与感性的博弈与结合,以及它们对我们的思考和行为的影响。
在决策过程中,理性往往被认为是最重要的因素。
它使我们能够以客观的方式分析和评估现实情况,并选择最佳的解决方案。
当我们面临挑战和抉择时,理性会帮助我们保持冷静和理智,避免情绪和个人偏见的干扰。
例如,当我们在职场上遇到困难时,理性思维能够帮助我们找到最有效的解决方法,而不是被情绪或个人喜好所左右。
然而,理性也有其局限性。
在某些情况下,过度强调理性可能使我们忽视了一些重要的信息和决策因素。
感性思维则能够补充这一不足。
感性不仅是我们对世界的感受,也是我们对自己内心的洞察。
通过感性思维,我们能够更好地理解自己的情感和需要,从而更好地与他人沟通和相处。
感性还能够激发我们的创造力和想象力,帮助我们发现新的解决方案和创新。
理性和感性之间的博弈可以在艺术和美学领域中得以体现。
艺术作品往往同时具有理性和感性的元素。
理性在艺术作品中体现为形式和结构的组织,而感性则是作品所传递的情感和意义。
例如,一部音乐作品可能有精确的音符和和弦的排列(理性),但它的音乐旋律和情感表达(感性)才是触动人心的关键。
同样地,一幅绘画作品可能有准确的画笔技巧和色彩运用(理性),但它所呈现的主题和情感(感性)才是吸引观众的核心。
理性和感性的结合也在人际关系中起到重要的作用。
当我们与他人交往时,理性使我们能够思考和分析对方的言行,从而更好地理解他人,并建立起有效的沟通和合作。
但感性也是构建亲密关系和情感共鸣的基础。
通过感性,我们能够表达自己的情感和关怀,与他人建立起深入的情感联系。
综合I类与II类理性人的博弈策略两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。
本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。
但本文没有对此进行严格的数学证明。
在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征, 即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。
在计算收益的时候,使用的是个人所得。
这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。
我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对他们的行为模式进行研究。
具有II类理性特征的现象在很多方面都有存在。
比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。
在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。
如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。
这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。
有研究表明,国际关系中这样的II类理性的例子更不少见。
这些虽然是比较极端的例子,现实生活中,更多的可能是,每个人或组织都会考虑自己的所得,并期望自己的所得比别人的大。
关键是对两种所得在考虑时的权数是随情况不同而变化的。
如果否定在策略选择中的II类理性因素,可能会对一些现象无法解释。
尽管从道德角度讲不值得提倡,而且从价值评判上总是受到谴责, 但作为一种存在的现象,仍然有必要加以研究。
但本文从II类理性个体的博弈战略开始,并过渡到一个综合了I类和II类理性行为的博弈模型,对例中设计的参与人的战略选择,只进行经济学分析而不做道义上的衡量。
当博弈参与者是II类理性人时, 此时收益矩阵的取值有一定的规律。
假设两个参与人甲和乙都是II类理性人时,对比在I类理性的得益矩阵(图1)乙S1 S2甲S1 (m1,n1) (m2,n2)S2 (m3,n3) (m4,n4)图1.I类理性参与人收益矩阵II类理性参与人的得益矩阵如下图所示:乙S1 S2甲S1 (m1-n1,n1-m1) (m2-n2,n2-m2)S2 (m3-n3,n3-m3) (m4-n4,n4-m4)图2.II类理性参与人收益矩阵很明显,在II类理性参与人进行的博弈里,在每一个战略组合下,双方的得益之和必为零,此时的博弈具有零和的性质。
这就是早期博弈论中重点研究的二人零和博弈的情形,在1910年~1930年间, 作为绝对竞争的形式,零和博弈被认为是博弈理论中的主要形态得到了深入的研究。
而且对零和博弈的研究成果成为了现代博弈理论中很多新理论的基础概念。
作为一个练习,我们把常见博弈模型改为零和博弈情形,来看相应的结果会是怎样的。
一般认为,零和博弈是一种常和博弈,而最普遍意义下的博弈情形是非常和的。
例1.囚犯困境甲,乙涉嫌同谋犯罪,分别在两个房间被提审。
提审官预先向两人交代政策:如果他们都承认犯罪事实,各判刑10年;如果两人都否认,双方都无罪释放;如果一方认罪一方抵赖,认罪方获500元奖励,抵赖方被判15年。
在非零和博弈情形下的支付矩阵如下:乙承认抵赖甲承认(-10,-10) (5,-15)抵赖(-15,5) (0,0)图3纳什均衡策略是(承认,承认),如果甲乙两人是II类理性人,他们的相应支付矩阵就变成了:乙承认抵赖甲承认(0,0) (20,-20)抵赖(-20,20) (0,0)图4可以看出,纳什均衡策略还是(承认,承认)。
例2.春节前夕,某小镇上两个商铺甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来卖,购货款加上运输费共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺也同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。
对于甲乙都是I类理性人而言,有支付矩阵:乙进货不进货甲进货(-1000,-1000) (1000,0)不进货(0,1000) (0,0)图5(不进货,进货)和(进货,不进货)为纳什均衡策略。
但是问题在于,甲乙双方同时行动,而互相不知道对方采取的行动。
如果甲乙都是II类理性人,那么情况会变成:乙进货不进货甲进货(0,0) (1000,-1000)不进货(-1000,1000) (0,0)图6此时的纳什均衡策略就是(进货,进货)。
例3.利己与利他甲乙作为I类理性人,其支付矩阵为乙利己利他甲利己(1,1) (4,0)利他(0,4) (3,3)图7纳什均衡是(利己,利己);甲乙作为II类理性人,其支付矩阵转化为:乙利己利他甲利己(0,0) (4,-4)利他(-4,4) (0,0)图8纳什均衡仍然是(利己,利己)。
例4.智猪博弈一头大猪和一头小猪被关在同一个猪圈里。
猪圈的一头安装着一个特制的按键,另一头安装着一个食槽。
但一头猪按下按键时,会有10单位的食物进入槽中,但按键的猪会付出2单位的成本;如果大猪先到食槽,则小猪只能吃到1单位的残羹剩饭;但若小猪先到的话,则它能吃到4单位的食物。
若两猪同时到,则小猪可吃到3单位的食物。
如果按照I类理性,有支付矩阵:小猪按键等待大猪按键(5,1) (4,4)等待(9,-1) (0,0)图9纳什均衡策略是(按键,等待)。
在II类理性下,重写支付矩阵为:小猪按键等待大猪按键(4,-4) (0,0)等待(10,-10) (0,0)图10纳什均衡是(按键,等待)和(等待,等待)。
有趣的是,此时小猪一定会选择等待(占优战略),而大猪无论怎么做,都是一无所获!最终结果是两头猪都会饿死。
在这种情况下,两头猪的结局似乎和“布里丹的饥饿的驴”有共同点,后者因为面对同样两堆干草不能做出选择而饿死。
在智猪博弈里,小猪认为自己的结果只能是损失或者既无损失又无所得,这时它会选择后者,而将责任推给大猪。
现实中,不大可能出现两猪都饿死的结果,因为大猪最终会明白,与其被饿死还不如去按键,此时自己会得到4单位的食物;而小猪也会因为大猪作出这样的选择,而同样得到4单位的食物。
例5.性别战两个恋人,男方想看拳击,女方想看芭蕾。
如果需要的话,他们会牺牲自己的爱好而迁就对方。
有下面的支付矩阵:女拳击芭蕾男拳击(2,1) (0,0)芭蕾(0,0) (1,2)图11纳什均衡是(拳击,拳击)和(芭蕾,芭蕾)。
将支付矩阵做个变换:女拳击芭蕾男拳击(1,-1) (0,0)芭蕾(0,0) (-1,1)图12那么,(拳击,芭蕾)就是纳什均衡策略。
例6.斗鸡博弈两个人举着火棍从独木桥两端向中间前进,每个人都有两种战略:前进或退下阵来。
若两人都继续前进,则两败俱伤;如果一方前进,另一方退下来,前进者取得胜利,退后者丢了面子;若两人都退了下来,则都丢了面子。
支付矩阵如下:A进退B 进(-3,-3) (2,0)退(0,2) (0,0)图13纳什均衡策略是(进,退)和(退,进);按II类理性对支付矩阵进行变换后得:A进退B 进(0,0) (2,-2)退(-2,2) (0,0)图14纳什均衡策略是(进,进)。
在上面的讨论中,可以看到,在例2中,对于I类理性参与人,(不进货,进货)和(进货,不进货)都是纳什均衡策略,采取哪个战略要取决于对方的行动,在一次静态博弈中是很难在行动之初就了解到对方的战略的,因此存在选择上的不确定性。
在智猪博弈中,对于II类理性参与人而言,不能根据支付矩阵决定出大猪的战略,如何才能避免在选择时出现这样的不确定状态呢?有必要考虑某种混合战略。
一般来讲,博弈的每个参与者在某些时间会按I类理性人行为模式行事,而有时又会采用II类理性人模式行事。
不妨将这种组合看成是决定于概率p和q。
这时候,假设甲遵循I 类理性的概率是p,那么他是II类理性人的概率就是1-p,乙遵循I类理性的概率是q,相应他是II类理性人的概率是1-q。
这时我们也可以构造出一种混合战略,得到支付矩阵:乙S1 S2甲S1 m1-(1-p)n1,n1-(1-q)m1 m2-(1-p)n2,n2-(1-q)m2 S2 m3-(1-p)n3,n3-(1-q)m3 m4-(1-p)n4,n4-(1-q)m4图15对于I类理性可以看作p=1,q=1时的上述混合战略的一个特例;而II类理性对应p=0,q=0的情况。
在现实中,还可能出现另一种情况,也就是甲乙两个参与者中,一方是I类理性的,而另一方是II类理性的,为方便起见,我们假设甲是I类理性人,乙为II类理性人,那么支付矩阵具有下面一般形式:乙S1 S2甲S1 (m1,n1-m1) (m2,n2-m2)S2 (m3,n3-m3) (m4,n4-m4)图16这其实是在p=1,q=0时,混合战略的一个特殊情况。
对于上述常见博弈案例,在这种情况下进行演绎,相应也会得到一些有趣的结果。
例1.囚犯困境乙承认抵赖甲承认(-10,0) (5,-20)抵赖(-15,20) (0,0)图17纳什均衡策略仍是(承认,承认);例2.进货与不进货乙进货不进货甲进货(-1000,0) (1000,-1000) 不进货(0,1000) (0,0)图18纳什均衡策略是(不进货,进货)。
例3.利己与利他乙利己利他甲利己(1,0) (4,-4)利他(0,4) (3,0)图19纳什均衡策略仍是(利己,利己)。
例4.智猪博弈小猪按键等待大猪按键(5,-4) (4,0)等待(9,-10) (0,0)图20纳什均衡策略是(按键,等待)。
例5.性别战女拳击芭蕾男拳击(2,-1) (0,0)芭蕾(0,0) (1,1)图21纳什均衡策略是(芭蕾,芭蕾)。
例6.斗鸡博弈A进退B 进(-3,0) (2,-2)退(0,2) (0,0)图22纳什均衡策略是(退,进)可以发现,在多数情况下,II类理性人的结果都好于I类理性人。
现在使用如图15的混合战略,看看在例2,性别战,斗鸡博弈和智猪博弈中,战略的选择情况:在例2中,为方便起见,将原支付矩阵先转换成:乙进货不进货甲进货(-1,-1) (1,0)不进货(0,1) (0,0)图23再设甲乙为I类理性的概率为p,q:乙进货不进货甲进货(-p,-q) (1,q-1)不进货(p-1,1) (0,0)图24可以看到(进货,不进货)是一个可能的均衡策略,但若要使其成为唯一的纳什均衡,还应该要求q-1>-q,即q>1/2。