博弈论分析报告:重复博弈现象分析
- 格式:doc
- 大小:27.00 KB
- 文档页数:3
一个社会的诚信高低标志该社会文明程度的高低。
人们对诚信的社会价值早就有所认识。
诚信在中国自古即为修身立国之根本。
“人而无信,不知其可也”,两千多年前的孔老夫子就这样断言,强调诚信是个人修身立命的基本道德准则。
战国时商鞅相秦,曾有南门立木的故事,说明诚信对推行法律、政策,建立强国的重要性。
当今社会也非常关注诚信的话题。
特别是企业诚信的问题,诚信不仅关系到我国企业在现代市场经济环境下能否健康成长,而且由于企业在经济运行中的特定作用和地位,也更加关系和影响着我国社会主义市场经济制度的发展和完善。
在我国现阶段经济转轨期间,诚信在经济生活中的作用显得更加重要。
诚信虽然不像物质产品那样会给企业带来直接利润,但它是一种企业资源,对企业的长远发展有着巨大的促进作用。
就目前的中国市场而言,消费者对诚信的重视程度越来越高,包括企业的产品,企业的外在形象。
在现实的经营活动中,有些企业经营确实不讲诚信,存在着大量的诚信问题。
假酒、毒大米、毒狗肉、鹅毛充羽绒……这一切的一切,都归结于 4个字:诚信缺乏。
缺乏诚信的代价是巨大的。
企业失信等欺诈行为,不仅影响企业发展、危害社会,而且极大地增加了经济生活中的交易成本、败坏了商业风气和市场环境,影响到企业,甚至一国的经济发展。
因此,企业的诚信建设刻不容缓。
一、博弈论与诚信建设诚信问题的表现是道德水平,但是大量的事实表明,市场竞争中每一个追求白利的人(自然人或法人)不会天然的讲诚信,关键是要有一个当事人讲诚信的收益大于不讲诚信所付的成本的制度或机制。
因此,我们认为,诚信也许跟文化、社会、心理等因素有关,但更重要的是,诚信往往是人们基于利益需要的一种策略选择的结果,而不是基于心理需要的道德选择。
因此,可把博弈论作为诚信建设的分析工具。
博弈论,英文是gametheory,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的,也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。
博弈论读书笔记(五)重复博弈2.3重复博弈从这⾥开始,就进⼊博弈论⽐较难以理解的地⽅了。
我也不跟着书上的章节⾛,根据⾃⼰的理解和书上的例⼦来写,如果理解有什么不对的地⽅,欢迎各位⼤佬的指正。
⾸先我们来明晰博弈论到底在讨论些什么:对于这个问题,前⾯⼏章的内容可能对⼤家会造成⼀定的误导。
因为根据前⾯⼏章的例⼦,我们可以很容易地认为,博弈论就是在讨论在某个规则下,参与者最优的策略和参与者之间达到的平衡。
这句话本⾝没有错误,但是我们很容易理解为:这个平衡是像最开始那两个囚徒⼀样,选择“保证对⽅不会背叛并且⾃⼰在此情况下能获得最⼤利益”的战略所达到的平衡(这句话有点难以理解,不过我相信你能明⽩我的意思)。
例如第⼀章第⼀节中囚徒困境双⽅都选择招认(因为选择合作即不招认,结果可能是被背叛)。
但是⼀旦进⼊了重复博弈那么我们就不能只考虑眼前的利益(即保守地只去选择单次博弈的纳什均衡),⽽要考虑多次重复博弈的总收益。
这个时候就需要参与双⽅共同商定⼀个“协议”(例如双⽅说好都选择不招认),这个协议必须是对于双⽅都有利的(⾄少由于选择单次博弈的纳什均衡,例如双⽅不招认总⽐双⽅都招认要好),并且协议中会对不遵守规则的进⾏惩罚,以便于对每个⼈来说选择合作是最好的结果。
从这⾥我们就可以理解“博弈论教你如何制定规则的”这句话了。
好了,这⼀章最核⼼的思想在这⾥已经讲完了,虽然我可能说的不是那么清晰,不过还是希望你能认真理解上⾯所说的,这会对下⾯的概念理解有很⼤帮助。
2.3.A两阶段重复博弈先给出⼏个先⾏的定义和定理:定义:对个定的阶段博弈G,令G(T)表⽰G重复T次的有限重复博弈,并且在下⼀次博弈开始前,所有以前的博弈都可以被观测到。
G(T)的收益为T次阶段博弈收益的简单相加。
这个定义最重要的是引出⼀个重复博弈中收益的概念,即T次博弈的收益简单相加,后⾯我们会提到贴现的概念,不过到这⾥先理解到简单相加就⾏。
定理:如果阶段博弈G有唯⼀的纳什均衡,则对任意有限的T,重复博弈G(T)有唯⼀的⼦博弈精炼解:即G的纳什均衡结果在每⼀阶段重复进⾏。
重复博弈现象分析作者:段俞戎来源:《科技视界》2016年第24期【摘要】囚徒困境这一现象在日常决策中越来越常见,这是一种博弈心理的体现,同时,为减弱囚徒困境的影响,在很多情况下人们采用重复博弈这一方法。
为了确切证明博弈这种现象的真实存在并分析其发生机制,实验选取山东师范大学24名学生进行相关实例的测验,并对数据进行比较分析,得出结论:重复博弈中人们确实更倾向于选择合作策略,但是在高收益面前,人们也有可能会选择背叛。
【关键词】囚徒困境;博弈;风险与收益0 引言决策中的博弈论与博弈心理在当今时代越来越受到重视,对其的研究也有利于深入了解人们的决策心理并理解人们某些行为背后的实际意义。
博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化并权衡不同决策主体之间决策的的过程。
简单说就是人与人之间为了谋取利益而竞争。
在博弈论中,以“囚徒困境”博弈模型最为著名。
该模型讲述了一个警察与小偷的故事。
两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。
警察知道两人有罪,但缺乏足够的证据。
警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
于是,每个囚徒都面临两种选择:坦白或抵赖。
然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。
根据上述描述,我们可以知道两人同时选择抵赖对于共同利益来说是最好的。
而在多项研究中都表明,很少有人会选择抵赖而与对方达成合作并得到最优效果。
这就是囚徒困境的存在,为了自己的利益达到最大化,大多数人会选择背叛而非合作。
囚徒的两难境地确实抓住了自己效益最大化、不信任和需要相互防范背叛这种真实的一面。
博弈论分析报告
重复博弈现象分析
现代经济学里,博弈论(GameTheory,又名对策论)已经成为十分标准的分析工具。
而完全信息静态博弈是一种最简单的博弈,重复博弈则是完全信息静态博弈论的一种进化。
重复博弈有下列三项基本特征:阶段博弈之间没有“物质上”的联系,即前阶段的博弈不改变后一阶段的结构;所有参与人都观测到博弈过去的历史;参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。
在博弈论课堂所做的两人重复博弈作业,属于多轮次的典型囚徒困境博弈。
根据囚徒困境的说法,个人最佳选择为不合作(招供)时可以达到纳什均衡,然而却达不到都合作(不招供)时的个人利益最大化。
因此,如何获得全部的信息在重复博弈的环境中显得至关重要。
这一点,从课堂同学们的决策中可以明显的看出来。
正是由于每一轮博弈后可以根据其结果来修正下一轮的选择,在经过几轮的信息交换后,大家基本可以明确博弈双方的态度,在一方释放合作意愿的情况下,采取合作态度(不招供)的人数会大幅度上升,带来双方收益的上升。
相反,在发现博弈对手采取不合作的情况下,自己往往会采取“以牙还牙,以眼还眼”的跟随策略,双方最终陷入多轮的囚徒困境,收益也会大为减少。
从同学们提交的数据中可以明显看出这一情况。
另一方面,在10轮的博弈过程中,随着轮次的增加,双方的信息越来越清楚,采取合作态度的博弈者就越多,在后几轮可以稳定的达到70%以上,说明重复博弈的情况下,单次博弈经常出现囚徒困境现象会得到明显改善。
在现实生活中,单次的囚徒博弈情况其实比较少见,而重复博弈的情况则比较普遍,因此研究重复博弈对于我们的工作生活有着更加明显的指导意义。
其中,一个比较常见的重复博弈现象就是电商和网购。
网购双方形成了与囚徒博弈类似的博弈情况:买方和卖方都可以选择诚信和不诚信,对于单次博弈的情况,选择
不诚信总是可以带来更大的效益,双方都不诚信的情况下,交易无法完成,双方利益没有损失。
而在一方诚信另一方不诚信的情况下,诚信一方会蒙受损失。
但是另一方面,网购又不是一次性的博弈,网购总是倾向于多次发生,尤其是在卖家选择诚信策略时,买家可能会与卖家建立长期的合作关系。
而且基于第三方电商平台(如淘宝)的交易信息是公开的,我们可以假设所有潜在的买家都可以完全看到该信息,这些潜在的买家完全可以被视为同一个买家。
对于重复博弈模型,我们添加如下的假设条件:交易一方首先选择信任;如果交易的另一方选择诚实守信,则交易一方在下一阶段博中即选择信任;如果在某个阶段博弈一方选择欺骗,则交易的另一方将永远选择不信任。
当卖家一直保持诚信的期望得益要大于他一次不诚信而获得的得益时,他将会在每次交易中都保持诚信的策略。
当卖家一直保持诚信时,买家就会跟卖家建立长期的合作关系。
在这种情况下,则卖家会一直采用诚信策略,博弈的双方最后的策略都将是买家购买商品,卖家一直保持诚信,这就是重复博弈产生的信用机制。
重复博弈促进了电商的发展。
根据以上推导过程,我们可以更进一步进入归纳,从重复博弈的角度来看,可以采取以下措施来促进博弈双方的合作,从而推动电商的健康发展:第一,加强监管,加大惩罚的力度。
政府部门或者第三方电子商务平台应加强对交易的监管。
只有加强建管力度,提高发现不诚信的概率,才能使交易者诚实守信,增大交易的概率。
要让守信用者和不守信用者都能很快地发现双方守信或不守信的条件和规律,并建立有效的惩罚机制,此时,交易者就会衡量守信和不守信收益的大小,视违约成本的大小而相应地改变其行为。
第二,建立良好的信息机制。
信息是市场交易者是否守信的重要基础,在复杂多变的市场交易中,市场信息量增大,且信息的不对称性使市场交易的不确定性增加。
因此,建立一个真实、高效的信息传递机制,将成为约束失信行为产生的关键。
可以通过建立交易信息数据库,保留所有交易的数据,为将来的交易双方提供参考依据,同时也促进了交易双方的博弈向着重复博弈方向进化。
第三,建立健全、完善的信用法律体系。
健全、完善的信用法律体系,是保证上述条件实现的重要前提。
必须加快电商信用体系的建立,才能从根本上抑制失信行为,使守信成为市场交易者理性的选择,为电商的发展营造一个良好的社
会环境。