当前位置:文档之家› 行为博弈分析

行为博弈分析

行为博弈分析
行为博弈分析

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

寿险代理人道德风险行为研究

寿险代理人道德风险行为研究 摘要:引入代理人制度以后,中国寿险业取得了很大发展。由于信息不对称的存在,寿险代理人道德风险行为呈逐年上升的趋势,给保险公司带来不必要的损失,甚至影响了保险业的声誉。本文列举了目前常见的代理人道德风险行为,分析了这些行为的原因并做了静态的博弈分析,在此基础上提出了减少代理人道德风险行为的对策建议。 关键词:寿险代理人道德风险博弈 1992年,随着美国友邦保险公司在上海的开业,一种全新的保险营销制度——代理人制度进入了中国寿险业。个人代理制的引入,对我国寿险近20年的发展起到了举足轻重的作用。在国人对保险知之甚少、保险意识不强的情况下,个人代理制使得保险营销员可以面对面和客户交流,增加了客户对保险的了解,提高了他们的保险意识,极大地推动了我国寿险业的发展。 保险代理人制度是一种典型的委托-代理制度,在委托-代理制度框架下,信息不对称引起的逆向选择和道德风险问题便时有发生。寿险代理人的道德风险(Moral Hazard)指的是由于机会主义的存在,寿险代理人不按照代理合同约定的条款进行销售保险,为了个人利益而做出的一些损害保险公司利益的展业行为。由于大的保险公司代理人数量众多,素质参差不齐,保险公司很难对代理人的展业行为进行全程监控,道德风险行为在保险业特别是寿险业广泛存在。一、寿险代理人道德风险行为的主要表现 (一)对客户 在展业的过程中,代理人最常见的违规行为就是销售误导。销售误导主要有以下表现形式: 1、隐瞒产品性质。目前我国国民保险意识不强,大部分人对保险知之甚少,不少人反感保险推销,部分代理人(多出于银保渠道)便隐瞒产品性质,在对客户讲解的时候把保险产品说成是银行的理财产品,利用客户对银行的信任,促成客户签单。日后客户发现是保险产品要求退保,产生退保退保损失,造成纠纷。 2、虚假宣传。现在寿险市场上产品大多数为分红险、万能险和投连险,三

囚徒困境博弈的行为博弈均衡分析

囚徒困境博弈的行为博弈均衡分析 Christopher Stephens: Modelling Reciprocal Altruism, The British Journal for the Philosophy of Science, vol.47, No.4, 1996, pp.533-551. 互动利他主义建模 1、利他主义困惑与标准模型 The altruism puzzle and the standard model 在一个囚徒困境博弈中,每个博弈者都有两种可能选择:背叛(Defect)或合作(Cooperate),可一般表示为: 囚徒困境博弈要求两个主要条件:(1)Y>W>Z>X(命令条件,The ordering condition);(2)(Y+X)<2W(反利用条件,The anti-exploitation condition) 尽管“背叛”策略是一次性博弈中每个博弈者的优超选择,但相互合作却比相互背叛要好。 2、利他主义的非正式条件 Informal condition for reciprocal altruism 3、对反利用条件的Axelrod证明的批评 Criticism of Axelrod’s justification of the anti-exploitation condition 4、相互利他主义的一组正式模型 A menu of formal models of reciprocal altruism 5、对于guppies、baboons和bats模型的互动利他主义建模 Modelling reciprocal altruism in guppies, baboons, and bats (1)建模guppies的同时合作

博弈模型分析

1.3 管理型医疗概念研究 - 概念提出 - 博弈关系杨燕绥/王瑶平 - 分析模型岳公正 管理型医疗中的博弈关系:模型分析 (暂题) 概括地讲,管理型医疗是一种主要由医院(或者医生)、患者(或者受益人)、医疗保险管理机构(或者医疗保险经办机构)、政府四方参与的管理过程,是建立在互惠基础上的进行多方合作的医疗社会管理机制。由于经济发展水平、人文环境、行政管理具体情况等的不同,各个国家和地区的管理型医疗的结构和内容应当有其特点,具体操作方式和方法也很自然地存在差异。但是,从逻辑实质看,各个国家和地区存在着诸多差异的管理型医疗在本质上都是一个由医院、患者、医疗保险管理机构、政府四方围绕医疗服务定价、服务标准和成本控制等问题进行协商、规范和监督的管理过程。 本节的研究内容:1、对于管理型医疗中的博弈关系进行划分;2、对于管理型医疗中主要的博弈关系进行分析。 1 管理型医疗中博弈关系的划分 一般分析,医疗保险涉及的主体主要由医院、患者、医疗保险管理机构、政府四方组成。但是,在通常情况下,医疗保险在实际操作上涉及的主体还包括参保人、缴费人、受益人、基金管理公司、基金托管机构、医疗服务机构(营利和非营利)、药店、类似医生协会和药品协会的NGO组织、社会保障部门和卫生部门、监督评价机构等等。如何将这些组织和机构协调起来,从而降低医疗费用,提高医疗服务的质量是管理型医疗的主要内容。

图1-3—1 医疗保险的运行关系1 依据图1-3—1分析,医疗保险的运行中,包括了多元主体(医院、医疗保险经办机构、雇主、雇员、药店等)之间复杂的多维的相互制约与相互影响的关系。 1、医院和医疗保险经办机构的关系; 2、医院和受益人的关系; 3、医疗保险经办机构和受益人的关系; 4、医疗保险经办机构和药店的关系; 5、受益人和药店的关系; 6、医疗保险经办机构和政府的关系; 7、医疗保险经办机构和雇主(企业)的关系; 8、医疗保险经办机构和雇员(患者、投保人)的关系; 9、雇主和雇员的关系; 1杨燕绥著:《劳动与社会保障立法国际比较研究》,第239页,中国劳动社会保障出版社,2001年

(完整word版)博弈论知识点总结,.docx

博弈论知识总结 博弈概述: 1、博弈概念: 博弈:就是研究决策主体的行生直接相互作用的决策以及种决策的均衡。 博弈研究的假: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知 3、每个参与人被假定可以所境以及其他参与者的行形成正确的信念与期 2、和博弈有关的量: 博弈参与人:博弈中行以最大化自己受益的决策主体。 行:参与人的决策 略:参与人的行,即事件与决策主体行之的映射,也是参与人行的。信息:参与人在博弈中的知,尤其是其他决策主体的略、收益、型(不完全信息) 等的信息。 完全信息:每个参与人其他参与人的支付函数有准确的了解;完美信息:在博弈 程的任何点每个参与人都能察并之前各局中人所的行,否不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、略空及支付函数等信息, 即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主所的行的函数。 从学的角度,博弈是决策主体之的相互作用,因此和个人决策存在着区: 3、博弈与决策的区: 1、微学的个人决策就是在定市价格、消者收入条件下,最大化自己 效用,研究工具是无差异曲。可表示:maxU(P,I),其中 P 市价格, I 消 者可支配收入。 2、其他消者个人的合影响表示一个参数——市价格,所以在市价格既定 下,消者效用只依于自己的收入和偏好,不用考其他消者的影响。但是在 博弈理个人效用函数依于其他决策者的和效用函数。 4、博弈的表示形式:略式博弈和展式博弈 略式博弈:是博弈的一种范性描述,有亦称准式博弈。 略式博弈是一种假每个参与人一次行或略,并且参与人同行的决策模型,因此,从本上来略式博弈是一种静模型,一般适用于描述不需要考博弈程的完全信息静博弈。 1、参与人集合{ 1 , 2,...,n }: 2、每位参与人非空的略集S i n s i(s 1 ,...,s i ,..., s n ) 上的效用函数Ui(s1,s2,?,sn). 3、每位参与人定在略合 i1 展式博弈:是博弈的一种范性描述。 与略式博弈重博弈果的描述相比,展式博弈更注重参与人在博弈程中遇到决策序列构的分析。 包含要素: 1 、参与人集合{ 1 , 2,...,n }

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈行为中的演绎与归纳推理及其问题

文章编号:1000-8934(2003)03-0039-05 博弈行为中的演绎与归纳推理及其问题 潘 天 群 (南京大学 哲学系,江苏 南京 210093) 摘要:博弈逻辑(game logic )是随着博弈论的迅速发展而形成的一个新的学科,它是一行动逻辑。博弈逻辑研究的是理性的人在互动行动中即博弈中的推理问题。在博弈行为中存在演绎推理和归纳推理。正如在传统逻辑中存在逻辑悖论一样,博弈逻辑中同样存在悖论或者“问题”。博弈参与人运用演绎推理时存在逆向归纳法悖论,而运用归纳推理时存在归纳是否有效的问题。 关键词:博弈逻辑;演绎推理与归纳推理;逆向归纳法悖论;归纳推理的合理性中图分类号:B812 文献标识码:A 收稿日期:2002-11-13 作者简介:潘天群(1965-),江苏盐城人,南京大学哲学系逻辑学教研室教授,博士,主要研究方向:哲学、逻辑学、博弈论。 1 一种新的逻辑:博弈逻辑 博弈论研究人类活动中的互动行为,在经济学中得到广泛的运用。在博弈论中,人类的所有活动,只要是互动行为,均可以看成是博弈行动。在此基 础上,一种新的逻辑“博弈逻辑” (game logic )得以兴起,它是一种特殊的行动逻辑(action logic )。 博弈论研究多个理性人在互动过程中如何选择自己的策略。理性的人是使自己的目标或得益最大化的人,在经济活动中理性的人即是使经济目标最大化的人———经济人。理性人如何使得自己的“得益”最大?关键是“推理”。 博弈逻辑中存在着两种研究纲领。第一种研究纲领是结合模态逻辑系统,建立新的博弈逻辑系统。在这方面,日本筑波大学的金子守(Mamoru Kaneko )教授是这方面的权威。近几年,他在国际刊物上发表了大量有关博弈逻辑方面的论文。他不仅在模态逻辑系统的基础上建立了多个博弈逻辑(game logic )系统,而且,建立了与博弈逻辑密切相关的公共知识逻辑(common knowledge logic )系统。第二种研究纲领是研究博弈活动中的实际“推理问题”,许多博弈论专家在此方面做了大量的工作。对博弈逻辑做整体的分析不是这里的任务,本文的目的是简要论述博弈活动中的推理问题,属于第二种研究纲领。 根据博弈论,人们在实际的博弈活动中涉及到 两种推理:演绎推理与归纳推理。然而,正如传统逻辑中存在着悖论(演绎悖论和归纳悖论),在博弈逻辑中同样存在着悖论。 2 博弈逻辑中的演绎推理与归纳推理 博弈论有两个假定:第一,博弈参与人是理性的;第二,博弈参与人的得益不仅取决于自己的行动,同时取决于其他人的行动。 每个理性的参与人在策略选取,使自己得益最大时,要充分考虑局中其他人的策略选取。同时,每个参与人知道其他参与人与他有同样的想法。在博弈中,“每个人是理性的”是公共知识(common knowledge ),它是每个参与人进行策略选择或者推理的前提。 博弈参与人的推理表现在他对策略的选取上。决定参与人的策略选取一方面是博弈结构,另一方面是其他参与人的策略。博弈结构是不同策略组合下的支付函数或者得益函数。按照博弈的次序来分,博弈分动态与静态博弈;按照信息的分布来分,博弈分为完全信息与不完全信息博弈。在不同的博弈结构下,参与人所用的推理不同。 根据参与人推理前提与结论之间的关系,在博弈中推理分为演绎推理和归纳推理。我们来分析博弈参与人是如何运用演绎推理与归纳推理的。 (1)静态博弈的演绎推理 让我们来分析典型 的“囚徒博弈”的例子。 第19卷 第3期2003年 3月 自然辩证法研究Studies in Dialectics of Nature Vol.19,No.3 Mar.,2003

从博弈论看保险市场信息不对称的本质及规范举措

从博弈论看保险市场信息不对称的本质及规范举措 [字体:大中小] [打印本页] [关闭窗口] 我国保险业自1980年恢复经营以来,取得了飞速发展,到2005年底,全国保险业保费收入已经达到4927.3亿元,对稳定国民经济和保障人民生活发挥着越来越重要的作用。与此同时,保险市场也初步形成了以国有保险公司为主体、中外保险公司并存、多家保险公司竞争的新格局。保险业作为金融业的重要组成部分,集风险性和金融性于一体。保险经营活动中交易的双方因各自所处的地位、信息交流的愿望、拥有的资源和保险知识等差异,造成对方希望了解或本来能够了解的信息不能为对方所了解,从而形成了保险市场信息不对称的现象。本文试图就保险市场信息不对称的负面现象,运用博弈论的相关理论和模型分析保险人与被保险人之间的关系,并据此提出规范保险市场信息不对称的政策举措。 一、保险市场信息不对称的负面现象 保险市场是一个典型的信息不对称市场,一般情况下,信息不对称是单向的,信息优势只存在于买卖双方中的一方。而在保险市场中,由于保险机制的固有特性,信息不对称却是双重的,对于保险人和被保险人都存在。保险市场的这种信息不对称容易引起两种负面现象:一是“逆向选择”,即“劣质客户驱逐优质客户现象”。所谓“逆向选择”是指,在信息不对称条件下,具有信息优势的一方通过隐藏信息可能做出有利于自己而不利于另一方的选择行为,当消费者受到伤害即购买“次商品时”时,消费者也不再选择“好商品”,或者在选择“好商品”时不愿付更高的成本。在保险市场上,潜在的被保险人总是比保险人更了解保险标的风险状态,保险双方存在信息差别是难以避免的。尤其是在保险定价中,保险人通常使用分类计算法厘定保单价格,这种方法尽管简便,但却不能区别具有不同风险程度的保险标的,从而也就不能确定适合于被保险人的保费水平,当保险费处于一般水平时,基于投保效用的考虑,高风险者将选择投保,而低风险者将退出需求市场,从而出现“劣质客户驱逐优质客户”的现象。二是“道德风险”。道德风险分为事前道德风险和事后道德风险。事前道德风险是指被保险人在防损行为方面产生的背离,因为保险公司无法观察到人们在投保后防灾行为而产生“隐蔽行为”,从而面临着人们松懈责任甚至可能采取“不道德”行为而引致的损失。事后道德风险是指被保险人在减损方面行为产生的背离。不论是保险人还是被保险人都存在着道德风险问题。对被保险人而言,由于保险人不了解被保险人的真实情况,被保险人的风险意识降低,甚至被保险人为了少交保险费和多获赔偿,可能故意隐瞒保险标的所面临的风险,甚至夸大保险损失,故意编造和制造保险事故,虚假索赔骗取保险金,也往往会造成保险公司因为居高不下的赔付率而陷入困境。对保险人而言,一些保险人对被保险人不负责任的行为都可视为道德风险问题,中国的保险市场是一个新兴的市场,保险公司层出不穷,保险商品复杂多变,保险服务参差不齐,

初探博弈论及其应用【开题报告】

毕业论文开题报告 信息与计算科学 初探博弈论及其应用 一、选题的背景与意义 在人类历史上,很早就有了博弈思想的故事,如众所周知的“田忌赛马”。在社会生活中,我们也能碰到类似的情形和现象,如下棋、打扑克、猜拳等想用自己的战术去取胜,这就是所谓的博弈现象。博弈论是研究理性的个体在相互依存时如何做出决策的一门理论知识,主要是强调决策主体的行为而引起的直接相互作用。 上世纪80年代以后,博弈论经历了突飞猛进的发展,主要是在经济方面的发展,越来越多的人把它归为主流经济学的重要组成部分。不仅是在经济上有广泛的应用,而且在军事、信息、政治等方面也能看见它的影子。1994年的诺贝尔经济学奖获得者就是三位博弈论的专家。以后又有三次奖授给了与博弈论有关的专家。在我国,经济学界对经济博弈论的关注和兴趣也在迅速增强。由于博弈论应用的广泛性和实用性,越来越来多的人开始学习和研究博弈论。可以说,博弈论正将进入一个崭新的阶段。 二、论文的主要思想 博弈论研究理性的个体在相互依存时如何作出决策。因此博弈论在研究时需要作出一定的假设,当然也包括一些基本定义。所以本文从介绍博弈论的基本假设和基本概念开始,在对基本概念了解的基础上学习博弈论中的经典模型,从中学习博弈过程中的双方博弈思维,然后再选取一些实际中的例子,运用所学的博弈论思维,从博弈双方的角度考虑得出该做出何种决策。 三、研究的步骤及方法 研究步骤 1. 1.10——1.20 明确毕业论文的设计方向,查阅文献资料,完成开题报告。 2. 2.10——2.25 撰写文献综述,翻译外文资料。 3. 2.26——3.05 列出论文正文部分的撰写提纲。 4. 3.06——4.01 撰写论文初稿。 5. 4.02——4.20 根据指导老师的建议进一步修改。 6. 4.21——4.27 论文定稿,装订成册,按时完成其它各项任务,准备答辩。 研究方法

博弈论与经济行为

博弈论与经济行为 博弈论已经成为整个社会科学特别是经济学的核心。萨缪尔森在他的经典教科书中曾引用过的短谚是:“你可以使鹦鹉成为训练有素的经济学家,所有它必须要学的只是两个词,供给和需求”——现在它们或许可换成“博弈”和“均衡”。 天才数学家冯诺伊曼(1904-1957)是“传奇中的传奇”。他是一个卓尔不群的数学天才,他几乎独立完成了这篇1200页的论文,进行史无前例的论述了“博弈论是一切经济学理论的正确基础”,为博弈论以后的发展打下了坚实的基础。 按照1998年诺贝尔经济学奖得主阿玛蒂亚森的看法,博弈论和社会选择理论是20世纪社会科学最主要的成就。 到目前为止,我们对经济活动的考察没有考虑人们之间的相互影响。其实,一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免要与他人发生利益冲突或矛盾,于是就出现了各种各样的问题,比如如何克服和解决人们之间的利益冲突,如何才能实现一种既能让每个人都实现自己的利益,又能让每个人都不妨碍和伤害他人利益的互利互惠的和谐局面,显而易见,这些问题的解决并非易事,于是就出现了博弈论。它为解决这些问题提供了有力工具。博弈论以人的理性为基本假定,强调策略性——一种普遍的行为现象。这种现象的广阔背景是市场中的竞争与合作。20世纪80年代以来,博弈论在经济学中得到了广泛应用,在揭示经济行为的相互影响和制约方面取得了重大进展。大部分经济活动都可以用博弈论加以解释,甚至连市场调节与宏观调控这样的重大问题,都可看成博弈现象来研究。 下边列举两个故事,来简单说明一下。 1. 智猪博弈的故事猪圈里有一大一小两头猪,猪圈一边装有踏板,踩一下,远离踏板的食槽端就会落下食物。若一猪去踩踏板,另一猪就会等在槽边抢先吃到

博弈论分析

中美军备竞赛的博弈分析 1.理论介绍 1.1博弈论的概念 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 1.2博弈论的主要特点 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。 具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 1.3博弈的分类 博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(sub game perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型等等。 1.4纳什均衡 纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方

博弈行为中的演绎与归纳推理及其问题

博弈行为中的演绎与归纳推理及其问题 1一种新的逻辑:博弈逻辑 博弈论研究人类活动中的互动行为,在经济学中得到广泛的运用。在博弈论中,人类的所有活动,只要是互动行为,均可以看成是博弈行动。在此基础上,一种新的逻辑“博弈逻辑”(game logic)得以兴起,它是一种特殊的行动逻辑(action logic)。 博弈论研究多个理性人在互动过程中如何选择自己的策略。理性的人是使自己的目标或得益最大化的人,在经济活动中理性的人即是使经济目标最大化的人——经济人。理性人如何使得自己的“得益”最大?关键是“推理”。 博弈逻辑中存在着两种研究纲领。第一种研究纲领是结合模态逻辑系统,建立新的博弈逻辑系统。在这方面,日本筑波大学的金子守(Mamoru Kaneko)教授是这方面的权威。近几年,他在国际刊物上发表了大量有关博弈逻辑方面的论文。他不仅在模态逻辑系统的基础上建立了多个博弈逻辑(game logic)系统,而且,建立了与博弈逻辑密切相关的公共知识逻辑(common knowledge logic)系统。第二种研究纲领是研究博弈活动中的实际“推理问题”,许多博弈论专家在此方面做了大量的工作。对博弈逻辑做整体的分析不是这里的任务,本文的目的是简要论述博弈活动中的推理问题,属于第二种研究纲领。 根据博弈论,人们在实际的博弈活动中涉及到两种推理:演绎推理与归纳推理。然而,正如传统逻辑中存在着悖论(演绎悖论和归纳悖论),在博弈逻辑中同样存在着悖论。 2博弈逻辑中的演绎推理与归纳推理 博弈论有两个假定:第一,博弈参与人是理性的;第二,博弈参与人的得益不仅取决于自己的行动,同时取决于其他人的行动。 每个理性的参与人在策略选取,使自己得益最大时,要充分考虑局中其他人的策略选取。同时,每个参与人知道其他参与人与他有同样的想法。在博弈中,“每个人是理性的”是公共知识(common knowledge),它是每个参与人进行策略选择或者推理的前提。 博弈参与人的推理表现在他对策略的选取上。决定参与人的策略选取一方面是博弈结构,另一方面是其他参与人的策略。博弈结构是不同策略组合下的支付函数或者得益函数。按照博弈的次序来分,博弈分动态与静态博弈;按照信息的分布来分,博弈分为完全信息与不完全信息博弈。在不同的博弈结构下,参与人所用的推理不同。 根据参与人推理前提与结论之间的关系,在博弈中推理分为演绎推理和归纳推理。我们来分析博弈参与人是如何运用演绎推理与归纳推理的。 (1)静态博弈的演绎推理让我们来分析典型的“囚徒博弈”的例子。 警察抓到了两个共同偷窃的小偷,对他们进行单独关押。囚徒面临这样的“政策”:如果一方“招认”,供出自己与对方以前所做违法之事,而对方“不招认”,“招认”方将无罪释放,对方会被判重刑10年;如果双方都与警方合作,选择“招认”策略,各被判刑5年;而如果双方均“不招认”,因警察找不到其他证明他们以前违法的证据,只能对他们的小偷行为进行惩戒,各判刑1年。这两个小偷如何做出选择? 囚徒困境的支付矩阵为: 附图 “囚徒困境”是一个被广泛谈论和研究的博弈。在这个囚徒困境中,小偷的最终“得益”是当场释放还是被判刑(10年、5年、1年),不仅取决于该囚徒的决定,而且取决于另外的小偷的决定。 在这个例子中,每个小偷都作这样的推理: 如果对方“招认”, 我“不招认”的结果是判刑10年,“招认”的结果是判刑5年; “招认”的结果好于“不招认”的结果 此时,我应当选择“招认” 如果对方“不招认”, 我“不招认"的结果是判刑1年,“招认”的结果是当场释放; 当场释放比判刑1年要好 此时,我应当选择“招认” 因此,无论对方采取“招认”还是“不招认”,我最好的策略是“招认”。

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期 用博弈论分析生活现象论文

博弈论分析生活中现象 博弈论它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域,主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的,所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利,我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。 比如某一天你觉得应该是你女朋友的生日,但又不能肯定,如果是女朋友的生日的话,你可以送一束花,女朋友会特别高兴,你不送花,女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话,你可以送女朋友一束花女朋友感到意外的惊喜,你不送花结果生活同往常一样。 生日非生日 买花 1 ,1 2 ,1 不买花-1,-1 0 ,0 确定今天是女朋友的生日或确定今天不是女朋友的生日,但你的最好行动都是买花。 谈到博弈论我们不得不说到囚徒困境,其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年刑但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。两个犯

人陷入的就是囚徒困境, A B 招不招 招 5 ,5 无罪释放,10 不招10,无罪释放 1 ,1 其结果就是A和B都招,判5年刑。如果两人协商后选择不招,但如果A或B其中一人招了,另一人就会判10年,而招的一人就会无罪释放,这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。 人际交往中的博弈 人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损两败俱伤。如果是朋友,也会因不断发生“负和游戏”而逐渐疏远,夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。如果不使性负气,而是互相谅解,与人交往采取合作态度,便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高,采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

行为博弈理论

行为博弈理论 在“菜鸟”上看到一篇非常有意思的文章,讲的是行为博弈理论,真的是很有意思。我们有很多人都学过数学,但是大都把数学当作一门科学上的工具,实际生活中用到的数学原理好像并不多见,能把数学思想来指导个人学习生活的例子就更少了,所以能看到这样一篇用数学来剖析大众在生活中可以遇见的事例的文章,实在是弥足珍贵。 不过美中不足的是文章中的分析并不是完全正确的,这是非常可惜的一件事情。我们还是把文章引出来吧:下面要讲到的例子与美国1970年代的一个电视节目有关,其中的概率计算困扰着成千上万的大众。在节目中,节目参与者将在3扇门之间选择其中一扇。这3扇门中有且仅有一扇门的后面装着奖品,另外两扇门则装着讽刺性礼品比如鸡崽(chicken)或者笨驴(donkey) 。当节目参与者选定一扇门之后,主持人就会打开另外两扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中,主持人会问参与者要不要改变最初的选择。 这里的问题就是:参与人希望获得奖品,而不是获得讽刺性礼品,那么现在仍关闭的两扇门中,他应当坚持最初的选择呢?还是改变主意选择另外一扇门? 大多数人凭直觉认为,剩下的两扇门中,每扇门后有奖品或没有奖品的概率各占50%。因此,改变主意选择另外一扇门和坚持最初的选择不改变,预期的赢利是一样的。的确,这种思路看来是没有什么错。因为在做最初的选择时,选择正确的概率是1/3;而一旦选择之后,剩下两扇门,参与者从主持人的行为中所能得到的信息就只是将信念修正为自己选择正确的概率为1/2,选择失误的概率也是1/2。此外没有任何其他的信息改善。因此,他坚持原来的选择似乎可以说得过去。 但是,上述看法不符合真实的情况。真实的情况是,如果参与者改变自己最初的选择,那么获得奖品的概率是2/3,而不改变最初选择则获得奖品的概率仅为1/3。也就是他应该改变自己最初的选择。奇怪的是,将这个结果告诉给参与者后,他们也常常还难以理解为什么会这样。一种比较浅显的解释是这样的:在最初的选择中,选择了错误的门的概率是2/3。如果参与人一开始的确选择了错误的门,那么主持人随后必然打开空门,而没有被打开的那一扇就必然有奖品,此时参与人显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初的选择中参与人的确选正确了(概率为1/3),那么他显然应该坚持,并因此获得奖品。也就是说,如果参与人一开始就选错了则参与人应该换门并一定获得奖金,如果参与人一开始就选对了则应该坚持并一定获得奖金——于是,转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始,选择出现错误的概率是2/3,为正确的概率是1/3。因此,在不知自己选择是正是误的情况下,在第二阶段改变主意转换到另一扇门,的确增加了获得奖品的概率。 对于有些读者,可能仍难以明白上述道理。那么我建议你可以做这样一个游戏:准备三张扑克和一枚硬币,让你的朋友来当节目主持人将三张牌铺在桌面上(并将那枚硬币放在其中一张之下);然后你来选择一张牌;你的朋友将你没选取的牌中拿走没有硬币的一张,再问你是否改变你当初选的牌。为了证明转换选择不不转换选择将更有可能获得奖品,你可以尝试以“转换选择”为策略进行数十次(比如50次),再以“不转换选择”为策略进行同样多的次数(比如50次)。结果你会发现什么?你将发现“转换选择”的策略中,得到硬币的次数基本上是“不转换选择”策略中得到硬币的次数的两倍,而两种策略中硬币出现的频率也基本上分别接近2/3和1/3。 当然,在一次性节目中,并不允许这样的重复实验。而且大多数人的确也不明智地选择了“不转换选择”。我曾在学生中做这个实验,结果32人中有20人坚持“不转换选择”。说明大多数人是不清楚这样复杂的概率思考的。更有意思的是,我跟我太太(一个没有修过高等数学的文学士、教育学硕士)玩这个游戏时,她也是坚持“不转换选择”。当我告诉她如果转换则可以成倍提高获奖概率时,她却说:如果我开始选对了,改变了结果错了就会后悔,所以心理素质好的就不应该改变。当然,她说的已经不是纯粹的概率计算,但也不是没有道理的。人们的行为的确不仅受制于各种精心的算计,也往往受制于某些心理因素(比如后悔)。不过,我对她的答案疑问在于:“如果开始选择对了,那么后来改变了选择会令人后悔。但是,如果后来你知道开始的选择错了,而你又没有转换选择,你就不后悔没有转换吗?”太太的回答更

保险代理人违规行为选择的博弈分析

摘要:保险代理人的违规行为在保险市场上层出不穷,大大损害了保险行业的信誉,严重阻碍了保险业的发展。所以对保险代理人的违规行为表现进行总结, 通过博弈论的分析方法结合我国保险市场的实际情况深层次地研究保险代理人违规行为选择的原因,具有很强的理论意义和现实意义。关键词:保险代理人;违规行为;三阶段博弈模型中图分类号:F840.3 文献标志码:A 文章编号:1674-3210(2011)06-0104-03 第27卷第6期Vol.27No.6廊坊师范学院学报(社会科学版) Journal of Langfang Teachers College (Social Sciences Edition )2011年12月 Dec.2011 收稿日期:2011-10-15 基金项目:国家社科基金项目“新时期社会公平与利益协调研究──基于实验经济学”(10BJL027)成果之一;福建 省数量经济学研究生教育创新基地资助项目 作者简介:胡玉霞(1979- ),女,安徽安庆人,华侨大学经济与金融学院博士生,黎明职业大学讲师,主要从事博弈论、应用数学等方面的研究。 随着物质文明的进步和社会生活水平的提高,广大消费者对于保险产品的需求逐渐增多。按理,保险业的发展应该更为顺利,然而,事实是很多消费者购买商业保险时仍显踌躇。究其原因,并不是对保险产品的排斥,而是目前我国保险代理人存在着各种各样的违规行为,导致了保险行业的社会认同感大大降低,从而严重阻碍了我国保险行业的进一步发展。 一、保险代理人违规行为的表现(一)隐瞒标的信息,加大保单的风险性部分保险代理人为获得高保险佣金,在比保险公司更多地了解标的的实际信息而其行为又缺乏有效监督的情况下,为了快速签订保险合同,常常会故意隐瞒标的信息,从而加大了保单的风险。 (二)与投保人共谋骗保 调查显示,部分保险代理人为追求高佣金、提高保单业务量,不择手段地与投保人合谋骗取保单合同,实施有损于保险人利益的行为。如在财产保险中,把已丢失的财产或报废的机器予以投保;在人寿保险中,明知被保险人已患绝症而投高额人身保险等。 (三)非法侵占保费 在我国保险市场上,为了方便投保人投保,有的保险人允许保险代理人代收保费,因此,部分保险代理人在取得保险公司已盖章(或授权)的各种保险单或代理章后,向社会办理各种保险业务,并直接向客户收取保险费,然后选择风险较集中的保险业务交还保险公司,而把风险较分散或微小的保险业务截留,并侵吞部分保险费。 (四)不实告知 由于保险条款具有较强的专业性,投保人往往对保险条款缺乏深入认识,保险代理人可能在与投保人订立保险合同前,有意隐瞒保险条款中的事项(如责任免除等),使得投保人在对保险合同缺乏必要了解的情况下签订合同,造成保险事故发生后无法获赔,最终使投保人的利益受损。 (五)虚假宣传 有的保险代理人为获得保险佣金,会向投保人提供虚假信息或者利用虚假广告误导投保人。 (六)骗保行为 骗保行为主要指的是保险代理人利用保险人的授权擅自签发非法保单,如“携程保险门”事件,投保人缴了保费,得到的却是无任何保障的伪保单,当保险事故发生时,投保人根本无保障可言。 保险代理人在开展业务的过程中,容易产生道德风险,由于缺乏足够的道德自律,可能会做出如 保险代理人违规行为选择的博弈分析 胡玉霞 (华侨大学经济与金融学院,福建福州362000;黎明职业大学公共教学部,福建泉州362000) 104 ··

高鸿业《西方经济学(微观部分)》(第6版)笔记(第10章 博弈论初步)

高鸿业《西方经济学(微观部分)》(第6版)第10章博弈论初步 复习笔记 跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。 以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。 博弈论在20世纪50年代由数学家约翰·冯·诺依曼和经济学家奥斯卡·摩根斯坦引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展作出了重要贡献。 一、博弈论的几个基本概念 博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。 1.博弈参与人 参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与人既可以是个人,也可以是团体(企业或国家)。 2.策略 策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。 3.支付函数 支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。 4.支付矩阵 参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。 其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。 二、完全信息静态博弈:纯策略均衡 1.条件策略和条件策略组合 在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。 2.纳什均衡 如表10-1所示,(不合作,不合作)既是甲厂商的条件策略组合,也是乙厂商的条件策略组合,在该策略组合上,甲厂商和乙厂商都没有单独改变策略的倾向。 表10-1 寡头博弈:合作与不合作

相关主题
文本预览
相关文档 最新文档