博弈论1
- 格式:ppt
- 大小:229.50 KB
- 文档页数:8
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1完整信息静态博弈1.0 对策论研究的内容与根本形式对策论研究的内容对策论研究多个行为主体的决议问题。
对策论研究的形式博弈 (game),由多个行为主体组成的系统。
例Stackelberg modelCournot model博弈的种类参加者行动的时间与次序同时行动——静态博弈;先后行动——动向博弈。
参加者的信息多少信息同样——完整信息;信息不一样——不完整信息。
1.1 根本理论 : 博弈的标准式和纳什平衡例 1少儿游戏:“石头、剪刀、布〞。
博弈的准式表示(normal-form representation)(1) 参加人( player).n个参加人: 1, 2, ⋯, i, ⋯, n.(2)略 (strategy).一个参加人的略是他采纳的一个行。
参加人 i 的略: s i.参加人 i 的略空 : S i .略的一个合 : s ={s1,s2, ⋯, s n}.化表示: s-i ={ s1,⋯, s i -1, s i+1, ⋯ , s n }.(3)利润 (payoff).参加人i 的利润: u i= u i(s1,s2, ⋯, s n)n 个参加人博弈的准形式表示:G = {S1, S2,⋯S,n;u1, u2,⋯u,n}完整信息 (complete information) :每个参加人知道其余人的略空和利润。
静博弈(static game):全部的参加人同行。
每一个人行,不知道其余人的行。
例 1〔〕:博弈 {石、剪刀、布 } 的描绘:参加人:1,2。
略空:S1 = S2 = {石、剪刀、布 }利润:两人出手的函数u1 (石,石 ) = 0, u1 (石,剪刀 ) = 1, u1 (石,布 ) = -1⋯u2 (石,石 ) = 0, u2 (石,剪刀 ) = -1,u2 (石,布 ) = 1⋯⋯利润表:两个参加人,有限个略的博弈的表示方法。
P2石头剪刀布石头0 , 01,-1-1 ,1P剪刀-1,10 , 0 1 ,-11布 1 ,-1-1,10 , 0博弈的:可否知道每个参加人的略?例 2: 囚犯窘境 (The Prisoner ’s Dilemma)囚犯2缄默招认缄默-1 ,-1-9 ,0囚犯1招认0 ,-9-6 ,-6囚犯 1 的考:无方缄默是招,自己“招〞好于“缄默〞。
博弈论公式(一)博弈论公式1. 最小最大定理(Minimax Theorem)最小最大定理是博弈论中的重要定理之一,用于描述两个参与者在零和博弈中的最佳策略选择。
公式:[minimax theorem formula](在公式中,a和b是参与者的策略选择,F(a, b)是参与者根据自己的策略选择所获得的收益。
例子:假设有两名囚犯A和B,他们被起诉犯有共同的罪行。
检察官为了尽可能追求公正,提供了以下交易:•如果A和B都选择保持沉默,则每人判刑1年。
•如果A和B都选择揭发对方,则每人判刑3年。
•如果A揭发B而B选择保持沉默,则A不被判刑而B被判刑6年。
•如果B揭发A而A选择保持沉默,则B不被判刑而A被判刑6年。
根据最小最大定理,囚犯A和B都会选择揭发对方,因为即使对方也选择揭发自己,判刑3年的收益仍然比判刑6年的收益更高。
2. 纳什均衡(Nash Equilibrium)纳什均衡是博弈论中的概念,用于描述参与者选择最优策略时的平衡状态。
公式:[nash equilibrium formula](在公式中,A是参与者的策略集合,a是参与者的策略选择,u是参与者的效用函数,i表示参与者的编号。
例子:考虑一个两人博弈,参与者A和B可以选择合作(C)或背叛(D),他们的效用函数如下:•A选择合作(C)且B选择合作(C):A的效用=3,B的效用=3。
•A选择合作(C)且B选择背叛(D):A的效用=0,B的效用=5。
•A选择背叛(D)且B选择合作(C):A的效用=5,B的效用=0。
•A选择背叛(D)且B选择背叛(D):A的效用=1,B的效用=1。
在这种情况下,合作(C)和背叛(D)是纳什均衡,因为任何一名参与者如果改变自己的策略选择,都无法获得更高的效用。
3. 马赛克文件公式(Blurred File Formula)马赛克文件公式是博弈论中用于保护数据隐私的方法之一,通过模糊化数据来限制敏感信息的泄露。
公式:[blurred file formula](在公式中,F是原始文件,K是用于模糊化的密钥,⊕表示按位异或运算。
博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。
在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。
博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。
一、概述博弈论的研究对象是策略性互动。
在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。
博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。
博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。
信息集合是指每个玩家在博弈过程中所了解的信息。
二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。
纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。
2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。
零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。
非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。
3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。
宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。
三、应用领域博弈论的研究在众多领域中都具有广泛的应用。
以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。
它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。
例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。
2. 政治学博弈论在政治学领域中也有着重要的应用。
◆博弈论(game theory)是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。
1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成电影《美丽心灵》,该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出的巨大贡献而获得诺贝尔经济学奖。
◆1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。
2005年诺贝尔经济学奖由拥有以色列和美国双重国籍的经济学家罗伯特·奥曼和美国经济学家托马斯·谢林分享,两位经济学家获得诺贝尔经济学奖是因为“他们通过对博弈论的分析加深了我们对冲突与合作的理解” (瑞典皇家科学院评语)。
◆为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。
一、什么是博弈论:从“囚徒困境”谈起1. 囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。
警方将两人分别臵于两间房间分开审讯,政策是若一人坦白但另一人抵赖,则坦白者立即被释放,抵赖者判入狱10年;若二人都坦白则两人各判刑8年;若两人都不坦白则未获证据但因私入民宅各拘留1年。
表1 囚徒困境博弈乙坦白抵赖坦白甲抵赖(问题:甲、乙如何选择?)☐囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。