第一章 决策论基础知识(博弈论-河海大学,王慧敏)
- 格式:ppt
- 大小:240.50 KB
- 文档页数:27
主讲人:邓光耀1、几个定义•定义1.1 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
•定义1.2 序贯博弈是指参与者选择策略有时间先后的博弈形式。
因此,某些对局者可能率先采取行动,它是一种较为典型的动态博弈,而重复博弈则可视为一种特殊的动态博弈形式。
•在序贯博弈中,先行者可能占据一定的有利地位,我们把它叫做先行者优势。
•定义1.3 决策论(Decision theory)决策论是根据信息和评价准则,用数量方法寻找或选取最优决策方案的科学,是运筹学的一个分支和决策分析的理论基础。
在实际生活与生产中对同一个问题所面临的几种自然情况或状态,又有几种可选方案,就构成一个决策,而决策者为对付这些情况所取的对策方案就组成决策方案或策略。
2、序贯博弈之例•例1:桌上有25枚硬币,每次可以取1枚、2枚或者3枚。
你与对手交替选择,谁先选到第25枚硬币谁就胜利。
假设你首先选择,你这样才能保证自己胜利?•解答:你应当这样选择:每次选择的最后一个数依次为1、5、9、13、17、21、25,这样无论对方如何选择,你均可以保证自己胜利。
也就是说你要保证每次最后选择的是4n+1型的数。
而这种保证是可以做到的,读者可以思考一下原因。
•推广1:此类游戏可以推广到选择4k+1枚硬币的情形,优胜策略也是保证每次最后选择的是4n+1型的数。
•推广2:设步长为a,(例1中步长为3),则形如(a+1)k+1枚硬币的情形,优胜策略也是保证每次最后选择的是(a+1)n+1型的数。
3、囚徒困境• 3.1 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。
该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。
完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。
不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。
博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。
扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。
根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。
根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。
经济学中的博弈论与决策理论博弈论和决策理论是经济学中两个重要的分支,它们研究了当涉及到决策和行为选择时,个体之间如何相互作用和相互影响。
这些理论为了解人们在经济环境中作出的决策提供了一种强大的框架。
本文将探讨博弈论和决策理论的基本概念、应用以及对经济学的重要性。
一、博弈论博弈论是研究决策制定者之间相互作用和决策制定的一种数学模型。
它的核心理念是通过分析决策制定者之间的策略选择和可能的结果,来确定最优的决策。
博弈论的一个关键概念是博弈的参与者,他们在特定情境下做出决策,并受到其他参与者决策的影响。
1.1 纳什均衡纳什均衡是博弈论中的一个重要概念。
它描述了一个状态,在该状态下,参与者之间的策略选择是相互协调的,没有人会单方面改变自己的策略来获得更好的结果。
简而言之,纳什均衡是一种稳定的策略选择状态。
1.2 进化博弈论进化博弈论是博弈论的一个分支,它结合了生物学与博弈论的原理。
在进化博弈论中,参与者的策略会随着时间的推移而演化。
那些能够在长期的演进中存活和繁衍的策略将成为主导策略。
这种理论有助于解释为什么在自然环境中存在着一些稳定的行为模式。
二、决策理论决策理论是研究决策制定者如何在面临不确定性的情况下做出决策的一门学科。
它关注的是决策者在不确定信息和风险中作出决策的过程和规律。
决策理论在经济学领域具有广泛的应用,用于解释经济主体(如消费者、生产者)在面对不确定的市场条件下做出的决策。
2.1 风险决策理论风险决策理论是决策理论中的一个重要分支,它研究如何在面临风险和不确定性的情况下做出决策。
在风险决策中,决策制定者权衡可能的结果和概率,以确定最佳的决策方案。
不同的风险态度和风险偏好将对决策结果产生重要影响。
2.2 启发式和认知偏差启发式和认知偏差是指人们在决策过程中所依赖的简化方法和决策中所存在的常见误差。
例如,人们通常倾向于根据可获得的信息做出决策,而不是综合所有可能的信息。
认知偏差也可能导致人们对风险的评估有所偏差,从而影响决策结果。
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。