第三章__零和游戏与混合策略
- 格式:ppt
- 大小:820.00 KB
- 文档页数:36
第三章完全信息静态博弈及其纳什均衡解1.完全信息静态博弈定义 3.1.完全信息静态博弈。
完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。
两个特点:(1)静态;(2)完全信息。
完全信息静态博弈例子。
例1:锤子-剪刀-布例2:交通行驶非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。
2.纳什均衡及其判定定义3.2 纳什均衡。
在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,一个策略组合{s1*,s2*,…,s n*},若满足u i(s1*,…,s i*,…s n*)≥u i(s1*,…s i,…,s n*)(i=1…n),则称这个策略组合为{s1*,s2*,…,s n*}为该博弈G的一个纳什均衡。
某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。
特点:(1)每个人没有单独改变策略的动机;(2)局部最优。
纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。
求解纳什均衡的方法:(2)用定义来求解(3)对于策略空间为连续的博弈,用求极值的方法来求得。
3.纳什均衡存在定理:(纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,如果n是有限的,且对每个i, S i是有限的,则博弈至少存在一个纳什均衡。
这里的均衡可能包含混合策略均衡。
证明:略例子3:囚徒困境的均衡例1:“锤子-剪刀-布”的均衡?4.混合策略与混合策略的均衡纯策略与混合策略概念。
定义.3.3.一个策略是纯策略指的是参与人策略空间中的某个确定策略;而一个混合策略是参与人策略空间上的一个概率分布,一般地,某个人i的策略空间为{s i1,s i2,…,s ik},则参与人i在策略空间上的一个概率分布p i=(p i1,p i2,…,p ik)构成他的一个混合策略,其中p i1+p i2+…+p ik=1。
零和游戏原理:当你看到两位对弈者时,你就可以说他们正在玩“零和游戏”。
因为在大多数情况下,总会有一个赢,一个输,如果我们把获胜计算为得1 分,而输棋为-1分,那么,这两人得分之和就是:1 (-1)=0。
这正是“零和游戏”的基本内容:游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远是零。
零和游戏原理之所以广受关注,主要是因为人们发现在社会的方方面面都能发现与“零和游戏”类似的局面,胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。
从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的“零和游戏”场。
这种理论认为,世界是一个封闭的系统,财富、资源、机遇都是有限的,个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺,这是一个“邪恶进化论”式的弱肉强食的世界。
但20世纪人类在经历了两次世界大战,经济的高速增长、科技进步、全球化以及日益严重的环境污染之后,“零和游戏”观念正逐渐被“双赢”观念所取代。
人们开始认识到“利己”不一定要建立在“损人”的基础上。
通过有效合作,皆大欢喜的结局是可能出现的。
但从“零和游戏”走向“双赢”,要求各方要有真诚合作的精神和勇气,在合作中不要耍小聪明,不要总想占别人的小便宜,要遵守游戏规则,否则“双赢”的局面就不可能出现,最终吃亏的还是自己。
正则形式的博弈是解释零和博弈的其中一个方式。
右方是一個兩人零和遊戲例子。
右方是一个两人零和游戏例子。
遊戲流程如下:第一個玩家(紅方)選擇動作1或動作2,第二個玩家(藍方),在不知道第一個玩家的選擇狀況下,選擇動作A、動作B或動作C其中的一個。
游戏流程如下:第一个玩家(红方)选择动作1或动作2,第二个玩家(蓝方),在不知道第一个玩家的选择状况下,选择动作A、动作B或动作C其中的一个。
然後,玩家的選擇被顯示和每個玩家的分數受根據這些選擇的結果而上升或下降。
然后,玩家的选择被显示和每个玩家的分数受根据这些选择的结果而上升或下降。
游戏设计概论考研复习笔记-第三章●♠️第三章-游戏的规则和系统设计入门●第一节-了解与初步设计游戏的规则和系统●一、三级同心圆——游戏作品的构成规律1.三级同心圆理论:规则(核心玩法)、系统(结构框架)、样态(外在表现)2.规则是指游戏进行所依据的最高准则——游戏中的一切活动,都要符合规则的要求。
规则可以以一个时代的技术发展为前提,但规则的本质与技术没有直接关系,而是一种思想和理念,更加接近于哲学的领域。
3.游戏的最外层组成部分是“样态”,样态仅指基于感性认识的外在特征。
样态也是技术应用的体现。
4.“形式”是居于样态之上、规则之下的组成部分,是游戏的框架、进行方式与游戏进行所必不可少的结构。
游戏形式中创意和理念的部分不属于技术内容。
游戏的系统,是规则的补充和完善,是游戏运行的关键部分。
5.游戏规则的设计,是整个游戏设计的核心和第一步;而系统设计,则是紧随其后的第二步工作。
●二、解构经典游戏——学会分析游戏规则和系统的本质1.猜拳游戏:●猜拳游戏中无法动摇的规则,是几种事物的互相克制——这种相克表现为一个循环;游戏必须通过这种相克,在玩家之中产生一名胜利者。
●平局出现得越少越好。
●游戏过程的失败概率是随着玩家人数的增加而不断增加的2.三者相生相克:●猜拳游戏在相生相克的项数增多的情况下,游戏过程的失败几率将呈线性增长。
●双人游戏以及“三者相生相克”便是猜拳游戏最重要的系统。
3.扑克游戏“24点”:●扑克游戏“24点”中把四则运算的结果限定为24,也是出于成功几率的考虑,而24的运算目标,便是这个游戏最重要的系统。
●它们之所以是属于“形式”的系统,而不是“规则”或“样态”,是因为它们既不是不可改变的,也不是可以随意改变的。
4.《超级马里奥兄弟》:●其规则是“利用跳跃和跑步等移动手段,从场景起点移动到终点并触发过关条件”。
●而为了丰富这一核心规则,宫本茂等游戏设计师创造或借鉴了“卷轴平台系统”“金币系统”“道具变身系统”“敌人和 boss系统”“水管传送系统”“水下场景系统”等诸多系统。
投资博弈论——正和游戏、零和游戏与负和游戏价值投资创始人——本杰明∙格雷汉姆说过:“投资是指根据详尽的分析,本金安全和满意回报有保证的操作。
不符合这一标准的操作就是投机”。
按照这个定义来深入分析,投资的收益应该来自于投资物所产生的财富,属于正和游戏;而投机的收益,是来自于另一个投机者的亏损,则是零和游戏。
博弈的英文为“game”,一般将它翻译成“游戏”,可分为三种:“正和游戏”、“零和游戏”和“负和游戏”。
“正和游戏”是指,赢家所得比输家所失要多,或者没有输家,结果为“双赢”或“多赢。
“零和游戏”,是指一项游戏中,游戏者有输有赢,一方所赢正是另一方所输,而游戏的总成绩永远为零。
“负和游戏”是指,博弈双方虽有一方获胜但付出了惨重的代价,得不偿失,可谓没有赢家。
举个简单的例子。
四人打麻将,不管谁输谁赢,不过是你的钱到了他口袋,或者他钱到你口袋,你们的收益和损失加起来总归是0,所以叫零和。
然而,如果到棋牌室去打麻将,不管谁输谁赢,总归要付台费,四人的收益和损失加起来总归是负的,所以叫负和。
投资的本质就是参与正和游戏。
在正和游戏中,公司上市后通过股票募集到的资金,再进行投资扩大生产,盈利后再分红,股东享受到价值的稳定与成长,正和游戏的本质决定绝大部分参与者都是赢家。
投机的本质是博弈零和/负和游戏。
股市中参与投机行为就是零和游戏,而期货、外汇、黄金,古玩、名画、钻石和邮票等,考虑手续费等交易成本就是负和,这两种游戏的本质注定绝大部分的参与者都是输家。
要区别投资和投机非常简单,就在于你买入一种金融产品后,希望从哪儿得到未来的收入。
比如买入了一支股票,期望企业做大做强且能不断得到利息分红;买入一套房子后希望租出去,每月都有房租收入,这就是投资。
而如果买入了一种金融产品后,是指望能以更高的价格卖出的话,不管你购买的是什么东西,都是投机。
同样是购买房子,可能是投资,也可能是投机。
最简单可用国际上通用的租售比(售价除以月租金)来衡量:低于150就属于投资,不过因为国内还没有征收房地产税,所以可调高到200,在国内超过200便属于投机了。
大数定理与墨菲法则(引花荣-常胜狐狸第一、二章)(2009-06-13 17:33:03)标签:花荣智慧分类:常胜狐狸(引花荣-常胜狐狸第三章)在相当时间内,投机套利成了沪深股市最重要的获利方法。
而投机套利的实施,依赖的最经典的原理就是:零和游戏和大数定理。
1.零和游戏零和游戏是指,一项游戏中,游戏者有输有赢,一方所赢正是另一方所输,游戏的输赢总和成绩为零。
沪深股市的方方面面都能发现与“零和博弈”类似的局面,胜利者的光荣往往隐藏着失败者的辛酸和绝望。
需要注意的是,沪深股市在局部的阶段时间里,存在着短暂的“双赢”与阶段的“通输”。
2.大数定理在股市中,收益率大于零的游戏能胜,小于零的游戏不能胜。
投机取胜的关键在于,要知道该项目的收益率,收益率为正数的能玩,为负数的不能玩,这就是打败市场、战胜市场的正收益率原则。
具体地说,只有你习惯使用的战术胜率高于50%,才有可能成为胜利者;只有你习惯使用的战术胜率高于65%,你只依靠股市就能很好地生存;只有你习惯使用的战术胜率高于75%,你才能成为职业高手或是职业杀手。
遗憾的是,在利益即得者运用简单的大数定理大把大把赚钞票的时候,绝大多数投资者却不自觉地使用本能心理学上小数法则充当不自愿的贡献者。
3.墨菲法则墨菲定律:凡事只要有可能出错,那就一定会出错。
我们发现,墨菲法则对于证券期货投资有更独到的意义,成为许多职业操盘师测试的必考之题。
此时,墨菲法则也获得了极端的表述:如果坏事有可能发生,不管这种可能性有多小,它总会发生,并造成最大可能的破坏。
墨菲法则提醒我们,在进行投资活动时,应该考虑得更周到、更全面些,事先考虑的保险措施应该较为积极。
a.大盘的行情与墨菲法则在绝望中新生,在迟疑中上涨,在欢乐中死亡,在希望中下跌。
这种绝望不是小绝望,而是大绝望,一种大多数人彻底的绝望。
迟疑指的是大盘带量上涨的迟疑,而不是技术性的弱势上涨。
欢乐指的是涨停板的数量,以及市场放出罕见的高位大成交量。
第三章 纳什均衡及其应用3.1 混合策略纳什均衡1 鹰鸽博弈我们知道老鹰具有攻击性,而鸽子爱好和平。
在原始社会里有两个部落,可以做出两个行动:一是进攻一是和平,分别用鹰和鸽表示。
表1 鹰鸽博弈乙甲鹰 鸽该博弈的那是均衡为(鹰,鸽),(鸽,鹰)。
一些学者研究发现,在同一个地域内,“鹰”和“鸽”的比例为0.36:0.64。
事实上,设鹰鸽比为:1z z -,可以得出如下结果:()2514(1)1439E e z z z =-+-=-; ()95(1)514E d z z z =-+-=-90.3625z == 聪明的做法是:当鹰鸽比小雨0.36时,选择鹰策略;否则选择鸽策略。
使用混合策略方法分析:第一步:混合策略型表示:乙 鹰 鸽甲鹰 p 鸽 1-p第二步:计算期望效用:(925)514(259)514E p q q E q p p=-+-=++-甲乙第三步:作出最优反应函数91 259[0,1] 2590 25q p q q ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩若若若, 90 259[0,1] 259 1 25p q p p ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩如果如果如果 第四步:作出反应函数的图像第五步:根据交点,找出纳什均衡:其中(99,2525)是混合策略纳什均衡。
2 斗鸡博弈我的老家地处安徽最北部,苏鲁豫皖四省交界之处,东北处有条小河。
河边的棉花地里,经常有鹌鹑栖息在其间。
秋末冬初的农闲时节,小鹌鹑刚好长成。
村民结网捕鹌鹑把玩、斗鸟儿为乐。
每天早晨4点多钟出发,大约7点钟回来,雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑,真正熟练了,才拿出来和别人的相斗。
设想两只鹌鹑要在场子里一决雌雄。
每只鹌鹑都有两个策略:攻击或逃跑。
由于两只鹌鹑实力相当,若同时选择进攻会两败俱伤;若一只进攻,一只逃跑,进攻者胜利。
逃跑的鹌鹑算是玩完了,以后再也没胆量进场子,主人也不回在把玩它,会用一块黑布把它的笼子蒙起来,培养成“叫子”,以后后捕鹌鹑的时候拎出去吸引同伴。