博弈论(2)
- 格式:pdf
- 大小:468.74 KB
- 文档页数:64
博弈论基础教程教学设计引言博弈论是数学的一个分支,研究在不同决策者的利益与互动下,如何进行最优选择,并通过程序设计和算法优化得出最优解。
它涉及许多领域,例如经济学、心理学、社会学、计算机科学等等。
本文将介绍博弈论基础教程的教学设计,主要面向计算机科学领域的初学者。
教学目标本课程的教学目标是使学生了解博弈论的基础概念和解法,并掌握以下内容:•博弈论概论•常用博弈模型的分析和求解方法•Nash均衡和博弈的稳定性•博弈的应用教学方法本教程采用多种教学方法,包括讲解、演示、练习和讨论等。
在课堂上,老师将主要采用讲解的方式向学生介绍博弈论的概念和解法,同时配以案例解析,并开设问答环节。
此外,老师将设计相关的程序实验和授课录屏,让学生更直观地理解和掌握相关知识。
学生需要在课后自行完成练习题和对案例的分析,并参加相应的讨论,以进一步巩固所学内容。
教学内容博弈论概论博弈论包括两部分:博弈和解决方式。
我们将重点介绍以下几个方面:•零和博弈和非零和博弈•完美信息博弈和不完全信息博弈•合作和非合作博弈•约束和非约束博弈常用博弈模型的分析和求解方法博弈论有许多用来建模和求解的模型。
在本课程中,我们将介绍以下模型:•囚徒困境•社交困境•保卫战争•博弈树Nash均衡和博弈的稳定性Nash均衡是指在一个博弈中,每个参与者都选择自己最优的策略,而无法通过单独改变策略来获得更好的结果。
在本课程中,我们将介绍以下内容:•Nash均衡的概念和计算方法•多元博弈的Nash均衡•博弈的稳定性博弈的应用博弈论在实际中有广泛的应用,例如电子商务、金融和投资、能源和环境等领域。
在本课程中,我们将介绍以下应用:•电子拍卖•股市交易和投资•能源和环境政策教学评估本教程采用多种教学评估方法,旨在全面地了解学生的掌握情况和学习效果,包括期末考试、平时作业、实验报告和课堂讨论等。
结论通过本教程的学习,我们希望学生能够初步掌握博弈论的基本概念和解法,了解博弈论在实际中的应用,并能够运用博弈论分析和解决一些实际问题。
博弈论课程设计1、引言博弈论是现代数学中的一个重要分支,是由经济学家和数学家共同合作发展起来的。
博弈论主要研究人类社会中的决策行为和相互关系,以及在涉及决策行为和相互关系的情景中个体或组织如何做出理性的决策。
博弈论在生物学、心理学、社会学、管理学、工程学等领域也有广泛的应用。
在博弈论的学习过程中,理论与实践相结合是必不可少的。
本文将介绍一些博弈论的课程设计,旨在帮助学生更好地理解和应用博弈论的知识。
2、课程设计2.1 美国拍卖模拟实验美国拍卖是一种竞价拍卖。
在竞拍过程中,买家通过不断提高他们的出价来争夺商品,最后出价最高者获得商品所有权。
美国拍卖的特点是出价者可以随时根据拍卖过程中的信息改变他们的出价。
该模拟实验的目的是通过竞卖过程的模拟来让学生学习博弈论中的核心概念,如策略、博弈纳什均衡等。
该实验还可以帮助学生分析竞价策略与结果的关系,提高学生思考和策略制定的能力。
2.2 博弈纳什均衡实验博弈纳什均衡是博弈论中的一个重要概念。
在一个博弈中,如果所有参与者都选择了他们各自的最优策略,那么这个博弈就到达了一个均衡状态,称为纳什均衡。
该实验可以让学生自己尝试找到博弈的纳什均衡,提高学生的逻辑推理和自主思考能力。
同时,这个实验中涉及到的博弈模型也可以用来分析和解决现实生活中的问题。
2.3 连续混合策略实验连续混合策略是博弈论中的一个重要概念,它在实际应用中有广泛的应用。
在连续混合策略中,玩家有一个概率分布,他们可以随机选择他们的行动。
在竞争和合作的情况下,连续混合策略被用来描述下注、选择行为模型等。
在本实验中,学生将学习如何制定连续混合策略并评估它们的效果。
通过该实验,学生将加深对复杂博弈策略的理解和应用,提高学生的计算能力和分析能力。
3、结语博弈论不仅仅是一种专业的数学知识,它已经成为了理解和解决社会问题的一种重要的工具。
实践是理论的检验,课程设计可以帮助学生更好地理解和应用博弈论的知识。
希望本文介绍的三个课程设计能够为读者提供一些启示,帮助读者更好地理解博弈论的知识和应用。
《博弈论》习题参考答案(第2次作业)一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。
8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高三、计算与分析题1、 (1)画出A 、B 两企业的损益矩阵。
(2)求纯策略纳什均衡。
(做广告,做广告)2、画出两企业的损益矩阵求纳什均衡。
(1)画出A 、B 两企业的损益矩阵(2)求纳什均衡。
两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下:甲乙 左 右 上 下(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>? 答:a>e, b>d, f>h, g<c(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足? 答:a>e, b>d 4、答:(1)将这一市场用囚徒困境的博弈加以表示。
博弈论的经典案例(2)博弈论的经典案例篇4:哈佛大学一位教授提出了这样一个博弈模型:有三个枪手,第一个枪手A的命中率是80%,B是60%,C是40%。
他们同时举枪瞄准、同时射击另两个人中的一个,要尽可能消灭对手,每个人一次机会,一颗子弹,目标是努力使自己活下来。
谁活下来的可能性最大?如果你认为枪法最准的A胜出,那么你就错了。
我们来看,如果你是A,你毫无疑问的会瞄准对你威胁最大的B,而B也会瞄准对他威胁最大的A,而C则也可能瞄准A,那么三个人存活的概率都是多少呢?A = 100% - 60% - (1-60%)* 40% = 24%B = 100% - 80% = 20% (因为命中率为80%的A在瞄准他)C = 100% (因为没有人瞄准他)原来,枪法最不准的C竟然活了下来。
那么,换一种玩法呢?如果三个人轮流开枪,谁会生存下来?如果A先开枪的话,A还是会先打B,如果B被打死了,则下一个开枪的就是C,那么此时A生存的概率为60%,而C依然是100%(他开过枪后A没有子弹了,游戏结束);如果打不死B,则下一轮在B开枪的时候一定会全力回击,A的生存率为40%,不管是否打死A,第三轮AB的命运都掌握在C的手里了。
那么,如果游戏规则规定必须由C先开枪,如果你是C怎么才能让自己活下来呢?答案是胡乱开一枪,只要不针对AB任何一人即可。
当C开枪完毕,AB还是会陷入互相攻击的困境。
博弈论的经典案例篇5:“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
第一章完全信息静态博弈博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性第一节博弈论的基本概念与战略式表述博弈论的基本概念与战略式表述博弈论(game theory )是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(S i )i ∈N ,(U i )i ∈N }有三个基本要素:(1)参与人(players )i ∈N={1,2,…,n};(2)战略(strategies ),s i ∈S i (战略空间);(3)支付(payoffs ),u i =u i (s -i ,s i )。
均衡与均衡结果均衡战略(坦白,坦白)均衡支付(-6,-6)第二节纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡完全信息静态博弈的几点特性同时出招,出招一次;知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的承诺(非合作)一、占优战略均衡占优战略:不管对手战略为何,该参与人可找到一最佳战略。
定义:在博弈G={N,(S i )i ∈N ,(U i )i ∈N }中,如果对所有的参与人i,s i *是它的占优战略,那么所有参与人选择的战略组合(s 1*,…,s n *)成为该对策的占优战略均衡。
“囚犯困境”的扩展两个寡头企业选择产量公共产品的供给军备竞赛经济改革结论:一种制度安排,要发生效力。
必须是一种纳什均衡;否则,制度安排便不能成立。
案例2:智猪博弈猪圈里圈两头猪,一头大猪,一头小猪。
猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。
按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。
若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。
支付如表。
智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动二、重复剔除的占优战略均衡 绝对劣势战略:s i 是一绝对劣势战略当且仅当存在另一战略s i ’∈S i 使得u i (s i ,s -i )< u i (s i ’,s -i ) 对所有s -i ∈S -i 均成立。
(s i ’未必是优势战略)重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。
三、纳什均衡定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s 1*,…,s n *)=(s i *,s -i *)是一纳什均衡,当且仅当对所有参与人而言,u i (s i *,s -i *)≥u i (s i ’,s -i *)对所有s i ’∈S i 均成立。
简单而言,当s 1*是对s 2*的最适反应,s 2*也是s 1*的最适反应时,(s 1*,s 2*)就是二人博弈的纳什均衡。
命题1:纳什均衡在占优战略重复剔除解法中不会被剔除 命题2:重复剔除的严格占优战略均衡一定是纳什均衡。
第三节纳什均衡应用举例古诺(Cournot)寡头模型沙滩卖冰豪泰林(Hotelling)价格竞争模型公共地的悲剧一、古诺寡头模型特点:存在两家厂商;同时行动确定产量。
通过预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡。
厂商1表示为:max p(y 1+y 2e )y 1-c(y 1),得出y 1=f 1(y 2e ),同理得出y 2=f 2(y 1e ),称为反应函数,两条曲线的交点为古诺模型的解。
y1例题:古诺模型的解假设p=a-(y1+y2),C1=y1c,C2=y2c则根据利润最大化的一阶条件分别得到反应函数y 1=f1(y2)=(a-y2-c)/2,y 2=f2(y1)=(a-y1-c)/2,求出均衡产量为(1/3(a-c),1/3(a-c)),为纳什均衡,均衡利润为(1/9(a-c)2,1/9(a-c)2)古诺模型的解:与垄断市场的比较假设为一垄断企业,则有:Max π=y(a-y-c), 得到垄断企业的最优产量y=1/2(a-c) <y 1+y 2=2/3(a-c)垄断利润为π=1/4(a-c)2 >2/9(a-c)2 寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。
三、豪泰林模型寡头企业竞争战略是价格伯川德(Bertrand)模型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡。
豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高豪泰林模型:以空间上差异为例根据两个商店的利润函数,π1=(p 1-c)x, π2=(p 2-c)(1-x)选择使利润最大化的价格,得到一阶条件,求得p 1*=p 2*=c+t,均衡利润π1=π2=t/2旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高。
原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强, 当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。
四、公共地的悲剧生物学家和生态学家哈丁(Garrett Harden)在《科学》(1968年,第162卷)发表《公地的悲剧》。
考虑一块对所有的人都开放的牧场,在着的制度下,可以预期,每一个放牧的人都会在公地上放牧尽可能多的牲口。
增加一头牲口既有正效用,也有负效用。
正效用是牲口的销售收入,增加一头为+1负效用使每增加一头带来的过度放牧的损失,每一个放牧着承担-1/n放牧者合理的决策是增加牲口,直至马瘦毛长,公地毁灭。
四、公共地的悲剧资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度开发;另一类是人们向其中排放废物的公地。
草地放牧:n个农民,每个拥有羊的数量为g i,G=Σg i,v(G)代表每只羊的价值,与草地上放牧的总数G相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即v’(G)<0农民的利润函数πi=g i v(Σg j)-g i c最优化的一阶条件:∂πi/∂g i=v(G)+g i v’(G)-c=0增加一只羊有正效应(羊的价值)、负效应(新增羊使之前所有羊的价值下降)个人边际成本小于社会边际成本,个人最优决定的饲养总量大于社会最优决定的饲养总量“斗鸡博弈”的扩展夫妻间吵架警察与游行队伍公共产品的供给(两富户修路)第四节混合战略纳什均衡混合战略(mixed strategies)定义:σ*=(σ1*,…,σn *)=(σi *,σ-i *)是一纳什混合战略均衡,当且仅当对所有参与人而言,σi *是σ-i *的最适反应,u i (σi *,σ-i *)≥u i (σI ’,σ-i *),对所有σi ’∈Σi 成立)。
持混合战略的前提是在均衡时两种战略的报酬会相等,是预期支付最大化的推导结果。
掷硬币的分析给定参与人1(q,1-q),参与人2的支付是:q+(-1)(1-q)(正面)=(-1)q+(1-q)(反面); 给定参与人2(p,1-p),参与人1的支付为:p(-1)+(1-p)(正面)=p+(-1)(1-p)(反面); 求得(1/2,1/2)是纳什混合战略均衡如果两种战略报酬不相等,那么就变为纯战略(pure strategies)了。
混合战略均衡的博弈原则两博弈方不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性;两博弈方选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。
例:在掷硬币的博弈中,参与人1选正面、反面的概率q,1-q,一定要使参与人2选正面的和反面的期望得益相等。
单纯战略与混合战略的定义G={N,S,U}是一个战略式有限博弈,参与人i 的战略空间S中的任一元素s i 称为i的一个单纯战略(pure strategy);定义在S i 上的一个概率分布函数p i (s i )代表了一个混合战略(mixed strategy)——这个战略的内容是:参与人i以概率p i (s i j )选择单纯战略s i j ,而Σp i (s i j )=1。
单纯战略是混合战略的特例,因为任一单纯战略s i 都可以理解为i以概率1选择s i ,以0概率选取其他所有单纯战略。
引入混合战略,参与人的目标需要修改为“最大化自己的期望支付”Selton:小偷和守卫的博弈一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为V的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。
设小偷被抓后要坐牢,负效用为-P,守卫睡觉而未遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用为-D。
而如果小偷不偷,则他既无得也无失,守卫不睡意味着出一份力挣一分钱,他也没有得失。
(守卫睡的概率)齐威王田忌赛马古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。
比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1000斤铜给赢方。
双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。
实际上,田忌的上马、中马要优于齐威王的中马、下马。
比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛。
齐威王田忌赛马前述为单方面运用策略的故事,如果齐威王预料到田忌的做法,必然会改变各匹马出场的次序。
本博弈中博弈双方的利益是完全对立的,是严格竞争的零和博弈,不会有纯策略纳什均衡,必然是一个混合策略均衡。
假设齐威王采取六种战略的概率分别为p a,p b,p c,p d,p e,p f(加总为1),则田忌采取六种战略的期望得益相等,则得出齐威王与田忌均以1/6的相同概率随机选择各自的六个纯策略,构成本博弈唯一的混合策略纳什均衡。
齐威王田忌赛马在上述混合策略下,齐威王的期望得益为1/6(3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-3-1-1-1-1)=-1,即多次进行这样的赛马,齐威王平均每次能赢田忌1000斤铜,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故混合策略反应函数将博弈方的策略空间扩展到包括混合策略,将纳什均衡扩展到包括混合策略纳什均衡以后,求纳什均衡反应函数的分析方法也可以扩展到求混合策略纳什均衡。
反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反映决策构成的函数。
在纯策略的范畴内,反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反应。
在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应。