当前位置:文档之家› 博弈论课堂实验

博弈论课堂实验

博弈论课堂实验
博弈论课堂实验

博弈论课堂实验。

第一个实验是二级价格拍卖,拍卖品被强制地规定为对每个同学价值10元。让他们出价。结果有1人出8元,有2人出9元,有9人出10元,有5人出11元,有2人出12元,有1人出13元,还有7人出到15元或以上。

第二个实验是苏比克拍卖。我以10元人民币向同学拍卖。依次有同学出价5元,6元,7元,10元,11元,最后叫10元的同学放弃。我10元钱拍卖得到21元(净赚11元)。

第三个实验是选美博弈,结果如下:

学生编号第一轮第二轮第三轮第四轮

1503972

2252533

3313186

4402333

52520207

6281772

723622320

83030102

9251276

101312100

115216

12505071

1390901414

142556100

1551000

163212

176860148

181111

19262642

20351532

21444411

220022

23252075

2440000

25101003

26251205

2755500

282548155

293029157

30303274

3138844

32251386

3315752

34152582

35250.9 2.53

36303073

372510010

=====================

补充:二级价格拍卖规则是,每个人写下他们的出价交给拍卖者,出价最高的人得到拍卖物品,但他只需要付出次高价格的价钱。其余人未得到物品,也不付钱。课堂的实验结果表明约有1半的人出价超过了其对于物品的评价,这并不是理性的选择。理性的结果应该是出价为其对物品的评价。但是,这也可能是因为事前强制了物品对他们价值10元有关(每个人都清楚此物对其他人价值十元)。不过,出价高于、低于十元仍是不理性的。

苏比克拍卖规则:直接叫价拍卖,喊价最高者得到拍卖品(10元钱),但是喊价最高和次高的都需要付出其喊价给拍卖者。理性的做法是不参加拍卖,或者一旦有人参加则自己放弃参加。因为会出现轮番加价的陷阱。

选美博弈规则:每人任选[0,100]区间的一个整数,然后以众人的选择求平均,再在平均值基础上乘0.5,得到一个数,与这个数越接近的选择就得到越高的回报(成绩分数,譬如确定分数计算的公式为100-|xi-0.5∑xi/n|,以此记载学生平时成绩一次)。标准的博弈论解最后是大家都会选择0。但是很多实验表明结果并不如此,因为很多时候人们不一定有这么深的推理能力,即使自己有这样的推理能力也不能确保其他人有同样深的推理能力。课堂实验结果与其他许多同样的实验结果是差不多的。最初人们多选择20-40的数字,但是重复数次后就出现向零方向的收敛,尤其是在获悉前次博弈的结果的时候。选美博弈的思想最早可

追溯到凯恩斯:“……专业投资者的情况可以和报纸上的选美竞赛相比拟。在竞赛中,参与者要从100张照片中选出最漂亮的6张。选出的6张照片最接近于全部参与者一起所选出的6张照片的人就是得奖者。由此可见,每一个参与者所要挑选的并不是他自己认为是最漂亮的人,而是他设想的其他参与者所要挑选的人。全部参与者都以与此相同办法看待这个问题。这里的挑选并不是根据个人判断力来选出最漂亮的人,甚至也不是根据真正的平均的判断力来选出的最漂亮的人,而是运用智力来推测一般人所推测的一般人的意见为何。在这里,我们已经达到了第三个推测的层次;我相信,有人还会进行第四、第五和更多的层次。”(摘自《就业、利息和货币通论》,P.159-160,约翰·梅纳德·凯恩斯,高鸿业重译本)聚点

选美博弈中略有例外的情况是,第10和14号同学,他们的前三次的选择符合收敛的性质,但是第四次选择都选择了100(不可思议!),其他同学的选择也基本上都符合收敛的性质。实验完毕让10、14号两同学描述一下他的决策过程,为什么这样选择。一个同学的解释是,他知道最后大家都会选向0,但是他不想让大家都得到0——其实可能有误解,因为大家都选0并不意味着大家都得到零,都选0的结果是大家的成绩都会是100,另外也有恶搞的成分,另一位同学承认他第4轮就是故意恶作剧的。其实,有人恶作剧可能是大家不会都选0的原因,因为在选择者的推理中,大概也需要把恶作剧纳入考虑。不过时间有限,未能继续做实验检验。

博弈论(课一)

课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章)

博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。

推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!)

博弈论结课论文——大学生活中的困境与突围

是课上所说的“存在优势策略”。 (2)绝色美女困境: 受很多影视作品和网络文学的影响,人们心目中恋爱组合的影像应是“帅哥+美女”,但是在校园里我们常常会看到“美女+野兽”、“帅哥+恐龙”的恋人组合,为什么? 在现实生活中,绝色美女被冷落并非特例,她们的条件比别人好,却没人追求。这种现象的发生根源于信息的不对称,对绝色美女有好感的优秀男生会想:这么美的女孩一定有很高的门槛,自己与其受人家的拒绝后没人要,不如在自己喜欢的女孩中去选择。而野兽们自己没人追求,也就没有受到拒绝后损失的成本机会,他会一心一意、锲而不舍的放手去追那朵“鲜花”,如果追到则其收益无穷大;而如果失败了,也没什么损失。所以“美女+野兽”的组合也就合情合理了,而“帅哥+恐龙”的原因也是如此。 解决“绝色美女困境”的方法就是:假如很多人都对一个特定环境里德绝色美女展开攻势,你放弃是一种优势策略。但当别人都群体冷落这位美女的时候,你就应该勇敢地去追求。当然,这需要很好的观察力和判断力。 二:博弈论在高校考试中的应用——混合策略博弈与完全静态博弈研究对象:学校,学生群体(区分为优秀生与差等生)——分析舞弊者与他们之间的博弈关系,监考老师;其中学生与学校的博弈为混合策略博弈,而学生与学生群体之间的博弈为完全静态博弈。 相互关系:大学生与高校的博弈

A、大学生与高校的博弈分析: 1、事实说明:学生参加考试,其作弊行为发生与否,与高校的考试制度息息相关,而考试制度的直接表现者为监考老师,所以本博弈分析,将高校具体为监考老师,即考察学生与老师的博弈分析,而且该博弈用到的信息均为深大目前的考试制度信息。 2、学生与监考老师的博弈分析模型(此博弈为混合策略博弈)。 假设:老师和学生都是理性人,二者在决策的过程中不会考虑道德成本,而且只要老师监考尽职,学生舞弊行为一定被发现。 (1)支付矩阵的构建。假设以下参数: ①监考老师认真监考的成本 B1;认真监考的收益 A1 ②不认真监考的成本 C2,监考老师不认真监考的收益 R2 ③学生诚信考试的收益 C1。 ④学生舞弊考试的收益 G2;学生舞弊的成本 M (3)均衡意义:①由于学生的作弊概率与老师认真监考的成本B1 和不认真监考的收益 R2 成正比,与老师认真监考的收益A1 和不认真监考的成本 C2 成反比,而在现实学校生活中,老师认真监考的

博弈论课堂实验

博弈论课堂实验。 第一个实验是二级价格拍卖,拍卖品被强制地规定为对每个同学价值10元。让他们出价。结果有1人出8元,有2人出9元,有9人出10元,有5人出11元,有2人出12元,有1人出13元,还有7人出到15元或以上。 第二个实验是苏比克拍卖。我以10元人民币向同学拍卖。依次有同学出价5元,6元,7元,10元,11元,最后叫10元的同学放弃。我10元钱拍卖得到21元(净赚11元)。 第三个实验是选美博弈,结果如下: 学生编号第一轮第二轮第三轮第四轮 1503972 2252533 3313186 4402333 52520207 6281772 723622320 83030102 9251276 101312100 115216 12505071 1390901414 142556100 1551000 163212 176860148 181111 19262642 20351532 21444411

220022 23252075 2440000 25101003 26251205 2755500 282548155 293029157 30303274 3138844 32251386 3315752 34152582 35250.9 2.53 36303073 372510010 ===================== 补充:二级价格拍卖规则是,每个人写下他们的出价交给拍卖者,出价最高的人得到拍卖物品,但他只需要付出次高价格的价钱。其余人未得到物品,也不付钱。课堂的实验结果表明约有1半的人出价超过了其对于物品的评价,这并不是理性的选择。理性的结果应该是出价为其对物品的评价。但是,这也可能是因为事前强制了物品对他们价值10元有关(每个人都清楚此物对其他人价值十元)。不过,出价高于、低于十元仍是不理性的。 苏比克拍卖规则:直接叫价拍卖,喊价最高者得到拍卖品(10元钱),但是喊价最高和次高的都需要付出其喊价给拍卖者。理性的做法是不参加拍卖,或者一旦有人参加则自己放弃参加。因为会出现轮番加价的陷阱。 选美博弈规则:每人任选[0,100]区间的一个整数,然后以众人的选择求平均,再在平均值基础上乘0.5,得到一个数,与这个数越接近的选择就得到越高的回报(成绩分数,譬如确定分数计算的公式为100-|xi-0.5∑xi/n|,以此记载学生平时成绩一次)。标准的博弈论解最后是大家都会选择0。但是很多实验表明结果并不如此,因为很多时候人们不一定有这么深的推理能力,即使自己有这样的推理能力也不能确保其他人有同样深的推理能力。课堂实验结果与其他许多同样的实验结果是差不多的。最初人们多选择20-40的数字,但是重复数次后就出现向零方向的收敛,尤其是在获悉前次博弈的结果的时候。选美博弈的思想最早可

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

自己写的博弈论结课论文

自己写的博弈论结课论文 博弈论论文 博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。 页 1

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

自己写的博弈论结课论文

博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。

反而会使自己的利益也受到损害,得不偿失。由此可以看出,生活在集体中就不能只以自己为中心,要多为他人着想,多为集体着想,多一些理性的交流和沟通,互相学习、团结互助、彼此尊重、取长补短,营造出和谐温馨的氛围对于个人的身心发展都大有好处,同时会使每个人的收益大幅增加达成共赢,获得更好的结局。

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论课程心得体会

《博弈论与信息经济学》课程心得体会 作为一名会计专业硕士,我选修这门课程是为了了解和学习一种思想方法,这种方法我很早就感兴趣,电影《美丽的心灵》中纳什的故事让博弈论在我心中显得非常神秘和高大上。第一堂课吕老师谈到博弈论已经成为一种主流方法时,学习的欲望变得更为强烈。经过九周的学习,尽管由于有些地方因为数学能力有限,不得尽懂,但我觉得自己起码已经揭开了这种方法的入门和核心的面纱。 我认为,会计专业硕士是为了培养立足于会计的高级管理人才而设置的,除了扎实的专业知识和理论功底,我觉得掌握思想方法是尤为重要的能力。面对会计行业的变革,作为一名研究生,财务管理能力和管理会计能力是我的核心竞争力。这两种能力需要缜密的思维,科学的方法。如果说缜密的思维更需要在学习和实践中不断历练,科学的方法就需要不断地去接触和了解,不断地去主动学习。博弈论就是一种科学的方法。我觉得博弈论是一种寻求均衡的科学,也是一种创造规则的科学。它让我了解面对不同利益相关者时怎么去寻求均衡、博弈,甚至创造有益的规则。同时,它让我有了一种更加科学、简洁的视角看待事物,非常实用有效而且简单漂亮。 博弈论的核心应该是纳什均衡,这是一个理性的策略组合,每个参与者在对方的选择一定情况下会做出纳什均衡策略组合中的策略。这种选择将是每个理性参与人最终的选择。这个道理很明了,也正是明了让这个理论非常有力。吕老师带着我们解决一个又一个案例中的问题时,我感觉到这种方法的神奇和独特。我印象里最深的是吕老师对法律的看法:法律让不可置信的承诺变成可置信的承诺,好的法律是看似严苛,但很少有人触犯它。以前在学习经济法时,我对“法律是一种合同”这种观点不是很在意,吕老师的说法让我有了新的认识。让不可置信承诺变成可置信的承诺,使得最有益的策略组合成为纳什均衡,在这一点上合同和法律的目的和性质是一样的。我还记得吕老师说《反国家分裂法》是一部非常好的法律,在以前我因为它几乎很少被使用而感觉不到这部法律的重量,但从博弈论的角度来看,这部法律使得针对台湾,宣布独立就会被制裁成为一种可置信的承诺,吕老师的解释让我非常赞同。我真的觉得自己看某些问题的视角发生了变化,更加地深刻和科学。 我觉得正是这种视角是我学习这门课程最大的收获。我知道,短短九周的学习远远不足以掌握博弈论,我甚至或许不能完整地计算出一道例题,但是我对它有了一个基本的认识,理解它的理论基础,最重要的在看一些问题时我可以尝试着用博弈论的角度去试试看。最可怕的不是不会用博弈论的技术和方法,可怕的是在能够使用它时我不知道以它的角度去看待问题,知道可以使用这门科学的技术和方法。经过这两个多月的课程,相信将来如果用的着这种方法时,我知道从哪里着手去学习。

博弈论与纳什平衡

博弈论与纳什平衡 博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。 纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。 所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。 类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。 在互联网这个原始丛林中:最优策略是如何产生的呢? 一、博弈中最优策略的产生 艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。 社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。 显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5

博弈论结课论文

博弈论基础 结课论文 课程名称:博弈论基础授课教师: 专业班级: 学生姓名:学号 成绩:

博弈随笔 以前,只是听说博羿——认为是那些?谍战片?似的斗心机,拼命得到所谓的胜利,让我想到?左右互搏术?。今天,挺欢喜的,值得一听,更加值得一想。 老师与学生第一节课,以(身边)故事开场,吸引了在玩、在谈、在写、在愣神的学友的耳朵和眼球,学友们——也学到了些东西,或者与博羿之思想能碰撞闪现出火花,有利益关系吗?一个,望学术或教育水平得到提高或责任的心。另一个,得点学分或找点乐子或陪伴人或还真有少许的是学的。俗话说的好?愿打,也得愿挨?呀!要么,人数成?抛物线?一样变化,要么是?倒梯形?,这也许就是学生,大学生的规律!而师,或呆板地照本宣科或妙趣横生或平平淡淡。显然,我们比较幸运点! 注:学点东西——还是比较好的。如何提高教学质量与学习效果?一个人,当TA面对TA喜欢或感兴趣的,才会花时间去听(无意评价教育体系),这可能占到大部分吧(希望),少部分随意的点的(暂评),因此,怎么才能延长其喜欢的持续时间:才是关键(除一些真学的)。 总之,?少壮不努力,老大徒伤悲?! 效率——单位个体在单位时间内获得的成果。现在,自己,的确是在玩时间战术,耗得起吗?也许只有在有效时间内完成自己的任务,努力加信心 (说偏了)。没话了,挂住了。 记于二零一二年三月一号晚二十三点五十六分(写了将近四十分

钟) 今天晚上,上课,感觉到了无聊与无奈,选修与专业,浅与深。主要讲了一些博弈的基础知识(概念类),自己也记了一些笔记(各人有各自的学习方法)。而我是靠时间磨靠笔磨的!偏了,,回归正传。她(老师)讲了一些故事——这的确挺吸引人眼球与耳朵的。但下面因为玩,其他的继续。同志们,半推半就的去 STUDY! 3月中旬的一次课,忘了忘了! 今天——2012年3月22日,博弈论的第三次课了(好像学生上课,都是这样似的)。 她,老师讲了纳什均衡的运用实例——一些经典例子:双垄断的博弈——也推倒出了于今下有实际意义的结论!但,我好像没有像第一次上课那样——认认真真的听:边看着鲁迅的小说边听着老师的?絮叨?,其实——自己挺喜欢数学的:可由初中的喜爱得出,只是随着时间的推移与知识的无奈——?膨胀?,自己也被自己慢慢的舍弃了! 难道自己没有想过吗?答案,不言而喻! 一个人,可悲的不是知道,而是无知与明明知道而又偏偏无知! 莫伤,也伤不起!三月的最后一节,老师讲了一些?概率性?的纳什均衡。第一小节,师已讲了个例子,同时也演算了一个例子,当下课布臵了一个小问题,在课间做,却无人问津。上课时?自然?鸦雀无声。

博弈论

1.“求爱博弈”:“自然”以P和1-P的概率决定求爱者是善良还是邪恶,但被求爱者不知道求爱者的真实情况,只知道其不同类型的概率分布,得益矩阵如下:通过海萨尼转换表示以上博弈问题; 找出该静态贝叶斯博弈贝叶斯纳什均衡。 *善良求爱者得益矩阵 被求爱者 接受不接受 求爱者求爱100,100 -50,0 不求爱0,0 0,0 *邪恶求爱者得益矩阵 被求爱者 接受不接受 求爱者求爱100,-100 -50,0 不求爱0,0 0,0 https://www.doczj.com/doc/041462503.html,im、Peter和John三人,由于Wet特被谋杀而受到传讯。犯罪现场的证据表明,可能有一名律师参与了对Wet特的谋杀。 这三人中肯定有一人是谋杀者,每一名可疑对象所作的两条供词是:Laim:(1)我不是律师。(2)我没有谋杀德怀特。 Peter:(3)我是个律师。(4)但是我没有杀害德怀特。 John:(5)我不是律师。(6)有一个律师杀了德怀特。 警察最后发现:a.上述六条供词中只有两条是实话;b.这三个可疑对象中只有一个不是律师。 你知道是谁杀害了德怀特吗? 3.张教授、李同学和王同学一起做推理实验。张教授用两张小纸片,各写一个正整数,且两者差是1。他把一张纸片贴在李同学额头上,另一张贴在王同学额头上。于是,两个人只能看见对方额头上的数。张教授不断地问:你们谁能猜到自己头上的数吗? 李说:“我猜不到。” 王说:“我也猜不到。” 李又说:“我还是猜不到。” 王又说:“我也猜不到。” 李仍然猜不到; 王也猜不到。 李同学和王同学都已经三次猜不到了。 可是,到了第四次,李同学喊起来:“我知道了!”王同学也喊道:“我也知道了!”问:李同学和王同学头上各是什么数?

博弈论与社会科学方法论(潘天群)

通识课 课程中文名称:博弈论与社会科学方法论 课程英文名称:Game Theory and Methodology of Social Sciences 课程代号:开课学期:第一学期(秋学期) 主讲教师:潘天群职称:教授、博导 研究专长:博弈论、逻辑学、科学方法论 所在院系:哲学联系电邮:tqpan@https://www.doczj.com/doc/041462503.html, 授课对象:全校二、三年级本科生(不限专业) 一、主讲教师简介: 潘天群,哲学博士,现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才(2006)。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。 主要研究领域为:逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部:《行动科学方法论》,《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》,自2002年出版以来深受读者欢迎,为畅销书与长销书,已出版第三版。 主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”(2009)。 二、课程简介 由于“他人”与“我”是既合作又竞争的关系,研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来,对社会现象表现出强大的解释力,已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖,许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学(如生物学、人工智能)之中。 本课程突破数理博弈论的框架,结合主讲教师十年来的研究工作,构建适合

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论课后习题

第一章导论 1、什么是博弈?博弈论的主要研究内容是什么? 2、设定一个博弈模型必须确定哪几个方面? 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型? 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么? 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2、为什么说纳什均衡是博弈分析中最重要的概念? 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响? 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10 000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会要求什么数额,为什么? 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么?当n趋向于无穷大时博弈分析是否仍然有效? 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci <a/2,问纳什均衡产量各为多少?如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少? 10、甲乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有什么好的办法? 11、设一个地区选民的观点标准分布于【0,1】上,竞选一个公职的每个候选人同时宣布他们的竞选立场,即选择0到1之间的一个点。选民将观察候选人们的立场,然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人,宣布的立场分别为x1=和x2=,那么观点在x=左边的所有选民都会投候选人1的票,而观点在x=右边的选民都会投候选人2的票,候选人1将以60%的选票获胜。再设如果又候选人的立场相同,那么立场相同的候选人将平分该立场所获得的选票,得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选(即不考虑自己对观点的真正偏好),如果又两个候选人,问纯策略纳什均衡是什么?如果又三个候选人,也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

耶鲁大学公开课博弈论笔记 博弈论 讲

博弈论作业(博弈论24讲)数应专业 一、 1、理性人:指代这一类人,他们只关心自己的利益。 2、如果选择a的结果严格优于b,那么就说a相对于b来说是一个严格优势策略。结论: 不要选择严格略施策略。 3、理性人的理性选择造成了次优的结果 4、举例:囚徒困境、宿舍卫生打扫问题、企业打价格战等 5、协和谬误收益很重要,“如欲得之,必先知之” 6、要学会换位思考,站在别人的立场上看别人会怎么做,在考虑自己受益的同时,要注 意别人会怎么选择 二、 1、打渔问题、全球气候变暖与碳排放问题 2、博弈的要素:参与人、策略集合、收益 3、如果策略a严格劣于策略b,那么不管他人怎么选择,b总是更好的选择 4、军队的入侵与防卫问题 5、所有人都从1到100中选个数字,最接近所有人选的数字的均值的2/3者为胜,这个数 字是多少呢?作为理性人,每个人都会选择67(100*2/3)以下的数,进一步假设你的对手也是理性的,你会选择45(100*4/9)以下的数……依据哲学观点,如果大家都是理性程度相当的,那么最后数字将为1,然而结果却是9,这说明博弈的复杂性 6、共同知识与相互知识的区别 三、 1、利用迭代剔除法领悟中间选民问题 2、迭代剔除法就是严格下策反复消去法,不断地把劣势策略剔除出去,最后只剩下相对 优势的策略 3、中间选民问题就是,在两党制中,政党表述施政纲领要吸引位于中间位置的选民,他 们认为在选举中处于中间标度可以吸引左右两边的选民,并以此获得胜利。 4、中间选民问题理论成立的条件是有两个参与人;政治立场能使选民相信。 5、由此延伸出来的还有加油站选址问题,两家加油站不是在不同的路口选址,而是在不 确定哪个位置较佳的时候会选在同一处,这也是“中间选民定理”的凸显 6、在迭代剔除法不能运用时,比如说该博弈中博弈方1和2均没有严格下策,可以用二 维坐标系画出选择策略之后的收益分布

博弈论与实验研究(泽尔腾)

我今天讲的是博弈理论,这也是实验研究的一个重要基础。首先是博弈论的起源,它来自德国冯·诺依曼1928年的文章。但博弈论的真正开始是冯·诺依曼和摩根斯腾(John von Neumann-Oskar Morgenstern)1944年的著作《博弈论和经济行为》。 先来讲一下什么是博弈论,博弈论是基于目标导向的冲突和合作中交互作用的数学建模和分析方法,即一种数学建模的分析方法。博弈论研究的情况发生在几个参与者发生目标导向交互作用的时候,交互作用包括冲突、合作或者二者并存。参与者可以是人,也可以是动物,还可以是人类构成的组织,如企业间的冲突和合作等。 下面,我们需要澄清一些误解,即博弈论不是什么。为何它不是帮助我们赢得纸牌赌博或者轮盘赌的学问?从长期来讲,你是不会赢得这些人机游戏的,它们不是多个参与者的活动。博弈论也不是告诉人们如何通过投机在股票市场上致富的理论。另外,博弈论给你一些基本的思考原则和启示,但也不是帮你赢得下棋或者扑克等复杂游戏的理论。那么,博弈论对于什么有帮助呢?博弈论是一种提供参与者在交互过程中策略和行动的内在逻辑洞察力的学问,可以应用到人类社会的经济理论、政治理论、军事理论或者生态演化理论中,也可以用于机制设计和成本会计等具体领域。 接下来,我们通过一个例子来说明博弈论的一些基本概念。 这里有三个企业(i =1, 2, 3)互相竞争,处在一种求大于供的市场,x i (x i 的取值区间为0到20)为各个企业的产品供应数量,总供应量x 为三者之和,即x =x 1+x 2+x 3。当x ≤20时,价格由公式p =20-x 给出,其它情况价格为0。各个厂商的利润P i 为x i 乘以p 。这个实验可以以学生为对象参与进行,获得结果后随机分 博弈论与实验研究 ○ (德)莱茵哈德·泽尔滕 第一种情况下,三个厂商供应量分别为4、8、6个单位,总量为18,所以价格为2,三个厂商的利润分别为8、16和12。第一问题是谁表现最出色?是否为厂商2?因为在此次博弈中它的利润比其他两个厂商高。不过,我们可以看到,在第二种实验情况下,如果它将供应量调整为5,那么价格为5,它的利润便会提升为25。实际上它犯了一个错误,自己损失了9个利润单位,在这个错误中,它的利润高于其他厂商是因为它对其他厂商的损害大于对自己的损害。 第二个问题是这种情况下应该如何做。有人讲,每个厂商供应量应该为3,则三个厂商总的最大利润为99,每个厂商利润为33。那么这是满意的解决方案吗?还不是,如果每个人供应量为3,而第一个厂商如果提供7个而不是3个单位,那么它就得到49的利润,其他人获得21的利润,这是一个很大的诱惑,供应量都为3的情况容易被否决,所以某个厂商如果获悉其他人的供应量为3,那么它就可以在3到7之间进行选择。也就是每个人都提供三个产量在具有绑定的协议的情况下是可以实现的;但是绑定的协议在这

相关主题
文本预览
相关文档 最新文档