博弈论之囚徒困境

  • 格式:doc
  • 大小:2.42 MB
  • 文档页数:4

下载文档原格式

  / 4
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论之囚徒困境

阿普顿是普林斯大学的高材生,毕业后被安排在爱迪生身边工作,他对依靠自学而没有文凭的爱迪生很不以为然。一次,爱迪生要阿普顿算出梨形玻璃泡的容积,阿普顿点点头,心想:这么简单的事一会几就行了。只见他拿来梨形玻璃泡,用尺上下量了几遍,再按照武样在纸上画好革田,列出了一道算式,算来算去,算得满头大汗仍没算出来。一连换了几十个公式,还是没结果,阿普顿惠得满脸通红,狼狈不堪。爱迪生在实验室等了很久,觉得奇怪,便走到阿普顿的工作问,看到几张白纸上密密麻麻的算式.便笑荚说:“您这样计算太浪费时间了。”只见爱迪生将一杯水倒连玻璃泡内,交给阿普顿说:“再找个量筒来就知道答案了。”阿普顿茅塞顿开,终于对爱迪生敬服.最后成为爱迪生事业上的好助手。有时候。科学并不一定意味着烦琐的计算与剥量,而是一种有浓厚艺术气息的思维方式。前者固然可以得出正确的结论,但是后者同样可以用一种出入意表的方式曲径通幽。这种方式,与我们在生活中运用博弈科学有异曲同工之妙。大量的教学模型吓不倒我们,因为我们可以对它们置之不理。有一个脑筋息转弯问题是这样的:在什么情况下零大干二,二大干五,五又大干零’答案是:在玩“石头.剪刀.布”游戏的时候。

博弈.就是用这种游戏思维来突破看似无法改变的局面,解决现实的严肃问题的策略。在博弈中,每个参与者都在特定条件下争取其最大利益,强差一者来必胜券在握,弱者也未必永无出头之日。因为在博弈中,特别是多十参与者的博弈中,结果不仅取决干参与者的实

力与策略,而且还取决于其他参与者的制约和策略。事实上,博弈过程本来就不过是一种日常现象。我们在日常生活中经常薷要先分析他人的意田从而做出合理的行为选择,而所谓博弈就是行为者在一定环境条件和规则下,选择一定的行为或策略加以实施并取得相应结果的过程。

博弈论首先是我们思索现实世界的一套逻辑,其次才是把这套逻辑严密化的数学形式。博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的.不是为了享受博弈分析的过程,而在于赢得更好的结局。说到底,博弈论毕竟只是一个分析问题的工具,用这个工具来简化问题,使问题的分析清晰明了也就够了。博弈的思想既然来自现实生活,它就既可以高度抽象化地用教学工具来表述,也可以用日常事例来说明,并运用到生活中去。

在斯大林时代的苏联,有一位乐队指挥坐火车前往下一个演出地点。正当他在车看当晚就要指挥演奏的作品乐谱时。两名克格勃(KGB,苏联国家安全警察。实际是政治特务将他作为间谍逮捕了。他们以为那乐谱是某种密码,这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲,却无济于事。在乐队指挥被投入牢房的第二天,审问者自鸣得意地走进来说:“我看你最好还是老实招了吧,我们已经抓住你的朋友柴可夫斯基了.他这会儿正向我们交代呢。你如果再不招就枪毙了你。如果交代了,只判你10年。”笑过之后,每个人都会思考其中所蕴涵的东西。但是如果认为这个笑话仅仅讽刺了克格勃特务的无知与无耻,那是不够的。事实上,克格勃们的花招,是想运

用博弈论中囚徒困境理论,达到自己的目的。虽然他们未必知道博弈论,但是他们明显企图运用其中的布局,使乐队指挥被迫选择招供。i950年,担任斯坦福大学客座教授的数学家图克(Tucker),给一些心理学家解释他正在研究的完全信息静态博弈问题,为r更形象地说明博弈过程.他用两个犯罪嫌疑人的故事构造了一个博弈模型.即囚徒嗣境模型。这一模型的过程具体是这样的:两个共同偷窃的犯罪嫌疑人甲和乙被带进警察局警方对两名犯罪嫌疑人实行隔离关押.隔离审讯,每个犯罪嫌疑人都无法观察到司伴的选择警方怀疑他们作案,但手中并没有掌握确凿证据,于是明确地分别告知两名犯罪嫌疑人:对他们犯罪事实的认定及相应的量刑完全取决于他们自己的供认如果其中一方与警方合作,供认偷窃之事.而对方抵赖.供认打将不受惩罚,无罪释放.另一方则会被判重刑10年;如果双方都与警方合作共同供认,各被判刑5年;而如果双方均不认罪.因为警察找不到其他证据.则无罪释放。每个犯罪嫌疑人都有两种可供选择的策略:供认或不供认而且,每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。如果甲选择抵赖.那么就可能会出现两种情况:如果乙选择供认.那么甲将被加重惩罚.判刑10年.而乙则无罪释放:如果乙也同样选择抵赖,那么他们两个都将因证据不足而被释放。很显然.这第二种结果对于两个人都是最有利的但是.因为警方没有把两名嫌疑人放在一间囚室里.因而这种合作难以顺利进行.使得结果预测的不确定性加大.或者说增加了抵赖合作的风险性因此.基于人是理性的这一前提.由于犯罪嫌疑人不知道对方的想法.最理性的博弈