当前位置:文档之家› 博弈论在频谱共享中的应用

博弈论在频谱共享中的应用

博弈论在频谱共享中的应用
博弈论在频谱共享中的应用

博弈论在频谱共享中的应用

胡玉佩,曾令康

北京邮电大学电子信息工程学院,北京 (100876)

E-mail: hypfly73@https://www.doczj.com/doc/f514165664.html,

摘要:博弈论(Game Theory)是专门用于研究若干个体之间竞争有限资源的数学理论。博弈论已被成功用于研究无线网络资源分配最优化和提高效率的问题。本文首先简单介绍了博弈论的基本概念;然后按照不同的分类准则,考虑无线网络资源分配的实际情况,描述了两种常用的博弈论类型:非合作型博弈论和合作型博弈论,并对这两种博弈论在无线网络资源分配中的应用列举了若干实例。

关键词:博弈论;非合作型博弈论;合作型博弈论;纳什均衡;帕累托最优

1.引言

在目前的无线网络系统中,为了避免或是减轻不同无线技术之间的干扰,广泛采用固定的频谱分配政策,即由国家政府机关进行频谱分配,将一部分频谱分别划分给指定的机构进行特定的服务,如无线电视、蜂窝系统、WLAN等,被指定分配的频谱称为授权频谱(licensed band),未被指定分配的频谱称为未授权频谱(unlicensed band),由国家机关授权使用某授权频谱的机构则被称为该授权频谱的授权用户(licensed user),反之则被称为未授权用户(unlicensed user)。大多数情况下,在无线网络中出现的科技创新都是基于未授权频谱的。近年来,随着无线技术的快速发展,新业务层出不穷,使原本就已非常有限的未授权频谱变得越来越拥挤,加剧了频谱资源有限性引起的频谱资源匮乏问题。

但是,频谱的匮乏是相对的,而不是绝对的,这种匮乏是由当前频谱资源管理上存在着的供新业务使用的频谱匮乏和已授权频谱使用效率不高这两个问题共同引起的。从美国联邦通信管理委员会(Federal Communications Commission)提供的测量数据来看,授权频谱远远没有得到充分的利用,其利用率随着时间的变化和地理环境的不同,一般在15%~85%之间[1]。因此FCC考虑用实时动态的方法代替已有的固定分配方法进行频谱分配,以解决上述资源匮乏问题。按照实时动态分配频谱的思想,FCC提出一项新的政策[2],将认知无线电(Cognitive Radio)技术应用于无线网络系统中。在此类系统中,授权用户划出部分或是全部授权频谱资源,按照一定的准则,使认知用户即未授权用户可以使用该频谱。为了保证授权用户的绝对传输质量,未授权用户的发射功率和工作频谱都要受到严格限制,因此需要未授权用户合理有效地分配资源,提高系统效益。在现有的知识体系中,博弈论是专门用于研究多个利益共同体之间竞争有限资源的数学工具,并且近年来理论体系不断完善,日趋成熟。实际上,博弈论已经在不同领域得到了广泛的利用,如经济学,政治学,生物学等[3]。同样,博弈论在无线网络中的应用已经引起了越来越多的重视,并且对于无线系统的分析起到巨大的推进作用。为了紧跟技术前沿,本文将对博弈论在资源分配中的应用进行简单的介绍。

2.博弈论

博弈论(Game Theory),有时也称为对策论,或者赛局理论,是应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化的激励结构(游戏或者博弈)间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法,同时它也是运筹学的一个重要学科[3]。

在实际生活中,博弈论经常被用作分析两个及两个以上决策者之间相互作用。一次完整

的博弈包括三个部分[4]:局中人,在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人;策略,一局博弈中,每个局中人都有选择实际可行的完整的行动方案,此方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略;得失,一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为效益函数。

一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

2.1 非合作型博弈论(Non-cooperative game theory)

在非合作型博弈论中,每个局中人与其他局中人之间没有共同协议的束缚,根据自己的当前状况,独立采取自己的最优策略而不经过协商,但是每个局中人的策略又会影响其他局中人的策略的选择。在非合作型博弈论下得出的结果或者可以称之为均衡点,即纳什均衡(Nash Equilibrium) [4],其物理含义是所有局中人采用的策略的集合,且是任何局中人都不想背离的策略集合。系统达到纳什均衡时,任何局中人都无法在其他局中人的策略不变的情况下提高自己的效益,也就是说在纳什均衡状态下,每个局中人所选策略是最优的。纳什均衡是一种稳定的状态,在这种状态下,任何局中人都没有改变自己策略的要求。

为说明非合作型博弈论的特点,特以著名的囚徒困境为例[3]。此例中,两个共同犯罪的囚徒就是两个局中人,他们被安置在两个独立的房间中且需要做出选择,认罪或是否认。每个囚徒都被提前告知惩罚措施:如果两个人都认罪,那么每个人将会分别被判刑入狱两年;如果都否认,两个人都将会被判刑入狱一年;如果一个认罪,一个否认,那么认罪的人将会得到释放,而否认的人将受到严厉的惩罚,被判入狱四年。此问题可总结为图1所示。

认罪否认

认罪 -1,-1 0,-2

否认 -2,0 -2,-2

图1 囚徒困境

由于两个罪犯是被分别放置于两个独立的房间,没有办法互相商量对策,只能从自己的利益出发,那么对于两个罪犯来说最有益于自身的策略是认罪,两个人都认罪的结果就是此次博弈的唯一的纳什均衡解。但是显然这并不是此次博弈的最优解,因为两个人都否认时二人所获得的利益才最大。由此可以看出在非合作型博弈论模式下,纳什均衡解并不一定是最优解,即不是帕累托最优解(Pareto Optimality)[4]。帕累托最优是资源分配的一种理想状态,是指在没有使任何人境况变坏的前提下,任何一个人都没有办法取得更大效益的状态。而帕累托改进是指一种变化,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。一方面,帕累托最优是指没有进行帕累托改进的余地的状态;另一方面,帕累托改进是达到帕累托最优的路径和方法。

非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是没有

效率的,个人利益和全局利益存在着明显的冲突矛盾。普遍认为低效的产出情况是需要避免的,因此在用非合作型博弈论解决问题时效益函数的建立以及每个局中人针对不同效益函数所采用的策略要注意尽可能实现系统性能的帕累托最优化。

2.2 合作型博弈论(Cooperative game theory)

在合作型博弈论中,每个局中人在博弈开始之前,从自己的利益出发与其他局中人谈判或是讨价还价,尽力形成联盟,尝试相互合作并达成共识,如果不能达成共识的话,局中人就会以非合作型博弈的方式采取措施。局中人达成的共识是有一定的限制条件的,而且每个局中人都不得私自背离。在形成的联盟中,每个局中人可选择与所有其他局中人讨价还价以获得最大效益,其结果对联盟各方均有利。通常在局中人合作情况下获得的效益要比局中人之间相互独立的进行资源分配所获得的效益要大,大多数情况下是帕累托最优的。

合作博弈强调的是团体的理性,强调的是效率、公正、公平,建立效益函数时要把提高效率和保证公平作为博弈问题的重点。

3.博弈论在资源分配中的应用

当前无线网络中的资源分配问题就是如何将有限的授权频谱分配给多个未授权用户,使无线网络资源能够得到尽可能大的利用,改善目前所存在的未授权频谱匮乏和授权频谱利用率低的现状,实现无线网络的高速和高效传输,满足日益壮大的无线用户的各种需求。无线网络中未授权用户之间对有限频谱资源的竞争可以看作是一次博弈,无线网络的资源共享和分配即可建立博弈模型,每个未授权用户终端可作为一个局中人,相互竞争使用网络资源,如频谱、能量等。

在无线网络中,根据是否有中心控制节点,或者说各个未授权用户终端是否需要交互信息,以非合作型博弈论和合作型博弈论为基础建立模型。

3.1 非合作型博弈论应用实例

在受到强烈信道间干扰(CCI,Cochannel Interference)和信道时变性较强的无线网络中实现有限无线资源的高效共享是一个重大挑战。资源分配[5],如功率控制和自适应调制等是抵抗这些有害影响的重要手段,并且可以在干扰受限的无线网络中提高频谱效率。由于用户之间相互并不了解情况,无法进行协作,因此可以建立非合作型博弈模型[6] [7] [8] [9],每个用户独立的自私的分配资源,目的是使自身的效益最大化。

用博弈论来分析无线网络资源分配,可以从不同角度入手建立模型解决问题。无线网络系统可以按照频谱的传输特性,将整个网络分成多个小区,把问题细化,再进一步进行资源分配。Kwon等人提出一种应用于多小区系统的分布式资源分配方案[10],用这种方法获得的效益比采用平均分配功率的方法获得的效益要大的多。类似于未来802.22网络的感知无线电系统,可以将整个无线网络系统分成两级:从服务提供商(SP)和终端用户,此处终端用户特指未授权用户,未授权用户在不干扰授权用户使用和其他未授权用户的情况下,共享授权用户的频带[11]。在此系统中,某一地理区域的某一频段通过SP分配给未授权用户,每个未授权用户以传输速率为自变量建立效用函数,系统的最终目的就是在功率的限制下使未授权用户的效用函数之和获得最大值,同时通过频谱权重来实现各SP之间的简单协作。每一次的资源分配所需的频谱权重由上一次分配结果决定,影响本次分配时各SP所能使用的频段。

无线通信系统中的用户一般通过空气介质进行传输,而空气对于所有的信号来说都是一个比较普遍的传输媒质,因而每个用户的信号都会对其他用户的信号造成干扰,对于授权用户和未授权用户都是如此。此时通常都会根据未授权用户的信干比(SIR,Signal-to-interference Ratio)来衡量系统的性能。另外,由于未授权用户一般都是移动用户,电池能量一般而言都是有限的,希望在比较高效的传输信号时消耗的电池尽量少,因此传输功率的控制是资源分配的一个重要部分。近年来人们开始用博弈论来解决功率控制问题[12] [13] [14],在建立博弈论模型时采用非合作型博弈论,用SIR衡量系统效益并建立效益函数,每个未授权用户都努力使自己的效益最大化,达到纳什均衡。但是由于用户都是根据自己的情况独立的进行资源分配,因此从社会的角度来看达到纳什均衡时所获得的系统效益并不一定是最佳结果,针对这一问题Shah和Saraydar分别提出在模型中引入一种线性价格政策函数(Pricing Policy Function)来提高系统效益[15] [16]。使用价格政策的非合作型博弈论模型,可以通过引入简单的合作来提高系统性能,同时也保持了各未授权用户分配功率的独立性,并且可以达到纳什均衡。但是由于价格政策函数是线性的,并且所有用户都使用同一个价格因子,此模型依然无法达到社会利益最优即帕累托最优。如果系统想要达到帕累托最优,那么每个从用户采用的价格政策函数要比线性函数复杂的多,而且每个从用户所采用的价格政策函数也不完全相同,这在实际操作中的难度很大,几乎是无法完成的。

无线网络资源分配方案按照其关注角度不同,可以分为以用户为中心的方案和以网络系统为中心的方案。以用户为中心的方案目的是使用户个体利益最大化,而以系统为中心的方案的目的是尽量使系统效益最优。上面提到的功率控制算法就是典型的以用户为中心的方案。而最大化网络信息容量[17] [18]或是最大化系统吞吐量[19]可看作是以系统为中心的方案。这两种方案一个显著的区别是以用户为中心的方案的QoS分布较以系统为中心的方案的分布平坦的多。以系统为中心的方案倾向于将大多数的甚至是全部的系统资源分配给少数信道质量较好的用户,而以用户为中心的方案则没有类似的情况发生。在上面提到的文献中,采用的方法是将用户的功率控制和系统的吞吐量一起建立一个效益函数,但是这样做会出现由于函数的非线性得到的纳什均衡解是局部最优而不是全局最优的不理想情况,如同上文功率控制算法中出现的问题。为避免这种情况,可以将功率控制和自适应速率分配问题结合考虑,在固定的BER(Bit-error Rate)的限制下建立双线性不等式[20],即当功率固定时吞吐量受到线性限制,而当吞吐量固定时功率受到线性限制。Feng等人首先提出了当系统中只使用一个效益函数并且没有使用自适应调制时,采用同时考虑用户标准和系统标准的一种双重标准的最优化方法的思想[21]。Han等人将以用户为中心的方案和以网络系统为中心的方案结合在一起设计博弈模型[22],从而实现将功率控制和自适应调制相结合。此种方法得到的系统效益非常接近最优结果,但是,由于建立的两个函数之间相互联系相互影响,因此实际操作时耗费时间很多,实施起来也比较困难。

在采用上述方法的系统中,未授权用户使用的是空白频谱,为了保证授权用户的正常数据传输,需要未授权用户检测频谱是否空闲,因此要求未授权用户对其所处的无线电环境变化具有非常高的敏感度,并且可以灵活切换状态。这对于器件的要求较高,同时在经常变化的环境中,会影响频谱的使用效率,器件的耗损率也比较大。因此FCC提出了干扰温度模型[23],此模型为授权用户接收方接收到的干扰值提供了度量标准。Huang等人提出了一种包含一个或是多个测量站点的系统模型[24],在此类模型中要求每个测量站点接收到的总干扰值不超过给定的门限。Jia等人在此模型下,提出了一种资源分配方法[25],为了保证干扰不超过门限值,测量站点会根据接收的干扰值决定是否需要剔除未授权用户,以及剔除哪个或

是哪几个未授权用户,从而降低对相应频段的干扰值。但是对于如何选择测量站点的位置,及存在若干个测量站点时,各站点如何协作并没有说明。并且,此文中要求测量站点掌握所有未授权用户的精确信道状况,而在实际情况中,这是很难做到的,因此还需要改进。

由此可见,非合作型博弈论应用于无线网络资源分配时最主要的问题是个体利益最优与系统利益最优之间存在的矛盾。采用非合作型博弈论模型的系统中,当系统达到稳定状态,即纳什均衡时,用户个体的利益是最优的,但是系统的利益却不能保证是最优的,有时可能还与系统最优状态相差很远。虽然已经提出了一些方案来解决这一问题,如价格函数的引入和不同算法的结合等,但是这些方法在实际操作中还存在着难度。因此还需要研究既能提高系统效益使其接近社会效益最优,还要有较高的可操作性的算法。

3.2 合作型博弈论应用实例

如同经济学中各商户之间进行协商合作一样,在无线网络系统中,分散分布的未授权用户之间也可以相互协商合作,共同商议无线网络资源的使用,以使每个用户的效益达到最优,用合作型博弈论模型实现资源共享。

在目前的研究当中,人们较多关注的是如何在某些限制下实现高效地最大化未授权用户的总传输速率或是最小化未授权用户的总传输功率。但是这些算法往往对于距离基站较近的或是有较高功率容量的用户较为有利,而公平性问题则被忽略了。Rhee等人提出的最大最小(max-min)算法[26],虽然保证了用户之间的公平性,但是此算法无法兼顾到用户对数据传输的不同的需求。此外,最大最小算法假定系统处于最差情况下,对信道条件较好的未授权用户会施以惩罚,从而抑制了这些未授权用户的数据传输,系统的性能会有所降低。同时此算法的复杂度较高,实际操作起来难度也较大。针对以上缺点,考虑到系统中未授权用户之间的公平性,系统的效率以及实施的复杂度,Han等人提出一种基于纳什讨价还价解(Nash Bargaining Solution, NBS)的算法[27]。这种算法在保证NBS公平性的基础上使系统性能达到最优,从而实现了在保证未授权用户之间资源公平分配的同时完成系统的总传输速率的最大化。

在NBS 的基础上,Feng等人考虑了未授权用户的感知性能,引入了权重的概念,提出了非对称型纳什讨价还价解(Asymmetric-Nash-Bargain-Solution, ANBS)算法[28]。采用ANBS 方法时,若权重较高的未授权用户占用了好的信道,两个未授权用户的总传输效率非常接近最佳输出,公平性优于NBS,因此可以极大的改善NBS算法;但若是权重较低的未授权用户占用了好的信道,两个未授权用户的总传输效率比起NBS算法显著下降,公平性也次于NBS算法。上述NBS算法和ANBS算法都是基于两个未授权用户的,可以用匈牙利方法[29]推广到多个用户的情况,但是随着载波数量的增加复杂度也有所提高。

无线网络系统中的信道具有一定的时变性,Jalali等人利用信道的这一特点来进行资源分配[30]。采用这种算法的系统中,需要控制中心实时监测用户每个特定时间间隔内的信息,根据用户当前的信道状况和传输速率决定用户是否可以使用信道进行传输。在此算法中,用以应对用户信道变化情况的参数需要慎重选择,如果取值太小,而用户的信道变化又比较频繁的话,用户就要不停的在传输与不传输之间来回切换,对器件的损耗较大,也不能完成数据的正常传输;反之,如果取值过大,那么就会造成系统对信道变化不够敏感,对用户的正常数据传输也会造成影响。

无线网络的用户一般都是移动用户,某一授权用户出现或是离开某一频段,或是未授权用户的出现或是离开发生的频率都相当高,因此无线系统的环境是经常变化的。这样,未授

权用户的资源分配策略就要作出相应的改变,在满足主用户传输的透明性的同时实现未授权用户资源分配的最优化。

Cao等人提出了一种应用于移动接入网的自适应分布式频谱分配算法[31]。在此算法中,首先假定在某一特定区域中的授权用户和未授权用户的拓扑分布是固定不变的,在此基础上完成未授权用户的资源的最优或是次最优分配。采用这个方法可以降低算法的计算量和复杂度。接着,根据系统中发生的移动事件,从用户自动组成讨价还价小组,共同协商频谱分配。算法对发起讨价还价的未授权用户,以及讨价还价小组的组员身份和数量都有严格的要求,以实现在较低复杂度的情况下比较高效的完成资源分配。同时,在讨价还价过程中每个用户都必须承诺通力合作实现系统性能最优,即使这样作会降低某些用户自身的性能。为了保证公平性,获得频段较多的用户要分出一部分频段给获得频段较少的用户。但是此算法在实际操作中还是有一定的难度,因为它要求未授权用户是完全无私的,而这在现实生活中是很难实现的。

在无线网络资源分配中使用合作型博弈论,需要各未授权用户之间进行协商和合作,因此使用合作型博弈论可以使系统资源分配达到或是近似达到系统最优,同时还可以保证公平和公正,这是合作型博弈论较之非合作型博弈论的优势所在。但是,由于合作型博弈需要局中人之间的持续的交流互动,实际操作中对无线网络控制中心的设置和用户的要求比较告,并且由用户之间交流信息引起的延迟也比较明显,因此目前在理论研究中和实际使用中受到的关注不如非合作型博弈论,如何加强合作型博弈论的实际操作性还有待开发。

4.总结和展望

随着无线技术的不断创新,新型的无线产品层出不穷,对于无线传输的速度和质量有了更高的要求。目前无线网络资源越来越紧缺,无线频谱越来越拥挤。如何将有限的频谱更加高效地利用起来,是当前无线网络面临的一个重大问题。博弈论由于其独特的数学特性,在无线网络资源分配的研究中已逐渐受到人们的普遍关注。本文对近几年来将博弈论应用于无线网络资源分配的研究成果进行了大致的介绍。无线网络资源分配中博弈论的使用,虽具有独特的优点,但还远不成熟,还存在一些问题需要进一步研究。我们今后的工作将重点关注以下几个方面:

y在用博弈论进行资源分配的同时,考虑频谱感知性能对于策略选择的影响。

y考虑非合作型博弈论和合作型博弈论在某种程度上的合作,共同完成资源分配。

y打破目前所提出的系统中关于接收方和发送方位置、距离等的限制,使算法更加具有普遍性,更加易于实施。

参考文献

[1]Federal Communication Commission, “Spectrum Policy Task Force Report”, ET Docket No. 02-155, Nov. 2002

[2]Federal Communication Commission, “Spectrum Policy Task Force”, Rep. ET Docket no. 02-135, Nov. 2002

[3]P.D. Straffin, “ Game Theory and Strategy.” Washington, DC: The Mathematical Association of America, 1993

[4] D. Fudenberg and J. Tirole, “Game Theory.” Cambridge, MA: MIT Press, 1991

[5]J. Zander and S. L. Kim, Radio Resource Management for Wireless Networks. Norwood, MA: Artech House, 2001

[6] C. U. Saraydar, N. B. Mandayam, and D. J. Goodman, “Efficient power control via pricing in wireless data networks,” IEEE Trans. Commun., vol. 50, no. 2, pp. 291–303, Feb. 2002

[7] A. B. MacKenzie and S. B. Wicker, “Game theory in communications: Motivation, explanation, and application to power control,” in Proc. GLOBECOM, vol. 2, Nov. 2001, pp. 821–826

[8]P. Zhang et al., “Power control of voice users using pricing in wireless networks,” in Proc. SPIE ITcom, Aug. 2001, pp. 155–165

[9]Z. Han, Z. Ji, and K. J. Ray Liu, “Fair multiuser channel allocation for OFDMA networks using Nash bargaining and coalitions,” IEEE Trans. Commun., vol. 53, no. 8, pp. 1366–1376, Aug. 2005

[10]H ojoong Kwon, Byeong Gi Lee, “Distributed Resource Allocation through Noncooperative Game Approach in Multi-cell OFDMA Systems.” IEEE Communications, pp. 4345 - 4350, June 2006

[11]J oydeep Acharya, Roy D. Yates, “A Framework for Dynamic Spectrum Sharing between Cognitive Radios.” IEEE Communications, pp. 5166 - 5171, June 2007

[12]D. Famolari, N. B. Mandayam, and D. J. Goodman, “A new framework for power control in wireless data networks: Games, utility and pricing,” in Allerton Conf. Communication, Control, and Computing, Sept. 1998, pp. 546–555

[13]N. Feng, N. B. Mandayam, and D. J. Goodman, “Joint power and rate optimization for wireless data services based on utility functions,” in Proc .CISS, vol. 1, Mar. 1999, pp. 109–113

[14]H. Ji and C. Huang, “Non-cooperative uplink power control in cellular radio systems,”Wireless Networks, vol. 4, no. 3, pp. 233–240, Apr. 1998

[15]V. Shah, N. B. Mandayam, and D. J. Goodman, “Power control for wireless data based on utility and pricing,” in Proc. PIMRC, 1998, pp. 1427–1432

[16]C. Saraydar, N. Mandayam, and D. Goodman, “Efficient power control via pricing in wireless data networks,” Comm., IEEE Trans., vol. 50, no. 2, pp. 291–303, 2002

[17]R. Knopp and P. A. Humblet, “Information capacity and power control in single-cell multiuser communications,” in Proc. Int. Conf. Communications, June 1995, pp. 331–335

[18]R. Frenkiel, B. R. Badrinath, J. Borras, and R. D. Yates, “The infostations challenge: Balancing cost and ubiquity in delivering wireless data,” IEEE Pers. Commun. Mag., vol. 7, pp. 66–71, Feb. 2000

[19]S. Ulukus and L. J. Greenstein, “Throughput maximization in CDMA uplinks using adaptive spreading and power control,” in Proc. IEEE 6th Int. Symp. Spread-Spectrum Techniques, Applications, Sept. 2000, pp. 565–569 [20]M. Mesbahi, M. G. Safonov, and G. P. Papavassilopoulos, “Bilinearity and complementarity in robust control,” in Advances in Linear Matrix Inequality Methods in Control. Philadelphia, PA: SIAM, 2000

[21]N. Feng, S. Mau, and N. Mandayam, “Pricing and power control for joint network-centric and user-centric radio resource management,” in Proc. 39th Allerton Conf. Commun., Control, Comput., Allerton, IL, Oct. 2001, pp. 202–211

[22]Z. Han and K. Liu, “Noncooperative power-control game and throughput game over wireless networks,” Comm., IEEE Trans., vol. 53, no. 10, pp. 1625–1629, 2005

[23]F ederal Communications Commission, Cognitive Radio Technologies Proceeding (CRTP), ET Docket No. 03-108E. H. Miller, “A note on reflector arrays (Periodical style-Accepted for publication)”, IEEE Trans.Antennas Propagat., to be published

[24]J. Huang, R. A. Berry, M. L. Honig, “Auction-based Spectrum Sharing”, Mobile Networks and Applications, 2006

[25]J uncheng Jia, Qian Zhang, “A Non-Cooperative Power Control Game for Secondary Spectrum Sharing.” IEEE Communications, pp. 5933-5938, June 2007

[26]W. Rhee and J. M. Cioffi, “Increase in capacity of multiuser OFDM system using dynamic subchannel allocation,” Proc. of IEEE VTC’00, pp. 1085-1089, 2000

[27]Z hu Han, Zhu Ji, and K. J. Ray Liu, “Low-Complexity OFDMA Channel Allocation With Nash Bargaining Solution Fairness.” IEEE Communications Society, pp. 3726-3731, 2004

[28]T ian Feng, Yang Zhen, “A New Algorithm for Weighted Proportional Fairness Based Spectrum Allocation of Cognitive Radios.” IEEE Computer Society, pp. 531-536, 2007

[29]H.W. Kuhn, “The Hungarian method for the assignment problem,” Nav. Res. Logist., pp. 2:83–2:97, 1955

[30]A. Jalali, R. Padovani, and R. Pankaj, “Data throughput of CDMAHDR a high efficiency-high data rate personal communication wireless system,” in Vehicular Technology Conf., vol. 3, pp. 1854–1858, 2000

[31]L. Cao and H. Zheng, “Distributed spectrum allocation via local bargaining,” in 2nd Ann. IEEE Comm. Soc. Conf. on Sensor and Ad Hoc Comm. and Networks (SECON 2005), pp. 475–486, 2005

The Application of Game Theory in Spectrum Sharing

Hu Yupei, Zeng Lingkang

School of Telecommunication Engineering, Beijing University of Posts and Telecommunications,

Beijing, China (100876)

Abstract

Game Theory is a mathematical theory which is specialized to study the process that a certain number of members competing for limited resource. Game theory has been successfully used to study the optimality of wireless network resource allocation and efficiency. This paper first introduces concept of Game Theory. According to the practical situation in resource allocation in wireless networks,two common types of Game Theory, Non-cooperative game theory and Cooperative game theory, are discussed. And finally, several practical examples are proposed.

Keywords: Game theory; Non-cooperative game theory; Cooperative game theory; Nash equilibrium; Pareto optimality

道德风险

第四章——道德风险 (一)博弈论 1、博弈论:是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同的决策主体之间决策的均衡。(对抗条件下最优决策问题) 2、博弈的组成要素: 参与人——决策主体,既可以是个人也可以是团队 行动——某个具体决策(或战略——行为规则) 支付——从博弈中获得的效用 3、博弈的分类 合作博弈——强调团队理性,强调效率,公正公平 非合作博弈——强调个人理性,结果可能有效率或无效率 (从结果来看) 零和博弈——各方利益+损失=0,如:猜硬币 常和博弈——利益总和为常数,如:分配固定数据奖金 变和博弈——零和和常和之外,如:囚徒困境 (从行为顺序来看) 静态博弈——同时作出选择,或一方不知先作方作出选择 动态博弈——行为有先后顺序,且后方可以看到前方行动 4、常见的博弈类型 【囚徒困境】:囚犯都选择认罪 “纳什均衡”:从利己目的出发,结果损人不利已,既不利己也不利他 【智猪博弈】:大猪按,小猪等 大股东为大猪,小股东为小猪。股东公司中大股东才有投票的积极性 中小企业不会花钱去开发新产品,大企业投入大量资金进行开发,中小企业等待大企业的新产品形成新的市场后生产模仿大企业新产品 【情侣博弈】:没有占优策略,出现两个均衡 可能会出现无效率的选择,如:男选择逛街,女选择看球——麦琪的礼物 解决方案:沟通、顺序行为、先动优势的作用 【斗鸡博弈】:怎么做取决于对手

【监管博弈】:形成一个死循环,无占优策略 算出每种策略的概率 纯战略:在给定情况下只选择一种特定行为 混合战略:在给定情况下,以某种概率分布随机选择不同的行为 后动优势的作用:谁先改变谁糟糕 以上都是静态博弈 【动态博弈】 有代价的承诺行动在限制自己选择余地,取决于参与者对各自收益函数的估计和行为准则。适当非理性行为有助于取得竞争优势。 例:为什么大公司需要聘请常年律师 【市场博弈-不完全信息】 “海萨妳转换”,通过引入虚拟的参与人—“自然”将不完全信息转换成完全但不完美的博弈 转换成一个动态博弈 5、纳什博弈:在给定其他参与者策略情况下,没有一个参与者能通过单方面改变自己的策略而使自己的得益提高,从而没有人有积极性打破这种均衡。(二)、道德风险 1、从博弈论角度来看,道德是一个人类群体经过长期博弈而形成的稳定预期下的共同信念。(是一种社会形象,为维护共同利益,协调彼此关系,产生调节行为准则) 2、不对称信息 ①对方知识的不对称。外生的,先定的,不是双方当事人行为造成,隐藏知识 ②隐藏的行为:一方对另一方行为无法管理,约束,内生的,取决于另一方的行为 3、道德风险是指投保人和保险人双方签订保险合同后,其行为发生变化的倾向,其后果是导致交易双方的收益减少 4、道德之所以会成为风险,是因为有人会为追求自己的利益的最大化而违反既定的道德规范,并将成本转嫁给他人且造成他人的损失 5、广义的道德风险产生的根源;产权界定不清、信息不对称(保险市场)

范里安《微观经济学:现代观点》(第9版)课后习题详解-(博弈论的应用)【圣才出品】

第30章博弈论的应用 1.在一个双人博弈纳什均衡中,每一个参与人都在针对什么作出最优的反应?在一个占优策略均衡中,每一个参与人又都在针对什么作出最优的反应? 答:(1)在纳什均衡中,每个参与人都对其他选手的最优反应作出了自己的最优反应。 (2)在一个占优策略均衡中,每个参与人的选择都是对其他选手所有选择的最优反应。特别地,占优均衡一定是纳什均衡,但纳什均衡却未必是占优均衡。 2.在有关混合策略的章节中,考虑行参与人和列参与人的最优反应。它们会产生最优反应函数吗? 答:行参与人和列参与人没有最优反应函数。如图30-1所示,这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应。曲线的交点就是纳什均衡。在这种情况下,博弈存在三个均衡,其中,两个是纯策略均衡,一个是混合策略均衡。当行参与人选择r=2/3时,列参与人存在无穷多个最优反应,而不是像函数的数学定义所要求的那样,只有一个最优反应。

图30-1 最优反应曲线 3.在一个合作博弈中,如果博弈双方作出相同的选择,那么,结果对于他们两个对这都令人满意。这个结论是否正确? 答:这个说法不正确。 这是因为合作博弈的结果取决于博弈的收益,而非两个人是否选择相同的策略。比如在汽车博弈中,如果双方都选择直线驾驶,他们将陷入最糟糕的境况。 4.本章正文指出,在均衡状态,行参与人在62%的时间内会得分。这个数值是如何得到的? 答:博弈的均衡策略为“行参与人按0.7的概率踢向左方,而列参与人以0.6的概率扑向左方”,由于射门方向和扑救方向共有四种组合,从而得到每种组合的概率分布如表30-1所示。 表30-1不同组合的概率分布

博弈论及其应用(期末学习报告)

博弈论及其应用长虹与同行家电业的价格战 姓名: 学号: 学院: 专业:

博弈论及其应用 长虹与同行家电业们的价格战 一、事件背景 由军工厂转型的长虹是国内最早从日本松下引进彩电生产线的企业。1985年,军人气质十足的倪润峰执掌长虹。1994年,长虹在上海证交所上市;1995宣布自己成为“中国最大彩电基地”。 1996年,长虹的指挥官倪润峰决定拿出更大的动作。提出一个令人意外的“产业报国”计划。1996年,本土彩电企业陷入最艰难的苦战时刻,一个潜在的危机正在步步逼近。4月1日开始,彩电的进口关税将大幅下降。3月26日,长虹宣布,所有品种彩电一律大幅度让利销售,降价幅度从8%到18%。随后,猝不及防的其他中国厂家纷纷选择跟进。彩电业的价格大战,就在这样一种“产业报国”的氛围之中,拉开大幕。 价格战刚刚开打一个月,长虹的市场占有率就上升到19%,比降价前增加了7.9%。到年底,长虹坐稳了“彩电大王”的宝座。中国每卖出三台彩电,有一台出自长虹,有一台是外资品牌,还有一台才是其他国内品牌。倪润峰逐渐把国内同行们逼到了死角。在此战之前,国内各省市其实还有60多个地方性的彩电品牌,它们大部分是国有企业,作为当地的支柱产业割据一方,小富即安。然而在长虹的降价冲击下,大多数企业迅速凋零,成为行业重组中一颗颗散落的棋子,只能到长虹、康佳、TCL那里请求收购。彩电业从此步入由五六家大公司瓜分市场的时代。这一年,预算内国有企业的净销售利润率降低到历史最低点,亏损总数是1985年的28.6倍。相比之下,全国乡镇企业的产值增长22%,中外合资企业的所得税增长40%。 1997年,用价格战给中国企业家们好好上了一课的倪润峰被推上了事业的巅峰,1998年,在价格战中得到洗礼的国内同行开始显山露水。1999年,长虹的净利润下降74%;2000年5月,倪润峰卸下总经理职务,退隐江湖。2000年6月9日,康佳和TCL在内的九大国内彩电巨头联手组成价格联盟,准备正面迎击长虹的价格战。2005年4月16日,在这个特意挑选的休市日,长虹公布了2004年年报,抛出中国股市有史以来上市公司亏损之最:36.81亿元。价格战的发明者和坚决的拥护者,为最后的豪赌交出了最昂贵的学费。 二、各方的观点

企业道德风险

我国食品安全问题层出不穷,试用博弈论分析企业的道德风险选择 我国正处于经济体制转轨过程之中,由于旧的经济体制下很多问题没有得到解决,新的体制尚未完全建立,企业作为市场经济的主体,在经营过程中出现了大量的道德风险现象。道德风险一般存在于下列情况:由于合同具有不确定性、不完全性,或者有限制的合同使负有责任的经济行为者不能承担全部损失,因而他们不承担其行为的全部后果。由于经济活动中人们的信息不对称,因此在签订合同的时候总会遇到一些不确定性,正是由于这些不确定性,使得经济行为者不能对自己的行为承担全部责任,把利益留给自己,而把损失转嫁给别人,从而产生道德风险。 企业经营道德风险行为作为一种盈利手段,不是在任何情况下都能发挥效用的,只有具备一定的前提条件,才为它提供了存在的可能性以及由可能转变为现实的保证。我国正处在社会转型期,部分旧的制度约束已经弱化,新的、适应社会主义市场经济发展要求的制度约束又没有完全建立,正是在我国现在的这种经济体质的转型时期才给道德风险的存在提供了空间。 一,信息的不确定性。任何经济行为都依赖着信息的收集、整理。用博弈论的语言讲,所有经济主体都是博弈中的局中人,要想在博弈中取得胜利,就必须首先进行信息的收集及反收集、隐匿与反隐匿。当双方从事交易时,其中掌握信息的一方就会控制另一方的决策行为,拥有信息放可以根据自己的实际情况来对信息加以润色,修改后提供给另一方来达到迷惑对方的目的从而使另一方在此基础上做出一些错误决策从而机身做出较为正确的决策而赢出优势。而这种现象如果试用在生厂商和消费者上就会表现在以下方面,生产商将有利于自己的信息加以扩大来诱惑消费者,另一方面将不利于自己的信息尽量隐藏或者弱化。更有甚者,生产商会搞一些欺诈性的促销,如生活中普遍存在的“跳楼大甩卖”,“清仓大处理”等。 二,素质的不全面性。由于人的素质呈残缺型,也就为道德行为的发生增加了概率。在现实生活中道德行为的败坏可能是单向也可能是双向的以行为活动,众所周知的项目承办过程中的招标及其中的暗箱操作活动和采购活动中的回扣现象即为典型的道德败坏。然而现实生活中双向的道德败坏似乎更为常见,如消费者购买一些盗版商品,明知其不利于商品经济的发展而因气价格的便宜去购买的现象。也正是由于消费者的这种消费心理助长了这种气焰的增长。 三,市场的不完善性。市场完善化程度体现为市场制度制定和运作的完善性,完善的制度从外在层面发挥着强制性作用,规控着败德行为所引致的社会成本全部甚至超额内部化到行为企业自身,使之实施败德行为不仅无利可图,而且还有可能亏本破产。在完善的市场中,企业一旦展现出道德败坏行为就可能会影响外界对其整个体系的评价,影响其在市场上的信誉度,进而会影响其以后的各种销售行为,可能会因为大家对其不信任最终导致其市场占有份额的下降,迫使其市场占有范围的下降,最终严重者可能会因其自身形象的无法重塑而完全推出市场。 然而,在不完全市场下,这种信誉度似乎与其自身的价值无甚大关联,败德行为及道德行为均对其运作绩效影响甚小,在这样的市场氛围中,企业选择败德行为会使其企业成本降低收益增加。市场的不完全性从这方面来看似乎是对企业道德败坏的一种正向刺激。 概括来说,信息不对称性、素质不全面性及市场不完善性是企业出现道德风险必要条件,缺一不可。由于经济发展的阶段局限性,这三维约束总是不同程度的存在着,企业在经营中出现道德风险也就具有了一定的必然性。 我国处于经济社会的转型期,一些旧的,老的制度约束已经弱化,而新的,适应社会主义现阶段的发展要求的制度还没有完全建立,没有形成其应有的约束力。在这种大环境的背景下,这种社会道德风险并不能完全归咎于企业的社会道德问题,更重要的是一个制度约

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者:————————————————————————————————日期:

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论在工作生活中的应用

东北财经大学MBA学院博弈论在工作生活中的应用 姓名:毕哲 学号:2013121098 班级:2013级MBA3班 课程名称:策略思维与决策 任课教师:宗计川

博弈论在工作生活中的应用 博弈论,又称对策论,是指在存在利益竞争的活动中,一个人采取行动的结果。有仅与自己有关,而且与整个活动中其他人的行为有关,即一门研究博奔中局中人各自所选策略的科学。近半个世纪来,人类思想正经历着一场博弈论革命。不论是在经济学上,或是其他社会科学,甚至自然科学领域,博弈论都有着广泛的应用,它已遍及人类生活的方方面面。 一、博弈论概述 博弈论是分析人们在博弈中的理性行为的理论,是讨论人们在博弈的交互作用中如何决策的理论,是一种“游戏理论”。对其具体来说是:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中,进行选择,加以实施,并从中各自取得相应结果或收益的过程。它考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 随着博弈理论的发展和博弈研究的不断深入,人们意识到要用博弈论解决现实经济中的决策问题,对现实经济的发展变化趋势进行预测,就必须解决博弈模型的理论抽象和假设与经济问题实际情况的差距问题,具体包括博弈规则、信息结构等的来源和变化问题,相关各方利益关系的设定问题,博弈方的行为模式,能力和理性水平问题。对这些问题的考虑和分析引出了博弈基础理论研究的许多有价值的课题,其中包括理性种类和理性层次、博弈结构的不确定性和动态变化等有待进一步研究发展的领域。这充分保证了博弈论在未来相当长时间内的发展潜力。 二、博弈论的类型 根据不同的基准,博弈论的分类不同。 关于博弈论最基本的分类有两个:一是按照博弈各方是否同时决策,分为静态博弈和动态博弈,同时决策或者同时行动的博弈属于静态博弈,先后或序贯决策或者行动的博弈属于动态博弈。另一分类,是按照大家是否都清楚各种对局情况下每个局中人的得益,分为完全信息博弈和不完全信息博弈。最后,博弈还分为合作博弈与非合作博弈。如果一个博弈允许参与人之中出现有行动约束力的联

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

初探博弈论及其应用【开题报告】

毕业论文开题报告 信息与计算科学 初探博弈论及其应用 一、选题的背景与意义 在人类历史上,很早就有了博弈思想的故事,如众所周知的“田忌赛马”。在社会生活中,我们也能碰到类似的情形和现象,如下棋、打扑克、猜拳等想用自己的战术去取胜,这就是所谓的博弈现象。博弈论是研究理性的个体在相互依存时如何做出决策的一门理论知识,主要是强调决策主体的行为而引起的直接相互作用。 上世纪80年代以后,博弈论经历了突飞猛进的发展,主要是在经济方面的发展,越来越多的人把它归为主流经济学的重要组成部分。不仅是在经济上有广泛的应用,而且在军事、信息、政治等方面也能看见它的影子。1994年的诺贝尔经济学奖获得者就是三位博弈论的专家。以后又有三次奖授给了与博弈论有关的专家。在我国,经济学界对经济博弈论的关注和兴趣也在迅速增强。由于博弈论应用的广泛性和实用性,越来越来多的人开始学习和研究博弈论。可以说,博弈论正将进入一个崭新的阶段。 二、论文的主要思想 博弈论研究理性的个体在相互依存时如何作出决策。因此博弈论在研究时需要作出一定的假设,当然也包括一些基本定义。所以本文从介绍博弈论的基本假设和基本概念开始,在对基本概念了解的基础上学习博弈论中的经典模型,从中学习博弈过程中的双方博弈思维,然后再选取一些实际中的例子,运用所学的博弈论思维,从博弈双方的角度考虑得出该做出何种决策。 三、研究的步骤及方法 研究步骤 1. 1.10——1.20 明确毕业论文的设计方向,查阅文献资料,完成开题报告。 2. 2.10——2.25 撰写文献综述,翻译外文资料。 3. 2.26——3.05 列出论文正文部分的撰写提纲。 4. 3.06——4.01 撰写论文初稿。 5. 4.02——4.20 根据指导老师的建议进一步修改。 6. 4.21——4.27 论文定稿,装订成册,按时完成其它各项任务,准备答辩。 研究方法

(作业)博弈论在工作生活中的应用

博弈论在工作生活中的应用 一、博弈论概述: 博弈论(game theory),又称对策论,是指在存在利益竞争的活动中,一个人采取行动的结果。有仅与自己有关,而且与整个活动中其他人的行为有关,即一门研究博奔中局中人各自所选策略的科学。近十年来博弈论在西方已成为最热门的学科,用博弈论去研究经济生活中的问题,已成为现代经济学最前沿的课题。 研究对象:冲突、竞争现象的定量分析理论。参加竞争的各方为了获胜而需研究出一组对付对方的策略。 博弈论研究的意义 对于博弈论发展的贡献也许更大的是,博弈论正是在这个时期开始受到经济学真正广泛的重视,并被看作重要的经济理论和经济学的核心分析方法,开始贯穿几乎整个微观经济学、产业组织理论,在环境、劳动、福利、国际经济学科中也开始占越来越重要的地位,大有“吞噬”整个现代西方经济理论的气势。也正是在这个阶段开始,博弈论开始成为西方国家经济学专业和许多相关专业学生的一门必读课,有志于攻读经济学博士学位者,更是必须熟练掌握和运用博弈论的原理和方法。博弈论的思想、词汇也开始在经济学专业杂志上大量出现,不懂博弈论的学者开始在阅读经济学文献方面遇到越来越大的困难和限制,几乎到了不懂博弈论就意味着不懂现代经济学的地步。 上述趋势由于90年代中期的两次诺贝尔奖而进一步得到加强。首先是1994年三位致力于博弈论的基础理论研究,对非合作博弈理论的产生和发展作出了巨大贡献的学者,纳什、海萨尼(J.Harsanyi)、塞尔顿(R.Selten),共同获得经济学诺贝尔奖,使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定:此后是1996年,诺贝尔经济学奖又由博弈论和信息经济学家莫里斯(James A. Mirrless)和维克瑞(William Vickrey),因为在不对称信息条件下激励机制问题(这种激励问题实际上就是一种不完全信息的博弈问题)方面的基础性研究而获得,更进一步强化了博弈论的发展趋势。 将80、90年代看作博弈论的成熟期,并不意味着此后博弈论将进入衰退阶段。事实上,至少到目前为止,博弈论的发展还远远没有达到顶峰。首先,由于博弈理论本身优美深刻的本质魅力,新的博弈分析工具和应用领域的不断发现,以及博弈分析的价值得到越来越充分的认识,不断吸引新的理论和实践工作者学习、应用博弈论,吸引大量学者加入研究队伍。这是博弈论继续向前发展的根本基础和保证。 其次,随着博弈理论的发展和博弈研究的不断深入,人们意识到这种理论还存在不少问题,特别是它的理论基础方面还存在一些没有很好解决的根本性问题。要用博弈论解决现实经济中的决策问题,对现实经济的发展变化趋势进行预测,就必须解决博弈模型的理论抽象和假设与经济问题实际情况的差距问题,具体包括博弈规则、信息结构等的来源和变化问题,相关各方利益关系的设定问题,博弈方的行为模式,能力和理性水平问题。对这些问题的考虑和分析引出了博弈基础理论研究的许多有价值的课题,其中包括理性种类和理性层次、博弈结构的不确定性和动态变化等有待进一步研究发展的领域。这充分保证了博弈论在未来相当长时间内的发展潜力。 第三,金融、贸易、法律、政治等众多领域,不断提出新的博弈论应用课题,也不断有新的应用博弈模型产生,这些应用问题和成果与博弈理论的发展之间形成了一种相互促进的良性循杯。这也是今后博弈论进一步发展的巨大动力。 第四,在合作博弈和非合作博弈两大类博弈中,目前非合作博弈理论的成熟程度大大高于合作博弈理论,非合作博弈是博弈论的主流。但事实上合作博弈理论同样是非常重要的博

什么是逆向选择与道德风险及相互关系和解决对策

什么是逆向选择与道德风险及相互关系和解决对策 一以人才聘用为例分析什么是逆向选择与道德风险及相互关系和解决对策(一)什么是逆向选择与道德风险 1人才招聘过程中的逆向选择分析 一般而言,在信息对称情况下,级别不同的企业会招聘到能力不同的人才,优秀的企业容易招聘到能力高的人才;同样能力不同的人才会落户到不同级别的企业,高能力人才容易受聘到优秀企业。但由于信息的不对称,最终会导致逆向选择。 在人才招聘过程中,企业只能通过人才递交的简历表和对人才进行笔试、面试来获取对方的相关信息。但对其实际工作能力、工作热情和长期打算却不甚了解,而且已获取信息又面临着虚假成分的威胁。相对而言,人才对自己的学历、业务水平、偏好、信用等信息却十分清楚,而且对所应聘企业及其职位亦认识深刻。企业并不知道应聘人才的真实能力,只知道应聘人才的平均能力及其分布。 而在现实社会中,信息是不对称的,招聘企业并不知道应聘人才的真实能力。在这种情况下,招聘企业只能根据应聘人才的平均能力来确定聘用的人才和给予其待遇。假定人才有两种类型:Q=4000(高能力)和Q=1000(低能力),企业遇到两类人才的概率为1/2。如果信息是对称的,企业代表会在不同的工资水平上雇佣到相应的人才。但由于信息不对称,企业就只能按照平均能力2500出资,并希望能雇到高能力人才。但在此工资下,高能力人才将退出应聘过程,招聘市场上只留下能力程度较低的人才。这样人才的平均能力就会下降,理性的招聘企业知道这一情况以后,便会降低给予应聘人才的待遇。结果造成更多的较高能力的应聘人才退出招聘市场,如此循环下去,形成“劣币驱逐良币”现象,即低能力人才对高能力人才的驱逐。这便是人才应聘过程中的逆向选择。逆向选择的结果,一方面是低能力人才获胜。 根据以上的事例,我们可以分析所谓逆向选择是指,经济活动中,在交易和合约形成前,由于信息不对称,且交易一方获得信息的成本过高,交易可能控制在拥有较多信息的一方。使得,降低优质商品的价格,需求也不会增加;提高优质品价格,供给也不会增加,所以劣质品就会挤出优质品,从而导致违背交易者愿望的市场淘汰,进而出现市场交易产品平均质量下降的现象。 2人才雇用过程中的道德风险分析 人才进入企业后仍存在着信息不对称。企业与人才订立委托—代理关系后,企业的效益是通过人才能力发挥来实现的。但是人才的能力发挥是无形的,对它的监督和控制是很困难的。企业无法判断出人才现在的努力程度和人才行为在多大程度上符合企业的利益等。而且根据“理性人”假设,人才往往倾向于做出有利于自身的决策。由此,导致人才雇用过程中的“道德风险”问题。 根据以上的事例,我们可以分析所谓道德风险是指,经济活动中,在交易和合约形成后,由于信息的不对称性,一方的行为难以被另一方所察知,从而一方最大限度地增加自身效用而损害另一方利益的行为。 (二)逆向选择与道德风险的相互关系 1相互联系: 根源相同:都是源于信息不对称; 本质一样:一方利用信息不对称欺诈另一方;

博弈论基础及应用

博弈论(对策论、游戏论) 博弈论又名对策论、游戏论,是一门研究互动关系“游戏”的参与者各自选择策略的科学,博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导和借鉴。 游戏三要素(博弈的规则、结构): 1、博弈、游戏参加者。 博弈论分析,假定参与者都是机智而理性的。 2、行为和策略空间。 博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间的因果关系。 3、有可评价优劣高下的决策行为结果。 博弈论用数字表示这类结果,并称之为支付。 支付矩阵 可以用支付矩阵(得益矩阵、收益矩阵、赢得矩阵)来描述一个博弈结构。 厂商B 厂商A 支配策略: 由于游戏参与者试图实现自身利益最大化并具有理性的决策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结果。从厂商A角度来说,它采取策略“下”而得到的支付总是好于“上”(2,1分别对1,0)。同样,对于厂商B来说,选择策略“左”得到的利益总是优于“右”(1,2分别对0,1)。因此,我们可以确定预期均衡选择策略是A选择“下”而B选择“左”的策略。 囚徒困境: 下面支付矩阵表示著名的“囚徒困境”游戏,从博弈论角度看,这是一个存在支配均衡的博弈;因为对囚犯A、B来说,无论对方如何选择,“坦白”都是各自的最优选择。 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)等竞争性动机阻碍了他们达到更好的互利选择,他们面临“囚徒困境”。我们将看到,寡头垄断厂商经常面临类似的困境。 囚犯B 囚犯A 纳什均衡: 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支配均衡表示博弈中,厂商A、B在选择做广告问题上存在的策略关系。其中厂商A没有支配策略,因为A的最佳决策取决于B的选择。例如,当B选择做广告时,A应当选择做广告,由此得到10而不是6的支付得益,然而,当B选择不做广告时,A应当选择不做广告,从而得到20而不是15的支付得益。假定两个厂商需要同时决策,A应当如何决策?

博弈论在生活中的运用

TECHNOLOGY AND MARKET Vol.18,No.6,2011 0引言 博弈最基本的意思是弈棋,博弈本身是一种游戏,博弈论最初主要是研究象棋、桥牌、赌博,研究做出何种选择会让自己打败对手。因而最初博弈论只是一种经验的描述,而不是一种系统的理论,20世纪40年代,冯·诺伊曼(John Von Neumann)与摩根斯坦恩(Oskar M orgenstern)合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中,标志着系统的博弈理论的形成,他们定义博弈论(GameTheory)是“研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题”[3]。 博弈论的应用范围非常广泛,在现实生活中一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并各自从中取得相应结果或收益,这个过程便是博弈的过程。[1]市场竞争、环境保护、公共资源的利用与开发,乃至国家间的军备竞争、各种竞技比赛等都属于博弈现象。它涉及经济学、政治学、军事、外交、国际关系、公共选择等领域。 1博弈论在日常生活中的运用 古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。我们最早接触的一个博弈论在生活中的运用恐怕就是,2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜。齐王与田忌各用上、中、下等马进行三场比赛,比赛为三局两胜制。在同等级的马中,齐王的马均优于田忌的马。在该比赛中我们知道会有六种策略: 为了赢得比赛,孙膑为田忌制定了对策,采取第六种策略。以劣马对齐王的上马,以上马对齐王的中马,以中马对齐王的下马,结果田忌赢得了两场比赛的胜利。田忌采用的是占优策略,即站在自己的立场上,无论对方如何选择,都能避免出现最糟糕的结果,实现自己的最大利益。在本故事中,齐王的参赛决策是透明的,依次用自己的上、中、下三匹马参与比赛,他没有考虑到对方为赢得最大利益将作出的决策,或者是没能发现自己的决策中存在的可被对手利用的漏洞。这种博弈在日常生活中很常见,参与人根据对方的策略选择自己的策略方式,以期得到利益最大化,甚至反败为赢。 这个例子是调整顺序来赢得比赛,在生活中我们也常遇到狭路相逢的情况,两辆车相向而行在一条很窄的路上,两位车主是都进还是都退,还是一个前进一个倒退。当然,如果哪方选择倒退可能导致耽误时间之类的损失,先行者可能会赢取时间,这就涉及到我们所说的斗鸡博弈,这是生活中很常见的一个现象,这个时候,我们用一个博弈标准式来表示,两位车主分别用甲乙代替,这个时候有四种策略,则标准式可以表示为: 有这个标准式的矩阵,我们可以选择这样的策略来达到纳什均衡,甲:乙选择(前进,后退)或(后退,前进),即其中一个选择后退,在生活中如果遇到这样的事,两个都想赢得时间的话只会两败俱伤,而如果一方选择倒退会给两方都带来好处。当然,我们在生活中还会遇到很多其他的博弈例子,例如恋爱中的男女是选择去看电影还是去选择看足球赛,男方是该求婚还是该放弃求婚。甚至是在儿童游戏剪刀石头布中是出剪刀,石头还是布都会涉及到博弈论。 2博弈论在经济生活中的运用 在经济生活中,各国之间的贸易谈判,同类产品的几个生产厂家进行广告宣传,争夺国际国内市场,企业对自己的一种商品定价,需要考虑市场上同类商品的价格等都涉及博弈[5]。博弈论在经济生活中的应用最广泛、最成功。经济学家对博弈论的贡献很大,特别是在动态分析和不完全信息中引入博弈论。经济学和博弈论的研究模式具有本质的相容性,其核心就是强调个体理性,也就是在给定的约束条件下追求效用最大化。这使得博弈论逐渐发展成为经济学的一部分。 在经济生活中,我们通常会遇到生产同种商品的厂家降低价格来扩大商品的市场份额,以此来击败对手,假如A、B两公司实力相当,市场份额既定。首先考虑厂商A,厂商A觉得,不管 博弈论在生活中的运用 付冬芹,丰容基 (安徽大学经济学院,安徽合肥230601) 摘要:博弈论研究的就是纳什均衡,把博弈双方每个阶段所要发生的事情罗列出来,然后再去按阶段进行分析,最终找到我们想要的均衡的最佳点。生活中,我们经常会有意无意地用博弈论知识来解决问题,掌握博弈论的相关知识有利于我们更好地进行决策。 关键词:博弈论;竞争;均衡 doi:10.3969/j.issn.1006-8554.2011.06.14 4专题研究 192

博弈论例子

一.信号博弈 1.网购市场逆向选择行为 交易发生之前的信息不对称易产生逆向选择问题。当交易市场中信息不对称时,通常卖方比买方拥有更多的私人信息,买方处于信息劣势。由于买方无法完全掌握商品的质量信息,或者无法鉴别卖方传递的信息是否有效,从而难以准确辨别商品质量的优劣。由于劣质商品成本低于优质商品,卖方更倾向于销售劣质商品滥竽充数,若两者具有相同的价格,则劣质商品的卖方能够获取高额利润。此时,优质商品卖方处于劣势状态,会逐渐被驱逐出市场,这就是逆向选择的基本过程。 在网购市场,由于交易信息传递的虚拟性、较大的信息搜寻成本、商家的信息垄断和网络监管的不健全,从而导致了消费者和商家之间的信息不对称。网购市场是一个不完全信息市场,但在不完全信息的博弈中,参与人为了显示自己的类型,可以通过传递信号给其它参与人以便使对方观察到某种信号而调整自身行动。因此,高质量的商家为了向消费者显示自己所属类型,会有强烈动机对外传递信号。在网购中传递信号可以是某种质量认证、消费保障和信誉机制等。不少网购购物平台会根据消费者好评设置信誉等级,如淘宝根据信誉积分将商家分为20个等级。这些等级将会给企业带来巨大的信誉资产,并为商家赢得大量的订单。当然,商家为了获得并传递这种声誉信号需要在在付出成本。高质量商家获取声誉信号的成本相对较低,低质量商家为了冒充高质量商家要付出的信号成本很高。。假定高质量商家认证的成本为α,低质量商家认证的成本为β,显然α<β 分离均衡:高质量商家会通过传递高质量显示信号,从而获得(0,-α)的收益;低质量商家则不会传递高质量显示信号,消费者会据此判断其类型,并实现(0,0)的收益。 混同均衡:高质量的商家有积极传递高质量显示信号的动机,因为如果不传递,消费者便无法分清该商家的商品是高质量还是低质量,会按照低质量的价格支付,此时高质量商家就会退出市场。高质量商家继续参与市场交易就必须通过传递高质量显示信号,在现实中,高质量商家一般都会进行质量认证。低质量商家可能为了冒充高质量商家参加认证,也可能不认证,当低质量商家也进行高质量认证时,消费者便在博弈中无法根据信号分清商家类型,此时的均衡为混同均衡。 2.节能减排补贴政策下的企业与政府信号博弈 企业是实现节能减排工作中最为关键的行为主体。遗憾的是,相对于现在高碳经济下成熟、低成本的技术而言,企业进行低碳技术和低碳产品的研发、使用低碳技术进行产品生产的成本相对较高、风险较大。企业是风险规避的,在没有相应政策的干预下,企业主动减排的动力相对不足。我国对节能减排实施了范围较广的补贴政策。 在政府和企业博弈的过程中,企业和政府的策略选择是相互依存的,一方策略的改变会影响到另一方策略的选择。在推进碳减排活动中,企业对其自身碳减排措施实施后的结果是具有完全信息的,政府对此具有不完全信息,即企业是享有信息优势的博弈方,政府是处于信息不对称的劣势方,只能根据企业的申请和贝叶斯法则对企业的减排结果做出“判断”。在补贴政策下的政企信号博弈中,企业为信号发出方(S),政府为信号接收方(R)。其博弈过程为:首先,由博弈方“自然”按一定概率从信号发出方企业(S)的类型空间M={m1,……,mI}中随机选择一个类型mi,并让企业知道;然后,企业根据“自然”的选择,在自己的策略空间N={n1,……,nJ}(此处策略即可选择的行为)中选择策略nj(该策略对后行动的政府来说是一种信号);最后,政府(R)根据观测到的企业的策略nj,应用贝叶斯法则修正先验概率,并得到有关企业减排效果的后验概率,然 后据此在自己的策略空间Q={q1,……,qK}中选择策略qk。

西方经济学(博弈论及其应用)历年真题试卷汇编1

西方经济学(博弈论及其应用)历年真题试卷汇编1 (总分:40.00,做题时间:90分钟) 一、单项选择题(总题数:9,分数:18.00) 1.考虑两寡头厂商A和B的如下支付矩阵,二者的(纳什)均衡策略组合为( )。(电子科技大学2010研 (分数:2.00) A.(U,L) B.(D,R) √ C.(U,R) D.(D,L) 解析:解析:在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略,如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,当B选择U时,A会选择R,因为5>3;当B选择D时,A会选择R,因为2>0。当A 选择L时,B会选择U,因为4>3;当A选择R时,B会选择D,因为1>0。因此,依据纳什均衡定义,可知(D,R)是纳什均衡。 2.下列说法错误的是( )。(中山大学2009研) (分数:2.00) A.占优策略均衡一定是纳什均衡 B.纳什均衡不一定是占优策略均衡 C.占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反应√ D.纳什均衡中,每个参与者都是在针对其他参与者的最优反应策略而做出最优反应 解析:解析:占优策略均衡中,不论其他参与者采取何种策略,每个参与者都会选择其自身的最优策略。 3.甲乙两人各在纸片上写上“上”或“下”,然后双方同时翻开纸片,如果两人的字相同,那么甲赢2块钱,乙输两块钱;如果写的字不同,那么乙赢1块钱,甲输1块钱。下列关于该博弈纳什均衡的描述哪一项是正确的?( )(上海财经大学2009研) (分数:2.00) A.甲以1/2概率选择“上”;乙以1/2概率选择“上”√ B.甲以1/3概率选择“上”;乙以1/3概率选择“上” C.甲以1/3概率选择“上”;乙以1/2概率选择“上” D.甲以1/2概率选择“上”;乙以1/3概率选择“上” 解析:解析:根据题目条件可以得出甲乙两人的收益矩阵,如表5—1 “上”时,乙必然会选择写“下”。同理,当甲选择写“下”时,乙必然会选择写“上”。因此,两个人选择写“上”的概率都为1/2时才能达到均衡。 4.在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去"或者选择“避让”。如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是一36。这个博弈有两个纯策略纳什均衡和( )。(上海财经大学2008研) (分数:2.00) A.一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以20%的概率选择“冲过去”√ B.两个混合策略纳什均衡,即每个青年人轮流采取避让或者冲过去 C.一个混合策略纳什均衡,即一人以80%的概率选择“避让”,另一人以20%的概率选择“冲过去” D.一个混合策略纳什均衡,即两人都以40%的概率选择“避让”,以60%的概率选择“冲过去” 解析:解析:根据题中条件可写出两人的收益矩阵,如表5—2 有两个纯策略纳什均衡(9,0),(0,9)。设甲选择“冲过去”的概率为r,乙选择“冲过去”的概率为c。

博弈论的应用-浅析博弈论经典模型

浅析博弈论经典模型 --囚徒困境模型及其启示 一、博弈论概述 博弈论又名“对策论”、“赛局理论”,属应用数学的一个分支,表示在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为理论。简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。 二、博弈论的基本原理 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益、结果、均衡等。 1、参与者指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。

5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的事情。 6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动和结果统称为博弈规则,博弈分析的目的是使用博弈规则来决定均衡。 三、博弈的分类 博弈的分类根据不同的标准也有不同的分类。 根据参与人的多少,博弈可以分为二人博弈和多人博弈。 根据参与人是否合作,博弈可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 根据各方得益的不同情况,博弈可以分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。 根据行为的时间序列性,博弈可以分为静态博弈、动态博弈。静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 根据参与人对其他参与人的了解程度,博弈可以分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解

相关主题
文本预览
相关文档 最新文档