第4讲 学习机制和有限理性
- 格式:pdf
- 大小:181.89 KB
- 文档页数:7
第四讲破解让人懵圈的专业词汇1.微观经济学专业词汇2.宏观经济学专业词汇3.战略管理专业词汇4.其他专业词汇拾零一、微观经济学专业词汇有限理性(P1)(1)处于完全理性和完全非理性之间的在一定条件限制下的理性。
(2)是为抓住问题的本质而简化决策变量的条件下表现出来的理性行为。
身份:马云,阿里巴巴集团创始人。
言论:我们要做一个由中国人打造的世界性公司(1999年)。
阿里巴巴每天上税100万。
(2004年)规模经济(P27)(1)指在一定时期内,企业所生产的产品或劳务的绝对量增加时,其单位成本趋于下降。
(2)此处规模指的是生产能力变化时的生产批量变化。
案例:生产1000万支手机要比生产1支手机的成本低得多。
最小有效规模(P27)(1)在长期中平均成本处于或接近其最小值的最小的规模。
(2)一般表现为“长期平均成本下降”,即长期平均成本曲线呈下降趋势,下降的最低点。
学习曲线(P28)当某一产品累积生产量增加时,由于经验和专有技术的积累所带来的产品单位成本的下降。
结构性障碍与行为性障(P27-28)对于一个产业来说,进入威胁的大小取决于呈现的进入障碍与准备进入者可能遇到的现有在位者的反击。
结构性障碍:产业呈现的进入障碍称为结构性障碍。
如规模经济、现有企业对专利、原材料等关键资源的控制以及现有企业的市场优势。
行为性障碍:是指现有企业对进入者实施报复手段所形成的进入障碍。
如限制进入定价,进入对方领域等。
直接产品替代(P28)某一种产品直接取代另一种产品。
案例:苹果计算机取代王安文字处理机。
间接产品替代(P28)由能够起到相同作用的产品非直接地取代另外一些产品。
案例:(1)人工合成纤维取代天然布料。
(2)数码相机与传统相机。
直接替代品与间接替代品的界限并不清晰!负外部性(P104)指一个人的行为或企业的行为影响了其他人或企业,使之支付了额外的成本费用,但后者又无法获得相应补偿的现象。
边际收益(P125)是指增加一单位产品的销售所增加的收益,即最后一单位产品的售出所取得的收益。
24堂课解读以下是每堂课的简介和重点:第1课:引言与导论。
介绍课程的目的、结构以及如何使用这本书进行学习。
强调课程的重要性和实用性,为后续的学习打下基础。
第2课:学习的基本原理。
阐述学习的定义、过程和机制,以及影响学习效果的因素。
通过理解学习的本质,读者能够更好地掌握学习方法。
第3课:记忆的奥秘。
深入探讨记忆的机制,包括短期记忆和长期记忆的形成、存储和提取过程。
提供提高记忆力的实用技巧。
第4课:情绪与学习。
分析情绪在学习中的作用,如何利用情绪促进学习效果。
帮助读者了解情绪在学习中的重要性,提高学习效率。
第5课:创造力的培养。
探讨创造力的定义、构成要素和影响因素。
提供激发创造力的技巧和方法,培养读者的创造力。
第6课:批判性思维的培养。
解析批判性思维的含义、特点和应用领域。
教授批判性思维的基本技能和方法,帮助读者培养批判性思维能力。
第7课:有效沟通的技巧。
讲解沟通的重要性、原则和技巧。
帮助读者提高沟通能力,促进有效的信息传递和人际交往。
第8课:团队合作的力量。
分析团队合作的意义、原则和策略。
教授团队合作的方法和技巧,培养读者的团队协作能力。
第9课:领导力的内涵与培养。
阐释领导力的定义、特点和作用。
教授领导力培养的途径和方法,帮助读者提升领导能力。
第10课:目标设定与实现。
讨论目标设定的原则、方法和步骤。
引导读者设定明确、具体、可衡量的目标,提高实现目标的可能性。
第11课:时间管理的方法与技巧。
解析时间管理的概念、原则和技巧。
教授有效的时间管理方法,帮助读者合理安排时间,提高工作效率。
第12课:应对压力与挫折。
分析压力与挫折的产生原因、影响和应对策略。
提供有效的压力管理和挫折应对技巧,帮助读者保持积极心态和良好应对能力。
第13课:人际关系与个人成长。
探讨人际关系对个人成长的影响、建立良好人际关系的方法和技巧。
帮助读者建立健康的人际关系,促进个人发展。
第14课:自信心的建立与提升。
分析自信心的重要性、影响因素和提升方法。
组织社会学十讲整理稿周雪光社会科学文献出版社2003年第一讲导论:组织现象和组织社会学■引子■问题与现象:组织研究的课题什么是组织现象?组织社会学中的经典问题什么是社会学的角度?社会学研究中对因果“机制”问题的关注■组织社会学历史的简短回顾序曲两个黄金时期20世纪90年代以来的挑战和发展■小结■进一步阅读的文献组织社会学的经典著作组织社会学20世纪80年代以来的主要著述其他有关文献第二讲组织与市场:一个交易成本经济学的研究角度■需要解释的组织现象■新古典经济学中的组织解释逻辑:效率机制讨论■交易成本学派的基本思想威廉姆森的理论框架理论研究和实证分析的工具几个重要的分析概念交易成本的种类测量交易成本的角度一个具体分析小结■经济学关于组织研究的新近动向“旧车市场”的例子一个合同的理论框架逆向选择组织对策道德风险社会习俗的建立:一个博弈论角度的讨论小结■进一步阅读的文献第三讲组织与制度:一个制度学派的理论框架■关于社会学理论研究的开场白■需要解释的组织现象■组织社会学中制度学派的基本思路学术背景迈耶新制度主义的基本思想合法性机制从“制度环境”到理性神话制度环境对组织的影响以及组织的对策合法性机制的进一步探讨迪玛奇奥和鲍威尔关于组织趋同性的思想■制度学派的实证研究和演变托尔博特和朱克(1983)的研究哈恩的研究另外几项研究一个应用:从制度学派的观点看“送温暖”现象■小结:有待解决的问题■进一步阅读的文献第四讲组织与社会关系网络■需要解释的组织现象■科尔曼的问题■社会网络学派的回答:两个思路齐美尔的基本思路社会网络功利性的思路■从“内嵌性”到“结构洞”:20世纪80年代以来的进展格拉诺维特的“内嵌性理论”博特的“结构洞理论”社会网络学派的实证研究小结理论上存在的若干问题研究设计上存在的问题■制度的微观基础:制度学派框架内的一个尝试共享观念的微观基础几个例子:美国的堕胎运动美国总统大选黑人贝多芬事件组织趋同性的微观基础■比较理论分析:三种机制之间的关系(效率机制、合法性机制、社会网络机制)不同经济形式和三种机制机制间的关系进一步思考的问题小结■进一步阅读的文献第五讲有限理性与组织研究■需要解释的组织现象■有限理性概念的历史回顾■有限理性的研究工作有限理性的心理学基础有限理性的组织基础有限理性的政治学基础注意力分配组织规章制度和有限理性有限理性与组织学习■有限理性与其他组织理论的关系有限理性与威廉姆森的交易成本学派有限理性与制度学派社会网络学派——网络的局限性■从“有限理性”到“组织的局限性”■进一步阅读的文献第六讲组织中的激励问题■需要解释的组织现象管理模型的选择:“亲密型”干群关系还是“疏远型”干群关系?■经济学的激励研究为什么需要“激励”?激励与风险的平衡问题经济学的一个模型:激励原则有效信息的原则激励强度的原则监督强度的原则平衡激励的原则讨论■社会学中的雇佣问题和激励问题■几个实证研究的分析一个实证研究一个例子:气象台责任制的困惑■小结■进一步阅读的文献第七讲契约制度研究■需要解释的组织现象■经济学中的合同框架交易成本的思路合同理论的观点合同理论(哈特)的基本思想:(1)合同都是不完全的(2)权力(剩余所有权)在不完全合同中非常重要哈特对其他经济学流派的批评:(1)新古典不讲“权力”(2)博弈论讲的权力实际上是市场力量(影响市场价格的能力)(3)委托代理理论中没有交易成本问题,从而也没有事后权力分割问题哈特把交易成本学派提出的合同不完全性作为理论起点合同不可能完全的原因(威廉姆森)不完全合同面临的问题:(1)合同可能成为一纸空文(由于可以在事后讨价还价)(2)产生投机行为(3)进行专用性投资要冒风险合同理论关于收购合并的基本思想(合并的收益与成本):公司间合并的收益是收购公司进行关系专用性投资的激励增加(获得了更多的剩余控制权),合并的成本是被收购公司进行关系专用性投资的激励减少(只拥有较少的剩余控制权)组织内部的契约关系企业间合同:一些实证命题■社会网络与合同关系■文化制度和契约制度:日本纺织业的启示■转型社会中的企业间合同关系:一个比较研究研究背景一个比较理论的框架实证假设研究设计因变量解释变量研究发现讨论■一个比较理论研究的例子■进一步阅读的文献第八讲声誉制度的比较研究■需要解释的组织现象■经济学的解释逻辑:声誉=信息阿克罗夫的问题达斯古波塔的模式几个重要的研究工作讨论■一个社会网络理论的解释逻辑:地位=信息问题的提出社会关系网络的解释逻辑讨论■声誉:一个制度学派的解释社会承认的逻辑:一个制度学派的理论框架实证意义合法性的基础与声誉等级制度的分布社会领域内部的组织程度与声誉的分布小结■几个研究课题职业声望的重新解释“导师崇拜”现象的思考■小结■进一步阅读的文献第九讲有限理性与组织决策■需要解释的组织现象■讨论的起点:组织决策的理性选择模式充分信息下利益最大化的一个决策模式这一模式的进一步演变不完备信息:信息不确定性不对称信息评论■有限理性与组织决策引子:从个人决策到组织决策组织决策模式1:规章制度基础上的决策组织决策模型2:组织决策的政治过程组织决策模式3:组织决策的解释过程组织决策模式4:决策过程启动的两个机制问题导向的决策过程答案导向的组织决策小结:模糊性概念与组织决策模糊性与不确定性■组织研究中的“垃圾箱决策理论”垃圾箱的比喻理论模式一个例子:前苏联防空决策过程■小结■进一步阅读的文献第十讲组织的局限性和可持续发展■组织的可持续发展:问题的提出■效率与适应:组织生存能力的一个悖论■企业的战略对策■可持续性发展的对策:一个宏观的角度■结束的话:组织的局限性。
可编辑修改精选全文完整版《博弈论与信息经济学》教学大纲课程编号:030412B课程类型:□通识教育必修课□通识教育选修课□专业必修课√专业选修课□学科基础课总学时:32讲课学时:32学分:2适用对象:经济学、经济学实验班先修课程:微观经济学、高等数学一、课程的教学目标《博弈论与信息经济学》是研究策略相互影响的局势中,参与人如何选择自己的策略才能使自身的收益最大化的一门课程。
无论是人类社会的发展变化、社会经济制度的变革,还是人们的日常生活,我们都会经常碰到利益相互影响的博弈问题,也会经常使用博弈去选择策略,不管是自觉的还是无意识的。
近年来,博弈论的思想和建模方法已渗透到了几乎所有的经济分析领域,拓宽了经济学的研究领域,加深了经济学的分析,有以博弈论为基础重构经济学大厦的趋势。
萨缪尔森曾说过,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解”,可见博弈论的重要性。
而作为经济类本科生,尤其需要掌握博弈论的思想和方法。
通过本课程的学习,目标1:要使学生掌握基本的博弈分析方法,目标2:能建立和分析简单的博弈模型,目标3:并能应用博弈思想分析实际经济问题。
二、教学基本要求本课程由两部分组成:第一部分是博弈论,包括完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈等内容;第二部分是信息经济学,信息经济学本质上是非对称信息博弈论在经济学上的应用,包括委托-代理理论、逆向选择模型、信号传递模型等内容。
对完全信息静态博弈和完全信息动态博弈这两类基本博弈模型要讲透,不完全信息静态博弈和不完全信息动态博弈可做简单讲解,信息经济学可以穿插在博弈论的讲解中。
通过各类博弈模型的对比讲解,可以更好的突出重点,掌握难点,并结合实例,加强重点知识的学习和巩固。
为实现教学目标,除了课堂讲授的方式外,也可以采用课堂讨论、案例分析等教学方式,还可以给学生留一些课后思考题,督促学生课后自学。
教学过程中应注意联系实际,尽量多的介绍现实中的例子,并使学生学习将博弈思想应用于现实的方法。
博弈方2 博弈方 1 第4讲 学习机制和有限理性一、学习机制人们的学习主要包括模仿能力和逻辑推理能力。
1.模仿左图为两人对称静态博弈,称为协调博弈。
在完全理性和绝顶聪明假设下,该静态博弈有两个纳什均衡。
(A, A)是风险上策均衡,(B, B)是帕累托上策均衡。
现对该博弈作些改动。
设有5个博弈方(居民),他们环山而居,每户居民都与各自的左右邻居反复博弈。
现假设这些居民只具有有限理性,他们的模仿规则均是:如果上期中有邻居采用A 策略,则当期采用A 策略;如果上期中两个邻居都采用B 策略,则当期采用B 策略。
在该模仿规则下,反复博弈的结果如何?本质上不同的初始状态有8种:0A 、1A 、相邻2A 、不相邻2A 、相邻3A 、不相邻3A 、4A 和5A 。
下面得出在各种初始状态下反复博弈收敛情况。
初始状态为1A 的情况初始状态为相邻2A 的情况初始状态为相邻3A 的情况z 初始状态为0A 表示一开始所有人均采用B 策略,根据模仿规则,所有博弈方总是一直采用B 策略,显然,这是最好的结果。
z 初始状态为1A 的情况(上图)最后收敛于所有人均采用A 策略。
z初始状态为不相邻2A、不相邻3A和4A状态包含在1A的情况中,即都收敛于所有人均采用A策略。
z初始状态为相邻2A和相邻3A的情况(上图)同样收敛于所有人均采用A策略。
z初始状态为5A情况,所有博弈方总是一直采用A策略。
由此,在该模仿规则下,除非一开始所有人采用B策略,博弈最后总是稳定在所有人均采用A策略。
所以,该重复博弈有两个稳定状态:所有人采用A策略和所有人采用B策略。
但这两个稳定状态是有所差别的。
假设某种干扰使得其中一个或多个博弈方(居民)偏离模仿规则,稳定状态B就难以回复到原有状态,而是最终收敛至A状态了;而稳定状态A尽管有博弈方有暂时的偏离模仿规则,但最后还是回复到A状态,稳定状态A的这种特性叫稳健性。
具有稳定性和稳健性的均衡策略叫进化稳定策略。
2.逻辑推理逻辑推理主要包括演绎和归纳。
演绎推理就是由某个普遍性的原理推出某种特殊的结论。
归纳推理就是从少数的观察事例中概括出普遍性的命题。
古希腊哲学家亚里士多德确定的三段论演绎推理形式如:大前提:“所有人都会死”;小前提:“张三是人”;结论:“张三会死”。
归纳推理如:前提1:“张三会死”;前提2:“李四会死”;前提3:“王五会死”;……结论:“所有人都会死”。
对于演绎推理,只要前提是真的,推理形式正确,结论就肯定是真的,因为这个结论内容不会超出前提蕴涵的内容。
对于归纳推理则没这么简单。
归纳推理是跳跃式的,这个跳跃过程是可疑的。
大哲学家休谟批判归纳推理没有合理性,认为归纳只是人们的习惯联想。
可设想一下:主人每天给猪喂食,当猪看到主人来时,意味着食物送来了,然而猪不能必然性地得出,主人来时必然给它们喂食。
因为很有可能主人是拎着刀杀它来了。
这就是归纳法的困难。
哲学家无法证明归纳法的绝对合理性,如果要证明,则必须引入其它假定,即假定某事物是有规律的,然而这样的假定无法证明其真。
虽然归纳法的合理性存在疑问,但归纳法在科学中的作用不可低估,以至有人说,归纳法是科学家的荣耀,哲学家的耻辱。
二、有限理性1.盲从现象有一群人鱼贯进入一个房间,拿一瓶饮料喝。
在他们面前有3种饮料,但房间很黑,看不清饮料的质量和品牌,也就是说,3种饮料视觉效果是一样的。
实验结果如何?实验发现,人们会偏爱一种饮料,即几乎所有人都选择一种饮料,而不是3种饮料平均被选取。
按通常情况,由于3种饮料视觉效果,人群的选择会出现对称性,即由于群体中每个人的偏爱会相互抵消,从而出现每种饮料被选取的可能性一样。
出现非对称性的选择完全由于人们的选择行动的相互作用。
第一个人的选取可以说是随机的,但后来者有理由认为前者选择是有根据的,在对饮料质量口味一无所知的情况下后来者的选择很可能就是盲从了。
2.蜈蚣博弈的悖论——旅行者的困境(逆向归纳法的合理性)A和B轮流决策是否结束游戏,如果自己不结束,轮到对方结束的话,对方得益升2,而自己的得益降1。
这样玩下去,因为每次升2降1,总的说来两人的奖赏越来越高,但是每次谁不结束,都面临着下次对方结束的话将使自己损失1的风险。
运用逆向归纳法,就知道如果两人彻底理性、斤斤计较,博弈的结果就是失去合作的巨大好处而抢先结束游戏而得到悲惨结局(1, 1)。
从逻辑推理来看,逆向归纳法是严密的,但结果令人悲伤,且违反直觉。
对于蜈蚣博弈,哈佛大学巴罗教授演绎出著名的“旅行者困境”的故事。
两个旅行者从一个以出产细瓷花瓶著名的地方旅行回来,他们都买了花瓶。
提取行李时,发现花瓶摔碎了。
他们向航空公司索赔。
航空公司知道花瓶的价格总在八九十元左右,但是不知道两位旅行堵塞花瓶的确切价格。
于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。
如果两人写的一样,航空公司将认为他们讲真话,就按照所写数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲真话,并按照这个低的价格赔偿,但是对讲真话的旅客奖励2元,对讲假话的旅客罚2元。
如果两位旅客是彻底理性的、相互算计的、足够聪明至算计几十步的,结果会如何?对于蜈蚣悖论,博弈论专家做过实验。
实验发现,不会出现一开始就选择结束(即不合作)而双方仅获1的情况。
双方会自动选择继续,从而走向合作。
这种做法违反逆向归纳法。
另一方面,这种合作也不会坚持到最后一步。
理性的人出于自身利益考虑,肯定会在某一步采取结束(不合作),也就是逆向归纳法在某步要起作用。
逆向归纳法在何处开始起作用?3.最后通牒博弈(理性的困境?)两人分一笔钱,比如100元。
方法是:一人提出方案,另一人表决;如果表决的人同意,就按照所提出的分配方案分配;如果表决的人不同意,两人将一无所有。
设两人为A和B,A提方案,B表决。
按理性人假设,A提的方案应是99:1。
但是,英国博弈论专家宾谟做实验,发现提方案者倾向于提50:50,而接受者倾向于:少于30%拒绝,多于30%则接受。
这个博弈反映“人是理性的”在某些时候与实际情况不符,因此,有人指出这是理性的困境。
就笔者所理解,认为这不是理性的困境。
实际上,钱不仅仅是钱,人们的公平观和/或性格(强悍抑或软弱)影响人们的理性决策,钱常常带上公平、道德等色彩。
如人们会因分配不公干脆拒绝所分收入;又如钱有正当与非正当之说,捡来的钱花得并不舒坦,加上急失主所急,唯一选择便是将钱奉还给失主以求一个正面心理效用。
实际上,效用的定义(即对某事或某物的满足程度)已蕴含了浓厚的主观感受。
由于通常意义上的理性与感性相对立,所以人们通常将理性理解为排除主观感受。
但就博弈论和经济学对理性的定义(个人效用最大化),理性由于效用的定义而具有了主观色彩,是理性与感性的统一。
所以笔者认为不应该将最后通牒例子表述为理性的困境(像一些书上所说的),该例仅是强调了对理性在经济学中的正确理解。
4.彩票问题(低效用区的决策陷阱)理性的人总是力图使自己的效用最大化,如果在不完全信息下则是使自己的期望效用最大化。
但是这难以解释现实中人们购买彩票的现象。
彩票的命中率低,并且命中率与命中所得相乘——期望得益肯定低于购买的支出,因为彩票发行者早已计算过,他们通过发行彩票将获得高额回报,他们肯定赢。
所以彩票购买者是“不理性的”。
但社会上存在各种各样彩票,也有大量人去购买。
所以,此时用期望效用最大化定理解释不通,或者更具体地说,当人们以小博大时,期望效用最大化定理失效。
在购买彩票问题上,付出少量的金钱给购买者带来的损失不大,所以尽管命中率几乎为零,但此时影响人们的决策因素已是非理性的。
购买者考虑到如果自己运气好的话,可以获得高回报。
彩票发行者正是利用人们存在“低效用区的决策陷阱”而找到了赚钱的途径。
三、关于期望效用最大化定理的悖论上面介绍了有关理性问题的例子,而有关期望效用最大化悖论的例子则动摇了博弈论的基础。
1.期望效用最大化定理个人理性是指:在确定性情况下使个人效用最大化;在不确定情况下使个人的期望效用最大化。
理性决策者应该按使个人期望效用最大化方式决策,这个思想可追溯到伯努里(Bernoulli, 1738),但其合理性——期望效用最大化定理直到近代才被证明(von Neumann and Morgenstern, 1947):在一些非常弱的假设(公理系1)下,对任一理性决策者,一定存在某种方式对他所关心的各种可能结果赋予效用数值和对各种状态的主观概率,使其总是选择最大化个人期望效用的策略。
期望效用最大化定理是从公理系推导出来的,而这些公理作为对理性偏好的刻划从直觉来看合情合理。
因有了这个定理,数理社会科学家有信心认为:基于该定理建立起来的人类行为数学模型应该有广泛适用性和重要意义。
博弈论在很大程度上就是在这种信心激励下的产物。
然而,决策方面的实验研究已经揭示了一些背离期望效用最大化定理的行为。
2.阿莱(Allias)悖论(不存在效用函数)设彩金集X ={0, 1, 12},且令4支彩票为12340.9[0]0.1[12]0.89[0]0.11[1][1]0.01[0]0.89[1]0.1[12]f f f f =+=+==++ 实验结果:许多人表现的偏好为1234,f f f f ;;。
12f f ;说明彩金低的彩票即使中彩概率稍高也是没有吸引力的,或者说,人们愿意以稍许低些的概率来获得高额彩金。
34f f ;则说明人们更愿意100%地获得100万美元,而不想以1%可能一无所获来换取10%的高额报酬。
记彩金0、100万和1200万所对应的效用为)12()1(),0(u u u 和,这4支彩票的期望效用: 1 公理系包括完备性、传递性、相关性、单调性、连续性、客观替代性、主观替代性、利害性和状态中性。
详尽说明见罗杰.B.迈尔森《博弈论——矛盾冲突分析》第一章决策理论基础。
1234()0.9(0)0.1(12)()0.89(0)0.11(1)()(1)()0.01(0)0.89(1)0.1(12)E f u u E f u u E f u E f u u u =+=+==++于是, 12123434()()0.01(0)0.1(12)0.11(1)()()0.01(0)0.1(12)0.11(1)f f E f E f u u u f f E f E f u u u ⇔>⇔+>⇔>⇔+<;;得出矛盾。
所以,不存在效用函数u 使得期望效用的大小正好反映偏好1234,f f f f ;;。
实际上,偏好1234,f f f f ;;违背客观替代性公理:由客观替代性公理得42315.05.05.05.0f f f f +>+,而)(5.0)(5.0)12(05.0)1(5.0)0(45.0)(5.0)(5.04231f E f E u u u f E f E +=++=+。