第4讲学习机制和有限理性

合集下载

第4讲_破解让人懵圈的专业词汇_create

第四讲破解让人懵圈的专业词汇1.微观经济学专业词汇2.宏观经济学专业词汇3.战略管理专业词汇4.其他专业词汇拾零一、微观经济学专业词汇有限理性（P1）（1）处于完全理性和完全非理性之间的在一定条件限制下的理性。

（2）是为抓住问题的本质而简化决策变量的条件下表现出来的理性行为。

身份：马云，阿里巴巴集团创始人。

言论：我们要做一个由中国人打造的世界性公司（1999年）。

阿里巴巴每天上税100万。

（2004年）规模经济（P27）（1）指在一定时期内，企业所生产的产品或劳务的绝对量增加时，其单位成本趋于下降。

（2）此处规模指的是生产能力变化时的生产批量变化。

案例：生产1000万支手机要比生产1支手机的成本低得多。

最小有效规模（P27）（1）在长期中平均成本处于或接近其最小值的最小的规模。

（2）一般表现为“长期平均成本下降”，即长期平均成本曲线呈下降趋势，下降的最低点。

学习曲线（P28）当某一产品累积生产量增加时，由于经验和专有技术的积累所带来的产品单位成本的下降。

结构性障碍与行为性障（P27-28）对于一个产业来说，进入威胁的大小取决于呈现的进入障碍与准备进入者可能遇到的现有在位者的反击。

结构性障碍：产业呈现的进入障碍称为结构性障碍。

如规模经济、现有企业对专利、原材料等关键资源的控制以及现有企业的市场优势。

行为性障碍：是指现有企业对进入者实施报复手段所形成的进入障碍。

如限制进入定价，进入对方领域等。

直接产品替代（P28）某一种产品直接取代另一种产品。

案例：苹果计算机取代王安文字处理机。

间接产品替代（P28）由能够起到相同作用的产品非直接地取代另外一些产品。

案例：（1）人工合成纤维取代天然布料。

（2）数码相机与传统相机。

直接替代品与间接替代品的界限并不清晰！负外部性（P104）指一个人的行为或企业的行为影响了其他人或企业，使之支付了额外的成本费用，但后者又无法获得相应补偿的现象。

边际收益（P125）是指增加一单位产品的销售所增加的收益，即最后一单位产品的售出所取得的收益。

西方管理思想的发展

用秒表测算工人做这些基本动作时每一步所需要的时间。进而确定选择用做快速度完成这项工作时其动作的组成部分
消除一切虚假的、慢的和无用的动作
在消除一切不必要的动作后，把最快的动作和最合适的工具形成一个序列
然后，就用这种包含了一序列最快和最合适动作的新方法取代以前使用了15年的落后的方法。这种最先进的方法就成了标准，在一段时间内，把这种最先进的方法作为标准。老师首先要掌握它，然后再传授给企业里的每个工人，直到又一系列更快更好地动作取代它为止
主张用科学代替经验
主张管理者和操作者的分离。主张进行专门的管理专业教育。主张管理工作应该职业化。
管理专业化、职业化
3、行为管理思想
行为管理思想认为：人不仅是经济人，更是社会人，其劳动生产率受到社会的、心理的和群体的因素的影响。代表人物：梅约————社会人观点马斯洛—想是人们对于管理过程中发生的各种关系的认识总和，是由一系列观念或观点所构成的知识体系。随着内外部环境的变化和人们对于管理认识的深入，管理思想也随之发生着相应的演变，并由此形成了若干类不同的管理思想。
思考题我们为什么要了解管理思想的演变？
了解管理思想演变的重要性
管理学这可以把研究过去作为研究管理的入门。
传统的做法
科学管理的原则
工人们按各自的经验来开展工作
提出工人操作的每一动作的科学方法，以代替过去单凭经验从事的方法。
由工人选择各自的工作，并各尽所能地进行自我培训。
科学地挑选工人，并进行培训和教育，使之成长成才。与工人密切合作，以确保所有工作都按照所制定的科学原则行事。
第四讲管理思想的演变
因为我认为每个员工都是比较自觉而且客观上是比较积极向上的
你为什么对你的手下这么放手？

第一讲经济学的基本假设、问题和原理

2．经济学的逻辑
经济学家通过观察经济事件、利用统计分析和历史记录等等来分析经济现象，在此基础上构建其理论架构，从而揭示出经济现象的内涵。经济学在进行经济推理的过程中，应该注意避免一些基本的逻辑错误。
第一、后此谬误:”前因”不一定导致“后果”
第二、条件谬误：请保持其它条件不变
第三、合成谬误：对局部成立不等于对整体也成立。
济问题的分析涉及伦理信条、价值判断和社会偏好，属于不能被检验其因果关系的问题。
在经济学中，如何认识这两种方法的关系？首先，经济学的研究方法是两种方法的结合。其次，实证经济分析能够对我们在分析规范经济问题时持有的价值观会产生影响。再次，实证经济分析有助于我们选择恰当的政策来实现由规范经济分析提出的目标。
第二、如何生产？如何生产的问题包括谁来生产？使用什么资源，以及采用什么技术来生产？等等。还要决定，在经济活动中，是允许较多的污染？还是较少的污染？这一问题要受经济制度和政治制度，以及生产者的技术偏好等因素的影响。第三、为谁生产？为谁生产就是一个生产成果，也就是一个国家的国民收入在社会成员中如何分配的问题。这一问题与经济制度、政治制度和社会价值观念都有一定的关系。三、解决经济学三个基本问题的机制：市场经济、指令经济和混合经济上述三个问题从不同角度研究稀缺资源的配置决策。如何解决这三个问题，从经济学的角度来看，实际上就是选择什么样的稀缺资源的配置机制的问题。
▲经济学家从大家庭制度中看到了什么？
第二、经济学在局限条件下的研究ቤተ መጻሕፍቲ ባይዱ法将我们对人类行为的研究放到了现实的基础上，有助于避免乌托邦式的、脱离局限条件的研究。
▲ 在现代经济学热情看来，马克思“各尽所能，按需分配”的共产主义社会就是一个典型的乌托邦。

24堂课解读

24堂课解读以下是每堂课的简介和重点：第1课：引言与导论。

介绍课程的目的、结构以及如何使用这本书进行学习。

强调课程的重要性和实用性，为后续的学习打下基础。

第2课：学习的基本原理。

阐述学习的定义、过程和机制，以及影响学习效果的因素。

通过理解学习的本质，读者能够更好地掌握学习方法。

第3课：记忆的奥秘。

深入探讨记忆的机制，包括短期记忆和长期记忆的形成、存储和提取过程。

提供提高记忆力的实用技巧。

第4课：情绪与学习。

分析情绪在学习中的作用，如何利用情绪促进学习效果。

帮助读者了解情绪在学习中的重要性，提高学习效率。

第5课：创造力的培养。

探讨创造力的定义、构成要素和影响因素。

提供激发创造力的技巧和方法，培养读者的创造力。

第6课：批判性思维的培养。

解析批判性思维的含义、特点和应用领域。

教授批判性思维的基本技能和方法，帮助读者培养批判性思维能力。

第7课：有效沟通的技巧。

讲解沟通的重要性、原则和技巧。

帮助读者提高沟通能力，促进有效的信息传递和人际交往。

第8课：团队合作的力量。

分析团队合作的意义、原则和策略。

教授团队合作的方法和技巧，培养读者的团队协作能力。

第9课：领导力的内涵与培养。

阐释领导力的定义、特点和作用。

教授领导力培养的途径和方法，帮助读者提升领导能力。

第10课：目标设定与实现。

讨论目标设定的原则、方法和步骤。

引导读者设定明确、具体、可衡量的目标，提高实现目标的可能性。

第11课：时间管理的方法与技巧。

解析时间管理的概念、原则和技巧。

教授有效的时间管理方法，帮助读者合理安排时间，提高工作效率。

第12课：应对压力与挫折。

分析压力与挫折的产生原因、影响和应对策略。

提供有效的压力管理和挫折应对技巧，帮助读者保持积极心态和良好应对能力。

第13课：人际关系与个人成长。

探讨人际关系对个人成长的影响、建立良好人际关系的方法和技巧。

帮助读者建立健康的人际关系，促进个人发展。

第14课：自信心的建立与提升。

分析自信心的重要性、影响因素和提升方法。

组织社会学第五讲有限理性与组织研究

▪ 一些命题
• 利益的考虑意味着信息的使用是策略性的，而不是中立的 • 组织目标并不一定是连贯一致的 • 组织目标和组织决策常常只是松散关联的 • 组织的执行过程是组织决策过程的延续；常常发生组织目
标替代现象
有限理性的研究工作：注意力分配
▪ Cyert and March
• 由于时间和注意力是有限的、稀缺资源 • 组织结构对注意力的分配制约、对组织决策过程都有着
迷茫的世界
？
食
物
温暖的世界？
··
··
··
▪ 为什么有各种各样的组织管理理论？
• 在美国，许多大公司的总经理在退休的时候都会写一本书，总结其管理经验
• 成功经验：
▪ 大权在握、科层制vs分权、扁平式组织结构 ▪ 生产过程最关键vs销售服务是成功之本
▪ 两种解释
• 不同领域，需要不同的管理方式 • 成功与创造性并无太大关系，而是大环境使然
有限理性的研究工作：心理学
▪ 西蒙：人的信息加工能力是有限的
• 人们在决策过程并没有考虑所有的选择 • 不是同时考量所有选择，而是循序成对比较，二选一 • 选择的标准不是“最大化”原则，而是“满意”原则
▪ Tversky and Kahneman
• 人们的许多决策活动，都是在不确定条件（因为信息缺乏而导致的决策判断困难）下进行的
• 在不确定条件下，人们决策行为往往不是按照“理性模式”进行，而是建立在以往实践探索之上而产生的“经验估算”的各种原则
• 代表性
▪ 人们的判断常常以相似性为基础，而忽略先验概率，从而导致系统偏差
▪ 40%律师、60%工程师——根据对象的自我描述来判断其职业
• 联想性
▪ 人们在判断某一现象出现的概率时，不是按照概率理论的要求，而是按照心理上联想到该现象的容易程度来判断

第八讲有限理性及其对博弈的影响

协调博弈的优先博弈方快速学习模型
12
8.2.1 协调博弈的有限博弈方快速学习模型

全部采用 A 或 B 的情况不需讨论，采用 A 策略博弈方数量和位置有实质差异的只有 6 种情况
A B B B A B B A A A A A A A B A B A A B A A A B
B
初次博弈为 1A 的最优反应动态（已包含有相邻 2A ，非相连 3A 和 4A 三种情况）

核心：博弈方策略类型比例是动态变化的，其变
化速度可用动态复制方程表示：
dx dt x ( u y u)

x 0时，无模拟榜样，博弈方不会有意识地改变策略。 x 0 时，若变化率为正，采用“同意”策略的博弈方
逐渐增多；若变化率为负，采用“不同意”策略的博弈方逐渐增多。
x( x x 2 ) x 2 (1 x ) x 2 x 3
分析过程如下协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型13策略博弈方数量和位置有实质差异的只有种情况初次博弈为1a的最优反应动态已包含有相邻2a非相连3a4a三种情况协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型14初次博弈为相连3a的最优反应动态初次博弈为相邻2a的最优反应动态协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型15进化稳定策略在博弈方的动态调整策略中能达到又对少量偏离的扰动有稳健性满足这两种性质的稳定状态称进化稳定策略ess分析现实问题必须根据实际情况建立分析框架协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型16博弈方策略连续分布时的最优反应动态分析以古诺模型为例两个寡头的反应函数分别是个单位

周雪光组织社会学十讲整理稿

组织社会学十讲整理稿周雪光社会科学文献出版社2003年第一讲导论：组织现象和组织社会学■引子■问题与现象：组织研究的课题什么是组织现象?组织社会学中的经典问题什么是社会学的角度?社会学研究中对因果“机制”问题的关注■组织社会学历史的简短回顾序曲两个黄金时期20世纪90年代以来的挑战和发展■小结■进一步阅读的文献组织社会学的经典著作组织社会学20世纪80年代以来的主要著述其他有关文献第二讲组织与市场：一个交易成本经济学的研究角度■需要解释的组织现象■新古典经济学中的组织解释逻辑：效率机制讨论■交易成本学派的基本思想威廉姆森的理论框架理论研究和实证分析的工具几个重要的分析概念交易成本的种类测量交易成本的角度一个具体分析小结■经济学关于组织研究的新近动向“旧车市场”的例子一个合同的理论框架逆向选择组织对策道德风险社会习俗的建立:一个博弈论角度的讨论小结■进一步阅读的文献第三讲组织与制度：一个制度学派的理论框架■关于社会学理论研究的开场白■需要解释的组织现象■组织社会学中制度学派的基本思路学术背景迈耶新制度主义的基本思想合法性机制从“制度环境”到理性神话制度环境对组织的影响以及组织的对策合法性机制的进一步探讨迪玛奇奥和鲍威尔关于组织趋同性的思想■制度学派的实证研究和演变托尔博特和朱克(1983)的研究哈恩的研究另外几项研究一个应用:从制度学派的观点看“送温暖”现象■小结:有待解决的问题■进一步阅读的文献第四讲组织与社会关系网络■需要解释的组织现象■科尔曼的问题■社会网络学派的回答:两个思路齐美尔的基本思路社会网络功利性的思路■从“内嵌性”到“结构洞”:20世纪80年代以来的进展格拉诺维特的“内嵌性理论”博特的“结构洞理论”社会网络学派的实证研究小结理论上存在的若干问题研究设计上存在的问题■制度的微观基础:制度学派框架内的一个尝试共享观念的微观基础几个例子：美国的堕胎运动美国总统大选黑人贝多芬事件组织趋同性的微观基础■比较理论分析:三种机制之间的关系（效率机制、合法性机制、社会网络机制）不同经济形式和三种机制机制间的关系进一步思考的问题小结■进一步阅读的文献第五讲有限理性与组织研究■需要解释的组织现象■有限理性概念的历史回顾■有限理性的研究工作有限理性的心理学基础有限理性的组织基础有限理性的政治学基础注意力分配组织规章制度和有限理性有限理性与组织学习■有限理性与其他组织理论的关系有限理性与威廉姆森的交易成本学派有限理性与制度学派社会网络学派——网络的局限性■从“有限理性”到“组织的局限性”■进一步阅读的文献第六讲组织中的激励问题■需要解释的组织现象管理模型的选择:“亲密型”干群关系还是“疏远型”干群关系?■经济学的激励研究为什么需要“激励”？激励与风险的平衡问题经济学的一个模型:激励原则有效信息的原则激励强度的原则监督强度的原则平衡激励的原则讨论■社会学中的雇佣问题和激励问题■几个实证研究的分析一个实证研究一个例子:气象台责任制的困惑■小结■进一步阅读的文献第七讲契约制度研究■需要解释的组织现象■经济学中的合同框架交易成本的思路合同理论的观点合同理论（哈特）的基本思想：（1）合同都是不完全的（2）权力（剩余所有权）在不完全合同中非常重要哈特对其他经济学流派的批评：（1）新古典不讲“权力”（2）博弈论讲的权力实际上是市场力量（影响市场价格的能力）（3）委托代理理论中没有交易成本问题，从而也没有事后权力分割问题哈特把交易成本学派提出的合同不完全性作为理论起点合同不可能完全的原因（威廉姆森）不完全合同面临的问题：（1）合同可能成为一纸空文（由于可以在事后讨价还价）（2）产生投机行为（3）进行专用性投资要冒风险合同理论关于收购合并的基本思想（合并的收益与成本）：公司间合并的收益是收购公司进行关系专用性投资的激励增加（获得了更多的剩余控制权），合并的成本是被收购公司进行关系专用性投资的激励减少（只拥有较少的剩余控制权）组织内部的契约关系企业间合同:一些实证命题■社会网络与合同关系■文化制度和契约制度:日本纺织业的启示■转型社会中的企业间合同关系:一个比较研究研究背景一个比较理论的框架实证假设研究设计因变量解释变量研究发现讨论■一个比较理论研究的例子■进一步阅读的文献第八讲声誉制度的比较研究■需要解释的组织现象■经济学的解释逻辑:声誉=信息阿克罗夫的问题达斯古波塔的模式几个重要的研究工作讨论■一个社会网络理论的解释逻辑:地位=信息问题的提出社会关系网络的解释逻辑讨论■声誉:一个制度学派的解释社会承认的逻辑:一个制度学派的理论框架实证意义合法性的基础与声誉等级制度的分布社会领域内部的组织程度与声誉的分布小结■几个研究课题职业声望的重新解释“导师崇拜”现象的思考■小结■进一步阅读的文献第九讲有限理性与组织决策■需要解释的组织现象■讨论的起点:组织决策的理性选择模式充分信息下利益最大化的一个决策模式这一模式的进一步演变不完备信息:信息不确定性不对称信息评论■有限理性与组织决策引子:从个人决策到组织决策组织决策模式1:规章制度基础上的决策组织决策模型2:组织决策的政治过程组织决策模式3:组织决策的解释过程组织决策模式4:决策过程启动的两个机制问题导向的决策过程答案导向的组织决策小结：模糊性概念与组织决策模糊性与不确定性■组织研究中的“垃圾箱决策理论”垃圾箱的比喻理论模式一个例子:前苏联防空决策过程■小结■进一步阅读的文献第十讲组织的局限性和可持续发展■组织的可持续发展:问题的提出■效率与适应:组织生存能力的一个悖论■企业的战略对策■可持续性发展的对策:一个宏观的角度■结束的话:组织的局限性。

学习概论(第七章)PPT课件

强化机制
通过奖励和惩罚等手段强化学习者的学习行为，增强学习效果。
迁移机制
学习者将学习到的知识应用到实际情境中，实现知识的迁移和应用。
学习过程中的影响因素
学习动机
学习策略
学习动机是推动学习者进行学习的内在动力，对学习效果有重要影响。
学习者采用的学习方法和技巧，对学习效果和学习效率产生影响。
学习环境
学习资源的利用与开发
利用资源
学习者应该充分利用现有的学习资源，包括人力资源、物力资源和财力资源，以提高学习效率和
质量。
开发资源
在现有资源的基础上，学习者还可以通过自我开发和学习，发掘更多的学习资源，以满足自身的学习需求。
资源共享
通过共享学习资源，学习者可以相互借鉴、交流和合作，从而更好地促进学习和发展。
学习资源
包括学习场所、学习氛围、师生关系等，对学习效果和学习体验产生影响。
包括教材、课件、辅导资料等，对学习效果和学习效率产生影响。
04 学习环境与资源
学习环境
01
02
03
物理环境
包括教室、图书馆、实验室等，这些环境为学习者提供了学习的场所和设施。
技术环境
包括计算机、网络、多媒体等，这些技术为学习者提供了更高效、更便捷的学习方式。
。
认知策略
运用有效的学习方法来理解和记忆学习材料，如复述、分类、归纳等。
资源管理策略
合理安排学习时间、选择合适的学习环境和学习资源，以提高学习效率。
动机策略
激发学习兴趣和动力，增强自我效能感和自信心，以提高学
习积极性。
03 学习过程与机制
学习过程
感知阶段

新制度经济学第6讲国家理论

• 法律权利(Legal Rights): the claims over assets delineated by the state as the property of particular individuals or institutions（资产的索取权，它是由国家以特定个体或机构的财产来进行界定的）
24
几种关于国家的经济学理论
奥尔森的国家理论
理论缺陷：新制度经济学缺乏对集体行为与制度关系的分析
奥尔森理论亮点在于：解释各种利益集团的利益如何体现在政策和制度中。
人类社会的许多制度是不同利益集团博弈的结果。
匪徒如果能够长期控制某个地方，则会企图以各种税收的形式对偷盗或掠夺并使之合理化。
• 权力(Power)：the ability to impose costs（强加成本的能力） • 暴力(Violence)：impersonal means of imposing costs（i.e.,
by individuals who do not form enduring relationship with the enforced)（强加成本的非人格化的手段，即由与被实施者没有持久关系的个体实施的） • 执行(Enforcement): the credible threat to induce compliance （促使顺从的可信威胁）
力有趣Leabharlann 实例：英王向大英银行借款，遵约还款
19
巴泽尔的国家理论
几种关于国家的经济学理论
背景
– 毕业于希伯来大学和芝加哥大学
– 1967年后在华盛顿大学任教。
– 在新制度经济学界享有很高的声誉，产权大师
– 主要著作：《产权的经济分析》《国家理论》

博弈论与信息经济学-教学大纲全文

可编辑修改精选全文完整版《博弈论与信息经济学》教学大纲课程编号：030412B课程类型：□通识教育必修课□通识教育选修课□专业必修课√专业选修课□学科基础课总学时：32讲课学时：32学分：2适用对象：经济学、经济学实验班先修课程：微观经济学、高等数学一、课程的教学目标《博弈论与信息经济学》是研究策略相互影响的局势中，参与人如何选择自己的策略才能使自身的收益最大化的一门课程。

无论是人类社会的发展变化、社会经济制度的变革，还是人们的日常生活，我们都会经常碰到利益相互影响的博弈问题，也会经常使用博弈去选择策略，不管是自觉的还是无意识的。

近年来，博弈论的思想和建模方法已渗透到了几乎所有的经济分析领域，拓宽了经济学的研究领域，加深了经济学的分析，有以博弈论为基础重构经济学大厦的趋势。

萨缪尔森曾说过，“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致的了解”，可见博弈论的重要性。

而作为经济类本科生，尤其需要掌握博弈论的思想和方法。

通过本课程的学习，目标1：要使学生掌握基本的博弈分析方法，目标2：能建立和分析简单的博弈模型，目标3：并能应用博弈思想分析实际经济问题。

二、教学基本要求本课程由两部分组成：第一部分是博弈论，包括完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈等内容；第二部分是信息经济学，信息经济学本质上是非对称信息博弈论在经济学上的应用，包括委托-代理理论、逆向选择模型、信号传递模型等内容。

对完全信息静态博弈和完全信息动态博弈这两类基本博弈模型要讲透，不完全信息静态博弈和不完全信息动态博弈可做简单讲解，信息经济学可以穿插在博弈论的讲解中。

通过各类博弈模型的对比讲解，可以更好的突出重点，掌握难点，并结合实例，加强重点知识的学习和巩固。

为实现教学目标，除了课堂讲授的方式外，也可以采用课堂讨论、案例分析等教学方式，还可以给学生留一些课后思考题，督促学生课后自学。

教学过程中应注意联系实际，尽量多的介绍现实中的例子，并使学生学习将博弈思想应用于现实的方法。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈方2 博弈方 1 第4讲学习机制和有限理性一、学习机制人们的学习主要包括模仿能力和逻辑推理能力。

1．模仿左图为两人对称静态博弈，称为协调博弈。

在完全理性和绝顶聪明假设下，该静态博弈有两个纳什均衡。

(A, A)是风险上策均衡，(B, B)是帕累托上策均衡。

现对该博弈作些改动。

设有5个博弈方（居民），他们环山而居，每户居民都与各自的左右邻居反复博弈。

现假设这些居民只具有有限理性，他们的模仿规则均是：如果上期中有邻居采用A 策略，则当期采用A 策略；如果上期中两个邻居都采用B 策略，则当期采用B 策略。

在该模仿规则下，反复博弈的结果如何？本质上不同的初始状态有8种：0A 、1A 、相邻2A 、不相邻2A 、相邻3A 、不相邻3A 、4A 和5A 。

下面得出在各种初始状态下反复博弈收敛情况。

初始状态为1A 的情况初始状态为相邻2A 的情况初始状态为相邻3A 的情况z 初始状态为0A 表示一开始所有人均采用B 策略，根据模仿规则，所有博弈方总是一直采用B 策略，显然，这是最好的结果。

z 初始状态为1A 的情况（上图）最后收敛于所有人均采用A 策略。

z初始状态为不相邻2A、不相邻3A和4A状态包含在1A的情况中，即都收敛于所有人均采用A策略。

z初始状态为相邻2A和相邻3A的情况（上图）同样收敛于所有人均采用A策略。

z初始状态为5A情况，所有博弈方总是一直采用A策略。

由此，在该模仿规则下，除非一开始所有人采用B策略，博弈最后总是稳定在所有人均采用A策略。

所以，该重复博弈有两个稳定状态：所有人采用A策略和所有人采用B策略。

但这两个稳定状态是有所差别的。

假设某种干扰使得其中一个或多个博弈方（居民）偏离模仿规则，稳定状态B就难以回复到原有状态，而是最终收敛至A状态了；而稳定状态A尽管有博弈方有暂时的偏离模仿规则，但最后还是回复到A状态，稳定状态A的这种特性叫稳健性。

具有稳定性和稳健性的均衡策略叫进化稳定策略。

2．逻辑推理逻辑推理主要包括演绎和归纳。

演绎推理就是由某个普遍性的原理推出某种特殊的结论。

归纳推理就是从少数的观察事例中概括出普遍性的命题。

古希腊哲学家亚里士多德确定的三段论演绎推理形式如：大前提：“所有人都会死”；小前提：“张三是人”；结论：“张三会死”。

归纳推理如：前提1：“张三会死”；前提2：“李四会死”；前提3：“王五会死”；……结论：“所有人都会死”。

对于演绎推理，只要前提是真的，推理形式正确，结论就肯定是真的，因为这个结论内容不会超出前提蕴涵的内容。

对于归纳推理则没这么简单。

归纳推理是跳跃式的，这个跳跃过程是可疑的。

大哲学家休谟批判归纳推理没有合理性，认为归纳只是人们的习惯联想。

可设想一下：主人每天给猪喂食，当猪看到主人来时，意味着食物送来了，然而猪不能必然性地得出，主人来时必然给它们喂食。

因为很有可能主人是拎着刀杀它来了。

这就是归纳法的困难。

哲学家无法证明归纳法的绝对合理性，如果要证明，则必须引入其它假定，即假定某事物是有规律的，然而这样的假定无法证明其真。

虽然归纳法的合理性存在疑问，但归纳法在科学中的作用不可低估，以至有人说，归纳法是科学家的荣耀，哲学家的耻辱。

二、有限理性1．盲从现象有一群人鱼贯进入一个房间，拿一瓶饮料喝。

在他们面前有3种饮料，但房间很黑，看不清饮料的质量和品牌，也就是说，3种饮料视觉效果是一样的。

实验结果如何？实验发现，人们会偏爱一种饮料，即几乎所有人都选择一种饮料，而不是3种饮料平均被选取。

按通常情况，由于3种饮料视觉效果，人群的选择会出现对称性，即由于群体中每个人的偏爱会相互抵消，从而出现每种饮料被选取的可能性一样。

出现非对称性的选择完全由于人们的选择行动的相互作用。

第一个人的选取可以说是随机的，但后来者有理由认为前者选择是有根据的，在对饮料质量口味一无所知的情况下后来者的选择很可能就是盲从了。

2．蜈蚣博弈的悖论——旅行者的困境（逆向归纳法的合理性）A和B轮流决策是否结束游戏，如果自己不结束，轮到对方结束的话，对方得益升2，而自己的得益降1。

这样玩下去，因为每次升2降1，总的说来两人的奖赏越来越高，但是每次谁不结束，都面临着下次对方结束的话将使自己损失1的风险。

运用逆向归纳法，就知道如果两人彻底理性、斤斤计较，博弈的结果就是失去合作的巨大好处而抢先结束游戏而得到悲惨结局(1, 1)。

从逻辑推理来看，逆向归纳法是严密的，但结果令人悲伤，且违反直觉。

对于蜈蚣博弈，哈佛大学巴罗教授演绎出著名的“旅行者困境”的故事。

两个旅行者从一个以出产细瓷花瓶著名的地方旅行回来，他们都买了花瓶。

提取行李时，发现花瓶摔碎了。

他们向航空公司索赔。

航空公司知道花瓶的价格总在八九十元左右，但是不知道两位旅行堵塞花瓶的确切价格。

于是，航空公司请两位旅客在100元以内自己写下花瓶的价格。

如果两人写的一样，航空公司将认为他们讲真话，就按照所写数额赔偿；如果两人写的不一样，航空公司就认定写得低的旅客讲真话，并按照这个低的价格赔偿，但是对讲真话的旅客奖励2元，对讲假话的旅客罚2元。

如果两位旅客是彻底理性的、相互算计的、足够聪明至算计几十步的，结果会如何？对于蜈蚣悖论，博弈论专家做过实验。

实验发现，不会出现一开始就选择结束（即不合作）而双方仅获1的情况。

双方会自动选择继续，从而走向合作。

这种做法违反逆向归纳法。

另一方面，这种合作也不会坚持到最后一步。

理性的人出于自身利益考虑，肯定会在某一步采取结束（不合作），也就是逆向归纳法在某步要起作用。

逆向归纳法在何处开始起作用？3．最后通牒博弈（理性的困境？）两人分一笔钱，比如100元。

方法是：一人提出方案，另一人表决；如果表决的人同意，就按照所提出的分配方案分配；如果表决的人不同意，两人将一无所有。

设两人为A和B，A提方案，B表决。

按理性人假设，A提的方案应是99：1。

但是，英国博弈论专家宾谟做实验，发现提方案者倾向于提50：50，而接受者倾向于：少于30%拒绝，多于30%则接受。

这个博弈反映“人是理性的”在某些时候与实际情况不符，因此，有人指出这是理性的困境。

就笔者所理解，认为这不是理性的困境。

实际上，钱不仅仅是钱，人们的公平观和/或性格（强悍抑或软弱）影响人们的理性决策，钱常常带上公平、道德等色彩。

如人们会因分配不公干脆拒绝所分收入；又如钱有正当与非正当之说，捡来的钱花得并不舒坦，加上急失主所急，唯一选择便是将钱奉还给失主以求一个正面心理效用。

实际上，效用的定义（即对某事或某物的满足程度）已蕴含了浓厚的主观感受。

由于通常意义上的理性与感性相对立，所以人们通常将理性理解为排除主观感受。

但就博弈论和经济学对理性的定义（个人效用最大化），理性由于效用的定义而具有了主观色彩，是理性与感性的统一。

所以笔者认为不应该将最后通牒例子表述为理性的困境（像一些书上所说的），该例仅是强调了对理性在经济学中的正确理解。

4．彩票问题（低效用区的决策陷阱）理性的人总是力图使自己的效用最大化，如果在不完全信息下则是使自己的期望效用最大化。

但是这难以解释现实中人们购买彩票的现象。

彩票的命中率低，并且命中率与命中所得相乘——期望得益肯定低于购买的支出，因为彩票发行者早已计算过，他们通过发行彩票将获得高额回报，他们肯定赢。

所以彩票购买者是“不理性的”。

但社会上存在各种各样彩票，也有大量人去购买。

所以，此时用期望效用最大化定理解释不通，或者更具体地说，当人们以小博大时，期望效用最大化定理失效。

在购买彩票问题上，付出少量的金钱给购买者带来的损失不大，所以尽管命中率几乎为零，但此时影响人们的决策因素已是非理性的。

购买者考虑到如果自己运气好的话，可以获得高回报。

彩票发行者正是利用人们存在“低效用区的决策陷阱”而找到了赚钱的途径。

三、关于期望效用最大化定理的悖论上面介绍了有关理性问题的例子，而有关期望效用最大化悖论的例子则动摇了博弈论的基础。

1．期望效用最大化定理个人理性是指：在确定性情况下使个人效用最大化；在不确定情况下使个人的期望效用最大化。

理性决策者应该按使个人期望效用最大化方式决策，这个思想可追溯到伯努里(Bernoulli, 1738)，但其合理性——期望效用最大化定理直到近代才被证明(von Neumann and Morgenstern, 1947)：在一些非常弱的假设（公理系1）下，对任一理性决策者，一定存在某种方式对他所关心的各种可能结果赋予效用数值和对各种状态的主观概率，使其总是选择最大化个人期望效用的策略。

期望效用最大化定理是从公理系推导出来的，而这些公理作为对理性偏好的刻划从直觉来看合情合理。

因有了这个定理，数理社会科学家有信心认为：基于该定理建立起来的人类行为数学模型应该有广泛适用性和重要意义。

博弈论在很大程度上就是在这种信心激励下的产物。

然而，决策方面的实验研究已经揭示了一些背离期望效用最大化定理的行为。

2．阿莱(Allias)悖论（不存在效用函数）设彩金集X ={0, 1, 12}，且令4支彩票为12340.9[0]0.1[12]0.89[0]0.11[1][1]0.01[0]0.89[1]0.1[12]f f f f =+=+==++ 实验结果：许多人表现的偏好为1234,f f f f ;;。

12f f ;说明彩金低的彩票即使中彩概率稍高也是没有吸引力的，或者说，人们愿意以稍许低些的概率来获得高额彩金。

34f f ;则说明人们更愿意100%地获得100万美元，而不想以1%可能一无所获来换取10%的高额报酬。

记彩金0、100万和1200万所对应的效用为)12()1(),0(u u u 和，这4支彩票的期望效用： 1 公理系包括完备性、传递性、相关性、单调性、连续性、客观替代性、主观替代性、利害性和状态中性。

详尽说明见罗杰.B.迈尔森《博弈论——矛盾冲突分析》第一章决策理论基础。

1234()0.9(0)0.1(12)()0.89(0)0.11(1)()(1)()0.01(0)0.89(1)0.1(12)E f u u E f u u E f u E f u u u =+=+==++于是， 12123434()()0.01(0)0.1(12)0.11(1)()()0.01(0)0.1(12)0.11(1)f f E f E f u u u f f E f E f u u u ⇔>⇔+>⇔>⇔+<;;得出矛盾。

所以，不存在效用函数u 使得期望效用的大小正好反映偏好1234,f f f f ;;。

实际上，偏好1234,f f f f ;;违背客观替代性公理：由客观替代性公理得42315.05.05.05.0f f f f +>+，而)(5.0)(5.0)12(05.0)1(5.0)0(45.0)(5.0)(5.04231f E f E u u u f E f E +=++=+。