纳什均衡

合集下载

简述纳什均衡的完整定义

简述纳什均衡的完整定义纳什均衡是经济学中一种非常重要的概念，它可以帮助研究者更好地理解和分析商业市场中的结构和行为，从而制定更有效和合理的市场规则和监管政策。

纳什均衡是由美国经济学家纳什在1952年提出的，它是一种经济系统中发现的一种特殊状态，在该状态下每一方都达到了自我利益的最优化，也即互利共赢的状态。

完整的定义：纳什均衡是一种经济系统中的元素之间的特殊状态，在该状态下参与者均衡主体之间的行为，使他们能够达到自身利益最大化的最佳状态，也即互利共赢的状态。

纳什均衡可以用于研究各种市场状况下的抉择决策，其中每一方都在实现自身利益的同时，也有利于其他参与者获取最大利益。

在具体的经济学中，纳什均衡的概念有着十分重要的地位，它是研究市场结构及其行为的基础。

纳什均衡的概念可以用来分析商业市场的作用、判断行为的合理性以及指导政府有效地实施市场监管政策。

从宏观层面来讲，纳什均衡是一种很有效的解决问题的方法，因为它可以使所有参与者都能实现利益最大化；而从微观层面来讲，纳什均衡可以帮助研究者了解市场结构中某一方可能采取的行为态度，以及市场如何做出反应。

纳什均衡的分析模型包含了三个基本假设：第一，存在多个参与者，每一方都希望达到最大的利益；第二，这些参与者都具有完备的信息；第三，参与者之间可以自由协商。

这三个基本假设能够帮助研究者更好地理解市场行为的决定因素。

另外，纳什均衡独特的结构特性也是其重要的特点之一。

它可以通过对各种不同的定价策略和其他参数，来模拟不同类型的商业市场，从而帮助研究者更好地理解市场中的不同类型行为。

此外，纳什均衡也被用于评估政府政策的影响，以及制定公平、合理的市场规则。

它可以帮助研究者更好地分析政府改革举措的影响，以及确定最有效的市场监管政策。

总之，纳什均衡是一个概念非常重要的概念，它不仅可以帮助研究者更好地理解和分析商业市场中的结构和行为，而且可以帮助研究者更好地分析政府改革举措和市场监管政策的影响。

纳什均衡

纳什均衡简介纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。

一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。

纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。

实际上，博弈论的研究起始于1944年冯·诺依曼（Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。

然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“非合作博弈”做了明确的区分和定义。

阿尔伯特·塔克（Alberttucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。

它发展了本身很有意义的n人有限非合作博弈的概念和性质。

并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。

在概念和方法两方面，该论文都是作者的独立创造。

”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。

囚徒困境是一个非零和博弈，说的是两个嫌疑犯甲和乙私人民宅联手作案，被警方逮住但未获证据。

警方于是将两个嫌疑犯分开审讯。

警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑3个月，对方将被判刑10年；若两人都不招供则因未获证据但私人民宅将各拘留1年；如果两人均招供，每人将被判刑5年。

纳什均衡

1.纳什均衡：给出对方的策略，你所选的是最优的（至少不比其它策略差），如果每个局中人都是这样，那么所构成的策略组合（对局），就称为纳什均衡。

2.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。

3.边际产量：当其他要素不变时，可变要素增加一个单位所带来的总产量的增加量。

4.生产成本：经营一个企业，为达到利润最大化，必须支付一些资金来维持运营，如建造厂房，采购机器及原料，雇用员工等支出都可视为厂家的生产成本。

5.帕累托标准：如果一种变化可以改善某些人的处境，同时对其他人都没有伤害。

则这种变化是好事，应该给予实行。

6.恩格尔系数：是食品支出总额占个人消费支出总额的比重。

一个家庭收入越少，家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大，随着家庭收入的增加，家庭收入中或者家庭支出中用来购买食物的支出将会下降。

恩格尔系数是用来衡量家庭富足程度的重要指标。

7.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。

8.价格管制：是指政府对新药定价以及上市药品价格上涨实施严格的管制，企业不能自由定价，而是由政府和制药企业谈判决定新药的价格。

9.软着陆：当一个国家经过强劲的经济增长后，仍维持缓和的增长，并未因此转入衰退，即使“软着陆”。

10.硬着陆：一个国家的经济在高速增长的同时伴随着高度通货膨胀，使得经济迅速从增高长直接走入低增长甚至衰退。

11.通货膨胀：平均物价水平持续上扬的状态，通货膨胀率通常是以消费者物价指数（CPI）的变化率来表示。

指数上升→物价上升，货币购买力下降。

12.再贴现率：一般商业银行可以直接向中央银行借贷的利率。

所谓“贴现”：通过一定的方式把发生在未来（或不同时间）的费用和效益转化为现值的方式就叫贴现。

13.机会成本：在资源一定的情况下，多生产一个单位的某种产品，就要以少生产若干单位的另一种产品为代价。

纳什均衡理论课件

迭代逼近法
总结词
通过不断迭代和调整策略来逼近纳什均衡。
VS
详细描述
迭代逼近法是一种通过不断迭代和调整参与者的策略，以逐渐逼近纳什均衡的方法。这种方法可以在不知道具体的纳什均衡的情况下，通过迭代过程找到近似解。
04
纳什均衡的扩展与深化
非合作博弈中的纳什均衡
要点一
总结词
非合作博弈中，纳什均衡是指参与人选择策略时，没有达成任何协议或合作，各自追求自身利益的最大化。
纳什均衡理论课件
目录 CONTENTS
• 纳什均衡理论概述 • 纳什均衡的分类与特性 • 纳什均衡的证明方法 • 纳什均衡的扩展与深化 • 纳什均衡理论的现实应用 • 纳什均衡理论的前沿研究与展望
01
纳什均衡理论概述
定义与概念
纳什均衡定义：在博弈中，如果每个参与者的策略都是针对其他参与者的最优策略，则该博弈状态被称为纳什均衡。
社会学
纳什均衡理论在社会学中用于研究社会行为、合作与冲突、社会规范等领域，揭示了社会现象背后的博弈逻辑。
生物学
在生物学中，纳什均衡理论用于研究生物种群竞争、进化策略等领域，解释了生物种群之间的生存竞争与演化现象。
政治学
在政治学中，纳什均衡理论用于分析国际关系、政治竞争等领域，揭示了权力与利益分配的博弈逻辑。
社会冲突管理
在处理社会冲突时，可运用纳什均衡理论来分析各方的利益和策略，寻求最优解决方案。
公共资源管理
在管理公共资源时，政府可运用纳什均衡理论来分析个体和团体的竞争策略，制定最佳资源分配方案。
06
纳什均衡理论的前沿研究与展望
当前研究热点与难点
热点
复杂系统中的纳什均衡、多智能体系统中的纳什均衡、网络博弈中的纳什均衡

纳什均衡

纳什均衡纳什均衡（Nash equilibrium）——完全信息静态博弈[编辑]纳什均衡简介纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。

一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。

[编辑]纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。

实际上，博弈论的研究起始于1944年冯·诺依曼（Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。

阿尔伯特·塔克（Albert tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。

它发展了本身很有意义的n人有限非合作博弈的概念和性质。

并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。

在概念和方法两方面，该论文都是作者的独立创造。

”[编辑]纳什均衡例子一个著名的例子就是囚徒困境，囚徒困境是一个非零和博弈。

大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑一年，而对方将被判刑十年；如果两人均招供，将均被判刑五年。

解释现实中的纳什均衡现象

VS
政治联盟
在某些政治体系中，政治家或政党可能会结成联盟，以增加自己的政治影响力。这种联盟的形成也可以看作是一种纳什均衡。
国际贸易
关税壁垒
在国际贸易中，国家可能会采取关税壁垒来保护本国产业。如果所有国家都采取这种策略，最终可能导致全球贸易量下降，形成纳什均衡。
自由贸易协定
为了避免关税壁垒带来的负面影响，国家之间可能会达成自由贸易协定，降低或取消关税。这种协定的达成也可以看作是一种纳什均衡。
激励机制
设计合理的奖励机
制
通过设计合理的奖励机制，激励参与者采取合作行为，避免陷入纳什均衡。
惩罚不合作行为
对采取不合作行为的参与者进行适当的惩罚，以减少不合作行为的发生，促进合作。
引入竞争机制
通过引入竞争机制，激励参与者采取更好的策略和行为，打破纳什均衡。
信息披露
增加信息透明度
通过增加信息透明度，减少信息不对称，让参与者更好地了解彼此的策略和行为，从而避免陷入纳什均衡。
它是一种非合作博弈均衡，基于参与者理性假设和自利原则，是博弈论中的基本概念之一。
纳什均衡的重要性
揭示博弈中策略选择的本质
纳什均衡揭示了博弈中参与者策略选择的本质，即为了实现自身利益最大化，参与者会选择对自己最有利的策略。
指导政策制定
在政策制定中，了解纳什均衡的存在及其特点，有助于政府制定出更有效的政策，引导市场主体理性决策。
解释现实中的纳什均衡现象
目录
• 纳什均衡简介 • 纳什均衡的实例 • 现实生活中的纳什均衡现象 • 如何应对纳什均衡现象 • 纳什均衡的未来研究方向
01纳什均衡简介源自定义与概念纳什均衡是指在博弈论中，一种所有参与者都不愿意偏离的策略组合，即每个参与者都认为当前策略是最好的，不会选择其他策略。

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡？1、纳什均衡（Nash equilibrium )，又称非合作博弈均衡，是博弈论概念，指的是：一种博弈稳定结果，谁单方改变策略，谁就会损失。

两个囚徒互相揭发，就是一种纳什均衡。

对于每个囚徒来说，如果打破纳什均衡，在对方实施揭发策略时，改变揭发策略，保持沉默，自己就会由判刑2年，变成判刑5年。

也就是说，两个囚徒互相揭发是稳定博弈结果，谁单方改变策略，就会受到损失。

这也就是均衡涵义所在，两个囚徒从利己角度，都不会单方改变策略。

博弈策略稳定，博弈结果也稳定。

之所以命名为纳什均衡，是因为提出者是经济学家、博弈论创始人约翰．纳什。

之所以称为非合作博弈均衡，原因就是：两个囚徒如果合作，互相保持沉默，各自只要坐牢1年；但最终博弈结果，也就是纳什均衡显著特征，是不合作。

2、纳什均衡意义重大。

纳什均衡提出，震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说：“你只要教会鹦鹉说‘需求和供给’，它也是经济学家。

”博弈论专家坎多瑞则说：“这只鹦鹉现在必须多学一个词了，那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说：“发现纳什均衡意义，可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡，创立博弈论，而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大，简单来说，就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理，就知道，古典经济学认为，通过市场这只‘看不见的手’调节，个体追求私利行为，会促进集体利益最大化。

但纳什均衡却违反上述原理：两个囚徒分别追求私利行为，并没有促进集体（囚徒整体）利益最大化，反而是损人不利己。

这正是市场失灵软肋之处，通过博弈论视角可以得到合乎逻辑解释，更有条件找到合适解决方案。

从上述这点，读友们可以“一斑窥全豹”，感受到博弈论重要性。

更重要的是，纳什均衡非常普遍，小至个人沟通，中到公司竞争，大到国家往来，都可以观察到。

Q2：怎样运用纳什均衡？1、分析囚徒困境。

定义纳什均衡

定义纳什均衡
纯策略纳什均衡是指在一个纯策略组合中，如果给定其他的策略不变，该节点不会单
方面改变自己的策略，否则不会使节点访问代价变小。

纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。

如果重复角力中存有惟一氢铵策略纳什平衡，那么我们怎么找到它的纯策略纳什平衡呢?首先看看下面囚徒的困境的角力的例子：
我们现在考虑该博弈重复两次的重复博弈，这可以理解成给囚徒两次坦白机会，最后
的得益是两个阶段博弈中各自得益之和．在两次博弈过程中，双方知道第一次博弈的结果
再进行二次博弈．用逆推归纳法来分析，先分析第二阶段，也就是第二次重复时两博弈方
的选择．很明显，这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈，此时前一阶段
的结果已成为既成事实，此后又不再有任何的后续阶段，因此实现自身当前的最大利益是
两博弈方在该阶段决策中的惟一原则。

因此我们不难得出结论，不管前一次的角力获得的结果如何，第二阶段的惟一结果就
是原角力惟一的纳什平衡(坦白，坦白)，双方获益(-5，-5)。

现在再回到第一阶段，即第一次博弈．理性的博弈方在第一阶段就对后一阶段的结局
非常清楚，知道第二阶段的结果必然是(坦白，坦白)，因此不管第一阶段的博弈结果是什么，双方在整个重复博弈中的最终得益，都将是第一阶段的基础上各加-5．因此从第一阶
段的选择来看，这个重复博弈与图l中得益矩阵表示的一次性博弈实际上是完全等价的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

精品课程《运筹学》

第二节纳什均衡
例8.2.4（古诺的两寡头模型）设市场有1、2两家厂商，他们生产相同的产品。设厂商1的产量为 q1 ，厂商2的产量为 q2 ，则市场总产量为 Q q1 q2 。p 为市场的出清价格 (可以将产品 p =100- Q 。再假设全部卖出去的价格)，两厂商的生产无固定成本，两厂家边际生产成本相等，c1 c2 2 ，两厂家同时决定各自产量，使利润最大。
精品课程《运筹学》
第二节纳什均衡
囚徒1
坦白不坦白坦白
（-5，-5）
（0，-8）
囚徒 2
不坦白
（-8，0）
（-1，-1）
（图8.2.1） 2.严格下策反复消去法不管其他人策略如何变化，自己某一策略带
精品课程《运筹学》
第二节纳什均衡
来的收益总被其他某些策略带来的收益要小，称这某一策略为相对于其他某些策略的严格下策策略。决策者是不可能选择任何严格下策的。如果发现某策略是相对于其他某些策略的严格下策，就可以将它从对策方的策略空间中去掉，这样就只需要在剩下的较小的策略空间中进行分析了。例8.2.3这是一个抽象对策问题：

* * * 对任意 S ij S i 都成立则称 S1 , S 2 ,S n 为一个纯策略纳什均衡。

精品课程《运筹学》
第二节纳什均衡
例8.2.1 “囚徒的困境” 警察抓住了两个罪犯，但是警察局缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判1年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判8年徒刑；如果两人都坦白认罪，则他们将被各判 5年监禁。
精品课程《运筹学》
第二节纳什均衡
§2.1 纳什均衡的概念
用 G 表示一个对策，若一个对策中有 n 个局中人，每个局中人可选策略的集合分别用
S1 , S 2 ,S n 表示； ij 表示局中人 i 的第 j 个 S 策略，其中 j 可取有限个值、也可取无限个
h 值；对策方 i 的得益用 h i表示； i 是各对策方策略的多元函数，个局中人的对策 G 常写成 n
精品课程《运筹学》
第二节纳什均衡
过这个限度，每只羊都无法吃饱，从而羊的产
出就会减少，甚至只能勉强存活或要饿死。假设这些农户只有夏天才到公共草地放羊，而每年春天决定养羊的数量，各农户在决定自己养羊的数量时是不知道其他农户的养羊数量的，各农户养羊数的决策是同时作出的。假设下面信息知道的：每只羊的产出（价格）是羊只总 Q p 数的减函数， 120 Q， q1 q2 q3, q i 为第i 个农户饲养羊的数量，每只羊的饲养成本为8元。
精品课程《运筹学》
第二节纳什均衡
参与人2 参与人 1 上下左（1，0）中（1，2）右（0，1）
（0，3）（0，1）图8.2.2 参与人2
左中（1，2）
（2，0）
参
与人上（1，0）下
1
（0， 3）（0，1）
图8.2.3
精品课程《运筹学》
第二节纳什均衡
参与人2 左中上（1，0）（1，2）图8.2.4
第二节纳什均衡
由 dP ，解之得 Q * =56（只），总收益 dQ 0 P =3136。这说明纳什均衡常是低效的。
§2.2 纳什均衡的求解
1.箭头法：纳什均衡是最优的，任何单方面的改变都将使改变者自己受损。这是箭头法的基础。箭头法对每个策略组合判断，看各博弈方能否通过改变自己的策略而改善其得益，如能，则从所考察的策略组合引一箭头到改变后的策略组合。对每个可能的策略组合进行判断
定理8.2.2 在个博弈方的博弈G = S1 , S2 ,Sn ; h1 , h2 ,hn S1* , S2* ,Sn*是G的一个纳什均衡，则严中，如果格下策反复消去法一定不会将它消去。 3.反应函数法（适应于变量为产量等这样连续变化的情况）
精品课程《运筹学》
* * 排除了 S1* , S 2 ,S n 以外的所有策略组合，则一定 * * * S1 , S2 ,Sn 是G的唯一的纳什均衡。
1
对参与人2，左又成为严格劣战略，仅剩的 (上，中)就是此博弈的结果。通过上面的讨论可以看出，严格下策反复消去法与纳什均衡之间有密切的关系。下面的两个定理就是表明这种关系的。
精品课程《运筹学》
第二节纳什均衡
定理8.2.1 在个博弈方的博弈在对策 G =
S1 , S2 ,Sn ; h1 , h2 ,hn 中，如果严格下策反复消去法
* 求其最大得：q1 49
* q2 1 49 2
精品课程《运筹学》
第二节纳什均衡
与古诺模型相比，此时总产量 Q* 3 98 > 2 98 ， 3 4
此时价格更低，利润更少。这说明垄断的效果不如自由竞争。
当然并非所有的对策都有纳什均衡，如石头、剪子、布就没有均衡。
§2.3 混合策略和混合纳什均衡
* 1 * 2 * 3

此为三农户同时独立决定数量时所获得的稳定结果。任何单方面的擅自改变会使自己受损。各自得益为784，三农户总收益为2352。
从总体利益的角度来考察公共草地上羊的最佳数量。设羊的总数为 Q ，则总得益为：
P = Q(120 Q) 8Q =112 精品课程《运筹学》

- Q2
都是对其余对策方策略组合的最佳策略，即
i 精品课程《运筹学》
(S , S ,, S
* 1 * 2
* i 1
* * * , Si* ,, S n ) (S1* , S 2 ,, Si*1 , Sij ,, S n ) i
第二节纳什均衡
* * 对任意 Sij Si 都成立，则称G * S1* , S 2 ,S n 为 G 的一个混合策略纳什均衡。
精品课程《运筹学》
第二节纳什均衡
局中人为两个囚徒，两个人都有两种策略（坦白、不坦白），两人的策略集共有四个元素。我们用-1、-5、-8分别表示被判刑的得益，用0表示被释放的得益，则可由下面的得益矩阵将此对策予以表示：表8.2.1
囚徒
策略
1
囚
徒 2
坦白
不坦白
策略
坦白
（-5，-5）
（0，-8）
设第个厂商的利润为Pi
精品课程《运筹学》
qi ( pi ci )=qi (98 (q1 q2 ))
第二节纳什均衡
反应函数的概念：对厂商1来说，给定厂商2 的任意产量 q2 ，厂商1的最佳反应为 q1 1 (98 q2 ) 2 即厂商1的最佳产量为厂商2的产量的连续函数，称此函数为厂商1对厂商2的产量的反应函数记 R1 : q2 。同理，厂商2对厂商1的产量的 q1 为 R2 : q1 。 q2 反应函数记为用反应函数表示两厂商之间的产量关系为
精品课程《运筹学》

第二节纳什均衡
R1 (q2 ) 1 (98 q2 ) 2
与
(0,98)
R2 (q1 ) 1 (98 q1 ) 2
R1 (q2 )
R 2 (q1 )
q1
(49,0)
(0,49)
(98,0)
图8.2.5
在双方反应函数对应直线交点上，才是双方都满意的最佳反应组合，此时， * * 1 。 q1 q2 3 98
第二节纳什均衡
§2.1 纳什均衡的概念 §2.2 纳什均衡的求解 §2.3 混合策略和混合纳什均衡
精品课程《运筹学》
第二节纳什均衡
纳什均衡是对策论中一个重要的概念。尤其在非合作对策分析中具有十分关键的作用。通过对经典对策模型的分析知道:对于对策中的每一个局中人，真正成功的措施应该是针对其他局中人所采取的每次行动，相应地采取有利于自己的策略。于是，每一个局中人应采取的策略必定是他对其他局中人策略的预测的最佳反应。Nash均衡正是体现这一基本原则。
不坦白
（-8，0）
（-1，-1）
精品课程《运筹学》
第二节纳什均衡
对囚徒l来说，囚徒2有坦白和不坦白两种选择，假设囚徒2选择的不坦白，则对囚徒l来说，不坦白得益为一l，坦白得益为O，应该选择坦白；假设囚徒2选择的是坦白，则囚徒1不坦白得益为一8，坦白得益为一5，他更应该选择坦白。囚徒2唯一的选择也是坦白。例8.2.2 设某村庄有3个农户，该村有一片大家都可自由牧羊的公共草地。由于这片草地的面积有限，草的数量只能让数量有限的羊吃饱，如果在此草地上放牧的羊的实际数量超
精品课程《运筹学》
第二节纳什均衡
将上面模型略作修改，即为斯塔克博格模型。两个厂商中，一方较强，一方较弱。强的一方领先行动，而较弱的一方则跟在较强的一方之后行动。设厂商1是领头厂商先行选择，厂商 2追随其后，其他条件不变。
厂商1的产量 q1 为已经确定，厂商2为使利润 q2 1 (98 q1 ) ，厂商1知道厂商最大，应选择 2 2的决策思路P1 q1 (98 (q1 1 (98 q1 ))) = 3 (98 q1 )q1 2 2

O≤ pij≤1对
p
j 1
k
j =1，…， k 都成立，且
ij
=1。
mi mi 式中 S xi E xi 0, i 1,2, mi , xi 1 i 1 * i
由定义可以看出，纯策略也可看作混合策略。定义8.2.3 如果一个策略 G =S1 , S2 ,Sn ; h1 , h2 ,hn 中，参与者 i 的策略集为 Si Si1 ,, Sik ，如果由各个对策方的策略组成策略集合 G * S1* , S 2* ,S n*