11第十一章 对策论及其应用

合集下载

第11章-博弈论教材全篇

第11章-博弈论教材全篇

田忌
齐王 b1 b2 b3 b4 b5 b6
a1
3 1 1 1 1 1
a2
1 3 1 1 1 1
a3
1 1 3 1 1 1
a4 1 1 1 3 1 1
a5
1 1 1 1 3 1
a6
1 1 1 1 1 3
2-2 具有鞍点的博弈
通过下面的例3说明,什么是局中人的最优纯策略, 如何求出这个纯策略以及博弈解和博弈值的概念。
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A

a1
a2

am
b1
c11 c21
cm1

b2
c12 c22
cm 2

bn
c1n c2 n
cmn
局中人A的收益函数可用如下的矩阵表示:
c11
A
c21
cm1
c12 c22
cm 2
c1n c2n
cmn
二人零和博弈也称为矩阵博弈。
博弈论的研究建立在下述假设前提下:即参与博弈 的各局中人都是理性的。
“博弈中一个理性的决策必定建立在预测其他局中人 的反应之上。一个局中人将自己置身于其他局中人的 位置,并为他着想从而预测其他局中人将选择的行为, 在这个基础上该局中人决定自己最理想的行动。”
博弈的三个要素,即局中人,策略集和收益函数 构成了博弈信息,根据不同信息可对博弈做如下 分类:
同样乙方应从收益表中每列找出最大正数(恰为乙 方输掉的数值),为了减少损失,应从这些数字中 求出最小数,它所对应的列策略为乙方的最优纯策 略。
计算过程如下:
对局中人甲,先从每一行中求出最小值
min6,1, 8 8,min3, 2,6 2, min3,0, 4 3,再求出其中的最大值 max8, 2, 3 2。数字2对应的行策略

第十一章 科技政策.2doc

第十一章  科技政策.2doc

第十一章科技政策当今世界,科技日益成为社会和经济的原动力和主导因素,科技是第一生产力,国家之间、地区之间的较量很大程度上是看科技的较量。

因此,推动科技的进步发展,是当今各国制定政策时首先考虑的问题。

科技政策已经成为国家公共政策中的重要组成部分。

本章在对科技政策概述的基础上,分别分析了改革开放以前及改革开放以后的科技政策,并对建国以来我国的科技政策的成就、不足进行了评价,最后提出进一步的完善对策。

一、科技政策概述科技政策(Science and Technology Policy,STP)成为一个专业性术语,并被经济发达和科技发达国家共同采用,是1963年联合国在日内瓦召开的关于低开发区适用的科学技术会议(UNCAST)以后才开始的。

在中国,科技政策的概念在1949年之后开始明确。

(一)科技政策的含义科技政策的主要是促进科技的发展以及如何更好地使科技促进社会经济的发展。

尽管科技政策已被广泛地使用并成为国家对科学技术活动实行控制的重要手段,但目前仍没有形成一个明确的定义。

下面看看国内一些学者对科技政策的定义:1、联合国科教文组织(UNESCO)认为:科教政策是指一个国家或地区为强化其科技潜力,以达成其综合开发之目标和提高其地位,而建立的组织、制度及执行方向的总和。

【吕炜,《中国公共政策:演进、评价与展望》,大连:东北财经大学出版社,2006.12】2、朱崇实,陈振明(1999)等认为,现代科技政策一般是指社会公共权力机构在一定历史时期,为实现科技发展的目标和任务而规定的指导方针和行为准则,以及根据这些方针、准则制定的有关科学技术的战略、规划、计划、法律、法令、措施、条例、办法等所组成的体系。

【朱崇实,陈振明等著,《公共政策:转轨时期我国经济社会政策研究》,北京:中国人民大学出版社,1999.7】3、王伟宜(2000)认为,科技政策是一个国家或地区在一定的时期,为了实现其经济社会发展目标,对科技活动的任务、目标、投资等进行指导、管理和调控而采取的方针、措施和规则体系。

对策论的基本概念

对策论的基本概念
假设: 局中人都是理智的,等智力的. ➢ 策略集:
– 策略: 可供局中人选择的一个实际可行的完整的行动 方案.
– 策略集:局中人所拥有的对付其它局中人的手段、方案 的集合。每局中人,都有自己的策略集,一般每一局 中人的策略集中至少应包括两个策略。
对策现象的基本要素
➢ 赢得函数(支付函数)
对策中, 每一局中人所出策略形成的策略组称为一个局势。例如, si 是第 i 个局中人的
运筹学
一个策略,则 n 个局中人的策略形成的策略组
s (s1, s2 ,sn ) , s 就是一个局势,全体局势的集合 S 可用各局中人策略集的笛卡尔积表示,即
S S1 S2 Sn 当一个局势 s (s1, s2 ,sn ) 给定以后,就用一个数来表示局中人的得失(或输赢),显
然,这种“得失”或“输赢”是局势的函数,称为支付函数。通常用正的数字表示局中人的
运筹学
对策论的基本概念
➢对策论的由来和发展历史 ➢ 对策现象的基本要素 ➢ 对策问题举例及对策的分类
对策论的由来和发展历史
在社会生活和经济、经常碰到各种各样具有竞争或利益相对抗的现象,研 究对抗或竞争现象的数学理论和方法,称为对策论。 20 世纪初数学家波雷尔(Borel)和策墨洛(E.Zermelo)开始用数学方 法研究对策现象,研究对象主要是日常生活中的一些游戏(如扑克、象棋 等),因而对策论在相当长的时间内发展缓慢。 冯• 诺依曼(Von Neumann)在 1928 年创立了二人零和对策理论,为对策 论的进一步发展奠定了基础。 1944 年冯•诺伊曼和摩根斯特恩(Morgenstern)合著的《对策论与经济 行为》一书的出版,标志着系统的对策理论的初步形成。 1994 年三位长期致力于对策论的理论和应用研究的学者纳什(John F Nash)、泽尔腾(Reinhard Selten)和海萨尼(John Harsanyi)共同获 得诺贝尔经济学奖,则更是对对策论地位和作用的最具权威性的肯定。 2005 年,以色列经济学家罗伯特·奥曼和美国经济学家托马斯·谢林获 得诺贝尔经济学 奖。罗伯特·奥曼提出的“重复博弈 ”分析,目前成为所 有社会科学的主流分支。托马斯·谢林提出了冲突局势理论,在上世纪 50 年代和 60 年代的冷战时期,该理论极大地影响了美国政府对核威慑的 态度。

11第十一讲:科学技术的社会建制

11第十一讲:科学技术的社会建制
• 20世纪以后,科学共同体已发展成为国际性的, 它超越了国家和地域的界限。如高能物理学研究 领域。
现实中的科学共同体的形式多种多样。
• 卡文迪许实验室 20名诺贝尔奖获得者诞 生的“摇篮”
无形学院”
麦克斯韦,创建卡文迪许实验室 , 1871年至1874年
案例一:科学家的摇篮:巴黎科学院
• 案例二:20名诺贝尔奖获得者诞生的“摇 篮”
事业辉煌
2004年2月,黄禹锡领导的研究小组在世界 上率先用卵子培育成功人类胚胎干细胞。 2005年5月,他们在《科学》杂志上发表论 文说,他的研究小组攻克了用患者体细胞 克隆胚胎干细胞的科学难题。该篇论文署 了20个研究人员的名字,其中,美国匹兹 堡大学著名教授杰拉尔德· 夏腾作为主要研 究者名列其中。
• 他把全社会从事科学研究的科学家作为一个具有 共同信念、共同价值、共同规范的社会群体,以 区别于一般的社会群体与社会组织。
• 后来,著名的科学哲学家库恩、著名的科学社 会学家普赖斯以及默顿等人,又从不同角度发 展了这一概念,赋予它许多新的具体内容。
• 科学共同体成为科学社会学的基本概念而被普遍使用,是 在美国科学史家、科学哲学家托马斯· 库恩1962年发表 《科学革命的结构》一书之后。库恩把科学发展的认识过 程和社会过程通过科学共同体与范式这两个概念有机结合 起来,成功解释了科学发展的规律问题,科学史、科学哲 学及科学社会学因而发生了重大转向。
第十一讲
科学技术的社会运行
一、科学共同体及其社会规范
社会中的科学共同体,构成科学精神气质的社会规范,科学 交流与同行评议,科学界的社会分层,科学奖励的特征。
二、
科技运行的社会保障
科研经费的投入,科技人才的培养,信息资源与科技传播, 科技活动的社会政治环境。

《应用写作教程》第11章 申论

《应用写作教程》第11章 申论
第十一章 目录
第一节 申论考查的目标 第二节 申论试卷结构、考试要求与特点 第三节 申论考试中解题的应对方法
一、申论的含义
申论,“申”即说明、申述,“论”即议论、论证。 申论作为一种对国家公务人员能力测试的载体,它要求考生在准确把握一定材
料的基础上,作出必要的说明和申述,发表中肯的见解,提出解决问题的方法 和策略,并进行论证。
(一)申论与一般作文的区别 一般文章是因时而作,作者有感而发。在写作中,作者可凭主观好恶去选材,尽情张扬个性。 申论考试是给出一定的材料,要求应试者准确地把握一定的客观事实,作出必要的说明、申述,
并在此基础上发表中肯的见解,提出方略、进行论证,与社会交际中广泛使用的各种文章不同。
(二)申论与策论的区别 策论是我国古代科举考试制度中选拔人才的一种方式。策论论述的是一个政策的对与错及如何
(二)提出解决方案时要体现政府行为
在解决问题,提出对策、方案时,政府应起什么作用、干哪些工作,都应体现出来。
(三)要善于针对问题提出意见和办法,即方案要有针对性
对策、方案应该与所给资料的倾向性相一致。 政策、方案要紧紧围绕前面概括资料时所提出的主要问题,要切中要害。
(四)意见和办法要有可操作性即可行性
(1)全局观念和综合能力。善于把多种事物、多种因素联系起来综合分析,具有 较强的分析归纳能力。
(2)深邃的洞察力。在对大量资料进行科学分析的基础上,能透过纷繁的外在现 象看到问题的本质,善于从微小的征兆中发现大的问题,能及时作出正确的判断和 选择,能提出很好的解决问题的方案和具体措施。
(3)理解能力和文字表达能力。申论考试能测查考生掌握信息的多与少、快与慢、 对与错,考生要摈弃套话、闲话,力求分析、论证问题透彻、全面、清晰。

第十一章博弈模型

第十一章博弈模型

• 用u1(a1,a2)表示对盟军产生的结果,即净胜场次, 称为盟军的效用函数.
盟军 德军 强化缺口 原地待命
向西进攻 盟军胜1场 盟军胜2场
向东撤退 无战斗 无战斗
1 0 M {mij}32 2 0
支付矩阵 2 1
东进 盟军败2场 盟军胜1场 (Payoff Matrix)
完全竞争: 零和博弈 (常数和博弈) u2(a1,a2)对应 –M
习题
• P411 ex1,ex3
11.5 效益的合理分配(合作对策)
例 甲乙丙三人合作经商,若甲乙合作获利7元, 甲丙合作获利5元,乙丙合作获利4元, 三人合作获利11元. 又知每人单干获利1元. 问三人合作时如何分配获利?
记甲乙丙三人分配为
x (x ,x ,x ) 123
x1 x2 x3 11
解不唯一
x1 x2 7 x1 x3 5
(5,3,3) (4,4,3)
x2 x3 4
(5,4,2)
x1, x2 , x3 1
……
怎样分配 更合理?
(1) Shapley合作对策
集合I {1,2, , n} 子集s I,实函数v(s)满足
v( ) 0 v(s1 s2 ) v(s1 ) v(s2 ), s1 s2
sSi (n s )!( s 1)!
1
w( s )
n!
nC|s|1
n1
s~子集 s中的元素数目, Si ~包含i的所有子集
[v(s) v(s \ i)] ~ i 对合作s 的“贡献” (i s)
w( s ) ~由s决定的“贡献”的权重
权重构成:|s|可能取值1~n, 先按此n等分;|s|=k的含有i的子
集个数有
C k 1 n 1

对策论

对策论

对策的三要素: 对策的三要素:
局中人: 局中人:有权决定自己行为方案的对局参加者
称为局中人。案例中,敌我双方的决策者为局中 称为局中人。案例中, 当对局中局中人只有两人时,称为二人对策。 人。当对局中局中人只有两人时,称为二人对策。
策略: 策略:对局中一个实际可行的方案称为一个策
略。案例中,敌我双方各有二个策略。 案例中,敌我双方各有二个策略。
经测算,双方均可得到如下估计: 经测算,双方均可得到如下估计:
局势1 局势1:
盟军的侦察机重点搜索北线,日本舰 盟军的侦察机重点搜索北线, 队也恰好走北线。由于气候恶劣,能见度差, 队也恰好走北线。由于气候恶劣,能见度差,盟 军只能实施两天的轰炸。 军只能实施两天的轰炸。
局势2 盟军的侦察机重点搜索北线, 局势2:盟军的侦察机重点搜索北线,日本舰
定理7 定理7-1:矩阵对策 G = { S1,S2;A}
在纯策略意义下有解的充分必要条件是:存在 在纯策略意义下有解的充分必要条件是: 一个局势( ),使得对一切 一个局势( α*i*, β*j *),使得对一切 =1, j=1, i=1,2,… m, j=1,2…n 均有 aij*≤ai*j* ≤ ai*j
矩阵对策的最优纯策略
设定 最稳妥策略 对策的解 例子

两人有限零和对策
局中人: 局中人:两人 策略集: 策略集

S 1 = {α 1 , α 2 ,..., α m } S 2 = { β 1 , β 2 ,..., β n }
局势集: 局势集: S1 × S 2 = {(α i , β j ) i = 1,2,..., m; j = 1,2,..., n} 支付函数: 支付函数:H 1 (α i , β j ) = a ij 和 H 2 (α i , β j ) = − a ij

对策论的名词解释

对策论的名词解释

对策论的名词解释策论,也称策略论,是一种研究人类决策行为和优化选择的学科。

它涉及到许多领域,包括经济学、心理学和社会学等,从而成为一门综合性的学科。

在这篇文章中,我将详细介绍策论的概念、背景、原理以及其在实际生活中的应用。

一、策论的概念策论是研究个体和群体在信息不完全和互动条件下进行决策的理论。

它关注的是个体在面对有限的资源和不确定的环境下,如何制定最优化选择,以最大化自身利益的问题。

在策论中,人们通常假设决策者是理性的,并且可以预测他们的选择。

二、策论的背景策论源于经济学中对人类决策行为的研究,特别是涉及到不完全信息和决策互动的情况。

经济学家认识到,在现实生活中,决策者经常面临信息不对称、风险和竞争等问题,这些因素都会影响他们的决策过程和结果。

因此,策论的出现填补了传统经济学中的一些缺失,使我们能够更好地理解人类决策行为。

三、策论的原理策论的核心原理主要包括两个方面:信息和行动。

信息是决策者进行决策所拥有的可获得知识,行动是指决策者基于信息所采取的具体行为。

在策论中,决策者通常面临信息不完全的情况,而且他们的决策还会受到其他决策者的行为影响。

因此,策论研究的重点是如何在有限信息和复杂环境中做出最优决策。

四、策论的应用策论在实际生活中有着广泛的应用。

首先,在经济领域中,策论被广泛运用于市场分析、定价和竞争策略等领域。

例如,在拍卖市场中,卖家和买家需要通过策论的分析来确定最佳的定价和出价策略。

此外,策论还可以应用于金融领域的投资决策、风险管理和资产定价等方面。

其次,在政治学和社会学领域,策论可以解释个体和群体在政治和社会环境中做出的决策。

例如,策论可以帮助我们理解政治选举中的选民行为,以及政府在制定政策时所面临的困境和选择。

此外,策论还可以应用于战略决策、谈判过程和合作策略等问题的研究。

最后,在行为经济学和心理学中,策论也有着广泛的应用。

策论可以帮助我们理解决策者在面临风险和不确定性时的行为,以及他们在不同情境下的决策偏差和错误。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十一章>>第三节
• 三、纳什均衡多重性
– 纳什在1950年证明了在任何有限博弈中,都存 在至少一个纳什均衡。这也是纳什均衡的弱点 所在,它并不能保证唯一性,当存在多个纳什 均衡的时候,哪一个会成为参与博弈的局中人 理性选择的最终结果,这是问题的关键所在。
第十一章>>第四节
第十一章>>第四节
• 古诺双头垄断模型
第十一章>>第二节
二、纳什均衡的应用
• 3.不存在纯策略的纳什均衡解 在有些对策局势中没有纯策略纳什均衡解,而只 有混合策略纳什均衡解,这就是需要在对策论 中引入混合策略概念的原因。
第十一章>>第三节
第十一章>>第三节
• 一、混合策略 • 二、纳什均衡的存在性
– 纳什定理(Nash,1950):在n个参与者的 标准式对策 中,如果n是有 G {S1 , S2i, , Sn也是有限的,则对策存 ; u1 , u2 , , un } 限的,且对于每个 , Si 在至少一个纳什均衡,均衡可能包含混合策略。
试求出这一局势中所有的纳什均衡。 • 8.试列举现实中应用了对策论方法的一些经济现 象,并对其中某一现象进行详细分析。
Thank You!
L/O/G/O

1 2 n 1 2 n
第十一章>>第二节
二、纳什均衡的应用
• 在各种对策局势中,纳什均衡解的数目不一定相 同,可分为以下几种情况:
– 1.存在唯一的纯策略纳什均衡解 通过剔除严格劣策略的方法得到最后唯一的一个策略, 这个唯一的策略就是唯一的纳什均衡解。 – 2.存在多个纯策略纳什均衡解 在某些对策局势中,纳什均衡解不是唯一的,而是存在 多个纳什均衡解,这种情况很常见。
第十一章>>第一节
三、博弈的标准式表达
图11-1“囚徒困境”的收益矩阵
括号中第一个数字代表 局中人2的收益,第二 个数字代表局中人1的 收益,这个矩阵也被称 为支付矩阵,有时也被 称为双支付矩阵。
第十一章>>第一节
四、基本假设
• (1)博弈规则是共同知识(common knowledge)。
• (2)“局中人是理性的”是共同知识。
• 2.策略及策略集
– 策略型对策中有两种策略概念:一种为纯策略,简称为 策略。另一种策略概念为在纯策略基础上形成的混合策 略(mixed strategy)。
第十一章>>第一节
一、构成对策论的三个基本要素
• 3.支付函数
– 支付是指一局对策结束后,给每一个局中人带来的收 益,收益往往采用局中人的效用来表示。由于它是策 略组合的函数,所以也被称为支付函数,或收益函数。 通常用函数 u i 来表示第i个参与者的支付函数, (s1 , s2 , , sn ) ui (s1 , s2 ,即为参与者选择策略 , sn ) 时第i个参与者的 支付。
思考与练习
第十一章>>思考与练习
• 1.试述决策论与对策论的区别与联系。
• 2.简述博弈的分类。 • 3.什么是策略的标准式?在策略的标准式中,什 么是严格劣策略,什么是纯策略纳什均衡? • 4.在下面的策略的标准式中,哪些策略不会被重 复剔除严格劣策略剔除?纯策略纳什均衡是什么?
思考与练习
第十一章>>思考与练习
第十一章>>第一节
二、对策论的分类
• 非合作博弈可以从两个角度来划分:
– (1)从时间角度来划分,即根据局中人行动的先后顺序, 分为静态博弈和动态博弈。 – (2)从信息方面来划分,即根据局中人对有关其他局中 人的特征、策略空间及支付函数等信息的掌握情况分为 完全信息博弈和不完全信息博弈。
第十一章>>第一节
过程,直到找到新的被优超策略为止。
第十一章>>第二节
第十一章>>第二节
一、纳什均衡的导出和定义
• 定义11.2:在n个参与者标准式博弈 中,如果策略组合 G {S1 , S2 , , Sn ; u1 , u2 , , un } * s 满足对任意一个参与者 i, 是他针对其他 ni * * * * * * * * (s1 , s2 , , sn ) ( s , s , , s , s , , s 1个参与者所选策略 1 的最优反应策略, 2 i 1 i 1 n) * * * (s1 , s2 , , sn ) 则称 是该博弈的一个纳什均衡,即
* * * * * * * * * * * u ( s , s , , s , s , s , , s ) u ( s , s , , s , s , s , , s ) i 1 2 i 1 i i 1 n i 1 2 i 1 i i 1 n 对所有 中的 都成立,亦即 是以下最优问题的
第十一章 对策论及其应用
L/O/G/O
• 讲授内容:
第一节 第二节 第三节 第四节 对策论的基本概念 纳什均衡 混合策略和纳什均衡的存在性 对策论案例
• 思考与练习
第十一章>>第一节
第一节 对策论的基本概念
第十一章>>第一节
一、构成对策论的三个基本要素
• 1.局中人(player)
– 局中人就是在一场竞争或对策中,根据自己的利益需要 来决定自己的策略的参与者。局中人可以是自然人,也 可以是企业、政府、社团和其他社会组织等。
• (3)并且每个局中人在不确定下的效用函数都具 有期望效用函数性质。
第十一章>>第一节
五、优超(重复剔除严格劣策略)
• 定义11.1:在标准式的博弈 中,令 G {S1 , S2 , , Sn ; u1 , u2 , , un } 和 代表参与者 i 的两个可行策略。如果对其他参 Si Si 与者每一个可能的策略组合,i选择 的收益都小 Si Si 于其选择 的收益,则称策略 Si 相对于策略 是严格劣策略,即 Si
• 7.考察一种投票对策:三个局中人A,B,C同时 投票给彼此,不能弃权,得到最多选票的当选。 如果没有一个人得到多数,则A当选。对应的支 付函数为: u ( A) u ( B) u (C ) 2
1 2 3
u1 ( B) u2 (C ) u3 ( A) 1 u1 (C ) u2 ( A) u3 ( B) 0
ui (s1, s2 , , si 1 , si, si 1, , sn ) ui (s1 , s2 , , si 1, si, si 1, , sn )
i 1 , Si 1 , , Sn 对其他参与者在其策略空间 S1, S2 , , S 中每一组可 (s1都成立。 , s2 , , si 1 , si 1 , , sn ) 能的策略
– 古诺(1838)早在一个多世纪前就提出了纳什 均衡所定义的均衡(但是只是在特定的双头垄 断模型中)。他的研究成为对策论的经典文献, 同时也是产业组织理论的重要里程碑。本例只 讨论古诺模型中最简单的一种情况。掌握以下 内容:(a)如何把对一个问题的非正式描述 转化为对策论的标准表述;(b)如何计算对 策的纳什均衡;(c)反映存在唯一纳什均衡模 型的特点。
第十一章>>第一节
二、对策论的分类
• 对策论可以划分为合作博弈和非合作博弈,这两者 之间的区别主要在于局中人的行为相互作用时,局 中人能否达成一个具有约束力的协议,如果能,就 是合作博弈,否则就是非合作博弈。合作博弈强调 的是集体理性,强调效率、公平和公正;非合作博 弈强调的是个人理性和个人最优策略,结果可能是 有效率的,也可能是无效率的。
解:
Si
si
si Si
si*
* * * maxui (s1 , s2 , , si*1 , si , si*1 , , sn )
第十一章>>第二节
一、纳什均衡的导出和定义
• 命题11.1:在n个局中人的博弈 * * * * G {S , S , , S ; u , u , , u } s ( s , s , , s 中,如果 是G的一个纳什 1 2 n) 均衡解,那么重复剔除严格劣策略法一定不会将 它剔除。 * G * 中,如果重复剔 * • 命题11.2:在n个局中人的博弈 s* (s1 , s2 , , sn ) 除严格劣策略法排除了除 之外的所有策 s* 略组合,那么 一定是该博弈唯一的纳什均衡解。
三、博弈的标准式表达
• 【例11ห้องสมุดไป่ตู้1】囚徒困境(prisoners dilemma)
两个犯罪嫌疑人被捕并受到指控,被警方关在不同 的房间内审讯。他们面临的形势是:他们之间除非 一个人招认犯罪,否则警方并无充分的证据来证明 其有罪并判刑。警方对他们阐述了不同的行动会带 来的不同后果:如果两人都不招认,将均被判处2 个月;如果两人都招认,均被判处6个月;如果一 方招认而另一方不招认,招认的一方将马上获得释 放,不招认的一方被判处9个月。他们的收益矩阵 如图11-1:
• 5.请用画线法求出以下支付矩阵的纳什均衡。
思考与练习
第十一章>>思考与练习
• 6.丈夫喜欢看拳击,妻子喜欢看芭蕾舞。他们宁 愿在一起也不愿分开行动。下图是他们的收益矩 阵。本例有两种纳什均衡结果会出现,要么一起 去看拳击,要么一起去看芭蕾舞,请求出他们的 混合策略纳什均衡。
思考与练习
第十一章>>思考与练习
第十一章>>第一节
五、优超(重复剔除严格劣策略)
• 利用优超的概念,我们可以通过重复剔除被严格 优超策略的方法对对策局势求解,其方法是:为 每个局中人寻找被严格优超的策略,因为它不会 被局中人选择实施,所以只要找到它的严格优超 策略就可以将其从对策局势中剔除,从而得到一 种新的缩减后的对策局势。对这种局势重复上述
相关文档
最新文档