第七章_对策论(本)

合集下载

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

对策论概述

对策论概述

对策论对策论是对决策者之间的行为的相互影响的研究。

因为对对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。

确实大多数经济行为能够被看成是对策论的一个特殊的情形。

5.1 对策的描述一个对策是对许多决策者的行为的相互影响的正式的表示。

行为的相互影响意思是每一个人的福利不仅依赖她自己的行为而且依赖其他人的行为。

而且她可能采取的最好的行为依赖于她对其他人的行为的预期。

要想完整地描述一个对策,我们必须知道以下四件事情:(1)局中人:有那些人卷入该对策?(2)规则:谁什么时候行动?当他们行动时他们知道什么?他们能干什么?(3)结果:对于局中人的每一组行为,对策的结果是什么?(4)报酬:局中人关于各种可能的结果的偏好(也即效用函数)是什么?例子5.1.1:配对的便士(A)局中人:这里有两个局中人,分别记为1和2。

规则:两个局中人同时抛下一个便士,要么正面向上要么反面向上。

结果:如果两个便士是配对的(要么两个正面向上要么两个反面向上),那么局中人1付一元钱给局中人2;否则,局中人2付一元钱给局中人1。

报酬:每个局中人的报酬简单地等于她得到的或失去的钱的数量。

一般地,这里有两种方法描述一个对策:策略(规范)形式的表示和扩展形式的表示。

5.1.1 一个对策的策略(规范)形式表示假设这里有有限个局中人,局中人的集合为},,2,1{I 。

每一个局中人i ∈},,2,1{I 有一个策略集,记为i S 。

在一个-I 人对策中,局中人的策略组合用一个向量表示为},,{1I s s s =,这里i s 是局中人i 的策略选择。

有时我们也把策略组合s 表示成),(i i s s -,这里i s -是除了局中人i 以外的)1(-I 个局中人的策略组合。

对于每一个策略组合},,{1I s s s =,局中人i 的效用函数为),,(1I i s s u 。

一个-I 人对策的规范形式的表示记为)}]({},{,[⋅=Γi i N u S I 。

对策论讲义

对策论讲义

对策论讲义对策论【教学内容】对策论的基本概念,纳什均衡,矩阵对策,二人的无限零和对策,有限的二人非零和对策,n人合作型对策与n人合作型对策。

【教学要求】要求学生理解对策论的基本概念,掌握矩阵对策的求解方法;理解纳什均衡的概念及相应的求解方法、理解二人的无限零和对策及有限的二人非零和对策问题,了解n人合作型对策与n人合作型对策。

【教学重点】对策论的基本概念、矩阵对策及求解、纳什均衡与求解、二人的无限零和对策,有限的二人非零和对策。

【教学难点】建立对策的模型求解。

【教材内容及教学过程】对策论来自于生活。

简单的问题如游戏,决策者的策略对最终结果有着举足轻重的影响,但决策者的策略选择也要考虑其它策略者的策略选择,现实生活中一个坏的策略选择未必带来坏的结果(原因是他方选择了对自己不利,对前者有利的策略),对策论的研究中排除了对方犯错误的可能性,每个决策者都在考虑到他方的各种策略后,选择对自己最有利的策略。

对策论解决的问题大的象经济生活中的经营决策、市场竞争,政治、军事活动中的竞选、谈判、联合和战争等,从这点来说对策论大有用武之地。

本章先介绍了对策论的基本概念,然后通过例子介绍了纳什均衡的概念及求解方法,重点介绍了二人零和对策(矩阵对策)与求解,接着介绍二人的无限零和对策、有限的二人非零和对策。

最后介绍n人合作型对策与n人合作型对策,目的是让学生通过本章学习,对其基本方法有所掌握与了解,为以后的实际应用打好基础。

i.§1.1 对策的三要素第一节引言从前述可看出对策论是研究具有斗争或竞争性质现象的数学理论和方法。

根据不同性质的问题,可建立不同的对策模型。

尽管对策模型的种类可以千差万别,但本质上都必须包含3个基本要素:1.局中人局中人即在一个对策行为中,有权决定自己行动方案的对策参加者。

通常用I表示局中- 1 -人的集合,如果有n个局中人,则I=?1,2,3,…n两个局中人。

?。

一般要求一个对策中至少要有对策中关于局中人的概念是广义的。

第七章 博弈论

第七章  博弈论

第七章 教学要求



1、概念:博弈论、占优策略、占优策略 均衡、纳什均衡 2、理解占优策略均衡与纳什均衡的关系。 3、掌握支付矩阵表,能够准确找到博弈 均衡的解。 4、掌握序贯博弈的博弈树均衡解法。 5、理解经典案例的启示。
其实,世上最温暖的语言,“ 不是我爱你,而是在一起。” 所以懂得才是最美的相遇!只有彼此以诚相待,彼此尊重, 相互包容,相互懂得,才能走的更远。 相遇是缘,相守是爱。缘是多么的妙不可言,而懂得又是多么的难能可贵。否则就会错过一时,错过一世! 择一人深爱,陪一人到老。一路相扶相持,一路心手相牵,一路笑对风雨。在平凡的世界,不求爱的轰轰烈烈;不求誓 言多么美丽;唯愿简单的相处,真心地付出,平淡地相守,才不负最美的人生;不负善良的自己。 人海茫茫,不求人人都能刻骨铭心,但求对人对己问心无愧,无怨无悔足矣。大千世界,与万千人中遇见,只是相识的 开始,只有彼此真心付出,以心交心,以情换情,相知相惜,才能相伴美好的一生,一路同行。 然而,生活不仅是诗和远方,更要面对现实。如果曾经的拥有,不能天长地久,那么就要学会华丽地转身,学会忘记。 忘记该忘记的人,忘记该忘记的事儿,忘记苦乐年华的悲喜交集。 人有悲欢离合,月有阴晴圆缺。对于离开的人,不必折磨自己脆弱的生命,虚度了美好的朝夕;不必让心灵痛苦不堪, 弄丢了快乐的自己。擦汗眼泪,告诉自己,日子还得继续,谁都不是谁的唯一,相信最美的风景一直在路上。 人生,就是一场修行。你路过我,我忘记你;你有情,他无意。谁都希望在正确的时间遇见对的人,然而事与愿违时, 你越渴望的东西,也许越是无情无义地弃你而去。所以美好的愿望,就会像肥皂泡一样破灭,只能在错误的时间遇到错的人。 岁月匆匆像一阵风,有多少故事留下感动。愿曾经的相遇,无论是锦上添花,还是追悔莫及;无论是青涩年华的懵懂赏 识,还是成长岁月无法躲避的经历……愿曾经的过往,依然如花芬芳四溢,永远无悔岁月赐予的美好相遇。 其实,人生之路的每一段相遇,都是一笔财富,尤其亲情、友情和爱情。在漫长的旅途上,他们都会丰富你的生命,使 你的生命更充实,更真实;丰盈你的内心,使你的内心更慈悲,更善良。所以生活的美好,缘于一颗善良的心,愿我们都能 善待自己和他人。 一路走来,愿相亲相爱的人,相濡以沫,同甘共苦,百年好合。愿有情有意的人,不离不弃,相惜相守,共度人生的每 一个朝夕……直到老得哪也去不了,依然是彼此手心里的宝,感恩一路有你!

对策论

对策论
对 策 论
对策论(博弈论) 中文名称:博弈论 英文名称:game theory 定义1:一种处理竞争与合作问题的数学决策方法。 应用学科:地理学(一级学科);数量地理学 (二级学科) 定义2:研究竞争中参加者为争取最大利益应当如何 做出决策的数学方法。 应用学科:生态学(一级 学科);数学生态学(二级学科) 定义3:根据信息分析及能力判断,研究多决策主体 之间行为相互作用及其相互平衡,以使收益或效 用最大化的一种对策理论。 应用学科:资源科技 (一级学科);资源管理学(二级学科)

高中概率、排列、组合知识的学习。

• 例2:河南政法 2010A-41)把 9 个苹果分 给 5 个人,每人至少一个苹果,那么不同 的分法一共有多少种?
• A.30 B.40 C.60 D.70
• [强化 1]D • [简析]9 个苹果排成一排,形成 8 个空, 中间插上 4 个挡板,就可以把这 9 个苹果 分成 5 份,并且每份至少 1 个。在 8 个空 中插上 4 个档板:C4/8=70 (种)分法。
• [例 5]B • [简析]挑选 2 个不同的年级有 3种情形, 总共有 5×6+6×3+3×5=63(种)选择。
• [例 9]A • [简析]先插入第一个节目,有 4 个位置, 所以有 4 种方法;再插入第二个节目,此 时有 5 个位置, • 所以有 5 种方法。共有不同安排方法 更多 资料4×5=20 种。
• • 例1:田忌与齐威王赛马并最终获胜被传为 佳话。假设齐威王以上等马、中等马和下 等马的固定顺序排阵,那么田忌随机将自 己的三匹马排阵时,能够获得两场胜利的 概率是( )。福建 (2010-101) • A.2/3 B.1/3 C.1/6 D.1/9
• C • • [简析]田忌随机排布自己的三匹马一共 有 A3 /3种方法,但是只有“下等马、上等 马、中等马”这种唯一的排布可以获得两 场胜利,所以概率为 1/6。

第七章 对策论习题课精品文档67页

第七章  对策论习题课精品文档67页

s1 s2
1 2 3 4
1
2
7
1
3
2
16 1 136 02
3 m-in8aij
8
2
4
-3
3 -3
55
m miaxm aijja a ix ji m n j m iia n ia j a 2 x 22
G 的解为(2,2), VG=2 , 2 与2分别是 局中人I和II的最优纯策略。
例3 求解矩阵对策 G ={S1, S2; A},其中
例4 某单位采购员在秋天要决定冬季取 暖用煤的贮量局中问人题I。:采已购知员在正常的冬季气温条 件下要消耗1三5个吨策煤略,:在在较秋天暖时与买较煤冷的气温条件 下要消耗10吨10和吨2、0吨15。吨假、定20冬分季别记时的煤价随天 气寒冷程为度:而有1,所2变,化3,, 在较暖、正常、较冷 的气候条件下局中每人吨I煤I:价大分自然别为10元,15元和20 元,又设秋季三种时策煤略价:为冬每季出吨现10元.在没有关于 当年冬季准确较的暖气、象正预常报、的条较件冷下,秋季贮煤 多少吨能分使别单记位为的:支1出,最2少,?3,
齐王 上 中 下 田忌 下 上 中
最终净胜一局,赢得1000金。
表14-1 齐王赛马中齐王的赢得表
田忌
1
的策略 上
齐王

的策略

1上 中 下
3
2上 下 中
1
3中 上 下
1
4中 下 上
-1
5下 中 上
1
6下 上 中
1
2
3
4
5
6









博弈论与策略性行为

博弈论与策略性行为
寡头垄断市场上的卖方将价格定在足以 获得经济利润,但又不致于引起新企业进入 的水平上。
与掠夺性定价的异同
企业采用限制性定价,直接目的是阻止新 企业进入市场,但实质上这是一种牺牲部分短 期利润以追求长期利润最大化。因此同掠夺性 定价一样,都是企业长期定价的策略性行为。 所不同的是采用限制性定价的企业短期内仍有 “利润”,而采用掠夺性定价的企业在短期内 处于亏损状态。
动态限制性定价
是指一家在位企业在长期内确定价格和产 量来减少或消除导致新企业进入它所在市场的 诱因的方法。
市场主导企业经常是先定立一个高价,然 后随新企业进入逐渐降低价格。现实经济中, 我们可以看到,新产品刚刚导入时价格定得很 高,然后逐渐回落到竞争性价格水平。
影响限制性定价的主要因素
市场进入壁垒高,新企业难以进入, 阻止的价格也就高。壁垒低,新企业容易 进入,要阻止新企业进入,必须按平均的 甚至更低的利润水平定价。
第七章 博弈论与策略性行为
博弈论又称为对策论或游戏论,是研究决 策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题。
近20年来,博弈论在经济学中得到了广泛 的应用,它对寡头理论、信息经济学等方面的 发展做出了重要贡献。
1994年度的诺贝尔经济学奖授予三位从事对策论 研究的经济学家:纳什、泽尔腾、海萨尼。
(2)对于现实经济而言,掠夺性定价并不是 经常发生,大企业更愿意通过兼并来消灭竞 争者,因为兼并能使企业免受低价造成的利 润损失,又有利于增强企业的实力和竞争力。
什么情况下掠夺性定价行为难以成功?
两家企业的成本函数相同 完全可竞争市场
二、限制性定价行为
限制性定价又称阻止进入定价,指一家 在位企业将其价格和产量定在新企业进入市 场后所剩的需求不足以使它生存的水平。

第七章 对策论

第七章 对策论

设 局 中 人 Ⅰ 用 概 率 xi 选 用 策 略 αi , 局 中 人 Ⅱ 用 概 率 y j 选 用 策 略 β j ,
m
n
∑ ∑ xi = y j = 1 ,记 x = (x1,L, xm )T , y = ( y1,L, yn )T ,则局中人Ⅰ的期望赢得为
i =1
j =1
E(x, y) = xT Ay 。
方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从
宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列
于表 1。
表1
嫌疑犯 B
供认
不供认
嫌疑犯 A
供认 不供认
(3,3) (7,0)
(0,7) (1.5,1.5)
表 1 中每对数字表示嫌疑犯 A、B 被判刑的年数。如果两名疑犯均担心对方供认并希
望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i)局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局
中人。通常用 I 表示局中人的集合.ቤተ መጻሕፍቲ ባይዱ果有 n 个局中人,则 I = {1,2,L, n} 。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A、B 两名疑犯。
炸机飞至 B 方上空,受到 B 方战斗机的阻击。若战斗机阻击后面的轰炸机Ⅱ,它仅受
Ⅱ的射击,被击中的概率为 0.3(Ⅰ来不及返回攻击它)。若战斗机阻击Ⅰ,它将同时受
到两架轰炸机的射击,被击中的概率为 0.7。一旦战斗机未被击中,它将以 0.6 的概率
击毁其选中的轰炸机。请为 A、B 双方各选择一个最优策略,即:对于 A 方应选择哪
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2. 二人有限非零和对策(又称双矩阵对策)
第二部分 二人有限零和对策
§2 纯策略对策
一、纯策略与混合策略
纯策略是指确定的选择某策略;而混合策略 则指以某一概率分布选择各策略。 二、纯策略对策的解 1. 引例
D d1 , d 2 , d 3 ,其赢得矩阵为: d1 d 2 d 3

设一对策 G S , D, A,其中 S s1 , s2 , s3 ,
抵赖
-8,-8 0,-10 对策问题的基本要素 坦白 抵赖 -10,0 -1,-1 (1)局中人(Players) 参与对抗的各方;不一定指自然人 (2)策略集(Strategies) 局中人选择对付其它局中人的行动方案称为策略; 某局中人的所有可能策略全体称为策略集;
对策双方的策略集一般记为:
3
-1 1 1 1
1
3 1 1 -1
1
1 3 -1 1
1
1 1 3 1
-1
1 1 1 3
“齐王赛马”齐王在各局势的赢得表(单位:千金)
田忌 齐王
β1 β2 β3 β4 β5 β6 (上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
α1 (上中下) α2 (上下中) α1 (中上下) α1 (中下上) α1 (下上中) α1 (下中上)
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。 问题:明确该对策问题的各要素:局中人、策略集、 赢得矩阵
小猪

例:股票市场中的 大户、小户 大 按 猪 等待 5,1 9,-1
等待
4,4 0,0
例:市场中的大企业、小企业
进行研究开发、为新产品做广告,对大 企业是值得的,对小企业则得不偿失。
所以,一种可能的情况是,小企业把精 力花在模仿上,或等待大企业用广告打开 市场后出售廉价产品。
小猪

大 按 猪 等待 例:公共产品的提供 村里住两户人家,一户富,一户穷,有 一条路年久失修。这时候,富户一般会承 担起修路的责任,穷户则很少这样干,因 为富户常常高朋满座,路用得更多。穷户 对于修路无所谓。 5,1 9,-1
他的故事被好莱坞拍成了电影《美丽心灵》,该影片获 得了2002年奥斯卡金像奖的四项大奖
三、对策问题举例
1. 囚犯困境(Prisoners’ dilemma) 囚犯困境是图克(Tucker)1950年提出的 该对策是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方 面的问题,但可以扩展到许多经济问题,以 及各种社会问题,可以揭示市场经济的根本 缺陷
最终结果:每个人都“不出钱”。这种纳什 均衡使得所有的人的福利都没法得到提高。
例:军备竞赛
冷战期间,美苏两国的军备竞赛,使得两国 的社会福利都变得更糟。
案例分析: 生活中的“囚徒困境”例 子
—— 商家价格战 出售同类产品的商家之间本来可以通 过共同将价格维持在高位而获利,但实 际上却是相互杀价,结果都赚不到钱。 当一些商家共谋将价格抬高,消费者 实际上不用着急,因为商家联合维持高 价的垄断行为一般不会持久,可以等待 垄断的自身崩溃,价格就会掉下来。
S s1 , s2 ,, sm D d1 , d 2 ,, d n
例:囚犯困境中,每个囚犯均有2个策略: {坦白,抵赖}
坦白
抵赖 0,-10 -1,-1
(3)局势
坦白 抵赖
-8,-8 -10,0
当每个局中人从各自策略集合中选择一策略而组 成的策略组成为一个局势,用 ( si , d j )来表示。 (4)赢得(支付)
前提: 对策双方均理智 结论: 最不利中选最有利
s1 3 A s 2 6 s 3 - 5
1 0 -1
2 - 3 4
问:双方局中人采用何策略最佳。
解:可用下述表格表示上述寻找最优纯策略过程:
d1 s1 s2 s3 3 6 -5 6 d2 1 0 -1 1 d3 2 -3 4 4
• • • 我国春秋战国时期的“孙子兵法” ; 围棋,发明于我国殷代; 对策作为一种数学理论开始于1944年。
由美国数学家冯· 诺依曼(Von. Neumann)和经济学家 摩根斯坦(Morgenstern))发表了题为“博弈论与经济行 为”的著作 • 1950年,纳什完成博士论文“非合作博弈”, • 九十年代以来博弈理论在金融、管理和经济领域 中得到广泛应用
大 按 猪 等待
5,1
Nash均衡:
(按,等待)
9,-1
0,0
小猪
智猪博弈的应用举例
大 按 猪 等待

5,1 9,-1
等待
4,4 0,0
例:大、小股东的职责
股份公司中,股东承担着监督经理的职能。 监督需要成本,大股东从监督中获得的好 处要多于小股东。 Nash均衡:大股东担当起搜集信息、监督 经理的责任,小股东“搭便车”。
min a ij
j
1 -3 -5
max aij
i
故若双方都采取理智行为,局势 ( s1 , d 2 )为最优纯策略.
2. 纯策略分析
(1)局中人甲对每个策略si的评价值为
si
* i
评价
f ( si ) min a ij
j
故局中人甲选择策略模型为:
s max f ( si ) maxminaij Vmax

坦白 坦白 Ⅰ 抵赖 -8,-8 -10,0
抵赖 0,-10 -1,-1 均衡解:
二人均坦白
相关概念介绍
对策分析的基本假设
(1)个人理性
假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。 (2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最 大化的策略。
坦白
囚犯困境问题在经济、政治、军事等领域的应用举例
例:寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡, 最终结果:每个企业按照纳什均衡的价格进行定价, 其利润小于卡特尔价格条件下的利润。
例:公共产品的供给博弈
如果大家都出钱兴办公用事业,所有人的福 利都会增加。问题是,如果我出钱你不出钱, 我得不偿失;而如果你出钱我不出钱,我就可 以占便宜。
i i j
(2)局中人乙对每个策略dj的评价值为
dj
评价
g (d j ) max a ij
i
故局中人乙选择策略模型为:
d ming(d j ) minmaxaij Vmin
* j j j i
3. 纯策略对策模型的解
(1) 鞍点与解 对于一个对策 G S , D, A ,如果有
局中人采用某局势时的收益值。 例:当局中人甲选择策略si ,局中人乙选策略 dj 时,局中人甲的赢得值可用 R(si , d j ) 表示。 甲
坦白
抵赖 0,-10 -1,-1
继续讨论“囚犯困境”问题: 坦白
抵赖
-8,-8 -10,0
启示:个人理性和集体理性的矛盾
当一个社会中的每个个体都为自身的 利益打算时,即使大家都遵守社会规则, 个体的行为不一定能实现个体的最佳利益。 结论:政府在社会经济活动中的组织协调 工作是必需的,放任自流不是导致全社会 最大福利的最佳政策。
等待
4,4 0,0
3.中国的游戏——“剪刀、石头、布”
小孩A与B猜手,若规定赢得1分,平得0分, 输得 -1分,则 A的赢得可用下表来表示。
赢 B 石头 A 石头
剪1
1
0
-1
1
0
分析:无确定最优解,可用“混合策略”求 解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。田 忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。 当时在三个不同等级中,齐王的马要比田忌的强些,看来 田忌要输三千金了,但由于田忌采用了谋士的意见,最终 反败为胜。谋士的主意是: 1) 每次比赛前先让齐王说出他要出哪匹马; 2) 让田忌用下马对齐王上马; 3) 用中马对齐王下马; 4) 用上马对齐王中马。
2、按局中人赢得
3、按解的表达形式
4、按对策过程
本课件的分类思路:
1. 二人有限零和对策(又称矩阵对策)
• 特点: • 局中人为2; • 对策双方的策略均有限; • 对策双方的赢得值之和为零。
• 记矩阵对策为:
G = {S, D, A} 甲的策略集 甲的赢得矩阵 乙的策略集 • 例:“齐王赛马”即是一个矩阵策略。
2、智猪博弈
猪圈里有两头猪:一头大猪、一头小猪,猪圈 的一头有一个猪食槽,另一头安装一个按钮,控制 着猪食的供应。按一下按钮就会有10个单位的猪食 进槽,但谁按按钮谁就需要付2个单位的成本。若 大猪先到,大猪吃到9个单位,小猪只能吃1个单位; 若同时到,大猪吃到7个单位,小猪吃3个单位;若 小猪先到,大猪吃到6个单位,小猪吃4个单位; 小猪 按 等待 4,4
三、对策问题举例
1. 囚犯困境(Prisoners’ dilemma)
两名囚犯I和II因涉嫌抢劫被捕。警方 因证据不足 先将二人分关二室,并宣布: 若二人均不坦白,则只能因藏有枪支而被判刑1年; 若有一人坦白而另一个不坦白,则坦白者无罪释放, 不坦白者 被判刑10年; 若二人都坦白了,则同判8年。 此二人确系抢劫犯,请分析他们的抉择。

纳什简介 1994年诺贝尔经济学奖获得者, 纳什在普林斯顿读博士时刚刚20岁出 头,他的一篇关于非合作博弈的博士 论文和其他两篇相关文章确立了他博 弈论大师的地位。到上世纪50年代末, 他已是闻名世界的大牌科学家了。
相关文档
最新文档