06 零和博弈模型
博弈论——零和博弈、正和博弈

博弈论——零和博弈、正和博弈我们⽤了四天时间,说了:“纳什均衡”、“囚徒困境”、“智猪博弈”、“公地悲剧”、“重复博弈”、“⼀报还⼀报”、“不完全信息博弈”、“拍卖博弈”今天,我们说说“零和博弈”和“正和博弈”举个例⼦你和你朋友去打斯洛克,各出了100块赌输赢,这是“零和博弈”,因为你赢100必然他会输100,你俩收益加起来是0;你和你朋友去打斯洛克,台球厅赞助了100块,谁赢了给谁,从你俩的⾓度,这是“正和博弈”,因为你俩不管谁赢,收益加起来都是100块,⼤于0;但从你、你朋友、台球厅三者的⾓度考虑,这就⼜是⼀个“零和博弈”,因为,你、你朋友、台球厅的收益加起来是0你和你朋友去打斯洛克,台球厅赞助了100块,然后⼜卖票给100个⼈,每个⼈ 10块,他们都愿意来看你俩打斯洛克(请忽略为啥他们愿意来,你和你朋友打得好,不⾏么...),此时你、你朋友、台球厅的总体收益就从0变成了1000块,你或者你朋友随便谁赢球可以得到100块,台球厅拿900块,你们三者⼜变成了“正和博弈”;但从你、你朋友、台球厅、看⽐赛的100个⼈的⾓度考虑,这就⼜是⼀个“零和博弈”...好了,估计你也看出来了,这么推演下去,就没完没了了,那这深层次的原因,是什么呢?零和博弈简单来说,你赢1元,我就会输1元,输赢之和为零的博弈,叫零和博弈,零和博弈只存在于封闭系统内部,且会导致你死我活的内部竞争。
正和博弈在零和博弈中加⼊增量,输赢之和⼤于零,就会变成正和博弈。
怎么把“零和博弈”变成“正和博弈”?第⼀,打开封闭系统,寻求增量。
有了太阳的能量,地球上所有的⽣物,才不是零和博弈。
第⼆,确定“存量分配规则”。
⽐如,交通资源是有限存量,如果汽车可以在马路上随便开,再宽的马路都会⽔泄不通。
制定存量交通资源的分配规则《交通法》,杜绝零和博弈,甚⾄负和博弈。
⽐如,公司分业绩分达产,已经获得的利润和业绩是有限存量。
如果赚到钱后,⼤家再讨论怎么分,就会你争我夺,惟恐吃亏。
06 零和博弈模型

根据图可分析出,乙不可能选择策略1,因此y1=0
49 / 11 3 y2 11y3 49 / 11 5 y2 2 y3 y 2 y3 1
y2 9 / 11 y 2 / 11 3
3 8 因此,该博弈中,甲的混合策略为 x ( , ) 11 11 9 2 * 乙的混合策略为 y (0, , ) 11 11
v* 1 / 0.08589 12 0.357
q1 0.25 q2 0.75 q3 0
所以,甲的最优混合策略为(0.372,0.384,0.244) 所以,乙的最优混合策略为(0.25,0.75,0)
最优期望收益为 v 练习1:教材P119例题
9 1 4 2 2
10 6 3 A 8 5 5 12 10 8
因此,甲的混合策略为(13/28,15/28),乙的混合策略为(1/2,1/2)
例3:求解下面零和博弈矩阵的混合策略
2 3 11 A 7 5 2 解:设甲的混合策略为 ( x,1 x) , x [0,1]
11
则
7 5 3 2 0 X* 2 1
VG 9 x 2 V 2 x 5 G
解:将原收益矩阵各元素均加上12,得到
构建线性规划模型为
22 6 15 A' 20 17 7 0 2 20
1 max y1 y2 y3 v 22 y1 6 y2 15y3 1 20 y1 17 y2 7 y3 1 2 y 20 y 1 2 3 y1 0, y2 0, y3 0
A3 A4
B1 -420 210 630 -210
博弈模型-数模

5、模型求解 囚徒 1 对 i=1,有 u1(坦白, 坦白)=-6=-6=u1(坦白, 坦白) u1(坦白, 坦白)=-6>-9=u1(沉默,坦白)
对 i=2,有 u2(坦白,坦白)=-6=-6=u2(坦白,坦白) u2(坦白,坦白)=-6>-9=u2(坦白,沉默)
囚徒 2 坦白 沉默 坦白 沉默 -6,-6 -9, 0 图 1-1 0,-9 -1,-1
* * * * ui ( s1 ,, si*1 , si* , si*1 ,, sn ) ui ( s1 ,, si*1 , si , si*1 ,, sn ), si Si
--------------(NE) 亦即 si*是最优问题
* * max ui ( s1 ,, si*1 , si , si*1 ,, sn ), i 1, 2, , n si Si
二、囚徒困境博弈模型分析
1、问题的提出
两个共同作案的犯罪嫌疑人被捕,并受到指控。 除非至少一个人招认犯罪,否则警方无充分证据将他 们按罪判刑。警方把他们关入不同的牢室,并对他们 说明不同行动带来的后果。如果两人都采取沉默的抗 拒态度,因警方证据不足,两人将均被判为轻度犯罪 入狱1个月;如果双方都坦白,根据案情两人将被判 入狱6个月;如果一个招供而另一个拒不坦白,招认 者因有主动认罪立功表现将立即释放,而另一人将被 判入狱9个月(所犯罪行判6个月,干扰司法加判3个 月)。
所以 s*=(s1*,s2*)=(坦白,坦白)满足定义不等式(NE)的条件,故 s* =(坦白,坦白)是囚徒困境博弈的一个纳什均衡,即此问题的解。
6、结果分析
战略组合(沉默,沉默),即如果两个人都不坦白,各人只判刑一 个月,不是比战略组合(坦白,坦白)带来的各判刑 6个月要好吗?
博弈模型及竞争策略简介

博弈模型及竞争策略简介博弈模型是用来分析决策者之间相互作用关系的数学工具。
在经济学中,博弈模型被广泛应用于研究市场竞争和企业策略等问题。
本文将介绍博弈模型的基本概念和基本原理,并介绍一些常见的博弈模型和竞争策略。
博弈模型的基本概念和基本原理:博弈模型是一种描述决策者行为和相互作用的数学工具。
博弈模型主要包括决策者、行动、支付函数和解的概念。
决策者是指参与博弈的个体或组织,他们根据自身利益和目标做出决策。
行动是指决策者可以选择的各种行为方式。
支付函数是用来衡量每个决策者在不同行动组合下的效用或收益。
解是指在博弈中各个参与者都做出最佳决策的状态。
博弈模型的基本原理包括理性选择、均衡和解的概念。
理性选择是指决策者根据自己的目标和利益做出决策,不会做出明显损害自己利益的决策。
均衡是指在博弈中各个决策者做出的决策组合是相互一致的,没有一个决策者可以通过改变自己的决策而提高自己的效用。
解是指在博弈中各个参与者都做出最佳决策的状态,也就是说没有一个决策者可以通过改变自己的决策而提高自己的效用。
博弈模型有多种解的概念,例如纳什均衡、帕累托最优、卓亚定理等。
常见的博弈模型和竞争策略:最常见的博弈模型是纳什均衡模型。
纳什均衡是指在博弈中各个决策者做出的决策组合是相互一致的,没有一个决策者可以通过改变自己的决策而提高自己的效用。
在纳什均衡下,每个决策者都采取了最优的个体策略,而无法通过改变策略来获得更高的效用。
博弈模型还包括零和博弈模型和非零和博弈模型。
零和博弈模型是指在博弈中各个决策者的利益是完全相反的,一个决策者的收益就是另一个决策者的损失。
非零和博弈模型是指在博弈中各个决策者的利益不完全相反,存在一定的合作和竞争关系。
在实际应用中,博弈模型常常用于研究市场竞争和企业策略问题。
市场竞争模型是一种描述市场中企业之间相互作用关系的博弈模型,它可以用于研究市场价格形成、市场份额分配等问题。
企业策略模型是一种描述企业之间相互作用关系的博弈模型,它可以用于研究企业的定价、产品开发、市场推广等问题。
十大经典博弈论模型

十大经典博弈论模型博弈论是一门研究决策者之间互动的学科,其应用范围广泛,涉及到经济、政治、生物学等领域。
在博弈论中,经典博弈论模型是基础和核心,以下是介绍十大经典博弈论模型:1. 囚徒困境博弈模型囚徒困境博弈模型是博弈论中最为著名的模型之一,也是最为典型的非合作博弈模型。
该模型主要讲述的是两个囚犯被抓后面临的选择问题,如果两个人都招供,那么都将受到较重的惩罚;如果两个人都不招供,那么都将受到轻微的惩罚;如果一个人招供而另一个人不招供,那么招供的人将受到宽大处理,而另一个人将受到较重的惩罚。
2. 零和博弈模型零和博弈模型是博弈论中最为简单的模型之一,其特点是参与者之间的利益完全相反,即一方获得利益就意味着另一方的利益受到损失。
在这种情况下,参与者之间的互动往往是竞争和对抗的。
3. 博弈树模型博弈树模型是一种用于描述博弈过程的图形模型,它可以清晰地展示出参与者在不同阶段的选择和决策,以及每个选择所带来的收益和风险。
4. 纳什均衡模型纳什均衡模型是博弈论中最为重要的概念之一,它指的是一个博弈中所有参与者都采取了最优策略的状态。
换句话说,如果所有参与者都遵循纳什均衡,那么任何一个人单方面改变策略都将无法获得更多的利益。
5. 最小最大化模型最小最大化模型是一种解决零和博弈问题的方法,其思想是在所有可能的情况中,选择让对手收益最小的情况,从而实现自己的最大化收益。
6. 帕累托最优解模型帕累托最优解模型是一种解决多人博弈问题的方法,其核心思想是通过合作和协商,使得所有参与者都能获得最大的收益,而不是只有某个人获得了最大的收益。
7. 博弈矩阵模型博弈矩阵模型是一种常用的博弈论分析工具,它可以清晰地展示出参与者在不同策略下的收益和风险,从而帮助参与者做出最优决策。
8. 拍卖模型拍卖模型是博弈论中的一个重要应用领域,其目的是通过竞价的方式,让参与者以最低的价格获得所需的商品或服务。
9. 逆向选择模型逆向选择模型是一种解决信息不对称问题的方法,其核心思想是通过知道对方的信息,来预测对方的行为和决策,从而做出最优策略。
零和动态非合作博弈论模型

零和动态非合作博弈论模型
零和博弈是指参与者的利益完全相反,一方的收益必然导致另一方的损失,总收益为零。
在这种情况下,参与者之间存在激烈的竞争,他们的利益是完全对立的。
动态非合作博弈则考虑参与者在一段时间内做出一系列决策,每一步决策都会影响到后续的决策和最终的结果。
这种类型的博弈模型更贴近实际情况,因为参与者通常需要考虑对手的反应和未来可能发生的情况。
在零和动态非合作博弈论模型中,参与者需要在每一时刻做出决策,以最大化自己的收益或者最小化损失。
他们需要考虑对手的策略,并且根据对手的行为做出相应的反应。
这种模型的分析通常涉及到博弈论中的一些重要概念,比如纳什均衡、最优策略、博弈树等。
在实际应用中,零和动态非合作博弈论模型被广泛应用于经济学、管理学、政治学等领域。
比如在经济学中,研究者可以利用这种模型来分析企业之间的竞争行为和市场的变化;在政治学中,可以用来研究国家之间的外交政策和冲突解决策略。
总的来说,零和动态非合作博弈论模型是博弈论中的一个重要分支,它帮助我们理解多方参与者之间的冲突与合作,以及他们在动态环境下的最优决策策略。
通过对这种模型的研究,我们可以更好地预测和解释现实世界中复杂的决策和行为。
零和博弈悖论 -回复

零和博弈悖论-回复零和博弈悖论:人类协作与零和博弈之间的辩证关系引言:人类社会是一个充满博弈与合作的复杂网络,一方面我们生活在一个需要彼此合作与互助的社会中,另一方面,博弈理论却指出在某些情况下,合作并非总是最优选择。
零和博弈悖论就是这样一个违背常规直觉的理论,它提出了在特定条件下,合作双方可能陷入零和博弈的困境。
本文将通过详细分析零和博弈悖论的基本概念,以及其对人类社会的影响,进一步探讨人类协作与零和博弈之间的辩证关系。
第一部分:零和博弈悖论的基本概念1.1 零和博弈的定义零和博弈是一种对弈双方的利益总量和为零的博弈形式,即其中一方的利益的增加必然伴随着另一方的利益的减少。
在零和博弈中,无论双方如何博弈,最后总有一方受益,一方受损。
1.2 零和博弈的局限性然而,零和博弈悖论并非描述了所有博弈情境。
事实上,现实生活中的博弈往往包含更多的非零和博弈情境,即通过协作与互助双方可以实现双赢甚至多赢的局面。
零和博弈悖论更多地只是提醒人们要警惕博弈中潜在的风险与损失。
第二部分:零和博弈悖论对人类社会的影响2.1 零和思维带来的困境零和博弈悖论可能会导致人们产生零和思维,即认为世界上的资源是有限的,他人的成功必然意味着自己的失败。
这种思维方式会导致个人利益与他人合作之间的冲突,削弱人们在面对共同问题时的合作意愿与能力。
2.2 零和博弈悖论对合作行为的挑战零和博弈悖论的存在可能使人们对合作抱有疑虑和警惕,甚至选择竞争与对抗来保护自身利益。
这种竞争导向的行为不利于社会的整体发展与协作,并可能加剧资源分配的不平等和冲突。
第三部分:人类协作与零和博弈的辩证关系3.1 人类协作的重要性人类是社会性动物,合作是我们生存和繁荣的关键。
通过合作,人们可以共同面对挑战、共享机会和资源,并创造更美好的未来。
人类的社会进步离不开协作与团结。
3.2 博弈与社会建设的平衡尽管零和博弈悖论存在,但我们不能因此忽视合作的重要性。
在现实生活中,博弈与合作不可分割,两者相互作用、相互制约。
博弈模型汇总

博弈模型汇总博弈模型是博弈论的重要工具,用于描述博弈参与者之间的策略和利益关系。
在博弈论中,通过建立合适的博弈模型,可以帮助我们分析和理解各种不同类型的博弈情境,并预测博弈参与者的行为和可能的结果。
下面将对几种常见的博弈模型进行汇总和介绍。
1. 零和博弈模型:零和博弈模型是博弈论中最简单和最基本的模型之一。
在零和博弈中,博弈参与者的利益完全相反,一方的利益的增加必然导致另一方的利益的减少。
这种博弈模型常常用于描述双方的冲突和竞争情境。
常见的零和博弈模型有二人零和博弈和多人零和博弈。
2. 非合作博弈模型:非合作博弈模型是博弈论中较为常见的模型之一。
在非合作博弈中,博弈参与者之间的行动和决策是相互独立的,每个博弈参与者都追求自身的最大利益。
在非合作博弈模型中,博弈参与者可以选择不同的策略,根据对手的行动做出最优的响应。
常见的非合作博弈模型有纳什均衡模型和博弈树模型。
3. 合作博弈模型:合作博弈模型是博弈论中另一个重要的模型。
在合作博弈中,博弈参与者之间可以进行协作和合作,共同追求最大化整体利益。
合作博弈模型通常用于描述多个博弈参与者之间的联盟和合作情境。
常见的合作博弈模型有核心模型和合作博弈解。
4. 演化博弈模型:演化博弈模型是博弈论中较为新颖和有趣的模型之一。
在演化博弈中,博弈参与者的行动和策略可以随时间变化和演化。
演化博弈模型通常用于描述博弈参与者之间的适应性和进化过程。
常见的演化博弈模型有进化博弈动力学模型和演化博弈解。
博弈模型的应用广泛,不仅在经济学中有重要的地位,也在其他学科领域得到广泛运用。
博弈模型可以帮助我们分析和解决各种决策和策略问题,对于理解社会、经济和生物系统中的行为和演化具有重要意义。
总结起来,博弈模型是博弈论的核心工具之一,用于描述和分析博弈参与者之间的策略和利益关系。
常见的博弈模型包括零和博弈模型、非合作博弈模型、合作博弈模型和演化博弈模型。
这些模型在各个领域中都有广泛的应用,对于理解和解决各种决策和策略问题具有重要意义。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
q1 0.25 q2 0.75 q3 0
所以,甲的最优混合策略为(0.372,0.384,0.244) 所以,乙的最优混合策略为(0.25,0.75,0)
最优期望收益为 v 练习1:教材P119例题
9 1 4 2 2
10 6 3 A 8 5 5 12 10 8
v
,
令 x1
p3 p1 p2 p3 1 p1 p2 , x2 , x3 , 则x1 x2 x3 v v v v v
p1a11 p2 a21 p3 a31 v p1a12 p2 a22 p3 a32 v p1a13 p2 a23 p3 a33 v
7 8 A 7 6
解:设甲的混合策略为
( x,1 x) , x [0,1] 乙的混合策略为 ( y,1 y) , y [0,1]
8
8
则
7
701ຫໍສະໝຸດ x01y
-6 -7
-6 -7
计算得 x 13/ 28,VG 1 / 2
y 1 / 2,VG 1 / 2
x 3 / 11 V 49 / 11 G
根据图可分析出,乙不可能选择策略1,因此y1=0
49 / 11 3 y2 11y3 49 / 11 5 y2 2 y3 y 2 y3 1
y2 9 / 11 y 2 / 11 3
3 8 因此,该博弈中,甲的混合策略为 x ( , ) 11 11 9 2 * 乙的混合策略为 y (0, , ) 11 11
x1 0.0826 x2 0.0854 x3 0.0542 1 2 min v 9
p1 0.372 p2 0.384 p3 0.244
同理,乙的混合策略求解的线性规划模型为
y1 0.0556 y2 0.1667 y3 0 1 2 max v 9
v* 1 / 0.08589 12 0.357
因此,甲的混合策略为(13/28,15/28),乙的混合策略为(1/2,1/2)
例3:求解下面零和博弈矩阵的混合策略
2 3 11 A 7 5 2 解:设甲的混合策略为 ( x,1 x) , x [0,1]
11
则
7 5 3 2 0 X* 2 1
VG 9 x 2 V 2 x 5 G
A3 A4
B1 -420 210 630 -210
B厂 B2 70 140
-70 -70
B3 -560 280 -630 420
min -560 140 -630 -210 练习:教材P116
-420 70 -70
140 280
-210 -70
max
630
140 420
maxmin minmax
例2:求二人零和博弈的均衡值(鞍点)
*
49 最优期望收益为 VG 11
练习:求解下面零和博弈矩阵的混合策略
2 7 A 6 6 11 2 解:设乙的混合策略为 ( y,1 y) , y [0,1]
11
7 6
B1 B2 6
1 4 y ( y,1 y ), 其中 y [ , ] 5 9
*
甲希望期望收益 v
1 最大化,则应将 x1 x2 x3 最小化 v
根据收益矩阵情况,所有元素可加上适当的数使得v非负, 这样,线性规划模型的变量取值即可要求全为非负,即 得到
1 min x1 x2 x3 v x1a11 x2 a21 x3 a31 1 x1a12 x2 a22 x3 a32 1 x a x a x a 1 1 13 2 23 3 33 x1 0, x2 0, x3 0
请问:A、B两厂分别会选择生产哪种型号电视机呢?
二人有限零和博弈是指参加博弈的参与人只有两个,每个参与人 都只有有限多个策略可供选择,而且在任何一个局势中,两个参 与人的收益之和总是等于零。
设两参与人分别为甲和乙,甲有 m个纯策略 1 , 2 ,, m可供选择, 乙有n个纯策略
1 , 2 ,可供选择,则甲乙的策略集分别为 , n
相应,乙的赢得为-A
通常,将二人有限零和博弈记成
G {S1 , S2 ; A}
(1)构建二人零和博弈模型 减去平均收益800万元 (2)求解模型:最大最小 原则(最小最大原则), 即考虑最坏的可能性的基 础上争取最好的结果 B1 A1 A2 A3 A4 210 630 B2 B3 -560 -630 420 A 厂 A1 A2
1 min x1 x2 x3 v 22x1 20x2 1 6 x1 17x2 2 x3 1 15x 7 x 20x 1 2 3 1 x1 0, x2 0, x3 0
求解线性规划模型,得到甲乙两人的最优混合策略分别为
( p1, p2 , p3 ) (0,0.643 ,0.357) (q1 , q2 , q3 ) (0,0.464,0.536)
解:将原收益矩阵各元素均加上12,得到
构建线性规划模型为
22 6 15 A' 20 17 7 0 2 20
1 max y1 y2 y3 v 22 y1 6 y2 15y3 1 20 y1 17 y2 7 y3 1 2 y 20 y 1 2 3 y1 0, y2 0, y3 0
因此原收益矩阵加上4可变为
0 6 9 A' 6 4 7 9 3 0
代入甲的线性规划模型,得到
1 min x1 x2 x3 v 6 x2 9 x3 1 6 x1 4 x2 3 x3 1 9x 7x 1 1 2 x1 0, x2 0, x3 0 1 max y1 y2 y3 v 6 y 2 9 y3 1 6 y1 4 y2 7 y3 1 9 y 3y 1 1 2 y1 0, y2 0, y3 0
S1 {1 , 2 , , m } S 2 {1 , 2 ,, n }
当甲选定 i 、乙选定 j 后,就形成了一个策略组合(也称局 势) (i , j ) ,对任一局势,记甲的赢得收益为 aij ,则甲的赢
得收益矩阵为
a11 a1n A am1 amn
零和博弈模型
“博弈”描述性定义:博弈就是一些个人、队组或其他组织, 面对一定的环境条件,在一定的规则下,同时或先后,一次
或多次,从各自允许选择的行为或策略中进行选择并加以实
施,各自取得相应结果的过程。 • 零和博弈:也称“严格竞争博弈”。博弈方之间利益始 终对立 —猜硬币,田忌赛马,石头-剪刀-布 • 常和博弈:博弈方之间利益的总和为常数。博弈方之间 的利益是对立的且是竞争关系 —分配固定数额的奖金、利润,遗产官司 • 变和博弈:零和博弈和常和博弈以外的所有博弈。合作 利益存在,博弈效率问题的重要性。 —囚徒困境、产量博弈等
x* (0,1,0)
2 2
VG 6
线性规划解法 求解零和博弈 G {S1 , S2 ; A},其中 S1 {1, 2 ,3}, S2 {1 , 2 , 3}
5 4 2 A 2 0 3 5 1 4
解:设参与人甲的最优混合策略为 p1 , p2 , p3 ,期望收益为 则得到如下一组不等式
二人有限策略零和博弈
例1:某城市有A、B两家电视机厂,A厂设计了4种型号的电视 机A1,A2,A3,A4;B厂设计了3种型号的电视机B1,B2,B3,由于资 金所限,两厂均只能选择一种型号的电视机投产,根据权威市 场研究机构调查,该市居民将用1600万元购买本地产电视机, 而对双方不同的型号,预测A厂的销售额如表1所示(单位:万 元) B厂 B1 B2 B3 A1 380 870 240 A厂 A2 1010 940 1080 A3 1430 730 170 A4 590 730 1220